OpenVision 3: A Family of Unified Visual Encoder for Both Understanding and Generation [101.8] 本稿では,単一で統一された視覚表現を学習する,OpenVision 3という高度な視覚エンコーダ群について述べる。
VAE圧縮されたイメージラテントをViTエンコーダに供給し、2つの補完的な役割をサポートするために出力をトレーニングします。
マルチモーダル理解のために、エンコーダをLLaVA-1.5フレームワークにプラグインします。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:47:12 GMT)
AQAScore: Evaluating Semantic Alignment in Text-to-Audio Generation via Audio Question Answering [97.5] 音声対応大規模言語モデルの推論機能を活用するバックボーン非依存評価フレームワークであるAQAScoreを紹介する。
AQAScoreは人格関連性、ペア比較、構成推論タスクを含む複数のベンチマークで評価する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:35:36 GMT)
Towards Holistic Modeling for Video Frame Interpolation with Auto-regressive Diffusion Transformers [95.7] 我々はtextbfVideo textbfFrame textbfInterpolation (LDF-VFI) のための textbfLocal textbfDiffusion textbfForcing for textbfVideo textbfFrame textbfInterpolation (LDF-VFI) という包括的でビデオ中心のパラダイムを提案する。
我々のフレームワークは、ビデオシーケンス全体をモデル化し、長距離時間的コヒーレンスを確保する自動回帰拡散変換器上に構築されている。
LDF-VFIは、挑戦的なロングシーケンスベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:58:52 GMT)
HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding [92.6] HERMESは、ビデオストリームのリアルタイムかつ正確な理解のためのトレーニング不要アーキテクチャである。
HermesはコンパクトなKVキャッシュを再利用し、リソース制約下で効率的なストリーミング理解を可能にする。
Hermesはすべてのベンチマークで優れた精度または同等の精度を実現しており、ストリーミングデータセットでは最大11.4%向上している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:26:15 GMT)
MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks [84.3] 我々は,MASオーケストレーションを関数呼び出し強化学習問題として定式化する訓練時間フレームワークとしてMAS-Orchestraを提案する。
MAS-Orchestraでは、複雑なゴール指向のサブエージェントは呼び出し可能な関数として抽象化され、システム構造に対する大域的推論を可能にする。
分析の結果,MASはタスク構造や検証プロトコル,オーケストレータとサブエージェントの両方の機能に大きく依存していることが判明した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:57:02 GMT)
Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms [83.2] Python Package Index(PyPI)上のライブラリのメタデータは、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。
本稿は,5万PyPIの著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。
我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:13:57 GMT)
Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.6] 大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:07:43 GMT)
Human detectors are surprisingly powerful reward models [76.1] 本稿では,生成ビデオにおける人間の動きの定量化と改善を目的とした,極めて単純な報酬モデルHuDAを提案する。
HuDAは、外観品質に対する人間の検出信頼度と、時間的プロンプトアライメントスコアを統合して、モーションリアリズムをキャプチャする。
この単純な報奨関数は、追加のトレーニングを伴わずに市販のモデルを活用でき、手動の注釈付きデータで微調整された特殊モデルより優れていることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:24:31 GMT)
Language-Coupled Reinforcement Learning for Multilingual Retrieval-Augmented Generation [73.5] 多言語検索強化学習フレームワークLcRLを提案する。
LcRLは言語に結合したグループ相対ポリシー最適化をポリシーと報酬モデルに統合する。
我々は,言語結合型グループサンプリングをロールアウトモジュールに導入し,知識バイアスを低減し,報酬モデルにおける補助的反一貫性のペナルティを正規化し,知識衝突を軽減する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:32:32 GMT)
STEAD: Robust Provably Secure Linguistic Steganography with Diffusion Language Model [71.4] 拡散言語モデル(DLM)を用いた頑健で確実な言語ステガノグラフィーを提案する。
ステガノグラフ抽出中に擬似ランダム誤り訂正や近傍探索補正を含む誤り訂正戦略を導入する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:58:12 GMT)
INFA-Guard: Mitigating Malicious Propagation via Infection-Aware Safeguarding in LLM-Based Multi-Agent Systems [70.4] 本稿では,感染防止対策の枠組みであるINFA-Guardを提案する。
修復中、INFA-Guardは攻撃者を置き換え、感染した者を修復し、トポロジカルな整合性を維持しながら悪意のある伝播を避ける。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:27:08 GMT)
Auditing Language Model Unlearning via Information Decomposition [68.5] 部分的情報分解(PID)を用いたアンラーニング監査のための解釈可能な情報理論フレームワークを提案する。
非学習前後のモデル表現を比較することにより、相互情報と忘れられたデータとを別個の構成要素に分解し、未学習および残留知識の概念を定式化する。
我々の研究は、言語モデルのより安全なデプロイのための理論的洞察と実行可能なツールを提供する、アンラーニングのための原則付き表現レベル監査を導入している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:51:19 GMT)
The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models [67.6] 拡散大言語モデル(dLLM)は、従来のLLMの厳格な左から右への制約を破る。
本稿では,dLLMsの推論境界を広げるよりも,任意の順序生成を現在の形式で狭くするという,直感に反する現実を明らかにする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:41:58 GMT)
Walk through Paintings: Egocentric World Models from Internet Priors [65.3] 本稿では,エゴセントリック・ワールド・モデル(EgoWM)について述べる。
我々は、スクラッチからトレーニングするよりも、インターネット規模のビデオモデルのリッチワールドを再利用し、軽量なコンディショニング層を通じてモーターコマンドを注入する。
当社のアプローチは,3-DoF移動ロボットから25-DoFヒューマノイドまで,エボディメントやアクションスペースを自然に拡張する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:59:32 GMT)
The Why Behind the Action: Unveiling Internal Drivers via Agentic Attribution [63.6] LLM(Large Language Model)ベースのエージェントは、カスタマーサービス、Webナビゲーション、ソフトウェアエンジニアリングといった現実世界のアプリケーションで広く使われている。
本稿では,タスク結果に関係なく,エージェントの動作を駆動する内部要因を識別する,テキスト汎用エージェント属性のための新しいフレームワークを提案する。
標準ツールの使用やメモリ誘起バイアスのような微妙な信頼性リスクなど、さまざまなエージェントシナリオでフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:22:21 GMT)
Learning Consistent Taxonomic Classification through Hierarchical Reasoning [61.4] 分類学分類における葉レベル精度と階層的整合性を改善するための2段階階層型推論フレームワークを提案する。
我々のフレームワークはQwen2.5-VL-7Bモデルで実装され、葉レベルと階層的整合性の両方で元の72Bを10%以上上回っている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:00:00 GMT)
Plug-and-Play Benchmarking of Reinforcement Learning Algorithms for Large-Scale Flow Control [61.2] 強化学習(RL)は,アクティブフロー制御(AFC)において有望な結果を示した。
現在のAFCベンチマークは、外部計算流体力学(CFD)の解法に依存しており、完全には微分不可能であり、3Dとマルチエージェントのサポートが限られている。
AFCにおけるRLのための最初のスタンドアロンで完全に差別化可能なベンチマークスイートであるFluidGymを紹介する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:13:44 GMT)
Communication-Efficient Multi-Modal Edge Inference via Uncertainty-Aware Distributed Learning [60.7] トレーニングと推論効率を向上させるために,3段階のコミュニケーション対応分散学習フレームワークを提案する。
StageIでは、デバイスがローカルなマルチモーダルな自己教師型学習を行い、デバイス-サーバ交換なしで共有およびモダリティ固有のエンコーダを得る。
集中的な顕在的融合校正による分散微調整は、モダリティごとの不確かさを解消し、ノイズやチャネルのフェーディングによって歪んだ特徴を確実に集約する。
不確実性誘導フィードバック機構であるStageIIIは、分散環境での通信精度のトレードオフを最適化し、不確実なサンプルに対する追加機能を選択的に要求する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:38:02 GMT)
What Makes Low-Bit Quantization-Aware Training Work for Reasoning LLMs? A Systematic Study [59.4] ポストトレーニング量子化(PTQ)は通常、特に低ビット設定でのタスクの推論において、大きな精度低下のコストが伴う。
本研究では,推論モデルに対する量子化認識学習(QAT)の体系的研究について述べる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:22:29 GMT)
Low-Dimensional Adaptation of Rectified Flow: A New Perspective through the Lens of Diffusion and Stochastic Localization [59.0] 整流流(RF)は、その生成効率と最先端の性能からかなりの人気を得ている。
本稿では,RFがターゲット分布の支持の内在的低次元性に自動的に適応し,サンプリングを高速化する程度について検討する。
時間分割方式を慎重に設計し,十分な正確なドリフト推定を行うことで,RFサンプリング器はオーダーO(k/varepsilon)$の複雑さを享受できることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:09:27 GMT)
FunCineForge: A Unified Dataset Toolkit and Model for Zero-Shot Movie Dubbing in Diverse Cinematic Scenes [56.5] FunCineForgeは、大規模なダビングデータセットのためのエンドツーエンド生産パイプラインと、さまざまな撮影シーン用に設計されたMLLMベースのダビングモデルで構成されている。
リッチアノテーションを用いた中国初のテレビダビングデータセットを構築し,その高品質性を実証する。
モノローグ,ナレーション,対話,マルチスピーカーシーンにおける実験により,我々のダビングモデルは音質,リップシンク,音色伝達,指示追従のSOTA手法より一貫して優れていた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:57:00 GMT)
Is Peer Review Really in Decline? Analyzing Review Quality across Venues and Time [55.8] 本稿では,エビデンスに基づくレビュー品質の比較研究のための新しいフレームワークを提案する。
ICLR、NeurIPS、*ACLといった主要なAIおよび機械学習のカンファレンスに適用します。
レビュー品質の測定値と時間経過に伴うその進化の関係について検討する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:48:29 GMT)
Single-Pixel Vision-Language Model for Intrinsic Privacy-Preserving Behavioral Intelligence [55.5] 安全な環境モニタリングを再現する新しいフレームワークSP-VLM(Single-Pixel Vision-Language Model)を提案する。
それは本質的に低次元の1ピクセルのモダリティを通して人間のダイナミクスを捉えることによって、固有のプライバシ・バイ・デザインを実現する。
いずれにせよ,SP-VLMは意味ある行動意味を抽出し,ロバストな異常検出,数え方,行動理解を可能にしている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:11:26 GMT)
Rethinking Reinforcement fine-tuning of LLMs: A Multi-armed Bandit Learning Perspective [54.2] 1) それぞれの選択を最適化する役割は何か? 2) ボトルネックはどれか?
本論文は,光を遮蔽することを目的としており,微調整プロセスにおいて,絡み合ったいくつかの要因の課題に直面している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:37:44 GMT)
Deep Leakage with Generative Flow Matching Denoiser [54.1] 再建プロセスに先立って生成フローマッチング(FM)を組み込んだ新しい深部リーク攻撃(DL)を導入する。
当社のアプローチは、ピクセルレベル、知覚的、特徴に基づく類似度測定において、最先端の攻撃よりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:51:01 GMT)
Bose condensation and Bogoliubov excitation in resonator-embedded superconducting qubit network [53.7] 低損失共振器に埋め込まれた超伝導量子ビットネットワーク(SQN)は有望なデバイスである。
量子アクスターク効果は、SQNと共振器のマイクロ波光子との結合によって、光子間の強い非線形相互作用をもたらす。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:43:43 GMT)
ScenDi: 3D-to-2D Scene Diffusion Cascades for Urban Generation [53.0] 本研究では,3次元拡散モデルと2次元拡散モデルを統合した都市景観生成手法であるScenDiを提案する。
粗い3Dシーンを2Dビデオ拡散のガイダンスとして活用することにより、ScenDiは入力条件に基づいて所望のシーンを生成し、正確なカメラ軌道に順応する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:53:21 GMT)
LaVR: Scene Latent Conditioned Generative Video Trajectory Re-Rendering using Large 4D Reconstruction Models [52.7] モノクロビデオが与えられた場合、ビデオの再レンダリングの目的は、新しいカメラの軌跡からシーンのビューを生成することである。
既存の方法は2つの異なる課題に直面している。
大規模な4次元再構成モデルの潜在空間に埋め込まれた暗黙的幾何学的知識を用いて,これらの課題に対処することを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:46:03 GMT)
InstructTime++: Time Series Classification with Multimodal Language Modeling via Implicit Feature Enhancement [52.2] InstructTimeは、時系列分類をマルチモーダルな生成タスクとして再構成する新しいフレームワークである。
InstructTime++は、言語モデルの限定的な帰納バイアスを補うために、暗黙のフィーチャモデリングを導入することで、InstructTimeを拡張している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:12:23 GMT)
NeuroFilter: Privacy Guardrails for Conversational LLM Agents [50.8] 本研究は,エージェント型大規模言語モデル(LLM)のプライバシを強制する際の計算上の課題に対処する。
NeuroFilterは、標準違反をモデルのアクティベーション空間における単純な方向にマッピングすることで、コンテキスト整合性を運用するガードレールフレームワークである。
7Bから70Bパラメータのモデルをカバーする15万以上のインタラクションに対する包括的な評価は、NeuroFilterの強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:16:50 GMT)
Improving MoE Compute Efficiency by Composing Weight and Data Sparsity [50.7] Mixture-of-Experts 層は重量空間によって計算効率を向上する。
各専門家がトークンのサブセットだけを処理するようなデータスパシティは、補完的な軸を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:53:58 GMT)
Controllable Layered Image Generation for Real-World Editing [49.8] LASAGNAは、その構成層と共同で画像を生成する、新しく統合されたフレームワークである。
クリーンな背景とRGBAフォアグラウンドからなる新しいデータセットであるLASAGNA-48Kを紹介した。
LASAGNAは複数の画像層にまたがって高度に一貫性があり一貫性のある結果を生成するのに優れていることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:29:33 GMT)
Automated Road Crack Localization to Guide Highway Maintenance [49.5] 本研究では,高速道路整備の指針となるオープンソースデータの可能性について検討する。
提案手法は空飛ぶ画像とOpenStreetMapをハイウェイクラックの局所化のための細いYOLOv11に統合する。
実世界の適用性を示すために,スイス相対高速き裂密度(RHCD)指数を算出した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:33:58 GMT)
When Text-as-Vision Meets Semantic IDs in Generative Recommendation: An Empirical Study [48.7] テキストを視覚信号として扱うことでセマンティックID学習の表現設計を再考する。
項目記述を画像に描画することで得られるOCRに基づくテキスト表現の体系的な実証的研究を行う。
OCR-text は, セマンティックID 学習における標準テキスト埋め込みと一意に一致しているか, 上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:18:57 GMT)
CorpusQA: A 10 Million Token Benchmark for Corpus-Level Analysis and Reasoning [48.6] 我々は、新しいデータ合成フレームワークによって生成された1000万のトークンをスケーリングする新しいベンチマークであるCorpusQAを紹介した。
合成データの微調整はLLMの一般的な長文推論能力を効果的に向上させることを示す。
メモリ拡張型エージェントアーキテクチャは,より堅牢な代替手段であることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:52:30 GMT)
Privacy Collapse: Benign Fine-Tuning Can Break Contextual Privacy in Language Models [47.9] トレーニングデータの多様で微妙なパターンは、コンテキストプライバシを低下させる可能性がある。
微調整されたモデルは、コンテキストプライバシの規範を推論する能力を失う。
この結果から, 現状の安全性評価に重大なギャップがあることが判明した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:53:06 GMT)
SearchGym: Bootstrapping Real-World Search Agents via Cost-Effective and High-Fidelity Environment Simulation [47.4] 本稿では,堅牢な検索エージェントをブートストラップするシミュレーション環境であるSearchGymを提案する。
SearchGymは厳密な生成パイプラインを使用して、検証可能な知識グラフと整列したドキュメントコーパスを構築する。
本研究は,高忠実度シミュレーションが,有能な検索エージェントを開発するためのスケーラブルで費用対効果の高い手法であることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:16:17 GMT)
Pb4U-GNet: Resolution-Adaptive Garment Simulation via Propagation-before-Update Graph Network [47.3] ガーメントシミュレーションは、仮想トライオンからデジタルヒューマンモデリングまで、コンピュータビジョンやグラフィックスの様々な応用に基礎を置いている。
既存のアプローチでは、クロスレゾリューションの一般化が貧弱で、高分解能メッシュ上での大幅な性能劣化を示す。
我々はPb4U-GNetを紹介した。Pb4U-GNetは機能更新からメッセージの伝搬を分離する分解能適応フレームワークである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:50:30 GMT)
StableWorld: Towards Stable and Consistent Long Interactive Video Generation [45.6] 対話型ビデオ生成における安定性と時間的一貫性の課題について検討する。
本研究では,動的フレーム消去機構であるtextbfStableWorld を提案する。
StableWorldは、ソースへの累積ドリフトを効果的に防止し、インタラクティブな生成の安定性と時間的一貫性を向上する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:59:02 GMT)
Evaluating Multimodal Large Language Models for Heterogeneous Face Recognition [45.1] MLLM(Multimodal Large Language Models)は、近ごろ、幅広い視覚言語タスクにおいて強力な性能を示した。
我々は、VIS-NIR、VIS-SWIR、VIS-AL顔認識など、複数のクロスプラットフォームMLLMをベンチマークする。
以上の結果から,MLLMと従来の顔認識システムの間には,特に難易度の高いクロススペクトル条件下での顕著な性能差が明らかとなった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:17:21 GMT)
RegFreeNet: A Registration-Free Network for CBCT-based 3D Dental Implant Planning [45.1] 既存の方法は、インストール後のデータをスキャンし、インプラントをプレインストールスペースにマッピングして、トレーニングのためにインプラント位置のラベルを取得する必要がある。
本研究は, インプラントを含むCBCTをトレーニングデータとして使用できるように, 実装後データ中のインプラントをマスキングすることを提案する。
本研究は1622 CBCTデータのボクセルレベル3Dアノテーションを付加した包括的,一般公開可能な歯科インプラントデータセットであるPassionFairyを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:30:18 GMT)
Memory Retention Is Not Enough to Master Memory Tasks in Reinforcement Learning [44.9] 実世界の意思決定は、安定かつ適応性のあるメモリに依存する。
既存の強化学習ベンチマークとメモリ拡張エージェントは、主に保持に焦点を当てている。
部分的な可観測性の下で連続的なメモリ更新を明示的にテストするベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:27:23 GMT)
READ-Net: Clarifying Emotional Ambiguity via Adaptive Feature Recalibration for Audio-Visual Depression Detection [44.6] 抑うつは、毎日の機能や生活の全体的な品質を損なう深刻な世界的メンタルヘルス問題である。
感情のあいまいさを解決するために設計された最初の音声・視覚的抑うつ検出フレームワークであるREAD-Netを提案する。
READ-Netは、無関係な感情ノイズを適応的に除去しながら、感情的特徴の中でうつ病に関連する手がかりを革新的に識別し、保存する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:55:10 GMT)
The Pictorial Cortex: Zero-Shot Cross-Subject fMRI-to-Image Reconstruction via Compositional Latent Modeling [43.7] 人間の脳活動から視覚的体験をデコードすることは、神経科学、神経イメージング、人工知能の交差点における中心的な課題である。
提案するPictorialCortexは、主観的・データセット的・試行的な変動下での刺激駆動表現を構造化する合成潜在定式化を用いて、fMRIのアクティビティをモデル化する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:15:27 GMT)
Erosion Attack for Adversarial Training to Enhance Semantic Segmentation Robustness [43.6] EroSeg-AT は,EroSeg を利用した脆弱性認識型対人訓練フレームワークである。
EroSegはまず、ピクセルレベルの信頼度に基づいて機密画素を選択し、その後徐々に高信頼画素への摂動を伝播させ、サンプルのセマンティック一貫性を効果的に破壊する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:52:09 GMT)
The Rise of Large Language Models and the Direction and Impact of US Federal Research Funding [43.4] 大規模言語モデル(LLM)は急速に科学的実践に拡散している。
科学的な執筆と評価においてAIの使用に注目が集まる一方で、LLMの台頭が公的資金の展望をどう変えているかについてはほとんど分かっていない。
LLMの使用は2023年から急激に増加し、バイモーダル分布が示され、最小使用と実体使用の明確な分割が示される。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:37:08 GMT)
Encoding Emotion Through Self-Supervised Eye Movement Reconstruction [42.8] 自然主義的低解像度ビデオから感情表現のマルチモーダルマーカーを予測するために、眼球運動をどのように利用できるかを検討する。
言語モデルの事前学習法に着想を得て,自己監督型眼球運動再構成を用いた新しい視線検出モデルを開発した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:08:38 GMT)
Towards Understanding Best Practices for Quantization of Vision-Language Models [42.8] 大きな言語モデル(LLM)は、様々なタスクに対して印象的な結果をもたらす。
これらのシステムのメモリとレイテンシの両方を減らすために、実践者は学習したパラメータを半精度で定量化する。
本稿では,最先端のGPTQやAWQなど,さまざまな量子化手法をマルチモーダルパイプラインに適用する方法について検討する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:59:51 GMT)
UniCon: A Unified System for Efficient Robot Learning Transfers [42.7] UniConは、ステート、制御フロー、プラットフォーム間のインスツルメンテーションを標準化するフレームワークである。
従来の方法とは異なり、バッチ化されたベクトル化されたデータフローによって効率を優先する。
進行中の研究プロジェクトに統合され、実世界のシナリオにおいてその効果が証明されている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:19:32 GMT)
VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents [42.6] 実装の変更が生成され、エージェントが提案する差分として適用される。
アーキテクチャを説明し、システムの生成と検証に使用するワークフローを要約し、アーティファクトを評価する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:29:00 GMT)
Check-weight-constrained quantum codes: Bounds and examples [41.5] 量子低密度パリティチェック(qLDPC)コードは、低ウェイトチェックのみを測定することで実装できる。
本稿では,制約付きチェック重み付き安定化器およびサブシステムコードについて検討する。
重みのチェックが3つ以上ある安定化符号は、非自明な距離を持つことができないことを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:24:51 GMT)
DARL: Encouraging Diverse Answers for General Reasoning without Verifiers [41.4] DARLは、参照から制御された偏差範囲内で多様な回答を生成するための強化学習フレームワークである。
我々のフレームワークは、既存の汎用強化学習手法と完全に互換性があり、追加の検証なしでシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:23:55 GMT)
UBATrack: Spatio-Temporal State Space Model for General Multi-Modal Tracking [40.8] UBATrackと呼ばれる,マンバスタイルの状態に基づく新しいマルチモーダルトラッキングフレームワークを提案する。
UBATrack は S-temporal Mamba Adapter (MA) と Dynamic Multi-modal Feature Mixer の2つの単純かつ効果的な作業空間から構成されている。
実験により、UBATrackはRGB-T、RGB-D、RGB-E追跡ベンチマークにおいて最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:24:19 GMT)
A Brain-inspired Embodied Intelligence for Fluid and Fast Reflexive Robotics Control [40.3] 現在のロボット政策は、生物学的運動に固有の動的安定性、反射応答性、時間記憶の再現に苦慮している。
ここでは,大脳皮質,小脳,脊髄間の生体神経系の構造構造を模倣したNeuroVLA(Neuromorphic Vision-Language-Action)を提案する。
NeuroVLAは、物理ロボティクスへの神経型VLAの最初の展開であり、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:04:44 GMT)
RANDSMAPs: Random-Feature/multi-Scale Neural Decoders with Mass Preservation [39.1] 本稿では, RANDSMAP (Random-feature/multi-scale neural decoder with Mass Preservation) を導入し, 多様体学習における画像前処理の問題を解決する。
RANDSMAPは計算コストが低い場合に高い再構成精度を示し、単一マシンの精度で大量保存を維持できることを示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:18:10 GMT)
Warm-Starting Collision-Free Model Predictive Control With Object-Centric Diffusion [38.4] 拡散型ウォームスタート条件と潜時オブジェクト中心のシーン表現を組み合わせることで、厳密な時間制限下での信頼性と効率的な動き生成が得られることを示す。
提案手法では,オブジェクト中心のスロットアテンション機構を用いて,システム状態,タスク,周囲に拡散トランスフォーマを設定できる。
サンプル軌道は、剛体力学と符号-距離衝突制約を強制する最適制御問題によって洗練される。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:53:52 GMT)
Ambient Dataloops: Generative Models for Dataset Refinement [38.3] Ambient Dataloopsはデータセットを精錬するための反復的なフレームワークであり、拡散モデルが基盤となるデータ分散を簡単に学習できるようにする。
本稿では,データセット・モデル共進化プロセスを提案する。本手法の各イテレーションにおいて,データセットは徐々に高品質になり,それに応じて改善される。
経験的に、アンビエントデータループは、無条件およびテキスト条件の画像生成とde novoタンパク質の設計において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:29:04 GMT)
KinGuard: Hierarchical Kinship-Aware Fingerprinting to Defend Against Large Language Model Stealing [38.0] KinGuardは、構造化された親族関係の物語の上に構築されたプライベートな知識コーパスを組み込むフレームワークである。
我々の研究は、モデルフィンガープリントの実用的で安全なパラダイムとして知識ベースの埋め込みを確立している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:51:19 GMT)
Beyond Denial-of-Service: The Puppeteer's Attack for Fine-Grained Control in Ranking-Based Federated Learning [37.2] 我々は、ランキングベースのFLフレームワークに合わせた、最初のきめ細かい制御攻撃であるエッジコントロールアタック(ECA)を紹介する。
ECAは平均誤差がわずか0.224%のきめ細かな精度制御を達成し、ベースラインを最大17倍の精度で上回っている。
以上の結果から, 先進的な毒殺攻撃に対する防御強化の必要性が示唆された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:03:11 GMT)
Multiparameter estimation for the superresolution of two incoherent sources [36.9] サブレイリー系における一対の非コヒーレント光源を特徴付ける3つのパラメータの同時推定を実験的に実証した。
我々はフィッシャー情報に基づくクラメールラオ境界を用いて性能をベンチマークし、対応する量子限界について議論する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:05:44 GMT)
Breaking the accuracy-resource dilemma: a lightweight adaptive video inference enhancement [36.6] キーシステムパラメータと推論関連メトリクスに基づいてファジィコントローラ(FC-r)を開発した。
VI拡張フレームワークが提案され、隣り合うビデオフレーム間のターゲットの動画相関が活用される。
実験により,提案手法は資源利用と推論性能のバランスを効果的に達成できることを示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:09:38 GMT)
DrivIng: A Large-Scale Multimodal Driving Dataset with Full Digital Twin Integration [35.4] 我々は18kmのルートの完全なデジタル双対を持つ大規模マルチモーダルデータセットであるDrivIngを提示する。
我々のデータセットは、6台のRGBカメラ、1台のLiDAR、そして1日中、夕暮れ時、夜の間を撮影する高精度ADMAベースのローカライゼーションから連続的な記録を提供する。
DrivIngは実際のトラフィックをシミュレーションに1対1で転送し、エージェントのインタラクションを保存すると同時に、現実的で柔軟なシナリオテストを可能にする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:41:05 GMT)
Reclaiming Software Engineering as the Enabling Technology for the Digital Age [35.3] ソフトウェアエンジニアリングは、デジタル時代の目に見えないインフラです。
戦略的かつ可能な規律としてではなく、支援的なデジタルコンポーネントとして扱われることが多すぎる。
このポジションペーパーは、デジタル技術の長期的な持続可能性、信頼性、主権は、ソフトウェア工学の研究への投資に依存していると主張している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:44:35 GMT)
On-the-fly hand-eye calibration for the da Vinci surgical robot [35.2] 本稿では,手目変換行列をオンザフライで計算することで,正確なツールローカライズ結果を生成するキャリブレーションフレームワークを提案する。
その結果, キャリブレーションフレームワークでは, ツールのローカライゼーション誤差が著しく減少した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:58:28 GMT)
TacUMI: A Multi-Modal Universal Manipulation Interface for Contact-Rich Tasks [35.1] 我々は、ハンドヘルドデモデバイスUniversal Manipulation Interface(UMI)のアイデアに基づいて構築する。
本稿では,ViTacセンサ,力トルクセンサ,ポーズトラッカーをロボット互換グリップパーに組み込んだマルチモーダルデータ収集システムであるTacUMIを紹介する。
次に、時間モデルを利用して意味的に意味のあるイベント境界を検出するマルチモーダルセグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:14:28 GMT)
Evaluation of Large Language Models in Legal Applications: Challenges, Methods, and Future Directions [34.9] 大規模言語モデル(LLM)は、法的アプリケーションにますます統合されている。
本調査は,LLMを現実の法的実践に基づく法的課題として評価する上で重要な課題を明らかにするものである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:51:37 GMT)
Reconstruction-Anchored Diffusion Model for Text-to-Motion Generation [34.9] 拡散モデルは、テキスト駆動の人間の動き生成と関連するタスクに広く採用されている。
現在の動き拡散モデルは、運動固有情報を持たない事前訓練されたテキストエンコーダによって引き起こされる表現的ギャップと、反復的復調過程におけるエラー伝播の2つの大きな制限に直面している。
本稿では,これらの課題に対処するため,再構成型拡散モデル(RAM)を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:11:45 GMT)
PCL-Reasoner-V1.5: Advancing Math Reasoning with Offline Reinforcement Learning [34.8] 数学的推論のための大規模言語モデル(LLM)であるPCL-Reasoner-V1.5を提案する。
トレーニングの安定性と効率性を向上するオフラインRL方式が中心的なイノベーションである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:11:40 GMT)
Chain-of-Thought Compression Should Not Be Blind: V-Skip for Efficient Multimodal Reasoning via Dual-Path Anchoring [34.0] CoT(Chain-of-Thought)推論は遅延制限を禁止します。
本稿では,V-Skipを導入し,V-Achored Information Bottleneck (VA-IB) 最適化問題としてトークンプルーニングを再構成する。
Qwen2-VLとLlama-3.2ファミリーの実験では、V-Skipが29倍のスピードアップを達成した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:58:23 GMT)
APPLE: Attribute-Preserving Pseudo-Labeling for Diffusion-Based Face Swapping [33.9] 顔スワッピングは、ポーズ、表情、照明、肌のトーン、メイクといったターゲット固有の属性を保持しながら、元の顔のアイデンティティをターゲットの顔に転送することを目的としている。
本稿では,属性認識型擬似ラベル管理により属性の忠実度を高める拡散型教師学習フレームワークAPPLEを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:59:55 GMT)
ReinPath: A Multimodal Reinforcement Learning Approach for Pathology [33.0] 強力な推論機能を備えた多モーダル・パロジ大言語モデルを提案する。
複雑な推論タスクをサポートするために特別に設計された,高品質な視覚的質問応答(VQA)データセットを構築した。
また,CLIPと比較して,下流のゼロショット画像分類タスクにおいて同等の性能を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:21:35 GMT)
XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being [31.8] 我々は、カウンセリングにインスパイアされたマルチエージェントフレームワークである textbfXInsight を紹介する。
XInsightは、統一されたtextitReason-Intervene-Reflectサイクルの下で、特別なエージェントをオーケストレーションする。
記録エージェントは、オープンエンドのWeb対話を標準化された心理的アーティファクトに変換する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:26:24 GMT)
Probing Prompt Design for Socially Compliant Robot Navigation with Vision Language Models [31.1] 言語モデルは、ますますソーシャルロボットナビゲーションに使われている。
既存のベンチマークは、社会的に従順な行動のための急進的な設計を概ね見落としていた。
システムガイダンスとモチベーションフレーミングの2つの側面に沿ってプロンプトデザインを研究する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:45:33 GMT)
Combining Tests and Proofs for Better Software Verification [30.9] 検証された品質のソフトウェアを作るための競合する技術よりも、テストと証明が相補的である、という異なる視点が生まれています。
逆例はプログラムをフェールさせる入力の組み合わせである。
しかし、自動テスト生成のツールとして、不正なプログラムに反例生成を適用することができる。
これらのメカニズムは、修正が正しいことを保証しながら、不正なプログラムのプログラム修正を作成するのに役立ちます。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:39:17 GMT)
Adaptive Fidelity Estimation for Quantum Programs with Graph-Guided Noise Awareness [30.9] QuFidは適応的でノイズ対応のフレームワークで、オンラインで測定予算を決定する。
固定ショットや学習ベースラインと比較して,QuFidは測定コストを大幅に削減することを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:04:05 GMT)
SciHorizon-GENE: Benchmarking LLM for Life Sciences Inference from Gene Knowledge to Functional Understanding [30.8] 大規模言語モデル (LLM) は、特に知識駆動型解釈タスクにおいて、生物医学研究において期待が高まりつつあることを示している。
SciHorizon-GENE(SciHorizon-GENE)は、生物データベースから構築された大規模遺伝子中心のベンチマークである。
このベンチマークは、190万以上のヒト遺伝子に対するキュレートされた知識を統合し、多様な遺伝子から機能への推論シナリオをカバーする540万以上の質問を含んでいる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:31:52 GMT)
BayesianVLA: Bayesian Decomposition of Vision Language Action Models via Latent Action Queries [30.7] VLA(Vision-Language-Action)モデルはロボット操作において有望であるが、新しい命令や複雑なマルチタスクシナリオへの一般化に苦慮することが多い。
目標駆動型データ収集がデータセットバイアスを生み出す現在のトレーニングパラダイムにおいて、重要な病理を識別する。
ベイジアン分解による指示に従う新しい枠組みであるベイジアンVLAを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:15:22 GMT)
DeLog: An Efficient Log Compression Framework with Pattern Signature Synthesis [30.7] 解析精度が向上しても圧縮比が向上しないことを示す。
パターン署名合成を実装した新しいログコンプレッサであるDeLogを設計する。
16のパブリックデータセットと10のプロダクションデータセットで、DeLogは最先端の圧縮比とスピードを達成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:26:09 GMT)
Purcell enhanced electroluminescence of a unipolar light emitting quantum device at 10 micron [30.5] 我々は、空間特性に優れたコリメートビームを放射する中赤外EL素子を実証した。
可視光域のLEDとして熱力学的平衡に近い動作を行う効率の良い光電子発光素子を考案した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:10:31 GMT)
U-Harmony: Enhancing Joint Training for Segmentation Models with Universal Harmonization [30.1] 本稿では,Universal Harmonization(U-Harmony)と呼ばれる協調学習手法を提案する。
U-Harmonyを統合することで、我々のアプローチは次々に正規化し、次に特徴分布を非正規化し、ドメイン固有のバリエーションを緩和する。
より魅力的なことに、我々のフレームワークは普遍的なモダリティ適応もサポートしており、新しい画像モダリティと解剖学的クラスをシームレスに学習することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:43:39 GMT)
QKVQA: Question-Focused Filtering for Knowledge-based VQA [30.0] 知識に基づくビジュアル質問回答(KB-VQA)は、画像と外部知識を統合することで質問に答えることを目的としている。
本稿では,高品質なフィルタリング知識を効率的に得るための質問焦点フィルタリング手法を提案する。
実験の結果,E-VQAでは4.9%,InfoSeekでは3.8%,最先端モデルでは4.9%向上した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:29:35 GMT)
Query-Efficient Agentic Graph Extraction Attacks on GraphRAG Systems [29.9] グラフベースの検索拡張生成(GraphRAG)システムは、文書コレクション上の知識グラフを構築し、マルチホップ推論をサポートする。
提案手法では,相手が適応的にシステムに問い合わせて潜伏するエンティティ関係グラフを盗む,予算制約付きブラックボックス設定について検討する。
本稿では,新たな探索探索戦略,外部グラフメモリモジュール,および2段階グラフ抽出パイプラインを活用するフレームワークであるAGEAを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:20:54 GMT)
OptiSQL: Executable SQL Generation from Optical Tokens [29.4] 本稿では,テーブルイメージや自然言語質問から直接実行可能なsqlを生成する,視覚駆動型フレームワークOptiを提案する。
実験の結果、Optiはテーブル入力トークンを桁違いに削減しながら、強い実行精度を維持していることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:17:28 GMT)
\textsc{LogicScore}: Fine-grained Logic Evaluation of Conciseness, Completeness, and Determinateness in Attributed Question Answering [29.3] ローカルアセスメントからグローバルな推論の精査へとパラダイムをシフトさせる統合評価フレームワークであるtextscLogicScore を提示する。
提案手法は,テキスト完全性(論理的音声推論),テキスト簡潔性(非冗長性),テキスト決定性(一貫性解答包含)の3つの重要な推論次元を評価するために,後方検証機構を統合する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:52:03 GMT)
LookBench: A Live and Holistic Open Benchmark for Fashion Image Retrieval [28.8] LookBenchは、実際のEコマース環境でのファッション画像検索のための、ライブで総合的で挑戦的なベンチマークである。
LookBenchには、ライブWebサイトからソースされた最近の製品イメージと、AIが生成したファッションイメージの両方が含まれている。
実験の結果,LookBenchは強いベースラインに重大な課題をもたらすことがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:50:23 GMT)
Adaptive Rotary Steering with Joint Autoregression for Robust Extraction of Closely Moving Speakers in Dynamic Scenarios [28.3] Ambisonicsにおける深部空間フィルタリングの最近の進歩は、静止多話者シナリオにおいて強い性能を示す。
我々は,この回転ステアリングを,目標の初期方向を条件としたインターリーブ付きトラッキングアルゴリズムを用いて自動化することを提案する。
付近の話者や交差する話者にとって、ロバストな追跡は難しくなり、空間的手がかりは強化にはあまり効果がない。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:35:09 GMT)
QDK/Chemistry: A Modular Toolkit for Quantum Chemistry Applications [27.8] 量子コンピュータをターゲットとする量子化学のためのソフトウェアツールキットQDK/Chemistryを提案する。
QDK/Chemistryは、データ表現を計算手法から分離するモジュラーアーキテクチャを通じて、このインフラを提供する。
量子古典パイプラインにターゲットアルゴリズムのネイティブ実装を提供するだけでなく、ツールキットは広く使われているオープンソースの量子化学パッケージや量子コンピューティングフレームワークの上に構築され、統合される。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:35:40 GMT)
RSNA Large Language Model Benchmark Dataset for Chest Radiographs of Cardiothoracic Disease: Radiologist Evaluation and Validation Enhanced by AI Labels (REVEAL-CXR) [27.7] GPT-4oは13,735個の胸部X線写真から異常所見を抽出した。
専門家のレビューのために、AIが推奨するベンチマークラベルに基づいて1000がサンプリングされた。
17名の胸部放射線科医が参加し、「Agree all」「Agree mostly」「Disagree」と名づけた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:04:01 GMT)
Overcoming In-Memory Bottlenecks in Graph Foundation Models via Retrieval-Augmented Generation [27.6] Graph Foundation Models (GFMs) はグラフ学習のフロンティアとして登場し、さまざまなタスク間で伝達可能な表現を提供することが期待されている。
本稿では,パラメータから知識をオフロードする検索型生成支援グラフ基礎モデルであるRAG-GFMを提案する。
RAG-GFMは、クロスドメインノードとグラフ分類の両方において、13の最先端のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:02:43 GMT)
LuxRemix: Lighting Decomposition and Remixing for Indoor Scenes [27.5] 屋内シーンにおけるインタラクティブな光編集のための新しい手法を提案する。
本手法は,複雑な屋内照明を構成光源に分解する生成画像に基づく光分解モデルを利用する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:59:22 GMT)
CodeDelegator: Mitigating Context Pollution via Role Separation in Code-as-Action Agents [27.5] 現実のタスクは、しばしば戦略的計画と詳細な実装の両方を要求する。
我々は,役割の専門化を通じて計画と実装を分離するマルチエージェントフレームワークであるCodeDelegatorを提案する。
永続的なデリゲータは、タスクを分解し、仕様を書き、コードを実行せずに進捗を監視して、戦略的監視を維持する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:55:30 GMT)
TempViz: On the Evaluation of Temporal Knowledge in Text-to-Image Models [27.4] TempVizは、画像生成における時間的知識を階層的に評価する最初のデータセットである。
5つの時間的知識カテゴリにまたがる5つのT2Iモデルの能力について検討する。
人間の評価では、時間的能力は一般的に弱く、カテゴリーごとの精度は75%を超えない。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:52:23 GMT)
Beyond Tokens: Concept-Level Training Objectives for LLMs [27.3] Next-token Prediction (NTP) はtextittoken レベルで動作し、単一の参照継続からの逸脱をエラーとして扱う。
我々はトークンレベルから概念レベルへのシフトを提案し、概念は同じアイデアの複数の曲面形式をグループ化する。
提案手法は, NLP ベンチマークにおいて, NTP モデルよりも低難易度化, ドメインシフト時の堅牢性の向上, 性能向上を実現していることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:42:15 GMT)
Reinforcement Learning for Chain of Thought Compression with One-Domain-to-All Generalization [27.1] 大規模言語モデルにおけるチェーン・オブ・シント推論は、"過度な罠"を引き起こす可能性がある
そこで本研究では,有能なサンプルレベルのソフト強化学習圧縮を提案する。
モデルがすでに問題を解決している場合にのみ、長時間のロールアウトをペナルティ化し、ロールアウトを短縮した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:34:10 GMT)
RMBRec: Robust Multi-Behavior Recommendation towards Target Behaviors [26.9] ターゲット行動に対するロバスト多行動勧告(RMBRec)を提案する。
RMBRecは、情報理論の堅牢性原理に基づく、堅牢なマルチビヘイビアレコメンデーションフレームワークである。
RMBRecは最先端の手法よりも精度が高く,様々なノイズ摂動下では顕著な安定性を維持している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:02:16 GMT)
AutoDriDM: An Explainable Benchmark for Decision-Making of Vision-Language Models in Autonomous Driving [26.9] AutoDriDMは,3次元にわたる6,650の質問 – Object, Scene, Decision – を備えた,意思決定中心の,プログレッシブなベンチマークです。
我々は、自律運転における知覚と判断能力の境界を明確化するために、主流の視覚言語モデルを評価する。
モデル推論プロセスの説明可能性分析を行い、論理的推論エラーなどの重要な障害モードを特定する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:29:09 GMT)
Tracking the Limits of Knowledge Propagation: How LLMs Fail at Multi-Step Reasoning with Conflicting Knowledge [26.8] TRACK(Testing Reasoning Amid Conflicting Knowledge)は、LLMがマルチステップ推論によって新しい知識をどのように伝播するかを研究するための新しいベンチマークである。
この結果から,モデルに更新事実を付与するよりも,モデルに更新事実を付与する方が性能を悪化させる可能性が示唆された。
この失敗は、更新された事実を忠実に統合できないことと、知識が統合されたとしても推論に欠陥があることから生じることを示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:56:35 GMT)
Diffusion In Diffusion: Reclaiming Global Coherence in Semi-Autoregressive Diffusion [26.5] ブロック拡散モデルに固有の不可逆性とミオピア問題を克服する「ドラフト・then-refine」フレームワークを提案する。
提案手法は,OpenWebTextデータセット上での離散拡散モデルに対する新しいベンチマークを設定する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:21:39 GMT)
Rethinking Video Generation Model for the Embodied World [26.2] RBenchは5つのタスク領域と4つの異なる実施形態でロボット指向のビデオ生成を評価するように設計されている。
25個の代表モデルの評価は、身体的現実的なロボット行動の生成において重大な欠陥を浮き彫りにしている。
改良された4段階のデータパイプラインを導入し、400万の注釈付きビデオクリップを備えたビデオ生成のための、最大のオープンソースロボットデータセットであるRoVid-Xを開発した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:59:18 GMT)
RECAP: Resistance Capture in Text-based Mental Health Counseling with Large Language Models [26.0] 既存のNLPアプローチは、抵抗カテゴリーを単純化し、治療介入のシーケンシャルなダイナミクスを無視し、限定的な解釈性を提供する。
PsyFIREは、13のきめ細かい抵抗挙動を、協調的相互作用とともに捉えるための理論的な基盤となるフレームワークである。
PsyFIREに基づいて,実世界の中国語テキストベースのカウンセリングから23,930の注釈付き発話を用いたクライアントレジスタンスコーパスを構築した。
本稿では,抵抗型と細粒度抵抗型を説明付きで検出する2段階フレームワークRECAPを開発する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:00:36 GMT)
Robustness of Mixtures of Experts to Feature Noise [25.9] スパース専門家のアクティベーションがノイズフィルタとして機能することを示す。
スパース専門家のアクティベーションがノイズフィルタとして機能することを示す。
合成データと実世界の言語タスクに関する実証的な結果が理論的洞察を裏付ける。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:15:48 GMT)
Metadata Conditioned Large Language Models for Localization [25.9] メタデータ条件付けは、領域間一般化を犠牲にすることなく、領域内性能を継続的に改善することを示す。
我々のアブレーション研究は、URLレベルのメタデータだけで地理的信号の多くをキャプチャすることを示した。
命令チューニングの後、メタデータ条件付きグローバルモデルはLLaMA-3.2-1B-インストラクトに匹敵する精度を達成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:20:59 GMT)
Symmetry Informative and Agnostic Feature Disentanglement for 3D Shapes [25.8] 近年,イメージファウンデーションモデルの特徴を活用してセマンティクスを意識した記述子を作成することによって,新たな研究の方向を導いた研究がいくつかある。
近年の手法では、意味認識記述子から対称性非表現的特徴を抽出することに成功したが、その特徴は1次元に過ぎず、他の貴重な意味情報を無視している。
本稿では,対称性情報と対称性非依存を同時に行う特徴的非絡み合い手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:30:13 GMT)
What Should I Cite? A RAG Benchmark for Academic Citation Prediction [25.0] 引用予測は、学者が拡大する科学文献をナビゲートするのを助けるために、自動的に適切な参照を提案することを目的としている。
ここでは,学術的な引用予測に基づいて大規模言語モデルを評価するための,最初の総合的検索拡張世代(RAG)統合ベンチマークである textbfCiteRAG を紹介する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:51:47 GMT)
Learning to Trust Experience: A Monitor-Trust-Regulator Framework for Learning under Unobservable Feedback Reliability [25.0] 保存不能信頼性(EIUR)下におけるてんかんの認識可能性について検討した。
標準的な堅牢な学習は安定して収束するが、高信頼で体系的に間違った信念を形成する。
本稿では,メタ認知制御の実践的対応として,学習者の内的力学における内在的証拠から経験的信頼性を推定する第2の内観的制御ループを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:48:31 GMT)
Render-of-Thought: Rendering Textual Chain-of-Thought as Images for Visual Latent Reasoning [23.4] CoT(Chain-of-Thought)の促進により、LLM(Large Language Models)の推論能力の解放に成功した。
Render-of-Thought (RoT) は、画像にテキストステップを描画することで推論チェーンを再構築する最初のフレームワークである。
提案手法は, 明示的なCoTに比べて3~4倍のトークン圧縮と相当な推論高速化を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:09:25 GMT)
Spatially Generalizable Mobile Manipulation via Adaptive Experience Selection and Dynamic Imagination [23.2] 移動マニピュレーションは、多段階の異種スキルの合成に対する長い水平決定を伴う。
既存のMM手法では, (i) 長期間の相互作用で発生する冗長なデータの有効利用により, サンプル効率が低下する。
本稿では,適応経験選択(AES)とモデルに基づく動的想像力を通して,これらの課題に対処する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:43:49 GMT)
LiViBench: An Omnimodal Benchmark for Interactive Livestream Video Understanding [23.2] LiViBenchはインタラクティブなライブストリームビデオのための全方位ベンチマークである。
24タスクの多様なセットが特徴で、知覚、推論、ライブストリーム固有の課題を強調している。
インタラクティブなライブストリームの知識を充実させたMLLMであるLiVi-LLM-7Bを開発した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:14:20 GMT)
3D Space as a Scratchpad for Editable Text-to-Image Generation [23.0] 言語意図と画像合成を橋渡しする3次元推論基板である空間的スクラッチパッドの概念を導入する。
我々のフレームワークは、対象と背景要素を解析し、編集可能な3Dメッシュとしてインスタンス化し、配置、配向、視点選択のためにエージェント的なシーンプランニングを採用する。
従来の2Dレイアウト方式とは異なり,本手法は直感的な3D編集をサポートし,最終画像に確実に伝播する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:40:19 GMT)
Social Caption: Evaluating Social Understanding in Multimodal Models [23.0] 社会的理解能力は、人間の社会的相互作用を解釈するために、マルチモーダルな大言語モデル(MLLM)にとって不可欠である。
本稿では,MLLMの社会的理解能力を評価するための相互作用理論に基づくフレームワークであるSocial Captionを紹介する。
我々は,スケール,建築設計,音声コンテキストなどの社会的理解におけるモデル性能に影響を与える要因を分析した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:10:42 GMT)
Graph Recognition via Subgraph Prediction [22.9] 画像中のグラフを認識するためのtextbfSubgraph textbfPrediction (textbfGraSP) を用いた textbfGraph 認識法を開発した。
提案手法は多種多様なグラフとその図面で動作し,タスク固有の変更を伴わずにタスク間を移動可能であることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:07:17 GMT)
Emerging from Ground: Addressing Intent Deviation in Tool-Using Agents via Deriving Real Calls into Virtual Trajectories [22.8] 意図のずれを軽減するために考案された「リアル・トゥ・ヴァーチャル」法。
RISE(Real-to-Virtual)は,意図の偏差を緩和する手法である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:58:54 GMT)
Enhancing Few-Shot Out-of-Distribution Detection via the Refinement of Foreground and Background [22.3] 本稿では,CLIPをベースとしたフォアグラウンド・バックグラウンド(FG-BG)分解のための新しいプラグイン・アンド・プレイフレームワークを提案する。
背景領域では、既存の手法では全てのパッチに対して均一な抑制戦略を採用しており、予測に対する異なるパッチの様々な貢献を見越している。
前景の地域では、既存の手法では、一部のローカルパッチが他のクラスと外観や意味的類似性を示す可能性があると適切に考慮できないため、トレーニングプロセスを誤解させる可能性がある。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:12:11 GMT)
When Are Two Scores Better Than One? Investigating Ensembles of Diffusion Models [22.0] スコアのアンサンブルは、一般的にスコアマッチング損失とモデル可能性を改善するが、画像データセット上のFIDのような知覚品質指標を一貫して強化することができない。
また,楽譜モデルの要約に関する理論的知見も提供し,アンサンブルだけでなく,いくつかのモデル構成技術にも光を当てた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:49:27 GMT)
A Contrastive Pre-trained Foundation Model for Deciphering Imaging Noisomics across Modalities [21.6] ノイズ(Noisomics)とは、抑圧から体系的なノイズデコーディングへ焦点を移すフレームワークである。
CoPはコントラスト学習を用いて摂動から意味的信号を解き放つ。
CoPは従来のディープラーニングスケーリングの法則を破り、100のトレーニングサンプルだけで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:52:34 GMT)
Multimodal Rumor Detection Enhanced by External Evidence and Forgery Features [21.5] ソーシャルメディアは、画像テキストの混合投稿を通じて情報を広める傾向が強まっている。
深いセマンティックなミスマッチの噂は、特定の課題を引き起こし、オンラインの世論を脅かす。
既存のマルチモーダル噂検出手法は,限られた特徴抽出,ノイズアライメント,非フレキシブル融合戦略に悩まされている。
外部証拠と偽造特徴を付加したマルチモーダルな噂検出モデルを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:53:18 GMT)
Joint single-shot ToA and DoA estimation for VAA-based BLE ranging with phase ambiguity: A deep learning-based approach [21.5] 仮想アンテナアレイ(VAA)技術は、単一アンテナによるDoA推定を可能にし、そのようなデバイス上での角度推定を可能にする。
本稿では、VAAとBLE双方向CFRを組み合わせた統合モデルを提案し、ニューラルネットワークに基づく位相回復フレームワークを提案する。
提案手法は,SNR$geq$5 dBでクレイマーラオ境界に接近する平均2乗誤差を用いて,不均一なVAA下での優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:31:52 GMT)
DNF: Dual-Layer Nested Fingerprinting for Large Language Model Intellectual Property Protection [21.4] 暗黙的な意味的トリガーとドメイン固有のスタイル的手がかりを結合することにより,階層的なバックドアを埋め込むブラックボックス手法を提案する。
Mistral-7B、LLaMA-3-8B-インストラクト、Falcon3-7B-インストラクトを通して、DNFは下流のユーティリティを保ちながら完璧な指紋活性化を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:03:08 GMT)
Safeguarding Facial Identity against Diffusion-based Face Swapping via Cascading Pathway Disruption [21.4] VoidFaceは,顔スワップを結合したアイデンティティパスとみなすシステム的防御手法である。
まず,物理レグレッションとセマンティック埋め込みを劣化させるため,局所化の破壊とアイデンティティの消去を導入し,音源面の正確なモデリングを損なう。
次に、注意機構を分離してアイデンティティ注入を行い、ソースアイデンティティの再構築を防ぐために中間拡散特性を損なうことにより、生成領域に介入する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:52:56 GMT)
DARA: Few-shot Budget Allocation in Online Advertising via In-Context Decision Making with RL-Finetuned LLMs [21.3] 大規模言語モデルは、AIGBの有望な代替手段を提供する。
微粒な最適化に必要な数値精度は欠如している。
DARAは、意思決定プロセスを2段階に分解する新しい2段階のフレームワークである。
当社のアプローチは、予算制約下での累積広告価値において、既存のベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:58:44 GMT)
Multi-Persona Thinking for Bias Mitigation in Large Language Models [21.1] 大規模言語モデル(LLM)は、有害なステレオタイプや不公平な結果に永続的な社会的バイアスを示す。
複数視点からの弁証的推論を利用してバイアスを低減する新しい推論時間フレームワークであるMulti-Persona Thinking (MPT)を提案する。
MPTは、対照的な社会的アイデンティティと中立的な視点を採用するようモデルに誘導し、それらのペルソナを反復してバイアスを露出し、修正する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:40:58 GMT)
IB-GRPO: Aligning LLM-based Learning Path Recommendation with Educational Objectives via Indicator-Based Group Relative Policy Optimization [20.9] 学習経路勧告(LPR)は、長期学習効果を最大化する学習項目のパーソナライズされたシーケンスを生成することを目的としている。
LLMは、自由形式のレコメンデーションにリッチなセマンティック理解を提供し、それを長期のLPRに適用することは困難である。
LLMに基づくLPRのためのインジケータ誘導アライメント手法であるIB-GRPOを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:03:05 GMT)
The GDN-CC Dataset: Automatic Corpus Clarification for AI-enhanced Democratic Citizen Consultations [20.7] 本稿では,フランス・グランド・デバット・ナショナルへの1,231件のコントリビューションのデータセットであるGDN-CCについて述べる。
これらのアノテーションを再現する上で,微調整された小言語モデルとLLMの適合性や性能が一致していることを示し,意見クラスタリングタスクのユーザビリティを測定した。
GDN-CC-largeは、240kのコントリビューションの自動注釈付きコーパスで、これまでで最大の注釈付き民主的コンサルティングデータセットです。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:43:07 GMT)
RefProtoFL: Communication-Efficient Federated Learning via External-Referenced Prototype Alignment [20.5] フェデレートラーニング(FL)は、エッジ環境で生データを共有せずに協調的なモデルトレーニングを可能にする。
本稿では,外部参照型プロトタイプアライメントを統合した通信効率の高いFLフレームワークRefProtoFLを提案する。
RefProtoFLは、最先端のプロトタイプベースのFLベースラインよりも高い分類精度が得られることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:01:14 GMT)
Automated Rubrics for Reliable Evaluation of Medical Dialogue Systems [19.9] 大規模言語モデル(LLM)は、幻覚や安全でない提案が患者の安全に直接的なリスクをもたらすという、臨床的な意思決定支援にますます利用されている。
本稿では,インスタンス固有の評価ルーリックの自動生成を目的とした検索拡張型マルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:40:41 GMT)
Small Gradient Norm Regret for Online Convex Optimization [19.7] 我々は、$Gstar$後悔は、既存の$Lstar$(小さな損失)後悔を厳しく洗練させることを示した。
結果をダイナミックな後悔と盗賊の設定にまで拡張します。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:05:14 GMT)
SpatialMem: Unified 3D Memory with Metric Anchoring and Fast Retrieval [19.7] SpaceMemはメモリ中心のシステムであり、三次元幾何学、意味論、言語を単一の表現に統一する。
メートル法で拡張された屋内環境を再構築し、構造的な3Dアンカーを検出し、オープン語彙オブジェクトノードで階層メモリをポップアップさせる。
特殊なセンサーを使わずに、言語誘導ナビゲーションやオブジェクト検索などの下流タスクをサポートする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:32:24 GMT)
Improving Regret Approximation for Unsupervised Dynamic Environment Generation [19.5] 無監督環境設計(UED)は、強化学習(RL)エージェントのための訓練カリキュラムを自動生成することを目指している。
現在の手法は、困難な信用割当問題に悩まされており、難易度を特定できない後悔の近似に依存している。
より高密度なジェネレータ報酬信号を実現するために,UEDのための動的環境生成を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:58:40 GMT)
Learning from Synthetic Data: Limitations of ERM [19.5] レビューサイトから裁判所文書まで、ナチュラル'のコンテンツは、自然データに類似しているように見えるデータポイントによって汚染されてきたが、実際はLSMが生成している。
我々は、このシナリオを、入力が自然データと合成データの混合である学習タスクのシーケンスとしてモデル化する。
任意のVCクラスと任意の量の汚染に対する正しい仮説を学習できるアルゴリズムが存在することを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:07:16 GMT)
HiNS: Hierarchical Negative Sampling for More Comprehensive Memory Retrieval Embedding Model [19.5] 既存のトレーニングデータ構築は、負のサンプルの階層的難しさという、重大な制限を見落としている。
本稿では, 負のサンプル難易度を明示的にモデル化し, 経験的基礎となる負の比率を組み込む, 基本データ構築フレームワークHiNSを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:39:48 GMT)
Dissipative Quantum Dynamics in Static Network with Different Topologies [19.5] 量子ネットワークの異なるネットワークトポロジ間の量子集団の散逸ダイナミクスとコヒーレンスについて検討する。
まず、リンドブラッドマスター方程式を用いてモデル化した大きな散逸浴に埋め込まれたイジングスピンの小さなネットワークを解析する。
次に,ネットワークを大規模に拡張し,大規模ネットワークにおける散逸ダイナミクスを捉える平均場アプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:08:07 GMT)
Variance-Adaptive Muon: Accelerating LLM Pretraining with NSR-Modulated and Variance-Scaled Momentum [19.4] 大規模言語モデル(LLM)は、多種多様な自然言語処理(NLP)タスク間の競合性能を達成する。
モーメントに分散適応正規化を適用するMuon-NSRとMuon-VSの2つの変種を提案する。
GPT-2 と LLaMA プレトレーニング実験により,提案手法は収束を加速し,AdamW と Muon の両ベースラインの競合よりも連続的に検証損失を減少させることを示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:41:56 GMT)
Teaching Robots Like Dogs: Learning Agile Navigation from Luring, Gesture, and Speech [19.4] 本研究の目的は,ロボットが人間の社会的手がかりを解釈し,身体的指導を通じて適切な行動を生み出す方法を学習できるようにすることである。
本稿では,ロボットがデータ効率のよいナビゲーション行動を取得することを可能にする,ループ型ヒューマン・イン・ザ・ループ・フレームワークを提案する。
障害を飛び越えたり回避したりする6つの現実のアジャイルナビゲーションシナリオで、私たちのフレームワークを評価します。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:52:18 GMT)
Seeing through Light and Darkness: Sensor-Physics Grounded Deblurring HDR NeRF from Single-Exposure Images and Events [18.7] 野生でよく見られる低ダイナミックレンジ(LDR)ぼかし画像からの新たなビュー合成は、極端な照明条件下での高ダイナミックレンジ(ブルー)と鋭い3D表現の回復に苦慮している。
単一露光でぼやけたLDR画像とそれに対応するイベントから、鋭いHDRノウハウを合成するための統合されたセンサ物理接地型NeRFフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:25:58 GMT)
PodBench: A Comprehensive Benchmark for Instruction-Aware Audio-Oriented Podcast Script Generation [18.4] PodBenchは、最大21Kトークンと複雑なマルチスピーカー命令を備えた800のサンプルからなるベンチマークである。
明示的な推論を備えたオープンソースモデルは、長いコンテキストを扱う際に優れた堅牢性を示す。
分析の結果,高次命令が高内容の物質を保証しない持続的分岐が明らかになった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:41:14 GMT)
Trustworthy Longitudinal Brain MRI Completion: A Deformation-Based Approach with KAN-Enhanced Diffusion Model [17.8] 縦断的脳MRIは、寿命の研究には不可欠であるが、高い摂食率は、しばしば欠落データにつながる。
深層生成モデルは研究されてきたが、ほとんどは画像強度に頼っている。
我々は,コンモゴロフ・アルノルドネットワーク(KAN)を拡張した拡散モデルであるDF-DiffComを紹介した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:28:23 GMT)
Language Model Representations for Efficient Few-Shot Tabular Classification [17.6] 大規模言語モデル(LLM)はセマンティック検索のようなタスクにおいて、Webインフラストラクチャのますます統合的なコンポーネントになりつつある。
本稿では、$textbfTa$ble $textbfR$epresentation with $textbfL$anguage Modelという軽量パラダイムを調査します。
提案手法は,低データ方式の最先端モデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:28:51 GMT)
HCVR Scene Generation: High Compatibility Virtual Reality Environment Generation for Extended Redirected Walking [17.6] HCVR(High Compatibility Virtual Reality Environment Generation)は、アライメントベースのRDWコントローラに本質的に最適化された仮想シーンを生成する。
物理衝突は22.78倍、ENI++では35.89%減少した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:51:03 GMT)
Holmes: An Evidence-Grounded LLM Agent for Auditable DDoS Investigation in Cloud Networks [17.4] LLMをベースとしたDDoS検出エージェントであるHolmes(DDoS Detective)を提案する。
ホームズは多種多様な攻撃家族にまたがる有能な証拠に根ざした帰属決定を下すことを示した。
結果から、ホームズは様々な攻撃家族にまたがる有能な証拠に根ざした帰属決定を下すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:39:46 GMT)
TRSVR: An Adaptive Stochastic Trust-Region Method with Variance Reduction [17.1] 本稿では,分散領域(SVRG)を組み込んで収束を加速する非拘束的非還元最適化の信頼手法を提案する。
提案アルゴリズムは勾配情報のみに依存し,関数値の評価を必要としない。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:41:57 GMT)
Multi-Behavior Sequential Modeling with Transition-Aware Graph Attention Network for E-Commerce Recommendation [17.0] transition-Aware Graph Attention Network (TGA) は、マルチビヘイビア遷移をモデル化するための線形複雑性アプローチである。
TGAは大規模産業生産環境にデプロイされており、主要なビジネス指標が大幅に改善されている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:53:32 GMT)
Mechanistic Interpretability for Large Language Model Alignment: Progress, Challenges, and Future Directions [16.8] 大規模言語モデル(LLM)は様々なタスクにまたがる優れた機能を実現しているが、内部決定プロセスはほとんど不透明である。
機械的解釈可能性(Mechanistic Interpretability)は、これらのモデルの理解と整合性のための重要な研究の方向性として現れている。
我々は、人間のフィードバックからの強化学習、立憲AI、スケーラブルな監視など、解釈可能性に関する洞察がどのようにアライメント戦略に影響を与えたかを分析する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:43:57 GMT)
Memorization Dynamics in Knowledge Distillation for Language Models [16.8] 3つの大言語モデル(LLM)と3つのデータセットを用いて,KDパイプライン全体の記憶について検討した。
1) 蒸留したモデルは, 通常の微調整(50%以上還元)に比べて, トレーニングデータを大幅に低減し, 2) 蒸留中の暗記を覚えやすい例(95%以上) , (3) 学生の暗記は, zlibエントロピー, KL の発散, 難易度に基づく特徴を用いて, 蒸留前に予測可能である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:04:40 GMT)
The Promises and Perils of using LLMs for Effective Public Services [16.7] 政府は重要な公共サービスの主要なプロバイダーであり、それらを効果的に届ける責任がある。
児童福祉(CW)のような高い意思決定領域では、機関は、家族のシステムへの関与を必要以上に延長することなく、子供を保護する必要がある。
AIに関する楽観主義が高まり、政府はその統合を推し進めているが、実現可能性や損害に関する懸念は残る。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:41:46 GMT)
An XAI View on Explainable ASP: Methods, Systems, and Perspectives [16.6] Answer Set Programming (ASP)は、シンボリックAIにおける一般的な宣言的推論と問題解決のアプローチである。
本稿では、ユーザによる説明に関する質問に関連するASPの説明のタイプの概要と、現在の理論やツールによるそのカバレッジについて述べる。
既存のASP説明アプローチのギャップを指摘し、今後の研究の方向性を特定します。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:37:33 GMT)
High-Fidelity 3D Tooth Reconstruction by Fusing Intraoral Scans and CBCT Data via a Deep Implicit Representation [16.3] 本稿では,CBCTとIOSデータを暗黙的表現を用いて融合する,完全自動パイプラインを提案する。
IOSクラウンとCBCTルートを組み合わせたハイブリッド・プロキシ・メッシュを作成した。
この最適化プロセスは、理想的な歯形を学習した多様体に入力を投影し、シームレスで水密で解剖学的に一貫性のあるモデルを生成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:40:56 GMT)
A Training-Free Guess What Vision Language Model from Snippets to Open-Vocabulary Object Detection [16.2] Open-Vocabulary Object Detection (OVOD)は、あらゆるものを検知する機能を開発することを目的としている。
本稿では,普遍的な理解パラダイムを形成するために,学習自由なギース・オブ・ビジョン言語モデルを提案する。
提案したGW-VLMは,トレーニングステップを使わずに,最先端の手法と比較して優れたOVOD性能を実現することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:41:03 GMT)
AI-generated data contamination erodes pathological variability and diagnostic reliability [16.1] この自己参照サイクルは, 人体検査が必須でない場合に, 病的変動と診断信頼性の急激な侵食を引き起こすことを示す。
我々の結果は、政策管理された人間の監視がなければ、生成的AIの展開は、それが依存する医療データエコシステムを劣化させる恐れがあることを示唆している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:06:17 GMT)
TIDAL: Temporally Interleaved Diffusion and Action Loop for High-Frequency VLA Control [15.5] 大規模なVision-Language-Action(VLA)モデルはセマンティックな一般化を提供するが、高い推論遅延に悩まされる。
本稿では,高頻度動作から意味論的推論を分離する階層型フレームワークであるTIDALを提案する。
TIDALは、二重周波数アーキテクチャを用いて拡散ベースのVLAのためのバックボーンに依存しないモジュールとして動作する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:43:11 GMT)
BBoxMaskPose v2: Expanding Mutual Conditioning to 3D [15.3] PMPoseは、確率的定式化とマスク条件を組み込んだトップダウン2Dポーズ推定器である。
PMPoseとSAMベースのマスク改善モジュールを統合したBBoxMaskPose v2(BMPv2)を提案する。
新しいOCHuman-Poseデータセットの結果は、複数人のパフォーマンスが検出よりもポーズ予測精度に影響されていることを示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:18:04 GMT)
A Two-Stage GPU Kernel Tuner Combining Semantic Refactoring and Search-Based Optimization [15.1] 本稿では,エージェント駆動反復ループ上にテンプレートベースの書き換え層を導入する。
提案手法は,実運用負荷に対する自動性能最適化を実現するために拡張することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:52:35 GMT)
Beyond Error-Based Optimization: Experience-Driven Symbolic Regression with Goal-Conditioned Reinforcement Learning [14.5] EGRL-SR(Experience-driven Goal- Conditioned Reinforcement Learning for Regression)という新しいフレームワークを提案する。
目標条件付き強化学習問題として記号回帰を定式化し、後続経験リプレイを取り入れた。
我々は、低エラー表現よりも構造パターンに注目するアクション値ネットワークを奨励する、全点満足度二項報酬関数を設計する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:08:37 GMT)
Scaling Ambiguity: Augmenting Human Annotation in Speech Emotion Recognition with Audio-Language Models [14.5] 音声感情認識モデルは典型的には、人間の感情の本質的なあいまいさを覆い隠して、単一の分類ラベルを使用する。
本稿では,高品質な合成アノテーションを生成することで,ALM(Large Audio-Language Models)がアノテーションボトルネックを軽減することができるかを検討する。
本稿では,ALMを利用してSynthetic Perceptual Proxiesを作成するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:32:24 GMT)
PULSE: Socially-Aware User Representation Modeling Toward Parameter-Efficient Graph Collaborative Filtering [14.3] グラフベースのソーシャルレコメンデーション(SocialRec)は、グラフ協調フィルタリング(GCF)の強力な拡張として登場した。
PULSE ( efficient User representation with Social Knowledge) は,各ユーザに対して明示的な学習可能な埋め込みを作成することなく,社会的に意味のある信号からユーザ表現を構築することで,この制限に対処するフレームワークである。
提案手法は, コールドスタートから高能率ユーザに至るまで, 13 GCF とグラフベースのソーシャルレコメンデーションベースラインを, 時間とメモリ効率のモデリングプロセスを通じて, 様々なレベルのインタラクション・スパシティで性能向上を実現している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:19:53 GMT)
Incentive-Tuning: Understanding and Designing Incentives for Empirical Human-AI Decision-Making Studies [13.6] 我々は,実証的な人間-AI意思決定研究を行う上で,インセンティブデザインの重要性に対処することを目的とする。
我々は、研究者が研究に効果的なインセンティブ・スキームを設計するのを助けるための一連のガイドラインをキュレートした。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:10:46 GMT)
The Effect of Scripts and Formats on LLM Numeracy [13.4] 大規模言語モデル (LLM) は、基本的な算術において優れた習熟度を達成している。
本研究では,多種多様な数字の書式および書式に対する数値推論について検討する。
数値入力が表現不足のスクリプトやフォーマットでレンダリングされると,LLMの精度が大幅に低下することを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:33:15 GMT)
Adversarial Drift-Aware Predictive Transfer: Toward Durable Clinical AI [13.4] Adversarial Drift-Aware Predictive Transfer (ADAPT)は、時間的ドリフトに対する耐久性を最小限の再トレーニングで提案する新しいフレームワークである。
ADAPTは、歴史的ソースモデルと限られた現在のデータを組み合わせることで、確実な将来モデルの集合を構築している。
将来の漂流による劣化に対する堅牢性と現在の精度のバランスをとる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:48:59 GMT)
To Neuro-Symbolic Classification and Beyond by Compiling Description Logic Ontologies to Probabilistic Circuits [13.2] 我々は,記述論理オントロジーと整合した予測を確実に出力するニューロシンボリック手法を開発した。
我々は,ニューラルネットワークのベースラインと比較した場合,ニューラルシンボリック分類器が確実に一貫した予測を生成することを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:30:14 GMT)
MonoRace: Winning Champion-Level Drone Racing with Robust Monocular AI [13.1] モノクラー式ローリングシャッターカメラとIMUを用いたドローンレース方式であるMonoRaceを紹介した。
このアプローチでは、ニューラルネットワークベースのゲートセグメンテーションとドローンモデルを組み合わせた堅牢な状態推定が特徴である。
同社は自律ドローンレースの新たなマイルストーンを樹立し、競技コースで最高100km/hに到達した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:53:29 GMT)
DCeption: Real-world Wireless Man-in-the-Middle Attacks Against CCS EV Charging [13.0] ホームプラググリーンPHY(HPGP)のSDR(Software-Defined Radio)実装について紹介する。
我々は、ハイジャックのタイミング制約を理解するために、2750の現実世界の充電セッションの特性を分析した。
下位互換性のある、ダウングレードなプロトコル拡張を提案し、基盤となる脆弱性を軽減します。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:59:49 GMT)
Software Testing in the Quantum World [13.0] 量子ソフトウェアが複雑化するにつれて、量子コンピュータの古典的なシミュレーションは実現不可能になる。
本稿では,大規模量子ソフトウェアをテストする上での課題と,それに対応するソフトウェア工学的視点について述べる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:21:36 GMT)
Alignment or Integration? Rethinking Multimodal Fusion in DNA-language Foundation Models [12.7] 本研究では,DNA-言語融合のための2つの新しい手法,すなわちセマンティックアライメント法 SeqCLIP と語彙レベル統合法 OneVocab を提案する。
分類と推論タスクに関する総合的な実験は、様々なアライメント戦略が埋め込みレベルのアライメントを改善する一方で、初期の語彙レベルの統合は、DNA言語モデリングにおいてより表現力が高く効果的な表現をもたらすことを示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:46:36 GMT)
Mechanism Shift During Post-training from Autoregressive to Masked Diffusion Language Models [12.6] Masked Diffusion Model (MDM) への事前訓練後の自己回帰モデル (ARM) は、逐次生成の限界を克服するための費用対効果の戦略として登場した。
訓練後MDMが真の双方向推論能力を獲得するか、あるいは単に自己回帰剤を再パッケージするかを検討する。
我々は,拡散後学習がモデルパラメータに適応するだけでなく,非逐次的グローバルプランニングを支援するために内部計算を根本的に再構成する,と結論付けた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:26:51 GMT)
Code Mixologist : A Practitioner's Guide to Building Code-Mixed LLMs [12.5] コードミキシングとコードスイッチング(CSW)は、大きな言語モデル(LLM)にとって難しい現象である。
この研究は、現代の大規模言語モデル設定におけるCSW研究の包括的概要を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:32:01 GMT)
DRGW: Learning Disentangled Representations for Robust Graph Watermarking [12.5] 本稿では,この問題に対処する最初のグラフ透かしフレームワークであるDRGWを提案する。
具体的には,多様な摂動に対する不変構造表現を学習する逆学習エンコーダを設計する。
また,離散グラフ編集における潜時修正の問題を解消する構造認識エディタも開発している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:29:25 GMT)
Retrieval-Augmented Self-Taught Reasoning Model with Adaptive Chain-of-Thought for ASR Named Entity Correction [12.5] 自動音声認識(ASR)における名前付きエンティティエラーの修正のための検索拡張生成フレームワークを提案する。
提案手法は,(1)名前付きエンティティ認識のための言い換え言語モデル(RLM)と,(2)タスクの難易度に基づいて推論の深さを動的に調整する適応チェーン・オブ・シント(A-STAR)を用いた新しい自己学習推論モデルからなる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:05:39 GMT)
Multi-context principal component analysis [12.2] コンテキストのサブセット間で共有される因子にデータを分解するフレームワークを開発する。
遺伝子発現に適用すると、がんのサブセット間で共有される変異の軸が明らかになる。
言語モデルからの文脈化された単語埋め込みに適用され、人間の自然に関する議論のステージをマッピングします。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:24:32 GMT)
Efficient Imputation for Patch-based Missing Single-cell Data via Cluster-regularized Optimal Transport [11.7] 我々は、パッチベースの欠落データを扱うために設計された最適なトランスポートベースの計算アルゴリズムCROTを提案する。
提案手法は,その基盤となるデータ構造を,重要な欠落の存在下で効果的に捉えるものである。
この研究は、構造化データの欠如を伴う不均一で高次元のデータセットにおいて、計算の堅牢な解を導入する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:58:13 GMT)
DeltaDorsal: Enhancing Hand Pose Estimation with Dorsal Features in Egocentric Views [11.7] 動的手とベースライン緩和位置との特徴を対比することでポーズを学習するデュアルストリームデルタエンコーダを提案する。
本手法は,自己閉塞シナリオにおいてMPJAE(Mean Per Joint Angle Error)を18%削減する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:00:43 GMT)
LoRAP: Low-Rank Aggregation Prompting for Quantized Graph Neural Networks Training [11.5] グラフニューラルネットワーク(GNN)は、グラフデータを処理し、ノード間の関係と相互作用をキャプチャすることを目的としたニューラルネットワークである。
本稿では,GNNにおける量子化学習(QAT)の性能向上のために,入力データを操作する即時学習を活用することを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:23:18 GMT)
LFS: Learnable Frame Selector for Event-Aware and Temporally Diverse Video Captioning [11.4] ビデオキャプションモデルはフレームを視覚トークンに変換し、大きな言語モデル(LLM)で記述を生成する。
すべてのフレームの符号化は違法に高価であるため、一様サンプリングがデフォルトの選択であるが、不均一なイベント分布を無視しながら時間的カバレッジを均等に強制する。
これは学習可能なフレームセレクタ(LFS)を動機付け、時間的に多様なイベント関連フレームを選択する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:26:48 GMT)
Unified Multimodal and Multilingual Retrieval via Multi-Task Learning with NLU Integration [11.2] 本稿では,画像,長文,短文,インテントに富んだクエリ間の特徴表現を統一するマルチタスク学習フレームワークを提案する。
提案手法は,画像とテキストの検索と共有テキストエンコーダを統合し,意図の理解と検索精度の向上を目的としてNLU機能を拡張した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:07:59 GMT)
HELIOS: Hierarchical Graph Abstraction for Structure-Aware LLM Decompilation [11.1] textscHELIOSは、バイナリの逆コンパイルを構造化推論タスクとして再構成するフレームワークである。
textscHELIOSは、セキュリティ設定のリバースエンジニアリングのための実用的なビルディングブロックである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:37:33 GMT)
FedUMM: A General Framework for Federated Learning with Unified Multimodal Models [11.1] 統一マルチモーダルモデル(UMM)は、単一のアーキテクチャにおけるタスクの生成と理解の両方が可能な強力な基盤モデルとして出現している。
We present FedUMM, a general federated learning framework for UMMs under non-IID multimodal data with low communication cost。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:02:52 GMT)
Designing KRIYA: An AI Companion for Wellbeing Self-Reflection [11.0] KRIYAは、個人の幸福データとの共解釈エンゲージメントをサポートする、AIウェルビーイングコンパニオンである。
仮説データを用いてKRIYAの試作機と相互作用する18人の大学生を対象に半構造化インタビューを行った。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:03:12 GMT)
Q-Probe: Scaling Image Quality Assessment to High Resolution via Context-Aware Agentic Probing [10.8] シンキング・ウィズ・イメージ」パラダイムは、自然界の深みをアーティファクトとして誤解し、刺激的な「クロール・インプリーズ・デグラデーション」バイアスを誘発する。
Q-Probeは,IQAを文脈認識型探索により高分解能に拡張するために設計された,最初のエージェント型IQAフレームワークである。
Q-Probeは、高解像度設定で最先端の性能を実現し、解像度スケールで優れた効率を維持する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:02:32 GMT)
Recommending Best Paper Awards for ML/AI Conferences via the Isotonic Mechanism [10.7] 著者支援機構を導入し,論文賞の選定を容易にする。
本手法では,著者の提出した論文に対する評価をアイソトニック・メカニズムを用いて抽出する。
実用関数が単に非減少かつ加法的である場合でも、真性は成り立つことを証明します。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:30:42 GMT)
Reflexis: Supporting Reflexivity and Rigor in Collaborative Qualitative Analysis through Design for Deliberation [10.7] ReflexisはReflexive Thematic Analysisのコラボレーティブワークスペースである。
反射性は、その場反射プロンプトを統合することで支持する。
また、違いを生産的で位置対応の対話に変換することで、協調的な解釈を足場とする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:24:39 GMT)
Anatomically Guided Latent Diffusion for Brain MRI Progression Modeling [10.6] Anatomically Guided Latent Diffusion Model (AG-LDM)は、解剖学的に一貫した進行を強制するセグメンテーション誘導フレームワークである。
軽量な3D組織セグメンテーションモデル(WarpSeg)は、オートエンコーダの微調整と拡散モデルトレーニングの両方において、明確な解剖学的監督を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:45:36 GMT)
Three-dimensional visualization of X-ray micro-CT with large-scale datasets: Efficiency and accuracy for real-time interaction [10.6] 本稿は、Micro-CTを用いた高精度かつ効率的な3次元可視化の最近の進歩について、ユニークな視点を提供する。
コンピュータ断層撮影の原理と微細構造技術の進歩を比較することにより,CT再構成アルゴリズムの進化を考察する。
高精度、フォトリアリスティック、効率的なボリュームレンダリングのための高度な照明モデルを探究する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:37:38 GMT)
Computational Representations of Character Significance in Novels [10.5] 我々は6成分構造的性格モデルを提案する新しい文学理論を提案する。
このモデルは、ナレーターとキャラクタの区別を考慮し、他のキャラクタによる議論である事前の手法によって無視されるコンポーネントを含む。
そして、これらの表現によって、新しい計算レンズから大規模に文学的な問題にアプローチできることを実証する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:29:41 GMT)
ClaimDB: A Fact Verification Benchmark over Large Structured Data [10.5] ClaimDBは、クレームの証拠が数百万のレコードと複数のテーブルの合成から導かれる最初の事実検証ベンチマークである。
この規模では、証拠を「読む」ことに依存する検証アプローチが崩壊する。
我々は30の最先端のプロプライエタリかつオープンソース(70B以下)のLLMで実験を行い、その精度は83%を超え、半分以上は55%以下であることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:19:47 GMT)
PROGRESSLM: Towards Progress Reasoning in Vision-Language Models [10.5] タスクの進捗を見積もるには、静的な視覚的内容を認識するのではなく、長い水平運動を推理する必要がある。
本稿では,視覚言語モデルにおける進捗推論を体系的に評価するベンチマークであるProgress-Benchを紹介する。
さらに、トレーニングフリープロンプトとトレーニングベースアプローチの両方を通じて、人間にインスパイアされた2段階進行推論パラダイムについて検討する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:56:59 GMT)
Fine-Grained Traceability for Transparent ML Pipelines [10.2] FG-Tracは、機械学習パイプライン全体にわたって詳細なサンプルレベルのトレーサビリティを確立する、モデルに依存しないフレームワークである。
これは、前処理とトレーニングにわたるサンプルライフサイクルイベントをキャプチャし、検証するための明示的なメカニズムを定義する。
トレーニングチェックポイントに明示的に基づいたコントリビューションスコアを計算し、これらのトレースを暗黙の暗号コミットに固定する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:21:30 GMT)
Statistical Reinforcement Learning in the Real World: A Survey of Challenges and Future Directions [10.1] 強化学習(RL)は現実世界の意思決定において顕著な成功を収めた。
これらの進歩にもかかわらず、RL研究と多くの実践的な環境での展開の間には大きなギャップが残っている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:58:49 GMT)
Diffusion Epistemic Uncertainty with Asymmetric Learning for Diffusion-Generated Image Detection [10.1] 生成した画像を検出するための非対称学習(DEUA)を用いた拡散認識不確実性(Diffusion Epistemic Uncertainty)を提案する。
ラプラス近似を用いて拡散疫学不確実性(DEU)推定を導入し,拡散生成試料の多様体へのデータの近接性を評価する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:57:15 GMT)
Reflecting in the Reflection: Integrating a Socratic Questioning Framework into Automated AI-Based Question Generation [10.1] 本稿では,大規模言語モデル(LLM)を用いたリフレクション質問の自動生成のためのリフレクション・イン・リフレクション・フレームワークを提案する。
本稿では,教師と教師の2つの役割特化エージェントをコーディネートし,ソクラテス的多ターン対話を行い,一つの質問を反復的に洗練する手法を提案する。
我々の2エージェントプロトコルは、ワンショットベースラインよりもはるかに関連性があり、より深く、より総合的に判断される質問を生成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:23:11 GMT)
Emergent, not Immanent: A Baradian Reading of Explainable AI [10.0] 我々は、人間、文脈、解釈装置とのAIモデルの位置的絡み合いから解釈が現れることを論じる。
本稿では,創発的解釈を支援するXAIインタフェースの設計指針を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:32:40 GMT)
DuFal: Dual-Frequency-Aware Learning for High-Fidelity Extremely Sparse-view CBCT Reconstruction [9.9] Sparse-view Cone-Beam Computed Tomography reconstruction from limited X-ray projections is challenge problem in medical imaging。
本稿では、デュアルパスアーキテクチャによる周波数領域と空間領域の処理を統合する新しいフレームワークであるDuFalを提案する。
LUNA16とTothFairyデータセットの実験結果は、DuFalが高周波解剖学的特徴の保存において既存の最先端手法を著しく上回っていることを示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:27:47 GMT)
Large Language Models: A Mathematical Formulation [9.8] 大規模言語モデル(LLM)は、質問に答えるテキストを含むシーケンスを処理し、予測する。
トークン列へのテキストシーケンスの符号化を記述することで,LLMの数学的枠組みを提供する。
これらのモデルがデータからどのように学習されるかを説明し、さまざまなタスクにどのようにデプロイされるかを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:22:49 GMT)
Many Experiments, Few Repetitions, Unpaired Data, and Sparse Effects: Is Causal Inference Possible? [9.8] 本研究では,隠れたコンバウンディングの下での因果関係を推定する問題について検討する。
適切な正則性条件の下では、問題はインストゥルメンタル変数(IV)回帰としてキャストすることができる。
クロスフォールドサンプル分割に基づくGMM型推定器を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:36:34 GMT)
AlertGuardian: Intelligent Alert Life-Cycle Management for Large-scale Cloud Systems [9.6] AlertGuardianは、大きな言語モデル(LLM)と軽量グラフモデルを協調して、3つのフェーズを通じて警告ライフサイクルを最適化するフレームワークである。
警報疲労(94.8%の警報低下率)を著しく軽減し、故障診断(90.5%の診断精度)を加速する。
さらに,1,174の警告ルールも改善され,SREが375を受理(32%)する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:51:59 GMT)
PREFAB: PREFerence-based Affective Modeling for Low-Budget Self-Annotation [9.6] 低予算の自己アノテーションであるPreFABは、完全なアノテーションではなく、感情的な反射領域をターゲットにしている。
PreFABは、相対的な感情変化を検出するために嗜好学習モデルを採用し、アノテータは刺激の残りの部分を補間しながら、選択したセグメントのみをラベル付けするように指示する。
その結果、PreFABは、作業負荷を軽減しつつ、感情的インフレクションをモデル化する上で、ベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:19:42 GMT)
Scaling Enhancement in Distributed Quantum Sensing via Causal Order Switching [9.4] 因果次数スイッチを循環ネットワークに組み込んだプロトコルを提案し、単一のプローブでN個の独立センサをシーケンシャルに問い合わせることを可能にする。
我々は、最大9個のセンサからなる自由空間量子光学ネットワークにおいて、分散ビーム傾き検出のためのこの方式を実験的に実装した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:54:08 GMT)
Measuring and Aligning Abstraction in Vision-Language Models with Medical Taxonomies [9.4] Vision-Language Modelsは胸部X線分類において強いゼロショット性能を示すが、標準的なフラットメトリクスは臨床的にマイナーなエラーと重度のエラーを区別することができない。
階層的メトリクスを用いていくつかの最先端のVLMをベンチマークし、クロスブランチミスを捉えるために破滅的抽象化エラーを導入します。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:58:50 GMT)
Online Linear Programming with Replenishment [9.2] オンライン線形プログラミング(OLP)モデルについて検討し、在庫を事前に提供せず、補充プロセスを通じて徐々に到着する。
分散された不確実な補充の導入は、古典的なALPの構造を根本的に変える。
我々は,ALP文献で研究されている3つの主要な分布系について,新しいアルゴリズムと後悔の分析法を開発した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:09:29 GMT)
A Checklist for Trustworthy, Safe, and User-Friendly Mental Health Chatbots [8.8] 我々は、メンタルヘルスチャットボットの設計と実装における重要なギャップを特定するために、文献を掘り下げる。
私たちは、より信頼性が高く、安全で、ユーザフレンドリーなチャットボットの開発と設計を支援するために、オペレーショナルチェックリストにコントリビュートしています。
我々は、このチェックリストが、より責任あるデザインプラクティスをサポートするためのステップであり、デジタルメンタルヘルスツールを社会技術的に健全にするための新しい標準をサポートする方法について論じる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:24:27 GMT)
FastFI: Enhancing API Call-Site Robustness in Microservice-Based Systems with Fault Injection [8.8] フォールトインジェクションはソフトウェアの信頼性を評価するための重要なテクニックであり、システムの欠陥を積極的に検出することを可能にする。
FastFIは、マイクロサービスベースのシステムにおけるAPIコールサイトの堅牢性を高めるための、フォールトインジェクション誘導フレームワークである。
FastFIは、最先端のベースラインと比較して、エンドツーエンドのフォールトインジェクション時間を平均76.12%削減する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:24:54 GMT)
QMC: Efficient SLM Edge Inference via Outlier-Aware Quantization and Emergent Memories Co-Design [8.8] Outlier-aware Quantization Memory Co-Design (QMC) は、新しいヘテロジニアスメモリアーキテクチャを持つリトレーニングフリーな量子化である。
QMCはメモリ使用量を6.3x-7.3x、外部データ転送を7.6倍、エネルギーを11.7倍、レイテンシを12.5倍削減する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:11:34 GMT)
Learning a Unified Latent Space for Cross-Embodiment Robot Control [8.8] 本稿では,人体横断型ロボット制御のためのスケーラブルなフレームワークを提案する。
我々は、人間と多様なヒューマノイドプラットフォームをまたいだ動きを統一する、共通の潜在表現を学ぶ。
本手法は,ロボットの潜伏空間への効率的な付加を支援する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:31:17 GMT)
Test-Time Adaptation for Speech Emotion Recognition [8.7] テスト時間適応(TTA)は、未ラベルのターゲットデータのみを使用して推論時にモデルを適用することでギャップを埋める。
本稿では,3つのSERタスクにまたがる11のTTA手法について,最初の体系的評価と比較を行った。
その結果,バックプロパゲーションフリーなTTA法が最も有望であることが示唆された。
一つの方法が普遍的に排他的であり、その効果は分布シフトやタスクに大きく依存する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:45:17 GMT)
MolecularIQ: Characterizing Chemical Reasoning Capabilities Through Symbolic Verification on Molecular Graphs [8.5] 分子の性質の推論には 分子グラフを解析し 理解する能力が必要です
大規模言語モデル(LLM)は、化学、分子名変換、キャプション、テキスト誘導生成、特性や反応予測といったタスクにますます応用されている。
我々は,分子構造推論ベンチマークである分子IQを紹介した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:58:01 GMT)
Beyond Prompting: Efficient and Robust Contextual Biasing for Speech LLMs via Logit-Space Integration (LOGIC) [8.5] 我々は、デコード層で直接動作する効率的で堅牢なフレームワークであるLOGICを紹介する。
LogICは、入力処理からコンテキストインジェクションを分離し、一定時間の複雑さを保証する。
Phi-4-MMモデルを11個の多言語局所で実験したところ、LOGICはEntity WERの平均9%の相対的な減少を達成することが示された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:08:45 GMT)
Forest-Chat: Adapting Vision-Language Agents for Interactive Forest Change Analysis [8.4] 大規模言語モデル(LLM)は、データ探索にますます採用されている。
リモートセンシング画像変化解釈(RSICI)のための視覚言語モデル(VLM)との統合はいまだ検討されていない。
森林変動解析のためのLLM駆動型エージェントであるフォレスト-Chatについて紹介する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:23:33 GMT)
CoScale-RL: Efficient Post-Training by Co-Scaling Data and Computation [8.3] 訓練大型推論モデル(LRM)は通常不安定で予測不可能である。
より優れたデータと計算効率を持つ新しいスケーリング戦略であるCoScale-RLを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:17:52 GMT)
Deaf and Hard of Hearing Access to Intelligent Personal Assistants: Comparison of Voice-Based Options with an LLM-Powered Touch Interface [8.3] 難聴者および難聴者に対する知的パーソナルアシスタント(IPA)のアクセシビリティについて検討した。
難聴音声を含む多様なアクセントを理解できないため、非署名や話し言葉のDHH個人にはほとんどアクセスできない。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:33:00 GMT)
Training-Free and Interpretable Hateful Video Detection via Multi-stage Adversarial Reasoning [8.3] ヘイトフルビデオは、差別を増幅し、暴力を誘発し、オンラインの安全を損なうことによって深刻なリスクを引き起こす。
トレーニング不要なマルチステージ適応型リアソニングフレームワークであるMARSを導入し、ヘイトフルコンテンツ検出の信頼性と解釈を可能にする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:52:26 GMT)
Training-Efficient Text-to-Music Generation with State-Space Modeling [8.1] 我々は、より訓練的でデータ効率のよいオープンソースの生成モデルバックボーンを提案する。
我々はTransformerのバックボーンを新しいステートスペースモデル(SSM)に置き換える。
提案したすべてのモデルは、CCライセンス音楽の457時間からなる純粋にパブリックなデータセット上で、ゼロからトレーニングされる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:06:55 GMT)
ViT Registers and Fractal ViT [8.0] 我々は、フラクタル ViT と呼ばれる大型ビジョントランス (ViT) の変種を発明し、試験する。
これらのモデルはレジスタ付きViTでは改善されず、これらの発見がスケール、ドメイン、アプリケーション固有のものであることを強調している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:24:53 GMT)
Dynamic Management of a Deep Learning-Based Anomaly Detection System for 5G Networks [8.0] Fogとモバイルエッジコンピューティング(MEC)は、今後の第5世代(5G)モバイルネットワークにおいて重要な役割を果たす。
本稿では,5G モバイルネットワークにおける MEC 指向のソリューションを提案し,リアルタイムかつ自律的にネットワーク異常を検出する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:54:19 GMT)
MARS: Unleashing the Power of Speculative Decoding via Margin-Aware Verification [7.9] Speculative Decoding (SD)は、自動回帰型大言語モデル(LLM)推論をデカップリングして高速化する。
対象モデルの局所的決定性に適応する訓練不要でドメインに依存しない検証戦略であるMargin-Aware Speculative Verificationを提案する。
本手法は,目標ロジットから直接測定した決定安定性の検証を行い,厳密な検証が最小限の利益をもたらす場合にのみ拒否を緩和する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:03:06 GMT)
How Reliable are Confidence Estimators for Large Reasoning Models? A Systematic Benchmark on High-Stakes Domains [7.8] 大規模推論モデルの誤校正は、高い領域における信頼性を損なう。
本稿では,6つの LRM から得られた347,496 個の推論トレースの公開リソースである Reasoning Model Confidence Estimation Benchmark (RMCB) を紹介する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:03:19 GMT)
Unified Multi-Dataset Training for TBPS [7.7] 既存のTBPS手法は、分散シフトを処理するためにデータセット中心の微調整に依存している。
複数のデータセットにまたがって単一の統合TBPSモデルをトレーニングできますか?
現在のトレーニングパラダイムは、多数のユニークな個人IDにスケールしないため、すべてのデータセットに対するナイーブな共同トレーニングは、依然として準最適であることを示す。
i)様々なTBPSデータセットを結合的にマージするノイズ対応統合データセットキュレーション戦略,(ii)スケーラブルな識別識別学習フレームワークである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:26:28 GMT)
CAG-Avatar: Cross-Attention Guided Gaussian Avatars for High-Fidelity Head Reconstruction [7.7] アニメーション技術は、しばしば"ワンサイズフィット"なグローバルチューニングアプローチに依存している。
クロスアテンション上に構築された条件適応型核融合モジュールについて紹介する。
実験では、特に歯などの挑戦的な領域において、再建の忠実度が著しく向上していることが確認されている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:22:53 GMT)
FeedbackSTS-Det: Sparse Frames-Based Spatio-Temporal Semantic Feedback Network for Infrared Small Target Detection [7.6] 複雑な背景下での赤外線小検出目標(ISTD)は依然として困難な課題である。
既存の手法はまだ非効率な長距離依存性モデリングに苦慮している。
本稿では,スパースなセマンティック・テンポラル・フィードバック・ネットワークによるISTD検出手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:06:36 GMT)
Lost Before Translation: Social Information Transmission and Survival in AI-AI Communication [7.6] AIがAIと対話する際に何が起こるかを研究する。
AI送信チェーンを通じてコンテンツを追跡する5つの研究で、3つの一貫したパターンが見つかった。
我々は、AIによるコンテンツを権威的に見せる特性は、情報的判断が依存する認知的・感情的な多様性を体系的に損なう可能性があることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:18:46 GMT)
Scribble-Supervised Medical Image Segmentation with Dynamic Teacher Switching and Hierarchical Consistency [7.5] 本稿では,弱信号の監督品質を最大化するために,SDT-Netを提案する。
本手法は,最も信頼性の高い教師を適応的に選択する動的教師スイッチング (DTS) モジュールを備える。
この選択された教師は、高信頼の擬似ラベル、Pick Reliable Pixels(PRP)メカニズムによる洗練、マルチレベルの特徴アライメントという2つの相乗的メカニズムを通じて生徒を指導する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:01:01 GMT)
NWQWorkflow: The Northwest Quantum Workflow [7.3] NWQWorkflowは量子アプリケーション開発のためのエンドツーエンドワークフローである。
これには、エラー修正、ベンチマーク、数値シミュレーション、制御、およびプロトタイプの超伝導テストベッドでの実行が含まれる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:15:27 GMT)
MEDFORD in a Box: Improvements and Future Directions for a Metadata Description Language [7.2] MEDFORD-in-a-Box (MIAB) は研究者の採用とメタデータの取得を容易にするドキュメントエコシステムである。
MIABには、拡張されたバリデーションルーチンとBagItエクスポート機能を備えたMEDFORDのアップデートなど、多くの改善が含まれている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:56:57 GMT)
FlowSSC: Universal Generative Monocular Semantic Scene Completion via One-Step Latent Diffusion [7.2] FlowSSCは、セマンティックシーン補完に直接適用される最初の生成フレームワークである。
品質を損なうことなくリアルタイムな推論を実現するために,ショートカットフローマッチングを導入する。
提案手法は,1ステップで高忠実度生成を実現するためのショートカット機構を利用して,自律システムへの実用的な展開を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:32:27 GMT)
CI4A: Semantic Component Interfaces for Agents Empowering Web Automation [7.2] 本稿では、UIコンポーネントの複雑なインタラクションロジックを、エージェントがアクセス可能な統一ツールプリミティブのセットに抽象化するセマンティックカプセル化機構であるComponent Interface for Agent(CI4A)を紹介する。
私たちは産業レベルのフロントエンドフレームワークであるAnt DesignにCI4Aを実装しました。
我々は、ページの状態に応じて動的に更新されるアクション空間を特徴とするハイブリッドエージェントを開発し、利用可能なCI4Aツールの柔軟な実行を可能にした。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:14:04 GMT)
Adoption and Use of LLMs at an Academic Medical Center [7.1] ChatEHRは、大規模言語モデル(LLM)の使用を可能にするシステムである。
私たちは7つの自動化を開発し、1075人のユーザがUIの定期的なユーザになるように訓練し、ローンチの最初の3ヶ月で23,000のセッションに従事しました。
当初の推計では、最初の1年間に600万ドルを節約し、提供されたより良いケアのメリットを定量化していない。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:43:57 GMT)
Robust Fake News Detection using Large Language Models under Adversarial Sentiment Attacks [7.1] AdSentは、原文記事と感傷記事の両方で一貫した予測を保証するために設計された感情汚染検出フレームワークである。
感情の変化が偽ニュース検出モデルの性能に大きく影響を与えることを示す。
我々は,このような摂動に対する堅牢性を高める,感情非依存の新たなトレーニング戦略を導入する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:56:49 GMT)
Communication-Efficient Federated Risk Difference Estimation for Time-to-Event Clinical Outcomes [6.9] FedRDは、分散サバイバルデータにおけるフェデレーションリスク差推定のための通信効率のよいフレームワークである。
FedAvgベースのフレームワークにはない信頼区間と仮説テストを提供する。
FedRDは、推定と予測の両方のパフォーマンスにおいて、ローカルベースラインとフェデレーションベースラインを上回っます。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:59:30 GMT)
V-CAGE: Context-Aware Generation and Verification for Scalable Long-Horizon Embodied Tasks [6.8] V-CAGEは、大規模なセマンティックアライメントデータセットを生成するクローズドループフレームワークである。
本研究では,シーン合成における幾何学的整合性を実現する文脈認識型インスタンス化機構を提案する。
また、階層的な命令分解モジュールを用いて、抽象意図と低レベル制御のギャップを埋める。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:41:51 GMT)
Re-understanding Graph Unlearning through Memorization [6.8] グラフアンラーニングは、グラフデータが機密性、ラベルのずれ、悪意のある情報を含む可能性のあるWebアプリケーションにおいて不可欠である。
既存のグラフアンラーニング手法では、未学習の有効性を決定する重要な要素が明確に理解されていない。
これらの問題に対処するために,覚書誘導グラフアンラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:14:23 GMT)
Low-frequency fiber-optic vibration sensing with a Floquet-engineered optical lattice clock [6.7] 創傷光振動センサの低周波特性を向上させるために,フロッケ式光学格子時計を用いた復調方式を提案する。
ファイバ長の格子深さと、200Hzから0.5Hzまでの振動下でのフロケ発振ラビスペクトルをシミュレートする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:53:10 GMT)
Comparative Study of Large Language Models on Chinese Film Script Continuation: An Empirical Analysis Based on GPT-5.2 and Qwen-Max [6.3] 本研究は,53本の古典映画からなる中国初の映画脚本継続ベンチマークを構築した。
評価にはROUGE-L, 構造類似性, LLM-as-Judgeスコアが組み込まれている。
GPT-5.2は文字の一貫性、トーンスタイルのマッチング、フォーマットの保存に優れており、Qwen-Maxは生成安定性の欠如を示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:55:26 GMT)
Finite-Sample Inference for Sparsely Permuted Linear Regression [6.2] 変分/シャッフル線形回帰(permuted/shuffled linear regression)と呼ばれる未知の変分を持つ雑音のある線形観測モデルについて検討する。
この未知の置換は、データ生成プロセスの重要なコンポーネントである。
我々は、置換係数と回帰係数に関する一般的な統計的推論フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:00:47 GMT)
Rewarding How Models Think Pedagogically: Integrating Pedagogical Reasoning and Thinking Rewards for LLMs in Education [6.2] 大規模言語モデル(LLM)は、インテリジェントなチューリングシステムとしてますます多くデプロイされている。
近年,LLM教育者を対象とした強化学習手法が提案されているが,これらの手法は可視応答の最適化にのみ焦点をあてている。
PedagogicalRL-Thinkingは、教育におけるLLMの推論に教育的アライメントを拡張するフレームワークである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:58:49 GMT)
Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification [6.1] 本研究は,3次元CTボリュームにおける椎体レベル骨折検出のための2次元投射型椎体分割法の有効性について検討した。
全視野からYOLOv8モデルを用いて関心領域を同定し, 3次元頚椎領域を近似した。
DenseNet121-Unetベースのマルチラベルセグメンテーションは、分散およびエネルギーベースのプロジェクションを利用して、Diceスコア87.86パーセントを達成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:15:47 GMT)
Enhancing Text-to-Image Generation via End-Edge Collaborative Hybrid Super-Resolution [6.0] エンドツーエンドの協調型世代拡大フレームワークを提案する。
実験の結果,本システムはベースラインに比べてサービス遅延を33%削減できることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:55:37 GMT)
ARISE - Adaptive Refinement and Iterative Scenario Engineering [6.0] ARISE - Adaptive Refinement and Iterative Scenario Engineeringを紹介する。
自然言語のプロンプトをScenicスクリプトに変換する。
ARISEはセマンティックに正確で実行可能なトラフィックシナリオを生成する上で、ベースラインよりも優れています。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:57:24 GMT)
Preparation and Motion Study of Magnetically Driven Micro Soft Robot Mimicking the Cownose Ray [6.0] 本研究は, 磁気応答型カウノーズ線誘発マイクロソフトロボットをカウノース線の水泳原理に基づいて設計し, 製作する。
実験の結果、水泳速度はB = 5 mT で、f = 11 Hz で5.25 mm/s に達する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:45:40 GMT)
SAGA: Detecting Security Vulnerabilities Using Static Aspect Analysis [6.0] SAGAは、Pythonソースコードの脆弱性を多目的に検出し、発見するアプローチである。
私たちは、SAGAを108の脆弱性のデータセットで評価し、100%の感度と99.15%の特異性を得ました。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:26:26 GMT)
Semantic-Guided Unsupervised Video Summarization [5.9] 本稿では,セマンティックガイドによる教師なしビデオ要約手法を提案する。
具体的には,新しいフレームレベルのセマンティックアライメント・アテンション・アテンション・セレクタを設計する。
さらに、段階的なトレーニング戦略を採用して、モデルコンポーネントを段階的に更新し、GANトレーニングの不安定性を効果的に軽減する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:53:29 GMT)
Context Patch Fusion With Class Token Enhancement for Weakly Supervised Semantic Segmentation [5.9] 本稿では,CPF-CTE(Context Patch Fusion with Class Token Enhancement)フレームワークを提案する。
CPF-CTEは、パッチ間のコンテキスト関係を利用して特徴表現を強化し、セグメンテーションを改善する。
CPF-CTEは従来のWSSS手法を一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:12:23 GMT)
Where Do AI Coding Agents Fail? An Empirical Study of Failed Agentic Pull Requests in GitHub [5.8] われわれはGitHub全体で5人のコーディングエージェントが作成した33kエージェントのPRを大規模に調査している。
まず,4次元のPRを定量的に特徴付ける。
マージされていないPRは、より大きなコード変更を伴い、より多くのファイルに触れる傾向があり、プロジェクトのCI/CDパイプライン検証に合格しないことが多い。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:12:46 GMT)
Supporting Humans in Evaluating AI Summaries of Legal Depositions [5.8] ナゲットに基づく手法は、要約手法の自動化評価に極めて有用であることが示されている。
本稿では,2つの具体的なシナリオで法的専門家を支援するために,現実的なナゲットに基づくアプローチを利用するプロトタイプを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:00:40 GMT)
SmartOracle - An Agentic Approach to Mitigate Noise in Differential Oracles [5.7] 差分ファジィは同一仕様の異なる実装間で同一の入力を実行することでバグを検出する。
SmartOracleは手動のトリアージワークフローを、専門のLarge Language Modelサブエージェントに分解する。
活発なファジィキャンペーンにおいて、SmartOracleは以前未知の仕様レベルの問題を特定し、報告した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:20:53 GMT)
SUG-Occ: An Explicit Semantics and Uncertainty Guided Sparse Learning Framework for Real-Time 3D Occupancy Prediction [5.7] SuG-Occは明示的なセマンティックスと不確実性ガイドによるスパース学習を可能とした3D職業予測フレームワークである。
まず、ビュー変換時の自由空間からの射影を抑えるために、意味的および不確実性事前を利用する。
次に、幾何整合性を高めるために明示的な符号なし距離符号化を用い、構造的に一貫したスパース3D表現を生成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:26:25 GMT)
Efficient and Minimax-optimal In-context Nonparametric Regression with Transformers [5.7] 我々は、$(log n)パラメータと$bigl(n2/(2+d)log3 nbigr)$事前学習列を持つ事前学習変換器が、最小収束率を達成できることを証明する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:13:38 GMT)
Securing LLM-as-a-Service for Small Businesses: An Industry Case Study of a Distributed Chatbot Deployment Platform [5.6] LLM(Large Language Model)ベースの質問応答システムは、中小企業におけるカスタマーサポートと内部知識アクセスを自動化する大きな可能性を秘めている。
本稿では,中小企業がノココードワークフローを通じて,LLMベースのサポートチャットボットをカスタマイズ可能な,オープンソースのマルチテナントプラットフォームを提案する。
このプラットフォームは、異種で低コストなマシンにまたがる分散軽量のk3sクラスタ上に構築され、暗号化されたオーバーレイネットワークを介して相互接続される。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:29:32 GMT)
From Biased Chatbots to Biased Agents: Examining Role Assignment Effects on LLM Agent Robustness [5.6] 大規模言語モデル(LLM)は、テキスト生成を超えた現実的な影響で行動可能な自律エージェントとして、ますます多くデプロイされている。
テキスト生成におけるペルソナによるバイアスは十分に文書化されているが、エージェントタスクのパフォーマンスへの影響は未解明のままである。
人口動態に基づくペルソナ割り当ては, LLMエージェントの行動を変化させ, 様々な領域で性能を低下させることができることを示す最初のシステマティックケーススタディを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:43:07 GMT)
M2I2HA: A Multi-modal Object Detection Method Based on Intra- and Inter-Modal Hypergraph Attention [5.5] 本稿では,M2I2HAと呼ばれるハイパーグラフ理論に基づくマルチモーダル知覚ネットワークを提案する。
我々のアーキテクチャにはハイパーグラフ内拡張モジュールが含まれており、各モダリティ内の大域的な多対多の高次関係をキャプチャする。
Inter-Hypergraph Fusionモジュールは、データソース間のコンフィグレーションと空間ギャップをブリッジすることで、クロスモーダル機能を調整、拡張、フューズする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:55:07 GMT)
Explainable OOHRI: Communicating Robot Capabilities and Limitations as Augmented Reality Affordances [5.4] 本稿では,ロボットの動作可能性と制約を伝達する拡張現実(AR)インターフェースであるX-OOHRIを提案する。
本システムは,視覚言語モデルを用いてオブジェクト特性とロボットの限界をオブジェクト指向構造にエンコードする。
エンド・ツー・エンドのパイプラインを物理ロボットと統合し、低レベルのピック・アンド・プレイスから高レベルの命令まで多様なユースケースを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:53:47 GMT)
Performance and Complexity Trade-off Optimization of Speech Models During Training [5.3] 音声機械学習では、ニューラルネットワークモデルは通常、固定された層の大きさと構造を持つアーキテクチャを選択することで設計される。
全体的なアーキテクチャは通常、タスクの事前の知識によってガイドされるが、個々のレイヤのサイズは、しばしば選択される。
プルーニング法とは異なり,本手法では,対象の性能・複雑さのトレードオフに対して,モデルサイズを動的に最適化する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:23:00 GMT)
On the Effectiveness of Mempool-based Transaction Auditing [5.2] 我々は,メムプール監査と検閲や取引の移動攻撃を検知する能力の相互作用について検討した。
分析の結果,メムプール監査は,一部の環境では25%以上の確率で鉱夫に対する誤認をもたらす可能性が示唆された。
バッチ順序のフェアオーダリングスキームは、現実のデプロイメントにおいて、トランザクションの限られたサブセットに対して、強いフェアネス保証のみを提供することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:54:04 GMT)
Differential Privacy Image Generation with Reconstruction Loss and Noise Injection Using an Error Feedback SGD [4.9] 匿名化などの従来のデータマスキング技術は、プライバシ保護のためのデータユーティリティを確保しながら、期待されるプライバシ保護を達成することはできない。
本稿では,EFSGD(Error Feedback Gradient Descent)法を用いた差分プライバシ生成のための新しいフレームワークを提案する。
MNIST、Fashion-MNIST、CelebAの3つのベンチマークで、ほぼすべてのメトリクスに対して最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:07:33 GMT)
Implementing Knowledge Representation and Reasoning with Object Oriented Design [4.8] 本稿では,ソフトウェアと知識表現・推論システムの統合ギャップを埋めるフレームワークであるKRROODを紹介する。
OWL2Benchベンチマークとヒューマンロボットタスク学習シナリオを用いて,本システムの評価を行った。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:14:29 GMT)
Data-driven Lake Water Quality Forecasting for Time Series with Missing Data using Machine Learning [4.7] ボランティア主導の湖のモニタリングは、氷の覆い、天候に関連したアクセス制限、時には人為的誤りから生じる多くのギャップを持つ、不規則で季節的な時系列をもたらす。
本研究は,メイン湖全域で収集された30年間のin situ記録から得られた30Lake, data-rich サブセット上でのSecchi Disk Depth (SDD) の予測について検討した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:20:26 GMT)
Martingale Foresight Sampling: A Principled Approach to Inference-Time LLM Decoding [4.7] 本稿では,大規模言語モデルの復号化を行う原則的フレームワークであるMartingale Foresight Theory(MFS)を紹介する。
MFSは、理論的な基底アルゴリズムを設計するために、確率論の原理でメカニズムを置き換える。
6つの推論ベンチマークの実験により、MSFは最先端の手法を精度で超越し、計算効率は大幅に向上した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:34:29 GMT)
Typhoon OCR: Open Vision-Language Model For Thai Document Extraction [4.7] 本稿ではタイ語と英語に適した文書抽出用オープンVLMであるTyphoon OCRについて述べる。
このモデルは、タイ語に焦点を当てたトレーニングデータセットを使用して、視覚言語バックボーンから微調整される。
最新のモデルであるTyphoon OCR V1.5は、メタデータへの依存を減らし、デプロイを単純化するために設計された、コンパクトで推論効率の良いモデルです。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:24:32 GMT)
BREPS: Bounding-Box Robustness Evaluation of Promptable Segmentation [4.6] 本研究では,有界箱プロンプトの自然変動に対するプロンプト可能なセグメンテーションモデルのロバスト性について検討する。
分析の結果、同じモデルとインスタンスに対して、ユーザ間でセグメンテーション品質がかなり変動していることが判明した。
BREPSは,セグメント化誤差を最小化あるいは最大化する逆境界ボックスを生成する手法である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:02:21 GMT)
From Generative Engines to Actionable Simulators: The Imperative of Physical Grounding in World Models [4.5] 世界モデルは、アクションの下で環境がどのように進化するかをシミュレートするAIシステムである。
現在の世界モデルは、高忠実度ビデオ生成が物理的および因果的ダイナミクスの理解を意味するという誤った仮定である。
現代のモデルはピクセルの予測に優れていますが、しばしば不変の制約に違反し、介入の下で失敗し、安全クリティカルな意思決定を断ち切ることを示しています。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:35:33 GMT)
Repair Brain Damage: Real-Numbered Error Correction Code for Neural Network [4.5] 記憶障害や計算ミスを経験するニューラルネットワーク(NN)を考える。
本稿では,メモリエラーと計算エラーの両方を検出・修正できる,新しい実数ベースの誤り訂正符号(ECC)を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:22:12 GMT)
GEGO: A Hybrid Golden Eagle and Genetic Optimization Algorithm for Efficient Hyperparameter Tuning in Resource-Constrained Environments [4.4] HyperEGOチューニングは、ハイパーサーチネットワークにおいて、重要ではあるが計算コストのかかるステップである。
ゴールデンイーグル最適化(GEGO)は、ゴールデンイーグル演算子の選択と突然変異のハイブリッド移動戦略を統合する。
GEGOは標準の単調、マルチモーダル、複合ベンチマーク関数で評価される。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:35:38 GMT)
Parameter-Efficient Multi-Task Fine-Tuning in Code-Related Tasks [4.3] 本稿では,コード生成,翻訳,要約という3つのタスクにまたがるマルチタスクQLoRAの微調整について検討する。
その結果,マルチタスクQLoRAは伝達学習を効果的に活用し,競争力や優れた性能を実現していることがわかった。
より大きなモデルは正しさと品質のバランスを保ち、より小さなモデルは機能を維持するが、品質に関する問題の発生頻度が高い。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:33:16 GMT)
Outcome-Based RL Provably Leads Transformers to Reason, but Only With the Right Data [4.3] 本研究では,スパース報酬が勾配降下を誘導し,系統的推論を発見するメカニズムについて検討する。
最終回答の正確性のみを訓練しているにもかかわらず、勾配流はモデルを構造的、解釈可能なアルゴリズムに収束させる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:36:19 GMT)
OmniSpectra: A Unified Foundation Model for Native Resolution Astronomical Spectra [4.3] オムニスペクトル(OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra。
固定長の入力サイズや構成に制限のある従来のモデルとは異なり、OmniSpectraは元のサイズで任意の長さのスペクトルを処理する。
この伝達学習能力により、このモデルは、星や銀河の性質予測や、源の分類、赤方偏移の推定など、様々な天文学的タスクにおける最先端のモデルとなっている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:39:32 GMT)
LLM-based Multimodal Feedback Produces Equivalent Learning and Better Student Perceptions than Educator Feedback [4.2] 本研究では,構造化テキスト記述を動的マルチメディアリソースと統合したリアルタイムAIファシリケート型マルチモーダルフィードバックシステムを提案する。
オンラインクラウドソーシング実験では,3次元の教育者による固定されたビジネス・アズ・ユースフィードバックと比較した。
その結果、AIマルチモーダルフィードバックは、元の教育者フィードバックに匹敵する学習の獲得を達成し、認知負荷の明確さ、特異性、簡潔性、モチベーション、満足度、および認知負荷の低減を著しく上回った。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:58:08 GMT)
Tailoring Adverse Event Prediction in Type 1 Diabetes with Patient-Specific Deep Learning Models [4.2] 本稿では,深層学習に基づく血糖予測手法を提案する。
従来の一般化モデルとは異なり、本手法は個々の変数を考慮し、より効果的な主観的予測を可能にする。
その結果、パーソナライズされたモデルでは、有害事象の予測が大幅に改善された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:57:51 GMT)
Automatically Tightening Access Control Policies with Restricter [4.2] 本稿では,アクセスログに関するポリシーのポリシールールを自動的に厳格化するRestricterを提案する。
規制対象システムの機能を犠牲にすることなく、ポリシールールによって許可されるアクセス要求数を削減し、ポリシー強化を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:42:05 GMT)
Knowledge Restoration-driven Prompt Optimization: Unlocking LLM Potential for Open-Domain Relational Triplet Extraction [4.0] 三重項のオープンマイニングは、事前に定義されたスキーマなしで構造化された知識の基礎となる。
既存の手法では曖昧さの脆弱性が示され、しばしば誤った抽出パターンが永続的である。
本稿では,Large Language Models (LLM) の抽出能力を継続的に改善するための知識再構成駆動型プロンプト最適化(KRPO)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:42:13 GMT)
WavLink: Compact Audio--Text Embeddings with a Global Whisper Token [4.0] We present WavLink, a compact audio-text embeddedding model that a augment Whisper encoder with a learnable global token。
3つのモデルサイズにわたる2段階のトレーニングレシピと、Matryoshkaスタイルの監視を組み合わせることで、スケーラビリティを改善し、パフォーマンスの低下を最小限に抑えた8倍の小さな埋め込みを可能にしました。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:55:58 GMT)
Blended Dynamics and Emergence in Open Quantum Networks [3.9] 拡散結合を伴うオープン量子ネットワークのためのブレンデッドダイナミックスフレームワークを開発した。
我々はまず、この理論が量子ネットワークの還元状態力学に自然に拡張されることを証明した。
次に、量子ラプラシアンおよび誘導グラフを用いて、解析をクビットコヒーレント状態に拡張する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:37:14 GMT)
Abusive music and song transformation using GenAI and LLMs [3.8] 本研究では,ジェネレーティブ・人工知能(GenAI)とLarge Language Models(LLMs)を用いて,ポピュラー音楽における虐待的言葉(音声配信)や歌詞の内容を自動的に変換する方法について検討する。
選択した4つの英曲とその変換された曲の比較分析を行い、音響および感情に基づくレンズによる変化を評価した。
以上の結果から,Gen-AIは高調波と雑音比,ケプストラルピークプロミネンス,シマーの改善を呈し,声の攻撃性を著しく低下させることが明らかとなった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:56:45 GMT)
Optimality of Staircase Mechanisms for Vector Queries under Differential Privacy [3.8] 任意の次元,任意のノルム,任意のノルム単調コスト関数に対して,任意の加法機構の中で最適となる$-DP階段機構が存在することを示す。
この結果は、Geng, Kairouz, Oh, Viswanath の予想を解き、微分プライバシーにおける極端解としての階段機構の出現に関する幾何学的な説明を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:35:33 GMT)
Deterministic and probabilistic neural surrogates of global hybrid-Vlasov simulations [3.8] ハイブリッド・ブラソフシミュレーションは、太陽風と磁気圏の相互作用をモデル化するためのイオン-運動効果を解く。
グラフベース機械学習エミュレータは、電界の進化とイオン速度分布の低次モーメントを学習できることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:43:49 GMT)
AdversaRiskQA: An Adversarial Factuality Benchmark for High-Risk Domains [3.7] 大型言語モデル(LLM)における幻覚は、誤報の拡散と公衆信頼の低下に寄与する。
本稿では,最初の検証済みで信頼性の高いベンチマークであるAdversaRiskQAを紹介する。
我々は,Qwen,GPT-OSS,GPTファミリーの6つのオープンソースLCMを評価し,誤情報検出率を測定した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:47:59 GMT)
Precision limit under weak-coupling with ancillary qubit [3.7] 本稿では,複合モデルを用いた計測に基づく量子メトロジープロトコルを提案する。
スピンアンサンブルは、一般のハイゼンベルク XXZ 相互作用を持つ補助的な2レベル系 (qubit) に結合される。
我々は、量子ビット上の無条件測定がグリーンベルガー・ホーネ・ゼーリンガー状態を置き換えるための効率的な資源になることを示唆する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:01:51 GMT)
Testing Deep Learning Libraries via Neurosymbolic Constraint Learning [3.5] ディープラーニング(DL)ライブラリ(例えばPyTorch)はAI開発で人気がある。
DLライブラリをテストする上で重要な課題は、API仕様の欠如である。
動的に学習された入力制約を用いてDLライブラリAPIをテストする最初のニューロシンボリック手法であるCentaurを開発する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:54:41 GMT)
Anomalous Localization and Mobility Edges in Non-Hermitian Quasicrystals with Disordered Imaginary Gauge Fields [3.4] 空間的に乱れた虚ゲージ場を持つ1次元非エルミート準結晶における異常な局在について検討した。
フラクタル次元はこれらの位相を区別できないが、リャプノフ指数と中心質量変動は鋭い診断を与える。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:14:27 GMT)
Learning and extrapolating scale-invariant processes [3.3] 地震や雪崩のような力の法則の振る舞いを示すプロセスは、どのようにして、どれくらいの程度でスケールフリーなプロセスが適用できるのかという問題に取り組む。
我々は、モデルの外挿能力を必要とするトレーニングセットにおける希少事象など、大きな事象を予測することに興味を持っている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:35:44 GMT)
Robust Verification of Concurrent Stochastic Games [3.3] 我々は *robust CSGs* とそのサブクラス *interval CSGs* (ICSGs) を紹介する。
本稿では、遷移の不確実性に関する最悪の仮定の下で、これらのモデルの *robust* 検証のための新しいフレームワークを提案する。
我々はPRISMgamesモデルチェッカーの実装を構築し、大規模なベンチマークからICSGの堅牢な検証が可能であることを実証する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:31:07 GMT)
Failing on Bias Mitigation: Investigating Why Predictive Models Struggle with Government Data [3.3] AIをサポートする政府サービスにおける偏見と不公平性の可能性は、倫理的および法的懸念を提起する。
ブリストル市議会のデータを用いた犯罪率予測をケーススタディとして、これらの問題がいかに持続するかを検討する。
政府のデータに適用されたバイアス緩和アプローチは必ずしも有効ではない。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:29:43 GMT)
Statistical Learning Theory for Distributional Classification [3.2] 分布入力を用いた教師付き学習では、入力は学習段階ではアクセスできないが、そのサンプルのみに限られる。
この問題は、まず分布やサンプルをヒルベルト空間に埋め込むカーネルベースの学習手法に特に当てはまる。
本稿では,SVMを用いた分布入力を用いた分類に着目し,後者の手法の理論解析に寄与する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:44:24 GMT)
DeepMoLM: Leveraging Visual and Geometric Structural Information for Molecule-Text Modeling [3.2] We propose DeepMoLM: Deep Molecular Language M odeling, a dual-view framework that grounds high- resolution molecular image in geometry invariants。
DeepMoLMは1024$times$1024入力からの高周波証拠を保存し、コンホメータ近傍を離散3次元フィンガープリントとして符号化する。
すべてのプロパティクエリに対して有効な数値出力を生成し、分子量では MAE 13.64 g/mol、複雑度では 37.89 を達成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:41:59 GMT)
When Agents Fail: A Comprehensive Study of Bugs in LLM Agents with Automated Labeling [3.1] LLMエージェントベースのソフトウェアにおいて、バグタイプ、根本原因、および影響に関する最初の包括的研究を行う。
Stack Overflow、GitHub、Hugging Faceフォーラムから1,187のバグ関連の投稿とコードスニペットを収集し、分析しました。
私たちはBugReActというReActエージェントを開発し、データセットのバグを検出し、注釈付けできるかどうかを判断するための適切な外部ツールを備えています。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:13:10 GMT)
Multi-Input Ciphertext Multiplication for Homomorphic Encryption [3.1] ホモモルフィック暗号化(HE)は、暗号化データ上で直接演算を行うことができる。
人気のあるHEスキームでは、暗号文の乗算は2つの入力に対してのみ定義される。
本稿では,3入力暗号文の乗算を改良し,計算の組合せを可能とし,複雑さをさらに軽減する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:13:31 GMT)
How to Build AI Agents by Augmenting LLMs with Codified Human Expert Domain Knowledge? A Software Engineering Framework [3.0] 批判的なドメイン知識は、通常、少数の専門家と共に存在する。
非専門家は効果的な可視化を作成するのに苦労する。
本稿では,AIエージェントシステムに人間のドメイン知識を取り込み,組み込む方法について検討する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:23:22 GMT)
A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits [3.0] 大規模言語モデル(LLM)は、言語理解と生成のために強力で広く使われている。
マルチアーム・バンディット(MAB)アルゴリズムは不確実性の下での適応的意思決定のための原則的枠組みを提供する。
この2つの分野の交点におけるポテンシャルについて調査する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:29:58 GMT)
Case-Guided Sequential Assay Planning in Drug Discovery [2.9] Implicit Bayesian Markov Decision Process (IBMDP) はシミュレータフリー設定用に設計されたモデルベースのRLフレームワークである。
IBMDPは、望ましい結果とリソース効率とのバランスをとる安定したポリシーを生成する。
実世界の中枢神経系(CNS)の薬物発見タスクにおいて、IBMDPは確立されたものと比較して、リソース消費を最大92%削減した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:58:01 GMT)
Landing-Induced Viscoelastic Changes in an Anthropomimetic Foot Joint Structure are Modulated by Foot Structure and Posture [2.8] 人間の足の骨格形状を再現する人為的な足の構造を構築した。
本研究では, 骨格構造と姿勢が粘弾性応答に及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:16:54 GMT)
Anytime Optimal Decision Tree Learning with Continuous Features [2.8] 連続した特徴を持つ最適決定木を学習するためのエレガントな正確なアルゴリズムが提案された。
これは、各分割の左サブツリーを完全に最適化し、対応する右サブツリーを探索するディープファースト検索最適化戦略に依存している。
我々は,木構造全体にわたってより均等に計算作業を分散し,限られた不整合探索を活用する,時空かつ完全なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:40:06 GMT)
Towards Bound Consistency for the No-Overlap Constraint Using MDDs [2.8] オーバラップ制約に対する最初のバウンダリ一貫性アルゴリズムを導出する。
新しいフィルタリングは、非オーバーラップ制約に対する古典的伝搬法を補完しているように見える。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:06:24 GMT)
Exotic collective behaviors of giant quantum emitters in two-dimensional baths [2.7] 現象学的には,2次元および3次元の浴におけるエキゾチック光子放出パターンの出現を観察する。
3次元浴への一般化は、連続的なモードとの結合にもかかわらず、コヒーレントな双極子-双極子相互作用が生き残ることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:52:06 GMT)
On Distributed Quantum Computing with Distributed Fan-Out Operations [2.7] 量子計算の分散バージョンを実装した異なる回路の比較を行った。
我々は,回路深度と(おそらく)絡み合い資源の低減の観点から,分散ファンアウト演算を用いる利点を強調した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:45:56 GMT)
Transfer Learning from One Cancer to Another via Deep Learning Domain Adaptation [2.7] 本研究は, 肺, 結腸, 乳腺, 腎臓腺癌におけるクロスドメイン分類性能を評価する。
単一の腺癌で訓練されたResNet50は、自身のドメインで98%以上の精度を達成するが、他のドメインには最小限の一般化を示す。
対照的に、ResNet50をドメイン逆ニューラルネットワーク(DANN)に変換することで、ラベルなしのターゲットドメインの性能が大幅に向上する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:50:34 GMT)
Logic Programming on Knowledge Graph Networks And its Application in Medical Domain [2.7] 知識グラフへのいくつかの主要な情報処理技術の応用は、まだ遅れていることがわかった。
本稿では,「知識グラフネットワーク」の概念の体系的理論,技法,応用とその医療・医療分野への応用について述べる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:50:47 GMT)
Counterfactual Modeling with Fine-Tuned LLMs for Health Intervention Design and Sensor Data Augmentation [2.7] 対実的説明(CFE)は、機械学習モデルの予測を変更するのに必要な最小限の実行可能な変更を特定することによって、人間中心の解釈可能性を提供する。
大規模言語モデル(LLM)を用いたCF生成の包括的評価を行う。
我々は、介入品質、特徴多様性、強化効果の3次元にわたるCFを評価した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:04:08 GMT)
IntelliSA: An Intelligent Static Analyzer for IaC Security Smell Detection Using Symbolic Rules and Neural Inference [2.7] Infrastructure as Code (IaC)は、大規模クラウドとオンプレミス環境の自動プロビジョニングを可能にする。
IaCスクリプトの単一の設定ミスが広く普及し、システムのダウンタイムとセキュリティリスクが深刻になる。
我々は、IaCセキュリティの臭い検知のためのインテリジェントな静的解析器であるIntelliSAを、シンボリックルールとニューラル推論を統合した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:27:54 GMT)
Place with Intention: An Empirical Attendance Predictive Study of Expo 2025 Osaka, Kansai, Japan [2.5] 本稿では,来訪者の来訪意図のプロキシとして予約動態を利用するTransformerベースのフレームワークを提案する。
入場記録と予約動態を組み合わせたデータセットを構築し,単一チャンネルと2チャンネル設定の両方でモデルを評価する。
その結果,東門と西門を別々にモデル化することで,特に短期・中期の地平線において精度が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:14:30 GMT)
In-Substrate Imaging of Diamond hBN FET Current via Widefield Quantum Diamond Microscopy [2.5] ダイヤモンド表面の水素終端は2次元ホールガス(2DHG)を誘導する
表面下1m$の近傍のNV中心のアンサンブルは、マイクロメートルスケールの空間解像度で電流の流れを非侵襲的に撮像することを可能にする。
磁場マップと再構成された電流密度分布は、ソースドレイン接触で直接電流注入を可視化し、hBNゲートチャネルの下を輸送する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:57:57 GMT)
HumanoidVLM: Vision-Language-Guided Impedance Control for Contact-Rich Humanoid Manipulation [2.5] 本稿では,Unitree G1ヒューマノイドが,エゴセントリックなRGB画像から直接タスク適合インピーダンスパラメータとグリップ構成を選択できるようにする,視覚言語による検索フレームワークであるHumanoidVLMを紹介する。
我々は14の視覚的シナリオでHumanoidVLMを評価し,93%の精度で検索を行った。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:04:19 GMT)
LocBAM: Advancing 3D Patch-Based Image Segmentation by Integrating Location Contex [2.4] 空間情報を明示的に処理する新しいアテンション機構であるLocBAMを提案する。
BTCV、AMOS22、KiTS23の実験では、位置コンテキストを組み込むことでトレーニングが安定し、セグメンテーション性能が向上することを示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:27:59 GMT)
Domain-Specific Knowledge Graphs in RAG-Enhanced Healthcare LLMs [2.4] 大規模言語モデル(LLM)は、流動的な答えを生成するが、信頼できるドメイン固有の推論に苦労する可能性がある。
我々は,3つのPubMedグラフを構築することにより,ドメイン知識グラフ(KG)が医療用検索強化生成(RAG)を改善するか否かを評価する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:55:12 GMT)
Is Grokipedia Right-Leaning? Comparing Political Framing in Wikipedia and Grokipedia on Controversial Topics [2.4] 本稿では,ウィキペディアとGrokipediaの比較分析を行った。
これら2つのプラットフォーム間のセマンティックな類似性は、記事セクション間で崩壊し、ランダムにサンプリングされたものよりも議論の的となるトピックに強く依存する。
両百科事典は左利きのフレーミングが主であるのに対し,Grokipediaは右利きのコンテンツの優位性を高めたバイモーダルな分布を示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:36:12 GMT)
Does medical specialization of VLMs enhance discriminative power?: A comprehensive investigation through feature distribution analysis [2.2] 本研究では,オープンソース医療ビジョン言語モデル(VLM)が生成する特徴表現について検討する。
実験の結果,医療用VLMは,医療用分類作業に有効な識別的特徴を抽出できることがわかった。
以上の結果から,医療用VLMの開発において,テキストエンコーダの強化は医用画像の集中的な訓練よりも重要であることが示唆された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:53:40 GMT)
Not Your Typical Sycophant: The Elusive Nature of Sycophancy in Large Language Models [2.2] そこで本研究では, LLMの薬効を直接的, 中立的に評価する新しい手法を提案する。
LLM-as-a-judge(英語版)の使用は、賭け設定におけるゼロサムゲームとしての梅毒の評価である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:00:14 GMT)
DroneVLA: VLA based Aerial Manipulation [2.2] 本研究は,高レベルの自然言語コマンドを解釈してオブジェクトを検索し,人間の手に届ける,自律航空操作システムという新しい概念を導入する。
このシステムは、Grounding DINOとVision-Language-Actionモデルに基づくMediaPipeと、1-DOFグリップとIntel RealSense RGB-Dカメラを備えたカスタムドローンを統合することを意図している。
実世界におけるローカライゼーションとナビゲーションの実証実験により,最大0.164m,0.070m,0.084m,平均ユークリッド,ルート平均2乗のシステムの有効性を実証した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:32:20 GMT)
Understanding Usefulness in Developer Explanations on Stack Overflow [2.2] 本研究は,開発者説明における有用性について,実証的な説明を提供する。
開発者とRE実践者がより明確で効果的な説明をする方法に意味がある。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:50:43 GMT)
DeepFedNAS: A Unified Framework for Principled, Hardware-Aware, and Predictor-Free Federated Neural Architecture Search [2.1] DeepFedNASは、プライバシ保護学習(FL)のためのモデル設計を自動化する
FedNASは現在、2つの重要なボトルネックに直面している。
DeepFedNAS(DeepFedNAS)は、原則付き多目的フィットネス機能によって支えられた新しい2相フレームワークである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:03:25 GMT)
A Marketplace for AI-Generated Adult Content and Deepfakes [2.1] AI生成コンテンツのための人気のあるコミュニティ主導のプラットフォームであるCivitaiは、Bountiesと呼ばれる収益化機能を運用している。
プラットフォームローンチ後14ヶ月の間に収集した,公開可能なすべての報奨金要求の経時的分析を行った。
報奨金の市場は、ユーザーがAIモデルを学習していないコンテンツに向けて操縦できるツールによって支配されていることが分かっています。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:44:40 GMT)
GuideTouch: An Obstacle Avoidance Device with Tactile Feedback for Visually Impaired [2.1] GuideTouchは、自律的障害物回避のために設計されたウェアラブルデバイスである。
システムは2つの縦方向のTime-of-Flight(ToF)センサーを統合し、3次元環境認識を可能にする。
指向性触覚フィードバックを提供する4つの振動アクチュエータ。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:36:57 GMT)
SAGE-FM: A lightweight and interpretable spatial transcriptomics foundation model [2.1] グラフ畳み込みネットワーク(GCN)に基づく軽量空間転写基盤モデルであるSAGE-FMを紹介する。
SAGE-FMは、15個の臓器にまたがる416個のヒトのビシウムサンプルに基づいて、マスクされた遺伝子を確実に回収する空間的に整合した埋め込みを学習する。
以上の結果から,GCNは大規模空間転写学において生物学的に解釈可能かつ空間的に認識可能な基礎モデルとして機能することが示唆された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:22:38 GMT)
HyperNet-Adaptation for Diffusion-Based Test Case Generation [2.0] 拡散に基づく生成を直接かつ効率的に制御できる生成試験法HyNeAを提案する。
このアプローチにより、探索に基づく手法よりも計算コストが大幅に低い現実的な障害ケースをターゲットとして生成することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:45:15 GMT)
ICLF: An Immersive Code Learning Framework based on Git for Teaching and Evaluating Student Programming Projects [2.0] Immersive Code Learning Framework (ICLF)は、学生プログラミングプロジェクトを管理し評価するためのスケーラブルなGitベースの組織パイプラインである。
学生は既存のコードベースから始めます。これは現実世界のソフトウェア開発をミラー化するのに不可欠なプラクティスです。
学生は、この中間リポジトリのプライベートフォークに招待され、教師が親リポジトリを変更するたびに、学期を通して更新される可能性がある。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:39:17 GMT)
Representation-Aware Unlearning via Activation Signatures: From Suppression to Knowledge-Signature Erasure [2.0] 本稿では,真の消去と難読化を区別する表現対応アーキテクチャであるKnowledge Immunization Framework(KIF)を紹介する。
提案手法は,主観的表現の動的抑制とパラメータ効率の適応を組み合わせ,完全モデル再学習を伴わない耐久性のある未学習を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:55:54 GMT)
HumanDiffusion: A Vision-Based Diffusion Trajectory Planner with Human-Conditioned Goals for Search and Rescue UAV [2.0] 本稿では,人間を意識したナビゲーショントラジェクトリを生成する軽量な画像調和拡散プランナであるHumanDiffusionを提案する。
このシステムは、YOLO-11をベースとした人間の検出と拡散駆動軌道生成を組み合わせることで、四極子を標的人物に接近させ、医療支援を提供する。
実世界の実験では、事故応答と捜索・配置のタスクで全体のミッション成功率が80%であることを示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:22:22 GMT)
Stochastic Decision-Making Framework for Human-Robot Collaboration in Industrial Applications [1.9] コラボレーティブなロボット(コボット)は、人間と一緒に効率的に安全に働くために、さまざまな産業やサービスの設定に統合されつつある。
本稿では,モデリングを利用したロボット協調環境における意思決定手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:35:33 GMT)
Towards Cybersecurity Superintelligence: from AI-guided humans to human-guided AI [1.9] サイバーセキュリティの超知能は、スピードと戦略的推論の両方において、人工知能が人間の最高の能力を上回っている。
本稿では,AIセキュリティの分野を開拓した3つの主要な貢献を通じて,そのような能力の出現について述べる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:12:48 GMT)
From Insight to Intervention: Interpretable Neuron Steering for Controlling Popularity Bias in Recommender Systems [1.9] 人気度バイアスはレコメンデーションシステムにおいて広範囲にわたる課題であり、いくつかの人気アイテムが注目されている一方、人気度の低いアイテムの大部分は未公開のままである。
本稿では,Sparse Autoencoderを利用するポストホックアプローチであるPopSteerを提案し,リコメンデーションモデルにおける人気バイアスの解釈と緩和を行う。
シーケンシャルレコメンデーションモデルを用いた3つの公開データセットの実験では、PopSteerは正確性に対する最小限の影響でフェアネスを著しく向上し、解釈可能な洞察とフェアネス-正確性トレードオフのきめ細かい制御を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:02:11 GMT)
Vehicle Routing with Finite Time Horizon using Deep Reinforcement Learning with Improved Network Embedding [1.9] 本稿では,ローカルノード埋め込みベクトルとコンテキスト対応グローバルグラフ表現を生成する新しいルーティングネットワーク埋め込みモジュールを提案する。
実装モジュールをポリシーグラデーションに基づくディープ強化学習フレームワークと統合し、有限時間水平線で車両のルーティング問題を解決する。
実験の結果,提案手法は既存のルーティング手法よりも高い顧客サービス率を実現することがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:05:04 GMT)
VegaChat: A Robust Framework for LLM-Based Chart Generation and Assessment [1.9] 本稿では,自然言語から宣言的視覚化を生成し,検証し,評価するフレームワークであるVegaChatを紹介する。
LLMを起動することなく仕様レベルの類似度を測定する決定論的計量であるSpec Scoreと、ライブラリに依存しない画像ベース計量であるVision Scoreの2つの相補的な指標を提案する。
VegaChatは、無効または空のヴィジュアライゼーションのほぼゼロの速度を達成する一方、Spec ScoreとVision Scoreは、人間の判断と強い相関を示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:02:11 GMT)
DWPP: Dynamic Window Pure Pursuit Considering Velocity and Acceleration Constraints [1.8] 純粋追従とその変種は、その単純さと計算効率のため、移動ロボットの経路追跡に広く用いられている。
本稿では,動的ウィンドウ純粋探索法(DWPP)を提案し,速度と加速度の制約を明示的に組み込むように指令速度計算過程を再構成する。
実験により,DWPPは制約違反命令を回避し,従来の純粋追従法と比較して経路追従精度が優れていることが示された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:05:42 GMT)
RL-BioAug: Label-Efficient Reinforcement Learning for Self-Supervised EEG Representation Learning [1.8] ラベル効率強化学習(RL)エージェントを利用して最適な拡張ポリシーを自律的に決定するフレームワークであるRL-BioAugを提案する。
実験の結果,RL-BioAugはランダム選択戦略よりも有意に優れていた。
我々のフレームワークは、従来の(10%)ベースの拡張を置き換え、データ拡張のための新しい自律パラダイムを確立する可能性を示唆している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:55:31 GMT)
Quadratic tensors as a unification of Clifford, Gaussian, and free-fermion physics [1.7] 量子力学モデルは,古典的コンピュータ上で効率的に記述・解けることを示す。
これらのモデルには、qubitまたはqudit Clifford回路と安定化器符号、フリーボソンまたはフリーフェルミオンモデル、特定のローターとGKP符号が含まれる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:07:27 GMT)
Using Multi-Instance Learning to Identify Unique Polyps in Colon Capsule Endoscopy Images [1.4] 本稿では、この問題をマルチインスタンス学習(MIL)タスクとして定式化し、クエリポリプ画像を画像のターゲットバッグと比較し、特異性を決定する。
我々は,分散刺激型マルチヘッドアテンション(VEMA)や距離ベースアテンション(DBA)などのアテンション機構を組み込んだマルチインスタンス検証(MIV)フレームワークを用いて,意味のある表現を抽出するモデルの能力を高める。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:50:31 GMT)
Summary of the Unusual Activity Recognition Challenge for Developmental Disability Support [1.4] この課題は、発達障害のある個人のための施設における異常な行動の自動認識の必要性に対処することを目的としている。
シミュレーションシナリオのビデオ記録から抽出した骨格キーポイントに基づいて,正常な活動と異常な活動の区別を行う。
このデータセットは実世界の不均衡と時間的不規則を反映し、評価は主観的一般化を保証するためにLeave-One-Subject-Out(LOSO)戦略を採用した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:41:35 GMT)
From Volumes to Slices: Computationally Efficient Contrastive Learning for Sequential Abdominal CT Analysis [1.3] 2D-VoCoは,スライスレベルの自己教師型事前学習のためのVoCoフレームワークの効率的な適応である。
RSNA 2023腹部外傷データセットでは、2D-VoCo事前トレーニングは、スクラッチからのトレーニングよりも、mAP、精度、リコール、RSNAスコアを大幅に改善する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:26:31 GMT)
Field-Space Autoencoder for Scalable Climate Emulators [1.3] 球面圧縮モデルに基づくスケーラブルな気候エミュレーションフレームワークを提案する。
Field-Space Attentionを利用することで、モデルはネイティブな気候モデル出力を効率的に操作する。
モデルは、豊富な低解像度データとスパース高解像度データから内部変数を同時に学習することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:43:53 GMT)
A Practical Guide to Establishing Technical Debt Management [1.3] このホワイトペーパーは、"技術的負債"というトピックの概要を提供し、チームにおける技術的負債を管理するためのアプローチを提示します。
白書は私の論文の結果に基づいており、科学的知見を実践的なガイダンスに翻訳することを目的としている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:45:42 GMT)
Synthetic Data Guided Feature Selection for Robust Activity Recognition in Older Adults [1.3] 老年者における股関節骨折リハビリテーション時の身体活動は長期機能低下の軽減に不可欠である。
既存の監視システムと市販のウェアラブルアクティビティトラッカーは、一般的に中年層で開発されている。
本研究の目的は,股関節骨折リハビリテーションにおける身体活動認識の持続的向上を目的とした,堅牢なヒト活動認識(HAR)システムの開発である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:44:49 GMT)
Arguing conformance with data protection principles [1.2] 整合性議論は、データ保護原則に適合する主張を裏付けるために、組織によって使用することができる。
これらの組織、監督当局、認証機関、データ主体は、これらの主張の真実を評価することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:26:28 GMT)
HiT: History-Injection Transformers for Onboard Continuous Flood Change Detection [1.2] 小型衛星のメモリと計算限界内で動作するオンボード切替検出システムを開発した。
本研究では,過去の観測から歴史的文脈を維持するトランスフォーマーモデル (HiT) のヒストリインジェクション機構を提案する。
提案されたHiT-Prithviモデルは、ナノサットで使用される代表的ハードウェアであるJetson Orin Nano上で43FPSを達成した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:02:55 GMT)
SplatBus: A Gaussian Splatting Viewer Framework via GPU Interprocess Communication [1.1] 放射場に基づくレンダリング手法はコンピュータビジョンやコンピュータグラフィックスコミュニティから大きな関心を集めている。
複雑な現実世界の照明効果を持つ高忠実なレンダリングを可能にするが、高レンダリングのコストがかかる。
3D Splattingは、リアルタイムレンダリングのためのガウシアン化ベースのアプローチでこの問題を解決する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:56:22 GMT)
WebAssembly Based Portable and Secure Sensor Interface for Internet of Things [1.1] 本稿では、セキュアでポータブルで低フットプリントのサンドボックスを提供する最初のWebAssembly System Interface(WASI)拡張を紹介する。
ランタイム拡張は、アプリケーションメモリを分離し、センサーアクセスをインターセプトすることで、適切なリソースプリミ-レッグを確保し、ネットワーク内アクセス制御を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:36:58 GMT)
Synthetic Data Augmentation for Multi-Task Chinese Porcelain Classification: A Stable Diffusion Approach [1.1] 本研究では,Low-Rank Adaptation (LoRA) を用いた安定拡散法により生成した合成画像が,マルチタスクCNNに基づく磁器分類のための制限された実データセットを効果的に増強できるかどうかを検討する。
MobileNetV3とトランスファーラーニングを併用して,実データを用いた学習モデルと混合実合成データセットを用いた学習モデルの比較実験を行った。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:14:22 GMT)
Operationalising DAO Sustainability KPIs: A Multi-Chain Dashboard for Governance Analytics [1.1] 私たちは、分散自律組織(DAO)の持続可能性を評価するために、プロダクショングレードの分析パイプラインとインタラクティブダッシュボードであるPortalを紹介します。
本研究は,提案活動の継続的参加率や集中度など,プラットフォームが繰り返しパターンを呈示する様子を示す。
Portalはガバナンスのトレースを計測可能で説明可能なものにすることで、持続可能性の監査可能な証拠と金融アプリケーションのためのソフトウェアエンジニアリングインフラストラクチャを提供します。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:19:43 GMT)
ExPrIS: Knowledge-Level Expectations as Priors for Object Interpretation from Sensor Data [1.1] ExPrISプロジェクトは、センサデータからオブジェクトの解釈を改善するために、知識レベルの期待がどのように役立つかを調査する。
我々は、過去の観測からの文脈的先行と、ConceptNetのような外部グラフからのセマンティック知識という、2つの情報源からの期待を統合する。
この方法は静的なフレーム・バイ・フレーム解析を超えて、時間とともにシーン理解の堅牢性と一貫性を高める。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:27:38 GMT)
RadixMLP - Intra-batch Deduplication for Causal Transformers [1.1] RadixMLPは、位置対応表現、LayerNorms、線形プロジェクション、埋め込みを利用して冗長性を排除する。
RadixMLPはステートレスであり、単一のフォワードパス内で動作する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:11:46 GMT)
Beyond Fixed Psychological Personas: State Beats Trait, but Language Models are State-Blind [1.1] Redditユーザ1,667人の5,001人のコンテキスト心理学的プロファイルのデータセットであるChameleonを紹介した。
ラテント・ステート・トレイト理論に触発され、分散を分解し、74%が内人(状態)であり、わずか26%が対人(取引)であることがわかった。
報酬モデルはユーザの状態に反応するが、一貫性がない: 異なるモデルが同じユーザーを反対方向に好んだり罰したりする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:06:50 GMT)
Active interference suppression in frequency-division-multiplexed quantum gates via off-resonant microwave tones [1.0] 周波数分割多重同時ゲート動作に対するアクティブ干渉抑制法を提案する。
オフ共鳴マイクロ波トーンを取り入れることで,マイクロ波トーン数の逆2乗に比例してゲートが減少することがわかった。
本手法は,周波数分割多重化量子ゲートの性能向上に有効である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:06:53 GMT)
From Observation to Prediction: LSTM for Vehicle Lane Change Forecasting on Highway On/Off-Ramps [1.0] 本稿では,このエリア・オブ・興味 (AoI) と幹線道路区間との差異について検討する。
その結果,AoIでは約76%,最大地平線では一般道路では94%,予測精度では最大4秒の地平線が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:31:03 GMT)
Efficient reformulations of ReLU deep neural networks for surrogate modelling in power system optimisation [1.0] 分散電力システムの脱炭はエネルギー資源への依存を増している。
複雑で非線形な相互作用は 最適に捉えるのが難しい
本稿では,DNNLP(Convexified ReLUs)のクラスに対する再編成を提案する。
提案された改革は、最先端の代替案に対してベンチマークされる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:40:27 GMT)
Calibrated uncertainty quantification for prosumer flexibility aggregation in ancillary service markets [1.0] 本稿では,モンテカルロ・ドロップアウト(MCD)と共形予測(CP)を統合したスケーラブルな不確実性フレームワークを提案する。
大規模な合成データセットは、業界グレードの家庭用エネルギー管理システムを使用して生成され、公的に利用可能な負荷、太陽、価格、アクティベーション、デバイスレベルのデータと組み合わせられる。
その結果,スタンドアローンのMCDは可利用な柔軟性を過大評価し,P90準拠に反するが,提案したMCD-CPフレームワークは制御された保守性で信頼性の高いカバレッジを達成できることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:21:31 GMT)
Risk Estimation for Automated Driving [0.9] 自動運転では、リスクは2つの側面によって特徴づけられる。
不確実性は一般的に、衝突に近い事象の危険をゼロにする。
既存のアプローチでは、経験的モデリングや厳密な近似に頼ってリスクを計算する。
本稿では,衝突確率推定の最近の進歩と衝突重大度の概念を組み合わせて,正確なリスク推定のための一般的な手法を開発する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:14:50 GMT)
From Instruction to Output: The Role of Prompting in Modern NLG [0.9] 本稿は, 自然言語生成(NLG)タスクの促進手法の最近の進歩とその影響を概観する。
実践者のさまざまな要因に基づいて選択を促すための決定枠組みであるパラダイムの促進の分類を導入し、新たなトレンドと課題を概説する。
より制御しやすく、一般化可能なNLGをサポートするために、設計、最適化、評価をリンクするフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:10:41 GMT)
Stimulated cooling in non-equilibrium Bose-Einstein condensate [0.8] 約室温から20Kまでの弱い相互作用を持つ励起子-偏光子を非平衡ボース-アインシュタイン凝縮体(BEC)で冷却する実験を行った。
エネルギー-運動量空間における凝縮物を解き、干渉測定を行うことにより、凝縮物を熱粒子と区別するが、励起状態はマクロ的に占有する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:23:20 GMT)
LLM-Based Repair of C++ Implicit Data Loss Compiler Warnings: An Industrial Case Study [0.8] 本稿では,Large Language Models (LLM) を用いた大規模C++プロジェクトにおいて,暗黙的なデータ損失警告を自動的に修正する手法を提案する。
我々のアプローチでは、Language Server Protocol(LSP)を使用してコンテキストを収集し、Tree-sitterを使って関連するコードを抽出し、LCMを使って意思決定を行い、修正を生成する。
我々はこの方法を大規模なC++プロジェクトでテストし、コードレビュー中に人間の開発者による修正の受け入れ率は92.73%となった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:30:32 GMT)
Lightweight LLMs for Network Attack Detection in IoT Networks [0.8] Internet of Things(IoT)デバイスは、サイバー攻撃の規模と多様性を高め、従来の侵入検知システムに制限を課している。
本研究では、構造化テキスト変換、QLoRA(Quantized Low-Rank Adaptation)ファインチューニング、Retrieval-Augmented Generation(RAG)を統合したIoT攻撃検出のための軽量デコーダ専用大規模言語モデル(LLM)について検討する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:52:26 GMT)
Memes-as-Replies: Can Models Select Humorous Manga Panel Responses? [0.8] 提案するMeme Reply Selectionタスクと,100,000対の注釈付きペアのベンチマークであるMaMe-Re(2,325のユニークなアノテーションの合計50,000アノテーション)を紹介する。
分析の結果,(1)大言語モデル(LLM)は,誇張などの複雑な社会的手がかりを捉える予備的証拠を示し,(2)視覚情報の含意は,視覚的内容の理解と文脈的ユーモアの効果的利用のギャップを明らかにすること,(3)LLMは制御された環境において人間の判断に合致するが,意味的に類似した候補間の微妙な相違を区別することは困難であった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:33:44 GMT)
Graph-Based Adaptive Planning for Coordinated Dual-Arm Robotic Disassembly of Electronic Devices (eGRAP) [0.8] リサイクル率が低いまま、e-wasteは急速に成長している。
本稿では、視覚、動的計画、デュアルアーム実行を統合した電子デバイスグラフベースの適応計画(eGRAP)を提案する。
スケジューラは、このグラフのトポロジ的順序付けを使用して、有効な次のステップを選択し、それらを2つのロボットアームに割り当てる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:57:03 GMT)
Multimodal system for skin cancer detection [0.8] 本研究では,従来の画像を用いたマルチモーダルメラノーマ検出システムを提案する。
画像とメタデータ処理を組み合わせたマルチモーダルニューラルネットワークを採用し、メタデータの有無に関わらず2ステップモデルをサポートする。
3段階のパイプラインは、アルゴリズムの強化とパフォーマンスの向上によって予測をさらに洗練する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:50:13 GMT)
Local Language Models for Context-Aware Adaptive Anonymization of Sensitive Text [0.7] 本研究は, ローカルLLMを用いて, 信頼性, 再現性, コンテキスト対応の匿名化プロセスを構築する。
本稿では,適応匿名化のための構造化フレームワーク(Structured Framework for Adaptive Anonymizer, SFAA)を紹介する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:59:56 GMT)
Say Anything but This: When Tokenizer Betrays Reasoning in LLMs [0.7] 大規模言語モデル (LLMs) は、離散トークンIDシーケンスを推論する。
現代のサブワードトークンーは、非特異なエンコーディングを日常的に生成する。
トークン化は,一対多のトークンIDマッピングを通じてLCM推論を裏切ることができることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:09:09 GMT)
GeMM-GAN: A Multimodal Generative Model Conditioned on Histopathology Images and Clinical Descriptions for Gene Expression Profile Generation [0.7] GeMM-GANは, 組織スライドと臨床メタデータに基づいて, 現実的な遺伝子発現プロファイルを合成する新規なジェネレーティブ・アドバイサル・ネットワークである。
我々はTCGAデータセットに対する我々のアプローチを評価し、我々のフレームワークが標準生成モデルより優れ、より現実的で機能的に意味のある遺伝子発現プロファイルを生成することを示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:03:54 GMT)
A tensor network formalism for neuro-symbolic AI [0.7] テンソル分解における異なるアプローチから生じる疎性原理を捉えるテンソルネットワーク形式論を導入する。
提案された形式は、論理式や確率分布を構造化テンソル分解として表現するために適用することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:20:31 GMT)
Machine learning-enhanced non-amnestic Alzheimer's disease diagnosis from MRI and clinical features [0.6] 認知機能検査とMRIによる海馬萎縮の評価により,ほとんどのアルツハイマー病 (AD) 診断が記憶クリニックで行われている。
非定型的提示(atAD)を有するAD患者の実質的なサブグループは、日常的に誤診される。
本稿では,臨床検査用バッテリと標準医療として収集したMRIデータを用いて,atADと非AD認知障害を区別する機械学習手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:32:17 GMT)
DS@GT at TREC TOT 2025: Bridging Vague Recollection with Fusion Retrieval and Learned Reranking [0.5] TREC Tip-of-Tongue(ToT)タスクに対処する2段階検索システムを開発した。
第1段階では、LLMに基づく検索、スパース(BM25)、高密度(BGE-M3)検索を併用したハイブリッド検索を採用する。
また、ウィキペディアコーパスを24のトピック領域に分割する、トピック対応マルチインデックスの高密度検索についても紹介する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:09:17 GMT)
Attention-Informed Surrogates for Navigating Power-Performance Trade-offs in HPC [0.5] 本稿では、この複雑な決定を自動化するために、サロゲート支援多目的ベイズ最適化(MOBO)フレームワークを提案する。
我々の中心となる仮説は、作業テレメトリの注意に基づく埋め込みによって得られるサロゲートモデルが、標準的な回帰手法よりもパフォーマンスのダイナミクスを効果的に捉えることができるというものである。
我々の知る限り、これはHPCスケジューリング問題に対してMOBOフレームワークに埋め込みインフォームドサロゲートをうまく適用する最初の試みである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:11:12 GMT)
Influence of Operator Expertise on Robot Supervision and Intervention [0.5] 本研究では,遠隔ロボットの監視において,様々な専門知識を持つオペレータが情報を理解し,介入決定を行う方法について検討する。
本研究では,シミュレータ内の4つの未知のトンネル環境を自律的に探索するロボットを,被験者が指導するユーザスタディを行った。
インタラクションデータと質問応答を解析することにより,初級,中級,専門ユーザを対象に,介入タイミングと意思決定戦略の異なるパターンを識別する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:14:23 GMT)
A Curriculum-Based Deep Reinforcement Learning Framework for the Electric Vehicle Routing Problem [0.5] EVRPTW(Electric Vehicle routing problem with Time Window)は、持続可能なロジスティクスにおいて複雑な最適化問題である。
この不安定性を解決するために,カリキュラムベースの深層強化学習(CB-DRL)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:42:33 GMT)
Benchmarking LLMs for Pairwise Causal Discovery in Biomedical and Multi-Domain Contexts [0.4] バイオメディシンのような高レベルの分野における大きな言語モデル(LLM)は、原因と効果を推論できる必要がある。
ベンチマークでは、12の多様なデータセットを使用して、2つのコアスキルを評価します。
textbfCausal Detection (テキストに因果リンクが含まれているかどうかを識別する) および
textbfCausal extract (正確な原因と効果句を抽出する)
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:29:46 GMT)
Generative Artificial Intelligence, Musical Heritage and the Construction of Peace Narratives: A Case Study in Mali [0.4] この研究は、コミュニティ間の緊張と社会的な骨折が、和解のための新しい象徴的な枠組みを探求する動機となる、政治的、社会的文脈においてなされてきた。
実験結果から,文化的に意識された参加型枠組みに埋め込まれたGen AIが,象徴的外交の触媒として機能することが示唆された。
しかし、言語コーパスの入手、アルゴリズムによる検閲、著作権源から派生した作曲の倫理に関する課題が続いている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:22:19 GMT)
Robust Machine Learning for Regulatory Sequence Modeling under Biological and Technical Distribution Shifts [0.4] 性能劣化、校正失敗、不確実性に基づく信頼性を定量化するためのロバストネスフレームワークを導入する。
シミュレーションでは、セル型特異的プログラム、摂動、GCバイアス、深さ変化、バッチ効果、ヘテロscedastic noiseによってモチーフ駆動の制御出力が生成される。
モデルは精度は保たれるが、高い誤差、激しいばらつきの誤校正、モチーフ効果の反転とノイズによるカバー崩壊が支配的な体制である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:15:27 GMT)
MiRAGE: A Multiagent Framework for Generating Multimodal Multihop Question-Answer Dataset for RAG Evaluation [0.3] 既存のデータセットは一般的なドメインコーパスや純粋にテキスト検索に依存していることが多い。
RAGシステム評価のためのMultiagentフレームワークであるMiRAGEを紹介する。
MiRAGEは、検証済み、ドメイン固有、マルチモーダル、マルチホップ質問応答データセットを生成するために、専門エージェントの群を編成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:39:09 GMT)
Computational Foundations for Strategic Coopetition: Formalizing Collective Action and Loyalty [0.3] 混合モチベーションのマルチエージェント設定は、個々の努力がメンバー全員に均等に利益をもたらすため、永続的なフリーライディングを伴いますが、各メンバは自身のコントリビューションの完全なコストを負担します。
本報告は, 戦略的合弁のための計算基盤をチームレベルのダイナミクスに拡張する。
我々は、忠誠の利益とコスト耐性の2つのメカニズムで、忠誠をモデレートしたユーティリティ機能を開発する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:23:04 GMT)
Obscuring Data Contamination Through Translation: Evidence from Arabic Corpora [0.3] 複数のオープンウェイト大言語モデルを微調整することにより,多言語環境における汚染動態を解明する。
アラビア語への翻訳は従来の汚染指標を抑制するが、それでも汚染されたデータへの曝露の恩恵はモデルは大きい。
我々は,複数の翻訳されたベンチマークの変種間での信号の比較により,汚染を識別する翻訳認識汚染検出法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:53:04 GMT)
The computational two-way quantum capacity [0.3] 量子チャネル容量は量子情報理論の基本である。
計算効率の自然な要求は、量子通信の限界を根本的に変えることができることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:04:07 GMT)
Fast-ULCNet: A fast and ultra low complexity network for single-channel speech enhancement [0.3] 本稿では,GRU層をFastGRNNに置き換えることで,計算レイテンシと複雑性の両面を低減し,ULCNetの適応性を提案する。
結果のモデルであるFast-ULCNetは、音声強調タスクにおける最先端のULCNetアーキテクチャと同等に動作する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:14:44 GMT)
MTFlow: Time-Conditioned Flow Matching for Microtubule Segmentation in Noisy Microscopy Images [0.3] MTFlowはマイクロチューブセグメンテーションのための時間条件付きフローマッチングモデルである。
ノイズマスクを基底真理に向けて反復的に輸送するベクトル場を学ぶ。
最先端のモデルに匹敵する、競争力のあるセグメンテーションの精度を実現する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:14:50 GMT)
A Comprehensive Benchmark of Language Models on Unicode and Romanized Sinhala [0.3] 本稿では,Unicode と Romanized Sinhala の多種多様なコーパス上での現代言語モデル (LM) のベンチマークを示す。
我々は,テキストの予測精度の指標であるパープレキシティ(perplexity)を用いて,オープンソースモデルを評価し,クローズドソースモデルを導出する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:58:46 GMT)
Federated Transformer-GNN for Privacy-Preserving Brain Tumor Localization with Modality-Level Explainability [0.3] 本稿では,脳腫瘍の局所化のための統合学習フレームワークを提案する。
提案手法は,従来のデコーダフリースーパーボクセルGNNから派生したハイブリッドトランスフォーマー-グラフニューラルネットワークアーキテクチャを拡張した。
本稿では,トランスフォーマーのアテンション機構による説明可能性解析を行い,MRIのモーダルティがモデル予測を駆動することを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:46:00 GMT)
Vision-Language Models on the Edge for Real-Time Robotic Perception [0.2] 6G内のエッジインテリジェンス、特にOpen RANとMulti- Access Edge Computingは、これらの課題に対処するための経路を提供する。
本研究は,Unitree G1ヒューマノイドロボットを具現化したテストベッドとして,ORAN/MECインフラストラクチャ上でのビジョンランゲージモデルの展開について検討する。
その結果,エッジデプロイメントはクラウドに近い精度を保ちながら,エンドツーエンドのレイテンシを5%削減できることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:09:48 GMT)
Early predicting of hospital admission using machine learning algorithms: Priority queues approach [0.2] 救急署の混雑は患者の安全と作業効率を損なう重要な問題である。
本研究では,季節自動回帰統合移動平均とeXogenous Regressors(SARIMAX),Extreme Gradient Boosting(XGBoost),Long Short-Term Memory(LSTM)の3つの予測モデルを評価し,比較する。
XGBoostは平均絶対誤差が6.63であり、統計SARIMAXモデルでは3.77である大合併症の予測に優れていた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:31:16 GMT)
QUAIL: Quantization Aware Unlearning for Mitigating Misinformation in LLMs [0.2] 低ビット量子化が機械学習を損なう理由を分析する。
量子化を意識したアンラーニング手法を提案する。
提案手法は, 4ビット量子化下での忘れを保存し, 既存の手法は忘れた知識をほぼ完全に復元する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:48:38 GMT)
LLMs Got Rhythm? Hybrid Phonological Filtering for Greek Poetry Rhyme Detection and Generation [0.1] LLM(Large Language Models)は、韻律検出や生成のような音韻論的に基底的な現象に対処する。
本稿では,LLMと決定論的音韻論的アルゴリズムを組み合わせて,正確な韻律識別・分析・生成を実現するハイブリッドシステムを提案する。
我々は,Anemoskala と Interwar Poetry corpora から派生した4万以上の韻律を重要かつ厳格に浄化したコーパスを,今後の研究を支援するためにリリースする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:18:15 GMT)
Feasibility Preservation under Monotone Retrieval Truncation [0.1] 本研究では,構造的観点からの検索について検討し,クエリ応答をトランケーション下で実現可能な問題としてモデル化する。
個々の問合せに対する有限可視性を保証するために, 単調トランケーションが十分であることを示す。
さらに,非単調なトランケーション,非有限生成クエリクラス,純粋にスロットワイズなカバレッジの失敗を示すシャープな反例を示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:25:16 GMT)
A Sublinear-Time Quantum Algorithm for High-Dimensional Reaction Rates [0.1] 非次元力学に対する量子アルゴリズムの成功確率の指数的減衰を克服するアルゴリズムを導入する。
また、この手法を用いて指数減衰を伴わない行列要素を直接推定する。
特殊古典散逸アルゴリズムは、実際にはこれらの境界よりも優れているが、これは量子的優位性への厳密な経路を示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:20:46 GMT)
Explaining the advantage of quantum-enhanced physics-informed neural networks [0.1] 偏微分方程式(PDE)は多くの自然現象エナのシミュレーションのバックボーンを形成する。
量子コンピューティングがPDEを解くための物理インフォームドニューラルネットワークの能力をどのように改善するかを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:50:17 GMT)
Exactly solvable topological phase transition in a quantum dimer model [0.0] 二重周期エッジ重みを持つ三角格子上の量子二量体モデルについて検討する。
本稿では,2次元モデルのループ統計量の観点から,定数ビソン相関器について説明する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:00:01 GMT)
jBOT: Semantic Jet Representation Clustering Emerges from Self-Distillation [0.0] jBOTはCERN大型ハドロン衝突型加速器からのジェットデータに対する自己蒸留に基づく事前学習法である。
ラベルなしジェットの事前学習が表現空間における創発的意味クラスクラスタリングにつながることを観察する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:25:59 GMT)
You Need Better Attention Priors [0.0] GOAT(Generalized Optimal Transport Attention with Trainable Priors)を紹介する。
GOATは、注意シンクのEOTベースの説明を提供し、それらに対する解決策を具体化する。
GOATは、学習した位置埋め込みの柔軟性と固定符号化の長さの一般化を組み合わせた拡張可能な事前学習を行う。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:00:08 GMT)
Visual and Cognitive Demands of a Large Language Model-Powered In-vehicle Conversational Agent [0.0] 本研究は,道路走行中における多言語モデル(LLM)会話エージェント(Gemini Live)の視覚的・認知的要求について検討した。
その結果、ジェミニ・ライブの相互作用は、視覚的ターンバイターンガイダンスとOSPANの類似した認知的負荷のレベルを共有していることがわかった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:37:05 GMT)
Vision Models for Medical Imaging: A Hybrid Approach for PCOS Detection from Ultrasound Scans [0.0] バングラデシュの女性の多くは、高齢の多嚢胞性卵巣症候群(PCOS)を患っている。
畳み込みと変圧器に基づくアプローチを組み合わせた2つの新しいハイブリッドモデルを導入した。
トレーニングおよび検査データは「感染」(PCOS陽性)と「非感染」(健康な卵巣)の2つのカテゴリに分けられた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:58:05 GMT)
USDs: A universal stabilizer decoder framework using symmetry [0.0] Toric コードに有効であることを示す手法を一般化し,ラベルデジェネティクスの課題に対処できることを示す。
カラーコードでは,物理誤差率5%で復号精度が約0.8%向上し,Golayコードでは約0.1%向上した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:06:17 GMT)
Two-Qubit Spin-Boson Model in the Strong Coupling Regime: Coherence, Non-Markovianity, and Quantum Thermodynamics [0.0] 本研究では,2量子ビット開量子系の力学,特に強い結合状態における2量子ビットスピンボソンモデルについて検討する。
強い結合状態下での量子熱デバイスの実現により, 系の非平衡定常挙動について検討した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:28:39 GMT)
Trimer Dynamics in Floquet-driven arrays of Rydberg Atoms [0.0] 我々は最近Rydberg原子配列に適用されたWAHUHA Floquetプロトコルを解析した。
パルス時間の適切な選択は、全磁化の保存に対応する近似対称性を強制することができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:40:42 GMT)
The Responsibility Vacuum: Organizational Failure in Scaled Agent Systems [0.0] 現代のCI/CDパイプラインは、責任帰属の構造的失敗を示す。
我々は、この条件を責任掃除機として定義する:決定が起こる状態だが、権限と検証能力が一致しないため、責任は帰属できない。
私たちは、組織が決定境界を明示的に再設計したり、個々の決定からバッチやシステムレベルのオーナシップに再割り当てしない限り、大規模なエージェントデプロイメントでは、責任掃除は目に見えないが永続的な障害モードのままである、と結論付けています。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:05:27 GMT)
The Plausibility Trap: Using Probabilistic Engines for Deterministic Tasks [0.0] 本稿は、"Plausibility Trap"を定義する。
人工知能にアクセスする個人は、単純な決定論的タスクのために高価な確率的エンジンをデプロイする。
ツール選択エンジニアリングと決定論的確率決定行列を導入し、開発者が生成AIを使うタイミングを決定するのを助ける。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:05:01 GMT)
The Perplexity Paradox: Why Code Compresses Better Than Math in LLM Prompts [0.0] コード生成はアグレッシブ・プロンプト・圧縮(r >= 0.6)を許容し、チェーン・オブ・シークレット推論は徐々に低下する。
TAAC (Task-Aware Adaptive Compression) は品質保持率96%で22%のコスト削減を実現し, 定比圧縮を7%上回った。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:03:27 GMT)
The Dark Side of AI Transformers: Sentiment Polarization & the Loss of Business Neutrality by NLP Transformers [0.0] トランスフォーマーの改良により、ある種類の感情の精度が向上し、別の種類の感情の偏極と中立性の欠如が犠牲になっていることが観察された。
この中立性の欠如は、信頼性の高い業界対応タスクに対する感情分析の計算結果に大きく依存する応用NLP空間の深刻な問題を引き起こす。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:40:47 GMT)
Testing the equivalence to thermal states via extractable work under LOCC [0.0] 多体純状態は、相関にアクセスできない局所的な操作に制限されるとき、消滅する仕事をもたらす。
この熱状態の同値性がLOCC(ローカル操作と古典通信)の下で持続するかどうかは不明である。
本研究では,Haar-random状態のような最大多部絡み合いのある状態はLOCCの下では大きな作業ができないことを示す。
有限次グラフ状態のような有限個の多部絡み合いを持ついくつかの状態は、局所的に熱状態と区別できないにもかかわらず、広範囲な作業抽出を可能にする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:12:31 GMT)
Taxonomy-Aligned Risk Extraction from 10-K Filings with Autonomous Improvement Using LLMs [0.0] 企業10-K出願から構造的リスクファクターを抽出する手法を提案する。
S&P500社から10,688のリスクファクタを抽出し,業界クラスタ間のリスクプロファイルの類似性を検討した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:28:31 GMT)
Systematic Evaluation of Hip Exoskeleton Assistance Parameters for Enhancing Gait Stability During Ground Slip Perturbations [0.0] 下肢のエキソ骨格は、歩行摂動時の安定性維持を支援する可能性がある。
ほとんどのエキソスケルトンコントローラは、安定性を向上させるのではなく、歩行のエネルギー的コストを削減するよう最適化されている。
安定性を重視した外骨格制御は、時間的補助パラメータを優先し、ユーザ固有のパーソナライゼーションを含めるべきである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:58:37 GMT)
Superluminal Transformations and Indeterminism [0.0] ローレンツ対称性は、正式にスーパールミナル変換(SpTs)を許容する
我々は自然の仮定からno-go定理を導出し、これは次のように解釈できる: 超光変換(SpTs)と有限情報は共存できない。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:48:46 GMT)
Strategic Doctrine Language Models (sdLM): A Learning-System Framework for Doctrinal Consistency and Geopolitical Forecasting [0.0] 我々は,多文書戦略的推論のための学習システムフレームワークであるストラテジック・ドクトリン言語モデル(sdLM)を紹介した。
このアプローチは、多文書の注意、テンポラリエンコーディング、ドクトリン一貫性レイヤを組み合わせて、長期の予測と計画の妥当性を改善する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:45:17 GMT)
Standards for trustworthy AI in the European Union: technical rationale, structural challenges, and an implementation path [0.0] この白書は、AI法に基づく欧州のAI標準化の技術的基盤について考察する。
CEN/CENELECの標準化プロセスを説明するとともに、AIがユニークな課題を提起する理由を分析する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:58:47 GMT)
Spectral Generative Flow Models: A Physics-Inspired Replacement for Vectorized Large Language Models [0.0] 本稿では,SGFM(Spectral Generative Flow Models)を紹介する。
テキストやビデオを注意によって処理された離散トークンのシーケンスとして表現するのではなく、SGFMは生成を制約されたダイナミクスによって支配される連続フィールドの進化として扱う。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:24:36 GMT)
SimD3: A Synthetic drone Dataset with Payload and Bird Distractor Modeling for Robust Detection [0.0] 本稿では,複雑な大気環境下でのロバストなドローン検出のために設計された大規模高忠実な合成データセットであるSimD3を紹介する。
既存の合成ドローンデータセットとは異なり、SimD3は異質なペイロードでドローンをモデル化し、複数の鳥種をリアルな邪魔者として取り込んでおり、様々なUnreal Engine 5環境を利用して、360度6カメラのリグで捉えた天候、照明、飛行軌道を制御している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:56:25 GMT)
Semi-Supervised Mixture Models under the Concept of Missing at Radom with Margin Confidence and Aranda Ordaz Function [0.0] 本稿では,MAR(Missing at Random)メカニズム下でのガウス混合モデリングのための半教師付き学習フレームワークを提案する。
マージン信頼を導入し、不確実性と欠落確率の間の非対称関係を柔軟に捉えるために、Aranda Ordaz リンク関数を組み込む。
結果として生じる不確実性を認識したフレームワークは、現実的なMARシナリオにおける信頼性の高い分類性能を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:13:00 GMT)
Self-Blinding and Counterfactual Self-Simulation Mitigate Biases and Sycophancy in Large Language Models [0.0] 大規模言語モデル (LLM) は, 対実的知識の下で行う決定を近似する能力において, 同様の制約を負っていることを示す。
人間と異なり、LLMは自己の反事実認識の地道的モデルにアクセスできる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:26:54 GMT)
Routing Qubits on Noisy Networks [0.0] グラフ上の量子ウォーカの位置にある情報を符号化し、単一の入力から複数の出力への一般的な量子ビット状態のルーティングをモデル化する。
静的騒音や動的騒音に対するロバスト性を評価し,様々な状況下でのルーティング性能を解析・評価する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:51:06 GMT)
Robust X-Learner: Breaking the Curse of Imbalance and Heavy Tails via Robust Cross-Imputation [0.0] AdTechやヘルスケアといった産業応用における不均質処理(HTE)の評価は、二重課題である。
X-Learnerフレームワークはクロスインプットによって効果的に不均衡に対処する。
RX-Learnerは、標準のX-Learnerと比較して、PEHE(heterogeneous Effect)の測定における平均値を98.6%削減する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:50:01 GMT)
Reliability by design: quantifying and eliminating fabrication risk in LLMs. From generative to consultative AI: a comparative analysis in the legal domain and lessons for high-stakes knowledge bases [0.0] 本稿では,幻覚を減らし,大規模言語モデルを高額な法的作業に信頼性を持たせる方法について検討する。
1)独立した生成モデル(創造的オラクル)、(2)基本的な検索強化システム(専門的アーキビスト)、(3)高度なエンドツーエンド最適化RAGシステム(厳密なアーキビスト)の3つのAIパラダイムを区別する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:26:42 GMT)
Relational Graph Modeling for Credit Default Prediction: Heterogeneous GNNs and Hybrid Ensemble Learning [0.0] 信用デフォルトのリスクは、借り手、金融機関、取引レベルの行動の間の複雑な相互作用から生じる。
我々は3300万のノードと5000万のエッジを含む大規模不均一グラフを構築した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:13:41 GMT)
Quantum Interference Needs Convention: Overlap-Determinability and Unified No-Superposition Principle [0.0] 量子重ね合わせはしばしば状態ベクトルを追加する能力として表現される。
我々は、位相規則と「オーバーラップ決定可能性」と呼ばれる単一の概念を通してこれを定式化する。
このような慣習に固定されたオーバーラップに対する普遍的なアクセスを許すことは、慣れ親しんだ基礎的制約や計算的制約を不安定にすることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:25:21 GMT)
Programming Quantum Measurements of Time inside a Complex Medium [0.0] 我々は,光時間ビンの高次元重ね合わせのための一般化された測定をプログラムするために,単一の多モードファイバを利用する方法を示す。
空間モードのエキサイティングなコヒーレント重ね合わせにより、ファイバ内の大きな非平衡多モード干渉計の等価性を設計する。
単一ファイバは、タイムビンキューディットのためのスケーラブルで共通パス干渉計として機能する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:08:18 GMT)
Predictive Prototyping: Evaluating Design Concepts with ChatGPT [0.0] 本稿では、生成事前学習変換器(GPT)がプロトタイピングによって得られる情報を予測できるかどうかを検討する。
OpenAI GPT-4o を用いた設計フィードバックをエミュレートするための検索拡張生成(RAG)手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:54:37 GMT)
Precision Enhancement in Transient Quantum Thermometry:Cold-Probe Bias and Its Removal [0.0] 安定状態限界を超える精度の向上は、プローブが当初、浴温度に対応する熱状態よりも低温である場合にのみ達成できることを示す。
この温度バイアスは、プローブダイナミクスが非マルコフ的であるときに持ち上げることができる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 18:22:28 GMT)
Physics-Informed Singular-Value Learning for Cross-Covariances Forecasting in Financial Markets [0.0] 我々は,経験的特異値から対応する清浄値への非線形マッピングを学習するランダム行列に着想を得たニューラルネットワークを設計する。
構築により、ネットワークは特別なケースとして解析解を復元できるが、非定常力学やモード駆動歪みに適応できるほど柔軟である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:01:01 GMT)
Patch-Level Tokenization with CNN Encoders and Attention for Improved Transformer Time-Series Forecasting [0.0] 本稿では,局所的時間的表現学習をグローバル依存モデルから分離する2段階予測フレームワークを提案する。
畳み込みニューラルネットワークは、固定長の時間的パッチで動作し、短距離時間的ダイナミクスと非線形特徴相互作用を抽出する。
その後、Transformerエンコーダがパッチ間の時間依存性をモデル化し、予測を生成する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:41:56 GMT)
Panther: Faster and Cheaper Computations with Randomized Numerical Linear Algebra [0.0] 我々は、既存のRandNLAアルゴリズムを単一の高性能フレームワークに統合するPyTorch互換ライブラリであるPantherを紹介する。
我々はRandNLA技術の有効性とPantherの採用容易性を示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:23:00 GMT)
PRISM: Deriving the Transformer as a Signal-Denoising Operator via Maximum Coding Rate Reduction [0.0] ディープラーニングのためのホワイトボックスアテンションベースのアーキテクチャであるPrismを提案する。
プリズムは、その注意をスペクトル的に異なる体制に自然に専門化していることが示される。
以上の結果から,解釈可能性と性能はトレードオフではなく,原理的な構成によって統一可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:52:36 GMT)
Orthogonalized Policy Optimization:Decoupling Sampling Geometry from Optimization Geometry in RLHF [0.0] 大規模言語モデルアライメントの目的はしばしば、PPO、DPO、IPO、およびそれらの変種といった、異なるアルゴリズムの集合として提示される。
この研究において、この多様性はより単純な基盤構造を曖昧にしていると論じる。
この絡み合いは、単にモデリングの利便性ではなく、体系的な不安定性の源であることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:54:54 GMT)
One scale to rule them all: interpretable multi-scale Deep Learning for predicting cell survival after proton and carbon ion irradiation [0.0] 放射線野の物理的特性と生物学的損傷との関係は放射線療法と放射線防護の両方の中心である。
我々は,プロトンおよび炭素イオン照射後の細胞生存を予測する,解釈可能な深層学習モデルを開発した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:47:25 GMT)
On the Provable Suboptimality of Momentum SGD in Nonstationary Stochastic Optimization [0.0] 各種段差系における均一な凸性および滑らか性の下でのグラディエントDescentの追跡性能を解析した。
本研究では,ドリフトによる追従誤差を大幅に増幅し,追従能力に明らかなペナルティを与えることを示す。
これらの結果は、動的環境における運動量の経験的不安定性に対する決定的な理論的根拠を与える。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:24:33 GMT)
On Implementing Hybrid Post-Quantum End-to-End Encryption [0.0] 量子コンピューティングは、現在の公開鍵暗号システムに根本的な脅威をもたらす。
従来の暗号プリミティブとポスト量子暗号プリミティブを組み合わせたハイブリッドエンドツーエンド暗号システムを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:17:24 GMT)
Neural Collision Detection for Multi-arm Laparoscopy Surgical Robots Through Learning-from-Simulation [0.0] 本研究では,腹腔鏡下手術におけるロボットアームの安全性と操作効率を高めるための統合的枠組みを提案する。
関節構成に基づいてロボットアーム間の最小距離を推定する解析モデルを開発した。
深部ニューラルネットワークモデルは、ロボットアームの関節アクチュエータと相対位置を入力としてトレーニングされ、平均絶対誤差は282.2mm、R二乗値は0.85である。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:54:35 GMT)
Multipartite entanglement in the quantum tetrahedron [0.0] 絡み合いは、複雑な方法でコヒーレントなインターツウィナーの幾何学的データに依存することを示す。
また、絡み合いは複雑な方法でコヒーレント・インターツウィナーの幾何学的データに依存する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:08:02 GMT)
Moving Beyond Compliance in Soft-Robotic Catheters Through Modularity for Precision Therapies [0.0] 柔らかいロボット機器は、硬い道具よりも繊細で丈夫な解剖学を安全にナビゲートできる。
センシングモジュールや治療モジュールはほとんどなく、コンパクトで頑丈で、光内手術中に微妙な生理的手がかりを計測し、反応するのに十分な適応性がある。
安全な内膜ナビゲーションに必要なコンプライアンスを維持しつつ, センサ, アクティベーション, セラピーを統合した直径1.47mmのモジュール型ソフトロボットカテーテルを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:11:59 GMT)
Mixture-of-Experts Models in Vision: Routing, Optimization, and Generalization [0.0] 画像分類設定におけるMoEの挙動について検討し、予測性能、専門家の活用、一般化に着目した。
我々は、CIFAR10データセット上の密度、SoftMoE、SparseMoE分類器を、同等のモデルキャパシティで比較する。
どちらのMoE変種も、正規化によるバランスの取れた専門家の利用を維持しながら、密度の高いベースラインよりもわずかに高い検証精度を達成する。
DenseとSparseMoEは、全てのモデルが同等の一般化性能を達成しているにもかかわらず、同様の曲率状態にあるのに対して、SoftMoEはこれらの指標によってよりシャープさを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:22:25 GMT)
Learning to Explain: Supervised Token Attribution from Transformer Attention Patterns [0.0] 我々は、トランスフォーマーの注意パターンからトークンレベルの重要度スコアへの明示的なマッピングを学習する軽量ニューラルネットワークであるExpplanation Network(ExpNet)を紹介する。
我々はExpNetを挑戦的なクロスタスク設定で評価し、モデルに依存しない幅広い手法と注意に基づく手法に対してベンチマークする。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:35:20 GMT)
Lattice: A Confidence-Gated Hybrid System for Uncertainty-Aware Sequential Prediction with Behavioral Archetypes [0.0] 本稿では,二項信頼ゲーティングを用いた学習行動構造を条件付きで活性化する逐次予測システムLatticeを紹介する。
我々はLSTMとトランスフォーマーバックボーンを用いて、レコメンデーションシステム(MovieLens)、科学時系列(LIGO)、金融市場についてLatticeを検証する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:37:57 GMT)
Kerr-enhanced amplification of three-wave mixing and emergent masing regimes [0.0] 2次((2)$)または3次((3)$)非線形性を利用する集積光マイクロ共振器は、周波数変換、低ノイズマイクロ波フォトニクス、量子エンタングルメント生成の鍵となるプラットフォームとなっている。
電気光学マイクロ共振器におけるKerr-enhanced 3波混合増幅の解析理論について,(2)$と(3)$$の非線形性について述べる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:32:43 GMT)
Just aware enough: Evaluating awareness across artificial systems [0.0] 私たちは、AI意識よりも生産的で方法論的に学習可能な代替手段を、意識が提供してくれると論じています。
多様なシステムにまたがって意識を評価するための実践的手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:39:35 GMT)
Interoperable Architecture for Digital Identity Delegation for AI Agents with Blockchain Integration [0.0] 不均一なアイデンティティエコシステムをまたいだ、境界付き、監査可能、最小限のデリゲートを可能にする統一的なフレームワークを導入する。
このフレームワークには4つの重要な要素が含まれている。デリゲーション・グラント(DG)、強制範囲の縮小を伴う権限の無効化をエンコードする第一級の認可アーティファクト。
また、信頼のアンカー、クレデンシャルと証明のバリデーション、ポリシー評価、Trust Gateway経由のプロトコル仲介を分離する階層化された参照アーキテクチャも含まれている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:29:23 GMT)
Influence of Normative Theories of Ethics on the European Union Artificial Intelligence Act: A Transformer-Based Analysis Using Semantic Textual Similarity [0.0] 本研究は、EU AI法における倫理の3つの主要な規範的理論の影響を検討することを目的としている。
本稿では、理論と法との関係を検討するために、哲学的・時間的分析によって確認された影響の概念を紹介する。
意図的かつ運用上の倫理的整合性を捉えるために、この法律はプリアンブルと法定条項の2つの部分に分割された。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 08:14:18 GMT)
Impossible Counterfactuals, Discrete Hilbert Space and Bell's Theorem [0.0] 量子物理学の局所モデルの開発(Rational Mechanics - RaQM)
RaQM では、ヒルベルト状態は二乗振幅および/または複素位相が不合理数である基底において未定義である。
ベルの不等式違反は、歴史的に関連づけられた奇妙な過程のどれにおいても理解できないと結論づけられた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 12:36:29 GMT)
Hybrid Vision Transformer_GAN Attribute Neutralizer for Mitigating Bias in Chest X_Ray Diagnosis [0.0] データ効率のよいイメージトランスフォーマー・スモール(DeiT-S)をChestX-ray14データセットでトレーニングした。
適度な編集レベル(alpha = 0.5)では、視覚変換器(ViT)は、曲線(AUC)の下の患者性認知領域を約0.80に減らし、元のフレームワークの畳み込みU-Netエンコーダより約10パーセント低い。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:43:19 GMT)
Finite de Finetti for convex bodies and Polynomial Optimization [0.0] 一般凸体に対する有限デ・フィネッティ表現定理を証明する。
我々の戦略は、量子論から任意の凸体への定量的な一夫一婦制の議論を一般化する。
アプリケーションとして、最適化問題として2人プレイヤ非ローカルゲームの最適GPT値を示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:04:13 GMT)
Filtered 2D Contour-Based Reconstruction of 3D STL Model from CT-DICOM Images [0.0] 分割CT画像から2次元輪郭データポイントを抽出し、3次元STLモデルを構築する。
各画像のフィルタされた2次元輪郭点を3次元STLモデルを再構成するために、デラウネートし、層間結合する。
骨分節骨のROIの2次元輪郭データポイントから構築した3次元STLモデルについて述べる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:56:43 GMT)
Exploring Quantumness at Long-Baseline Neutrino Experiments [0.0] 古典性の違反は、異なるタイミングでシステム上で行われた測定によって調査することができる。
本研究では,古典的および量子的挙動を表す分布を扱う,より完全でデータ駆動型のフレームワークを開発する。
我々は、MINOS、T2K、NOvA、および今後のDUNEを考察し、古典的なシナリオと量子的振る舞いを区別するための統計的意義を示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 19:00:01 GMT)
Constructing Multi-label Hierarchical Classification Models for MITRE ATT&CK Text Tagging [0.0] 我々は、MITRE ATT&CKテキストタグタスクの「タスクスペース」の特徴付けを行う。
テキストタギングタスクのための多ラベル階層分類モデルを構築した。
私たちのモデルは、古典的な機械学習手法にのみ依存しながら、最先端のパフォーマンスを満たしたり、超えたりします。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 00:41:34 GMT)
Consistency of Honest Decision Trees and Random Forests [0.0] 本研究は,レグレッション・セッティングにおける優良な決定木と無作為な森林の整合性について検討する。
正直な木と正直な森の平均を真回帰関数に弱くほぼ確実に収束させる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:40:36 GMT)
Comment on "Electrostatics-induced breakdown of the integer quantum Hall effect in cavity QED'' [0.0] We comment on the preprint arXiv:2511.04744 by Andolina et al.
We comment on the preprint arXiv:2511.04744 by Andolina et al.
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:23:50 GMT)
Combatting noise in near-term quantum data centres [0.0] 我々は,3ビット繰り返し符号と[4, 1, 2]のLung-Nielsen-Chuang-yamamoto符号を用いて,遠隔ゲートにおける量子誤り検出の効果と従来のエンタングルメント蒸留法との比較を行った。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 10:23:50 GMT)
Circadian Modulation of Semantic Exploration in Social Media Language [0.0] 大規模なRedditデータを用いて、言語使用の日時変化を定量化する。
季節的な光刺激によって訓練できる、頑健な概日リズムを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:31:44 GMT)
Chunking, Retrieval, and Re-ranking: An Empirical Evaluation of RAG Architectures for Policy Document Question Answering [0.0] 大規模言語モデル(LLM)の公衆衛生政策分野への統合は、疾病管理予防センター(CDC)などの機関が管理する規制ガイダンスの膨大なリポジトリをナビゲートするための変革的なアプローチを提供する。
LLMが幻覚を発生させることの正当性は、情報整合性が不可能なハイテイク環境において、これらの技術を採用する上で重要な障壁となる。
この経験的評価は、信頼できる文書コンテキストにおける生成出力を基盤として、これらのリスクを軽減するために、検索型拡張生成(RAG)アーキテクチャの有効性を探求するものである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 20:52:48 GMT)
Cavity-QED tools for MBQC with optical binomial-codes [0.0] 計測ベースの量子計算(MBQC)は、フォトニック量子コンピューティングにおいて有望なパラダイムを提供する。
我々の研究は、既存の光学原子空洞アーキテクチャが量子計算に利用するための基礎となる最初のステップを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:17:17 GMT)
ButterflyMoE: Sub-Linear Ternary Experts via Structured Butterfly Orbits [0.0] 量子化、プルーニング、低ランク因数分解といった現在の圧縮手法は定数因子を減少させるが、スケーリングのボトルネックは未解決のままである。
独立質量行列ではなく、統一量子化基板の幾何学的配向として専門家を扱う手法であるButterflyMoEを紹介する。
言語モデリングのベンチマーク全体で、ButterflyMoEは256のエキスパートで150$times$のメモリ削減を達成した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:34:28 GMT)
BirdsEye-RU: A Dataset For Detecting Faces from Overhead Images [0.0] BirdsEye-RUデータセットは、8万以上の注釈付き顔を含む2,978枚の画像の集合である。
このデータセットは、様々な環境にまたがる、小さくて離れた顔を捉えるように設計されている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 03:24:02 GMT)
Bidirectional teleportation using scrambling dynamics: a practical protocol [0.0] 量子情報のスクランブルにより、普遍的な局所制御のないシステムにおいて、集合的な自由度間のSWAPゲートが実現可能であることを示す。
我々のプロトコルは、ブラックホール情報パラドックスに付随するヘイデン・プレスキル・リカバリ方式と量子テレポーテーションを組み合わせ、それらを並列かつ反対方向に実行する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:39:47 GMT)
Beyond the Geometric Curse: High-Dimensional N-Gram Hashing for Dense Retrieval [0.0] NUMENは、学習プロセスを削除することで、次元ボトルネックを破る。
LIMITベンチマークでは、NUMENは93.90%のRecall@100を32,768次元で達成している。
これにより、BM25ベースライン93.6%を公式に超えた最初の密集した検索モデルとなった。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:26:55 GMT)
Benchmarking Large Language Models for ABAP Code Generation: An Empirical Study on Iterative Improvement by Compiler Feedback [0.0] 本研究では,ABAPコード生成におけるLarge Language Models(LLM)の性能について検討する。
本研究の目的は,様々なLLMが統語的正確かつ機能的なABAPコードを生成する程度を経験的に分析することである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:06:41 GMT)
Bangla Music Genre Classification Using Bidirectional LSTMS [0.0] 本研究では,Mel-Frequency Cepstral Coefficients (MFCCs)を用いて生音声波形をコンパクトかつ代表的な特徴セットに変換する。
実験の結果、分類精度は78%であり、バングラ音楽ジャンルの組織を強化し合理化するためのシステムの可能性を示している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:25:44 GMT)
Automated univariate time series forecasting with regression trees [0.0] 対処すべき重要な側面は、自己回帰的アプローチの使用、自己回帰的特徴の選択方法、トレンドシリーズへの対処方法、季節的行動への対処方法である。
実験結果から,指数的滑らか化やARIMAなどの統計モデルに匹敵する予測精度が得られた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 09:55:15 GMT)
Assessing the informative value of macroeconomic indicators for public health forecasting [0.0] 選択されたマクロ経済指標が、いくつかのキャパシティ関連公衆衛生目標に対する予測情報を含むかどうかを検討する。
マクロ経済指標は、一部の公衆衛生目標に対して一貫した再現可能な予測信号を提供する。
これらの結果は、マクロ経済指標がデジタル公衆衛生モニタリングに有用な上流シグナルとして役立つことを示唆している。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 22:54:49 GMT)
An LLM Agent-based Framework for Whaling Countermeasures [0.0] 捕鯨 (Whaling) は、社会工学の一形態であり、組織内の重要な権威を持つ個人をターゲットにしている。
本研究では,大学教員を対象とした捕鯨対策の枠組みを提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:43:42 GMT)
An Agentic Operationalization of DISARM for FIMI Investigation on Social Media [0.0] 外部情報操作・干渉(FIMI)と関連するハイブリッド活動は,様々な社会次元と情報圏にわたって行われる。
AIの最近の進歩は、AI強化されたトロルと干渉活動のコストの低下につながっている。
ソーシャルメディア上でFIMIを調査するためのフレームワークに依存しないdisARMの運用手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:50:13 GMT)
Algorithmic Identity Based on Metaparameters: A Path to Reliability, Auditability, and Traceability [0.0] アルゴリズムの利用は、医療、司法、財務、教育など、さまざまな分野にわたって増加している。
本稿では,Digital Object Identifier (DOI) によるアルゴリズムの同定の可能性について検討する。
DOIの使用は、アルゴリズムの起源の追跡を促進し、監査を可能にし、バイアスを防止し、研究を促進し、倫理的考察を強化する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 07:35:14 GMT)
Agentic AI for Commercial Insurance Underwriting with Adversarial Self-Critique [0.0] 本研究は, 対向的自己批判機構を組み込んだ意思決定陰性, ループ内エージェントシステムを提案する。
このシステム内では、批評家エージェントが、人間レビュアーに勧告を提出する前に、主エージェントの結論に異議を唱える。
この研究は、決定陰性エージェントによる潜在的なエラーを特徴付けるために、障害モードの正式な分類法を開発する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:51:27 GMT)
Agent Identity URI Scheme: Topology-Independent Naming and Capability-Based Discovery for Multi-Agent Systems [0.0] マルチエージェントシステムは基本的なアーキテクチャ上の欠陥に直面している。
我々は、トポロジから3つのコンポーネントを通してアイデンティティを分離する Agent:// scheme を提案する。
組織権限を確立する信頼根、階層的な能力パス、ソート可能なユニークな識別子は安定した参照を提供する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 01:09:22 GMT)
AdaTIR: Adaptive Tool-Integrated Reasoning via Difficulty-Aware Policy Optimization [0.0] 現在のエージェントは認知的オフロードを示し、単純なタスクであっても外部ツールを冗長に呼び出す。
本稿では,静的ツール呼び出しから内部化の難易度を考慮した推論へパラダイムをシフトするフレームワークを提案する。
AdaTIRは、ツールアクセスが厳格に無効化されている場合でも、AIME 2024のベースラインを4.8%上回る推論を成功させる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 06:18:46 GMT)
AI, Metacognition, and the Verification Bottleneck: A Three-Wave Longitudinal Study of Human Problem-Solving [0.0] このパイロット研究は、AIが学術的な環境での6ヶ月にわたる問題解決にどのように影響するかを追跡した。
結果は、主にアーリーアドプター、学術関連集団に一般化される。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 15:49:04 GMT)
AI Optimized Routing and Resource Allocation for Quantum Enabled Non Terrestrial Industrial Networks [0.0] 産業4と5の産業変革は、安全でエネルギー効率の良い接続を必要とするサイバー物理生産システムをもたらす。
量子鍵分配QKDによって実現された量子通信技術と絡み合い支援リンクは、高い保証セキュリティと同期の可能性を秘めている。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 14:11:27 GMT)
A nearly linear-time Decoded Quantum Interferometry algorithm for the Optimal Polynomial Intersection problem [0.0] 最近、JordanらはDecoded Quantum Interferometry (DQI)と呼ばれる新しい量子アルゴリズム技術を導入した。
彼らは、OPI (Optimal Polynomial Intersection) と呼ばれる制約条件問題を提示し、時間内で動作するDQIアルゴリズムが、既知のどの古典的アルゴリズムよりも大きな制約を満足できることを示した。
これらの改善によって,OPI問題に対するほぼ線形時間DQIアルゴリズムがもたらされることを示す。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 16:48:05 GMT)
A framework to evaluate the performance of Variational Quantum Algorithms [0.0] 変分量子アルゴリズム(VQA)はノイズ量子デバイスにおける最適化問題を解くための有望な手法である。
VQAのベンチマークは、その振る舞いと標準化されたパフォーマンス基準の欠如のために難しい。
本研究は、擬似非制約二項最適化問題に適用されるVQAを評価するための一般的なフレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 13:15:57 GMT)
A comprehensive overview of deep learning models for object detection from videos/images [0.0] ビデオおよび画像監視における物体検出は、近年のディープラーニングの進歩の影響を受けつつも、十分に確立されている。
本稿では, アーキテクチャの革新, 生成モデルの統合, 強靭性と精度を高めるための時間情報の利用について検討する。
第一の目的は、ディープラーニングモデルとその実践的応用を分析しながら、セマンティックオブジェクト検出の現在の有効性を評価することである。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 05:50:21 GMT)
A Universal Large Language Model -- Drone Command and Control Interface [0.0] 我々は,MavlinkプロトコルをサポートするMPPサーバをホストするクラウドベースのLinuxマシンを開発し,デプロイする。
実際の無人航空機の飛行制御を実証する。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 21:37:54 GMT)
A Prompt-Based Framework for Loop Vulnerability Detection Using Local LLMs [0.0] 本研究では,Python 3.7以上のコード中のループ脆弱性を検出するためのプロンプトベースのフレームワークを提案する。
このフレームワークは、制御とロジックのエラー、ループ内のセキュリティリスク、リソース管理の非効率といった、ループ関連の問題の3つのカテゴリをターゲットにしている。
設計されたプロンプトベースのフレームワークには、言語固有の認識、コード認識の接地、バージョン感度、幻覚予防といった重要な保護機能が含まれていた。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 04:53:38 GMT)
A Machine Vision Approach to Preliminary Skin Lesion Assessments [0.0] 本研究は,皮膚内視鏡のABCD規則と機械学習の分類を併用した皮膚病変予備評価システムについて検討した。
ストクラッチからトレーニングされたカスタム3層畳み込みニューラルネットワーク(CNN)は78.5%の精度と86.5%のリコールを達成した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 23:48:59 GMT)
A Lightweight LLM Framework for Disaster Humanitarian Information Classification [0.0] 本稿では,パラメータ効率の良い微調整を用いた災害時ツイート分類のための軽量で費用対効果の高いフレームワークを開発する。
我々はHumAIDデータセットの統合と正規化により統一された実験コーパスを構築する。
我々は、LoRAが79.62%の人道的分類精度(+37.79%以上のゼロショット)を達成する一方で、パラメータの2%しか訓練していないことを示した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 02:05:25 GMT)
A Constraint Programming Model for the Super-Agile Earth Observation Satellite Imaging Scheduling Problem [0.0] 地球観測衛星は、前例のない画像の柔軟性を提供する。
従来のアジャイル衛星の既存のアプローチは、様々な観測期間と複数の撮像方向を考慮していない。
本研究は,SAEOS-ISPにおける制約プログラミングの正確な定式化について述べる。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 11:41:29 GMT)
A Computer Vision Hybrid Approach: CNN and Transformer Models for Accurate Alzheimer's Detection from Brain MRI Scans [0.0] CNNアーキテクチャは強い性能を保ち、ResNet50は98.83%の精度を達成した。
トランスフォーマーモデルは競争上の一般化能力を示し、ViTは95.38%で最高精度を達成した。
提案したEvan_V2ハイブリッドモデルは、10のCNNとTransformerアーキテクチャの出力を機能レベルの融合によって統合し、99.99%の精度、0.9989 F1スコア、ROC AUCで最高のパフォーマンスを実現した。
論文参考訳(メタデータ) (Wed, 21 Jan 2026 17:19:18 GMT)