DreamVAR: Taming Reinforced Visual Autoregressive Model for High-Fidelity Subject-Driven Image Generation [108.7] 本稿では,視覚的自己回帰モデルに基づく主観的画像合成のための新しいフレームワークを提案する。
本研究では,Dreamtheが従来の拡散法よりも優れた外観保存を実現していることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:32:29 GMT)
Is Softmax Loss All You Need? A Principled Analysis of Softmax-family Loss [91.6] ソフトマックスの損失は、分類とランキングのタスクにおいて最も広く使用されるサロゲートの目標の1つである。
本研究では,異なるサロゲートが分類とランキングの指標との整合性を達成するかどうかを考察し,それらの勾配ダイナミクスを分析して,異なる収束挙動を明らかにする。
本研究は,大規模機械学習アプリケーションにおける損失選択の実践的ガイダンスとして,原則的基礎を確立した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:24:52 GMT)
Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text [90.2] Golden Gooseは、未検証のインターネットテキストから無制限のRLVRタスクを合成するトリックだ。
大規模なRLVRデータセットであるGoseReason-0.7Mを合成するために、推論に富んだ検証不可能なコーパスを利用する。
また、Golden Gooseを現実の環境で展開し、サイバーセキュリティドメイン用の生のFinWebスクラップからRLVRタスクを合成します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:39:11 GMT)
Residual Context Diffusion Language Models [90.1] Residual Context Diffusion (RCD) は、捨てられたトークン表現をコンテキスト残留に変換し、次のデノイングステップでそれらを注入するモジュールである。
RCDは、最小限の計算オーバーヘッドで、5-10ポイントの精度でフロンティアdLLMを一貫して改善する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:16:32 GMT)
A Unified View of Attention and Residual Sinks: Outlier-Driven Rescaling is Essential for Transformer Training [86.6] 外接線は正規化と共に機能する。
アウトリーチは、コントリビュータではなく、再スケール要因として役立ちます。
外乱は学習可能なパラメータに吸収されるか、明示的なゲート再スケーリングによって緩和される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:29:45 GMT)
Are you going to finish that? A Practical Study of the Tokenization Boundary Problem [85.5] 言語モデル(LM)はトークンのシーケンスによって訓練されるが、ユーザはテキストを介してLMと対話する。
このミスマッチは、ユーザーが期待する次のトークンの途中でプロンプトを終了したときに発生する部分トークン問題を引き起こす。
この研究では、トークンと"ワード"境界がしばしば並んでいない3つのドメインを特定します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:47:16 GMT)
TSAQA: Time Series Analysis Question And Answering Benchmark [85.4] 時系列データは、金融、医療、交通、環境科学といった分野における重要な応用に不可欠である。
TSAQAはタスクカバレッジを拡大し、多様な時間的分析能力を評価するために設計された新しい統合ベンチマークである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:28:56 GMT)
Large Language Model Agents Are Not Always Faithful Self-Evolvers [84.1] 自己進化型大規模言語モデル(LLM)エージェントは、過去の経験を蓄積し再利用することによって継続的に改善される。
本稿では,経験の忠実さ,エージェントの判断が与えられた経験に因果的依存を初めて体系的に調査する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:05:15 GMT)
Demystifying Design Choices of Reinforcement Fine-tuning: A Batched Contextual Bandit Learning Perspective [83.8] 本稿では,学習と一般化のダイナミクスにおける設計選択の役割を浮き彫りにすることを目的とする。
根本的な課題は、設計選択が絡み合っており、学習や一般化への貢献が難しいことだ。
3つのベースモデルと2つのデータセットの実験は、学習と一般化ダイナミクスにおける様々な設計選択の役割に関する新たな理解を明らかにしている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:09:06 GMT)
GUDA: Counterfactual Group-wise Training Data Attribution for Diffusion Models via Unlearning [83.6] モデルがトレーニングを欠席した場合、モデルが生成したサンプルの変化に対してどのように振る舞うか?
拡散モデルに対してGUDA(Group Unlearning-based Data Attribution)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:10:59 GMT)
Reducing Class-Wise Performance Disparity via Margin Regularization [82.8] ディープニューラルネットワークは、クラスバランスのデータでトレーニングされた場合でも、クラスレベルでの精度において大きな違いを示すことが多い。
本稿では,性能格差低減のためのMargin Regularization for Performance Disparity Reduction (MR$2$)を提案する。
分析の結果,クラスごとの機能変動がエラーにどのように寄与するかが明らかとなり,ハードクラスに対するより大きなマージンの利用が動機となった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:56:08 GMT)
AI Decodes Historical Chinese Archives to Reveal Lost Climate History [82.5] 我々は、記録された出来事に関連する定量的な気候パターンを推定することにより、歴史的年代記者の論理を逆転する生成的AIフレームワークを導入する。
古代中国の古文書に当てはまると、1368年~1911年の間、中国南東部の年間降水量の半減期を再現する。
我々の再建は、明の大干ばつのような象徴的な極端を定量化するだけでなく、5世紀にわたってこの地域の降水量に対するエルニドルオの影響の空間的・季節的構造を地図化しています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:06:13 GMT)
From Abstract to Contextual: What LLMs Still Cannot Do in Mathematics [79.8] 我々は文脈的数学的推論を通してギャップを研究する。
AIMEとMATH-500の問題を2つのコンテキスト設定に再利用するベンチマークであるContextMATHを紹介する。
オープンソースモデルはSGとCSで13、34ポイント減少し、プロプライエタリモデルは13、20ポイント減少している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:56:04 GMT)
AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts [78.3] 我々は、横方向思考パズルに基づく環境ロールアウトによるエージェントの評価を行うtextbfAgentLongBenchを紹介した。
このフレームワークは、知識集約的で知識のないシナリオにまたがる厳密な相互作用の軌跡を生成する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:18:17 GMT)
HeaPA: Difficulty-Aware Heap Sampling and On-Policy Query Augmentation for LLM Reinforcement Learning [78.1] HeaPAは精度を継続的に改善し、少ない計算で目標性能に達する。
分析の結果、これらの上昇はフロンティアに焦点を当てたサンプリングとオン政治プールの成長によるものであることが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:31:17 GMT)
Prompt Optimization Via Diffusion Language Models [74.0] 本稿では,迅速な最適化のための拡散型フレームワークを提案する。
本手法は,下流言語モデルへのアクセスや変更を必要とせずに,フレキシブルかつスパンレベルのプロンプト更新を可能にする。
適度な拡散ステップ数によって、精製品質と安定性のバランスが良くなることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:00:54 GMT)
Autonomous Chain-of-Thought Distillation for Graph-Based Fraud Detection [73.9] テキスト分散グラフ(TAG)上のグラフベースの不正検出には、リッチテキストセマンティクスとリレーショナル依存関係を共同でモデル化する必要がある。
我々は,自律型グラフ認識チェーン(CoT)推論とスケーラブルなLLM-GNN協調学習を通じて,TAGに基づく不正検出を促進する統一フレームワークであるFraudCoTを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:12:12 GMT)
Decoupled Diffusion Sampling for Inverse Problems on Function Spaces [73.5] 既存のプラグ・アンド・プレイ拡散後サンプリングは係数ジョイント・ソリューション・モデリングを通じて物理を暗黙的に表現する。
逆PDE問題に対する関数空間における物理認識型生成フレームワークを提案する。
我々の解答拡散逆ソルバー(DDIS)は、非条件拡散が事前に係数を学習し、ニューラル演算子はガイダンスのためにフォワードPDEを明示的にモデル化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:54:49 GMT)
EvoClinician: A Self-Evolving Agent for Multi-Turn Medical Diagnosis via Test-Time Evolutionary Learning [72.7] エージェントのマルチターン診断能力を評価するためのベンチマークであるMed-Inquireを提案する。
次に、テスト時に効率的な診断戦略を学ぶ自己進化エージェントであるEvoClinicianを紹介する。
実験の結果,EvoClinicianは連続学習ベースラインや,メモリエージェントなどの自己進化エージェントよりも優れていた。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:26:18 GMT)
Character as a Latent Variable in Large Language Models: A Mechanistic Account of Emergent Misalignment and Conditional Safety Failures [70.5] 創発的ミスアライメント(英: Emergent Misalignment)とは、狭い範囲のデータに対する微調整された大きな言語モデルによって、広範囲に不整合な振る舞いが引き起こされる障害モードを指す。
複数のドメインやモデルファミリにまたがって、特定の文字レベルの配置を示すデータの微調整モデルは、誤操作よりもはるかに強く、転送可能な微調整を誘導する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:28:42 GMT)
Segment Any Events with Language [68.1] これは、Open-Vocabulary Event Instance (OV-EIS)に対処する最初のセマンティック対応のAny Eventsフレームワークです。
視覚的プロンプトを前提として,本モデルでは,セグメンテーションイベントとオープンボキャブラリマスクの分類を,複数レベルの粒度でサポートする統一フレームワークを提案する。
我々のSEALは、パラメータ効率のよいアーキテクチャで性能と推論速度の点で提案されたベースラインよりも大きく優れています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:42:56 GMT)
From Observations to States: Latent Time Series Forecasting [66.0] 本稿では,TSFを観測回帰から潜時予測に移行する新しいパラダイムであるLatent Time Series Forecasting(LatentTSF)を提案する。
具体的には、LatentTSFはAutoEncoderを使用して、各段階での観測結果を高次元の潜在状態空間に投影する。
提案する潜伏目標は,予測潜伏状態と地道状態と観測値との相互情報を暗黙的に最大化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:39:44 GMT)
Guided by Trajectories: Repairing and Rewarding Tool-Use Trajectories for Tool-Integrated Reasoning [65.1] AutoTrajはツール使用トラジェクトリの修復と報酬によってTIRを自動的に学習するフレームワークである。
実世界のベンチマークの実験では、AutoTrajの有効性が示されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:42:04 GMT)
From Gameplay Traces to Game Mechanics: Causal Induction with Large Language Models [64.4] 本稿では,観測データから法則を推定できる因果誘導について検討する。
本稿では,VGDL生成に対する2つのアプローチを比較する。観測からの直接コード生成と,まず構造因果モデル(SCM)を推定し,次にVGDLに変換する2段階法である。
その結果,SCMに基づくアプローチは,直接生成よりも基礎的真実に近いVGDL記述を多く生み出すことがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:48:23 GMT)
TriSpec: Ternary Speculative Decoding via Lightweight Proxy Verification [63.7] 投機的復号化は、その軽量なドラフトと並列検証機構を通じて、大幅なスピードアップを提供する。
計算コストを大幅に削減する軽量なプロキシを新たに導入した3次SDフレームワークであるTriSpecを提案する。
Qwen3およびDeepSeek-R1-Distill-Qwen/LLaMAファミリーの実験は、TriSpecが標準SDよりも最大35%のスピードアップを達成したことを示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:04:18 GMT)
EAG-PT: Emission-Aware Gaussians and Path Tracing for Indoor Scene Reconstruction and Editing [63.6] 本研究では,2次元ガウス表現を統一した物理的光輸送を目的としたElectron-Aware Gaussian and Path Tracing (EAG-PT)を提案する。
本設計は,(1)再構成メッシュを回避する統一的なシーン表現と移動に適した幾何プロキシとして2次元ガウシアンを用い,(2)さらなるシーン編集のために再構成中の許容成分と非許容成分を明示的に分離し,(3)効率的なシングルバウンス最適化と高品質なマルチバウンスパストレースを用いて最終レンダリングから再構成を分離する,という3つのコアに基づいている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:16:37 GMT)
YuriiFormer: A Suite of Nesterov-Accelerated Transformers [62.4] 本稿では,トークン埋め込みに作用する最適化アルゴリズムの繰り返しとして,トランスフォーマー層を解釈する変分フレームワークを提案する。
この観点では、自己注意は相互作用エネルギーの勾配ステップを実装し、層はポテンシャルエネルギーの勾配更新に対応する。
標準のGPT型変圧器は、この2つのエネルギーの間でLie-Trotterスプリッティングによって実装された複合目的物のバニラ勾配降下として出現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:06:21 GMT)
THINKSAFE: Self-Generated Safety Alignment for Reasoning Models [60.1] 外部の教師がいなくても安心して安心できるフレームワークであるThinkSafeを提案する。
我々の重要な洞察は、コンプライアンスは安全メカニズムを抑制するが、モデルはしばしば害を特定するために潜伏した知識を保持することである。
DeepSeek-R1-DistillとQwen3の実験では、ThinkSafeは推論能力を維持しながら安全性を大幅に向上している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:31:02 GMT)
RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.3] LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。
我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:29:01 GMT)
DIFFA-2: A Practical Diffusion Large Language Model for General Audio Understanding [58.3] 一般音声理解のための実用的な拡散型LALMであるDIFFA-2を紹介する。
DIFFA-2は音声エンコーダをアップグレードし、デュアルセマンティックとアコースティックのアダプタを採用し、4段階のカリキュラムで訓練されている。
MMSU、MMAU、MMARの実験では、DIFFA-2はDIFFAよりも一貫して改善されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:44:23 GMT)
PaperBanana: Automating Academic Illustration for AI Scientists [58.1] PaperBananaは、出版可能な学術イラストの自動生成のためのエージェントフレームワークである。
最先端のVLMと画像生成モデルによって駆動されるPaperBananaは、参照を検索し、コンテンツとスタイルを計画し、画像をレンダリングし、自己批判を通じて反復的に洗練する特別エージェントを編成する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:33:37 GMT)
A Step Back: Prefix Importance Ratio Stabilizes Policy Optimization [58.1] 強化学習のポストトレーニングは、大きな言語モデルにおける推論の振る舞いを引き出すことができる。
トークンレベルの補正は、オフポリシーネスの度合いが大きい場合、不安定なトレーニングダイナミクスにつながることが多い。
我々は,最小固定率 (MinPRO) を簡易かつ効果的に提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:47:19 GMT)
CVeDRL: An Efficient Code Verifier via Difficulty-aware Reinforcement Learning [57.2] コード検証は、LLMベースのコード生成の検証後において重要な役割を果たす。
既存の教師付き微調整手法は、データの不足、高い失敗率、推論効率の低下に悩まされている。
機能的な報酬しか持たない単純RLは、難しいブランチやサンプルに対して効果的な単体テストを生成することができないことを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:33:29 GMT)
When Meanings Meet: Investigating the Emergence and Quality of Shared Concept Spaces during Multilingual Language Model Training [57.2] 本研究では,EuroLLMの事前学習における言語に依存しない概念空間の開発について検討する。
共有概念空間は早期に出現し、洗練され続けていますが、それらとの整合性は言語に依存しています。
従来の作業とは対照的に、細かな手作業分析により、翻訳品質の顕著な向上は、行動の変化を反映していることが判明した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:23:01 GMT)
World-Shaper: A Unified Framework for 360° Panoramic Editing [57.2] 既存の視点に基づく画像編集手法ではパノラマの空間構造をモデル化できない。
一つの編集中心の設計にパノラマ生成と編集をブリッジする統合幾何認識フレームワークであるWorld-Shaperを提案する。
本手法はSOTA法と比較して, 幾何的整合性, 編集精度, テキスト制御性に優れる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:38:54 GMT)
LINA: Linear Autoregressive Image Generative Models with Continuous Tokens [56.8] 連続トークンを持つ自己回帰モデルは、特にテキスト・トゥ・イメージ(T2I)合成において、視覚生成に有望なパラダイムを形成する。
このフレームワーク内での計算効率のよい線形アテンションの設計法について検討する。
LINAは、線形注意に基づくシンプルで計算効率の良いT2Iモデルであり、ユーザ命令から高忠実度1024x1024画像を生成することができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:44:33 GMT)
Position: Agentic Evolution is the Path to Evolving LLMs [56.7] この制限に対処するには、新たなスケーリング軸進化が必要です。
既存の展開時適応手法では、障害を診断し、持続的な改善を生み出すために必要な戦略的機関が欠如している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:15:58 GMT)
EUGens: Efficient, Unified, and General Dense Layers [56.5] 我々は、標準完全連結フィードフォワード層、textbfEfficient、 textbfUnimat、 textbfGeneral dense layer (EUGens) を一般化する新しい階層のクラスを提案する。
EUGensはランダムな特徴を活用して標準的なFFLを近似し、その計算に入力ノルムに直接的な依存を組み込むことによってそれらを超える。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:01:03 GMT)
SPA-Cache: Singular Proxies for Adaptive Caching in Diffusion Language Models [56.5] DLMキャッシュにおける更新識別と予算配分を共同で最適化するSPAキャッシュを提案する。
まず、低次元部分空間における更新臨界トークンの識別を可能にする低次元特異プロキシを導出する。
第2に、生成品質を劣化させることなく、安定したレイヤへの更新を少なくするアダプティブ戦略を導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:22:44 GMT)
StreamSense: Streaming Social Task Detection with Selective Vision-Language Model Routing [56.3] StreamSenseは、軽量なストリーミングエンコーダと、Vision-Language Modelのエキスパートへの選択的ルーティングを結合するストリーミング検出器である。
複数のソーシャルストリーミング検出タスク(感情分類やヘイトコンテンツモデレーションなど)におけるStreamSenseの評価を行う。
以上の結果から,選択的エスカレーションとdeferralは,ストリーミング型ソーシャルタスクの理解に有効なプリミティブであることが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:19:22 GMT)
Rethinking Transferable Adversarial Attacks on Point Clouds from a Compact Subspace Perspective [55.9] CoSAは、共有された低次元セマンティック空間内で機能する転送可能なアタックフレームワークである。
CoSAは、最先端のトランスファー可能な攻撃を一貫して上回っている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:48:11 GMT)
Dispersion Loss Counteracts Embedding Condensation and Improves Generalization in Small Language Models [55.9] 大規模言語モデル(LLM)はパラメータ数の増加によって顕著な性能を達成するが、スケーリングは計算コストの急激な増加を招く。
本研究では,LLMと小型モデルの表現特性を再現することを目的として,LLMと小型モデルの表現特性の相違について検討する。
我々は、 $textttGPT2$ や $textttQwen3-0.6B$ のような小さなモデルは、深刻な凝縮を示し、 $textttGPT2-xl$ や $textttQwen3-32B のような大きなモデルは、
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:07:03 GMT)
Unsupervised Synthetic Image Attribution: Alignment and Disentanglement [55.9] そこで我々は,アライメント・アンド・ディスタングルメント(Alignment and Disentanglement)という,シンプルで効果的な教師なしの手法を提案する。
具体的には、コントラッシブな自己教師あり学習を用いて基本的な概念アライメントを実行することから始める。
次に、Infomax損失による表現のゆがみを促進することにより、モデルの属性能力を高める。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:31:53 GMT)
PlatoLTL: Learning to Generalize Across Symbols in LTL Instructions for Multi-Task RL [55.6] 線形時間論理(LTL)は、構造的、時間的に拡張されたタスクをRLエージェントに指定するための強力な形式である。
ここでは, ゼロショットのポリシーを公式構造にまたがるだけでなく, 命題にまたがってパラメトリックに一般化できる新しいアプローチであるPlatoLTLを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:11:55 GMT)
SpanNorm: Reconciling Training Stability and Performance in Deep Transformers [55.1] 両パラダイムの強度を統合することでジレンマを解消する新しい手法であるSpanNormを提案する。
我々は、SpanNormと原則付きスケーリング戦略を組み合わせることで、ネットワーク全体にわたって有界信号のばらつきを維持できることを理論的に示す。
経験的に、SpanNormは、密集および混成実験(Mixture-of-Experts、MoE)のシナリオにおいて、標準正規化スキームを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:21:57 GMT)
Variational Bayesian Flow Network for Graph Generation [54.9] グラフ生成のための変分ベイズフローネットワーク(VBFN)を提案する。
VBFNは、構造化精度で支配されるトラクタブルジョイントガウス変分信念ファミリーに対して変分リフトを行う。
合成グラフと分子グラフのデータセットでは、VBFNは忠実度と多様性を改善し、ベースライン法を超えている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:59:38 GMT)
AsyncMesh: Fully Asynchronous Optimization for Data and Pipeline Parallelism [54.8] 両方の並列処理軸をまたいだ非同期更新を導入し、コロケーション要求を緩和します。
スパース平均化と非同期更新の両方に対して収束保証を提供します。
大規模言語モデルを用いた実験により,本手法が完全同期ベースラインの性能と一致することを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:24:47 GMT)
MEnvAgent: Scalable Polyglot Environment Construction for Verifiable Software Engineering [54.2] 本稿では,自動環境構築のためのフレームワークであるMEnvAgentを紹介する。
MEnvAgentは、建設失敗を自律的に解決するマルチエージェント計画実行検証アーキテクチャを採用している。
MEnvData-SWEは,これまでで最大の,現実的な検証可能なDocker環境のポリグロットデータセットである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:36:10 GMT)
Lingua-SafetyBench: A Benchmark for Safety Evaluation of Multilingual Vision-Language Models [54.1] 既存のベンチマークは、典型的にはマルチリンガルだがテキストのみ、あるいはマルチモーダルだがモノリンガルである。
近年の多言語的赤チームの取り組みは、画像に有害なプロンプトを与えるが、タイポグラフィースタイルの視覚に強く依存している。
10言語にまたがる100,440の有害な画像テキストペアのベンチマークを導入し、明示的に画像支配サブセットとテキスト支配サブセットに分割する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:18:13 GMT)
PerfGuard: A Performance-Aware Agent for Visual Content Generation [53.6] PerfGuardは、ビジュアルコンテンツ生成のためのパフォーマンス対応のエージェントフレームワークである。
ツールのパフォーマンス境界をタスク計画とスケジューリングに統合する。
ツール選択の正確性、実行の信頼性、ユーザの意図との整合性にメリットがあります。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:12:19 GMT)
Generation Enhances Understanding in Unified Multimodal Models via Multi-Representation Generation [53.2] 統一マルチモーダルモデル(UMM)は、視覚的理解と生成の両方を単一のフレームワークに統合する。
単純なアーキテクチャに依存しないポストトレーニング手法であるUniMRG(Unified Multi-Representation Generation)を提案する。
提案手法は, 微粒化知覚を高め, 幻覚を低減し, 空間的理解を向上し, 同時に生成能力を向上する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:22:34 GMT)
The Hot Mess of AI: How Does Misalignment Scale With Model Intelligence and Task Complexity? [53.2] AIがより有能になるにつれて、より汎用的で簡潔なタスクを委任します。
我々はAIモデルによる誤りのバイアス分散分解を用いてこの問題を運用する。
より有能なAIはより困難なタスクを追求し、よりシーケンシャルな行動と思考を必要とするので、私たちの結果は失敗がより一貫性のない行動を伴うことを予測します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:52:03 GMT)
Stabilizing Diffusion Posterior Sampling by Noise--Frequency Continuation [52.7] 高雑音下では、不正確な推定から計算されたデータ一貫性勾配は、後部幾何学と幾何的に一致しない。
本稿では、雑音依存周波数帯域内でのみ測定一貫性を強制する中間部分の連続的なファミリを構成するノイズ周波数継続フレームワークを提案する。
提案手法は最先端性能を実現し,強いベースライン上で最大5dBのPSNRの動作劣化を改善する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:14:01 GMT)
FourierSampler: Unlocking Non-Autoregressive Potential in Diffusion Language Models via Frequency-Guided Generation [52.6] 隠れ状態における低周波成分は主にグローバルな構造情報と長距離依存を符号化し,高周波成分は局所的な詳細を特徴づける役割を担っていることを示す。
そこで本研究では,周波数領域のスライディングウインドウ機構を利用したFourierSamplerを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:06:41 GMT)
Trajectory2Task: Training Robust Tool-Calling Agents with Synthesized Yet Verifiable Data for Complex User Intents [52.3] Trajectory2Taskは,3つの現実的なユーザシナリオの下で大規模なツール使用を研究するための,検証可能なデータ生成パイプラインである。
有効なツールコールトラジェクトリを、制御されたインテント適応を伴うユーザ向けタスクに変換する。
我々は、生成された複雑なユーザシナリオタスクに対して、7つの最先端のLCMをベンチマークし、頻繁な障害を観察する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:44:33 GMT)
The Illusion of Forgetting: Attack Unlearned Diffusion via Initial Latent Variable Optimization [51.8] 非学習型防衛は拡散モデル(DM)からNot-Safe-For-Work概念を浄化すると主張している
本研究では,未学習が言語記号と基礎知識のマッピングを部分的に破壊し,休眠記憶として残り続けることを示す。
IVOは、壊れたマッピングを再構築することで、これらの休眠記憶を再活性化する簡潔で強力な攻撃フレームワークである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:39:51 GMT)
Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis [51.8] ChemCraftは、知識ストレージから化学推論を分離する新しいフレームワークである。
ChemCraftは最小の推論コストで優れたパフォーマンスを実現する。
この研究は、AI支援化学のコスト効率とプライバシ保護のパラダイムを確立する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:54:31 GMT)
MathlibLemma: Folklore Lemma Generation and Benchmark for Formal Mathematics [51.7] 数学的民俗補題の発見と形式化を自動化するLLMベースのマルチエージェントシステムであるMathlibLemmaを紹介する。
さらに、幅広い数学的領域にまたがる4,028の型チェックリーンステートメントスイートであるMathlibLemmaベンチマークを構築します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:24:42 GMT)
OrLog: Resolving Complex Queries with LLMs and Probabilistic Reasoning [51.6] そこで我々は,論理的推論から述語レベルの妥当性推定を分離するニューロシンボリック検索フレームワークOrLogを紹介する。
大規模言語モデル (LLM) は1つの復号のない前方通過において原子述語に対する可視性スコアを提供し、確率論的推論エンジンはクエリ満足度の後方確率を導出する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:31:58 GMT)
A Fragile Guardrail: Diffusion LLM's Safety Blessing and Its Failure Mode [51.4] Diffusion large language model (D-LLMs) はjailbreak攻撃に対して本質的に堅牢であることを示す。
構成された良質なコンテキスト内に有害な要求が埋め込まれる、単純な、効果的な障害モードをコンテキストネストと呼ぶ。
この単純な戦略は、D-LLMの安全性を回避し、最先端の攻撃成功率を達成するのに十分であることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:08:14 GMT)
Decomposing and Composing: Towards Efficient Vision-Language Continual Learning via Rank-1 Expert Pool in a Single LoRA [51.0] 単一低ランク適応 (LoRA) モジュールを分解可能な Rank-1 エキスパートプールとして再構成する,新しいフレームワークを提案する。
本手法では,このエキスパートプールから[Guided]トークンのセマンティクスに導かれて,疎結合でタスク固有の更新を動的に作成することを学ぶ。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:54:51 GMT)
Statistical Estimation of Adversarial Risk in Large Language Models under Best-of-N Sampling [50.9] 大規模言語モデル(LLM)は、通常、単一ショットまたは低予算の逆のプロンプトの下で安全性を評価する。
我々は,Best-of-Nサンプリングの下でのジェイルブレイク脆弱性をモデル化するための,スケーリング対応のリスク推定手法であるSABERを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:54:35 GMT)
Language Model Circuits Are Sparse in the Neuron Basis [50.5] その結果, textbfMLP ニューロンは SAE と同様の機能的基盤であることがわかった。
この作業は、追加のトレーニングコストなしで言語モデルの自動解釈可能性を向上させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:41:19 GMT)
Why Self-Rewarding Works: Theoretical Guarantees for Iterative Alignment of Language Models [50.2] 自己回帰言語モデル(SRLM)は、外部からのフィードバックなしに反復的にアライメントを改善することに成功している。
本稿では,SRLMの厳密な理論的保証について述べる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:45:43 GMT)
AgentIF-OneDay: A Task-level Instruction-Following Benchmark for General AI Agents in Daily Scenarios [49.9] 持続時間と複雑さが増大するタスクを効果的に処理するAIエージェントの能力は、成長を続けている。
エージェントタスクの多様性に十分対処することなく,タスクの難易度の向上を優先している。
本稿では,自然言語命令とAIエージェントを多種多様な日常タスクに活用できるかどうかを判定するエージェントIF-OneDayを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:36:46 GMT)
RulePlanner: All-in-One Reinforcement Learner for Unifying Design Rules in 3D Floorplanning [49.8] フロアプランニングは集積回路における各モジュールの座標と形状を決定する。
現在のメソッドは、特定の設計ルールと限られた設計ルールのみを扱うことができる。
我々はこれらの課題に対処するために,オールインワンの深層強化学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:41:48 GMT)
Real-Time Aligned Reward Model beyond Semantics [49.7] 本稿では,R2M(Real-Time Aligned Reward Model)という軽量なRLHFフレームワークを紹介する。
R2Mは、事前訓練されたLLMの意味表現のみに依存するバニラ報酬モデルを越えている。
この研究は、ポリシーモデルからのフィードバックをリアルタイムで活用することで、報酬モデルの性能を向上させるための有望な新しい方向性を示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:32:35 GMT)
Pushing the Boundaries of Natural Reasoning: Interleaved Bonus from Formal-Logic Verification [49.5] 大きな言語モデル(LLM)は目覚ましい能力を示すが、その次は論理的不整合と報奨ハックを生み出す。
本稿では,自然言語生成プロセスと形式的記号的検証を動的にインターリーブする形式論理検証誘導フレームワークを提案する。
我々はこのフレームワークを,形式論理検証誘導制御による微調整とポリシー最適化の相乗効果を生かした,新しい2段階のトレーニングパイプラインを通じて運用する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:01:25 GMT)
Make Anything Match Your Target: Universal Adversarial Perturbations against Closed-Source MLLMs via Multi-Crop Routed Meta Optimization [49.3] 我々は、より厳密な設定であるユニバーサル・ターゲティング・トランスファラブル・アタック(UTTAA)について研究する。
単一の摂動は、未知の商用MLLMをまたいで、指定されたターゲットに対する任意の入力を常に制御しなければならない。
本稿では,M CRMO-Attackを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:03:24 GMT)
Inequality in Congestion Games with Learning Agents [49.2] ネットワークの構造だけでなく,通勤者による適応の仕方にも相違があることが示される。
潜在的効率性と公平性のトレードオフを捉えるために,学習中の非効率性の尺度であるPrice of Learning (PoL)を導入する。
シミュレーションにより,ネットワーク拡張が同時に効率を向上し,不等式を増幅できることが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:25:06 GMT)
ScholarPeer: A Context-Aware Multi-Agent Framework for Automated Peer Review [48.6] ScholarPeerは、上級研究者の認知過程をエミュレートするために設計された、検索可能なマルチエージェントフレームワークである。
We evaluate ScholarPeer on DeepReview-13K and the results showed that ScholarPeer achieve significant win-rates against state-of-the-art approach in side-side-side evaluations。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:54:55 GMT)
Where Not to Learn: Prior-Aligned Training with Subset-based Attribution Constraints for Reliable Decision-Making [47.9] 本稿では,属性に基づく事前アライメント手法を提案する。
MLLMに基づくGUIエージェントモデルにおいて,画像分類とクリック決定タスクの両方において,本手法の有効性を検証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:29:27 GMT)
Denoising the Deep Sky: Physics-Based CCD Noise Formation for Astronomical Imaging [47.8] 学習ベースのdenoisingは有望だが、ペアのトレーニングデータが不足しているため、進歩は妨げられている。
CCDノイズ生成に適した物理に基づくノイズ合成フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:47:54 GMT)
TTCS: Test-Time Curriculum Synthesis for Self-Evolving [47.8] テストタイムトレーニングは、大きな言語モデルの推論能力を改善するための有望な方法を提供する。
テスト時間トレーニングフレームワークTTCSを提案する。
TTCSは,挑戦的な数学ベンチマークにおける推論能力を一貫して強化することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:38:02 GMT)
Sample Complexity Analysis for Constrained Bilevel Reinforcement Learning [47.7] 制約付き2レベルRLアルゴリズムのサンプル複雑性を解析し、制約なし設定の進捗状況に基づいて構築する。
我々は、一般パラメータ化ポリシーに基づくRLアルゴリズムを非滑らかな目的関数で解析する最初の人である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:10:21 GMT)
UrbanMoE: A Sparse Multi-Modal Mixture-of-Experts Framework for Multi-Task Urban Region Profiling [47.6] 我々は,マルチタスク都市域プロファイリングのベンチマークを開発し,マルチモーダルな特徴と強力なベースラインの多種多様なセットを特徴とする。
次に,マルチタスクの課題を解決するために構築された,最初のスパースなマルチモーダル・マルチエキスパートフレームワークであるUrbanMoEを提案する。
ベンチマークでは,UrbanMoEがすべてのベースラインに対して常に優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:25:05 GMT)
Machine Unlearning in Low-Dimensional Feature Subspace [47.5] マシン・アンラーニング(MU)は、訓練済みモデルから特定のデータの影響を取り除き、残りのデータのパフォーマンスを維持することを目的としている。
本研究では,低次元特徴部分空間にMUの新たな視点を提示し,残余と忘れるデータを分離する可能性をもたらす。
この分離性は、事前訓練されたモデルスキスルー主射影からLOW次元のFeaTure部分空間で学習を進める方法であるLOFTを動機付けている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:58:38 GMT)
DINO-SAE: DINO Spherical Autoencoder for High-Fidelity Image Reconstruction and Generation [47.4] 本稿では,DINO Spherical Autoencoder(DINO-SAE)について述べる。
提案手法は, 既修のVFMと強いセマンティックアライメントを維持しつつ, 0.37 rFID と 26.2 dB PSNR に到達し, 最先端の再現性を実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:25:34 GMT)
Exploring Sidewalk Sheds in New York City through Chatbot Surveys and Human Computer Interaction [47.3] 歩行者から画像ベースのアノテーションと経路選択を収集するAIベースのサーベイを開発した。
本稿では,入り口アノテーションのグリッド解析を行い,歩道選択パターンの評価にロジスティック・ミックスエフェクト・モデリングを適用した。
本研究は,都市研究に生成AIを組み込むことで,歩道のシードデザインを評価する新しい手法を実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:41:44 GMT)
DimABSA: Building Multilingual and Multidomain Datasets for Dimensional Aspect-Based Sentiment Analysis [47.2] DimABSAは、従来のABSA要素とVAスコアの両方に注釈を付けた最初の多言語次元ABSAリソースである。
このリソースには、42,590の文にわたる76,958のアスペクトインスタンスが含まれており、6つの言語と4つのドメインにまたがっている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:30:35 GMT)
Compressed BC-LISTA via Low-Rank Convolutional Decomposition [47.2] 圧縮前方・後方演算子を用いたマルチチャネルイメージングのためのスパース信号回復法(SSR)について検討した。
本稿では,低ランク畳み込みネットワーク(CNN)分解に基づくCBC(Compressed Block-Convolutional)測定モデルを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:33:51 GMT)
Eroding the Truth-Default: A Causal Analysis of Human Susceptibility to Foundation Model Hallucinations and Disinformation in the Wild [47.0] フェイクニュースの親しみ」は、被曝が人間の差別者に対する敵対的訓練として機能する可能性を示唆する中間者候補として出現する。
これらの結果から,「プレバンキング」介入は,人口層区分よりも認知源モニタリングを対象とすべきであることが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:49:58 GMT)
Generalizable Multimodal Large Language Model Editing via Invariant Trajectory Learning [46.5] 既存の編集方法は、パラメータやモジュールの変更から出力への厳密なマッピングに依存している。
本稿では,MLLM編集をアウト・オブ・ディストリビューション(OOD)の一般化問題として再検討する。
我々は,編集の信頼性,局所性,汎用性を高めるための,プラグアンドプレイ不変学習ベースのフレームワークODEditを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:02:03 GMT)
Breaking the Blocks: Continuous Low-Rank Decomposed Scaling for Unified LLM Quantization and Adaptation [46.3] 低ランク分解スケーリング(LoRDS)は、この低ランク分解を通じて量子化の粒度を再考する統一フレームワークである。
空間的制約の「ブロックを壊す」ことで、LoRDSはシームレスな効率ライフサイクルを確立する。
LoRDSは、量子化タスクと下流細調整タスクの両方において、さまざまなモデルファミリの最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:46:02 GMT)
Soft Clustering Anchors for Self-Supervised Speech Representation Learning in Joint Embedding Prediction Architectures [45.7] JEPA(Joint Embedding Predictive Architectures)は、自己教師型音声表現学習において有望なアプローチを提供するが、明示的な根拠なしに表現の崩壊に悩まされる。
本稿では,GMM-Anchored JEPAを提案する。GMM-Anchored JEPAはガウス混合モデルの対数メル分光法に一度適合し,凍結した軟体後部をトレーニングを通して補助目標とする。
50k時間音声では、GMMアンカーがASR(28.68% vs. 33.22% WER)、感情認識(67.76% vs. 65.46%)、スロットフィリング(64.7% vs. 59.1% F1)を改善している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:51:37 GMT)
Do AI Overviews Benefit Search Engines? An Ecosystem Perspective [45.7] AI概要の検索エンジンへの統合は、コンテンツクリエーターからのトラフィックを分散させる。
本稿では,コストのかかる開発競争のゲーム理論モデルを提案し,均衡挙動を特徴付けるとともに,2つのインセンティブ機構を設計する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:04:38 GMT)
Open-Vocabulary Functional 3D Human-Scene Interaction Generation [45.6] FunHSIは、オープンな語彙のタスクプロンプトから機能的にヒューマン・シーンのインタラクションを可能にする、トレーニング不要のフレームワークである。
本研究では,FunHSIが室内・屋外の多様な場面において,機能的正当かつ物理的に妥当なヒューマン・シーンの相互作用を連続的に生成することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:39:55 GMT)
Position-Aware Self-supervised Representation Learning for Cross-mode Radar Signal Recognition [45.5] 複雑な拡張やマスキングを伴わずにパルスレベルの時間ダイナミクスを活用する位置認識型自己教師型フレームワークを提案する。
この枠組みを用いて,長距離設定下でのクロスモードレーダ信号認識を評価し,適応性と一般化性を評価する。
実世界の電磁環境における実用性を強調し, 識別性の向上とロバスト性を示す実験結果を得た。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:37:24 GMT)
TokenTrim: Inference-Time Token Pruning for Autoregressive Long Video Generation [45.4] 自動回帰ビデオ生成は、以前生成されたコンテンツに対して、新しいフレームのバッチを反復的に条件付けすることで、長いビデオ合成を可能にする。
近年の研究では、こうしたパイプラインは、長い地平線上でエラーが蓄積され増幅される厳しい時間的ドリフトに悩まされていることが示されている。
条件付けに再利用される前に、不安定な潜伏トークンを識別・削除することで、時間的ドリフトを緩和する簡易な推論時間法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:44:16 GMT)
The Alignment Curse: Cross-Modality Jailbreak Transfer in Omni-Models [45.3] テキストからオーディオへのジェイルブレイク攻撃の相互モダリティの伝達は、過小評価されている。
テキスト転送されたオーディオジェイルブレイクは、オーディオベースのジェイルブレイクと相容れないパフォーマンスを示します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:23:50 GMT)
A Real-Time Privacy-Preserving Behavior Recognition System via Edge-Cloud Collaboration [45.2] 従来のRGB監視は、視覚記録と記憶に関する重要な懸念を提起する。
既存のプライバシー保護手法は意味理解能力を損なうか、あるいは再構成攻撃に対する数学的不可逆性を保証できない。
本研究では,AI Flow理論フレームワークとエッジクラウド協調アーキテクチャに基づく,新たなプライバシ保護型認識技術を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:55:36 GMT)
MM-THEBench: Do Reasoning MLLMs Think Reasonably? [45.2] MLLMの推論における中間CoTの幻覚評価のための総合的なベンチマークであるMM-theBenchを紹介する。
MM-theBenchは、認知次元を基盤としたきめ細かい分類法、検証された推論アノテーションを備えた多様なデータ、多段階の自動評価フレームワークを備えている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:17:50 GMT)
"Someone Hid It": Query-Agnostic Black-Box Attacks on LLM-Based Retrieval [44.5] 大規模言語モデル(LLM)は,検索システムにおいて有効なバックボーンとして機能している。
近年の研究では、LDMをベースとしたRetrievalは敵の攻撃に弱いことが示されている。
ゼロショットサロゲートLPMをベースとした転送可能なインジェクショントークンを生成する実用的なブラックボックス攻撃法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:28:04 GMT)
Hide and Seek in Embedding Space: Geometry-based Steganography and Detection in Large Language Models [44.4] 微調整LDMは、ステガノグラフィーチャネルを介してプロンプトシークレットを出力に隠蔽的にエンコードすることができる。
任意の写像を埋め込み空間由来のものに置き換えることで、従来のスキームが100%回復可能であることを示す。
我々は、微調整によるステガノグラフィー攻撃を検出するには、従来のステガナシス以上のアプローチが必要であると論じる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:43:43 GMT)
No More, No Less: Least-Privilege Language Models [43.7] 我々は、コンピュータシステムにおける最小特権からインスピレーションを得て、最小特権言語モデルと呼ばれるモデルのクラスを定義します。
配置時制御をモニタ・アロケータ・エンフォースラスタックとして形式化し、(i)要求時信号を分離し、(ii)特権を割り当てる決定ルールと(iii)特権を選択する推論時機構を分離する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:42:13 GMT)
PhoStream: Benchmarking Real-World Streaming for Omnimodal Assistants in Mobile Scenarios [43.5] PhoStreamは、ビデオ、オーディオ、時間的推論を評価するために、オンスクリーンとオフスクリーンのシナリオを統合する最初のモバイル中心のストリーミングベンチマークである。
厳格な人間の検証を支援する自動生成パイプラインで構築し、リアルなオンライン推論パイプラインを使用してモデルを評価する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:17:21 GMT)
FNF: Functional Network Fingerprint for Large Language Models [43.2] FNF(Functional Network Fingerprint、FNF)は、被疑者モデルが被害者モデルから導出されているかどうかを検出する訓練のない、サンプル効率のよい手法である。
我々は、スケールやアーキテクチャの違いがあっても、共通の起源を持つモデルが神経活動の極めて一貫したパターンを示すことを示した。
従来の手法とは異なり,本手法では検証に少数のサンプルが必要であり,モデルの有用性を保ち,一般的なモデル修正に対して頑健である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:12:16 GMT)
Behemoth: Benchmarking Unlearning in LLMs Using Fully Synthetic Data [43.0] 実世界のデータに基づいて学習した大規模言語モデルに対するモデル編集の効果を理解するためのフレームワークであるBehemothを提案する。
例えば、いくつかのケースでは、現実世界の結果を反響させて、更新ランクを制限することで、より効果的な更新結果が得られることを示しています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:39:42 GMT)
SayNext-Bench: Why Do LLMs Struggle with Next-Utterance Prediction? [42.9] 先行モデルでさえ、人間の話者の次の発話を予測するのに驚くほど苦労しています。
その代わり、人間は、コンテキストからジェスチャー、視線、感情のトーンといったマルチモーダルな手がかりに基づいて、来るべき発話を予測できる。
我々は,会話における予測処理をエミュレートするために,認知にインスパイアされた設計を取り入れた2経路予測MLLM,SayNext-Chatを開発した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:27:45 GMT)
MIRRORTALK: Forging Personalized Avatars Via Disentangled Style and Hierarchical Motion Control [42.9] MirrorTalkは条件付き拡散モデルに基づく生成フレームワークである。
簡単な参照ビデオから純粋なスタイルの表現を抽出することができる。
リップシンク精度とパーソナライズ保存の観点から,最先端手法に対する大幅な改善を実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:23:01 GMT)
Obfuscation as an Effective Signal for Prioritizing Cross-Chain Smart Contract Audits: Large-Scale Measurement and Risk Profiling [42.8] HOBFNETはOBFPROBEの高速サロゲートであり、数百万のクロスチェーンスコアリングを可能にする。
系統的なスコアドリフトを観察し、チェーン内のパーセンタイルキューを動機付ける。
チェーンの再利用は尾に富み、より小さなエコシステムから大きなエコシステムへと方向偏りがある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:43:21 GMT)
FraudShield: Knowledge Graph Empowered Defense for LLMs against Fraud Attacks [42.6] 大規模言語モデル(LLM)は、重要な自動化プロセスに広く統合されている。
不正な情報による操作に影響を受けやすいため、有害な結果につながる可能性がある。
本稿では,不正コンテンツからLLMを保護するためのフレームワークであるFraudShieldを紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:48:52 GMT)
EntroCut: Entropy-Guided Adaptive Truncation for Efficient Chain-of-Thought Reasoning in Small-scale Large Reasoning Models [42.5] 大規模推論モデル(LRM)は、拡張連鎖生成による複雑な推論タスクに優れる。
初期の推論ステップにおけるモデル出力分布のエントロピーは、正しい推論と間違った推論とを確実に区別する。
本研究では,高信頼状態を特定することによって推論を動的に切り離す訓練自由度手法であるEntroCutを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:19:16 GMT)
Learning Alzheimer's Disease Signatures by bridging EEG with Spiking Neural Networks and Biophysical Simulations [42.1] 脳波に基づくアルツハイマー病検出のための従来のディープラーニングアプローチは、計算集約的で機械的に不透明である。
本稿では,データ駆動学習と生体物理シミュレーションを結びつけるニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:54:16 GMT)
LogicGaze: Benchmarking Causal Consistency in Visual Narratives via Counterfactual Verification [42.0] LogicGazeは視覚入力に対して逐次因果連鎖を検証できるかどうかを精査するために設計された新しいベンチマークフレームワークである。
我々の三部評価プロトコルは、Qwen2.5-VL-72Bのような最先端のVLMの重大な脆弱性を明らかにする。
LogicGazeは堅牢で信頼性の高いマルチモーダル推論を提唱しており、すべてのリソースは匿名リポジトリで公開されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:28:01 GMT)
CALM: Joint Contextual Acoustic-Linguistic Modeling for Personalization of Multi-Speaker ASR [41.9] 本稿では,自動音声認識のための共同文脈音響言語モデリングフレームワークCALMを提案する。
CALMは話者埋め込み駆動型ターゲットスピーカ抽出と動的語彙に基づく文脈バイアスを実装している。
両話者混合の場合,CALM は LibriSpeech2Mix では 12.7 から 4.7 に,CSJMix2 では 16.6 から 8.4 にバイアス付き文字誤り率 (B-CER) を減少させる(eval3)。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:12:16 GMT)
SemaCDR: LLM-Powered Transferable Semantics for Cross-Domain Sequential Recommendation [41.8] クロスドメインレコメンデーション(CDR)は、データ豊富なソースドメインからの知識を活用することで、ターゲットドメインにおけるデータ空間とコールドスタートの問題に対処する。
本稿では,大言語モデル(LLM)を活用してセマンティック空間を構築する,クロスドメインシーケンシャルレコメンデーションのためのセマンティックス駆動フレームワークSemaCDRを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:07:06 GMT)
Solving Inverse Problems with Flow-based Models via Model Predictive Control [41.6] MPC-Flowは制御サブプロブレムのシーケンスとしてフローベース生成モデルを用いて逆問題解決を定式化するモデル予測制御フレームワークである。
生成モデル軌道によるバックプロパゲーションを回避するレギュレーションを含む,異なるアルゴリズム選択が,ガイダンスアルゴリズムのスペクトルをいかに生み出すかを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:59:09 GMT)
Rethinking LLM-as-a-Judge: Representation-as-a-Judge with Small Language Models via Semantic Capacity Asymmetry [41.3] 曲面生成の代わりに内部表現を活用することにより,より小さなモデルで効率的な評価を行うことができるかどうかを検討する。
本稿では,セマンティック・キャパシティ非対称性仮説を提案する。
我々は、このパラダイムを、小さなモデル表現からアスペクトレベルの評価スコアを予測する探索ベースのフレームワークであるINSPECTORを通じてインスタンス化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:34:24 GMT)
Unrewarded Exploration in Large Language Models Reveals Latent Learning from Psychology [41.1] 大規模言語モデル(LLM)が潜在学習力学を示すことを示す。
LLMは2段階の探査体制の下で訓練後、報酬に基づく強化学習で訓練後のものよりも高い能力を達成する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:39:22 GMT)
Brazilian Portuguese Image Captioning with Transformers: A Study on Cross-Native-Translated Dataset [41.0] 本研究では,ブラジルのポルトガル語ICを対象としたトランスフォーマーを用いた視覚・言語モデルのクロスネイティブ評価を提案する。
ブラジル原住民のポルトガル語話者が手動で作成したキャプションで構成されたFlickr30Kのバージョンを使用し、それを英語からポルトガル語に自動翻訳されたキャプションと比較する。
以上の結果から,Swin-DistilBERTimbauは他のモデルよりも優れており,データセット間の強い一般化が示されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:12:03 GMT)
Decoding in Geometry: Alleviating Embedding-Space Crowding for Complex Reasoning [40.7] CraEGは、幾何学誘導再重み付けによる群集を緩和するプラグアンドプレイサンプリング手法である。
CraEGはトレーニングフリーで、シングルパスであり、標準サンプリング戦略と互換性がある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:18:04 GMT)
CamReasoner: Reinforcing Camera Movement Understanding via Structured Spatial Reasoning [40.7] CamReasonerは、カメラムーブメントの理解を構造化推論プロセスとして再構築するフレームワークである。
我々は、この領域における論理的アライメントにRLを初めて採用し、運動推論が物理幾何学に基礎を置いていることを保証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:45:43 GMT)
One Ring to Rule Them All: Unifying Group-Based RL via Dynamic Power-Mean Geometry [40.5] グループベース強化学習はGRPOの算術平均からGMPOの幾何学平均へと進化してきた。
我々はこれらのアプローチを,集約幾何学をパラメータ化する一般化されたフレームワークであるPMPO(Power-Mean Policy Optimization)の下で統一する。
我々は,p調整が勾配更新の濃度を調節し,その利点に基づいてトークンを効果的に再重み付けすることを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:58:54 GMT)
Reducing Memorisation in Generative Models via Riemannian Bayesian Inference [40.4] データ分布の変動をよりよく捉えた予測後部を構築する。
提案手法は,一般化を保ちながら記憶を減少させることを示した。
全体として,損失の幾何学を考えることで,パラメータ空間の有効利用が可能となることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:08:51 GMT)
Scalable Topology-Preserving Graph Coarsening with Graph Collapse [40.3] トポロジ的特徴の保存は,粗いグラフ上でトレーニングされたグラフニューラルネットワーク(GNN)の予測性能を維持するのに役立つが,指数時間的複雑性に悩まされていることを示す。
本稿では,代数的トポロジから拡張されたグラフ強崩壊とグラフエッジ崩壊の概念を導入して,スケーラブルなトポロジ保存グラフ粗大化(STPGC)を提案する。
STPGCは、これらの2つの概念に基づいてGStrongCollapse、GEdgeCollapse、NeighborhoodConingという3つの新しいアルゴリズムで構成されており、トポロジ的特徴を厳格に保存しながら空間的エッジを排除している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:02:26 GMT)
Leveraging Data to Say No: Memory Augmented Plug-and-Play Selective Prediction [40.2] 本稿では,視覚言語基盤モデルの選択的予測について考察する。
我々は、どんな基礎モデルにも適用可能な、低複雑さのトレーニング不要なアプローチを模索する。
我々は,(1)視覚言語表現の不安定性,(2)画像テキストの埋め込みのばらつき,(2)類似度スコアのキャリブレーションの低下,の2つの主要な課題を識別する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:10:34 GMT)
Quartet II: Accurate LLM Pre-Training in NVFP4 by Improved Unbiased Gradient Estimation [40.1] 我々は,NVFP4における量子化学習のための技術の現状を,マイクロスケールフォーマットのための新しい非バイアス量子化ルーチンによって改善する。
解析学的に、Quartet II はすべての行列乗法において一貫したより良い勾配推定を達成できることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:39:11 GMT)
Triage: Hierarchical Visual Budgeting for Efficient Video Reasoning in Vision-Language Models [39.9] Triageはトレーニング不要のプラグイン・アンド・プレイフレームワークで、階層的な視覚的予算化を通じて、ビデオ推論をリソース割り当ての問題として再設計する。
推論速度を向上し、メモリフットプリントを削減し、さまざまなビデオ推論ベンチマークでベースラインや他のメソッドのパフォーマンスを維持または超過する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:20:04 GMT)
Visual Personalization Turing Test [39.9] 本稿では,視覚的パーソナライゼーションを評価するための新しいパラダイムである視覚的パーソナライゼーションチューリングテスト(VPTT)を紹介する。
モデルは、その出力が人間または校正されたVLM裁判官に、ある人が作成または共有する可能性のあるコンテンツから区別できない場合、VPTTを通過させる。
本稿では,人,VLM,VPTT評価に高い相関性を示し,VPTTスコアを信頼性の高い知覚プロキシとして検証した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:53:07 GMT)
Quantum $(r,δ)$-Locally Recoverable BCH and Homothetic-BCH Codes [39.5] 量子$(r,)$-LRC, $Q(C)$は、ユークリッドまたはエルミート双対を含む$(r,)$-LRC, $C$から構成することができる。
この記事では、BCHおよびホモセティックBCH符号から量子$(r,)$-LRCを得る方法について研究する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:08:59 GMT)
Bridging the Semantic Chasm: Synergistic Conceptual Anchoring for Generalized Few-Shot and Zero-Shot OOD Perception [39.4] この原稿は、クロスモーダルアライメント・デジェネレーションの現象を軽減するために設計されたSynerNet(SynerNet)フレームワークのパイオニアである。
視覚知覚、言語コンテキスト、名目埋め込み、グローバルコーディネーションの4つの特殊な計算ユニットは、モダリティの格差を協調的に修正する。
VISTA-Beyondベンチマークで実施された実証的な評価によると、SynerNetは、少数ショットとゼロショットの両方のシナリオにおいて、大幅なパフォーマンス向上をもたらす。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:44:33 GMT)
ARGOS: Automated Functional Safety Requirement Synthesis for Embodied AI via Attribute-Guided Combinatorial Reasoning [39.2] Embodied AIはオープンエンドの自然言語命令で動作し、インタラクションリスクの課題を生み出す。
大規模言語モデル(LLM)は、このスケーラビリティの課題に対する有望な解決策として現れています。
オープンエンドユーザ命令と具体的な物理的属性のギャップを埋める新しいフレームワークARGOSを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:40:11 GMT)
CARE: Multi-Task Pretraining for Latent Continuous Action Representation in Robot Control [39.2] CAREは、ロボットタスク実行のためのVLAモデルをトレーニングするために設計されたフレームワークである。
CAREはビデオテキストペアのみを活用することで、明示的なアクションラベルの必要性を排除している。
結果は, ロボット制御におけるCAREのスケーラビリティ, 解釈可能性, 有効性を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:28:32 GMT)
Synthetic Time Series Generation via Complex Networks [39.1] 複雑なネットワークマッピングを利用して合成時系列を生成するためのフレームワークを提案する。
時系列が量子グラフ(QG)に変換され、逆マッピングによって再構成されるかどうかを検討する。
その結果, 量子グラフに基づく手法は, 合成時系列生成の競合的かつ解釈可能な代替手段であることがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:01:50 GMT)
FlyAware: Inertia-Aware Aerial Manipulation via Vision-Based Estimation and Post-Grasp Adaptation [39.0] 本文は, 強靭な航空操作のための新しい枠組みを提示する。
提案システムでは,視力に基づく初期慣性推定モジュールとポストグラフ適応機構を統合した。
制御のために、ゲインスケジューリングに基づく慣性を考慮した適応制御戦略を開発する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:02:33 GMT)
Enhancing TableQA through Verifiable Reasoning Trace Reward [39.0] 本稿では,軽量でトレーニング不要な報酬モデリングによる軌道探索をアーキテクチャ的に強化するRE-Tabについて紹介する。
状態遷移(ベストアクションとは何か?)」と「シミュレーティブ推論(私はアウトプットについて確実か?」)の間に明確な検証可能な報酬を提供することが、エージェントのナビゲーションをテーブル状態で操作するために重要であることを実証する。
RE-Tabの直接プラグアンドプレイ実装では、QA精度が41.77%向上し、一貫した回答のためにテスト時間推論サンプルが33.33%減少した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:06:42 GMT)
Monotonic Reference-Free Refinement for Autoformalization [38.8] 完全定理自動形式化のための参照フリー反復単調過程を導入する。
我々は,形式的妥当性,論理的保存,数学的整合性,形式的品質よりもマスクされた複合目標を最適化する。
実験により、提案プロセスは複数の次元にまたがって同時に改善できることを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:48:33 GMT)
Hi-Light: A Path to high-fidelity, high-resolution video relighting with a Novel Evaluation Paradigm [38.8] Hi-Lightは、高解像度で高解像度で堅牢なビデオリライトのためのトレーニング不要のフレームワークである。
われわれのアプローチでは、3つの技術革新が紹介されている。
評価における重要なギャップを解決するために,光の安定度を特に測定するための最初の定量的指標である光安定度スコアを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:50:55 GMT)
PersonaAct: Simulating Short-Video Users with Personalized Agents for Counterfactual Filter Bubble Auditing [38.6] PersonaActは、実行動トレースに基づいて訓練されたペルソナ条件のマルチモーダルエージェントでショートビデオユーザーをシミュレートするフレームワークである。
本研究では,フィルタバブル監査のための訓練エージェントを配置し,コンテントの多様性とエスケープ電位による気泡深さの評価を行った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:38:03 GMT)
AI Literacy, Safety Awareness, and STEM Career Aspirations of Australian Secondary Students: Evaluating the Impact of Workshop Interventions [38.4] ディープフェイクやその他のタイプの合成メディアは、青年期の安全リスクを増大させる。
本研究は,AIオーストラリアにおけるワークショップによる介入の日がオーストラリア中等生に与える影響を評価する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:55:53 GMT)
Game-Theoretic Co-Evolution for LLM-Based Heuristic Discovery [38.0] 大規模言語モデル(LLM)は、自動発見の急速な進歩を可能にした。
本稿では,発見を問題解決者とインスタンスジェネレータのプログラムレベルの共進化として再編成するゲーム理論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:14:52 GMT)
RAGRouter-Bench: A Dataset and Benchmark for Adaptive RAG Routing [37.8] 適応型RAGルーティング用に設計された最初のデータセットとベンチマークであるRAG-Benchを紹介する。
RAG-Benchは、クエリコーパスの互換性の観点から検索を再考し、5つの代表的なRAGパラダイムを体系的評価のために標準化する。
DeepSeek-V3 と LLaMA-3.1-8B による実験は、単一のRAGパラダイムが普遍的に最適であることを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:38:11 GMT)
MiTa: A Hierarchical Multi-Agent Collaboration Framework with Memory-integrated and Task Allocation [37.7] 協調効率を高めるための階層型メモリ統合タスク割り当てフレームワークであるMiTaを提案する。
MiTaはエージェントをマネージャメンバー階層に整理し、マネージャは追加のアロケーションとサマリモジュールを組み込む。
実験により, 複雑なマルチエージェント協調において, MiTaは優れた効率と適応性が得られることを確認した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:38:11 GMT)
OptiMAG: Structure-Semantic Alignment via Unbalanced Optimal Transport [37.6] マルチモーダル分散グラフ(MAG)は、テキストや画像などのマルチモーダル情報をノード上で統合することにより、複雑なシステムのモデリングに広く採用されている。
異なるモダリティ埋め込みによって誘導される暗黙的な意味構造と明示的なグラフ構造との相違を同定する。
既存のメソッドは通常、固定された明示的なグラフ構造上でメッセージパッシングを実行するため、それらは必然的に異なる特徴を集約する。
我々は,不均衡な最適輸送に基づく正規化フレームワークOptiMAGを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:29:03 GMT)
Scaling GraphLLM with Bilevel-Optimized Sparse Querying [37.6] BOSQ(Bilevel-d Sparse Querying)を提案する。
BOSQは既存のGraphLLMメソッドよりも桁違いのスピードアップを実現し、オンパーまたは優れたパフォーマンスを継続的に提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:03:18 GMT)
Distributional value gradients for stochastic environments [37.5] 回帰正則値学習法は、遷移力学と報酬の学習モデルを活用してサンプル効率を向上させる。
本研究では、連続状態-作用空間上の分散強化学習を拡張することで、これらの制約に対処する。
SVG(Value Gradients)にインスパイアされた本手法は,条件付きVari Autoencoder(cVAE)を用いて実装された報酬および遷移分布の一段階の世界モデルを利用する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:15:42 GMT)
ZEST: Zero-shot Embodied Skill Transfer for Athletic Robot Control [37.5] 本稿では,多種多様な情報源からの強化学習を通じて政策を訓練する動きの合理化フレームワークであるZESTを紹介する。
ZESTは、連絡先ラベル、参照または観察ウィンドウ、状態推定器、広範囲な報酬形成を避けながら、行動やプラットフォームをまたいで一般化する。
ボストン・ダイナミクスのアトラス・ヒューマノイドで、ZESTはモーションキャプチャーからダイナミックでマルチコンタクトのスキル(例えば、陸軍のクロール、ブレイクダンス)を学ぶ。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:35:02 GMT)
BatCoder: Self-Supervised Bidirectional Code-Documentation Learning via Back-Translation [37.2] BatCoderはコード生成とドキュメント生産を共同で最適化するために設計された自己教師付き強化学習フレームワークである。
ドキュメンテーションはまずコードから生成され、それから生成されたドキュメンテーションを使用して元のコードを再構築する。
7BモデルでHumanEvalとMBPPを評価し、BatCoderは83.5%と81.0%のpass@1を達成した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:32:15 GMT)
ShotFinder: Imagination-Driven Open-Domain Video Shot Retrieval via Web Search [37.1] 編集要件をオブジェクト指向のショット記述として形式化するベンチマークであるShotFinderを紹介する。
私たちは、20のテーマカテゴリーにわたるYouTubeから1210の高品質なサンプルを使用し、人間の検証による生成のために大きなモデルを使用します。
提案するShotFinderはテキスト駆動型3段階検索およびローカライゼーションパイプラインである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:01:17 GMT)
EmoShift: Lightweight Activation Steering for Enhanced Emotion-Aware Speech Synthesis [36.8] EmoSteerレイヤを組み込んだ軽量なアクティベーションステアリングフレームワークであるEmoShiftを提案する。
EmoShiftは出力埋め込み空間内の各ターゲット感情に対するステアリングベクトルを学習し、その潜在オフセットをキャプチャし、安定した適切な表現を維持する。
完全な微調整の1/30未満のトレーニング可能なパラメータは10Mに過ぎず、EmoShiftはゼロショットと完全に微調整されたベースラインを客観的および主観的な評価で上回っている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:50:23 GMT)
FMIR, a foundation model-based Image Registration Framework for Robust Image Registration [36.6] 基礎モデルに基づく登録フレームワークFMIRを紹介する。
ドメイン内画像のロバストな登録を維持しつつ、ドメイン内での最先端(SOTA)パフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:02:31 GMT)
Corrected Samplers for Discrete Flow Models [36.3] 近年の研究では、タウ・リーピングやオイラー・ソルバのような離散拡散モデルのサンプルについて研究されている。
遷移率やソース分布に制限を加えることなく,非漸近的離散化誤差境界を確立する。
位置補正されたサンプリング器は,既存の並列サンプリング器よりも複雑さが低いことを厳密に示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:53:22 GMT)
SHED Light on Segmentation for Dense Prediction [36.3] センス予測は、1枚の画像からピクセル当たりの値を推定し、3D知覚とロボット工学の基礎となる。
本稿では,重み付き予測にセグメンテーションを組み込むことにより,幾何的事前を明示的に適用する新しいエンコーダデコーダアーキテクチャSHEDを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:02:29 GMT)
CoFrGeNet: Continued Fraction Architectures for Language Generation [36.2] 連続分数にインスパイアされた生成モデリングのための新しい関数クラスを導入する。
トランスフォーマーブロックにおけるマルチヘッドアテンションとフィードフォワードネットワークを置き換えることができる,この関数クラスに基づく新しいアーキテクチャコンポーネントを設計する。
私たちのコンポーネントは、トレーニングや推論手順の変更をほとんど必要としないプラグイン代替物です。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:45:39 GMT)
Stochastic Linear Bandits with Parameter Noise [36.1] ここでは、水平方向の$T$に対する$widetildeO (sqrtd T log (K/) 2_max)$、次元$d$の$K$の一般的なアクションセット、そして、$_max$が任意のアクションに対する報酬の最大分散であることを示す。
驚くべきことに、この最適(対数的要因による)後悔境界は、非常に単純な探索探索アルゴリズムを用いて達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:47:42 GMT)
InstructDiff: Domain-Adaptive Data Selection via Differential Entropy for Efficient LLM Fine-Tuning [35.9] InstructDiffは、ドメイン適応選択基準として微分エントロピーを運用する統合フレームワークである。
InstructDiffは、数学的推論に関する完全なデータトレーニングよりも17%の相対的な改善を達成し、一般的な命令追従の52%を実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:15:44 GMT)
Neural Clothing Tryer: Customized Virtual Try-On via Semantic Enhancement and Controlling Diffusion Model [35.5] 本研究の目的は、Cu-VTON(Customized Virtual Try-ON)タスクに対処することである。
特定の衣服を、外観、姿勢、その他の属性でカスタマイズできるモデルに重ね合わせることができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:05:14 GMT)
Qualitative Evaluation of LLM-Designed GUI [35.4] 大規模言語モデル(LLM)はGUI(GUI)の自動設計のために研究されている。
本研究では, LLMインタフェースのユーザビリティと適応性について, 多様なユーザニーズを満たす能力について検討した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:33:44 GMT)
TABES: Trajectory-Aware Backward-on-Entropy Steering for Masked Diffusion Models [35.3] Backward-on-Entropy (BoE) Steeringは勾配誘導型推論フレームワークで、無限水平コンテキストを1つの後方パスで近似する。
スケーラビリティを確保するために,マスク対象の構造を利用した疎結合プリミティブであるttexttActiveQueryAttentionを導入し,後方通過の複雑さを低減する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:10:32 GMT)
Countering the Over-Reliance Trap: Mitigating Object Hallucination for LVLMs via a Self-Validation Framework [35.3] 大規模視覚言語モデル(LVLM)は、既存のオブジェクトの記述を生成し、その信頼性を損なう。
以前の作業は、LVLMが言語事前に過度に依存していることと、ロジットキャリブレーションによってそれを緩和しようとすることによる。
我々は,LVLMがオブジェクトの存在の信頼性を忠実に検証できるように,Language-Prior-Free Verificationを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:37:53 GMT)
DRL-Enabled Trajectory Planing for UAV-Assisted VLC: Optimal Altitude and Reward Design [35.2] 航空車両(UAV)と可視光通信(VLC)技術の統合は、効率的な照明を提供するための有望なソリューションとして現れている。
本稿では,UAV支援VLCシステムにおける3次元軌道計画について検討する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:44:14 GMT)
ImgCoT: Compressing Long Chain of Thought into Compact Visual Tokens for Efficient Reasoning of Large Language Model [34.9] 大規模言語モデル (LLM) を用いた効率的な推論には, コンパクトな潜在トークンへの思考(CoT)の長い連鎖が不可欠である。
テキストCoTから画像にCoTを描画して得られる視覚CoTに置き換えるImgCoTを提案する。
これにより、言語バイアスを空間的帰納バイアスに置き換え、潜在トークンがグローバルな推論構造をよりよく捉えることができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:06:45 GMT)
Causal Characterization of Measurement and Mechanistic Anomalies [34.7] 異常は基本的に異なる2つのプロセスによって生じうることを示す。
測定誤差は、しばしば安全に修正されるが、機械的異常は慎重に考慮する必要がある。
我々は、両方の型を明示的にキャプチャする因果モデルを定義し、潜伏変数である「真」変数と「測定された」変数に対する潜伏介入として外乱を扱います。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:36:14 GMT)
VideoGPA: Distilling Geometry Priors for 3D-Consistent Video Generation [34.5] VideoGPAは、高密度な嗜好信号を自動的に導出する、データ効率のよい自己組織化フレームワークである。
人間のアノテーションを必要とせずに、固有の3D一貫性に向けた生成的分布を操縦する。
最小限の選好ペアを用いて、時間的安定性、身体的可視性、動きコヒーレンスを大幅に向上させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:59:57 GMT)
Vision-Language Controlled Deep Unfolding for Joint Medical Image Restoration and Segmentation [34.0] AiOMIRSとオールインワン医用画像修復のための原則的枠組みを提案する。
本研究では,大域的セグメンテーションのための長距離依存関係を捕捉し,復元に必要な高周波テクスチャを保存するための周波数認識型Mamba機構を提案する。
AiOMIRSタスクの先駆的な作業として、VL-DUNはマルチモーダルベンチマークにまたがる新しい最先端技術を確立し、PSNRを0.92dB、Dice係数を9.76%改善した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:48:35 GMT)
D$^2$Quant: Accurate Low-bit Post-Training Weight Quantization for LLMs [33.9] 軽量後トレーニング量子化(PTQ)は、メモリ使用量を減らし、低ビット演算子や専用ハードウェアを使わずに実用的なスピードアップを可能にするため、魅力的である。
精度は、重量のみのPTQにおいて、サブ-4ビットの精度で著しく低下する。
D$2$Quantは、ウェイトとアクティベーションの両方の観点から量子化を改善する新しいウェイトオンリーのPTQフレームワークである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:49:48 GMT)
Fundamental Limits of Large Momentum Transfer in Optical Lattices [33.7] 大規模モメンタム・トランスファー技術は次世代の原子干渉計に欠かせない技術である。
最先端の実装は、ブロッホ振動やシーケンシャルブラッグ回折のような光学格子からの弾性散乱過程に依存している。
ここでは、フレケットに基づく理論フレームワークを開発し、すべての関連するレシエーションにまたがる弾性光原子散乱の統一的な記述を提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:28:45 GMT)
Conditional Performance Guarantee for Large Reasoning Models [33.7] 未知のグルーピングに対するグループPAC(G-PAC)とクラスタ化PAC(C-PAC)の推論を示す。
G-PACとC-PACは、実質的な計算貯蓄を維持しながら、グループ条件のリスク制御を成功させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:09:41 GMT)
NAG: A Unified Native Architecture for Encoder-free Text-Graph Modeling in Language Models [33.5] このアプローチはテキストグラフに最適である,と我々は主張する。
NAG(Native Architecture for Graphs)は、言語モデル内でグラフ処理を内部化する統合フレームワークである。
NAGは外部エンコーダのオーバーヘッドなしに堅牢なグラフ理解を実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:22:11 GMT)
MARE: Multimodal Alignment and Reinforcement for Explainable Deepfake Detection via Vision-Language Models [33.2] 視覚言語モデルを用いた説明可能なディープフェイク検出のためのマルチモーダルアライメントと強化(MARE)を提案する。
MarEは、人間のフィードバックからの強化学習を取り入れ、人間の嗜好に固執する推論コンテンツの生成を動機付けている。
MarEは精度と信頼性の観点から最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:19:35 GMT)
When RAG Hurts: Diagnosing and Mitigating Attention Distraction in Retrieval-Augmented LVLMs [33.2] この研究は、以前の研究で見過ごされた、明確な障害モードを特定している。
この問題を緩和するために、文脈統合から視覚的接地を分離する訓練不要の介入であるMAD-RAGを提案する。
OK-VQA、E-VQA、InfoSeekの大規模な実験は、MAD-RAGが既存のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:47:00 GMT)
Retrieval-Infused Reasoning Sandbox: A Benchmark for Decoupling Retrieval and Reasoning Capabilities [32.8] DeR2(DeR2)は、ドキュメント基底推論を分離する制御されたディープ検索サンドボックスである。
DeR2は、推論から4つのレシエーション(命令のみ、概念のみ、関連のみ、フルセット)を通じてアクセスする証拠を分離する。
さまざまな最先端の基礎モデルに対する実験は、かなりのバリエーションと重要なヘッドルームを明らかにしている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:58:09 GMT)
NativeTok: Native Visual Tokenization for Improved Image Generation [32.7] VQベースの画像生成は通常、2段階のパイプラインに従う: トークン化器は画像を個別のトークンにエンコードし、生成モデルはそれらの依存関係を再構築するために学習する。
このミスマッチは生成モデルを非順序分布から学習させ、バイアスと弱コヒーレンスをもたらす。
トークン化中に因果依存性を強制するネイティブな視覚トークン化を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:01:43 GMT)
PEAR: Pixel-aligned Expressive humAn mesh Recovery [32.4] ワイヤード画像から詳細な3Dメッシュを再構築することは、コンピュータビジョンの根本的な課題である。
既存のSMPLXベースの手法は、しばしば推論が遅くなり、粗い身体のポーズしか生成せず、顔や手などの細粒な領域で不規則や不自然な人工物が現れる。
PEARは,高速でロバストな画素配列表現型ヒューマンメッシュリカバリのためのフレームワークである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:12:54 GMT)
Compact Hypercube Embeddings for Fast Text-based Wildlife Observation Retrieval [32.2] 高速テキストに基づく野生生物の観察検索のためのコンパクトなハイパーキューブ埋め込みを提案する。
共有ハミング空間における自然言語記述と視覚的・音響的観察との整合性を確保するために,軽量ハッシングを拡張した。
その結果, 離散型ハイパーキューブ埋め込みを用いた検索は競争力が高く, 性能も優れていた。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:05:32 GMT)
TSPO: Breaking the Double Homogenization Dilemma in Multi-turn Search Policy Optimization [32.2] マルチターンツール統合推論により、大規模言語モデル(LLM)は反復情報検索によって複雑なタスクを解くことができる。
探索強化推論のための現在の強化学習(RL)フレームワークは、少ない結果レベルの報酬に依存している。
この問題に対処するために,ターンレベル段階対応政策最適化(TSPO)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:58:45 GMT)
GrepRAG: An Empirical Study and Optimization of Grep-Like Retrieval for Code Completion [32.2] リポジトリレベルのコード補完は、大きな言語モデルでは依然として困難である。
本稿では,軽量でインデックスなし,意図認識型語彙検索について検討する。
本稿では,LLMが関連するコンテキストを自動生成するベースラインフレームワークであるNaive GrepRAGを紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:22:15 GMT)
VisionTrim: Unified Vision Token Compression for Training-Free MLLM Acceleration [31.3] MLLM(Multimodal large language model)は、過度な視覚トークンによる計算コストが高い。
トレーニングフリーMLLMアクセラレーションのための統合フレームワークであるVisionTrimを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:45:48 GMT)
Clipping-Free Policy Optimization for Large Language Models [30.7] 強化学習は、訓練後の大規模言語モデルの中心となっている。
支配的なアルゴリズムは、大規模に最適化問題を導入するためのクリッピング機構に依存しています。
本稿では,クリッピングを全変動ばらつき制約から導いた凸ペナルティに置き換えるクリッピング自由政策最適化を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:32:37 GMT)
Tackling air quality with SAPIENS [30.5] 大気汚染は世界中の大都市で慢性的な問題である。
車両の交通は大気の質の悪さに大きく寄与していると認識されている。
本稿では,メキシコシティの交通データと汚染センサの詳細な測定結果について述べる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:41:38 GMT)
L$^3$: Large Lookup Layers [30.5] スパーストークンライザ埋め込みテーブルは、コンテキスト情報を持たないコストで、トークンごとの単一の埋め込みを選択する。
L$3$レイヤは静的トークンベースのルーティングを使用して、コンテキスト依存の方法でトークン毎に学習した埋め込みのセットを集約する。
L$3$は、(1)高速なトレーニングとCPUオフロード推論が可能なシステムフレンドリーなアーキテクチャ、(2)スピードと品質を効果的にバランスする情報理論の埋め込み割り当てアルゴリズムである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:13:05 GMT)
TEON: Tensorized Orthonormalization Beyond Layer-Wise Muon for Large Language Model Pre-Training [30.3] Muon の一般化は、事前学習された大きな言語モデルにおいて、強い経験的性能を示している。
本研究では,直交化を個々の層を超えて拡張するムオンの原理的一般化であるTEONを提案する。
本稿では,レイヤワイドミューオンに対するTEONの収束保証を改良し,TEONの実用的なインスタンス化をさらに発展させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:30:12 GMT)
AR-BENCH: Benchmarking Legal Reasoning with Judgment Error Detection, Classification and Correction [30.1] 法的判断は、事件状況の複雑さと法的概念の抽象的な性質による誤りを含むことがある。
現在の法的AI研究は、判断予測や法的文書生成のようなタスクに焦点を当てている。
本稿では,モデルの診断的推論と信頼性を法的に評価することを目的とした新しいタスクAPPELLATE REVIEWを紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:22:32 GMT)
Pipeline Inspection, Visualization, and Interoperability in PyTerrier [30.0] PyTerrierは、Information Retrieval (IR)パイプラインの構築と実験のためのフレームワークを提供する。
これらの機能は、研究者、学生、AIエージェントが幅広いIRパイプラインを理解し、使用するのを容易にすることを目的としている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:49:29 GMT)
SSL: Sweet Spot Learning for Differentiated Guidance in Agentic Optimization [29.8] 検証可能な報酬を伴う強化学習は、知的エージェントを訓練するための強力なパラダイムとして登場した。
textbfSweet textbfSpot textbfLearning (textbfSSL) はエージェント最適化のための差別化されたガイダンスを提供する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:02:18 GMT)
Test-Time Mixture of World Models for Embodied Agents in Dynamic Environments [29.5] Test-time Mixture of World Models (TMoW) は、目に見えない領域や進化しない領域への適応性を高めるフレームワークである。
TMoWは、関数が固定されている従来のMoEとは異なり、テスト時に世界モデル上でルーティング機能を更新する。
我々は、VirtualHome、ALFWorld、RLBenchベンチマーク上でTMoWを評価し、ゼロショット適応と少数ショット拡張シナリオの両方で強い性能を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:06:40 GMT)
Tuning the Implicit Regularizer of Masked Diffusion Language Models: Enhancing Generalization via Insights from $k$-Parity [29.5] Masked Diffusion Language Modelsは、最近強力な生成パラダイムとして登場した。
本研究では、これらの性質を$k$-parity問題の設定内で検討する。
MD目標を$k$-parity問題に適用してナノGPTをトレーニングすることにより,MD目標が学習環境を根本的に変えることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:36:00 GMT)
A General ReLearner: Empowering Spatiotemporal Prediction by Re-learning Input-label Residual [29.4] ReLearnerは、逆学習プロセスを通じて双方向学習機能でSNNを拡張するモジュールである。
ReLearnerは既存のSTNNの予測性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:26:57 GMT)
UPA: Unsupervised Prompt Agent via Tree-Based Search and Selection [29.3] 教師なしプロンプトエージェント(UPA)は、教師付きフィードバックに頼ることなく、構造化された探索と選択を実現する。
UPAはまず、不確実な条件下でのフィルタ候補に対する局所的な比較のパスワイドベイズアグリゲーションを行い、続いてグローバルなトーナメントスタイルの比較を行い、遅延したプロンプトの品質を推定する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:39:09 GMT)
Spectra: Rethinking Optimizers for LLMs Under Spectral Anisotropy [29.1] スパイクテールの分離はトレーニングを通して継続し、スパイクテールの約1.5%しか占めていないが、統計は支配的である。
この優位性は、第2モーメント正規化を通じてテール更新を収縮させ、グローバルに安定した学習速度を締め付けることでテールラーニングを抑制する。
この分析により,ノイズ感度のスペクトルトークンを増幅することなく,支配的な低ランクスパイク部分空間を抑えるスパイクアウェアメントであるSpectraを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:09:47 GMT)
Video-o3: Native Interleaved Clue Seeking for Long Video Multi-Hop Reasoning [28.9] Video-o3は、優れた視覚的手がかりの反復的な発見をサポートする新しいフレームワークである。
Video-o3は最先端の手法を大幅に上回り、MLVUでは72.1%、Video-Holmesでは46.5%の精度を達成している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:47:30 GMT)
Stabilizing Consistency Training: A Flow Map Analysis and Self-Distillation [28.7] 本稿では,フローマップの観点から解析することで,一貫性モデルの理論的検討を行う。
これらの知見に基づいて, ある形態の準最適収束に対する実践的な対策として, 自己蒸留を再考する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:51:55 GMT)
RPP: A Certified Poisoned-Sample Detection Framework for Backdoor Attacks under Dataset Imbalance [28.7] ディープニューラルネットワークは、バックドア攻撃の影響を受けやすい。
これまでの防御手法のほとんどは、現実のシナリオにおける広汎なクラス不均衡を見越して、バランスの取れたデータに依存している。
本稿では,データセットの不均衡がバックドアの脆弱性をいかに増幅するかを詳細に調査する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:17:54 GMT)
RPO:Reinforcement Fine-Tuning with Partial Reasoning Optimization [28.7] プラグ・アンド・プレイ強化微調整アルゴリズムRPO(Reinforcement Fine-Tuning with partial Reasoning Optimization)を提案する。
RPOは、経験キャッシュを使用して推論パスの接尾辞を生成することでモデルを訓練する。
フルパス強化微調整アルゴリズムと比較して、RPOは1.5Bモデルのトレーニング時間を90%、7Bモデルのトレーニング時間を72%削減する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:18:54 GMT)
MulFeRL: Enhancing Reinforcement Learning with Verbal Feedback in a Multi-turn Loop [28.6] 本研究では,よりリッチな言語フィードバックを活用して,失敗したサンプルに対するRLVRトレーニングを指導する方法を検討する。
具体的には,マルチターンフィードバック誘導型強化学習フレームワークを提案する。
1) フィードバックによって誘導される動的マルチターン再生は、失敗したサンプルにのみトリガーされ、(2) ターン内最適化とクロスターン最適化のための2つの補完的な学習信号、(3) モデルの推論プロセスへの構造化されたフィードバック注入である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:19:54 GMT)
Beyond Experience Retrieval: Learning to Generate Utility-Optimized Structured Experience for Frozen LLMs [28.6] 大規模言語モデル(LLM)は大部分が静的であり、しばしば推論や繰り返しの誤りを繰り返す。
SEAMは軽量なエグゼクタ固有のプラグインで、そのパラメータでエクスペリエンスを格納し、構造化されたインスタンスに適したエクスペリエンスエントリを生成する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:15:13 GMT)
$ρ$-$\texttt{EOS}$: Training-free Bidirectional Variable-Length Control for Masked Diffusion LLMs [28.5] 我々はデノナイジングダイナミクスを研究し、その暗黙の密度(texttEOS$)が世代十分性の信頼できるシグナルとなることを発見した。
マスク付きdLLMの双方向可変長生成を可能にする,トレーニングフリーの単一ステージ戦略を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:00:04 GMT)
SCaLRec: Semantic Calibration for LLM-enabled Cloud-Device Sequential Recommendation [28.1] LLM対応クラウド・デバイス・レコメンデーション(SCaLRec)について紹介する。
SCaLRecは、ユーザの最新のインタラクションの下でキャッシュされたセマンティクスの信頼性を推定する。
実世界のデータセットでの実験では、SCaLRecは、クラウドセマンティックの安定性の下で、強いベースラインよりも推奨性能を一貫して改善している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:28:50 GMT)
Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers [27.8] ツールレベルの専門知識を学習するための自己進化型マルチエージェントシステムである textbfGeoEvolver を紹介する。
GeoEvolverはエンドツーエンドのタスクの成功を継続的に改善し、複数のバックボーンで平均12%向上することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:11:07 GMT)
To See Far, Look Close: Evolutionary Forecasting for Long-term Time Series [27.5] DF(Direct Forecasting)パラダイムは、モデルに1回のフォワードパスで将来の地平線全体を予測させることによって、長期的な時系列予測(LTSF)を支配している。
本研究では,短地平線上で訓練されたモデルと提案した進化予測(EF)パラダイムを組み合わせることで,非直観的最適化の異常を明らかにする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:02:27 GMT)
RN-D: Discretized Categorical Actors with Regularized Networks for On-Policy Reinforcement Learning [27.5] 我々は、政策表現を、オン・ポリティクス最適化のための第一級の設計選択として再考する。
我々は,各行動次元をビン上の分布で表わす離散化されたカテゴリー的アクターについて検討し,クロスエントロピー損失に類似した政策目標を導出する。
その結果,標準的なアクターネットワークを離散化された正規化アクターに置き換えれば,一貫した利得が得られることがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:24:34 GMT)
Now You Hear Me: Audio Narrative Attacks Against Large Audio-Language Models [26.6] 我々は、許可されていない指示を物語スタイルのオーディオストリームに埋め込む、テキストからオーディオへのジェイルブレイクを設計する。
この攻撃は構造的および音響的特性を利用して、主にテキストに校正された安全機構を回避する。
結果は、言語的およびパラ言語的表現を共同で理由づける安全フレームワークの必要性を強調している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:23:02 GMT)
Do Transformers Have the Ability for Periodicity Generalization? [26.5] Transformerをベースとした大規模言語モデル(LLM)は、さまざまなタスクにまたがって強力なパフォーマンスを示している。
周期性一般化は、トレーニングデータから周期パターンを抽出し、OODシナリオに一般化するモデルの能力を表す。
抽象代数学と推論の観点から周期性の統一解釈を導入する。
実験により、トランスフォーマーの周期性一般化は限定的であり、モデルはトレーニング中に周期データを記憶することができるが、目に見えない複合周期性には一般化できないことが明らかになった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:09:14 GMT)
PaperX: A Unified Framework for Multimodal Academic Presentation Generation with Scholar DAG [26.5] 本稿では,学術的なプレゼンテーション生成を構造的変換とレンダリングのプロセスとしてモデル化する統合フレームワークPaperXを紹介する。
PaperXは単一のソースから多種多様な高品質の出力を生成する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:27:03 GMT)
Q-Hawkeye: Reliable Visual Policy Optimization for Image Quality Assessment [25.9] 本稿では,RLに基づく信頼性の高い視覚ポリシー最適化フレームワークであるQ-Hawkeyeを提案する。
Q-Hawkeyeは、複数のロールアウトにまたがる予測スコアのばらつきを用いて予測の不確実性を推定する。
本稿では,実際の視覚的証拠に品質判断を根拠として,モデルに制約を与えるインプシット知覚損失を導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:42:32 GMT)
Changepoint Detection As Model Selection: A General Framework [25.7] Dissertationは、L0モデル選択に基づく変更点検出のための一般的なフレームワークを提供する。
反復再加重ラッソ(IRFL)は、適応的に罰則を再加重することにより一般化ラッソを改善する。
フレームワークは画像データに拡張され、エッジ保存のデノゲーションとセグメンテーションが可能になる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:44:34 GMT)
Inference-time Alignment via Sparse Junction Steering [25.5] 推論時間アライメントのための重要なアプローチとして、トークンレベルのステアリングが登場している。
既存の手法はデコードの各ステップで密接な介入に依存している。
密接な介入は不要であり,スパースジャンクションステアリングを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:40:47 GMT)
3DGS$^2$-TR: Scalable Second-Order Trust-Region Method for 3D Gaussian Splatting [25.3] 3次元ガウススティングにおけるトレーニング問題を高速化する2次計算法である3DGS$2$-TRを提案する(3DGS)。
本手法はハッチンソン法を用いて, ヘッセン行列の対角線のみを用いて曲率を近似する。
3DGS$2$-TRは、ADAMよりも50%少ないトレーニングイテレーション、3DGS-LMより85%少ないトレーニングイテレーションを使用して、標準データセットの再構築品質を向上させることができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:14:09 GMT)
DecompressionLM: Deterministic, Diagnostic, and Zero-Shot Concept Graph Extraction from Language Models [24.8] DecompressionLMはゼロショットの概念グラフ抽出のためのステートレスフレームワークである。
提案手法は,共通復号法に基づく探索手法の3つの制限を対象とする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:56:56 GMT)
PLANING: A Loosely Coupled Triangle-Gaussian Framework for Streaming 3D Reconstruction [24.6] ハイブリッド表現上に構築された効率的なオンザフライ再構築フレームワークであるPLANingを提案する。
Planing は PGSR よりも 18.52% の高密度メッシュ Chamfer-L2 を改善し、ARTDECO を 1.31 dB PSNR で上回り、ScanNetV2 のシーンを100秒以内に再構築する。
PLANingは、大規模なシーンモデリングやシミュレーション可能な環境を具体化するなど、幅広いダウンストリームアプリケーションに適している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:26:59 GMT)
Decomposing Epistemic Uncertainty for Causal Decision Making [24.6] 観測データからの因果推論は、高価なランダム化試行を行うことなく、意思決定において最良の行動を示す強力な証拠となる。
近年の研究では、ニューラルネットワークを用いて、そのような因果効果の実践的な境界を求めており、しばしば難解な問題である。
本稿では,経験的観測分布に関する信頼度を考慮し,この問題に対処する新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:18:11 GMT)
MapDream: Task-Driven Map Learning for Vision-Language Navigation [24.5] Vision-Language Navigation (VLN)は、エージェントが部分的に観察された3D環境で自然言語の指示に従う必要がある。
本研究では,マップ構築を自己回帰型鳥眼ビュー(BEV)画像合成として定式化するマップ・イン・ザ・ループ・フレームワークであるMapDreamを提案する。
R2R-CEとRxR-CEの実験は、タスク駆動型生成マップ学習を検証し、最先端のモノクル性能を実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:33:16 GMT)
TimeBlind: A Spatio-Temporal Compositionality Benchmark for Video LLMs [24.3] TimeBlindは、詳細な時間的理解のための診断ベンチマークである。
我々は600のインスタンスで20以上の最先端MLLMを評価した。
最高のMLLMのインスタンス精度は48.2%に過ぎず、人間のパフォーマンス(98.2%)をはるかに下回っている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:21:46 GMT)
Full-Graph vs. Mini-Batch Training: Comprehensive Analysis from a Batch Size and Fan-Out Size Perspective [24.2] 本稿では,フルグラフとミニバッチグラフニューラルネットワーク(GNN)のトレーニング手法を体系的に比較する。
本稿では、ワッサーシュタイン距離を用いた新しい一般化解析を行い、グラフ構造の影響について検討する。
GNN収束と一般化におけるバッチサイズとファンアウトサイズの非等方性効果を明らかにする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:51:38 GMT)
KEPO: Knowledge-Enhanced Preference Optimization for Reinforcement Learning with Reasoning [24.1] 強化学習は、大規模言語や視覚言語モデルにおいて、明示的な推論行動を引き起こすための有望なパラダイムとして登場した。
しかしながら、推論指向のRLポストトレーニングは、低軌道レベルの報酬のため、基本的には困難である。
近年のオンライン蒸留法では,教師の集中管理によって最適化の安定化が図られている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:28:37 GMT)
Semantic Leakage from Image Embeddings [23.9] 意味リークは,元の画像の正確な再構築を必要としないことを示す。
本稿では,スタンドアロンの圧縮画像埋め込みからの意味情報を明らかにする軽量な推論フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:46:41 GMT)
Mitigating Hallucinations in Video Large Language Models via Spatiotemporal-Semantic Contrastive Decoding [23.8] 本稿では,時空間・意味的コントラストデコーディングというデコーディング戦略を提案する。
この戦略は、ビデオ特徴の新しい一貫性とセマンティックアソシエーションを意図的に破壊することによって、ネガティブな特徴を構築する。
本手法は,幻覚の発生を効果的に軽減するだけでなく,一般的な映像理解と推論能力も維持する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:16:12 GMT)
Towards Explicit Acoustic Evidence Perception in Audio LLMs for Speech Deepfake Detection [23.7] 音声ディープフェイク検出(SDD)は、与えられた音声信号が本物か合成的に生成されたかを特定することに焦点を当てる。
既存の音声大言語モデル(LLM)ベースの手法は、しばしば意味論的に相関した手がかりに偏っている。
聴覚知覚強調音声大言語モデル(SDD-APALLM)を用いたSDDについて紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:16:43 GMT)
From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents [23.6] EigenDataは階層的なマルチエージェントエンジンで、ツール基底の対話と実行可能なインスタンスごとのチェッカーを合成する。
合成データに基づいて、まずユーザモデルを微調整し、GRPOスタイルのトレーニングを適用するRLレシピを開発する。
以上の結果から,高価なアノテーションを使わずに,複雑なツールの動作をブートストラップするためのスケーラブルな経路が示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:01:23 GMT)
Perplexity Cannot Always Tell Right from Wrong [23.5] パープレキシティ(Perplexity)とは、特定の出力に遭遇する際のモデル全体の「サプライズ」レベルを測定する関数である。
厳密な方法で、パープレキシティがモデル選択に不適な計量であることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:13:10 GMT)
Bi-Anchor Interpolation Solver for Accelerating Generative Modeling [23.4] フローマッチング(FM)モデルは高忠実度合成の主要なパラダイムとして登場してきた。
トレーニング不要の問題解決者は、低次神経機能評価において、大幅なパフォーマンス劣化に悩まされる。
バイアンカー補間解法(BA-solver)を提案する。
BAソルバは、トレーニング不要の標準ソルバの汎用性を保ちながら、大幅な加速を実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:24:20 GMT)
Interpretable and backpropagation-free Green Learning for efficient multi-task echocardiographic segmentation and classification [23.4] グリーンラーニングフレームワークは、左室(LV)セグメンテーションとLVEFの同時分類を実行する。
EchoNet-Dynamicデータセットでは、MTGLモデルは最先端の分類とセグメンテーション性能を達成する。
この研究は、GLパラダイムが複雑な医用画像解析のための高精度、効率的、解釈可能なソリューションを提供できることを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:57:32 GMT)
Mem-T: Densifying Rewards for Long-Horizon Memory Agents [23.2] 我々は,動的更新やストリーミング入力によるマルチターン検索を行うために,軽量な階層型メモリデータベースと対話する自律メモリエージェントMem-Tを紹介する。
また,木誘導型強化学習フレームワークであるMoT-GRPOを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:23:33 GMT)
Entropy-Guided k-Guard Sampling for Long-Horizon Autoregressive Video Generation [23.0] トークン単位の分散に適応する手法として,Entropy-Guard k-gressive sampleを提案する。
ENkGは低エントロピー領域の適応トークン候補サイズを用いており、冗長ノイズを抑え、構造的整合性を維持するために少ない候補を用いる。
実験では、静的トップk/トップp戦略と比較して知覚品質と構造安定性が一貫した改善を示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:29:48 GMT)
A Unified Study of LoRA Variants: Taxonomy, Review, Codebase, and Empirical Evaluation [22.7] Low-Rank Adaptation (LoRA)は、大規模ニューラルネットワークにおける効率と性能のバランスをとるパラメータ効率の良い微調整手法である。
この研究は、体系的な分類学、統一された理論的レビュー、構造化された経験的評価、および標準化された経験的評価を提供する、LoRA変種の最初の統一的な研究を提示する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:30:05 GMT)
PLACID: Identity-Preserving Multi-Object Compositing via Video Diffusion with Synthetic Trajectories [22.6] PLACIDは、オブジェクトイメージの集合を魅力的なマルチオブジェクト複合体に変換するフレームワークである。
まず、事前訓練された画像間拡散モデルとテキスト制御を用いて、オブジェクトの一貫性、アイデンティティ、背景の詳細を保存する。
第2に、ランダムに配置されたオブジェクトがターゲット位置へスムーズに移動する合成シーケンスを生成する新しいデータキュレーション戦略を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:42:54 GMT)
MemoryLLM: Plug-n-Play Interpretable Feed-Forward Memory for Transformers [22.5] MemoryLLMは、フィードフォワードモジュールを自己アテンションから切り離すことを目的としている。
トークンの埋め込みを使って、自己注意から独立してトレーニングする。
システムは、文脈のないトークン単位の埋め込みでFFNをトレーニングすることによるパフォーマンスギャップを橋渡しする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:25:20 GMT)
Distribution-informed Efficient Conformal Prediction for Full Ranking [22.4] 不確実性の定量化は、現実世界のアプリケーションにおけるランキングモデルの安全な配置に不可欠である。
最近の研究は、完全ランク付けシナリオにおける共形予測を用いた厳密なソリューションを提供し、テスト項目の絶対ランクの予測セットを構築することを目的としている。
非整合性スコアの正確な分布を導出して効率的な予測セットを生成する分散インフォームド・コンフォーマルランキング(DCR)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:16:44 GMT)
Vision-Language Model Purified Semi-Supervised Semantic Segmentation for Remote Sensing Images [22.4] リモートセンシング(RS)領域におけるS4問題に対処するために,視覚制御モデル(VLM)を導入した新しいSemiEarthモデルを提案する。
具体的には、教師ネットワークの擬似ラベルを浄化するために、VLM擬似ラベル浄化(VLM-PP)構造を考案し、大幅な改善を実現した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:09:38 GMT)
Localizing and Correcting Errors for LLM-based Planners [22.3] 大規模言語モデル(LLM)は数学やコーディングにおいて強い推論能力を示しているが、古典的な計画課題ではしばしば失敗する。
そこで本研究では,L-ICL(Localized In-Context Learning)による命令を反復的に拡張する手法を提案する。
L-ICLはトレースの最初の制約違反を特定し、失敗するステップに対して正しい振る舞いを与える最小の入出力サンプルを注入する。
例えば、8x8グリッドワールドでは、L-ICLは60のトレーニング例で89%の有効プランを生成しており、最高のベースラインでは59%、30%の増加となっている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:56:15 GMT)
BeSafe-Bench: Unveiling Behavioral Safety Risks of Situated Agents in Functional Environments [22.3] 本研究では,機能的環境における位置エージェントの行動安全リスクを明らかにするベンチマークであるBeSafe-Bench(BSB)を提案する。
BSBは、Web、Mobile、Embodied VLM、Embodied VLAの4つの代表的なドメインをカバーしている。
機能的環境を用いて、安全クリティカルリスクの9つのカテゴリでタスクを増強し、多様な指導空間を構築する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:41:57 GMT)
Gated Relational Alignment via Confidence-based Distillation for Efficient VLMs [22.3] VLM(Vision-Language Models)は、強力なマルチモーダル性能を実現するが、デプロイにコストがかかり、トレーニング後の量子化は、しばしばかなりの精度を失う。
本稿では,知識蒸留とQATを統合化するためのフレームワークであるGRACEを提案する。
教師をタスク関連情報のプロキシとして扱うことで,信頼できない監督をフィルタリングするために,信頼度の高い分離蒸留を導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:30:52 GMT)
Beauty and the Beast: Imperceptible Perturbations Against Diffusion-Based Face Swapping via Directional Attribute Editing [21.4] 拡散ベースの顔交換は、最先端のパフォーマンスを達成するが、悪意のある顔交換の危険性を高めて、肖像画を正しく侵害したり、個人的評判を損なう。
拡散型顔交換に対するプロアクティブ・ディフェンス・フレームワークであるFaceDefenseを提案する。
本手法は, 対向的な例の防御効果を高めるために新たな拡散損失を導入し, 摂動誘発歪みの復元に指向性顔属性の編集を用いる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:24:47 GMT)
Ethical Risks of Large Language Models in Medical Consultation: An Assessment Based on Reproductive Ethics [21.3] 大きな言語モデル(LLM)が倫理的に従順な方法で医学的問い合わせに応答できるかどうかという懸念が高まっている。
本研究は、生殖倫理に関する疑問に答える上で、LLMのパフォーマンスを体系的に評価する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:24:04 GMT)
Fire on Motion: Optimizing Video Pass-bands for Efficient Spiking Action Recognition [21.3] スパイキングニューラルネットワーク(SNN)は、そのエネルギー効率、生物の楽観性、および固有の時間的処理により、視界において牽引力を高めている。
しかしながら、SNNは、人工知能ニューラルネットワーク(ANN)と比較して、動的ビデオタスクではまだパフォーマンスが劣っている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:47:23 GMT)
Sparse Attention as Compact Kernel Regression [21.0] カーネル理論によるスパースアテンション機構の理解が現在欠落している。
スパースアテンションとコンパクト(有界サポート)カーネルの正式な対応を確立する。
カーネルレグレッションベースの変種であるメモリモザイクによる実験は、カーネルベースのスパースアテンションが競合性能を達成することを示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:45:35 GMT)
Quantum-Enhanced Sensing Enabled by Scrambling-Induced Genuine Multipartite Entanglement [21.0] 超伝導量子プロセッサ上での量子強調センシングのためのスクランブルベースアプローチを実証する。
多数体情報のスクランブルを利用して、標準的な量子限界を超えるエンコードされた位相に対する量子強調感度を観測する。
本研究は、多体量子システムにおける量子強調センシングのためのスケーラブルで実用的なアプローチを実証するものである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:28:36 GMT)
Rank-and-Reason: Multi-Agent Collaboration Accelerates Zero-Shot Protein Mutation Prediction [20.8] ウェットラブ検証プロセスを自動化する2段階のエージェントフレームワークであるRan-and-Reason(VenusRAR)を提案する。
Rank-Stageでは、計算専門家と仮想生物学者がコンテキスト対応のマルチモーダルアンサンブルをまとめ、ProteinGym上で0.551(vs.0.518)の新しいスピアマン相関記録を樹立した。
Reason-Stageでは、エージェント専門家パネルが、幾何学的および構造的制約に対して候補を監査するチェーン・オブ・シンキングを採用し、ProteinGym-DMS99で最高5ヒット率を最大367%改善している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:35:46 GMT)
GNN Explanations that do not Explain and How to find Them [20.7] 我々はSE-GNNの説明の致命的な失敗を識別する: 説明は、SE-GNNがラベルを推測する方法と明らかに無関係である。
私たちの経験的分析では、退化した説明を悪意的に植え付けることができ(攻撃者が機密属性の使用を隠蔽できる)、また自然に現れる可能性があることが示されています。
この問題に対処するために、退化的説明を不信として確実にマークする新しい忠実度指標を導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:29:50 GMT)
UniGeo: A Unified 3D Indoor Object Detection Framework Integrating Geometry-Aware Learning and Dynamic Channel Gating [20.4] 我々はUniGeoと呼ばれる3次元屋内検出フレームワークを提案する。
まず,空間的関係から特徴量への学習可能なマッピングを確立する幾何学的学習モジュールを提案する。
そこで本研究では,学習可能なチャネルワイド重み付けを利用する動的チャネルゲーティング機構を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:15:50 GMT)
Mitigating Error Accumulation in Continuous Navigation via Memory-Augmented Kalman Filtering [20.4] 無人航空機(UAV)にとって連続航法は重要である
既存のVision-Language Navigation (VLN) モデルはデッドレコンディングに従っており、次のウェイポイント予測のためにその位置を反復的に更新し、その後に完全な軌道を構築する。
本研究では,ナビゲーションを2つの補完的なプロセスに分解する新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:03:08 GMT)
MonoScale: Scaling Multi-Agent System with Monotonic Improvement [20.2] LLMベースのマルチエージェントシステム(MAS)は、タスクを分解し、サブタスクを特殊エージェントに委譲するルータを用いて急速に進歩している。
我々は,エージェント条件の慣れ親しんだタスクを積極的に生成する拡張対応更新フレームワークであるMonoScaleを提案する。
逐次拡張を文脈的バンディットとして形式化し、信頼領域のメモリ更新を行い、単調な非遅延性能を保証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:44:49 GMT)
User-Adaptive Meta-Learning for Cold-Start Medication Recommendation with Uncertainty Filtering [20.1] そこで我々は,患者の冷え込み問題に対処するための多段階不確実性を考慮したメタラーニングフレームワーク,MetaDrugを提案する。
我々はMIMIC-IIIとAKI(Area Kidney Injury)データセットに対するアプローチを評価した。
両方のデータセットの実験結果から、MetaDrugは、コールドスタート患者に対する最先端の薬剤推奨法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:45:47 GMT)
Learning Geometrically-Grounded 3D Visual Representations for View-Generalizable Robotic Manipulation [19.8] 実世界のロボット操作は、多様なカメラ視点で、堅牢な空間的シーン理解と強力な一般化を要求する。
近年の3次元視覚表現の進歩は、将来性を示しているが、それでもいくつかの重要な限界に悩まされている。
ビュー汎用ロボット操作のための統一型表現型政治学習フレームワークである MethodName を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:53:53 GMT)
What can Computer Vision learn from Ranganathan? [19.7] コンピュータビジョンにおけるセマンティックギャップ問題(SGP)は、視覚的意味論と語彙的意味論のミスアライメントから生じる。
本稿では,S.R. Ranganathanの分類原理がSGPに対処し,高品質なCVデータセットを設計するための出発点となることを示唆する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:51:13 GMT)
SPICE: Submodular Penalized Information-Conflict Selection for Efficient Large Language Model Training [19.6] 本研究では,不一致をペナルティ化しながら情報を最大化するコンフリクト対応セレクタSPICEを提案する。
これにより、トレーニングコストを大幅に削減してパフォーマンスが向上する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:40:48 GMT)
Scale Equivariance Regularization and Feature Lifting in High Dynamic Range Modulo Imaging [19.5] 本研究は,学習に基づくHDR復元フレームワークを提案する。
i)露出変動の下で一貫性を強制するスケール同変正規化、(ii)原モジュロ画像を組み合わせた特徴持ち上げ入力設計、(ii)有限差分を含む2つの重要な戦略が組み込まれている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:45:29 GMT)
The Blessing of Dimensionality in LLM Fine-tuning: A Variance-Curvature Perspective [19.4] 重量摂動進化戦略は驚くほど人口が少ない言語モデルを微調整できることを示す。
また、細調整報酬がしばしば上昇し、ピークが上昇し、ESとGRPOの両方で劣化するのを観察する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:26:35 GMT)
Detect and Act: Automated Dynamic Optimizer through Meta-Black-Box Optimization [19.3] 本稿では,進化アルゴリズムにおける自動変分検出と自己適応を実現するための強化学習支援手法を提案する。
本手法は, 自動環境変動検出と自己適応により, 未知のDOPに対して一般化することができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:28:27 GMT)
Intra-Class Subdivision for Pixel Contrastive Learning: Application to Semi-supervised Cardiac Image Segmentation [19.3] 心臓画像分割のためのクラス内サブディビジョン画素コントラスト学習フレームワークを提案する。
同じクラス内の内および境界領域におけるピクセル表現を区別するために、"Unconcerned sample'"の概念が提案されている。
境界表現に対する新たなコントラッシブ・ロスが提案され、境界を越えた表現の識別が促進される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:34:15 GMT)
Dual Quaternion SE(3) Synchronization with Recovery Guarantees [18.8] 本稿では、二元四元数表現を採用し、SE(3)を単位二元四元数上で直接同期する。
スペクトル初期化器はエルミート二元四元数測定行列上の電力法で計算され、次いで二元四元数一般化電力法で計算される。
合成ベンチマークと実世界のマルチスキャン点集合登録実験により、提案したパイプラインは精度と効率の両方を向上することを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:24:20 GMT)
Darwinian Memory: A Training-Free Self-Regulating Memory System for GUI Agent Evolution [18.7] MLLM(Multimodal Large Language Model)エージェントはグラフィカルユーザインタフェース(GUI)の自動化を促進するが、長期にわたるクロスアプリケーションタスクに苦労する。
既存のパラダイムは、高レベルのインテントと低レベルの実行のミスマッチに苦しむ、動的GUI環境への適応に苦慮している。
本研究では,動的エコシステムとしてメモリを構築する自己進化型アーキテクチャであるDarwinian Memory System (DMS)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:01:21 GMT)
Divide-and-Conquer CoT: RL for Reducing Latency via Parallel Reasoning [18.6] 我々は、遅延を低減するためにDivide-and-Conquer CoT (DC-CoT) を訓練することを提案する。
DC-CoTは、推論プロセスで並列に実行できる異なるサブタスクを識別するディレクタとして機能し、サブタスクを実行するためにワーカーを生成できる。
我々のゴールは、応答に必要な遅延の理論的尺度である、最も長い経路長で高い精度を達成することである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:37:07 GMT)
Learn More with Less: Uncertainty Consistency Guided Query Selection for RLVR [18.5] 既存のRLVRアルゴリズムでは、大量のクエリ予算が必要で、アノテーションはコストがかかる。
我々は、RLVRにアクティブラーニング(AL)を導入し、より少ないがより情報的なクエリが類似または優れたパフォーマンスをもたらすかどうかを調査する。
実験の結果,本手法は乱数および古典的ALベースラインを一貫して上回り,データの30%をトレーニングしながら全データセットのパフォーマンスを達成できた。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:41:55 GMT)
MASC: Metal-Aware Sampling and Correction via Reinforcement Learning for Accelerated MRI [18.5] MRIの金属インプラントは、画像の品質を低下させ、臨床診断を妨げる深刻な人工物を引き起こす。
我々は,加速MRIのためのメタアウェアk空間サンプリングとアーティファクト補正を共同で最適化する統合強化学習フレームワークMASCを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:53:43 GMT)
Rethinking Anonymity Claims in Synthetic Data Generation: A Model-Centric Privacy Attack Perspective [18.4] 合成データを生成するための生成機械学習モデルを訓練することは、データ共有におけるプライバシーを高めるための一般的なアプローチとなっている。
これは一般的に機密性の高い個人情報を処理するため、トレーニングされたモデルまたは生成された合成匿名性は、プライバシー上のリスクを生じさせる可能性がある。
有意義な評価は、基礎となる生成モデルの能力と特性を考慮し、最先端のプライバシ攻撃に基礎を置く必要がある、と我々は主張する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:57:41 GMT)
Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents [18.4] Traversal-as-Policy: サンドボックス化されたOpenHandsの実行ログを単一の実行可能なGated Behavior Tree (GBT)に蒸留する
各ノードは状態条件のアクションマクロを符号化し、成功した軌道からマージチェックを行う。
実行時に、軽量なトラバーサは、子マクロに対するベースモデルの意図と一致します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:25:08 GMT)
AnoMod: A Dataset for Anomaly Detection and Root Cause Analysis in Microservice Systems [18.3] 我々は、SocialNetworkとTrainTicketという2つのオープンソースのマイクロサービスシステム上に構築された、新しいマルチモーダルな異常データセットを紹介します。
各シナリオについて、ログ、メトリクス、分散トレース、APIレスポンス、コードカバレッジレポートの5つのモード(Mod)を収集します。
このデータセットは、クロスモーダル異常検出および融合/アブレーション戦略の評価を可能にする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:03:51 GMT)
Localized, High-resolution Geographic Representations with Slepian Functions [18.1] 地理的データは基本的に地域的であり、人口集中部の病気の発生、海岸線に沿って生態パターンが出現し、経済活動が国境内で集中している。
しかし、地理的位置を符号化する機械学習モデルは、ローカライズされたアプリケーションに必要な微細な解像度に苦しむ、世界中に一様に表現能力を分配する。
本研究では,球面スレピアン関数を用いた地理的位置エンコーダを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:11:41 GMT)
Recovering Whole-Brain Causal Connectivity under Indirect Observation with Applications to Human EEG and fMRI [18.1] INCAMA(Indirect CAusal MAmba)は、間接的な観測から神経力学を分離するために測定物理を考慮に入れた潜在空間因果発見フレームワークである。
脳波とfMRIの大規模生体物理シミュレーションにおけるINCAMAの有効性を検証した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:26:28 GMT)
Unveiling Scaling Behaviors in Molecular Language Models: Effects of Model Size, Data, and Representation [18.0] 本研究では,分子言語モデルの事前学習タスクと下流タスクのスケーリング挙動について検討する。
以上の結果から,分子モデルにおける前処理および下流輸送のスケーリング則が明らかとなった。
我々は,分子言語モデルとしてこれまでで最大のライブラリをリリースし,今後の研究開発を促進する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:32:12 GMT)
Learnable Permutation for Structured Sparsity on Transformer Models [17.8] 構造的空間性は、一般的なモデルプルーニング技術として現れている。
重みの置換は、打ち切り後のパフォーマンスをさらに改善するための有望な方向である。
本稿では、新しいエンドツーエンドの学習可能な置換フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:44:00 GMT)
Robust and Generalized Humanoid Motion Tracking [17.6] 一般的なヒューマノイド全体制御器の学習は、ロボット領域に移動された後、実用的な参照動作がノイズや不整合を示す可能性があるため、困難である。
本稿では,因果的時間的エンコーダを用いた動的条件付きコマンドアグリゲーションフレームワークの提案と,コンテキストウィンドウを選択的に集約するマルチヘッド・クロスアテンション・コマンドエンコーダを提案する。
提案手法は多種多様な参照入力と挑戦的な動作条件の下で評価され,無見えない動作へのゼロショット転送と,物理的ヒューマノイドロボットへのロバストなシミュレート・トゥ・リアル転送が実証された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:27:43 GMT)
Bonnet: Ultra-fast whole-body bone segmentation from CT scans [17.5] Bonnetは超高速のスパースボリュームパイプラインで、CTスキャンから全身骨の分節を行う。
ボネットは1回のスキャンでわずか2.69秒で走りながら、リブ、骨盤、脊椎のハイダイスを達成する。
強いボクセルベースラインと比較して、Bonnetは同様の精度を達成しているが、同じハードウェアとセットアップでおよそ25倍の推論時間を短縮する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:18:39 GMT)
MedMCP-Calc: Benchmarking LLMs for Realistic Medical Calculator Scenarios via MCP Integration [17.4] MedMCP-Calcは、MedMCP(Model Context Protocol)の統合により、医学計算のシナリオを評価するための最初のベンチマークである。
MedMCP-Calcは、4つの臨床領域にまたがる118のシナリオタスクから構成されており、自然なクエリ、構造化データベースのインタラクション、外部参照検索、プロセスレベルの評価を模倣するファジィタスク記述が特徴である。
我々は、シナリオ計画とツール拡張を取り入れた微調整モデルであるCalcMateを開発し、オープンソースモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:56:20 GMT)
Agentic Framework for Epidemiological Modeling [17.3] EPIAGENTは、疫学シミュレーターを自動で合成し、校正し、検証し、精製するエージェントフレームワークである。
中心的な設計選択は、シナリオ仕様とモデル構造を結びつける明示的な疫学的フローグラフ中間表現である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:45:45 GMT)
From Tokens to Blocks: A Block-Diffusion Perspective on Molecular Generation [17.1] GPTに基づく分子言語モデル(MLM)は、大規模データから化学構文と意味学を学ぶことで、強力な分子設計性能を示した。
本稿では,分子表現,モデルアーキテクチャ,ターゲット認識生成のための探索戦略を共同設計する統合フレームワークであるSoftMolを提案する。
ソフトモールは100%の化学的妥当性を達成し、結合親和性が9.7%向上し、分子多様性が2-3倍向上し、推論効率が6.6倍向上する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:42:43 GMT)
SWE-Manager: Selecting and Synthesizing Golden Proposals Before Coding [17.1] ソフトウェアエンジニアリングでは、チームは問題を修正するための複数の候補提案をドラフトし、次に、実装のための黄金の提案を慎重に行う。
この選択は、問題のスコープ、影響、緊急性を評価するだけでなく、各提案の長所と短所を明確に理解する必要がある。
SWE-Managerは,最高の提案を選択し,黄金の提案を合成する共同選択合成手法である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:17:14 GMT)
Generation Order and Parallel Decoding in Masked Diffusion Models: An Information-Theoretic Perspective [16.9] Masked Diffusion Models (MDMs) は、逐次決定論のトレードオフによって推論を著しく加速する。
我々は,2つの障害源である順序感度と並列化バイアスを分離し,解析するための統合情報理論フレームワークを提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:15:18 GMT)
Weak Diffusion Priors Can Still Achieve Strong Inverse-Problem Performance [16.8] 逆解法が拡散先行の弱さに対して頑健である時期と理由について検討する。
測定が極めて有益である場合には、弱い先入観が成功する。
これらの結果は、弱い拡散前処理を確実に使用できる場合に、原理化された正当化を与える。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:25:54 GMT)
A Random Matrix Theory of Masked Self-Supervised Regression [16.8] 実験では,様々なマスキングパターンにまたがって予測を集約し,行列値の合同予測を行う。
このオブジェクトは、互いに条件をコーディネートする方法を符号化し、新しい分析課題を生じさせる。
マスクされた自己教師型学習がPCAを確実に上回る構造的体制を同定する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:32:33 GMT)
When Handwriting Goes Social: Creativity, Anonymity, and Communication in Graphonymous Online Spaces [16.7] 本稿では、ユーザが手書きや描画を通じて匿名で対話する通信形式であるGraphonymous Interactionを紹介する。
我々は,Graphonymous Online Space (GOS) CollaNoteから600ページ以上のcanvasページを分析し,20ユーザを対象にインタビューを行った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:40:15 GMT)
Cross-Domain Few-Shot Learning for Hyperspectral Image Classification Based on Mixup Foundation Model [16.7] ハイパースペクトル画像(HSI)分類のためのクロスドメイン少ショット学習は、大きな研究関心を集めている。
本稿では,CDFSL HSI分類のためのMIFOMOを提案する。
MIFOMOは、リモートセンシング(RS)基礎モデルの概念に基づいて構築されており、大規模なRS問題に対して事前訓練されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:24:51 GMT)
Toward Third-Party Assurance of AI Systems: Design Requirements, Prototype, and Early Testing [16.5] 我々は,AI評価のギャップに対処する,サードパーティのAI保証フレームワークを導入する。
我々は、利害の衝突を防ぎ、プロセスの信頼性と説明責任を確保するために、第三者の保証に焦点を当てる。
私たちの発見は、AI保証フレームワークが健全で包括的で、さまざまな組織的コンテキストで使用できるという、初期の証拠を示しています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:37:12 GMT)
Does Algorithmic Uncertainty Sway Human Experts? Evidence from a Field Experiment in Selective College Admissions [16.4] 我々は、アルゴリズム依存を、より好ましくないアルゴリズム予測が決定者へ提示されるか否かによって決定結果が依存する範囲として定義する。
より好ましいスコアを提示することは,モデルに大きく相違がある場合でも,平均的な入場確率が有意に上昇しないことを示す。
これらの結果は、この専門家では、人間の意思決定はアルゴリズム予測の任意のバリエーションとほとんど変わらぬものであることを示唆している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:03:30 GMT)
MalURLBench: A Benchmark Evaluating Agents' Vulnerabilities When Processing Web URLs [16.4] 悪意のあるURLに対するWebエージェントの脆弱性を評価する最初のベンチマークであるMalURLBenchを提案する。
MalURLBenchには、実際の10のシナリオにまたがる61,845の攻撃インスタンスと、実際の悪意のあるWebサイトの7つのカテゴリが含まれている。
12の人気のあるLCMを使った実験によると、既存のモデルは、精巧に偽装された悪意のあるURLを検出するのに苦労している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:10:06 GMT)
FarmMind: Reasoning-Query-Driven Dynamic Segmentation for Farmland Remote Sensing Images [16.3] 農地リモートセンシング画像(FRSI)セグメンテーションの手法は、一般的に静的セグメンテーションのパラダイムに従う。
そこで我々はFarmMindというFRSIのための推論クエリ駆動動的セグメンテーションフレームワークを提案する。
実験により、FarmMindは既存の方法と比較して、セグメンテーション性能とより強力な一般化能力を達成することが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:37:34 GMT)
Learning Hamiltonian Flow Maps: Mean Flow Consistency for Large-Timestep Molecular Dynamics [16.3] 我々は、選択した時間領域における平均位相空間の進化を予測することによって、ハミルトンフローマップを学習するためのフレームワークを導入する。
特に,機械学習力場を用いた分子動力学シミュレーションを改良した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:02:04 GMT)
Learning to Explore with Parameter-Space Noise: A Deep Dive into Parameter-Space Noise for Reinforcement Learning with Verifiable Rewards [16.2] PSN-RLVRは、ロールアウト生成前にポリシーパラメータを摂動させ、時間的に一貫した軌道レベルの探索を誘導する。
本稿では,意味的多様性と正規化自己確実性を組み合わせた軽量サロゲートによって駆動される,計算効率のよいリアルタイム適応ノイズスケジューラを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:10:30 GMT)
ToolTok: Tool Tokenization for Efficient and Generalizable GUI Agents [16.1] ToolTokはGUIエージェントのための多段階パスフィニングの新しいパラダイムである。
我々は,人間のインタラクションの習慣に沿ったツールを考案し,学習可能なトークン埋め込みを用いて各ツールを表現する。
トークン定義質問回答,純テキスト誘導ツールの選択,視覚的パスフィニングの3つのタスクからなる,難易度の高いカリキュラムを構築した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:38:05 GMT)
Training-Free Test-Time Adaptation with Brownian Distance Covariance in Vision-Language Models [16.0] ブラウン距離共分散(TaTa)を用いた無訓練テスト時間適応
TaTaはBrownian Distance Covarianceを利用して、トレーニングやバックプロパゲーションなしで視覚言語モデルを新しいドメインに動的に適応する。
多様なデータセットを対象とした実験により、TaTaはドメインの最先端性能とデータセット間の一般化を実現しつつ、計算コストを著しく削減することが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:21:45 GMT)
When Anomalies Depend on Context: Learning Conditional Compatibility for Anomaly Detection [15.9] 異常検出はしばしば、異常が観測の本質的な性質であり、文脈に依存しないという仮定の下で定式化される。
この仮定は、同じオブジェクトやアクションが正常である場合や、遅延したコンテキスト要因によって異常な場合など、現実世界の多くの設定で分解される。
従来,文脈に依存した異常として定義され,視覚領域で機能的に機能するアンフコンテクスチュアルな異常検出法について検討した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:48:20 GMT)
Asymptotic Theory of Iterated Empirical Risk Minimization, with Applications to Active Learning [15.9] 本研究では,2つの連続ERMを同一データセット上で実行した反復的経験的リスク(ERM)のクラスについて検討する。
ガウス混合データに対して幅広い凸損失を訓練した線形モデルに対して、テスト誤差の鋭い特徴付けを導出する。
ラベル付け予算の段階的配分に関する基本的なトレードオフを明らかにするとともに、データ選択によって純粋に駆動されるテストエラーの2D動作を実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:39:51 GMT)
How Far Can Pretrained LLMs Go in Symbolic Music? Controlled Comparisons of Supervised and Preference-based Adaptation [15.8] 音楽は、しばしば言語と顕著な類似点を共有し、象徴的な音楽理解と生成のために事前訓練された大きな言語モデル(LLM)の使用を動機付けている。
本稿では,ABC をベースとした学習と理解のための微調整手法の比較研究を行い,既成の命令付きバックボーンとドメイン適応型を比較検討した。
ドメイン適応と事前情報トレードオフを保存すること、およびシンボリック音楽のドメイン適応を測定するために使われるメトリクスの異なる振る舞いを強調する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:44:01 GMT)
Learning to Build Shapes by Extrusion [15.5] 本稿では,顔押出のシーケンスとしてメッシュ構築を表現するテキストベース表現であるText Encoded Extrusion (TEE)を紹介する。
我々の表現は、再構成、新しい形状合成、および既存のメッシュへの新機能の追加を可能にすることを実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:32:34 GMT)
VGGT-SLAM 2.0: Real-time Dense Feed-forward Scene Reconstruction [15.5] VGGT-SLAM 2.0はリアルタイムのRGBフィードフォワードSLAMシステムであり、VGGT-SLAMを大幅に改善する。
我々は、VGGT-SLAM 2.0が、VGGT-SLAMよりも約23%少ないポーズエラーで、TUMデータセット上で最高の精度を達成することを実証した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:16:50 GMT)
ExplainerPFN: Towards tabular foundation models for model-free zero-shot feature importance estimations [15.2] ExplainerPFNは、基礎となるモデルや参照説明にアクセスせずにShapley値を推定するためのゼロショットメソッドである。
ExplainerPFN は 2-10 SHAP の例に依存した数発のサロゲート説明器で性能の競争力を発揮することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:17:36 GMT)
Postural Virtual Fixtures for Ergonomic Physical Interactions with Supernumerary Robotic Bodies [15.0] 我々は,非エルゴノミック姿勢が検出された場合に,SRBユーザに審美的フィードバックを提供する新しい制御フレームワークを提案する。
このアプローチは、人間工学的習慣の長期学習を促進し、身体的相互作用における適切な姿勢を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:44:41 GMT)
Continual Policy Distillation from Distributed Reinforcement Learning Teachers [14.9] 継続強化学習は、生涯学習エージェントを開発し、多様なタスクにまたがる知識を継続的に獲得することを目的としている。
これは、安定性と塑性のジレンマを効率的に管理し、新しいタスクに迅速に一般化するために事前の経験を活用する必要がある。
本稿では、CRLを2つの独立したプロセスに分離する新しい教師学生フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:40:34 GMT)
FITMM: Adaptive Frequency-Aware Multimodal Recommendation via Information-Theoretic Representation Learning [14.9] マルチモーダルレコメンデーションのための周波数対応情報理論フレームワークを提案する。
FITMMはグラフ付きアイテム表現を構築し、モダリティワイドスペクトル分解を行い、軽量なバンド内マルチモーダル成分を形成する。
実世界の3つのデータセットの実験では、FITMMは一貫して、高度なベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:16:54 GMT)
OpenVTON-Bench: A Large-Scale High-Resolution Benchmark for Controllable Virtual Try-On Evaluation [14.8] 約100Kの高解像度画像対からなる大規模ベンチマークであるOpenVTON-Benchを提案する。
データセットはDINOv3ベースの階層クラスタリングを用いて構築され、セマンティック・バランスの取れたサンプリングとジェミニ・パワーの高密度キャプションを行う。
本稿では,VTONの品質を背景整合性,アイデンティティの忠実度,テクスチャの忠実度,形状の妥当性,全体的現実性という5つの解釈可能な次元に沿って測定するマルチモーダルプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:58:00 GMT)
SplineFlow: Flow Matching for Dynamical Systems with B-Spline Interpolants [14.7] SplineFlow(スプラインフロー)は、B-スプラインを通して観測された条件付き経路を共同でモデル化する理論的基盤付きフローマッチングアルゴリズムである。
本研究では,B-スプライン基底の滑らかさと安定性をSplineFlowがいかに活用するかを示すとともに,マルチマージ要求を満たすことを保証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:19:48 GMT)
FedDis: A Causal Disentanglement Framework for Federated Traffic Prediction [14.6] 我々は,フェデレーション型空間時間予測のための新しいフレームワークであるFedDisを紹介する。
我々はFedDisが常に最先端のパフォーマンスデータセット、有望な効率、優れた拡張性を実現していることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:20:53 GMT)
Benchmarking Machine Translation on Chinese Social Media Texts [14.6] 急速に進化するスラング、ネオロジズム、およびユーザ生成テキストにおける高度にスタイル化された表現の出現は、機械学習ベンチマークにおいて大きな課題となっている。
CSM-MTBenchは、中国語以外の5つの方向をカバーするベンチマークである。
本稿では,各サブセットについて,スラングとネオロジズムの翻訳成功率を測定し,ソーシャル・スニペットのトーンとスタイルを評価する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:48:02 GMT)
Semantics-Preserving Evasion of LLM Vulnerability Detectors [14.5] LLMベースの脆弱性検知器は、セキュリティクリティカルなコードレビューにますますデプロイされている。
セマンティクス保存脅威モデルに基づく検出時間整合性の評価を行った。
異なる攻撃方法/キャリア間での関節の堅牢性の測定基準を導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:54:27 GMT)
The Semantic Trap: Do Fine-tuned LLMs Learn Vulnerability Root Cause or Just Functional Pattern? [14.5] そこで我々は,脆弱性根本原因を機能パターンから切り離すための総合評価フレームワークTrapEvalを提案する。
我々は、3つのモデルファミリーにまたがる5つの最先端LCMを微調整し、それらを、CodeBLEUによって測定されたクロスデータセットテスト、セマンティック保存、および様々なセマンティックギャップの下で評価する。
従来のデータセットに対する高いベンチマークスコアは、モデルが脆弱性の真の因果論理を理解できないことを隠蔽している可能性がある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:19:17 GMT)
SolAgent: A Specialized Multi-Agent Framework for Solidity Code Generation [14.4] 本稿では,人間専門家のワークフローを模倣する新しいツール強化マルチエージェントフレームワークであるSolAgentを提案する。
SolAgent には textbfdual-loop refinement メカニズムが組み込まれている。機能上の正確性を保証するために textitForge コンパイラを使用する内部ループと,セキュリティ上の脆弱性を取り除くために textitSlither 静的アナライザを活用する外部ループである。
高品質な現実世界プロジェクトから派生した厳格なスイートであるSolEval+Benchmarkの実験は、SolAgentがPass@1レートを textbf64.39 まで達成していることを示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:17:48 GMT)
DROGO: Default Representation Objective via Graph Optimization in Reinforcement Learning [14.4] ニューラルネットワークを用いてデフォルト表現の主固有ベクトルを直接近似する目的を導出する。
我々は,様々な環境における目的の有効性を実証的に実証し,学習した固有ベクトルを報酬形成に適用する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:45:45 GMT)
CAPA: Contribution-Aware Pruning and FFN Approximation for Efficient Large Vision-Language Models [14.3] 本研究では,注目度をベクトルサイズで重み付けした注意貢献が,視覚的トークン選択のためのより正確な基準を提供することを示す。
本稿では、重要な機能遷移における注意貢献を用いて視覚トークンを創出する二重戦略フレームワークであるCAPA(Contribution-Aware Pruning and FFN Approximation)を紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:09:03 GMT)
Text-only adaptation in LLM-based ASR through text denoising [14.2] テキストのみのデータを用いて、音声認識システムを新しいドメインに適応させることは、大きな課題だが未解明の課題である。
本稿では,テキスト記述タスクとして扱うことで,音声投影タスクをエミュレートする新しいテキストのみ適応手法を提案する。
私たちのソリューションは軽量で、アーキテクチャの変更やパラメータの追加は必要ありません。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:53:08 GMT)
A Conditional Companion: Lived Experiences of People with Mental Health Disorders Using LLMs [14.1] 大規模言語モデル(LLM)は、メンタルヘルスのサポートにますます利用されている。
精神疾患のある英国人を対象に,20回の半構造化インタビューを行った。
その結果, LLM を条件的, 状況的に関与する参加者がみられた。
LLMは軽度から軽度の苦痛に対して有効であったが、危機、トラウマ、複雑な社会的情緒的状況には不十分であった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:36:48 GMT)
TaF-VLA: Tactile-Force Alignment in Vision-Language-Action Models for Force-aware Manipulation [14.1] 本稿では,物理相互作用力の高次元触覚観測を基盤としたTaF-VLAについて紹介する。
TaF-VLAポリシは、最先端の触覚と視覚のみのベースラインを、コンタクトリッチなタスクで大幅に上回る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:45:08 GMT)
Local Intrinsic Dimension of Representations Predicts Alignment and Generalization in AI Models and Human Brain [14.1] 近年の研究では、より強い一般化を持つニューラルネットワークは、互いに高い表現的アライメントを示す傾向があることが判明している。
より強力な一般化モデルもまた、人間の神経活動とより強く一致していることを示す。
これらの関係は、学習された表現の単一の幾何学的性質、すなわち埋め込みの局所内在次元によって説明できる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:54:59 GMT)
Training-Free Representation Guidance for Diffusion Models with a Representation Alignment Projector [14.0] 本稿では,プロジェクタによって予測される表現を中間サンプリングステップに注入するアライメントアライメントプロジェクタを提案する。
SiTとREPAの実験は、クラス条件の画像ネット合成において顕著に改善されている。
提案手法は,SiTモデルに適用した場合の代表的なガイダンスより優れる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:29:54 GMT)
Learning to Execute Graph Algorithms Exactly with Graph Neural Networks [14.0] 有界および有限精度制約下でのグラフアルゴリズムの正確な学習可能性について検証する。
局所的な命令は、小さなトレーニングセットから学習できることを示し、完全なグラフアルゴリズムは、誤りなく、高い確率で、推論中に実行可能であることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:31:26 GMT)
RVDebloater: Mode-based Adaptive Firmware Debloating for Robotic Vehicles [13.9] モードベースの組み込みデバイスのための新しい適応型デブロレーション手法であるRVDebloaterを提案する。
RVDebloaterは、静的または動的解析を使用して、各モードの不要なファームウェアコードを識別する。
実行時の関数レベルで各モードのファームウェアを動的にデブロートする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:46:08 GMT)
ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas [13.9] ASTRAは、ツール拡張言語モデルエージェントをトレーニングするためのエンドツーエンドフレームワークである。
ASTRAはスケーラブルなデータ合成と検証可能な強化学習を統合している。
複数のエージェントツール使用ベンチマークの実験は、ASTRA訓練されたモデルが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:12:32 GMT)
MELINOE: Fine-Tuning Enables Memory-Efficient Inference for Mixture-of-Experts Models [13.9] Mixture-of-Experts (MoE)モデルアーキテクチャはトークン当たりのアクティベートパラメータの数を著しく削減することができる。
彼らの全体的なパラメータ数とモデルサイズは、リソース制約された設定で広く使用されるのを妨げている。
MELINOE(MelinoE)は、MoEモデルを微調整し、より強く、配列ごとに少数の専門家を活性化する手法である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:40:18 GMT)
In-Run Data Shapley for Adam Optimizer [13.9] 本稿では,Adam-Aware In-Run Data Shapleyを提案する。
本手法は, 標準トレーニングの95%を保ちながら, グラウンドピアソン限界貢献に対するほぼ完全な忠実度を実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:31:40 GMT)
COBRA++: Enhanced COBRA Optimizer with Augmented Surrogate Pool and Reinforced Surrogate Selection [13.8] 我々は,COBRAを2つの側面で強化する学習型適応戦略(COBRA++)を提案する。
RBFのようなサロゲートとの結合を断ち切るための強化されたサロゲートプールは、モデル多様性と近似能力を高める。
強化学習に基づくオンラインモデル選択ポリシーは、COBRA++の全体的なパフォーマンスを最大化するために訓練される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:27:10 GMT)
Mock Worlds, Real Skills: Building Small Agentic Language Models with Synthetic Tasks, Simulated Environments, and Rubric-Based Rewards [13.8] 既存のオープンソースエージェントトレーニングデータはタスクの多様性が狭く、容易に解決できる。
現実世界のAPIには多様性がなく、大規模な強化学習のロールアウトプロセスでは不安定である。
多様なツール使用トレーニングデータを共同で合成し,完全な環境をシミュレートするフレームワークであるSynTHAGENTで,これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:43:42 GMT)
KBVQ-MoE: KLT-guided SVD with Bias-Corrected Vector Quantization for MoE Large Language Models [13.8] ベクトル量子化(VQ)は、大規模言語モデル(LLM)における超低ビット圧縮に有望なアプローチを提供する
KBVQ-MoE は,MoE ベースの LLM の超低ビット量子化を実現する新しい VQ フレームワークである。
さまざまなMOE LLMの実験により、KBVQ-MoEは既存の量子化法よりも精度がかなり高いことを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:57:17 GMT)
Med-Scout: Curing MLLMs' Geometric Blindness in Medical Perception via Geometry-Aware RL Post-Training [13.7] 最先端のMLLMでさえ、視覚障害(幾何学的盲点)に悩まされている。
本稿では,強化学習(Reinforcement Learning, RL)を通じて,この盲点を「修正」する新しいフレームワークであるMed-Scoutを紹介する。
大規模な評価の結果,Med-Scoutは幾何学的盲点を著しく軽減し,我々のベンチマークではプロプライエタリでオープンソースのMLLMを40%以上上回った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:45:10 GMT)
CoDCL: Counterfactual Data Augmentation Contrastive Learning for Continuous-Time Dynamic Network Link Prediction [13.7] 本稿では,この欠陥に対処するために,対実データ拡張と対照的学習を組み合わせた動的ネットワーク学習フレームワークを提案する。
CoDCL全体はプラグイン・アンド・プレイのユニバーサルモジュールとして設計されており、様々な時間グラフモデルにシームレスに統合できる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:41:20 GMT)
Auditing Sybil: Explaining Deep Lung Cancer Risk Prediction Through Generative Interventional Attributions [13.5] 肺癌ががん死亡の主な原因である。
現在の評価は純粋に観測基準に依存している。
モデルに依存しない監査フレームワークであるS(H)NAPを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:21:52 GMT)
Farewell to Item IDs: Unlocking the Scaling Potential of Large Ranking Models via Semantic Tokens [13.5] セマンティックトークンはアイテムIDと比較してスケーリング可能性が高いことを示す。
提案するフレームワークであるTRMはトークン生成とアプリケーションパイプラインを改善し,スパースストレージを33%削減する。
大規模な実験により、TRMはモデルキャパシティがスケールした場合、常に最先端のモデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:12:59 GMT)
Understanding Generalization from Embedding Dimension and Distributional Convergence [13.5] 表現中心の観点から一般化を研究し、学習した埋め込みの幾何学が固定訓練モデルの予測性能をどのように制御するかを分析する。
人口リスクは, (i) 埋込み分布の内在的次元, (i) 埋込み分布のワッサーシュタイン距離における人口分布への収束率, (ii) 埋込みから予測への下流マッピングの感度, (ii) リプシッツ定数によって特徴づけられる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:32:04 GMT)
Towards the Holographic Characteristic of LLMs for Efficient Short-text Generation [13.3] 本稿では,Large Language Models (LLM) による生成特性の探索を目的とする。
我々は,言語モデルが生成プロセスの開始時にターゲット側のキーワードをキャプチャする傾向があることを発見した。
この特徴を探求し、言語モデルの推論効率をさらに向上するために、HOLOと呼ばれるプラグインを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:36:09 GMT)
Spectral Gradient Descent Mitigates Anisotropy-Driven Misalignment: A Case Study in Phase Retrieval [13.2] スペクトル勾配法は、スケールを捨てながら方向情報を保存することによって勾配の更新を変更する。
非線形位相探索モデルの動的解析により,これらの利得のメカニズムを解明する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:12:58 GMT)
Should LLMs, $\textit{like}$, Generate How Users Talk? Building Dialect-Accurate Dialog[ue]s Beyond the American Default with MDial [13.0] 16億人の英語話者の80%以上が標準アメリカ英語を使用していない。
我々は,多言語対話データを生成するための最初の大規模フレームワークである$textbfMDial$を紹介した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:08:08 GMT)
UCPO: Uncertainty-Aware Policy Optimization [12.8] 既存のLarge Language Models (LLM) はバイナリ決定空間と静的不確実性報酬によってアドバンテージバイアスに悩まされ、過剰な保守主義や過剰な自信を引き起こす。
本稿では、不確実性に基づく報酬を取り入れた現在のRLパラダイムにおける報酬ハッキングと過信の根本原因を明らかにし、UnCertainty-Aware Policy Optimizationフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:07:42 GMT)
Safer Policy Compliance with Dynamic Epistemic Fallback [12.7] 本研究では,LLMの誤認攻撃に対する予測時防御を改善するために,ダイナミック・エピステマティック・フォールバック(DEF)を導入する。
DEFはLLMに対して、不整合を宣言し、拒絶し、混乱した政策文書に遭遇する際の知識を拒絶するよう訴えている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:40:49 GMT)
TimeMachine-bench: A Benchmark for Evaluating Model Capabilities in Repository-Level Migration Tasks [12.6] TimeMachine-benchは、現実のPythonプロジェクトでソフトウェアマイグレーションを評価するために設計されたベンチマークである。
私たちのベンチマークは、依存関係の更新に応じてテストが失敗し始めるGitHubリポジトリで構成されています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:42:45 GMT)
HierLoc: Hyperbolic Entity Embeddings for Hierarchical Visual Geolocation [12.4] 画像と画像の検索を,ハイパーボリック空間に埋め込まれた地理的エンティティのコンパクトな階層構造に置き換える。
画像は、土地、地域、小地域、都市と直接的に一致し、地理的に重み付けられた双曲的学習を通して、対照的な目的にハーシン距離を直接組み込む。
文献の現在の方法と比較すると、平均測地誤差を19.5%削減し、細粒度のサブリージョン精度を43%改善している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:16:07 GMT)
Bias Beyond Borders: Political Ideology Evaluation and Steering in Multilingual LLMs [12.3] 本稿では,50か国,33か国にまたがる政治的偏見の大規模多言語評価について述べる。
我々は,既存のステアリング手法を強化するために,CLAS(Cross-Lingual Alignment Steering)という補足的ポストホック緩和フレームワークを導入する。
実験は、応答品質の低下を最小限に抑えながら、経済と社会の両軸に沿って実質的なバイアス低減を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:07:25 GMT)
Mitigating Cognitive Inertia in Large Reasoning Models via Latent Spike Steering [12.3] 大規模推論モデル(LRM)は、テスト時間計算をスケールすることで、優れた性能を実現している。
LRMは、しばしば認知的慣性(動作慣性)または剛性(方向慣性)のどちらかを過度に考える失敗パターンである認知的慣性(Cognitive Inertia)に悩まされる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:47:12 GMT)
MTDrive: Multi-turn Interactive Reinforcement Learning for Autonomous Driving [12.3] 軌道計画は自動運転における中核的な課題である。
強化学習によるMLLMは、"ロングテール"シナリオに対処する上で、有望であることを示している。
我々は,MLLMが環境フィードバックに基づいて軌道を反復的に洗練できるマルチターンフレームワークMTDriveを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:47:55 GMT)
Is Training Necessary for Anomaly Detection? [12.2] 現在の異常検出法は、異常を再構築するためのエンコーダ・デコーダモデルの訓練に依存している。
検索型異常検出(RAD)を提案する。
RADは、メモリに異常のない特徴を格納し、マルチレベル検索によって異常を検出する、トレーニング不要のアプローチである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:40:42 GMT)
Auto-Augmentation Contrastive Learning for Wearable-based Human Activity Recognition [12.1] 本稿では,ウェアラブルに基づくヒューマンアクティビティ認識(HAR)のための,エンドツーエンドの自動拡張コントラスト学習(AutoCL)手法を提案する。
AutoCLは、バックボーンのパラメータを共有し、自動拡張を学ぶためにジェネレータを組み込んだ、Siameseネットワークアーキテクチャに基づいている。
4つの広帯域HARデータセットに基づく実験により,提案手法は認識精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:22:05 GMT)
Matterhorn: Efficient Analog Sparse Spiking Transformer Architecture with Masked Time-To-First-Spike Encoding [12.0] スパイキングニューラルネットワーク(SNN)はエネルギー効率の良いLLM推論の候補として期待されている。
本稿では,マスク付きタイム・ツー・ファースト・スパイク符号化方式を統合したスパイク変換器であるMatterhornを提案する。
Matterhornは新たな最先端技術を確立し、既存のSNNを1.42%の精度で上回り、エネルギー効率は2.31倍向上した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:53:42 GMT)
ReLAPSe: Reinforcement-Learning-trained Adversarial Prompt Search for Erased concepts in unlearned diffusion models [12.0] マシン・アンラーニングは、テキスト・ツー・イメージ拡散モデルから不正な概念を取り除くための鍵となる防御メカニズムである。
この漏洩を悪用する既存の敵のアプローチは、基本的な制限によって制約される。
本稿では,ReLAPSeについて紹介する。ReLAPSeは,概念回復を強化学習問題として再編成する政策ベースの敵対的枠組みである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:56:50 GMT)
TabClustPFN: A Prior-Fitted Network for Tabular Data Clustering [11.9] データクラスタリングのためのネットワークであるTabClustPFNを紹介する。
クラスターの割り当てとクラスターの濃度の両方について、アモータイズされたベイズ推定を行う。
古典的、ディープ、アモート化されたクラスタリングベースラインよりも優れています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:18:19 GMT)
Mano: Restriking Manifold Optimization for LLM Training [11.8] 大規模言語モデル(LLM)は人工知能の重要な進歩として現れている。
Manoは、多様体最適化とモダン性の間のパフォーマンスギャップを橋渡しした最初の人です。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:07:03 GMT)
Particle-Guided Diffusion Models for Partial Differential Equations [11.8] 物理に基づく誘導による拡散モデルからのサンプリングを増強するガイド付きサンプリング手法を提案する。
我々はこのサンプリング手順を新しいSequential Monte Carloフレームワークに組み込み、スケーラブルな生成PDEソルバを生成する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:30:24 GMT)
Deep Search with Hierarchical Meta-Cognitive Monitoring Inspired by Cognitive Neuroscience [11.7] 本稿では,階層的メタ認知監視機構を付加したディープサーチフレームワークであるDep Search with Meta-Cognitive Monitoring (DS-MCM)を提案する。
DS-MCMは、モニタリングを直接推論と検索のループに埋め込むことで、介入がいつ保証されたか、どのように修正アクションが事前の経験によって通知されるべきかを判断する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:10:48 GMT)
From Horizontal Layering to Vertical Integration: A Comparative Study of the AI-Driven Software Development Paradigm [11.7] 本稿では,ソフトウェア工学におけるジェネレーティブAI導入の組織的意義について,複数ケース比較研究を通じて検討する。
水平層から垂直層への遷移は資源消費を8倍から33倍に削減する。
我々は,上級技術者のアイドル認知帯域の再活性化など,組織再設計のための管理戦略で締めくくった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:38:16 GMT)
Agnostic Language Identification and Generation [11.7] 言語識別と生成に関する最近の研究は、厳密な統計率を確立している。
我々は、この実現可能性の仮定を完全に緩和し、入力データの分布に制限を加えない。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:26:28 GMT)
SurfelSoup: Learned Point Cloud Geometry Compression With a Probablistic SurfelTree Representation [11.5] SurfelSoupは、ポイントクラウド幾何学圧縮のためのエンドツーエンドの学習フレームワークである。
これはオクツリーのような階層であるpSurfelTreeに編成され、木決定モジュールは、速度歪みの最適サーフェル粒度選択のために木分割を適応的に終了する。
また,MPEG標準G-PCC-GesTM-TriSoupでは,ボクセルベースラインやMPEG標準G-PCC-GesTM-TriSoupよりも幾何圧縮が一貫した向上を示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:47:48 GMT)
Offline Reinforcement Learning of High-Quality Behaviors Under Robust Style Alignment [11.5] サブトラジェクティブラベリング機能を用いた明示的なスタイル監視を用いたスタイル条件付きポリシーのオフライン強化学習について検討する。
SCIQL(Style-Conditioned Implicit Q-Learning)を導入する。
実験によると、SCIQLは、以前のオフラインメソッドと比較して、両方の目的において優れたパフォーマンスを達成している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:49:22 GMT)
Beyond Activation Patterns: A Weight-Based Out-of-Context Explanation of Sparse Autoencoder Features [11.5] 現在の解釈法では、アクティベーションパターンから特徴セマンティクスを推測するが、前方通過における計算的役割を果たすアクティベーションを再構築するために特徴が訓練されているという見落としがある。
本稿では, 直接重み相互作用による機能的効果を計測し, アクティベーションデータを必要としない新しいウェイトベース解釈フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:30:48 GMT)
MC-GRPO: Median-Centered Group Relative Policy Optimization for Small-Rollout Reinforcement Learning [11.5] グループ相対ポリシー最適化手法は,プロンプト毎に複数のロールアウトを生成することで,言語モデルを訓練する。
ロールアウト予算が小さいリソース制約のある環境では、精度が低下することが多い。
我々は,小規模ロールアウト学習のためのシンプルかつ効果的なソリューションであるMC-GRPO(Median-Centered Group Relative Policy Optimization)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:24:51 GMT)
PA-MIL: Phenotype-Aware Multiple Instance Learning Guided by Language Prompting and Genotype-to-Phenotype Relationships [11.3] Phenotype-Aware Multiple Instance Learning (PA-MIL)は、病理組織全体から癌関連表現型を識別する新しいフレームワークである。
がん関連表現型とその関連遺伝子型を含む表現型知識基盤を構築した。
我々は,遺伝子型間フェノタイプ関係に基づくGP-NN(Genotype-to-Phenotype Neural Network)を考案し,PA-MILのマルチレベルガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:05:51 GMT)
PEFT-MuTS: A Multivariate Parameter-Efficient Fine-Tuning Framework for Remaining Useful Life Prediction based on Cross-domain Time Series Representation Model [11.1] データ駆動型残留有用寿命(RUL)予測の適用は、大量の劣化データの可用性によって長い間制約されてきた。
本研究はPEFT-MuTS, aについて検討する。
クロスドメイン事前学習時系列表現モデルに基づく数ショットRUL予測のための効率的なファインチューニングフレームワーク。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:46:57 GMT)
TTSA3R: Training-Free Temporal-Spatial Adaptive Persistent State for Streaming 3D Reconstruction [11.1] ストリーミングリカレントモデルは、永続的な状態表現を維持することで効率的な3D再構成を可能にする。
近年の手法では、アダプティブシグナルを注意視点から導き出すことによってこれを緩和している。
本稿では,時間的状態の進化と空間的観察品質の両面を活用する,TTSA3Rというトレーニングフリーフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:14:42 GMT)
DIVERGE: Diversity-Enhanced RAG for Open-Ended Information Seeking [11.0] 本稿では,新しいリフレクション誘導生成とメモリ拡張反復改善機能を備えたプラグアンドプレイエージェントRAGフレームワークを提案する。
我々は,DIVERGEが競争基準よりも優れた多様性と品質のトレードオフを達成できることを実証した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:03:11 GMT)
TriPlay-RL: Tri-Role Self-Play Reinforcement Learning for LLM Safety Alignment [10.9] 本稿では,TriPlay-RLと呼ばれるクローズドループ強化学習フレームワークを提案する。
実験結果から,攻撃者は高い出力の多様性を保ちつつ,敵の効率を20%-50%向上させ,防御力は一般的な劣化推論能力のない安全性能で10%-30%向上し,評価器は反復によるきめ細かい判断能力を継続的に改善することがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:12:01 GMT)
Inference-Time Dynamic Modality Selection for Incomplete Multimodal Classification [10.9] Inference-time dynamic modality selection frameworkであるDyMoを提案する。
Central to DyMoは、各テストサンプルのタスク関連情報を最大化する新しい選択アルゴリズムである。
様々な自然・医学的な画像データセットの実験により、DyMoは最先端の不完全/動的MDL法を著しく上回っている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:24:43 GMT)
Dynamic Welfare-Maximizing Pooled Testing [10.9] プールテストは、限られた検査資源の下での公衆衛生疾患スクリーニングの一般的な戦略である。
本研究では,限られた数の試験を順次実施するプールテスト戦略を最適化する動的福祉について検討する。
以上の結果から,低予算体制下での静的ベースラインよりも,動的試験が実質的な福祉改善をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:15:58 GMT)
Intelligent Reasoning Cues: A Framework and Case Study of the Roles of AI Information in Complex Decisions [10.9] 臨床診断における8種類の推論法の役割について検討した。
推論手法は、設計に直接情報を伝達できる影響のパターンが異なることが分かりました。
以上の結果から, 推論手法は, 高い可変性と判断性を有するタスクを優先し, 進化する意思決定ニーズとの整合性を確保するとともに, 複雑なケースに対する相補的で厳密な洞察を提供することが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:22:23 GMT)
Color Matters: Demosaicing-Guided Color Correlation Training for Generalizable AI-Generated Image Detection [10.8] 本稿では,AI生成画像検出のためのデモサイジング誘導色相関トレーニングフレームワークを提案する。
自己教師付きU-Netは、与えられたチャネルから欠落したチャネルの条件分布をモデル化するように訓練される。
理論的解析の結果,DCCTは画像とAI生成画像間の色相関特性の分布特性の証明可能な差異を目標としていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:01:49 GMT)
AACR-Bench: Evaluating Automatic Code Review with Holistic Repository-Level Context [10.8] AACR-Benchは、複数のプログラミング言語にまたがる完全なクロスファイルコンテキストを提供する包括的なベンチマークである。
従来のデータセットとは異なり、AACR-Benchは潜伏する欠陥を明らかにするために"AIアシスト、エキスパート検証"のアノテーションパイプラインを使用している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:43:52 GMT)
PowerGenie: Analytically-Guided Evolutionary Discovery of Superior Reconfigurable Power Converters [10.7] PowerGenieは、大規模な高性能リコンバータの自動発見のためのフレームワークである。
コンポーネントサイズやSPICEシミュレーションを使わずにコンバータ機能と理論的性能限界を決定する。
PowerGenieは、最高のトレーニングトポロジよりも23%高いフィギュア・オブ・メリットを持つ、新しい8モード再構成可能なコンバータを発見した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:35:12 GMT)
Just-in-Time Catching Test Generation at Meta [10.7] ジャスト・イン・タイムのキャッチテストは、コードが到着する前にバグを指摘して失敗することを目的としている。
符号変化認識手法は, ハードニング試験で4倍, 偶然に失敗した試験で20倍の予測値が得られることを示す。
8例は真陽性と確認され、そのうち4例は未発見のままでは深刻な失敗に繋がった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:58:32 GMT)
SOMBRERO: Measuring and Steering Boundary Placement in End-to-End Hierarchical Sequence Models [10.5] 本稿では,境界品質のルータに依存しない境界エンリッチメントBを導入する。
本研究では,信頼度調整境界損失による予測困難に対する学習を推し進め,信頼オフと精度重み付き貿易平滑化を適用して学習を安定化させるSombreroを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:34:07 GMT)
Constructing Safety Cases for AI Systems: A Reusable Template Framework [10.4] 安全ケース、つまりシステムが確実に安全であるという構造化された議論は、AIシステムのガバナンスの中心になりつつある。
航空や原子力工学の伝統的な安全ケースのプラクティスは、明確に定義されたシステムの境界、安定したアーキテクチャ、既知の障害モードに依存している。
本研究では、AIシステムにおける安全ケースの構築方法と、古典的アプローチがこれらのダイナミクスを捉えることができない理由について検討する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:53:22 GMT)
Learning with Challenges: Adaptive Difficulty-Aware Data Generation for Mobile GUI Agent Training [10.4] MobileGenは、GUIエージェントの機能フロンティアとトレーニングの難しさを一致させる、新しいデータ生成フレームワークである。
GUIエージェントの平均性能を1.57倍改善することで、既存のデータ生成手法を一貫して上回っている。
このことは、効果的なモバイルGUIエージェントトレーニングにおける機能整合データ生成の重要性を強調している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:03:20 GMT)
CiMRAG: CiM-Aware Domain-Adaptive and Noise-Resilient Retrieval-Augmented Generation for Edge-Based LLMs [10.4] Retrieval-Augmented Generation (RAG)は、関連するプロファイルデータを検索し、調整された応答を生成することでパーソナライズするための重要な方法である。
計算メモリ(CiM)アーキテクチャは、メモリと処理ユニット間のデータ移動をin-situ操作によって排除することで、このボトルネックを軽減する。
本稿では,雑音環境におけるRAGのノイズおよびドメイン適応性を改善するフレームワークである,タスク指向型ノイズ-レジリエントな埋め込み学習を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:00:53 GMT)
Where Do the Joules Go? Diagnosing Inference Energy Consumption [10.3] 我々は、46のモデル、7のタスク、1,858の異なる構成を持つ生成AIランドスケープ全体にわたって、推論時間とエネルギーを大規模に測定する。
LLMタスクタイプは25$times$エネルギー差をもたらし、ビデオ生成は100$times$画像のエネルギーを消費し、GPU利用率の違いは3-5$times$エネルギー差をもたらす。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:31:56 GMT)
FOCUS: DLLMs Know How to Tame Their Compute Bound [10.3] FOCUSは拡散大言語モデル(DLLM)のための推論システムである
計算はデオード可能なトークンに焦点を合わせ、非デコーダなトークンをオンザフライで取り除く。
プロダクショングレードエンジンのLMMよりも最大3.52$timesのスループット向上を実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:52:06 GMT)
VocBulwark: Towards Practical Generative Speech Watermarking via Additional-Parameter Injection [10.2] VocBulwarkは、知覚品質を維持するために生成モデルパラメータを凍結するフレームワークである。
VocBulwarkは高容量かつ高忠実な透かしを実現し、複雑な実践シナリオに対して堅牢な防御を提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:51:50 GMT)
VarParser: Unleashing the Neglected Power of Variables for LLM-based Log Parsing [10.2] ログは、大規模なオンラインサービスシステムの障害を診断するエンジニアにとって、主要な情報源となる。
大規模言語モデル(LLM)の進歩により、その強力なテキスト理解能力を活用することは、正確なログ解析に有効であることが証明された。
既存のLLMベースのログはすべて、ログ解析に対する変数部分の潜在的貢献を無視して、ログの一定部分に焦点を当てている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:49:54 GMT)
AST-PAC: AST-guided Membership Inference for Code [10.2] コード大言語モデルは、ライセンスされたソースコードを含む巨大なデータセットで頻繁に訓練される。
メンバーシップ推論攻撃(MIA)は、モデルにおける不正なデータ使用を検出する監査メカニズムとして機能する。
本稿では,これらの手法を3B--7Bパラメーターコードモデル上で評価する探索的研究を行う。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:23:38 GMT)
E2CAR: An Efficient 2D-CNN Framework for Real-Time EEG Artifact Removal on Edge Devices [10.1] 脳波(EEG)信号は、しばしば人工物によって汚染される。
伝統的なアーティファクト除去法は、しばしば計算コストが高く、エッジデバイスにおけるリアルタイムアプリケーションには非効率である。
本稿では,1次元(1-D)CNNを2次元(2-D)CNNに置き換えることで,既存の畳み込みニューラルネットワーク(CNN)の計算コストを削減する手法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:22:14 GMT)
CoVA: Text-Guided Composed Video Retrieval for Audio-Visual Content [10.1] Composed Video Retrieval(CoVR)は、参照ビデオと、視覚的な修正を指定したテキストクエリを使用して、大きなギャラリーからターゲットビデオを取得することを目的としている。
視覚と聴覚の両方のバリエーションを考慮に入れた新しい検索タスクであるAudio CoVAで、ビデオのコンポジション検索を導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:36:43 GMT)
GRANITE: A Generalized Regional Framework for Identifying Agreement in Feature-Based Explanations [10.1] 特徴に基づく説明法は、機能がモデルの振る舞いにどのように影響するかを、局所的またはグローバル的に定量化することを目的としているが、異なる方法はしばしば一致しない。
本稿では,特徴空間を相互作用や分布の影響を最小限に抑える領域に分割する一般化された地域説明フレームワークを提案する。
実世界のデータセット上での有効性を実証し、一貫性と解釈可能な特徴説明のための実用的なツールを提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:49:26 GMT)
How should AI Safety Benchmarks Benchmark Safety? [10.0] 安全ベンチマークにおける共通課題をマップする210の安全ベンチマークのレビューを行う。
我々は、確立されたリスク管理原則に従うことで、AI安全ベンチマークの有効性と有用性を大幅に向上させることができると論じる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:58:59 GMT)
Training LLMs with Fault Tolerant HSDP on 100,000 GPUs [10.0] 同期トレーニングは、頻繁な障害と長い回復時間により、効率が低下する。
我々は、FT-HSDP(Fault Tolerant Hybrid-Shared Data Parallelism)を提案する。
FT-HSDPはフォールトトレランスの単位としてデータ並列レプリカを使用する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:57:36 GMT)
A Practical Framework of Key Performance Indicators for Multi-Robot Lunar and Planetary Field Tests [9.9] 本研究では,月面上の重要な資源に対するロボット探査を評価するための枠組みを提案する。
本フレームワークは, 効率性, 堅牢性, 精度のシナリオ依存的優先順位を重視し, 現場展開における実用性を重視した設計である。
全体として、本フレームワークは、マルチロボットフィールド試行の一貫性のある目標指向比較を可能にする共通の評価基準として提案されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:02:50 GMT)
Why GRPO Needs Normalization: A Local-Curvature Perspective on Adaptive Gradients [9.9] Group Relative Policy Optimization (GRPO) は、Reinforcement Learning (RL)アルゴリズムのデファクト標準である。
標準偏差正規化は適応勾配を具現化する。
軽度条件下では,GRPOは非正規化REINFORCEよりも厳格に収束率を向上し,平均的な報酬標準偏差が特徴的であることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:23:43 GMT)
GRIP2: A Robust and Powerful Deep Knockoff Method for Feature Selection [9.9] グループ規則化重要度2次元(GRIP2)は、2次元正則化面上の第1層の特徴活性を統合する。
合成および半実データの実験において、GRIP2は特徴相関と雑音レベルの改善を実証した。
現実のHIV薬剤耐性データでは、GRIP2は既知の抵抗関連変異を、確立された線形塩基性よりも優れたパワーで回収する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:30:49 GMT)
On the calibration of survival models with competing risks [9.8] 既存のキャリブレーション対策が競合リスク設定に適していないことを示す。
オラクル推定器で最小化される2つの新しい校正手法を導入する。
我々の校正法は差別を保ちながら良好な確率を得る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:23:33 GMT)
LPIPS-AttnWav2Lip: Generic Audio-Driven lip synchronization for Talking Head Generation in the Wild [9.7] 本稿では,音声に基づく任意の話者の顔画像再構成のための汎用手法LPIPS-AttnWav2Lipを提案する。
提案手法は, リップ同期精度と視覚的品質の観点から, 優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:02:49 GMT)
Robust automatic brain vessel segmentation in 3D CTA scans using dynamic 4D-CTA data [9.7] 動的4D-CTA頭部スキャンを用いた脳血管造影法を開発した。
我々は、動的4D-CTAコレクションから複数のフェーズに同じセグメンテーションを用いて、地上の真理アノテーションに基づいてディープラーニングモデルを訓練する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:10:48 GMT)
EndoCaver: Handling Fog, Blur and Glare in Endoscopic Images via Joint Deblurring-Segmentation [9.6] EndoCaverは、一方向誘導デュアルデコーダアーキテクチャを備えた軽量トランスフォーマーである。
画像のデブロアやセグメンテーションのためのジョイントマルチタスク機能を実現する。
デバイス上の臨床展開に適している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:18:04 GMT)
Detecting AI-Generated Content in Academic Peer Reviews [9.5] 本研究では、過去のレビューに基づいて訓練された検出モデルを適用し、ピアレビューにおけるAI生成コンテンツの時間的出現について検討する。
我々は2022年以前のAI生成コンテンツの最小限の検出と、2025年までの大幅な増加を観察する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:15:08 GMT)
Improved Algorithms for Nash Welfare in Linear Bandits [9.4] 線形包帯において,次数最適ナッシュ残差を生じる新しい解析ツールを導入する。
本稿では,任意の線形帯域戦略上のメタアルゴリズムとして機能する汎用アルゴリズムフレームワークであるFairLinBanditを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:32:37 GMT)
SCALED : Surrogate-gradient for Codec-Aware Learning of Downsampling in ABR Streaming [9.4] 現在、Over-the-Top (OTT)配信は、主にAdaptive Bitrate (ABR)ストリーミングに依存している。
ディープラーニングは、学習された再サンプリング手法を使用してABRパイプラインを共同最適化することへの関心を喚起している。
そこで本研究では,現実の非微分可能コーデックによるエンドツーエンドのトレーニングを可能にする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:38:35 GMT)
Hybrid operator learning of wave scattering maps in high-contrast media [9.4] 本稿では,散乱演算子をスムーズな背景伝搬と高コントラスト散乱補正という2つの別々の寄与に分解するハイブリッドアーキテクチャを提案する。
ハイブリッドモデルでは、スタンドアロンのFNOや変圧器に比べて位相と振幅の精度が大幅に向上する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:11:01 GMT)
Does My Chatbot Have an Agenda? Understanding Human and AI Agency in Human-Human-like Chatbot Interaction [9.3] 筆者らが構築したLLMコンパニオンであるデイとチャットした22人の成人を対象に,1カ月にわたる縦断的研究を行った。
私たちは、人間とAIのチャットルームにおけるエージェンシーが、創発的で共有された体験であることに気付きました。
我々は、透明なデザイン(すなわち透明性オンデマンド)、代理店交渉のためのスペース、代理店を意識した会話型AIに対するガイドラインを論じる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:42:32 GMT)
AI and My Values: User Perceptions of LLMs' Ability to Extract, Embody, and Explain Human Values from Casual Conversations [9.3] 13人の参加者が、AIが人間の価値を理解することを確信した。
私たちは、"Weaponized Empathy"について警告しています。これは、価値に整合するが、福祉に整合したAIで生じる可能性のある、潜在的に危険なデザインパターンです。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:19:54 GMT)
LLM-42: Enabling Determinism in LLM Inference with Verified Speculation [9.1] LLM推論では、同じプロンプトが異なるランで異なるアウトプットを生成する。
この非決定論は、浮動小数点非結合性と動的トークンの組み合わせから生じる。
推論における決定性を実現するためのスケジューリングベースのアプローチであるLSM-42を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:59:09 GMT)
PromptMAD: Cross-Modal Prompting for Multi-Class Visual Anomaly Localization [9.0] 本稿では,教師なし視覚異常検出と局所化のためのクロスモーダルプロンプトフレームワークPromptMADを提案する。
本手法は,意味的コンテキストによる視覚的再構成を強化し,微妙・テクスチュラルな異常の検出を改善する。
我々のアーキテクチャには、マルチスケールの畳み込み機能とトランスフォーマーに基づく空間的注意を融合させる教師付きセグメンタも含まれている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:04:06 GMT)
AutoMerge: Search-Based Model Merging Framework for Effective Model Reuse [9.0] 近年,大規模言語モデル (LLM) の分野において,学習自由なアプローチとしてモデルマージが出現している。
このようなアプローチが他のディープラーニングモデルに効果的に適用できるかどうかを体系的に検討する以前の研究はない。
3つの異なるモデルアーキテクチャ上で5つのモデルマージ手法を評価する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:27:01 GMT)
Keep Rehearsing and Refining: Lifelong Learning Vehicle Routing under Continually Drifting Tasks [8.9] 本研究では,学習時間ステップよりも連続的なドリフトタスクの下で,ニューラルVRPソルバのための新しい生涯学習パラダイムについて検討する。
本稿では、学習効率の向上と、そのようなドリフト下での破滅的な忘れを軽減するための一般的なフレームワークであるDREE(Dual Replay with Experience Enhancement)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:37:39 GMT)
Neuron Block Dynamics for XOR Classification with Zero-Margin [8.9] ガウスXOR問題を解析してゼロマージン非線形分類を研究する。
無視できないデータの断片は境界に任意に近づき、標準のマージンベースの議論を破る。
ニューロンは4方向に集束し、ブロックレベルの信号はコヒーレントに進化することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:29:11 GMT)
AscendCraft: Automatic Ascend NPU Kernel Generation via DSL-Guided Transcompilation [8.9] 本稿では,自動アセンドCカーネル生成のためのDSL誘導型アプローチであるAscendCraftを提案する。
AscendingCraftは98.1%のコンパイル成功と90.4%の機能的正しさを達成した。
また、DSL誘導トランスコンパイルにより、LLMが正しいNPUカーネルと競合するNPUカーネルの両方を生成することができることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:34:59 GMT)
BEAR: Towards Beam-Search-Aware Optimization for Recommendation with Large Language Models [8.7] BEAR(Beam-Search-Aware Regularization)は、トレーニング中のビーム探索動作を明示的に考慮した、新しい微調整目標である。
4つの実世界のデータセットにわたる実験において、強力なベースラインを著しく上回る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:45:02 GMT)
Deep in the Jungle: Towards Automating Chimpanzee Population Estimation [8.7] 大類類人猿の個体数と密度の推定は、動物からカメラまでの距離の測定を必要とする統計的枠組みに依存している。
本研究は, コンピュータビジョンに基づく単眼深度推定パイプラインを生態カメラトラップ距離に直接統合し, 猿の保護に有効であることを示す。
野生チンパンジーの個体数を記録した220枚のカメラトラップ映像の実際のデータセットを用いて、Dense Prediction TransformersとDepth Anythingの2つのMDEモデルと、複数の距離サンプリング戦略を組み合わせる。
提案手法は,従来の手法を用いて得られた個体数の22%以内の個体数を推定する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:40:47 GMT)
Layer-wise Swapping for Generalizable Multilingual Safety [8.7] 既存の安全データセットは主に英語中心であり、多言語安全アライメントの進歩を制限する。
本稿では、英語の安全専門家から低リソース言語専門家への安全アライメントを追加訓練なしで伝達する安全意識層スワップ手法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:22:02 GMT)
Bi-MCQ: Reformulating Vision-Language Alignment for Negation Understanding [8.6] Bi-MCQは、最先端のZero CARモデルのゼロショット性能に対して、最大0.47 MCQ AUCの否定的理解を改善する。
Bi-MCQはInfoNCEベースの微調整と比較して、肯定的負のAUCギャップを平均0.12削減する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:14:45 GMT)
Token-Guard: Towards Token-Level Hallucination Control via Self-Checking Decoding [8.6] Token-Guardは自己チェックデコードに基づくトークンレベルの幻覚制御手法である。
HALUデータセットの実験では、Token-Guardは幻覚を大幅に減らし、生成精度を向上させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:59:30 GMT)
SQUAD: Scalable Quorum Adaptive Decisions via ensemble of early exit neural networks [8.5] 本稿では,早期終了機構と分散アンサンブル学習を統合した最初の推論手法であるSQUADを紹介する。
また,階層的多様性を最適化した早期学習者を選択するニューラルネットワーク探索手法であるQUESTを導入する。
このコンセンサス駆動のアプローチは統計的に堅牢な早期出口をもたらし、最先端の動的解と比較してテスト精度を5.95%向上させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:32:33 GMT)
Evaluating the Utility of Grounding Documents with Reference-Free LLM-based Metrics [8.5] グラウンドイングジェネレーションユーティリティ(GroGU)は、エントロピーに基づく下流LLMの生成信頼度関数としてユーティリティを定義するモデル固有のメトリクスである。
実験では、平均相反ランクで最大18.2ポイント、解答精度で最大9.4ポイントの改善が示されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:17:07 GMT)
Modeling Image-Caption Rating from Comparative Judgments [8.5] 直接評価ではなく,このような比較判断をモデル化する機械学習フレームワークを提案する。
モデルを適用することで、直接評価に基づいてトレーニングされた回帰モデルと同じ方法で、目に見えない画像キャプチャペアをランク付けすることができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:00:07 GMT)
Beyond the Loss Curve: Scaling Laws, Active Learning, and the Limits of Learning from Exact Posteriors [8.4] 実写画像で正確な後部を抽出可能なオラクルとして,クラス条件正規化フローを用いる。
我々のフレームワークは、標準メトリクスが進行中の学習を隠蔽し、アーキテクチャの違いを隠蔽し、分散シフトの性質を診断できないことを明らかにしている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:08:55 GMT)
Self-Supervised Slice-to-Volume Reconstruction with Gaussian Representations for Fetal MRI [8.2] 運動崩壊した2Dスライススタックから3D胎児のMRボリュームを再構築することは、重要かつ困難な課題である。
本稿では,スライス・ツー・ボリューム再構築のための自己教師型フレームワークであるGaussianSVRを提案する。
高忠実度再構成を実現するために3次元ガウス表現を用いて目標体積を表す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:56:44 GMT)
One-shot Optimized Steering Vector for Hallucination Mitigation for VLMs [8.1] 視覚言語モデル(VLM)は、マルチモーダルタスクにおいて高いパフォーマンスを達成するが、まだ幻覚や安全関連の障害に悩まされている。
textbf1-shot textbfSteering with textbfGenerative textbfAnchorは、単一の最適化インスタンスでモデル性能を改善するための、入力に依存しないフレームワークである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:47:59 GMT)
Unconventional Distance Scaling of Casimir-Polder Force between Atomic Arrays [8.0] 2つの原子配列間のカシミール・ポルダー相互作用について検討する。
我々は、短距離での高速な崩壊から遅角状態における緩やかな崩壊まで、力が交差する非伝統的な距離のスケーリングを明らかにする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:57:40 GMT)
FedCARE: Federated Unlearning with Conflict-Aware Projection and Relearning-Resistant Recovery [8.0] フェデレートラーニング(FL)は、生データを集中化せずに協調的なモデルトレーニングを可能にするが、忘れられる権利のようなプライバシー規制は、リクエスト時に以前使用されていたトレーニングデータの影響を取り除くためにFLシステムを必要とする。
我々は、コンフリクト対応の未学習と再学習耐性回復を可能にする統一的で低オーバーヘッドなFUフレームワークであるFedCAREを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:36:31 GMT)
DAVIS: OOD Detection via Dominant Activations and Variance for Increased Separation [7.9] DAVISは,重要な統計情報を組み込むことで特徴を豊かにする,シンプルで広く適用可能なポストホック手法である。
偽陽性率(FPR95)は48.26%をResNet-18で改善し、CIFAR-100で38.13%をResNet-34で、ImageNet-1kで26.83%をMobileNet-v2で改善した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:23:14 GMT)
VoxServe: Streaming-Centric Serving System for Speech Language Models [7.9] 本稿では,ストリーミング性能を最適化するSpeechLMのための統合サービスシステムであるVoxServeを提案する。
VoxServeは、モデルアーキテクチャをシステムレベルの最適化から切り離すモデル実行抽象化を導入している。
我々は,VoxServeが既存のSpeechLMの10~20倍のスループットを実現していることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:45:59 GMT)
GAC-KAN: An Ultra-Lightweight GNSS Interference Classifier for GenAI-Powered Consumer Edge Devices [7.7] 本稿では,GAC-KANという新しいフレームワークを提案する。
GAC-KANの全体的な精度は98.0%であり、最先端のベースラインを上回っている。
この極端に軽量な特徴は、GAC-KANを理想的な「常時オン」セキュリティコンパニオンとし、プライマリGenAIが必要とする計算リソースと競合することなく信頼性を確保する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:33:30 GMT)
Strongly Polynomial Time Complexity of Policy Iteration for $L_\infty$ Robust MDPs [7.7] 頑健なポリシー反復は、定数(固定された)割引係数を持つ$(s, a)$-正方形$L_infty$RMDPsに対して強ポリノミカル時間で実行されることを示す。
マルコフと強い多項式時間アルゴリズムの存在は、これらの最適化モデルの基本的問題である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:57:07 GMT)
From Absolute to Relative: Rethinking Reward Shaping in Group-Based Reinforcement Learning [7.7] 本稿では,報酬形成を絶対得点から相対ランクへシフトさせるために,相対報酬を用いた強化学習を提案する。
RLRRは、推論ベンチマークやオープン・エンド・ジェネレーションタスクにおいて、標準グループベースベースラインよりも一貫した性能向上をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:07:06 GMT)
Toward Non-Expert Customized Congestion Control [7.6] 汎用渋滞制御アルゴリズム(CCAs)は,一般的な混雑制御目標を達成するために設計されているが,特定のユーザの要求を満たすものではない。
我々は,非エキスパートユーザがカスタマイズされたCCAを簡単にモデル化,実装,デプロイできる,NECCという,探索的でないカスタマイズされたCCAフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:14:28 GMT)
ReNCE: Learning to Reason by Noise Contrastive Estimation [7.6] GRPOは、事前訓練されたLLMに推論機能を持たせるための標準的なアプローチである。
優位性を推定する代わりに、正と負の集合に$K$の結果を二分する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:57:31 GMT)
Toward IIT-Inspired Consciousness in LLMs: A Reward-Based Learning Framework [7.6] 本稿では、報酬に基づく学習パラダイムを用いて、言語モデルにおける意識の先導的理論である統合情報理論(IIT)の実装について検討する。
テキストの因果性、一貫性、統合性、意識的な処理に関連する特徴を定量化する新しい報酬関数を定式化する。
ドメインタスクの内、注意深いチューニングは、ベースモデルに匹敵する精度を維持しながら、出力長を最大31%削減する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:07:58 GMT)
Stabilizing the Q-Gradient Field for Policy Smoothness in Actor-Critic [7.5] 政策非平滑性は批評家の微分幾何学によって支配されていると論じる。
批判中心の正規化フレームワークであるPAVEを紹介する。
PAVEは局所曲率を維持しながらQ段階のボラティリティを最小化して学習信号を補正する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:32:52 GMT)
Automating Forecasting Question Generation and Resolution for AI Evaluation [7.5] 本稿では,高品質な予測質問を自動的かつ大規模に生成・解決するシステムを提案する。
このシステムを使って1499の多様な実世界の予測質問を生成し、数ヶ月後に解決します。
我々は,メタキュラスの速度を超える確率で約96%の確率で検証可能な不明瞭な質問を生成すると見積もっている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:27:23 GMT)
Hybrid Cross-Device Localization via Neural Metric Learning and Feature Fusion [7.4] CroCoDL 2025 Challengeのために開発されたハイブリッドデバイスクロスデバイスローカライゼーションパイプラインを提案する。
提案手法では,共有検索エンコーダと2つの補完枝,古典幾何学的分岐とニューラルフィードフォワード分岐を統合した。
最終スコアは92.62(R@0.5m, 5)であった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:45:43 GMT)
Why Your Deep Research Agent Fails? On Hallucination Evaluation in Full Research Trajectory [7.4] 深層研究エージェント(DRA)の故障メカニズムの診断は依然として重要な課題である。
既存のベンチマークは主にエンドツーエンドの評価に依存しており、重要な中間幻覚を隠している。
機能成分とエラー特性に沿った幻覚を分類するためにPIES分類を導入した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:49:09 GMT)
Learning to Defer in Non-Stationary Time Series via Switching State-Space Models [7.4] 本研究では,非定常時系列の学習 to Deferについて,部分的なフィードバックと時間変化による専門家の可用性について検討する。
L2D-SLDSは文脈依存型状態遷移を持つ線形ガウス状態空間モデルである。
IDSにインスパイアされたルーティングルールを提案し、予測コストを、潜伏体制や共有要因に関する情報と引き換えに取引する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:18:42 GMT)
Sparse or Dense? A Mechanistic Estimation of Computation Density in Transformer-based LLMs [7.4] 変換器をベースとした大規模言語モデル(LLM)は、深層および広範囲の計算グラフに配置された数十億のパラメータで構成されている。
本稿では,LLMの計算密度を体系的に定量化する手法を紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:18:29 GMT)
Self-Imitated Diffusion Policy for Efficient and Robust Visual Navigation [7.3] SIDP(Self-Imitated Diffusion Policy)は、自己からサンプリングされた一連の軌跡を選択的に模倣することによって、計画の改善を学ぶ新しいフレームワークである。
具体的には、SIDPは報酬誘導型自己刺激機構を導入し、政策が常に高品質な軌道を効率的に生成することを奨励する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:27:59 GMT)
From Similarity to Vulnerability: Key Collision Attack on LLM Semantic Caching [7.2] 本稿では,キャッシュ衝突による整合性リスクに関する最初の体系的研究について述べる。
我々は、ブラックボックス衝突攻撃を起動する自動化フレームワークであるCacheAttackを紹介した。
金融エージェントに関するケーススタディでは、これらの脆弱性の現実的な影響が示されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:37:00 GMT)
Benchmarking Uncertainty Calibration in Large Language Model Long-Form Question Answering [7.2] 大きな言語モデル(LLM)は質問回答(QA)設定で一般的に使用される。
既存のUQアプローチは、科学的QAでは弱い検証が残っている。
推論要求QAにおけるUQ指標を評価するための,最初の大規模ベンチマークを紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:02:34 GMT)
Region-Normalized DPO for Medical Image Segmentation under Noisy Judges [7.1] Region-Normalized DPOは、マスク間の不一致領域のサイズによって好みの更新を正規化するセグメンテーション対応の目的である。
追加のピクセルアノテーションを必要とせずに、好みベースの微調整、標準のDPO、強力なベースラインを安定させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:45:53 GMT)
Gender Disparities in StackOverflow's Community-Based Question Answering: A Matter of Quantity versus Quality [7.0] 人間の評価と大規模言語モデルを用いた自動評価を組み合わせることで,回答の質が性別の影響を受けているかを検討する。
回答の質に有意な性別差は見られず、また、ベスト回答の選択に対する性別バイアスの実質的な影響もない」と述べた。
本結果は,コミュニティ質問応答プラットフォームにおけるスコアリングシステムの設計に重要な意味を持つ。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:16:01 GMT)
Toward Fully Autonomous Driving: AI, Challenges, Opportunities, and Needs [6.9] 自動運転(AD)は有望だが、完全自動運転への移行は、現実の、絶え間なく変化するオープンな世界が対象だ。
ADの分野での研究は、古典的なアプローチを上回る人工知能(AI)の能力を示している。
同時に、AIの使用は、安全性と転送可能性に関するさらなる疑問を提起する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:45:44 GMT)
Degradation-Aware Frequency Regulation of a Heterogeneous Battery Fleet via Reinforcement Learning [6.8] 繰り返し充電と放電はサイクル劣化を誘発し、バッテリー寿命を減少させる。
本稿では,バタリーランプレートとキャパシティ制約による信号の集合的追跡を行う異種電池群のリアルタイムスケジューリングについて検討する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:44:53 GMT)
EEO-TFV: Escape-Explore Optimizer for Web-Scale Time-Series Forecasting and Vision Analysis [6.8] トランスフォーマーベースの基礎モデルは、時系列予測や画像セグメント化といったタスクにおいて顕著な進歩を遂げている。
彼らは多変量長周期予測におけるエラーの蓄積に悩まされ、画像関連タスクにおけるアウト・オブ・ディストリビューション・サンプルに対する脆弱性を示す。
本稿では,新しいEscape-Explore(EEO)とともに軽量トランスフォーマーアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:30:16 GMT)
Adapting Reinforcement Learning for Path Planning in Constrained Parking Scenarios [6.7] 駐車場におけるリアルタイム経路計画のためのDeep Reinforcement Learningフレームワークを提案する。
古典的なプランナーとは異なり、我々の解は理想的で構造化された知覚を必要としない。
テスト時には、ポリシーは各ステップで1つのフォワードパスを通じてアクションを生成します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:35:49 GMT)
Assistive Robots and Reasonable Work Assignment Reduce Perceived Stigma toward Persons with Disabilities [6.7] 本研究は、職場における障害者に対する認知的・行動的スティグマに関するヴィグネット研究である。
以上の結果から,作業課題が人の能力に適応したり,補助ロボットによって強化されたりすると,認知の便益は著しく低下することがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:08:38 GMT)
Faithful-Patchscopes: Understanding and Mitigating Model Bias in Hidden Representations Explanation of Large Language Models [6.6] 大規模言語モデルは、隠れ表現に符号化された文脈情報をオーバーライドできる固有の言語パターンに依存する傾向があることを示す。
この行動はパッチスコープにおいて体系的な不信感を示す。
本稿では,BALOR(Bias Alignment through Logit Recalibration)を提案する。これは未パッチのプロンプトからの出力ロジットをモデルバイアスのキャプチャとして扱い,パッチ付きコンテキスト情報に基づいて得られるロジットと対比する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:50:18 GMT)
User Prompting Strategies and Prompt Enhancement Methods for Open-Set Object Detection in XR Environments [6.6] オープンセットオブジェクト検出(OSOD)は、推論時に未知のクラスを特定し、拒否しながらオブジェクトをローカライズする。
インタラクティブなXR設定では、ユーザ生成プロンプトは曖昧で、仕様が不明確で、詳細が多すぎることが多い。
XR環境におけるOSODモデルのいくつかのプロンプト戦略とプロンプト拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:55:38 GMT)
Elastic Spectral State Space Models for Budgeted Inference [6.6] ファンデーションモデルは一般的に、固定された計算能力でトレーニングされるが、現実のアプリケーションは異なるリソース制約を持つプラットフォームにデプロイする必要がある。
本研究では,フル能力で1回のトレーニングしか必要としないElastic Spectral State Space Model (ES-SSM)を提案する。
本研究では,1回トレーニングしたES-SSMモデルに対して,現代的なTransformerとSSMのベースラインを同様のパラメータスケールで比較して,競合性能を実現することができることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:58:19 GMT)
Towards Resiliency in Large Language Model Serving with KevlarFlow [6.6] KevlarFlowは、ハードウェアの信頼性の低下とサービス可用性のギャップを埋めるために設計された、フォールトサービスアーキテクチャである。
KevlarFlowは平均回復時間(MTTR)を20倍に削減し、故障条件下では平均遅延を3.1倍改善することを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:17:27 GMT)
Multi-Speaker Conversational Audio Deepfake: Taxonomy, Dataset and Pilot Study [6.6] 実話と完全合成された2話者会話を含む2,830の音声クリップからなるマルチ話者対話型オーディオディープフェイクスデータセット(MsCADD)を新たに導入する。
このデータセットでは、LFCC-LCNN、RawNet2、Wav2Vec 2.0の3つのニューラルネットワークベースラインモデルをベンチマークし、F1スコア、正確性、真正レート(TPR)、真負レート(TNR)の観点から性能を報告する。
以上の結果から,これらのベースラインモデルが有用なベンチマークとなったが,合成音声を確実に検出する上で,マルチスピーカーディープフェイク研究において大きなギャップがあることが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:38:10 GMT)
Relaxing Positional Alignment in Masked Diffusion Language Models [6.5] マスケード拡散言語モデル(MDLM)は、支配的な自己回帰的アプローチに代わる有望な代替手段として登場した。
厳密な位置予測によってMDLMの復号化がトークンの誤認識に非常に敏感になることを示す。
本手法は広く使われているMDLMモデルに適用し、5つのオープンエンドテキスト生成ベンチマークで実験を行う。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:09:21 GMT)
WED-Net: A Weather-Effect Disentanglement Network with Causal Augmentation for Urban Flow Prediction [6.5] 極端な条件下での都市流れの時間予測は、事象のダイナミクスと希少性のために困難である。
WED-Net(Weather-entanglement Network)は,固有気象と交通パターンを分離した2分岐トランスフォーマアーキテクチャである。
We show WED-Net delivers robust performance under extreme weather conditions。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:32:47 GMT)
Task-Aware LLM Council with Adaptive Decision Pathways for Decision Support [6.5] Task-Aware LLM Council (TALC) はモンテカルロ木探索 (MCTS) と大規模言語モデルのカウンシルを統合している。
TALCは、強いベースラインよりも優れたタスク成功率と検索効率の向上を実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:29:20 GMT)
Towards Sample Efficient Entanglement Classification for 3 and 4 Qubit Systems: A Tailored CNN-BiLSTM Approach [6.4] 畳み込みと双方向長短期記憶ネットワーク(CNN-BiLSTM)を統合したハイブリッドニューラルネットワークアーキテクチャを提案する。
この設計では、ローカルな特徴抽出にCNN、シーケンシャルな依存性モデリングにBiLSTMを活用し、最小限のトレーニングデータから堅牢な特徴学習を可能にする。
わずか100のサンプルでトレーニングされた場合、アーキテクチャ2は3ビットと4ビットの両方で90%を超える分類精度を維持し、数十のエポックで急速に失われることを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:59:44 GMT)
SYMPHONY: Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly [6.4] 本稿では,新しいマルチエージェント・プランニング・フレームワークであるSYMPHONY(Synergistic Multi-Adnt Planning with Heterogeneous langauge model assembly)を提案する。
エージェント間の多様な推論パターンを活用することで、SYMPHONYはロールアウトの多様性を高め、より効果的な探索を促進する。
実験結果から,SYMPHONYはコンシューマグレードのハードウェア上にデプロイ可能なオープンソースLLMをインスタンス化した場合でも,高い性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:26:34 GMT)
Machine Learning for Energy-Performance-aware Scheduling [6.4] ディナード時代以降、組み込みシステムはエネルギー効率と遅延の間の複雑なトレードオフを必要とする。
伝統的なチューニングは、高次元の非滑らかな風景においてしばしば非効率である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:23:06 GMT)
TopoLS: Lattice Surgery Compilation via Topological Program Transformations [6.4] TopoLSは、ZX-ダイアグラム最適化とモンテカルロ木探索を組み合わせたトポロジカルコンパイラである。
SAT-solverベースのコンパイラと比較して、TopoLSは格子サージェリーコンパイルに効果的でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:54:57 GMT)
DART-ing Through the Drift: Dynamic Tracing of Knowledge Neurons for Adaptive Inference-Time Pruning [6.4] DARTは、オンザフライでコンテキストベースプルーニングを行う軽量なトレーニングフリー手法である。
DARTは分布の変化を監視し、文脈変化を推測し、ニューロンレベルのマスクを動的に更新し、正常なパラメータを保持する。
LLAMA-3.1-8Bでは、70%のFFN間隔で14.5%の精度向上を実現し、3倍のROUGE-Lスコアが得られる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:48:16 GMT)
Structured Over Scale: Learning Spatial Reasoning from Educational Video [6.4] 我々は,Dora the Explorerの8シーズンから自動的に抽出された5,344の質問応答ペアのデータセットであるDoraVQAを紹介する。
我々はQwen2とQwen3の両方を微調整し、教育内容に固有の明確な正当性信号と構造化された推論トレースを活用する。
CVBenchではDoraVQAの8-14点,最先端の86.16%の改善を実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:20:23 GMT)
ExpAlign: Expectation-Guided Vision-Language Alignment for Open-Vocabulary Grounding [6.3] オープン語彙の接地には、弱い監督下で正確な視覚言語アライメントが必要である。
原理化された複数インスタンス学習の定式化に基づいて構築された理論的に基礎付けられた視覚言語アライメントフレームワークであるExpAlignを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:38:04 GMT)
Lethe:Adapter-Augmented Dual-Stream Update for Persistent Knowledge Erasure in Federated Unlearning [6.2] Federated Unlearning (FU)は、グローバルモデルから指定されたクライアントレベル、クラスレベル、またはサンプルレベルの知識を削除することを目的としている。
私たちは、継続的なトレーニングが未学習の知識を再活性化できることを明らかにすることで、知識の再認識と呼ばれる重要な障害モードを特定します。
本稿では,知識の保持から学ばない新しい非学習手法Letheを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:50:35 GMT)
Time-TK: A Multi-Offset Temporal Interaction Framework Combining Transformer and Kolmogorov-Arnold Networks for Time Series Forecasting [6.1] 既存のメソッドは通常、各ステップを独立したトークンとして埋め込む戦略を採用している。
Time-TKはすべてのベースラインモデルを大幅に上回り、最先端の予測精度を達成している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:11:51 GMT)
A Geometric Multimodal Foundation Model Integrating Bp-MRI and Clinical Reports in Prostate Cancer Classification [6.1] 前立腺癌(PCa)は、世界でも最も多いがんの1つである。
既存のコンピュータ支援診断手法の多くは画像ベースモデルに重点を置いている。
我々はbp-MRIと臨床報告から表現を学習する多モード幾何学基礎モデル(FM)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:21:31 GMT)
A complex-linear reformulation of Hamilton--Jacobi theory and the emergence of quantum structure [6.1] 我々は、ペア$(R,S)$を1つの複素体に埋め込むことで、相補的な定式化、ハミルトン・ヤコビ・シュルディンガー(HJS)理論を開発する。
注目すべきは、$mathrmRe()neq 0$のとき、重ね合わせ、作用素代数、可換子、ハイゼンベルクの不確実性原理を含む量子力学の本質的な特徴は、自然に整合条件として生じることである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:14:55 GMT)
AutoRefine: From Trajectories to Reusable Expertise for Continual LLM Agent Refinement [6.0] 大規模な言語モデルエージェントは経験から知識を蓄積できず、個々のタスクを独立した課題として扱うことが多い。
最近の手法は、複雑なサブタスクの手続き論理をキャプチャできないフラットなテキスト知識としての経験を抽出する。
エージェント実行履歴からデュアルフォームエクスペリエンスパターンを抽出し,維持するフレームワークであるAutoRefineを紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:33:30 GMT)
Post-LayerNorm Is Back: Stable, ExpressivE, and Deep [6.0] 大規模言語モデル(LLM)のスケーリングは壁にぶつかっている。拡張モデルはリターンを減少させ、コンテキスト長の延長は基本的な表現性を改善しない。
ポストレイヤーノーム (Post-LayerNorm, Post-LN) の定式化について検討した。
本稿では,Post-LNの中央障害モードがResNetスタイルの残差経路から生じることを示す。
我々は、この残路をハイウェイスタイルの接続で置き換えるポストLN変換器であるKeelを提示する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:44:40 GMT)
An Efficient Algorithm for Thresholding Monte Carlo Tree Search [6.0] 本稿では,Thresholding Monte Carlo Tree Search問題を紹介する。
我々はトラック・アンド・ストップ戦略に基づく$$$-correct sequence sampleアルゴリズムを開発した。
そこで本研究では, D-Tracking アーム推進戦略の比に基づく修正により, 実験試料の複雑さが大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:50:04 GMT)
Secure Tool Manifest and Digital Signing Solution for Verifiable MCP and LLM Pipelines [6.0] 大規模言語モデル(LLM)は、医療や金融機関のデータ分析のような繊細な分野にますます採用されている。
Model Context Protocol (MCP)のような既存の制御メカニズムは、ツール呼び出しのコンプライアンスポリシーを定義するが、モデルのアクションの検証と透過的な検証は欠如している。
モデルコンテキストプロトコルの構造化およびセキュリティに配慮した拡張であるSecure Tool Manifest and Digital Signing Frameworkを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:22:21 GMT)
HeatMat: Simulation of City Material Impact on Urban Heat Island Effect [6.0] 都市ヒートアイランド(UHI)効果は、周辺地域に比べて都市環境の気温が著しく上昇している。
この効果に寄与する要因の1つは、農村部と異なる都市物質の性質である。
本研究では,実際の都市におけるUHI効果に対する都市物質の個人的影響を高分解能で解析する手法であるHeatMatを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:20:47 GMT)
Real-World Design and Deployment of an Embedded GenAI-powered 9-1-1 Calltaking Training System: Experiences and Lessons Learned [6.0] 緊急コールテイカーは、公共の安全対策における最初の運用リンクとなる。
従来のトレーニングアプローチは、現実の制約の下でスケールするのに苦労します。
我々は、メトロナッシュビル救急通信省と協力し、GenAIを利用したコールテイク訓練システムを設計、開発、展開した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:05:59 GMT)
Shattered Compositionality: Counterintuitive Learning Dynamics of Transformers for Arithmetic [5.9] 大規模言語モデル(LLM)は、大規模であっても予期せぬ誤りや意図せぬ振る舞いを示すことが多い。
合成算術課題における変圧器の訓練による動的学習のメカニズムについて検討する。
この結果から,モデルの学習行動と所望のスキル構成との根本的なミスマッチが明らかとなった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:38:54 GMT)
OSNIP: Breaking the Privacy-Utility-Efficiency Trilemma in LLM Inference via Obfuscated Semantic Null Space [5.9] プライバシー保護LLM推論のための軽量クライアント側暗号化フレームワークであるObfuscated Semantic Null space Injection for Privacy (OSNIP)を提案する。
難解なセマンティックヌル空間」は、元の埋め込みにほぼ直交しながら意味的忠実性を保った高次元の制度である。
OSNIPは最先端のパフォーマンスを実現し、厳格なセキュリティ制約の下で強力なモデルユーティリティを維持しながら、攻撃成功率を大幅に削減する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:29:54 GMT)
Tri-LLM Cooperative Federated Zero-Shot Intrusion Detection with Semantic Disagreement and Trust-Aware Aggregation [5.9] 本稿では,言語に基づくセマンティック管理をフェデレーション最適化に組み込んだ,セマンティックス駆動のフェデレーションIDSフレームワークを提案する。
このフレームワークは、目に見えない攻撃パターンに対して80%以上のゼロショット検出精度を達成し、類似性に基づくベースラインと比較してゼロデイ識別を10%以上改善する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:38:05 GMT)
AlienLM: Alienization of Language for API-Boundary Privacy in Black-Box LLMs [5.9] AlienLMはデプロイ可能なAPIのみのプライバシレイヤで、Alien言語に変換することでテキストを保護する。
本研究は,APIのみのアクセス下でのLLMのプライバシ保護を実現するための実践的経路を示すものである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:32:32 GMT)
Development of Domain-Invariant Visual Enhancement and Restoration (DIVER) Approach for Underwater Images [5.9] 水中画像は、波長依存性の減衰、散乱、照明の不均一により深刻な劣化を被る。
教師なしのドメイン不変ビジュアルエンハンス・アンド・リカバリフレームワークを提案する。
DIVERは、ロバストな水中画像強調のための物理誘導モデリングと経験的補正を統合している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:58:40 GMT)
Sequence Diffusion Model for Temporal Link Prediction in Continuous-Time Dynamic Graph [5.8] 既存の時間グラフニューラルネットワークは、主に歴史的相互作用の学習表現に焦点を当てている。
本稿では,動的グラフ学習を生成的認知と統合する,新しいシーケンスレベルの拡散フレームワークを提案する。
我々は,時間的リンク予測タスクにおいて,このフレームワークが常に最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:02:12 GMT)
HetCCL: Accelerating LLM Training with Heterogeneous GPUs [5.8] HetCCLは、ベンダー固有のバックエンドを統一し、ドライバの変更を必要とせずに、GPU間でRDMAベースの通信を可能にする集合通信ライブラリである。
HetCCLは、均一なセットアップでNCCLとRCCLのパフォーマンスを一致させ、異種環境において一意にスケーリングする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:31:29 GMT)
Exo-Plore: Exploring Exoskeleton Control Space through Human-aligned Simulation [5.8] エクソスケルトンコントローラを最適化するための現在のアプローチは、参加者が何時間も歩かなければならない広範囲な人間実験を必要とする。
我々は,神経機械シミュレーションと深層歩行学習を組み合わせたシミュレーションフレームワークであるExo-ploreを提案し,実際の人体実験を必要とせず,股関節外骨格補助を最適化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:45:35 GMT)
Fed-Listing: Federated Label Distribution Inference in Graph Neural Networks [5.7] 分散ローカルグラフデータによる協調学習を容易にするために,フェデレーショングラフニューラルネットワーク(FedGNN)を提案する。
Fed-Listingは、生のデータやノードの機能にアクセスせずにFedGNN内のターゲットクライアントのプライベートなラベル統計を推測するグラデーションベースの攻撃である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:51:49 GMT)
RePaint-Enhanced Conditional Diffusion Model for Parametric Engineering Designs under Performance and Parameter Constraints [5.7] 本稿では、事前訓練された性能誘導型拡散確率モデル(DDPM)を統合するRePaint拡張フレームワークを提案する。
提案手法は, 基礎となるモデルを再学習することなく, 部分参照設計に基づいて, 欠落設計部品の生成を可能にする。
この枠組みは、船体設計と翼設計という2つの代表的な設計上の問題で評価されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:04:05 GMT)
Structural Conditions for Native CCZ Magic-State Fountains in qLDPC Codes [5.7] 量子低密度パリティチェック(qLDPC)符号は、有界重みチェックを持つ定格線形距離ファミリーを約束する。
明示的なエンフィクビットqLDPC族は、定数速度、線形距離、有界安定度重み、および多くの非クリフォード資源状態を一定の深さで準備する固有なアンフィクティック状態の噴水を同時に持つことが知られている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:59:06 GMT)
EvoEGF-Mol: Evolving Exponential Geodesic Flow for Structure-based Drug Design [5.7] 構造に基づく薬物設計における情報幾何学的アプローチを提案する。
EvoEGF-Molは静的ディラックターゲットを動的に集中分散に置き換える。
我々のモデルは、クロスドック上での基準レベル PoseBusters 通過率 (93.4%) にアプローチし、顕著な精度と相互作用の忠実さを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:26:13 GMT)
Cascaded Flow Matching for Heterogeneous Tabular Data with Mixed-Type Features [5.6] 我々は,グラフデータに対する拡散モデルの現状をカスケード的アプローチで進める。
数値特徴の低分解能表現は、欠落や膨らんだ値などの離散的な結果を説明する。
結果は,本モデルがより現実的なサンプルを生成し,より正確に分布の詳細を把握できることを示唆している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:42:10 GMT)
SmartMeterFM: Unifying Smart Meter Data Generative Tasks Using Flow Matching Models [5.6] 本研究では,多種多様なスマートメーターデータ生成タスクを条件生成のために訓練された単一モデルで統一する手法を提案する。
異なる生成タスクを別の部分的データ観測形式として見ることにより、インパルス化や超解像化といったタスクを単一モデルで統一する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:22:42 GMT)
Gradual Fine-Tuning for Flow Matching Models [5.5] Gradual Fine-Tuning (GFT) は、フローベース生成モデルを微調整するための原則的なフレームワークである。
流れについて、GFTは、事前訓練されたドリフトと目標ドリフトの間を円滑に介在する中間目標の温度制御配列を定義している。
GFTは収束安定性を改善し、確率パスを短縮し、推論を高速化し、標準の微調整に匹敵する生成品質を維持する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:07:47 GMT)
Uncertainty-Aware Multimodal Learning via Conformal Shapley Intervals [5.5] 不確実性とともにモダリティレベルの重要性を定量化することは、解釈可能で信頼性の高いマルチモーダル学習の中心である。
共形シェープリー値と共形推論を組み合わせたフレームワークである共形シェープリー区間を導入し,各モードに対する不確実性を考慮した重要区間を構築する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:40:23 GMT)
MiNER: A Two-Stage Pipeline for Metadata Extraction from Municipal Meeting Minutes [5.5] 効果的な情報検索には、ミーティング番号、日付、場所、参加者、開始/終了時間などのメタデータを識別する必要がある。
既存の名前付きエンティティ認識(NER)モデルは、ドメイン固有のカテゴリに適合しないため、このタスクには不適である。
自治体の議事録からメタデータを抽出するための2段階パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:09:13 GMT)
AdaFuse: Adaptive Multimodal Fusion for Lung Cancer Risk Prediction via Reinforcement Learning [5.5] 肺がんリスク予測のための患者固有のモダリティ選択と融合戦略を学習する適応型多モード融合フレームワークであるAdaFuseを提案する。
AdaFuseは、ポリシーネットワークが追加のモダリティを組み込むか、既に取得した情報に基づいて予測に進むかを反復的に決定する、シーケンシャルな決定プロセスとしてマルチモーダル融合を定式化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:51:44 GMT)
dgMARK: Decoding-Guided Watermarking for Diffusion Language Models [5.4] dgMARKは離散拡散言語モデルのための復号誘導型透かし法である。
dgMARKは、逆候補トークンが単純なパリティ制約を満たす位置に対して、偽りの順序を定めている。
透かしはパリティマッチング統計によって検出される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:51:20 GMT)
How Much of a Model Do We Need? Redundancy and Slimmability in Remote Sensing Foundation Models [5.4] リモートセンシング (RS) における大規模基礎モデル (FM) はコンピュータビジョン (CV) で確立されたパラダイムに基づいて開発され, 様々な地球観測への応用が期待されている。
我々は,RS FM がCV FM よりもかなり小さいパラメータ化状態に入るという仮説を立てた。
我々は,4つの下流分類タスクにおいて,6つの最先端RS FMの表現冗長性を測定するために,ポストホックスライミングを用いる。
本研究は,資源制約環境の実践的展開戦略と,RSのスケーリングパラダイムに挑戦する診断ツールとして,ホック後のスリム性を確立した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:08:48 GMT)
FlowCalib: LiDAR-to-Vehicle Miscalibration Detection using Scene Flows [5.3] FlowCalibは、静的オブジェクトのシーンフローからモーションキューを使用してLiDARから車両への誤校正を検出する最初のフレームワークである。
本手法は, 逐次3次元点雲から発生する流れ場における回転不整合による系統的バイアスを利用する。
nuScenesデータセットの実験では、FlowCalibが誤校正を堅牢に検出する能力を示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:53:16 GMT)
Fast Forward: Accelerating LLM Prefill with Predictive FFN Sparsity [5.2] 我々は,大規模言語モデル (LLM) のプレフィルをブロックワイドでコンテキスト対応のFFNスパシティによって高速化する,予測可能なスパシティフレームワークであるFastForwardを紹介した。
FastForwardは最大1.45$times$計算バウンド・スピードアップを50%FFN間隔で提供し、LongBenchの高密度ベースラインに比べて6%の精度で損失する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:23:40 GMT)
GEPC: Group-Equivariant Posterior Consistency for Out-of-Distribution Detection in Diffusion Models [5.2] G EPC (Group-Equivariant Posterior Consistency) は、学習したスコアがいかに一貫して変換されるかを測定する訓練のないプローブである。
近年の拡散ベースラインと比較して, G EPC は AUROC の競争力や向上を実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:58:13 GMT)
TriCEGAR: A Trace-Driven Abstraction Mechanism for Agentic AI [5.1] TriCEGARはトレース駆動の抽象化メカニズムで、実行ログから状態構築を自動化する。
タイプされたエージェントライフサイクルイベントをキャプチャし、トレースから抽象化を構築するフレームワークネイティブ実装について説明する。
また, 走行確率が異常検出をガードレール信号として有効にする方法も示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:01:47 GMT)
Securing Time in Energy IoT: A Clock-Dynamics-Aware Spatio-Temporal Graph Attention Network for Clock Drift Attacks and Y2K38 Failures [5.1] 分散型モノのインターネット(IoT)デバイスにおける時間の統合性は、エネルギー物理システムにおける信頼性の高い操作に不可欠である。
信頼性の高いタイムスタンプを仮定する従来の異常検出モデルは、時間的不整合を捉えることができない。
本稿では,エネルギーIoTシステムにおける時間歪みとデバイス間の一貫性の両方をモデル化するフレームワークSTGATを紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:33:07 GMT)
ScribbleSense: Generative Scribble-Based Texture Editing with Intent Prediction [5.1] ScribbleSenseは、マルチモーダル大言語モデル(MLLM)と画像生成モデルを組み合わせた編集方法である。
我々はMLLMの視覚的能力を活用し、スクリブルの背後にある編集意図を予測する。
局所的なテクスチャの詳細を抽出するために,グローバルに生成された画像を用いる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:55:44 GMT)
Can 3D point cloud data improve automated body condition score prediction in dairy cattle? [5.1] 体調スコア (BCS) は, 乳牛の代謝状態, 生殖能力, 健康と密接に関連している。
BCSの予測にはコンピュータビジョンのアプローチが適用されており、色やテクスチャに依存しない幾何学的情報を取得するため、深度画像が広く使用されている。
3次元の点雲データは、動物形態学のよりリッチな幾何学的特徴を表現する能力によって、関心が高まりつつある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:59:06 GMT)
Protecting Private Code in IDE Autocomplete using Differential Privacy [5.0] 本稿では,Large Language Models (LLMs) をトレーニングするための堅牢な防御機構として,差分プライバシー(DP)の利用について検討する。
DPを用いてttexttMellumモデルを微調整し、そのプライバシーと実用性を総合的に評価する。
以上の結果から,DPはメンバシップ推論攻撃(MIA)に対して強い防御力を示し,ランダムな推測(AUC 0.901 から 0.606 まで)に近い攻撃成功率の低下を図った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:51:43 GMT)
Best-of-Q: Improving VLM agents with Q-function Action Ranking at Inference [4.9] VLM(Vision-Language Models)は、エージェントがデジタル環境で自律的に操作するための強力なバックボーンとなっている。
これらのモデルは、Webのような高速に変化する環境に適応できない。
本稿では,エージェントVLMポリシーを政策再訓練なしで推論時に拡張するための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:22:18 GMT)
Benchmarking Long Roll-outs of Auto-regressive Neural Operators for the Compressible Navier-Stokes Equations with Conserved Quantity Correction [4.9] 本稿では,深層学習モデルに物理保存基準を組み込むためのモデル非依存手法である保存量補正について述べる。
その結果、モデルアーキテクチャに関係なく、自己回帰型ニューラル演算子の長期安定性が一貫した改善を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:27:29 GMT)
Multipartite entanglement measures based on the thermodynamic framework [4.9] 本研究では,熱力学の枠組みを用いて,複数粒子の絡み合いを特徴づけ,測定するための統一手法を提案する。
新しい絡み合い対策のファミリーが提案される:テクテジトロピックギャップの絡み合い
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:26:29 GMT)
Understanding on the Edge: LLM-generated Boundary Test Explanations [4.9] 境界値分析とテストは、ソフトウェアの品質保証に不可欠である。
LLMは自然言語の合理性を生み出すのに役立つが、BVTに対するその価値は実証的に評価されていない。
調査では、ソフトウェア専門家が、明確さ、正確性、完全性、有用性に対する20の境界対について、GPT-4.1の説明を評価した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:11:45 GMT)
Float8@2bits: Entropy Coding Enables Data-Free Model Compression [4.8] EntQuantは、トレーニング後のさまざまな圧縮方式の利点を統一する最初のフレームワークです。
本手法は,70Bパラメータモデルを30分以内で圧縮し,エントロピー符号化によりストレージコストから数値精度を分離する。
我々は、EntQuantが標準評価セットやモデルで最先端の結果を得るだけでなく、より複雑なベンチマークで機能性能を維持することを実証した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:08:15 GMT)
OOVDet: Low-Density Prior Learning for Zero-Shot Out-of-Vocabulary Object Detection [4.7] ゼロショットアウトオブボキャブラリ検出(ZS-OOVD)は、ゼロショット推論で提供されるインボキャブラリカテゴリのオブジェクトを正確に認識することを目的としている。
以前の方法はIVクラスを過度に適合させる傾向があり、OOVまたは未定義のクラスは高い信頼スコアを持つIVクラスと誤分類される。
本稿では、ゼロショットシーンにおける未定義クラスを確実に拒否しつつ、事前定義クラスを効果的に検出する新しいフレームワークであるゼロショットOOV検出器(OOVDet)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:59:35 GMT)
CATTO: Balancing Preferences and Confidence in Language Models [4.7] 大規模言語モデル(LLM)は、しばしば正確な次のトークン予測を行うが、これらの予測に対する信頼度は不十分である。
本稿では,予測信頼度と経験的予測正しさを一致させる予測キャリブレーションを意識した目標を提案する。
出力トークンのベイズ最適選択に校正トークン確率を活用するテスト時間スケーリング機構であるConfidence@kを導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:43:38 GMT)
Ensuring Semantics in Weights of Implicit Neural Representations through the Implicit Function Theorem [4.7] Inlicit Neural Representation (INR)は、軽量空間学習(WSL)のための便利なテストベッドを提供する
我々は、データ空間とその潜在重み表現空間の間の厳密なマッピングを確立するために、IFT(Implicit Function Theorem)をデプロイする。
我々は、インスタンス固有の埋め込みを共有ハイパーネットワークを介してINR重みにマッピングするフレームワークを分析する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:05:37 GMT)
Beyond Fixed Rounds: Data-Free Early Stopping for Practical Federated Learning [4.6] フェデレートラーニング(FL)は、生データを送信することなく、分散化された協調学習を促進する。
本稿では,サーバ側パラメータのみを用いてタスクベクトルの成長率を監視することにより,最適な停止点を決定するデータフリー早期停止フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:42:13 GMT)
Elderly HealthMag: Systematic Building and Calibrating a Tool for Identifying and Evaluating Senior User Digital Health Software [4.6] デジタルヘルス(DH)ソフトウェアは、多くのエンドユーザが1つ以上の健康状態で生活している人口にますます普及している。
しかし、DHソフトウェア開発チームは、これらのユーザについて暗黙の誤った仮定を使って頻繁に運用します。
我々は、GenderMagにインスパイアされたTextbftextitHealthMagを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:36:53 GMT)
Probing the Trajectories of Reasoning Traces in Large Language Models [4.6] 本研究では,大規模言語モデルにおける推論トレースの軌跡を探索するプロトコルを提案する。
得られた推論トークンの比率が大きくなるにつれて、精度と決定のコミットメントが一貫して増加することが分かっています。
軌道探索が推論モデルのより効率的かつ安全な展開のための診断を提供することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:45:16 GMT)
Training Beyond Convergence: Grokking nnU-Net for Glioma Segmentation in Sub-Saharan MRI [4.5] グリオーマはサハラ以南のアフリカ(SSA)にますます臨床負担をかけている
この地域では、患者の平均生存率は2年未満であり、診断画像へのアクセスは極めて限られている。
脳腫瘍 (BraTS) Africa 2025 Challenge データセットはグリオーマMRIの注釈付き専門的コレクションである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:54:49 GMT)
ArabicDialectHub: A Cross-Dialectal Arabic Learning Resource and Platform [4.4] 6種(モロッコ・ダリヤ・レバノン・シリア・エミラティ・サウジアラビア・MSA)にまたがる552句からなるアラビア語横断学習資料を提示する。
フレーズはLLMを用いて生成され、5つの母語話者によって検証され、難易度によって階層化され、主題的に整理された。
オープンソースのプラットフォームは、翻訳探索、アルゴリズムによるイントラクタ生成による適応的なクイズ、クラウド同期プログレストラッキング、文化的コンテキストを提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:52:37 GMT)
Computer Vision and Its Relationship to Cognitive Science: A perspective from Bayes Decision Theory [4.4] ベイズ決定理論からみたコンピュータビジョンの紹介とその認知科学との関係について(Berger 1985)
コンピュータビジョンは広大で複雑な分野であるため、この概要は狭いスコープを持ち、多くの重要な概念を捉える理論レンズを提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:21:48 GMT)
Fairness-Aware Performance Evaluation for Multi-Party Multi-Objective Optimization [4.3] MPMOPの公平性を考慮した性能評価フレームワークを開発した。
MPMOPの公平性を考慮した評価関数が満足すべき4つの公理を定式化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:09:58 GMT)
TDPNavigator-Placer: Thermal- and Wirelength-Aware Chiplet Placement in 2.5D Systems Through Multi-Agent Reinforcement Learning [4.3] 電子の急速な成長は2.5D集積回路の採用を加速させ、効果的なチップレット配置が不可欠である。
既存の配置法では、重み付け和によるワイヤ長の最小化や多目的最適化の単一目的への変換に重点を置いている。
我々は,チップレットの熱設計力に基づいて配置を動的に最適化する,新しいマルチエージェント強化学習フレームワークTDPNavigator-Placerを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:04:55 GMT)
Names Don't Matter: Symbol-Invariant Transformer for Open-Vocabulary Learning [4.3] 現在のニューラルアーキテクチャには、交換可能なトークンを扱うための原則的な方法がない。
本稿では、交換可能なトークンの改名に対して、確実に不変なトランスフォーマーベースのメカニズムを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:53:01 GMT)
Non-Intrusive Graph-Based Bot Detection for E-Commerce Using Inductive Graph Neural Networks [4.2] 悪意のあるボットは、データをスクラップし、在庫を盗み、詐欺行為を繰り返すことで、Eコマースプラットフォームへの脅威が増大する。
IPブラックリストやCAPTCHAベースの課題など、従来のボットの緩和技術は、ますます非効率あるいは侵入的になっている。
本研究は,ユーザセッションの振る舞いをグラフ表現を通じてモデル化するEコマースのための非侵襲的なグラフベースボット検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:21:32 GMT)
Non-Equilibrium Phase Transition in a Boundary-Driven Dissipative Fermionic Chain [4.2] 境界局在周期ドライブは非相互作用性フェルミオン鎖における非自明な長距離相関を誘導することができる。
この境界駆動による非平衡遷移は共鳴機構によって駆動されると主張する。
本結果は,オープン量子系における局所コヒーレント駆動によるマクロ秩序の生成の可能性を強調した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:26:53 GMT)
Optimal Fair Aggregation of Crowdsourced Noisy Labels using Demographic Parity Constraints [4.1] 本稿では,$varepsilon$-fairnessフレームワーク内のクラウドソース集約手法の公正度を解析する。
集約されたコンセンサスのフェアネスギャップは、解釈可能な条件下では、グランドトゥルースのフェアネスギャップに指数関数的に収束することを示す。
基底真理自体はいまだ不公平である可能性があるので、最先端のマルチクラスフェアネス後処理アルゴリズムを一般化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:45:32 GMT)
Standardized Methods and Recommendations for Green Federated Learning [4.1] フェデレートラーニング(FL)は、プライバシに敏感な分散データに対する協調モデルトレーニングを可能にするが、その環境への影響は研究全体で比較することは困難である。
NVIDIA NVFlare と CodeCarbon を用いた FL CO2e 追跡のための実用的な炭素計数手法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:46:36 GMT)
Opportunistic Promptable Segmentation: Leveraging Routine Radiological Annotations to Guide 3D CT Lesion Segmentation [4.0] 臨床画像アーカイブ・通信システム(PACS)では大量のCT画像と報告が容易に利用可能である
クリティカルな発見の3Dセグメンテーションは、一般的には放射線技師による広範囲な手作業による注釈を必要とする。
スパースアノテーションをCTボリュームの3次元セグメンテーションに変換するために設計された,最初のプロンプト可能なセグメンテーションモデルを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:59:53 GMT)
Okara: Detection and Attribution of TLS Man-in-the-Middle Vulnerabilities in Android Apps with Foundation Models [4.0] トランスポート層セキュリティ(TLS)は、オンライン通信のセキュア化に基本である。
Man-in-the-Middle(MitM)による攻撃は、Androidアプリにとって大きな脅威だ。
我々は,MitM脆弱性の検出と帰属を自動化するフレームワークであるOkaraを紹介する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:49:09 GMT)
DELNet: Continuous All-in-One Weather Removal via Dynamic Expert Library [3.9] 気象画像復元のための連続学習フレームワークであるDELNetを提案する。
新しいタスクのために、バルブは知識伝達のためのトップkの専門家を選択し、タスク固有の特徴をキャプチャするための新しい専門家を追加する。
既知のタスクに対して、対応する専門家は直接再利用される。この設計は、既存のモデルを再トレーニングすることなく、継続的な最適化を可能にする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:14:16 GMT)
HEEDFUL: Leveraging Sequential Transfer Learning for Robust WiFi Device Fingerprinting Amid Hardware Warm-Up Effects [3.9] HEEDFULはシーケンシャルトランスファーラーニングとターゲット障害推定を利用した新しいフレームワークである。
本評価では,初回装置操作間隔で最大96%の分類精度を達成し,HEEDFULの有効性を示した。
WiFiタイプBとNRF指紋データセットを初めてリリースし、時間領域表現と実際のハードウェア障害の両方を組み込んだ。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:41:19 GMT)
On the Impact of Code Comments for Automated Bug-Fixing: An Empirical Study [3.9] 価値ある設計と実装の洞察を提供することによって、ある種のバグを修正する上で、コメントは重要な役割を果たすかもしれません。
本研究では,大規模言語モデルのバグフィックス能力に,トレーニング時と推論時の両方でコメントの有無がどのような影響を及ぼすかを検討する。
以上の結果から,いずれのフェーズにおいても,ABFの精度は最大3倍向上するが,コメントによるトレーニングでは,インスタンスが欠如している場合には性能が低下しないことがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:07:27 GMT)
JobResQA: A Benchmark for LLM Machine Reading Comprehension on Multilingual Résumés and JDs [3.8] JobResQAは、HR固有のタスクで機械読み取り(MRC)機能を評価するためのベンチマークである。
データセットは、5つの言語で105のresumé-job記述ペアに対して511のQAペアで構成されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:06:59 GMT)
LLMs Explain't: A Post-Mortem on Semantic Interpretability in Transformer Models [3.8] 大きな言語モデル(LLM)は、その汎用性と強力なパフォーマンスのために、広範にコンピューティングで人気が高まっている。
本稿では,LLMにおいて言語的抽象化がどのように現れるのかを考察し,異なるモジュール間で言語的抽象化を検出することを目的とする。
注意に基づく説明は、後層表現がトークンに対応しているというコア仮定をテストすると、崩壊します。
埋め込みに適用される特性推論法も、その高い予測スコアが、方法論的アーティファクトとデータセット構造によって駆動されたため失敗した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:46:37 GMT)
Small is Beautiful: A Practical and Efficient Log Parsing Framework [3.8] ログ解析の基本的なステップは 教師なしのログ解析です
LLM(Large Language Models)は、従来の構文に基づく手法よりも優れた一般化性を示す。
この依存関係は、より小さく、よりリソース効率のよいLCMを使用すると、大幅にパフォーマンスが低下する。
より小さなモデルの能力を高めるために設計された,教師なしLLMベースのログであるEFを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:37:08 GMT)
Scalable Memory Sharing in Photonic Quantum Memristors for Reservoir Computing [3.8] フォトニック量子メムリスタ(PQMR)は非マルコフ応答を可能としたが、メモリは局所的要素に限られている。
本稿では,計測に基づくメモリ共有を実現するスケーラブルなPQMRネットワークを提案する。
本手法は,線形光学量子コンピューティングと互換性のある経験的デバイスを用いた高容量量子機械学習への道を開くものである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:51:42 GMT)
Moral Outrage Shapes Commitments Beyond Attention: Multimodal Moral Emotions on YouTube in Korea and the US [3.7] 本研究は、YouTube上の主流ニュースチャンネルによる道徳的感情的フレーミングが、韓国と米国のユーザー行動にどのように影響するかを検討する。
視覚言語モデルに微調整を施したマルチモーダルな道徳感情分類器を開発した。
私たちは、ビュー、いいね!、コメントを含むエンゲージメントレベルを分析し、コミットメントの度合いの増加を示しています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:24:41 GMT)
Calibrated Multivariate Distributional Regression with Pre-Rank Regularization [3.7] 回帰モデルのトレーニング中に多変量キャリブレーションを適用した正規化に基づくキャリブレーション法を提案する。
予測分布の主方向に予測を投影するPCAベースの新しいプリランクを導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:13:47 GMT)
From Cold Start to Active Learning: Embedding-Based Scan Selection for Medical Image Segmentation [3.6] 本稿では,基礎モデル埋め込みとクラスタリングを組み合わせて,多様な初期訓練を構築する冷間開始型サンプリング戦略を提案する。
続いて、空間的多様性を統合してサンプル選択をガイドする不確実性に基づくALフレームワークが続く。
我々はX線とMRIを対象とする3つのデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:56:47 GMT)
Neural Ising Machines via Unrolling and Zeroth-Order Training [3.6] 本稿では,NP-hard Ising と Max-Cut の最適化のために,反復力学系の更新規則を学習するデータ駆動型アルゴリズムを提案する。
我々はこのアプローチを、長いニューラルネットワークパラメータ化Issing Machine(NPIM)と呼ぶ。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:51:51 GMT)
Bayesian Matrix Completion Under Geometric Constraints [3.6] スパース・ノイズ観測からユークリッド距離行列の完成は、信号処理における根本的な課題である。
ランク制約付き最適化や半定値プログラミングのような伝統的な手法は、幾何的制約を強制するが、しばしばスパースまたはノイズの多い条件下で苦労する。
本稿では,EDMを生成する潜在点集合に直接構造的事前を配置し,自然に幾何学的制約を埋め込む階層的ベイズフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:45:34 GMT)
Label Curation Using Agentic AI [3.5] 本稿では,大規模マルチモーダルデータアノテーションのためのエージェントAIフレームワークであるAURAを紹介する。
AURAは、複数のAIエージェントをコーディネートして、基礎的な真実を必要とせずにラベルを生成し、検証する。
AURAは最大5.8%の精度向上を実現している。
品質アノテータの貧弱さによるより困難な設定では、改善はベースラインよりも最大50%向上する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:58:52 GMT)
naPINN: Noise-Adaptive Physics-Informed Neural Networks for Recovering Physics from Corrupted Measurement [3.5] 本研究では,劣化測定から物理解を確実に回収する雑音適応型物理情報ニューラルネットワーク (naPINN) を提案する。
naPINNは、予測残差の潜在分布を学習するために、エネルギーベースのモデルをトレーニングループに組み込む。
非ガウス雑音とオフレーヤの変動率により劣化した様々なベンチマーク偏微分方程式に対するnaPINNの有効性を実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:03:33 GMT)
Do Good, Stay Longer? Temporal Patterns and Predictors of Newcomer-to-Core Transitions in Conventional OSS and OSS4SG [3.3] OSS4SGプロジェクトはコントリビュータを2.2倍高く保ち、コントリビュータはコアステータスを達成する確率が19.6%高い。
この結果から,個人的価値に整合したプロジェクトを見つけることや,主要なコントリビューションの事前理解に時間を費やすことが,中核的な地位を達成する上で重要な戦略であることが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:30:25 GMT)
Graph Attention Network for Node Regression on Random Geometric Graphs with Erdős--Rényi contamination [3.0] そこで本研究では,回帰処理のための記述されたプロキシ機能を構成するタスク固有のGATを慎重に設計し,解析する。
その結果, (a) 回帰係数の推定において, 応答変数の回帰が誤差的に低いことが証明された。
また,複数のノード回帰タスクにおけるアテンション機構の有効性を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:09:03 GMT)
Shaping capabilities with token-level data filtering [3.0] 本研究では,事前学習データのフィルタリングを簡易に行うことは,大規模かつ効果的で,堅牢で,安価であることを示す。
データ属性の研究から着想を得た結果,トークンのフィルタリングは文書のフィルタリングよりも効果的であることが判明した。
また,事前学習が十分であれば,フィルタはノイズの多いラベルに対して堅牢であることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:44:20 GMT)
MetaLead: A Comprehensive Human-Curated Leaderboard Dataset for Transparent Reporting of Machine Learning Experiments [2.9] リーダボードは、マシンラーニング(ML)領域において、進捗のベンチマークと追跡に不可欠である。
提案するMetaLeadは、完全な人間による注釈付きデータセットで、結果の透明性のために実験結果をすべてキャプチャする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:16:35 GMT)
MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants [2.9] 我々は、メンタルヘルスアプリケーションのためのAIシステムの開発、評価、監査を支援するために設計されたオープンソースのプラットフォームであるMHDashを紹介する。
以上の結果から, 単純ベースラインと高度なLCM APIは, 高リスク症例においてほぼ同等の精度を示しつつも, 極めて多岐にわたることが示唆された。
MHDashをオープンプラットフォームとしてリリースすることで、再現可能な研究、透過的な評価、メンタルヘルス支援のためのAIシステムの安全に整合した開発を促進することを目指している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:03:31 GMT)
MATRIX: A Multimodal Benchmark and Post-Training Framework for Materials Science [2.8] 我々は,基礎理論,研究レベルの推論,実実験成果物の解釈を評価する材料科学推論のベンチマークであるMATRIXを紹介する。
構造化材料科学テキストだけでのポストトレーニングと、ペア実験画像を含むポストトレーニングの比較を行った。
比較的少量のマルチモーダルデータを使用するにもかかわらず、視覚監督は実験的な解釈を10-25%改善し、テキストのみの科学的推論タスクで5-16%の利益を得る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:55:16 GMT)
URBAN-SPIN: A street-level bikeability index to inform design implementations in historical city centres [2.8] 本研究は,知覚主導型,タイポロジーベース,およびデータ統合フレームワークを開発する。
街路タイプとそれらのサブ分類を明示的にモデル化し、視覚的および空間的構成がサイクリング体験を形作るかを評価する。
このフレームワークは、遺産都市におけるサイクリング状況の評価と改善のための移行可能なモデルを提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:22:11 GMT)
A Comparative Evaluation of Large Vision-Language Models for 2D Object Detection under SOTIF Conditions [2.8] 本稿では、安全クリティカルな2次元物体検出のためのLVLM(Large Vision-Language Models)を体系的に評価する。
PeSOTIFデータセットは、ロングテール交通シナリオと環境劣化のベンチマークである。
LVLMは複雑な自然シナリオの25%以上をリコールしてYOLOベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:58:24 GMT)
SpecIBT: Formally Verified Protection Against Speculative Control-Flow Hijacking [2.7] SpecIBTは、正式にはSpectre BTB、RSB、PHTに対する防衛である。
CETスタイルのハードウェア支援制御フロー整合性と、コンパイラを挿入した投機的負荷硬化を組み合わせる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:42:43 GMT)
PocketDP3: Efficient Pocket-Scale 3D Visuomotor Policy [2.7] 3次元視覚に基づく拡散政策は、複雑なロボット操作スキルを学習する上で強力な能力を示している。
小さいが効率的なポイントクラウドエンコーダは、しばしば巨大なデコーダとペアリングされる。
重条件付きU-Netデコーダを代替するポケットスケール3次元拡散ポリシであるPocketDP3を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:52:41 GMT)
OneFlowSBI: One Model, Many Queries for Simulation-Based Inference [2.6] textitOneFlow SBIはシミュレーションベースの推論のための統一されたフレームワークである。
パラメータと観測の連成分布について、単一のフローマッチング生成モデルを学ぶ。
後続サンプリング、確率推定、任意の条件分布を含む複数の推論タスクをサポートする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:14:44 GMT)
Parametrization of subgrid scales in long-term simulations of the shallow-water equations using machine learning and convex limiting [2.6] 浅水式におけるサブグリッドプロセスのパラメトリゼーション法を提案する。
粗い変数と局所空間平均を定義し、フィードフォワードニューラルネットワークを用いてサブグリッドフラックスを学習する。
提案手法は, 4点計算ステンシルを用いた局所パラメトリゼーションであり, グローバル結合パラメトリゼーションに対していくつかの利点がある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:57:32 GMT)
Trojan-Resilient NTT: Protecting Against Control Flow and Timing Faults on Reconfigurable Platforms [2.6] Number Theoretic Transform (NTT) は格子ベースのポスト量子暗号 (PQC) アルゴリズムで使われる乗算において最も重要な要素である。
ハードウェアの形でのサイドチャネル攻撃(SCA)とハードウェア脆弱性は、制御信号を変更して回路の制御フローを妨害する可能性がある。
本研究では,従来の遅延,制御フローの破壊,およびSASCAを検出可能なセキュアNTTアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:33:39 GMT)
Sifting the Noise: A Comparative Study of LLM Agents in Vulnerability False Positive Filtering [2.5] ソフトウェア脆弱性を特定するには静的アプリケーションセキュリティテスト(SAST)ツールが不可欠だ。
SASTツールは、しばしば大量の偽陽性(FP)を生成する。
LLM(Large Language Model)エージェントの最近の進歩は、有望な方向性を提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:14:55 GMT)
Controllable Information Production [2.4] 内在的動機づけ(Intrinsic Motivation, IM)は、外部ユーティリティなしで知的行動を生成するためのパラダイムである。
我々は、外部ユーティリティとデザイナ指定変数の両方を避ける新しいIM原則である制御可能情報生成(CIP)を導入する。
我々は、CIPの重要な理論的特性を確立し、その有効性を標準IMベンチマークで示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:33:50 GMT)
How well do generative models solve inverse problems? A benchmark study [2.4] 生成学習は低次元条件に基づいて高次元データを生成する。
本研究では,従来のベイズ逆法と,条件付き生成学習モデル,非可逆ニューラルネットワーク,条件付きフローマッチングの3つの状態を比較した。
Conditional Flow Matchingは、競合するすべてのアプローチを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:06:50 GMT)
Autonomous Data Processing using Meta-Agents [2.4] 我々はメタエージェント(ADP-MA)を用いたtextbf Autonomous Data Processingを提案し,データ処理パイプラインを動的に構築し,実行し,反復的に洗練するフレームワークを提案する。
ADP-MAは、コンテキスト対応の最適化、適応的なワークロード分割、拡張性のためのプログレッシブサンプリングを強調している。
ADP-MAはパイプライン構築、実行監視、代表データ処理タスク間の適応的な改善を示すインタラクティブなデモを通じてデモを行う。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:58:17 GMT)
Are Coding Agents Generating Over-Mocked Tests? An Empirical Study [2.4] コーディングエージェントは最近、ソフトウェア開発に大きく採用されている。
本稿では,実世界のソフトウェアシステムのエージェント生成テストにおけるモックの存在について検討する。
全体として、コーディングエージェントは、非コーディングエージェントよりもテストを変更し、テストにモックを追加する傾向にある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:55:25 GMT)
Reinforcement Learning for Control Systems with Time Delays: A Comprehensive Survey [2.4] 強化学習(RL)は複雑な力学系の制御と意思決定において顕著な成功を収めた。
ほとんどのRLアルゴリズムはマルコフ決定過程(Markov Decision Process)の仮定に依存している。
本稿では,制御系の時間遅延に対処するRL法に関する総合的な調査を行う。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:25:30 GMT)
Uncovering Hidden Inclusions of Vulnerable Dependencies in Real-World Java Projects [2.3] Javaにおける依存性スキャンへのハイブリッドアプローチであるUnshadeを紹介します。
メタデータベースのスキャニングの効率性と、コード中心のアプローチの依存関係の変更を検出する機能を組み合わせる。
私たちはGitHubで、最も人気のある1,808のJava Mavenプロジェクトについて大規模な調査を行いました。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:30:04 GMT)
Efficient and accurate steering of Large Language Models through attention-guided feature learning [2.3] ステアリングに関わる3つの課題を克服する,注意誘導型ステアリングフレームワークを導入する。
512のセマンティック概念のステアリングベンチマークを通じて、我々のフレームワークは従来の最先端技術よりもステアリングを大幅に改善した。
当社のフレームワークは,産業用LLMのための効率的かつ高スケールな微調整アルゴリズムを開発するためのさらなる道を開く。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:35:13 GMT)
Super-résolution non supervisée d'images hyperspectrales de télédétection utilisant un entraînement entièrement synthétique [2.3] 本稿では,合成量データに基づく教師なし学習手法を提案する。
ニューラルネットワークは、枯葉モデルで生成されたデータを使用して、地図の超解法を訓練する。
最終超解像ハイパースペクトル像は、超解像アブリダンスマップをエンドメンバーと再結合することによって再構成される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:32:56 GMT)
Heterogeneous Graph Alignment for Joint Reasoning and Interpretability [2.3] クロスグラフ学習のための統一的でスケーラブルで解釈可能なフレームワークであるMulti-Graph Meta-Transformer (MGMT) を提案する。
MGMTはまずグラフトランスフォーマーエンコーダを各グラフ、構造、属性を共有潜在空間にマッピングする。
次に、タスク関連スーパーノードを注意して選択し、潜在空間における類似性を利用してグラフをまたいで機能的に整列したスーパーノードを接続するメタグラフを構築する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:40:13 GMT)
Variational Approach for Job Shop Scheduling [2.3] 本稿では、ジョブショップスケジューリング問題(JSSP)を解決するための新しい変分グラフ・ツー・スケジュール(VG2S)フレームワークを提案する。
提案手法は,最先端のDRLベースラインや従来のディスパッチルールと比較して,ゼロショットの一般化に優れる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:55:18 GMT)
On the undecidability of quantum channel capacities [2.1] 一般的な量子チャネルでは、量子容量を計算するのがQMAハードであり、最大エンタングルメント支援ゼロエラーワンショット容量は計算不可能であることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:35:01 GMT)
Green-NAS: A Global-Scale Multi-Objective Neural Architecture Search for Robust and Efficient Edge-Native Weather Forecasting [2.1] 低リソース環境向けに設計された多目的NASフレームワークであるGreen-NASを紹介する。
グリーンAI」の原則に従うことで、このフレームワークは計算エネルギーコストと炭素フットプリントを明示的に最小化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:03:21 GMT)
Automatic Constraint Policy Optimization based on Continuous Constraint Interpolation Framework for Offline Reinforcement Learning [2.1] オフライン強化学習(RL)は、パフォーマンスを形作るためのポリシー制約に依存している。
既存のほとんどのメソッドは単一の制約ファミリにコミットします。
本稿では,統合最適化フレームワークであるContinuous Constraint Interpolation (CCI)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:21:41 GMT)
DETOUR: An Interactive Benchmark for Dual-Agent Search and Reasoning [2.0] 本稿では,1011のプロンプトを含むデュアルエージェント評価ベンチマークであるDETOUR(Obscure Under-specified Retrieval)を提案する。
以上の結果から,現在の最先端モデルではベンチマークに苦戦しており,すべてのモダリティで評価した場合の精度は36%に過ぎなかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:01:30 GMT)
Generative and Nonparametric Approaches for Conditional Distribution Estimation: Methods, Perspectives, and Comparative Evaluations [2.0] 本稿では、古典的非パラメトリック法と近代生成モデルにまたがるいくつかの代表的なアプローチをレビューし、比較する。
推定条件分布に使用する性能指標には,条件平均の平均2乗誤差と標準偏差がある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:10:36 GMT)
Beyond Alignment: Expanding Reasoning Capacity via Manifold-Reshaping Policy Optimization [2.0] RLVR(Reinforcement Learning with Verifiable Rewards)は,Large Language Models(LLM)の推論能力の向上に成功している。
近年の研究では、RLが推論能力を真に拡張するか、あるいは既存の潜在能力を単に整合させるかが疑問視されており、探索は事前訓練されたモデルの低ランクバイアス多様体に限られていると主張している。
我々は,LLMの推論空間を根本的に再構成する幾何学的フレームワークであるマニフォールド変換ポリシー最適化(MRPO)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:38:44 GMT)
Disentangling multispecific antibody function with graph neural networks [2.0] 多種特異的抗体は、複数の抗体を同時に作用させることにより、形質転換的治療電位を提供する。
それらの効果は複雑な分子構造によって支配される。
非線形相互作用をキャプチャする合成機能ランドスケープを作成するための生成法を提案する。
このモデルは,合成景観に基づいて訓練され,複雑な機能的特性を再カプセル化し,伝達学習によって高い予測精度を達成できることを実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:36:19 GMT)
Stabilizing Transformer Training Through Consensus [2.0] コンセンサス機構は、より広範な効果的な学習率でトランスフォーマートレーニングを安定化させることを示す。
本稿では,安定性を向上しつつ,性能を保ちつつ協調的なコンセンサスアテンション・アテンション・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:12:07 GMT)
Metric Hub: A metric library and practical selection workflow for use-case-driven data quality assessment in medical AI [1.9] データ品質の次元を実際に測定するためのデータ品質指標のコレクションを導入します。
提案手法がPTB-XL ECGデータセットに与える影響を例に示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:22:29 GMT)
Complete Identification of Deep ReLU Neural Networks by Many-Valued Logic [1.9] ディープReLUニューラルネットワークは、非自明な機能対称性を持つ。
我々はReLUネットワークをLukasiewicz論理式に変換する。
すべての関数同値類に対して、そのクラスのすべてのReLUネットワークは有限個の対称性によって接続されていることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:39:55 GMT)
Planning with Language and Generative Models: Toward General Reward-Guided Wireless Network Design [1.9] 統合報酬関数を用いた拡散型生成推論が屋内展開計画のスケーラブルな基盤となることを示す。
我々は屋内AP展開のための大規模な実世界のデータセットを導入し、報酬のランドスケープを鋭くする必要がある。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:09:31 GMT)
Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction [1.9] Open Compute Project (OCP) Microscaling標準MXFP4はNVIDIAのNVFP4の精度に遅れている。
我々は,OAS(Overflow-Aware Scaling)とMBS(Macro Block Scaling)という,ソフトウェアのみの2つのテクニックを紹介した。
OASとMBSはMXFP4とNVFP4のエンドツーエンドの精度ギャップを平均で約10%から1%以下に減らす。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:24:17 GMT)
Modeling Art Evaluations from Comparative Judgments: A Deep Learning Approach to Predicting Aesthetic Preferences [1.8] 比較判断法は、相対的な選択は直接的な得点よりも認知的負担と認知的一貫性が低いことを示唆している。
我々は、ディープニューラルネットワーク回帰モデルとデュアルブランチペアワイズ比較モデルを開発する。
人間の被験者による実験では、比較判断はアイテムあたりのアノテーション時間に60ドルもかからないことがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:13:06 GMT)
Self-Attention at Constant Cost per Token via Symmetry-Aware Taylor Approximation [1.7] トークン当たりのコストは一定であり,自己注意は任意の精度で効率的に計算可能であることを示す。
当社の作業は,トークン生成を最小の固定コストで実現し,大規模トランスフォーマーモデルのインフラストラクチャとエネルギー需要を大幅に削減する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:38:02 GMT)
From Data Leak to Secret Misses: The Impact of Data Leakage on Secret Detection Models [1.7] 機械学習モデルは、ソフトウェアセキュリティタスクにますます使われています。
これらのモデルは一般にトレーニングされ、大規模なインターネット由来のデータセットで評価される。
このようなサンプルをトレーニングとテストセットに分割すると、データのリークが発生し、学習の一般化ではなくパターンを記憶することができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:05:52 GMT)
Evaluating the Effectiveness of OpenAI's Parental Control System [1.7] 未成年者が使用するメインストリームの会話アシスタントにおいて,プラットフォームレベルのペアレンタルコントロールがいかに効果的かを評価する。
我々は、身体的危害、ポルノグラフィー、プライバシー侵害、健康相談、詐欺、ヘイトスピーチ、マルウェアの7つの危険領域に焦点を当てています。
通知は包括的ではなく選択的であることがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:15:24 GMT)
Manifold-Aware Perturbations for Constrained Generative Modeling [1.6] 等式制約付き生成モデルにおいて、既知の落とし穴と戦うために、計算的に安価で、数学的に正当化され、高度に柔軟な分布修正を開発する。
本研究では,拡散モデルと正規化フローを併用して,データの分散回復と安定したサンプリングを一貫して実現することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:34:33 GMT)
Complete Hierarchies for the Geometric Measure of Entanglement [1.6] 量子物理学において、多粒子系はヒルベルト空間のテンソル積に作用する量子状態によって記述される。
この積構造は、積状態と絡み合った状態の区別につながる。
量子状態から積状態の集合への距離を考慮し、絡み合いを定量化することができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:12:55 GMT)
Evaluating Large Language Models for Security Bug Report Prediction [1.5] セキュリティバグレポート(SBR)の早期検出は、タイムリーな脆弱性軽減に不可欠である。
本稿では,SBRの予測手法として,プロンプトベースエンジニアリングと微調整手法の評価を行う。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:43:01 GMT)
From Monolith to Microservices: A Comparative Evaluation of Decomposition Frameworks [1.5] この研究は、静的、動的、ハイブリッド技術にまたがる最先端のマイクロサービス分解アプローチを統一的に評価する。
我々は,構造モジュール性(SM),インターフェース番号(IFN),インターパーティション通信(ICP),非エクストリーム分布(NED),関連指標を用いて,広く使用されているベンチマークシステム(JPetStore,AcmeAir,DayTrader,植物)の分解品質を評価する。
階層的なクラスタリングベースの手法、特にHDBScanは、ベンチマーク間で最も一貫したバランスの取れた分解を生成することを示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:28:47 GMT)
SCOPE-PD: Explainable AI on Subjective and Clinical Objective Measurements of Parkinson's Disease for Precision Decision-Making [1.5] パーキンソン病(英: Parkinson's disease、PD)は、遺伝、臨床、生活習慣に影響を及ぼす慢性神経変性疾患である。
機械学習(ML)はPD診断をサポートする可能性を示しているが、既存のアプローチは主観的報告のみに依存することが多い。
本研究では、主観的および客観的な評価を統合することで、説明可能なAIベースの予測フレームワークであるSCOPE-PDを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:49:31 GMT)
Chain-of-thought obfuscation learned from output supervision can generalise to unseen tasks [1.4] チェーン・オブ・シント(CoT)推論はLLMに大幅なパフォーマンス向上をもたらす。
CoTは、これらのエージェントの振る舞いを監視する強力なツールでもある。
我々は、CoTの最適化圧力が、モデルが推論トレースを難なくし、この有益な性質を失う可能性があることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:34:14 GMT)
Laser interferometry as a robust neuromorphic platform for machine learning [1.4] 本稿では,線形光学資源のみを用いた光ニューラルネットワークの実装手法を提案する。
ニューラルネットワークにおける学習に必要な非線形性は、入力を位相シフトに符号化することで実現される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:48:48 GMT)
Quasiperiodic Skin Criticality in an Exactly Solvable Non-Hermitian Quasicrystal [1.4] 準周期系の臨界状態は、拡張状態と局所状態の間の従来の二分法に反する。
波多野・ネルソンモデルに基づく非エルミート準周期格子を導入する。
この臨界性はマルチバンド格子に持続し、汎用的で解析的に制御されたフレームワークを確立する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:26:14 GMT)
When Machines Get It Wrong: Large Language Models Perpetuate Autism Myths More Than Humans Do [1.3] 本研究は,先行するAIシステムが自閉症スペクトラム障害に関する誤解を永久に克服するか否かを検討する。
人類の参加者はLLMよりもはるかに少ない神話を支持した。
評価項目30項目のうち18項目において、人間はAIシステムを大きく上回った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:12:52 GMT)
AI-Generated Image Detectors Overrely on Global Artifacts: Evidence from Inpainting Exchange [1.3] VAEをベースとした再構成は、未編集領域を含む画像全体にわたって微妙に広範にスペクトルシフトを引き起こす。
Inpainting Exchange (INP-X) は、編集領域外の元のピクセルを復元し、すべての合成コンテンツを保存する操作である。
本研究の成果は,コンテンツ認識検出の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:14:10 GMT)
WiFiPenTester: Advancing Wireless Ethical Hacking with Governed GenAI [1.3] WiFiPenTesterは、GenAI対応のワイヤレス倫理的ハッキングのための実験的で、管理され、再現可能なシステムである。
本稿では,複数の無線環境を対象としたシステムアーキテクチャ,脅威モデル,ガバナンス機構,実証実験について述べる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:40:16 GMT)
Automated Testing of Prevalent 3D User Interactions in Virtual Reality Applications [1.3] 既存のVRテストアプローチはシーンナビゲーションとインタラクションのアクティベーションを可能にするが、現実的な3Dユーザ入力を自動的に合成する能力は欠如している。
ターゲット,アクション,条件を識別することによって,3次元ユーザインタラクションを体系的にモデル化する,新たな抽象化であるInteraction Flow Graphを導入する。
動的シーン探索とインタラクション実行にこのグラフを活用する自動テスト手法であるXRintTestを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:28:31 GMT)
High-quality generation of dynamic game content via small language models: A proof of concept [1.2] 大規模言語モデル(LLM)は動的ゲームコンテンツ生成を約束するが、それらは重大な障壁に直面している。
サイズが大きいため、しばしばクラウドでアクセスされ、オフラインゲームでアプリケーションに制限される。
本稿では,意図的なスコープ化タスクを積極的に微調整することで,高品質なSLM生成を実現する戦略を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:30:59 GMT)
AEGIS: White-Box Attack Path Generation using LLMs and Training Effectiveness Evaluation for Large-Scale Cyber Defence Exercises [1.2] AEGISはLLM、ホワイトボックスアクセス、モンテカルロ木探索を用いて攻撃経路を生成するシステムである。
46のITホストにまたがる大規模なエクササイズであるCIDeX 2025での評価では、AIGISが生成するパスは、人間が許可したシナリオに匹敵することを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:52:27 GMT)
Scale-Cascaded Diffusion Models for Super-Resolution in Medical Imaging [1.2] 画像をラプラシアンピラミッドスケールに分解し、各周波数帯域に対して個別拡散先行を訓練する。
そして、これらの先行技術を用いて様々なスケールの再構成を段階的に洗練する超解像処理アルゴリズムを開発する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:24:34 GMT)
Layerwise Progressive Freezing Enables STE-Free Training of Deep Binary Neural Networks [1.2] スクラッチからバイナリネットワークをトレーニングするためのストレートスルー推定器(STE)の代替として,進行凍結について検討した。
制御されたトレーニング条件下では、グローバルなプログレッシブ・フリーズがバイナリ・ウェイト・ネットワークで機能する一方で、アクティベーションによって引き起こされる障害により、完全なバイナリ・ニューラル・ネットワークでは機能しないことがわかった。
我々はStoMPPを導入する。StoMPPはレイヤーワイズマスキングを用いて、切り取り可能な重み付け/アクティベーションをハードバイナリステップ関数に段階的に置き換える。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:26:10 GMT)
Quantifying Model Uniqueness in Heterogeneous AI Ecosystems [1.1] In-Silico Quasi-Experimental Design に基づく監査モデル一意性に関する統計的枠組みを提案する。
モデル間で一致した介入を強制することにより、本質的なモデルのアイデンティティを分離し、一意性を Peer-Inpresentible Residual (PIER) として定量化する。
これらの結果は、信頼できるAIを単一のモデルの説明以上のものにする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:41:53 GMT)
Beyond Abstract Compliance: Operationalising trust in AI as a moral relationship [1.0] 本稿では、共通開発手法に組み込むことができるAIに対する信頼のための拡張された原則を提案する。
我々は、関係倫理、特にアフリカ共産主義哲学に基づいて、包括的、参加的プロセスのニュアンスを予見する。
AIライフサイクル全体を通じてコミュニティを巻き込むことは、AI設計と開発チームとの有意義な関係を育むことができる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:48:24 GMT)
Procedural Knowledge Extraction from Industrial Troubleshooting Guides Using Vision Language Models [1.0] 産業トラブルシューティングガイドは、空間的レイアウトと技術言語が共同で意味を伝えるフローチャートのようなダイアグラムの診断手順を符号化する。
本稿では,構造化知識抽出のための2つの視覚言語モデルについて検討する。
結果は、レイアウトの感度とセマンティックな堅牢性の間のモデル固有のトレードオフを明らかにし、実践的なデプロイメント決定を通知する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:31:41 GMT)
Learning to Price: Interpretable Attribute-Level Models for Dynamic Markets [1.0] 本稿では,emphAdditive Feature Decomposition-based Low-dimensional Demand (textbfAFDLD)モデルを提案する。
ADEPTは動的市場条件下でほぼ最適価格を学習することを示す。
その結果,自律型価格設定エージェントの解釈可能性と効率性は共同で達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:52:07 GMT)
Stop Jostling: Adaptive Negative Sampling Reduces the Marginalization of Low-Resource Language Tokens by Cross-Entropy Loss [1.0] 余剰余剰化による有害な影響を抑えることにより, 希少なトークンの表現を改善するために, 負のサンプリングが適用可能であることを示す。
この研究は、過剰な余剰化による有害な影響を制限することにより、希少なトークンの表現を改善するために、どのように負のサンプリングを適用できるかを示す最初のものである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:17:53 GMT)
Adaptive Momentum and Nonlinear Damping for Neural Network Training [1.0] 本稿では,各モデルパラメータの運動エネルギーによって制御される個別の適応運動量係数を導入する,大規模最適化のための連続時間スキームを提案する。
適応摩擦は構造力学からの抑制機構である立方減衰と関係があることを実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:35:55 GMT)
Assessing the Real-World Impact of Post-Quantum Cryptography on WPA-Enterprise Networks [1.0] WPA-Enterprise-based authentication におけるポスト量子暗号(PQC)アルゴリズムの性能評価を行った。
PQCアルゴリズムを複数組み合わせて評価し,性能のオーバーヘッドを解析する。
そこで本研究では,PQC対応WPA-Enterprise認証の性能評価を行った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:12:07 GMT)
Assessing Domain-Level Susceptibility to Emergent Misalignment from Narrow Finetuning [0.9] 言語モデルが自律的なタスクにますます使われているため、創発的なミスアライメントはAIの安全性にリスクをもたらす。
11の異なる領域にまたがる安全でないデータセットに基づいて,大規模言語モデル (LLM) の個体群を微調整した。
バックドアのトリガーは 77.8%のドメインで 悪用率を高めます
ドメインの脆弱性は、微調整時に0%のミスアライメントから、数学問題に対する誤った回答を出力する際のミスアライメントから、textttgore-movie-triviaで微調整されたとき87.67%まで、様々である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:43:56 GMT)
Advanced Geometric Correction Algorithms for 3D Medical Reconstruction: Comparison of Computed Tomography and Macroscopic Imaging [0.9] 本稿では, マクロスライスから3次元腎解剖を再構築するためのハイブリッド2段階登録フレームワークを提案する。
これは、マクロ画像の典型的なデータスカシティと高歪みの課題に対処する。
提案手法は,光学的および写真的断面から再構成した他の軟部臓器に一般化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:16:17 GMT)
MoVE: Mixture of Value Embeddings -- A New Axis for Scaling Parametric Memory in Autoregressive Models [0.9] 我々は,モデルキャパシティの剛性構造結合を計算コストに分解するメカニズムである$textbfMoVE (Mixture of Value Embeddings)$を紹介した。
MoVEは、すべての注目層間で共有される学習可能な値埋め込みのグローバルバンクを導入することで、メモリを計算から切り離す。
自動回帰モデリングの2つの代表的応用であるテキスト生成と画像生成に関する厳密に制御された実験を通してMoVEを検証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:07:23 GMT)
Robust Rigid Body Assembly via Contact-Implicit Optimal Control with Exact Second-Order Derivatives [0.9] 本稿では, 組立動作決定のためのサンプル効率の高いロバスト最適制御手法を提案する。
数値解法に二階解析微分を与える微分可能な物理シミュレーションを構築する。
物理シミュレーション問題の解法は、衝突検出と接触分解問題の両方に適用された内部点法にインスパイアされた平滑化を用いて微分可能とする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:21:20 GMT)
Mixed-Precision Training and Compilation for RRAM-based Computing-in-Memory Accelerators [0.9] CIMアーキテクチャのための混合精度トレーニングおよびコンパイルフレームワークを提案する。
最大の課題は巨大な検索スペースであり、優れた量子化パラメータを見つけるのが難しくなる。
最良の場合、我々の手法は既存の最先端ソリューションよりも2.48倍のスピードアップを達成し、精度の損失は0.086%である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:40:21 GMT)
Uncertainty-Aware Extrapolation in Bayesian Oblique Trees [0.9] 適度に一貫性のある葉の予測は、トレーニング対象によって境界付けられ、しばしば分布シフトの下で過信される。
本稿では,各葉にGP予測器を装着することにより,VSPYCTを拡張した単木ベイズモデルを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:19:17 GMT)
RAudit: A Blind Auditing Protocol for Large Language Model Reasoning [0.9] 推論時間のスケーリングは、梅毒、暴走崩壊、早さの確実性といった推論の病理を増幅することができる。
基礎的な真理アクセスを伴わずにLCM推論を監査するための診断プロトコルであるRAuditを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:22:45 GMT)
Bayesian Interpolating Neural Network (B-INN): a scalable and reliable Bayesian model for large-scale physical systems [0.9] 本稿ではベイズ補間ニューラルネットワーク(B-INN)と呼ばれるスケーラブルで信頼性の高いベイズ代理モデルを提案する。
B-INNは、高次理論とテンソル分解と交互方向アルゴリズムを組み合わせることで、予測精度を損なうことなく、効果的な次元削減を実現する。
数値実験により、B-INNは20倍から1万倍の速度で安定な不確実性推定を行うことができることが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:38:42 GMT)
Agile Reinforcement Learning through Separable Neural Architecture [0.9] 本研究は, 深層強化学習のための関数近似手法であるSPANを紹介する。
SPANはサンプル効率を30-50%改善し、ベンチマーク全体の成功率をベースラインの1.3-9倍に向上させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:47:36 GMT)
Learn from A Rationalist: Distilling Intermediate Interpretable Rationales [0.8] textbfREKD (textbfRationale textbfExtraction with textbfKnowledge textbfDistillation) ここでは、学生REモデルが教師の合理性と予測から学習する。
言語および視覚分類データセット(IMDB映画レビュー、CIFAR 10、CIFAR 100)にわたる実験により、REKDは学生REモデルの予測性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:07:47 GMT)
Synchronized distribution of quantum entanglement coexisting with high-rate, broadband classical optical communications over a real-world fiber link [0.8] 既存の古典的ネットワークインフラストラクチャとの互換性は、大規模量子ネットワークの展開に向けたスケーラブルなパスを提供する。
設置した24.4km繊維上のOバンド偏光符号化量子絡み合い分布を実証する。
超高電力レベルと量子絡み合いの共存を実証し,古典的帯域幅を記録する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:17:57 GMT)
Towards Analyzing N-language Polyglot Programs [0.8] 開発者が複数のプログラミング言語を統合することで、多言語プログラミングが人気を集めている。
現代的なWebシステムは、同じ実行チェーン内でJavaScript、WebAssembly、Rustをリンクすることが多い。
本稿では,3言語多言語通信によるソフトウェアシステムの展望について述べる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:52:26 GMT)
Scalable spatial point process models for forensic footwear analysis [0.8] 犯罪現場から回収された靴の指紋証拠は、法医学的な調査において重要な役割を担っている。
「調査員がよく使うアプローチは、事故の兆候の印刷物を調べることである。」
したがって、法医学的証拠の強さを正確に測定するためには、パターンの希少性を定量化することが不可欠である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:30:32 GMT)
NEXUS: Bit-Exact ANN-to-SNN Equivalence via Neuromorphic Gate Circuits with Surrogate-Free Training [0.8] スパイキングニューラルネットワーク(SNN)は、イベント駆動の空間性を通じてエネルギー効率の高いコンピューティングを約束する。
既存のアプローチでは、離散スパイクで連続的な値を近似することで精度を犠牲にしている。
ビットエクササイズ ANN-to-SNN 等価性を実現するフレームワークであるNEXUS を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:45:40 GMT)
Semantic-Aware Advanced Persistent Threat Detection Using Autoencoders on LLM-Encoded System Logs [0.8] Advanced Persistent Threats(APT)は、最も困難なサイバー攻撃のひとつだ。
従来の統計手法と浅い機械学習技術は、しばしばそれらを検出するのに失敗する。
本稿では,セマンティック埋め込みを利用した新しい異常検出手法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:38:12 GMT)
RAG-DIVE: A Dynamic Approach for Multi-Turn Dialogue Evaluation in Retrieval-Augmented Generation [0.8] RAG-DIVE(Dynamic Interactive Validation and Evaluation approach)を紹介する。
RAG-DIVEはマルチターン設定でRAGシステムとのユーザインタラクションをシミュレートする。
以上の結果から,RAG-DIVEは対話型対話の動的・対話型評価を促進することが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:32:14 GMT)
QUASAR: A Universal Autonomous System for Atomistic Simulation and a Benchmark of Its Capabilities [0.8] QUASARは、生産段階の科学的発見を促進するために設計された原子論シミュレーションのための普遍的な自律システムである。
我々は,光触媒スクリーニングや新規材料評価など,日常的な課題からフロンティア研究の課題まで,一連の3段階の課題に対してquariSARをベンチマークした。
その結果,quiSARはタスク固有の自動化フレームワークではなく,一般的な原子論的推論システムとして機能することが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:29:44 GMT)
A Renderer-Enabled Framework for Computing Parameter Estimation Lower Bounds in Plenoptic Imaging Systems [0.7] 本研究は, Plenoptic imaging system におけるシーンパラメータ推定における情報理論的限界を評価することに焦点を当てる。
雑音の反射光観測からパラメータ推定誤差の下位境界を計算するための一般的な枠組みを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:47:58 GMT)
Subspace Clustering on Incomplete Data with Self-Supervised Contrastive Learning [0.7] サブスペースクラスタリングは、低次元のサブスペースの結合にあるデータポイントをグループ化することを目的としている。
現在の手法では、完全に観測されたデータを仮定し、欠落したエントリを持つ現実世界のシナリオにおける有効性を制限している。
不完全なデータをクラスタリングするために設計されたContrastive Subspace Clustering (CSC)を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:24:48 GMT)
Multi-Cue Anomaly Detection and Localization under Data Contamination [0.7] 本稿では,適応的偏差学習パラダイムに限定的な異常監視を組み込んだ頑健な異常検出フレームワークを提案する。
本フレームワークは, 各種データ汚染下での強い検出・局所化性能, 解釈可能性, 堅牢性を実現する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:34:13 GMT)
High Rank Matrix Completion via Grassmannian Proxy Fusion [0.6] 現在の手法は理論的な支持を欠くことが多く、解釈不可能な結果をもたらし、理論上必要以上に多くのサンプルを必要とする。
プロキシ部分空間をグループ化し、グラスマン多様体上の2つの基準を最小化することにより、クラスタリング不完全ベクトルを提案する。
合成および実データを用いた実験により,本手法は高サンプリング率,低サンプリング率において,先行手法と相容れない性能を示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:06:36 GMT)
When LLM meets Fuzzy-TOPSIS for Personnel Selection through Automated Profile Analysis [0.6] 本研究では、高度な自然言語処理(NLP)手法を用いて、ソフトウェア工学の応募者を評価・ランク付けする自動人事選択システムを提案する。
ユニークなデータセットは、教育、仕事の経験、能力、自己導入といった重要な機能を含むLinkedInプロファイルを集約することによって作成されました。
候補ランキングでは、DistilRoBERTaモデルが微調整され、ファジィTOPSIS法と統合され、人間の専門家評価と密接に整合したランキングが達成された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:57:35 GMT)
PIDSMaker: Building and Evaluating Provenance-based Intrusion Detection Systems [0.6] PIDSMakerは、一貫した視覚化プロトコルの下でPIDSを開発し評価するためのオープンソースのフレームワークである。
最先端の8つのシステムを、標準化された事前処理と基盤トラストラベルを備えたモジュラーアーキテクチャに統合する。
YAMLベースの設定インターフェースは、コード変更なしにシステム間でコンポーネントを構成することで、迅速なプロトタイピングをサポートする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:45:33 GMT)
A Comparative Simulation Study of the Fairness and Accuracy of Predictive Policing Systems in Baltimore City [0.6] ボルチモアにおける予測警察システムの公正性と正確性に関する総合的な比較シミュレーションを行った。
以上の結果から,予測ポーリングにおけるバイアスの状況は,従来想定されていたよりも複雑であることが示唆された。
予測的ポリシングは短期的にはホットスポットポリシングよりも公平で正確であることが判明したが、バイアスは速くなった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:34:46 GMT)
Under-Canopy Terrain Reconstruction in Dense Forests Using RGB Imaging and Neural 3D Reconstruction [0.6] 従来のRGB画像のみを用いた天蓋のない光写実的地上ビューの再構築のための新しいアプローチを提案する。
提案手法は,最近の3次元再構成法であるNeRF(Neural Radiance Fields)に基づく。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:38:56 GMT)
The Green Side of the Lua [0.6] Lua氏はこのトレードオフを説明している。 人気があるにもかかわらず、C言語のようなよりグリーンで高速な言語よりもエネルギー効率が低い。
本稿では,25の公式インタプリタバージョンとジャスト・イン・タイム(JIT)コンパイラを対象に,Luaのランタイム性能とエネルギー効率に関する実証的研究を行った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:52:17 GMT)
Regularisation in neural networks: a survey and empirical analysis of approaches [0.5] 二重降下などの近代的理論を含む正則化手法を概観する。
10個の数値および画像データセットの分類タスクにおける様々な正規化手法を比較した。
その結果,正規化の有効性はデータセットに依存していることがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:22:11 GMT)
Addressing the ground state of the deuteron by physics-informed neural networks [0.5] Informed Neural Networks(PINN)は、積分微分問題を解くのに適した、有望な機械学習技術である。
我々は運動量空間における現実的な核子-核子相互作用に取り組み、強い高モメンタム相関を持つモデルを含む。
我々のアプローチは、より複雑な原子核を解くためのPINNの活用の道を開く。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:27:40 GMT)
A Cross-Domain Graph Learning Protocol for Single-Step Molecular Geometry Refinement [0.5] GeoOpt-Net (GeoOpt-Net) は、B3LYP/TZVP理論のDFT品質構造を1つの前方通過で予測する多分岐SE(3)等変幾何改善ネットワークである。
GeoOpt-Netは、DFT収束基準と本質的に互換性のある初期推定を生成し、非ゼロのAll-YES'収束率をもたらす。
これらの結果は、DFTに基づく量子化学予測の効率的な加速を可能にするスケーラブルで物理的に一貫した幾何補正フレームワークとしてGeoOpt-Netを確立する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:55:46 GMT)
Leveraging Convolutional Sparse Autoencoders for Robust Movement Classification from Low-Density sEMG [0.5] 本研究では,2つの表面筋電図(sEMG)チャネルのみを用いた正確なジェスチャー認識のためのディープラーニングフレームワークを提案する。
最小限の校正データで35.1%$pm$3.1%から92.3%$pm$0.9%のベースラインから、未確認被験者のパフォーマンスを改善した数ショット転送学習プロトコルを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:21:46 GMT)
Aligning the Unseen in Attributed Graphs: Interplay between Graph Geometry and Node Attributes Manifold [0.5] 構造アライメントから多様体学習を分離するカスタム変分オートエンコーダを導入する。
属性多様体をグラフのHeat Kernelにマッピングするために必要な計量歪みを定量化することにより、幾何学的衝突を構造記述子に変換する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:34:26 GMT)
Scaling Multiagent Systems with Process Rewards [0.5] 本稿では,AIフィードバックから処理毎の報酬を付与したマルチエージェントシステムを提案する。
我々は,競合数学問題とツール拡張データ解析タスクに対するアプローチを実証する。
データ解析タスクでは,品質指標が最大30%向上するのに対して,本手法は成功率を+12.5pp向上させる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:55:27 GMT)
Leveraging Textual-Cues for Enhancing Multimodal Sentiment Analysis by Object Recognition [0.5] マルチモーダル感情分析は画像データとテキストデータの両方を含む。
このアプローチの一部は、オブジェクト認識手法に基づいた、新しいマルチモーダル知覚分析のためのテクスチュアルキュー(TEMSA)を導入している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:17:29 GMT)
High-resolution tunable frequency beamsplitter enabled by an integrated silicon pulse shaper [0.5] 6つのスペクトルチャネルを持つ集積パルス整形器をベースとした量子周波数プロセッサを用いて,高忠実度,波長可変,超高分解能オンチップ周波数ビームスプリッタを実演する。
周波数間隔を2GHzまで狭くするシステムのサポートは、以前のバルクデモをはるかに上回っている。
その結果、周波数ビン量子フォトニクスの統合のためのスケーラブルで資源効率の良いプラットフォームが確立された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:37:44 GMT)
Toward Ultra-Long-Horizon Sequential Model Editing [0.4] 本研究では,大規模な言語モデルにおいて,長い編集シーケンスが突然のモデル崩壊を引き起こすことを示す。
そこで我々は,Norm-Anchor Scaling NASを提案する。
NASは代表L&Eアルゴリズムの崩壊点を4回以上遅らせ、編集性能の平均相対利得は72.2%である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:31:21 GMT)
Local-Global Multimodal Contrastive Learning for Molecular Property Prediction [0.4] LGM-CLは,分子グラフとテキスト表現を共同でモデル化する,局所的多言語型コントラスト学習フレームワークである。
MoleculeNetベンチマークの実験では、LGM-CLは分類タスクと回帰タスクの両方で一貫した、競争力のあるパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:06:17 GMT)
EQ-5D Classification Using Biomedical Entity-Enriched Pre-trained Language Models and Multiple Instance Learning [0.4] 健康経済学において、体系的な文献レビューは、EQ-5Dを使用する出版物の正しい識別に依存している。
大量の科学文献の手作業によるスクリーニングは、時間を要する、エラーを起こし、一貫性がない。
本研究では,汎用言語モデル(BERT)とドメイン固有言語モデル(SciBERT, BioBERT)の微調整について検討する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:10:34 GMT)
M-SGWR: Multiscale Similarity and Geographically Weighted Regression [0.4] M-SGWRは2次元の空間的相互作用を特徴付けている。
M-SGWRは、GWR、SGWR、MGWRを全ての好適な指標で一貫して上回っていることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:46:45 GMT)
Analyzing Shapley Additive Explanations to Understand Anomaly Detection Algorithm Behaviors and Their Complementarity [0.4] 本稿では, 異常検出器の判定機構を用いて, 異常検出器を識別する手法を提案する。
類似した説明を持つ検出器は相関した異常スコアを生成し、主に重複する異常を同定する傾向がある。
また、多様性だけでは不十分であり、個々のモデルのパフォーマンスが効果的なアンサンブルの前提条件であることも示しています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:45:43 GMT)
Expert Evaluation and the Limits of Human Feedback in Mental Health AI Safety Testing [0.4] 人間のフィードバックから学ぶことは、専門家の判断が適切に集約され、AIシステムのトレーニングと評価に有効な基礎的真実をもたらすと仮定する。
この仮定は、高い安全性が専門家のコンセンサスに不可欠であるメンタルヘルスにおいて検証された。
自殺反応と自傷反応は、他のどのカテゴリーよりも大きなばらつきをもたらし、ランダムではなく体系的であった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:45:34 GMT)
RobustDebias: Debiasing Language Models using Distributionally Robust Optimization [0.4] そこで本研究では,分散ロバスト最適化をデバイアス言語モデルに適用する機構である itRobustDebias を提案する。
我々のアプローチは、微調整中にモデルを複数の人口層に分散させ、任意のデータセットやタスクに一般化する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:49:11 GMT)
AI-Enabled Waste Classification as a Data-Driven Decision Support Tool for Circular Economy and Urban Sustainability [0.4] 本稿では,従来の機械学習技術(Random Forest, SVM, AdaBoost)とディープラーニング技術の両方を評価する。
廃棄物の自動ソートのためのリアルタイムデータ駆動意思決定支援システムにこれらのモデルがどのように統合されているかを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 00:10:40 GMT)
IDE-Bench: Evaluating Large Language Models as IDE Agents on Real-World Software Engineering Tasks [0.4] 我々は、生の端末実行を超えるDocker化されたテストハーネスを提示します。
検索、構造化ファイル編集、フルスタックアプリケーションのテストツールに高レベルの抽象化を提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:43:06 GMT)
Approximating $f$-Divergences with Rank Statistics [0.3] ランクの分布を直接扱うことで、明示的な密度比推定を避けるために、$f$-divergencesのランク統計近似を導入する。
発散の結果として生じる推定量は、K$の単調であり、常に真$f$-発散の下位境界であることを示す。
ニューラルベースラインに対するベンチマークによるアプローチを実証的に検証し,生成モデル実験における学習目的としての利用を例証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:05:33 GMT)
Leveraging Multi-Rater Annotations to Calibrate Object Detectors in Microscopy Imaging [0.3] マルチレータアノテーションを利用したモデルキャリブレーションの改良手法を提案する。
そこで本研究では,アノテーションに関する個々のモデルを単一専門家から訓練し,それらの予測を集約してコンセンサスをエミュレートする手法を提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:17:29 GMT)
The Third-Party Access Effect: An Overlooked Challenge in Secondary Use of Educational Real-World Data [0.3] 教育における実世界のデータ(RWD)の二次的利用は、研究のための重要な機会を提供する。
このようなRWDへのサードパーティのアクセスを可能にするためのプライバシプラクティスは、ダウンストリーム分析に影響を及ぼすものとして評価されることは滅多にない。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:36:44 GMT)
Generalized Inverses of Matrix Products: From Fundamental Subspaces to Randomized Decompositions [0.3] ムーア・ペンローズ擬逆数と行列積$A=CR$の一般化逆数について検討し、一般化およびランダム化された行列逆数の統一的枠組みを確立する。
このフレームワークは一般化された1,12$-逆および特殊形式に拡張され、確立されたランダム化線形代数アルゴリズムの構造を明らかにする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:05:18 GMT)
Trackly: A Unified SaaS Platform for User Behavior Analytics and Real Time Rule Based Anomaly Detection [0.2] Tracklyは、総合的なユーザ行動分析をリアルタイムで、ルールベースの異常検出と統合する。
リアルタイムダッシュボードは、グローバルセッションマップ、DAU MAU、バウンスレート、セッション期間を提供する。
トラックは98.1%の精度、97.7%の精度、合成データセットの2.25%の偽陽性を達成した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:31:26 GMT)
AI Unplugged: Embodied Interactions for AI Literacy in Higher Education [0.2] 本稿では,大学レベルのAI授業に具体化されていない活動を統合する,新たな教育的アプローチを提案する。
K-12教育におけるCS Unpluggedの効果に触発されて、我々の身体的、協力的な活動は、学生にAI意思決定に関する第一の視点を与えました。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:47:26 GMT)
Compact U(1) Lattice Gauge Theory in Superconducting Circuits with Infinite-Dimensional Local Hilbert Spaces [0.2] ガウスの法則は、補助的な安定化器、ペナルティ項、ヒルベルト空間の切り離しなしで、局所電荷の保存から正確に現れる。
最小のゲージ・マッター結合はジョセフソンの非線形性から顕微鏡的に生じる。
数値対角化は、コンパクトな電磁力学とコヒーレント渦励起の出現を確認する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:34:13 GMT)
Entanglement Hamiltonians in dissipative free fermions and the time-dependent GGE [0.2] 放散自由フェルミオン系におけるエンタングルメントハミルトニアン(EHs)のダイナミクスについて検討する。
利得と損失の散逸に着目して,ポストクエンチの進化を考察し,弾道スケールでのEHの明示的な表現を導出する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:05:58 GMT)
On the Assessment of Sensitivity of Autonomous Vehicle Perception [0.1] 自動走行の実現性は知覚システムの性能に大きく依存する。
モデルアンサンブルに基づく予測感度定量化を用いて知覚性能を評価する。
異なる路面上の停止標識におけるAVの停止距離に基づいて知覚評価基準を開発する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:06:05 GMT)
End-to-end Optimization of Belief and Policy Learning in Shared Autonomy Paradigms [0.1] 共有自律システムは、ユーザの意図を推測し、適切な支援レベルを決定するための原則化された方法を必要とする。
以前のアプローチでは、静的なブレンディング比や補助仲裁からの分離した目標推定に頼っていたため、非構造化環境での最適以下の性能が得られた。
BRACEはベイズ的意図推論と文脈適応支援を微調整する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:59:16 GMT)
A room-temperature cavity-magnonic source of correlated microwave pairs [0.1] 関連するマイクロ波光子源は、量子制限センシング、信号増幅、通信の技術のキーイネーブルである。
ここでは、ハイブリッドマグノン-光子プラットフォームから放射される強い相関マイクロ波信号を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:17:06 GMT)
MCP-Diag: A Deterministic, Protocol-Driven Architecture for AI-Native Network Diagnostics [0.1] 本稿では,モデルコンテキストプロトコル(MCP)上に構築されたハイブリッド型ニューロシンボリックアーキテクチャであるMCP-Diagを紹介する。
本稿では,AI導入前の標準ユーティリティ(dig,ping,tratraroute)から厳密なスキーマに変換する決定論的翻訳層を提案する。
また,プロトコルレベルでのHuman-in-the-Loop(HITL)認証を強制する「Elicitation Loop」も導入する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:49:25 GMT)
Understanding multiscale disorder in superconducting nanowire single photon detectors [0.1] 超伝導ナノワイヤ単光子検出器は、量子情報科学における応用の中心である。
しかし、それらの性能は、よく理解されていない障害や電気力学的不均一性の影響によって制限されている。
直流輸送, 暗数測定, バイアス依存性マイクロ波透過分光法を組み合わせることで, 局所不安定性駆動過程を内在超伝導劣化と運動インダクタンス非線形性から区別する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:48:11 GMT)
On Safer Reinforcement Learning Policies for Sedation and Analgesia in Intensive Care [0.1] 集中治療における痛み管理は、治療目標と患者の安全との間の複雑なトレードオフを伴う。
我々は,オピオイド,プロポフォール,ベンゾジアゼピン,デキソメデトミジンを2つの目標に従って処方するための政策を訓練した。
その結果,2つの政策は低痛に関連するが,第1政策からの行動は死亡と正の相関がみられ,第2政策の提案した政策は負の相関がみられた。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:40:40 GMT)
Robust multiparameter estimation using quantum scrambling [0.0] 本稿では,汎用的で効率的な量子センシングプロトコルの提案と解析を行う。
同時に、多くの非可換信号と時間依存信号とを同時に推定し、その信号はコヒーレントまたは非コヒーレントにセンサー粒子と結合する。
本手法は,感度の最適スケーリングを維持しつつ,システムサイズにおいて指数関数的に多くのパラメータを検出できる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:58:01 GMT)
Whispers of Wealth: Red-Teaming Google's Agent Payments Protocol via Prompt Injection [0.0] 大規模言語モデル(LLM)ベースのエージェントは、金融取引の自動化にますます利用されている。
文脈推論への依存は、即時操作に支払いシステムを公開する。
Agent Payments Protocol (AP2) は、暗号的に検証可能な命令を通じてエージェント主導の購入を確保することを目的としている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:10:16 GMT)
Weight-four parity checks with silicon spin qubits [0.0] コヒーレントスピンシャットリングにより、スパース半導体スピン量子ビットアレイは、量子プロセッサを実現するための魅力的な固体プラットフォームとなった。
ここでは、クビットをコヒーレントに搬送するシャットリングバスを含むシリコンスピン量子ビットデバイスを実演する。
ゲート定義半導体スピンで構築された最大の状態を構成する5ビットグリーンバーガー・ホーネ・ザイリンガー状態(GHZ)の真の絡み合いを報告する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:34:27 GMT)
Wave-like amplification of near-threshold two-particle reactions: from muon-catalyzed fusion to $Λ\barΛ$ production at $e^-e^+$ annihilation [0.0] 最近発見された$bar$ペア生産の$e-e+$消滅付近での波状強化を説明するための簡単なモデルが提案されている。
特に、結合エネルギーが$varepsilon_bar=(36pm5)$MeVの単一のバウンド状態が予測される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:59:10 GMT)
Unconditional flow-based time series generation with equivariance-regularised latent spaces [0.0] フローベースモデルは時系列生成に成功している。
しかし、時系列生成モデルに望ましい同値性を持つ潜在表現を設計する方法は、まだ未定である。
本稿では,事前学習したオートエンコーダの簡単な正規化により,等価性を明示的に促進する潜在フローマッチングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:19:33 GMT)
Toward a Universal Color Naming System: A Clustering-Based Approach using Multisource Data [0.0] 広く受け入れられているカラー命名基準の欠如は、プラットフォーム、アプリケーション、産業間での一貫性のないカラー標準に繋がる。
本稿では,クラスタリングに基づくマルチソースデータフレームワークを提案する。
このアプローチは、生成AI、ビジュアルサーチ、デザインシステムといった実践的な応用において、標準化され、知覚的に根拠づけられたカラーラベリングのための新たな機会を開く。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:25:00 GMT)
Topological Defects from Quantum Reset Dynamics [0.0] 量子位相遷移における有限時間クエンチ下でのランダム化量子リセット(QR)の効果について検討する。
その結果、量子臨界点を越えて駆動されるシステムは、QRと非相関雑音の線形クエンチの下で同じスケーリング挙動を示すことが示唆された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:00:02 GMT)
TessPay: Verify-then-Pay Infrastructure for Trusted Agentic Commerce [0.0] TessPayは、暗黙の信頼を'Verify-then-Pay'アーキテクチャに置き換える統合インフラストラクチャである。
実行中、エージェントがタスクを実行している間に資金がロックされ、PoTE(Proof of Task Execution)をサポートするための暗号証拠が生成される。
和解後、TessPayは、紛争解決の明確な説明責任を実現するために、未解決の監査証跡を保存している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:18:39 GMT)
Steady-State Emission of Quantum-Correlated Light in the Telecom Band from a Single Atom [0.0] 共振器モードとテレコム遷移を共振器モードで結合することにより,エミッションの速度が向上することを示す。
次に、単一セシウム原子の超微細構造モデルを説明し、数値的に統合し、このスキームの実装の可能性を実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:46:43 GMT)
Spontaneous four-wave mixing in a thin layer with second-order nonlinearity [0.0] SFWMのウェーブベクターミスマッチはSHGやSPDCよりもはるかに小さいため,薄い層では直接SFWMが支配的であることを示す。
2階および3階の非線形過程の存在は、量子状態工学の幅広い機会を与える。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:25:05 GMT)
Spec-Driven Development:From Code to Contract in the Age of AI Coding Assistants [0.0] 仕様駆動開発(SDD)は、仕様を真理とコードのソースとして扱い、生成または検証された二次的アーティファクトとして扱う。
仕様の厳格化, 仕様書化, 仕様書化, 仕様書化の3段階を, それぞれの適用時期について明確なガイダンスで提示する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:45:42 GMT)
Simulation-based Bayesian inference with ameliorative learned summary statistics -- Part I [0.0] 本稿では,学習した要約統計を用いたシミュレーションに基づく推論について考察する。
観測データとシミュレーションモデルに関連付けられた正確な確率関数は、閉じた形で取得することは困難か、あるいは計算的に抽出可能である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:21:11 GMT)
Signatures of coherent initial ensembles on all work moments [0.0] 本研究では, 初期アンサンブルにおけるコヒーレンスを, 追加の散逸作業コストを発生させることなく, 熱力学的精度の指標として利用できることを示す。
また、平均散逸した仕事に対する新しい量子下界を確立する一般化されたゆらぎ定理を得る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:00:01 GMT)
Scattering of Squeezed Light by a Dielectric Slab [0.0] 我々は、場の二次体の変換を導出し、分散、吸収、多重反射がインシデント・スクイーズを歪めていることを示す。
その結果,スラブのパラメータに応じて2次雑音を選択的に減衰あるいは増幅し,出力電力スペクトルに表現できることがわかった。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:26:48 GMT)
Scaling Laws for Moral Machine Judgment in Large Language Models [0.0] Moral Machineフレームワークを用いて75の大規模言語モデル構成(0.27B-1000Bパラメータ)を評価する。
我々は、モデルサイズとして減少する人間の嗜好からの距離と、一貫した権力関係を観察する。
拡張された推論モデルはアライメントが大幅に向上し、この効果はより小さなモデルでより顕著である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:22:15 GMT)
Rust and Go directed fuzzing with LibAFL-DiFuzz [0.0] Rust や Go のアプリケーションに特化して,ファジイングを指向する新たなアプローチを提案する。
LibAFL-DiFuzzバックエンドをベースとしたファジングツールは,競争上の優位性を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:52:50 GMT)
Retrieval Augmented (Knowledge Graph), and Large Language Model-Driven Design Structure Matrix (DSM) Generation of Cyber-Physical Systems [0.0] 本稿では,Large Language Models (LLMs), RetrievalAugmented Generation (RAG), Graph-based RAG (GraphRAG) の可能性を探る。
これらの手法を、パワースクリュードライバーと既知のアーキテクチャ参照を備えたCubeSatという2つの異なるユースケースでテストし、2つの主要なタスクのパフォーマンスを評価します。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:10:49 GMT)
Remarks on Dirac-Bergmann algorithm, Dirac's conjecture and the extended Hamiltonian [0.0] 制約付きシステムのハミルトン解析のためのディラック・ベルグマンアルゴリズムは、優しく強力なツールである。
第一級制約を持つシステムへの適用のいくつかの側面は、しばしば文献で見過ごされる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 20:14:21 GMT)
Reinforcement Learning-Based Co-Design and Operation of Chiller and Thermal Energy Storage for Cost-Optimal HVAC Systems [0.0] 強化学習を用いた商用HVACシステムにおける冷却設備の連成運転と小型化について検討した。
ライフサイクルコストは、電力消費やメンテナンスを含む資本支出と割引運用コストの両方を担っている。
提案手法を用いて, 最適シラーと蓄熱容量をそれぞれ700, 1500とする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:02:13 GMT)
RPWithPrior: Label Differential Privacy in Regression [0.0] 本稿では,$$-label差分プライバシー保証の下での回帰タスクに着目した。
元の応答とランダムな応答を連続確率変数としてモデル化し、離散化を完全に回避する。
我々のアルゴリズムであるRPWithPriorは、$$-label差分プライバシーを保証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 06:27:13 GMT)
Quantum Fisher information analysis for absorption measurements with undetected photons [0.0] 理論的には、分光吸収の3つの構成と未検出アイドラー光子を比較する。
我々は、完全かつ信号のみの検出アクセスにおけるパラメトリックゲインの関数として量子フィッシャー情報を計算する。
これらの結果は、各アーキテクチャが情報理論の観点で最適である測定体制を記述している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:36:00 GMT)
Prototype-based Explainable Neural Networks with Channel-specific Reasoning for Geospatial Learning Tasks [0.0] プロトタイプベースのXAIメソッドは、ポストホックアプローチに対して本質的に解釈可能な代替手段を提供する。
既存のプロトタイプベースのモデルは、主に標準のRGB画像データのために設計されている。
我々は,マルチチャネル地理空間データに適したプロトタイプベースのXAIアプローチを開発した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:34:45 GMT)
Predicting the post-wildfire mudflow onset using machine learning models on multi-parameter experimental data [0.0] 放火後の泥流は、山火事の流行によりますます危険である。
雨水と浸食した土壌が斜面を覆い、破砕流に繋がる。
土壌の疎水性は浸食を促進させ、強度、持続時間、破壊性において自然の泥流とは異なる火の後の破片の流れをもたらす。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:30:36 GMT)
Predicting Gene Disease Associations in Type 2 Diabetes Using Machine Learning on Single-Cell RNA-Seq Data [0.0] 糖尿病は、インスリン産生または機能不全による血糖値の上昇を特徴とする慢性代謝障害である。
インスリン産生ベータ細胞を自己免疫的に破壊する1型糖尿病(T1D)と、インスリン抵抗性および進行ベータ細胞機能不全から生じる2型糖尿病(T2D)の2つの主要な形態が認識されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 03:27:06 GMT)
Post-Training Probability Manifold Correction via Structured SVD Pruning and Self-Referential Distillation [0.0] Sparse Knowledge Distillation (SparseKD) は、構造化SVDプルーニングと自己参照知識蒸留を組み合わせることでトランスフォーマーモデルを圧縮する手法である。
SparseKDは、外部のスーパー教師、アーキテクチャの変更、カスタム推論カーネルを必要としないため、既存のインフラで即座にデプロイできる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:42:02 GMT)
Path integrals and deformation quantization:the fermionic case [0.0] この論文は、変形量子化の基本的な問題、すなわち恒星指数を計算することの難しさに対処する。
恒星指数とボソニック系の量子プロパゲータを結びつける形式主義に触発され、この研究はフェルミオンの場合の類似した拡張を開発する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:30:32 GMT)
Orders of magnitude runtime reduction in quantum error mitigation [0.0] 仮想ノイズスケーリングと層状緩和アーキテクチャを組み合わせた緩和フレームワークを提案する。
提案手法は動的回路と互換性があり、誤り検出や量子誤り訂正方式とシームレスに統合できる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:07:31 GMT)
Motion Planning with Metric Temporal Logic Using Reachability Analysis and Hybrid Zonotopes [0.0] 本稿では,MTL仕様を満たす状態の集合を暗黙的に表現し,動作計画の探索に最適化する手法を提案する。
数値ベンチマークでは,提案手法の計算上の優位性を文献上の既存手法と比較して強調する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:25:26 GMT)
MeshGraphNet-Transformer: Scalable Mesh-based Learned Simulation for Solid Mechanics [0.0] MeshGraphNet-Transformer(MGN-T)は,Transformerのグローバルモデリング機能とMeshGraphNetの幾何学的帰納バイアスを組み合わせた新しいアーキテクチャである。
MGN-Tは、大規模な高解像度メッシュ上での反復メッセージパッシングによる非効率な長距離情報伝搬である標準MGNの重要な制限を克服する。
我々は,MGN-Tが産業規模のメッシュの衝撃力学をうまく処理できることを実証した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:02:47 GMT)
Margin-Based Generalisation Bounds for Quantum Kernel Methods under Local Depolarising Noise [0.0] 現在のノイズ中間量子(NISQ)時代の量子デバイスは本質的にノイズの影響を受けており、一般化性能は低下している。
局所偏極雑音下での量子カーネル支援ベクトルマシン(QSVM)の高次および低次マージンベース一般化バウンダリを導出する。
これらの理論的境界はノイズによるマージン崩壊を特徴づけ、複数のデータセットにわたる数値シミュレーションや実際の量子ハードウェアの実験を通じて検証される。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:31:36 GMT)
Lower bounds on non-local computation from controllable correlation [0.0] 我々は、任意のユニタリに対して評価できる2つの新しい下界技術を与える。
ハールランダムな2量子ユニタリの場合、我々の手法は典型的に非自明な下界につながる。
我々は、CNOT、DCNOT、$sqrttextSWAP$、XX相互作用を含む、よく研究されている2つの量子ゲートのほとんどの下界を得る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:19:12 GMT)
Leveraging LLMs For Turkish Skill Extraction [0.0] 本稿では,Large Language Models(LLMs)を用いたトルコ初のスキル抽出データセットと自動スキル抽出の性能評価について紹介する。
LLMの使用は、エンドツーエンドパイプラインで使用する場合、教師付きシーケンスラベリングよりも優れており、抽出されたスパンとESCO分類の標準化されたスキルをより効果的に調整する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:06:27 GMT)
Improving Supervised Machine Learning Performance in Optical Quality Control via Generative AI for Dataset Expansion [0.0] 監視された機械学習アルゴリズムは、産業生産における光学品質制御において重要な役割を果たす。
特殊な損失関数や従来のデータ拡張テクニックといった、この課題に対処する既存の戦略には、制限がある。
本研究では、限られたデータセットを拡張するための代替手法として、生成人工知能(GenAI)の可能性を探る。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:24:08 GMT)
IRL-DAL: Safe and Adaptive Trajectory Planning for Autonomous Driving via Energy-Guided Diffusion Models [0.0] 本稿では,自動車用拡散型適応型ルックアヘッドプランナ(IRL-DAL)を用いた新しい逆強化学習フレームワークを提案する。
96%の成功率に達し、衝突は1kステップあたり0.05に減少し、安全なナビゲーションのための新しいベンチマークとなる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:34:10 GMT)
Human-Centered Explainability in AI-Enhanced UI Security Interfaces: Designing Trustworthy Copilots for Cybersecurity Analysts [0.0] 本稿では、AI駆動型セキュリティダッシュボードにおける説明設計戦略の混合手法について述べる。
その結果,説明スタイルがユーザの信頼度,判断精度,認知負荷に大きく影響していることが判明した。
この研究は、サイバーセキュリティにおける人間中心のAIツールの設計を前進させ、他の高度なドメインにおける説明可能性に広範な意味を提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:18:20 GMT)
How Understanding Forecast Uncertainty Resolves the Explainability Problem in Machine Learning Models [0.0] 局所線形手法は決定境界付近で不安定であるとして批判されている。
そのような懸念が問題の誤解を反映していることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:43:06 GMT)
High-gain effects in broadband continuous-wave parametric down conversion sources and measurements with undetected photons [0.0] 未検出光子計測方式における可視光スペクトルの測定結果に高利得効果が及ぼす影響について検討した。
各構成について、アイドラーのみの吸収の場合、(ii)追加分散、(iii)複合効果について考察する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:32:47 GMT)
High-Definition 5MP Stereo Vision Sensing for Robotics [0.0] 高解像度(5MP+)ステレオビジョンシステムは、ロボットの能力向上に不可欠である。
本研究では,新しいフレーム・ツー・フレーム・キャリブレーションとステレオマッチング手法を用いて,5MPカメラ画像の処理による限界ギャップを解消する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 01:29:34 GMT)
Hierarchical Shift Mixing -- Beyond Dense Attention in Transformers [0.0] 我々は、Transformer層にまたがる相互トークンの相互作用を分散するトークンミキシングフレームワークであるHSMを紹介する。
HSMは特定の混合関数に留まりながら線形時間複雑性を可能にする。
単純なHSMの変種であっても,ソフトマックスの注目度に近い性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:23:14 GMT)
Harvest: Opportunistic Peer-to-Peer GPU Caching for LLM Inference [0.0] LLM(Large Language Model)推論は、計算スループットよりもGPUメモリ容量に制限されている。
本稿では,高帯域幅のピアツーピアGPU相互接続を利用したGPUキャッシュ管理フレームワークであるHarvestを紹介する。
本研究では、Harvestを用いて2つの広く使われている推論コンポーネントの検索を高速化することにより、2倍以上のスループットの大幅な高速化を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 21:29:04 GMT)
GaussianOcc3D: A Gaussian-Based Adaptive Multi-modal 3D Occupancy Prediction [0.0] セマンティック占有率予測のためのメモリ効率・連続3次元ガウス表現フレームワークを提案する。
ガウシアンOcc3Dは、雨と夜間の困難な状況にまたがって優れた堅牢性を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:05:30 GMT)
From Labels to Facets: Building a Taxonomically Enriched Turkish Learner Corpus [0.0] 本稿では,最近提案された表層分類に基づく学習者コーパスに対する半粒度アノテーション手法を提案する。
分類学は、各エラーインスタンスの根底にある言語特性をキャプチャする理論的に基礎付けられた多次元分類を提供する。
その結果得られた分類学的に富んだコーパスは、クエリ機能を強化し、学習者コーパス間の詳細な探索分析をサポートする。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:52:49 GMT)
From Feynman-Vernon to Wiener Stochastic Path Integral [0.0] オープン量子系に対するファインマン-ヴァーノン経路積分と古典力学で用いられるウィーナー積分経路との直接接続を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:21:36 GMT)
Free encoding capacity: A universal unit for quantum resources [0.0] 完全なd-次元量子チャネルは、古典情報のログd-ビットを伝達することができる。
送信側の全ての量子状態に対して、d-直交量子状態を生成するd-エンコード演算が存在する。
このような符号化操作のクラスは、任意の量子資源理論に対する自由演算の集合であると考える。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:03:05 GMT)
Fermionic magic resources in disordered quantum spin chains [0.0] エルゴード系および多体局所化系における偏差を測定するためにフェルミオン性反平坦性を用いる。
高度に励起された固有状態全体で、AFFは弱い障害における典型的な状態の挙動から、MBL状態の奥深くで強く抑圧された値へと進化する。
希少な長距離ネコ様固有状態はAFFの顕著な増強を示し、MBLを不安定化するメカニズムの敏感な診断となる。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:05:39 GMT)
Fast magic state preparation by gauging higher-form transversal gates in parallel [0.0] 本稿では,多数の論理ゲートのフォールトトレラント測定を並列に行う高速コード手術法を提案する。
我々の手続きの時間オーバーヘッドは一定であり、キュービットオーバーヘッドは線形である。
このことは、より高速なクリフォードゲートをサポートする優れた量子低密度パリティチェック符号の探索を動機付けている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:55:53 GMT)
FOTBCD: A Large-Scale Building Change Detection Benchmark from French Orthophotos and Topographic Data [0.0] FOTBCD(英: FOTBCD)は、IGN Franceによって提供される、権威あるフランスのオルソフォトと地形的建築データから派生した大規模な建築変化検出データセットである。
フランス本土に28の部署があり、25の部署が訓練に使われ、3の部署が評価のために派遣されている。
データセットは、様々な都市、郊外、農村の環境を0.2m/ピクセル解像度でカバーしている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 05:42:42 GMT)
Explainability Methods for Hardware Trojan Detection: A Systematic Comparison [0.0] この研究は、Trust-Hubベンチマークでゲートレベル検出の3つの説明可能性カテゴリを比較した。
特性に基づく分析は、「出力近くの高ファンイン複雑性は潜在的なトリガーを示す」といった回路概念を通して説明を提供する。
事例に基づく推論は、予測とトロイの木馬の訓練の間の97.4%の対応を達成し、前例に基づく正当化を提供する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:09:57 GMT)
Environment-Conditioned Tail Reweighting for Total Variation Invariant Risk Minimization [0.0] EmphEnvironment-Conditioned Tail Reweighting for Total Variation Invariant Risk Minimization (ECTR)を提案する。
ECTRは、環境条件付き尾重み付けによるテレビベースの不変学習を強化し、両方のタイプの分散シフトに共同で対処する。
最小限の定式化を通じて潜在環境を推測することにより、明示的な環境アノテーションなしでフレームワークをシナリオに拡張する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:03:04 GMT)
Efficient Distance Pruning for Process Suffix Comparison in Prescriptive Process Monitoring [0.0] 規範的なプロセス監視は、進行中のケースの継続性を分析することによって、プロセスの結果を改善するアクションを推奨することを目指している。
鍵となる障害は、大規模サフィックス比較の計算コストの重いことであり、ログサイズとともに急速に増大する。
本稿では,三角不等式を利用した効率的な探索手法を提案する。最適化されたピボットの集合に対して,冗長な比較を行う境界を定義する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:19:38 GMT)
Dynamics of states of infinite quantum systems as a cornerstone of the second law of thermodynamics [0.0] 量子スピン系の決定論的定理として熱力学の第2法則の改良を行った。
2つの特定の例は、1次元の力学の2つの異なる普遍性クラスにおける純粋状態から混合状態への遷移に関するものである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 11:42:21 GMT)
Dynamical witnesses and universal behavior across chaos and non-ergodicity in the tilted Bose-Hubbard model [0.0] 孤立量子系における量子カオスは、熱化と観測可能な物質の急激な緩和と密接に関連している。
生存確率, 単一部位絡み合いエントロピー, 半鎖不均衡の時間的変化を解析した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 22:32:01 GMT)
Diverse Approaches to Optimal Execution Schedule Generation [0.0] 本稿では,品質多様性アルゴリズムMAP-Elitesの取引実行への応用について述べる。
MAP-Elitesは、単一の最適政策を探すのではなく、流動性とボラティリティの条件によって索引付けされた、多種多様な体制-特殊主義戦略のポートフォリオを生成する。
個々の専門家は行動ニッチの中で8~10%のパフォーマンス改善を達成する一方、他の細胞は劣化を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:51:39 GMT)
Direct observation of the optical Magnus effect with a trapped ion [0.0] 光の内在的なスピン軌道状結合は、40$Ca$+$イオンに対して原子-光相互作用プロファイルのスピン依存性の逆変位を生じさせる。
この結果は、光ツイーザーに基づく量子制御に関連する偏光-勾配相互作用の物理的基盤を確立する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:44:08 GMT)
Dicke superposition probes for noise-resilient Heisenberg and super-Heisenberg Metrology [0.0] N-量子ディック重畳状態のクラスは、量子フィッシャー情報の近ハイゼンベルクスケーリングを示す。
特定のディック重ね合わせは、超ハイゼンベルクスケーリングと位相減衰に対するレジリエンスの改善を組み合わせたものである。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:51:10 GMT)
Dicke States for Accelerated Two Two-Level Atoms [0.0] 右リンドラーくさびにある2つの2層原子からなる系におけるディック状態の形成について検討する。
対称状態を形成するN二層原子の動力学を解析し、N原子の集まりの1つの原子を励起する確率は1つの原子を励起する確率と関係していることを示した。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 02:44:18 GMT)
Development of a Cacao Disease Identification and Management App Using Deep Learning [0.0] 本研究は,カカオ病の診断と管理のためのモバイルアプリケーションを開発した。
システムのコアは、カカオの病気を正確に識別するために訓練されたディープラーニングモデルである。
トレーニングされたモデルはモバイルアプリに統合され、農家のフィールド診断を支援する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 16:01:11 GMT)
Deep Learning-Based Object Detection for Autonomous Vehicles: A Comparative Study of One-Stage and Two-Stage Detectors on Basic Traffic Objects [0.0] 本研究では, YOLOv5とFaster R-CNNの2つの物体検出モデルを比較した。
YOLOv5は、mAP、リコール、トレーニング効率の点で優れたパフォーマンスを示している。
しかし、より高速なR-CNNは、小さな遠方物体を検出する利点を示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:05:13 GMT)
Deep Learning-Based Early-Stage IR-Drop Estimation via CNN Surrogate Modeling [0.0] 従来のIR-drop分析は、高精度だが計算コストの大きい物理ベースのサインオフツールに依存している。
CNNを用いた早期IR-drop推定のための深層学習に基づくサロゲートモデリング手法を提案する。
提案するフレームワークは,高額なサインオフ分析に先立って,設計者が迅速なIR-dropインサイトを提供するための補完的なアーリーステージ解析ツールとして意図されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:29:45 GMT)
Deep Learning Based CNN Model for Automated Detection of Pneumonia from Chest XRay Images [0.0] 肺炎は、世界で最も大きな進化と死亡の原因の1つとなっている。
胸部X線撮影を手動で解釈する従来の手法は、観察者間変動の疲労により、しばしば制約される。
本稿では,胸部X線画像中の肺炎を高精度かつ最小の計算コストで認識できる,独自のConal Neural Network CNNを用いた統合診断モデルを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:05:40 GMT)
Conformal Prediction Algorithms for Time Series Forecasting: Methods and Benchmarking [0.0] 時系列の時間的依存関係は、データ交換可能性のコア前提に反する。
本稿では,この対立に対処するために設計されたアルゴリズム解の主要なカテゴリについて批判的に検討する。
当社はAutoARIMAを、大規模な月次販売データセットのベース予測ツールとして使用しています。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 08:58:12 GMT)
Complexity of Quantum Trajectories [0.0] 開量子系はリンドブラッドのマスター方程式を量子軌道のアンサンブルに解いて記述することができる。
このような軌道の複雑さは、リンドブラッド進化の保存法則やその他の動的制約によってどのように影響を受けるかを検討する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 19:00:04 GMT)
Clause-Internal or Clause-External? Testing Turkish Reflexive Binding in Adapted versus Chain of Thought Large Language Models [0.0] 本研究では,現在最先端の大規模言語モデルがトルコ語の反射的代名詞の結合関係を捉えているかどうかを評価する。
我々は,非局所的先駆者に対して局所的に対決する100の文のバランスの取れた集合を構築し,反射性ケンディとケンディジについて検討する。
マルチステップ推論のために設計されたOpenAIチェーン・オブ・シントモデルと、LLaMA-2由来のトルコデータに基づく広範囲に微調整されたTrendyol-LLM-7B-base-v0.1である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:00:04 GMT)
Breaking the Stochasticity Barrier: An Adaptive Variance-Reduced Method for Variational Inequalities [0.0] 非コン最適化タスクのための新しいアルゴリズムとしてVR-A-A(VarianceReduced-Ascent with Armijo)を提案する。
本手法は,手動学習スケジューリングへの依存度を低減して,限界周期を効果的に抑制し,収束を加速することを示す。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 14:43:07 GMT)
Beyond Medical Chatbots: Meddollina and the Rise of Continuous Clinical Intelligence [0.0] 臨床コンテキストインテリジェンス(CCI)を実世界の臨床に必要とされる能力クラスとして定式化する。
本稿では,言語の実現前に推論を制約するガバナンスファーストな臨床インテリジェンスシステムであるMeddollinaを紹介する。
16,412以上のヘテロジニアスな医療クエリを対象とした行動優先型システムを用いてMeddollinaの評価を行った。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 07:05:14 GMT)
Benchmarking Vanilla GAN, DCGAN, and WGAN Architectures for MRI Reconstruction: A Quantitative Analysis [0.0] この研究では、Vanilla GAN、Deep Convolutional GAN(DCGAN)、Wasserstein GAN(WGAN)の3つのGANアーキテクチャが検討されている。
それらは、膝、脳、心臓のMRIデータセットを用いて、全身領域にわたる一般化性を評価するために訓練され、評価された。
GANモデルは、匿名膝の1000個のMRI画像、805個のハート画像、90個の脳MRIデータセットを用いてテストされた。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 17:32:09 GMT)
Are Bell's conditions for local realism general enough? [0.0] 私はベルが提案した検出器の信号に対する応答を極めて理想化されたものだと批判する。
より物理的な条件が提案され、光学実験の現実的な局所モデルが可能である。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 10:59:06 GMT)
Applied Sociolinguistic AI for Community Development (ASA-CD): A New Scientific Paradigm for Linguistically-Grounded Social Intervention [0.0] 本稿では,コミュニティ開発のための応用ソシオリスティックAI(ASA-CD)を,言語的に基礎をおくAIによる介入を通じて,コミュニティの課題に対処するための新たな科学的パラダイムとして確立する。
ASA-CDは,(1)解答的断片化の計算指標としての言語バイオマーカー,(2)AI最適化パラダイムである開発対応自然言語処理(NLP),(3)解答的介入のための標準化された5段階プロトコル,の3つの主要なコントリビューションを紹介している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 23:12:46 GMT)
Analytical topological invariants for 2D non-Hermitian phases using Morse theory [0.0] 我々は、リッチな構造とエッジ電流をサポートする2次元非エルミートSSH型ハミルトニアンに対する2次元ザック位相を解析的に計算する。
バンド構造は例外的に崩壊するが、特定の位相ベースの位相不変量はよく定義されている。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 18:38:21 GMT)
Analysis of self-thermalization dynamics in the Bose-Hubbard model by using the pseudoclassical approach [0.0] 我々は,M$-site Bose-Hubbardモデルの自己熱化ダイナミクスを解析した。
格子を横切るボース粒子の準定常電流を数値計算する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 04:47:40 GMT)
Alignment among Language, Vision and Action Representations [0.0] 言語,視覚,行動表現が部分的に共有された意味構造に収束することを示す。
これらの結果は、言語、視覚、行動表現が部分的に共有された意味構造に収束していることを示している。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:12:07 GMT)
Adaptive Edge Learning for Density-Aware Graph Generation [0.0] We propose a density-aware conditional graph generation framework using Wasserstein GANs (WGAN)。
微分可能なエッジ予測器は、ノード埋め込みから直接ペアワイズ関係を決定する。
密度認識選択機構は、クラス固有の空間分布に適合するエッジ密度を適応的に制御する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 15:01:50 GMT)
Active Learning-Driven Lightweight YOLOv9: Enhancing Efficiency in Smart Agriculture [0.0] 本研究は, 温室環境のエッジデバイスに設置した農業用ロボットによるトマトとトマトのリアルタイム検出の必要性に対処するものである。
これらの制約を克服するため,本研究では,能動的学習駆動型軽量物体検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 09:14:35 GMT)
About an Automating Annotation Method for Robot Markers [0.0] 本稿では,ArUcoマーカー画像を用いたディープラーニングモデルの自動アノテーション手法を提案する。
自動アノテーション付きデータセットを用いてYOLOベースのモデルをトレーニングし、その性能を様々な条件下で評価する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:44:56 GMT)
A novel Hamiltonian formulation of $1+1$ dimensional $φ^4$ theory in Daubechies wavelet basis: momentum space analysis [0.0] 量子場理論のウェーブレット形式を用いて、非摂動的ハミルトンフレームワークの場の理論を研究する。
4$理論を考察し、m2>0$セクターにおけるよく知られた非摂動的強結合相転移の出現を実証する。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 13:16:00 GMT)
A Serverless Edge-Native Data Processing Architecture for Autonomous Driving Training [0.0] 本稿では,車載データフィルタリングとユーザ定義関数による処理が可能なエッジネイティブプラットフォームであるフレームワークを紹介する。
NVIDIA Jetson Orin Nano上でフレームワークを評価し、ネイティブのROS 2デプロイメントと比較する。
その結果、競合性能、レイテンシの低減、ジッタが示され、Lambdaベースの抽象化が組み込み自律運転システムでリアルタイムデータ処理をサポートできることが確認された。
論文参考訳(メタデータ) (Fri, 30 Jan 2026 12:41:11 GMT)