Kimi K2.5: Visual Agentic Intelligence [236.1] Kimi K2.5は、汎用エージェントインテリジェンスを促進するために設計されたオープンソースのマルチモーダルエージェントモデルである。
このマルチモーダル基盤の上に構築されたK2.5では、セルフ指向の並列エージェントオーケストレーションフレームワークであるAgent Swarmが導入されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:17:38 GMT)
RE-TRAC: REcursive TRAjectory Compression for Deep Search Agents [144.6] Re-TRACはクロス軌道探索を行うエージェントフレームワークである。
Re-TRAC は BrowseComp とフロンティア LLM で連続して ReAct を 15-20% 上回っていることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:58:07 GMT)
Training LLMs for Divide-and-Conquer Reasoning Elevates Test-Time Scalability [129.1] 大規模言語モデル(LLM)は、ステップ・バイ・ステップ・チェーン・オブ・シークレット(CoT)推論を通じて強力な推論能力を示している。
潜在的には、解のより効率的な探索を容易にするために複雑な問題をサブプロブレムに分解するDAC推論がある。
本稿では,DAC型推論能力を高めるために,エンドツーエンド強化学習(RL)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:54:54 GMT)
LaST$_{0}$: Latent Spatio-Temporal Chain-of-Thought for Robotic Vision-Language-Action Model [102.6] 潜在時空間連鎖(CoT)を介して行動する前に効率的に推論できるフレームワークを提案する。
具体的には,未来の視覚力学,3次元構造情報,ロボットの受容状態をモデル化したトークン効率の潜在CoT空間を導入し,時間的に一貫した暗黙的推論軌道を可能にするためにこれらの表現をさらに拡張する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:46:04 GMT)
Infinite-World: Scaling Interactive World Models to 1000-Frame Horizons via Pose-Free Hierarchical Memory [101.2] 複雑な実環境において,1000フレーム以上のコヒーレントな視覚記憶を維持することのできる,堅牢な対話型世界モデルを提案する。
我々は,歴史的潜水剤を固定予算の幾何学的表現に蒸留するpose-free Memory (HPMC)を導入する。
また,連続動作を三状態論理に識別する不確実性認識型アクションラベルモジュールを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:52:56 GMT)
RANKVIDEO: Reasoning Reranking for Text-to-Video Retrieval [99.3] 本稿では,ビデオ検索のための推論に基づくリランカであるRANKVIDEOを紹介する。
RANKVIDEOは、関連性を評価するためにビデオコンテンツを使用するクエリ-ビデオペアを明示的に理由付けている。
大規模なMultiVENT 2.0ベンチマークの実験では、RANKVIDEOは2段階のフレームワーク内での検索性能を一貫して改善している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:40:37 GMT)
Prism: Efficient Test-Time Scaling via Hierarchical Search and Self-Verification for Discrete Diffusion Language Models [96.0] LLM推論を改善するための実用的な方法として、推論時計算が再導入されている。
テスト時間スケーリング(TTS)アルゴリズムの多くは、自動回帰デコーディングに依存している。
そこで我々は,dLLM のための効率的な TTS フレームワーク Prism を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:14:51 GMT)
Making Bias Non-Predictive: Training Robust LLM Judges via Reinforcement Learning [91.9] 大規模言語モデル(LLM)は、ますます自動化された審査員として機能するが、認知バイアスの影響を受けやすいままである。
本稿では,重要原則に基づく強化学習フレームワークである疫学独立訓練(EIT)を提案する。
EITはバランスの取れた競合戦略を通じてこれを運用します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:43:48 GMT)
AICD Bench: A Challenging Benchmark for AI-Generated Code Detection [91.2] AICD Benchは、AI生成コード検出の最も包括的なベンチマークである。
これは$emph2Mサンプル$、$emph77モデル$、$emph11ファミリー$、$emph9プログラミング言語$で、最近の推論モデルを含む。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:24:14 GMT)
Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text [90.2] Golden Gooseは、未検証のインターネットテキストから無制限のRLVRタスクを合成するトリックだ。
大規模なRLVRデータセットであるGoseReason-0.7Mを合成するために、推論に富んだ検証不可能なコーパスを利用する。
また、Golden Gooseを現実の環境で展開し、サイバーセキュリティドメイン用の生のFinWebスクラップからRLVRタスクを合成します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:54:20 GMT)
Intellectual Property Protection for 3D Gaussian Splatting Assets: A Survey [89.1] 3D Gaussian Splatting (3DGS)はリアルタイムな3Dシーン合成の主流となり、仮想現実や拡張現実、ロボティクス、そして3Dコンテンツ作成の応用を可能にしている。
商業価値の上昇と明示的なパラメトリック構造は、新たな知的財産権(IP)保護の懸念を高める。
現在の進歩は断片化され続けており、基盤となるメカニズム、保護パラダイム、堅牢性に関する統一的な見解が欠如している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:27:51 GMT)
Unlocking the Duality between Flow and Field Matching [86.3] 条件付きフローマッチング(CFM)は拡散モデルやフローマッチングのような従来の生成パラダイムを統一する。
相互作用場マッチング(IFM)は、ポアソンフロー生成モデル(PFGM)に根ざした静電場マッチング(EFM)を一般化する新しいフレームワークである。
IFMの自然なサブクラスと一致し,このサブクラスをフォワードオンリーIMMと呼ぶ。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:04:01 GMT)
Are you going to finish that? A Practical Study of the Partial Token Problem [85.5] 言語モデル(LM)はトークンのシーケンスによって訓練されるが、ユーザはテキストを介してLMと対話する。
このミスマッチは、ユーザーが期待する次のトークンの途中でプロンプトを終了したときに発生する部分トークン問題を引き起こす。
この研究では、トークンと"ワード"境界がしばしば並んでいない3つのドメインを特定します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:48:06 GMT)
Modality Gap-Driven Subspace Alignment Training Paradigm For Multimodal Large Language Models [84.8] 永続的な幾何学的異常であるモダリティギャップが残っている。
このギャップを埋める以前のアプローチは、過度に単純化された等方的仮定によってほとんど制限されている。
固定フレームモダリティギャップ理論(英語版)を提案し、モダリティギャップを安定バイアスと異方性残差に分解する。
次に、トレーニング不要なモダリティアライメント戦略であるReAlignを紹介します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:59:39 GMT)
SWE-Universe: Scale Real-World Verifiable Environments to Millions [84.6] SWE-Universeは、GitHubのプルリクエスト(PR)から検証可能な環境を自動的に構築するフレームワークである。
本稿では, 自動建築の課題を克服するために, 効率的なカスタムトレーニングモデルを用いた建築エージェントを提案する。
大規模エージェントによる中等教育と強化学習を通じて,環境の重要さを実証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:20:30 GMT)
SAME: Stabilized Mixture-of-Experts for Multimodal Continual Instruction Tuning [83.7] マルチモーダル・インストラクション・チューニング(MCIT)のためのStAbilized Mixture-of-Experts(SAME)を提案する。
プロプライエタリは、サブスペースへのルーティングダイナミクスを分解し、タスク関連方向のみを更新することで、専門家の選択を安定化する。
また、トレーニング中に選択した専門家を凍結するためにアダプティブな専門家アクティベーションを導入し、冗長でクロスタスクな干渉を減らす。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:47:06 GMT)
Why Steering Works: Toward a Unified View of Language Model Parameter Dynamics [81.8] 局所的な微調整、LoRAに基づく適応、およびアクティベーションに基づく介入を分離して研究する。
制御信号によって誘導される動的ウェイト更新として、これらの介入をフレーム化する統一的な視点を示す。
提案手法では,選択と効用との間に一貫したトレードオフが観測される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:04:36 GMT)
Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models [79.8] Vision-DeepResearchシステムは複雑なビジュアルテキストのファクトフィンディングに検索エンジンを使用する。
既存のベンチマークはビジュアル検索中心ではない。
2,000のVQAインスタンスからなるVision-DeepResearchベンチマーク(VDR-Bench)を構築した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:53:11 GMT)
DDP-WM: Disentangled Dynamics Prediction for Efficient World Models [79.5] 本稿では,DDP-WMについて紹介する。DDP-WMはDDP-WM(Distangled Dynamics Prediction)の原理に基づく新しい世界モデルである。
DDP-WMは、効率的な履歴処理と動的ローカライゼーションを統合したアーキテクチャにより、この分解を実現する。
実験により、DDP-WMは様々なタスクにおいて、大幅な効率と性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:04:25 GMT)
Wave packet description of Majorana neutrino oscillations in a magnetic field [78.3] 磁場中のマヨナニュートリノ振動は波状パケットの定式化を用いて検討する。
磁場中で伝播する非ゼロ遷移磁気モーメントを持つマヨラナニュートリノに対するディラック方程式を解析的に解く。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:02:34 GMT)
Multi-View Stenosis Classification Leveraging Transformer-Based Multiple-Instance Learning Using Real-World Clinical Data [76.9] 冠動脈狭窄は心血管疾患の主要な原因であり,多発血管造影で冠動脈を解析し診断した。
患者レベルの狭窄分類のためのトランスフォーマーベースマルチビューマルチインスタンス学習フレームワークであるSegmentMILを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:07:52 GMT)
ReasonCACHE: Teaching LLMs To Reason Without Weight Updates [75.3] 大規模言語モデル(LLM)は、コンテキストウィンドウをオーバーロードすることなく、重み付けをすることなく、推論を学習できることを示します。
本稿では、デモを固定キー値キャッシュに蒸留するReasonCACHEについて紹介する。
経験的に、ReasonCACHEは標準のICLよりも優れており、IWLアプローチにマッチするか、超えている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:24:23 GMT)
HumanX: Toward Agile and Generalizable Humanoid Interaction Skills from Human Videos [74.4] 我々はHumanXについて紹介する。HumanXは人間の動画を、ヒューマノイドのための汎用的で現実的なインタラクションスキルにコンパイルするフルスタックのフレームワークである。
HumanXは、従来の方法より8倍高い一般化成功を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:53:01 GMT)
ObjEmbed: Towards Universal Multimodal Object Embeddings [74.4] 我々は、新しい個別オブジェクト埋め込みモデルであるEmbedを提示する。
入力画像を複数の局所的な埋め込みに分解し、それぞれが個々のオブジェクトに対応し、グローバルな埋め込みを行う。
ビジュアル検索、ローカル画像検索、グローバル画像検索など、幅広い視覚的理解タスクをサポートする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:38:45 GMT)
SGHA-Attack: Semantic-Guided Hierarchical Alignment for Transferable Targeted Attacks on Vision-Language Models [73.2] 大規模視覚言語モデル(VLM)は、転送ベースの対向摂動に対して脆弱である。
SGHA-Attackは、複数のターゲット参照を採用し、中間層一貫性を強制するフレームワークである。
オープンソースおよび商用のブラックボックスVLMの実験は、SGHA-Attackが従来の方法よりも強力な目標転送性を実現することを示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:10:41 GMT)
UV-M3TL: A Unified and Versatile Multimodal Multi-Task Learning Framework for Assistive Driving Perception [71.2] 運転者の行動、運転者の感情、車両の行動、交通状況を同時に認識する枠組みを提案する。
本フレームワークは,デュアルブランチ空間チャネルのマルチモーダル埋め込みと適応的特徴分離型マルチタスク損失の2つのコアコンポーネントを組み込んでいる。
提案手法をAIDEデータセット上で評価し,UV-M3TLが4つのタスクすべてにおいて最先端の性能を達成することを示す実験結果を得た。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:35:24 GMT)
Adversarial Reward Auditing for Active Detection and Mitigation of Reward Hacking [69.1] 本稿では,報酬ハッキングを動的かつ競争的なゲームとして再認識するフレームワークであるAdrial Reward Auditing(ARA)を提案する。
まず、ハッカーポリシーは報酬モデルの脆弱性を発見し、監査人は潜伏表現からのエクスプロイトを検出することを学習する。
ARAはすべてのベースラインの中で最高のアライメントユーティリティトレードオフを実現しています。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:34:57 GMT)
Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts [68.8] 長いコンテキストでの大規模言語モデル(LLM)のトレーニングは、トレーニング時間ではなく、GPUメモリの異常なオーバーヘッドによって厳しく制限される。
この障壁に直面するメモリ効率の高いトレーニングシステムOOMBを紹介します。
本手法では,オンザフライアクティベーション・リコンピュテーションを備えたチャンク・リカレント・トレーニング・フレームワークを用いて,一定のアクティベーションメモリフットプリントを維持する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:52:40 GMT)
OneMall: One Architecture, More Scenarios -- End-to-End Generative Recommender Family at Kuaishou E-Commerce [68.8] OneMallは、Kuaishouのeコマースサービスに適したエンドツーエンドのジェネレーティブレコメンデーションフレームワークである。
製品カード、ショートビデオ、ライブストリーミングなど、eコマースの複数のアイテム配信シナリオを統合する。
OneMallはすでにデプロイされており、Kuaishouでは毎日4億人のアクティブユーザーが利用している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:05:42 GMT)
Nearly Optimal Active Preference Learning and Its Application to LLM Alignment [68.6] 大規模言語モデルの調整は、人間の好みラベルの高品質なデータセットに依存する。
既存の多くのアプローチでは、G-やD-最適化のような古典的な実験的な設計基準が採用されている。
本研究では,これら設計目標の適合性に疑問を呈する,選好学習に特有な単純な直観を同定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:21:29 GMT)
Variational Entropic Optimal Transport [67.8] 本稿では,ドメイン翻訳問題に対する変分エントロピー最適輸送(VarEOT)を提案する。
VarEOTは、補助正の正規化子上のトラクタブルな一般化として、log-partition $log mathbbE[exp(cdot)$の正確な変分再構成に基づいている。
合成データと画像と画像の変換に関する実験は、競争力のあるか、あるいはより良い翻訳品質を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:48:44 GMT)
Flow Policy Gradients for Robot Control [67.6] フローマッチングポリシ勾配は、より表現力のあるポリシのトレーニングと微調整に有効である。
我々は、スクラッチからトレーニングを行う際に、フロー表現をどのように活用するかを示し、ベースラインよりもきめ細やかな堅牢性を改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:56:49 GMT)
Proof-RM: A Scalable and Generalizable Reward Model for Math Proof [67.5] 大規模言語モデル(LLM)は,*検証リワード*(RLVR)を用いた強化学習を通じて,強力な数学推論能力を示した。
多くの先進的な数学的問題は証明ベースであり、単純な解マッチングによって証明の真性を決定するための保証された方法はない。
自動検証を実現するには、完全な証明プロセスを確実に評価できるリワードモデル(RM)が必要である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:42:53 GMT)
Toward Cognitive Supersensing in Multimodal Large Language Model [67.2] 我々は,MLLMに人間のような視覚的特徴を付与する訓練パラダイムであるCognitive Supersensingを紹介する。
実験では、CogSense-BenchでCognitive Supersensingを訓練したMLLMが、最先端のベースラインを大きく上回った。
私たちはCogSense-Benchとモデルウェイトをオープンソースにします。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:19:50 GMT)
SIEVE: Sample-Efficient Parametric Learning from Natural Language [66.5] 本稿では,自然言語の文脈からサンプル効率の高いパラメトリック学習手法であるSIEVEを提案する。
我々は、コンテキストが分解可能であるという洞察を活用する新しい合成データ生成パイプライン、SIEVE-GENを使用する。
以上の結果から,SIEVEは従来の文脈蒸留法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:52:52 GMT)
Samba+: General and Accurate Salient Object Detection via A More Unified Mamba-based Framework [66.2] Saliency Mamba (Samba) は、純粋なMambaベースのアーキテクチャで、様々な異なるサルトオブジェクト検出タスクを柔軟に処理する。
Sambaは、計算コストの低い22データセット上の6つのSODタスクで、既存のメソッドを個別に上回ります。
Samba+は、トレーニング済みの汎用モデルを使用することで、これらのタスクとデータセット上でさらに優れた結果を得る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:34:25 GMT)
Quantifying the Gap between Understanding and Generation within Unified Multimodal Models [66.1] GapEvalは、理解と生成能力のギャップを定量化するために設計されたベンチマークである。
実験により、幅広いUMMにわたる2つの方向の連続的なギャップが明らかになる。
以上の結果から,UMM内の知識は相容れないことが多いことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:19:37 GMT)
No Global Plan in Chain-of-Thought: Uncover the Latent Planning Horizon of LLMs [65.8] この研究は、Chain-of-Thought (CoT): Large Language Models (LLMs)の力学に関する先行的な補完的な観察に由来する。
LLMは、CoTの出現前の後続の推論の遅延計画を示すため、明示的なCoTの重要性は低下する。
各種タスク領域にまたがる隠れ状態に適用し,LLMの潜在計画強度について検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:46:56 GMT)
Mitigating Safety Tax via Distribution-Grounded Refinement in Large Reasoning Models [63.4] 安全調整は、大きな推論モデル(LRM)の一般的な推論能力を乱す安全税を発生させる。
LRMの安全アライメントに使われる既存のデータセットは、通常、外部のLRMまたは人間のラベルから安全推論の痕跡と回答を蒸留することによって構築される。
本稿では,DGRと呼ばれる安全アライメントデータセット構築手法を提案する。DGRは,既存のアウト・オブ・ディストリビューション型安全推論データセットを改良し,目標のLLM内部分布に適合させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:18:48 GMT)
FIRE-Bench: Evaluating Agents on the Rediscovery of Scientific Insights [63.3] FIRE-Bench (Full-cycle Insight Rediscovery Evaluation) は、確立された発見の再検討を通じてエージェントを評価するベンチマークである。
最強のエージェントでさえ、限られた再発見成功(50 F1)を達成し、実行中に高いばらつきを示し、実験的な設計、実行、エビデンスに基づく推論において繰り返し失敗モードを表示する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:21:13 GMT)
MentisOculi: Revealing the Limits of Reasoning with Mental Imagery [63.3] 視覚的解決が可能な多段階推論問題の組である MentisOculi を開発した。
遅延トークンから明示的な生成画像まで,視覚的戦略を評価すると,一般的にはパフォーマンス向上に失敗する。
以上の結果から,視覚的思考がモデル推論の恩恵を受けていないことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:49:06 GMT)
Textual Equilibrium Propagation for Deep Compound AI Systems [63.3] 大規模言語モデル(LLM)は、複合AIシステムの一部としてますます多くデプロイされている。
テキストフィードバックをグローバルに伝達する最近のアプローチ(例:TextGrad)は、そのようなパイプラインを最適化することを可能にするが、システムの深さが大きくなるにつれて性能が低下する。
特に、長距離エージェントは2つの深度スケーリング障害モードを示す: 1) テキストのフィードバックが指数関数的に深度とともに増加し、不当に長いメッセージをもたらし、評価バイアスを増幅するテキストの勾配を爆発させる; 2) 長いコンテキスト能力に制限のあるモデルが部分的なフィードバックを過度に強調し、長いフィードバックの圧縮が下流メッセージの特異性を徐々に低下させるテキストの勾配を消失させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:45:50 GMT)
Optimal Sample Complexity for Single Time-Scale Actor-Critic with Momentum [62.7] 我々は,シングルタイムスケールアクター・クリティック(AC)アルゴリズムを用いて,$O(-2)$の最適なグローバルポリシを得るための最適なサンプル複雑性を確立する。
これらのメカニズムは、既存のディープラーニングアーキテクチャと互換性があり、実用的な適用性を損なうことなく、小さな修正しか必要としない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:35:42 GMT)
AQER: a scalable and efficient data loader for digital quantum computers [62.4] 我々は,ターゲット状態の絡み合いを体系的に低減し,負荷回路を構成するスケーラブルなAQL手法であるAQERを開発した。
我々は、合成データセット、古典画像および言語データセット、最大50キュービットの量子多体状態データセットを用いて、AQERの有効性を評価するための体系的な実験を行う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:39:42 GMT)
Training-Free Self-Correction for Multimodal Masked Diffusion Models [61.8] 本研究では,事前学習したマスク拡散モデルの帰納バイアスを利用した学習自由自己補正フレームワークを提案する。
本手法は,サンプリングステップを短縮したテキスト・画像生成およびマルチモーダル理解タスクにおける生成品質を著しく向上させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:58:15 GMT)
Show, Don't Tell: Morphing Latent Reasoning into Image Generation [60.7] テキスト・ツー・イメージ(T2I)生成は目覚ましい進歩を遂げているが、既存の手法では生成時に動的に推論や洗練を行う能力が欠如していることが多い。
T2I生成プロセスに暗黙の潜伏推論をシームレスに統合するフレームワークであるLatentMorphを導入する。
連続ラテント空間で完全に推論を行うことにより、ラテントマーフは明示的推論のボトルネックを避け、より適応的な自己精製を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:29:48 GMT)
HandMCM: Multi-modal Point Cloud-based Correspondence State Space Model for 3D Hand Pose Estimation [60.2] 3Dハンドポーズ推定は、拡張現実のような多くの人間とコンピュータのインタラクションアプリケーションにとって不可欠である。
HandMCMは強力な状態空間モデル(Mamba)に基づく新しい手法である
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:25:43 GMT)
Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts [59.7] Avenir-Webは、現実世界のデプロイにおいて、Online-Mind2Webベンチマークの新たなオープンソース状態を達成するWebエージェントである。
Avenir-Web on Online-Mind2Web, a rigorous benchmark of live and user-centered web task。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:50:07 GMT)
Self-Rewarding Sequential Monte Carlo for Masked Diffusion Language Models [58.9] 本研究は自己回帰型モンテカルロ(SMC)を提示する。
提案アルゴリズムは,既存のMDLMのほとんどが信頼性に基づくサンプリング戦略に依存している点に起因している。
粒子重み付けのための自己回帰信号として軌道レベルの信頼性を導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:21:45 GMT)
R2-Router: A New Paradigm for LLM Routing with Reasoning [58.9] R2-は既存のルータに比べて4~5倍のコストで最先端性能を実現する。
ルータはリアクティブセレクタから故意の推論器へと進化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:23:51 GMT)
Tail-Aware Post-Training Quantization for 3D Geometry Models [58.8] ポストトレーニング量子化(PTQ)は、再トレーニングなしに効率的な推論を可能にする。
PTQは複雑な特徴分布と禁止キャリブレーションオーバーヘッドのために、3Dモデルに効果的に転送できない。
3次元幾何学学習のためのTail-Aware Post-Training Quantization PipelineであるTAPTQを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:21:15 GMT)
A Reduction from Delayed to Immediate Feedback for Online Convex Optimization with Improved Guarantees [58.6] 本稿では,後悔を遅延非依存の学習項と遅延誘発のドリフト項に分解する連続時間モデルを提案する。
バンディット凸最適化では,最先端の1次数に適合する遅延依存項を用いて,既存の残差境界を大幅に改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:17:34 GMT)
AR-MAP: Are Autoregressive Large Language Models Implicit Teachers for Diffusion Large Language Models? [58.5] 拡散大言語モデル(DLLM)は自己回帰モデルに代わる強力な代替手段として登場した。
エビデンス・ロウアー・バウンド(ELBO)による推定結果から,DLLMの選好アライメントは依然として困難である。
本稿では,選択整合型自己回帰LDMを暗黙の教師として活用し,分散Mアライメントのための新しい伝達学習フレームワークであるAR-MAPを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:48:40 GMT)
AdNanny: One Reasoning LLM for All Offline Ads Recommendation Tasks [57.7] 大規模言語モデル(LLM)は、自然言語理解と生成において強力な能力を示している。
オンライン広告システムに直接デプロイするのは、厳密なミリ秒レベルの遅延制約のため、現実的ではないことが多い。
我々は、オフライン広告タスクの共有バックボーンとして機能する統合推論中心のLCMであるAdNannyを紹介します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:56:11 GMT)
Co-RedTeam: Orchestrated Security Discovery and Exploitation with LLM Agents [57.5] 大規模言語モデル(LLM)はサイバーセキュリティタスクを支援することを約束しているが、既存のアプローチでは自動脆弱性発見とエクスプロイトに苦労している。
Co-RedTeamは,現実世界のレッドチームのミラーリングを目的とした,セキュリティを意識したマルチエージェントフレームワークである。
Co-RedTeamは、脆弱性分析をコーディネートされた発見およびエクスプロイトステージに分解し、エージェントがアクションを計画、実行、検証、洗練できるようにする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:38:45 GMT)
Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All [57.2] Live-kBenchは、新たに発見されたカーネルバグのエージェントをスクラップし、評価するセルフ進化ベンチマークの評価フレームワークである。
kEnvは、カーネルのコンパイル、実行、フィードバックのためのエージェントに依存しないクラッシュ解決環境である。
kEnvを用いて3つの最先端エージェントをベンチマークし、最初の試行で74%のクラッシュを解決したことを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:06:15 GMT)
Plain Transformers are Surprisingly Powerful Link Predictors [57.0] リンク予測はグラフ機械学習における中核的な課題であり、リッチで複雑なトポロジ的依存関係をキャプチャするモデルを必要とする。
グラフニューラルネットワーク(GNN)が標準的なソリューションであるのに対して、最先端のパイプラインは明示的な構造やメモリ集約的なノードの埋め込みに依存していることが多い。
本報告では,手作りのプリミティブに置き換えるエンコーダのみのプレーントランスであるPENCILについて,サンプリングしたローカルサブグラフに注目する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:45:52 GMT)
<SOG_k>: One LLM Token for Explicit Graph Structural Understanding [57.0] 我々は、グラフの構造を統一トークン空間内に完全に表現するために、1つの特別なトークン SOG_k> を組み込むことを提案する。
SOG_k>は、簡潔で正確な方法でLLMに理解、生成、理性を与える。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:55:09 GMT)
Statistical Learning Theory in Lean 4: Empirical Processes from Scratch [57.0] 本稿では,経験的プロセス理論に基づく統計学習理論(SLT)の総合的なLean 4形式化について述べる。
エンドツーエンドの正式なインフラストラクチャは、最新のLean 4 Mathlibライブラリに欠けている内容を実装しています。
この研究は再利用可能な形式基盤を確立し、機械学習理論の今後の発展への扉を開く。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:24:53 GMT)
Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles [56.7] Wiki Live Challenge (WLC)は、最新のWikipedia Good Articles(GA)をエキスパートレベルの参照として活用する、ライブベンチマークである。
Wiki Evalは, 品質基準39の細粒度評価手法と, 事実検証性のための厳密な指標を含む総合的な評価フレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:30:13 GMT)
Unifying Masked Diffusion Models with Various Generation Orders and Beyond [56.7] 仮面拡散モデル(MDM)は、言語生成のための自己回帰モデル(ARM)の潜在的な代替品である。
広範な拡散生成過程のための秩序表現型マスク拡散モデル(OeMDM)を提案する。
生成順序と拡散バックボーンを共同で学習する学習順マスク拡散モデル(LoMDM)を導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:54:32 GMT)
How Well Do Models Follow Visual Instructions? VIBE: A Systematic Benchmark for Visual Instruction-Driven Image Editing [56.6] 我々は,3段階の相互作用階層を導入し,決定的接地,形態的操作,因果推論を捉える。
本稿では,スケーラブルできめ細かい評価を実現するために,タスク固有のメトリクスを備えた堅牢なLMM-as-a-judge評価フレームワークを提案する。
プロプライエタリなモデルは早期の視覚指示追従能力を示し、一貫してオープンソースモデルを上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:24:45 GMT)
Beyond Global Alignment: Fine-Grained Motion-Language Retrieval via Pyramidal Shapley-Taylor Learning [56.6] 動き言語検索は、自然言語と人間の動きの間の意味的ギャップを埋めることを目的としている。
既存のアプローチは主に、全動作シーケンスとグローバルテキスト表現の整合性に重点を置いている。
本研究では,微粒な動き言語検索のためのPST学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:35:51 GMT)
EUGens: Efficient, Unified, and General Dense Layers [56.5] 我々は、標準完全連結フィードフォワード層、textbfEfficient、 textbfUnimat、 textbfGeneral dense layer (EUGens) を一般化する新しい階層のクラスを提案する。
EUGensはランダムな特徴を活用して標準的なFFLを近似し、その計算に入力ノルムに直接的な依存を組み込むことによってそれらを超える。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:47:29 GMT)
FastPhysGS: Accelerating Physics-based Dynamic 3DGS Simulation via Interior Completion and Adaptive Optimization [56.2] 我々は物理に基づく動的3DGSシミュレーションのためのフレームワークであるFastPhysGSを提案する。
FastPhysGSは、わずか7GBのランタイムメモリを使用して、1分で高忠実度物理シミュレーションを実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:00:42 GMT)
Condition Errors Refinement in Autoregressive Image Generation with Diffusion Loss [56.1] 本稿では拡散損失を伴う拡散・自己回帰モデルの理論解析について述べる。
自動回帰モデルにおけるパッチデノゲーション最適化は、条件誤差を効果的に軽減し、安定した条件分布をもたらすことを示す。
「条件不整合に対処するための最適輸送(OT)理論に基づく新しい条件改善手法を導入する。」
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:48:04 GMT)
Accelerating Structured Chain-of-Thought in Autonomous Vehicles [55.8] チェーン・オブ・ソート(CoT)推論は、自律運転における視覚言語行動モデルの意思決定能力を高める。
FastDriveCoTはテンプレート構造CoTを高速化する新しい並列復号法である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:14:26 GMT)
Inference-Aware Meta-Alignment of LLMs via Non-Linear GRPO [55.6] 推論対応メタアライメント(IAMA)は、大きな言語モデルを多様な人間の好みに合わせる新しいアプローチである。
IAMAは、異なる推論時間アライメントアルゴリズムによって複数のタスクに効果的にアライメントできるようにベースモデルを訓練する。
確率測度の空間における最適解に確実に収束する非線形GRPOを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:50:42 GMT)
vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM [55.3] 我々は、大言語モデル(LLM)の内部状態のプログラミングを可能にするオープンソースのプラグインであるvLLM Hookを紹介する。
vLLM HookはvLLMへのシームレスな統合を提供し、パッシブプログラミングとアクティブプログラミングの2つの重要な機能をサポートしている。
本稿では, インジェクション検出, 検索強化検索 (RAG) , アクティベーションステアリングの3つのユースケースについて紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:34:13 GMT)
Probability-Entropy Calibration: An Elastic Indicator for Adaptive Fine-tuning [55.3] RankTunerは確率エントロピーキャリブレーション信号、相対ランクインジケータを導入し、予測分布の下で接地トラストークンのランクと期待ランクを比較する。
逆インジケータはトークン単位の相対尺度として使用され、微調整の目的を再重み付けし、真に未学習のトークンを更新する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:27:19 GMT)
Edit Knowledge, Not Just Facts via Multi-Step Reasoning over Background Stories [54.8] 知識の内在化は記憶の問題というよりも推論問題であると主張する。
3つの原則に基づくトレーニング戦略を提案する。
実験により、この戦略で訓練されたモデルは、推論中に獲得した知識を効果的に活用できることが示されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:22:51 GMT)
AMA: Adaptive Memory via Multi-Agent Collaboration [54.5] 複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:41:51 GMT)
MEnvAgent: Scalable Polyglot Environment Construction for Verifiable Software Engineering [54.2] 本稿では,自動環境構築のためのフレームワークであるMEnvAgentを紹介する。
MEnvAgentは、建設失敗を自律的に解決するマルチエージェント計画実行検証アーキテクチャを採用している。
MEnvData-SWEは,これまでで最大の,現実的な検証可能なDocker環境のポリグロットデータセットである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:17:52 GMT)
Rethinking the Role of Entropy in Optimizing Tool-Use Behaviors for Large Language Model Agents [54.2] LLM(Large Language Models)に基づくツール利用エージェントは、数学的推論やマルチホップ質問応答といったタスクに優れる。
長い道のりでは、エージェントはしばしば過度で低品質なツールコールをトリガーし、レイテンシを増大させ、推論性能を低下させる。
本稿では,エントロピー低減を監視信号として使用し,ツール使用行動の最適化ニーズに対処する2つの報奨戦略を設計する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:52:14 GMT)
Causal Flow Q-Learning for Robust Offline Reinforcement Learning [53.6] 構築された実演から表現型フローマッチングポリシーを学習する実践的実装を提案する。
提案手法は,最先端のオフラインRL法よりも120%の成功率を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:50:52 GMT)
Learning Better Certified Models from Empirically-Robust Teachers [53.5] 対人訓練は、具体的な対人摂動の訓練により、特定の対人攻撃に対して強い経験的堅牢性を得る。
ニューラルネットワークの検証を通じて、強力な堅牢性証明には対応できないニューラルネットワークを生成する。
以前認定されたトレーニングスキームは、ネットワーク緩和から直接トレーニングを行い、堅牢だがサブパーの標準性能を示すモデルを得る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:30:53 GMT)
Past- and Future-Informed KV Cache Policy with Salience Estimation in Autoregressive Video Diffusion [53.1] 既存のアプローチは一般的にKVキャッシュポリシーに依存しており、長期のビデオ生成におけるトークンの重要性の違いを無視している。
我々は,過去・未来型KVキャッシュポリシー(PaFu-KV)を提案する。
特にPaFu-KVは、双方向キャッシュ教師から抽出した軽量なサリエンス推定ヘッドを導入し、サリエンススコアを推定する。
このポリシーは、KVキャッシュ容量を小さくし、推論時にメモリフットプリントを減らすことで、より良い品質効率のトレードオフをもたらす。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:46:31 GMT)
FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents [53.0] 我々はFS-Researcherを紹介した。FS-Researcherはファイルシステムベースのフレームワークで、永続的なワークスペースを通じてコンテキストウィンドウを超えて深い研究をスケールする。
Context Builderエージェントはインターネットを閲覧し、構造化されたノートを書き、ソースを階層的な知識ベースにアーカイブする。
その後、レポートライターエージェントが最終レポートセクションをセクションごとに構成し、知識ベースを事実のソースとして扱う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:00:19 GMT)
Probabilistic Performance Guarantees for Multi-Task Reinforcement Learning [52.9] マルチタスク強化学習は、複数のタスクを実行できるポリシーを訓練する。
既存のアプローチが正式なパフォーマンスを保証することはめったにない。
本稿では、トレーニング中に見えないタスクに対するマルチタスクポリシーの性能に関する高信頼度保証を計算するためのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:41:47 GMT)
Learning Generative Selection for Best-of-N [52.9] 目的の強化学習によって、小さな推論モデルによって強力なGenSelect能力が得られることを示す。
この結果は,小規模モデルにおける強力な生成的選択を解放するスケーラブルな手法として強化学習を確立した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:21:15 GMT)
Adaptive Linear Path Model-Based Diffusion [52.8] リニアパスモデルベース拡散(LP-MBD)を導入し、分散保存スケジュールをフローマッチング線形確率パスに置き換える。
また,適応型LP-MBD(ALP-MBD)を提案し,タスクの複雑さや環境条件に応じて拡散ステップやノイズレベルを調整する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:33:03 GMT)
Beyond Open Vocabulary: Multimodal Prompting for Object Detection in Remote Sensing Images [52.7] リモートセンシングにおけるオープンボキャブラリオブジェクト検出は、テキストのみに依存してターゲットカテゴリを指定する。
実際には、タスクやアプリケーション固有のカテゴリセマンティクスによって、リモートセンシングのシナリオでは、この仮定は分解されることが多い。
テキストのみのプロンプト以外のカテゴリ仕様を再構成するマルチモーダルなオープン語彙検出フレームワークRS-MPODを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:03:01 GMT)
Grounding Generated Videos in Feasible Plans via World Models [52.6] Grounding Video Plans with World Models (GVP-WM) は、ビデオ生成したプランを実行可能なアクションシーケンスに変換するための計画手法である。
GVP-WMはまず、最初の観測とゴール観測からビデオプランを生成し、次に動的に実現可能な潜在軌道の多様体にビデオガイダンスを投影する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:04:47 GMT)
Transformers as Measure-Theoretic Associative Memory: A Statistical Perspective and Minimax Optimality [52.4] トランスフォーマーは、コンテント順応可能な検索とコンテキスト、原則として長さを活用できる能力を通じてエクササイズする。
確率尺度のレベルで連想記憶をリキャストし、コンテキストを無拘束トークン上の分布として扱う。
浅度測度理論変換器は入力密度のスペクトル仮定に基づいてリコール・アンド・予測マップを学習することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:34:17 GMT)
RLAnything: Forge Environment, Policy, and Reward Model in Completely Dynamic RL System [52.3] クローズドループ最適化により環境・ポリシー・報酬モデルを構築する強化学習フレームワークであるRLAnythingを提案する。
具体的には、ポリシーはステップワイドおよび結果信号からの総合的なフィードバックで訓練される。
理論を動機とした自動環境適応は、報酬モデルと政策モデルの両方のトレーニングを改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:59:04 GMT)
Self-Consolidation for Self-Evolving Agents [51.9] 大規模言語モデル(LLM)エージェントは静的システムとして機能し、生涯にわたる相互作用を通じて進化する能力に欠ける。
相補的進化機構を導入したLLMエージェントのための新しい自己進化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:16:07 GMT)
Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics [51.9] 分子動力学(MD)シミュレーションは、タンパク質動力学研究のゴールドスタンダードのままである。
近年の生成モデルではシミュレーションの加速が期待できるが、長軸生成に苦慮している。
物理的に可塑性なタンパク質軌道をマイクロスケールの時間スケールで生成する拡張拡散モデルSTAR-MDを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:13:28 GMT)
Maximum Likelihood Reinforcement Learning [51.8] MaxRLは、強化学習技術を用いて、最大極大度を近似するサンプリングベースのフレームワークである。
MaxRLは,GRPOで訓練したものと比較して,最大20倍のスケーリング効率を達成できることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:23:42 GMT)
Prediction-Powered Risk Monitoring of Deployed Models for Detecting Harmful Distribution Shifts [51.4] 予測駆動型リスクモニタリング(PPRM)を提案する。
PPRMは、合成ラベルを真のラベルの小さなセットと組み合わせることで、ランニングリスクの任意の有意な下界を構築する。
本稿では,画像分類,大規模言語モデル(LLM),通信監視タスクの広範な実験を通じて,PPRMの有効性を実証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:32:14 GMT)
PRISM: Performer RS-IMLE for Single-pass Multisensory Imitation Learning [51.2] PRISMは,IMLEのバッチ・グロバル・リジェクション・サンプリングに基づく単一パスポリシーである。
PRISMは、Performerアーキテクチャを用いた線形アテンション発生器と時間的マルチセンサエンコーダを結合する。
7-DoFアームD1を搭載したUnitree Go2を用いたロコマニピュレーションやUR5マニピュレータを用いたテーブルトップ操作など,PRISMの有効性を実証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:57:37 GMT)
One Size, Many Fits: Aligning Diverse Group-Wise Click Preferences in Large-Scale Advertising Image Generation [50.6] textitOne Size, Many Fits (OSMF) は、大規模な広告画像生成において、多様なグループワイドなクリック嗜好を整合させる統合フレームワークである。
我々のフレームワークは、オフラインとオンラインの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:30:53 GMT)
ProjDevBench: Benchmarking AI Coding Agents on End-to-End Project Development [49.6] ProjDevBenchはエンドツーエンドのベンチマークで、コーディングエージェントにプロジェクト要件を提供し、その結果のリポジトリを評価する。
概念指向タスクと実世界のアプリケーションシナリオの両方をカバーし、8つのカテゴリにまたがる20のプログラミング問題をキュレートします。
エージェントは基本的な機能を扱うが、複雑なシステム設計、時間最適化、リソース管理に苦労する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:17:23 GMT)
Expanding the Capabilities of Reinforcement Learning via Text Feedback [49.6] テキストフィードバックをトレーニング中に利用できるが、推論では利用できないマルチターンRLセットアップであるテキストフィードバック(RLTF)を形式化する。
そこで本研究では, 自己蒸留法(RLTF-SD)と, フィードバック条件付き第2ターン世代に適合するように単一ターンポリシーを訓練するフィードバックモデリング法(RLTF-FM)の2つの手法を提案する。
以上の結果から,両手法はベンチマークにおいて強いベースラインを一貫して上回っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:56:56 GMT)
Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models [49.5] ラテント探索復号(Latent Exploration Decoding、LED)は、深度条件付き復号法である。
LEDは、複数の推論ベンチマークとモデルでパス@1とパス@16の精度を0.61と1.03ポイント改善している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:12:33 GMT)
FlowSteer: Interactive Agentic Workflow Orchestration via End-to-End Reinforcement Learning [49.4] FlowSteerは、エージェントと実行可能なキャンバス環境として軽量なポリシーモデルを採用する、エンドツーエンドの強化学習フレームワークである。
FlowSteerは様々なタスクでベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:30:42 GMT)
Position: Beyond Model-Centric Prediction -- Agentic Time Series Forecasting [49.1] エージェント時系列予測(ATSF)は,認識,計画,行動,反射,記憶からなるエージェントプロセスとして再編成される。
ワークフローに基づく設計、エージェント強化学習、ハイブリッドエージェントワークフローパラダイムという3つの代表的な実装パラダイムを概説し、モデル中心の予測からエージェント予測に移行する際に生じる機会と課題について議論する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:01:11 GMT)
GPD: Guided Progressive Distillation for Fast and High-Quality Video Generation [49.0] 高速かつ高品質なビデオ生成のための拡散過程を高速化するフレームワークであるGPD(Guid Progressive Distillation)を提案する。
GPDは、VBench上での競争的な視覚的品質を維持しながら、サンプリングステップを48から6に減らす。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:47:33 GMT)
CUA-Skill: Develop Skills for Computer Using Agent [48.9] コンピュータを利用したエージェントスキルベースであるCUA-Skillを導入し,人間のコンピュータ利用知識をスキルとして符号化する。
我々は、動的スキル検索、引数のインスタンス化、メモリ認識障害回復をサポートする、エンドツーエンドのコンピュータ利用エージェントであるCUA-Skill Agentを構築した。
その結果、CUA-Skillは、エンドツーエンドのベンチマークで実行の成功率と堅牢性を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:11:55 GMT)
A Relative-Budget Theory for Reinforcement Learning with Verifiable Rewards in Large Language Model Reasoning [48.7] 強化学習(Reinforcement Learning, RL)は、大規模言語モデルの推論能力を改善するための主要なパラダイムである。
本稿では, 相対予算$:= H/mathbbE[T]$という単一の量を用いて, この変動を説明する式式予算理論を提案する。
報奨の分散と情報トラジェクトリの確率を制御して,$$がサンプル効率を決定することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:31:52 GMT)
MARS: Modular Agent with Reflective Search for Automated AI Research [48.5] 我々は自律型AI研究に最適化されたフレームワークMARSを紹介する。
MARSは,(1)コストを意識したモンテカルロ木探索(MCTS)による予算計画(Budget-Aware Planning)による実行コストとパフォーマンスを明示的にバランスさせる),(2)複雑なリポジトリを管理するために"Design-Decompose-Implement"パイプラインを使用するモジュール構成,(3)ソリューションの違いを分析して高信号の洞察を抽出することで,与信の割り当てに対処する反射記憶(Reference Reflective Memory)という3つの柱に依存している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:03 GMT)
MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration [48.4] トレーニング不安定性は、大規模言語モデルの事前トレーニングにおいて依然として重要な課題である。
我々は,5MナノGPTモデルにおけるトレーニング失敗をP$で評価した。
安定なランクを回復するために行列手演算を周期的に適用する新しいノルムであるMSignを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:18:45 GMT)
From Latent Signals to Reflection Behavior: Tracing Meta-Cognitive Activation Trajectory in R1-Style LLMs [48.3] R1型LPMは自己反射の能力に注目が集まっているが、そのような行動の基盤となる内部メカニズムはいまだ不明である。
logitレンズを使ってトークンレベルのセマンティクスを読み取ると、構造化された進行が明らかになる。
以上の結果から,潜時モニタリングから談話レベルの規制,そして最終的に自己回帰を過大化させる,人間的なメタ認知プロセスの進展が示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:58:24 GMT)
DRAINCODE: Stealthy Energy Consumption Attacks on Retrieval-Augmented Code Generation via Context Poisoning [48.2] 本稿では,RAGベースのコード生成システムの計算効率を目標とした,最初の逆アタックであるDrainCodeを紹介する。
その結果,DrainCodeのレイテンシは85%増加し,エネルギー消費量は49%増加し,出力長はベースラインに比べて3倍増加した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:41:03 GMT)
Mind-Brush: Integrating Agentic Cognitive Search and Reasoning into Image Generation [48.0] 我々は、生成を動的で知識駆動のワークフローに変換する統合エージェントフレームワークであるMind-Brushを紹介します。
人間のような「思考-研究-創造」パラダイムをシミュレートして、Mind-Brushは、分配の概念を根絶するために、マルチモーダルなエビデンスを積極的に回収する。
大規模な実験により、Mind-Brushは統一モデルの能力を著しく向上させることが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:42:13 GMT)
PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss [47.9] 知覚的監視機能を備えたシンプルなピクセル拡散フレームワークであるPixelGenを提案する。
フルイメージ多様体をモデル化する代わりに、PixelGenは2つの補完的な知覚的損失を導入した。
LPIPSの損失は、より優れた局所パターンの学習を促進する一方、DINOベースの知覚的損失は、グローバルな意味論を強化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:59:42 GMT)
Search-Augmented Masked Diffusion Models for Constrained Generation [47.5] Search-Augmented Masked Diffusion (SearchDiff)は、インフォメーションサーチを直接リバース・デノイング・プロセスに統合するトレーニング不要なニューロシンボリック推論フレームワークである。
SearchDiffは制約満足度とプロパティの定着性を大幅に改善し、離散拡散と自己回帰ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:43:25 GMT)
Causal Forcing: Autoregressive Diffusion Distillation Done Right for High-Quality Real-Time Interactive Video Generation [47.3] 現在の方法では、事前訓練された双方向ビデオ拡散モデルを数段階自己回帰(AR)モデルに蒸留する。
ODEのためのAR教師を用いたCausal Forcingを提案する。
私たちのメソッドは、すべてのメトリクスですべてのベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:19:22 GMT)
Deep Multivariate Models with Parametric Conditionals [47.2] 確率変数の不均一な集合に対する深層多変量モデルについて考察する。
本稿では,各変数群に対する条件付き確率分布を用いて,共同確率分布を表現することを提案する。
それらの学習は、その制限分布のデータ確率を最大化することにより、パラメトリドマルコフ連鎖カーネルのトレーニングとしてアプローチすることができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:01:48 GMT)
The Verification Crisis: Expert Perceptions of GenAI Disinformation and the Case for Reproducible Provenance [47.0] 本稿では,AI研究者,政策立案者,偽情報専門家による縦断的専門家意識調査(N=21)の第1波から得られた知見について述べる。
テキスト、画像、オーディオ、ビデオといったマルチモーダルな脅威の重大さを調査し、現在の緩和戦略を評価する。
その結果、ディープフェイクビデオは即時「衝撃」の値を示す一方で、大規模テキスト生成は「印象的断片化」のシステム的リスクをもたらすことが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:45:12 GMT)
Small Generalizable Prompt Predictive Models Can Steer Efficient RL Post-Training of Large Reasoning Models [46.5] 本研究は、汎用予測型プロンプト選択(GPS)を紹介する。
GPSは、共有最適化履歴に基づいて訓練された軽量な生成モデルを用いて、迅速にベイズ推定を行う。
様々な推論ベンチマークによる実験は、GPSがトレーニング効率、最終性能、テストタイム効率を大幅に改善したことを示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:24:36 GMT)
Emergent Analogical Reasoning in Transformers [46.1] 認知における中心的な役割にもかかわらず、トランスフォーマーがアナログ推論を習得し実装するメカニズムはいまだに理解されていない。
類推的推論をカテゴリー間の実体間の対応の推論として定式化する。
変換器における類似推論は、埋め込み空間における関係構造の幾何学的アライメントと、変換器内の関手の適用の2つの重要な構成要素に分解されることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:49:36 GMT)
Rethinking LoRA for Data Heterogeneous Federated Learning: Subspace and State Alignment [45.7] 本稿では,クライアント側GaLoreスタイルの勾配-部分空間最適化とサーバ側ドリフト-ロバスト同期を組み合わせたFedGaLoreを提案する。
NLU、ビジョン、NLGベンチマーク全体において、FedGaLoreは、非IID設定における最先端のフェデレーションLoRAベースラインに対する堅牢性と正確性を改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:27:44 GMT)
HER: Human-like Reasoning and Reinforcement Learning for LLM Role-playing [45.6] LLMロールプレイングは、コンパニオンシップ、コンテンツ生成、デジタルゲームなど、様々なアプリケーションにおいて重要な機能として現れている。
これまでの取り組みは主に、高品質な推論トレースを持つデータと、人間の好みに沿った信頼できる報酬信号の2つの欠陥に悩まされていた。
認知レベルのペルソナシミュレーションのための統合フレームワークであるHERを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:22:28 GMT)
Less Noise, More Voice: Reinforcement Learning for Reasoning via Instruction Purification [44.7] RLVR(Reinforcement Learning with Verifiable Rewards)は、LLM推論の進歩であるが、限定的なロールアウト予算の下での非効率な探索によって制約されている。
多くの探索失敗は、問題の難しさではなく、干渉を引き起こすプロンプトトークンの少なさから生じている。
本稿では、干渉トークンの識別と削除を最初に促すLess Noise Smpling Framework(LENS)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:30:50 GMT)
ProxyImg: Towards Highly-Controllable Image Representation via Hierarchical Disentangled Proxy Embedding [44.2] 本稿では,意味的,幾何学的,テクスチュラルな属性を独立したパラメータ空間に分割する階層的プロキシベースパラメトリック画像表現を提案する。
本手法は,直感的,対話的,物理的に妥当な操作が可能でありながら,パラメータが大幅に少ない最先端のレンダリング忠実度を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:53:45 GMT)
UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing [44.1] 本稿では,テキスト・画像生成と画像編集を両立する統合フレームワークを提案する。
我々は、暗黙の制約を注入するための世界的知識強化計画として生成を定式化し、細粒度の視覚的改善のための編集機能を活用し、自己回帰による視覚的エラーをさらに補正する。
このアプローチは、共有表現内で生成と編集を統一し、計画の認知過程を反映し、改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:34:35 GMT)
Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks [43.6] 我々は、ロバストな世界モデルは、能力の緩やかな集まりではなく、相互作用、知覚、象徴的推論、空間的表現を一体的に組み込んだ規範的な枠組みであるべきだと主張する。
この研究は、未来の研究を世界のより一般的で堅牢で原則化されたモデルへと導くことを目的としている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:42:44 GMT)
DOGMA: Weaving Structural Information into Data-centric Single-cell Transcriptomics Analysis [43.6] 生データの構造的再構成と意味的拡張を目的としたデータ中心型フレームワークであるDOGMAを提案する。
複雑な多種多様なベンチマークにおいて、DOGMA SOTA性能は優れたゼロショットロバスト性とサンプル効率を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:10:09 GMT)
Cost-Aware Bayesian Optimization for Prototyping Interactive Devices [43.5] 多様なプロトタイピングコストを考慮に入れた,コストを考慮したベイズ最適化の拡張を提案する。
鍵となるアイデアは、デザイナーが見積もったコストを使って、よりコスト効率の良いプロトタイプのサンプリングをガイドすることだ。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:59:50 GMT)
DASH: Faster Shampoo via Batched Block Preconditioning and Efficient Inverse-Root Solvers [43.5] シャンプー(英: Shampoo)は、二階近似計算の1つである。
Shampooの適用には、内部運用が高価なため、大幅な減速が伴う。
本稿では,Newton-DBイテレーションとChebyshevs近似を,シャンプーが必要とする逆行列根を計算するための,新しい高速なアプローチとして紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:14:45 GMT)
InfMem: Learning System-2 Memory Control for Long-Context Agent [43.4] InfMemは、PreThink-Retrieve-Writeプロトコルを介してSystem-2スタイルの制御をインスタンス化する制御中心のエージェントである。
32kから100Mまでの超長期のQAベンチマークでは、InfMemはバックボーン全体でMemAgentを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:15:08 GMT)
TIDE: Trajectory-based Diagnostic Evaluation of Test-Time Improvement in LLM Agents [43.4] 自律型LLMエージェントの最近の進歩は、環境との反復的相互作用によって性能を向上させる能力を示している。
本稿では,TTIを3つの包括的かつ相互接続的な次元に分解するエージェント非依存および環境非依存のフレームワークであるテスト時間改善診断評価(TIDE)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:00:47 GMT)
Efficient Cross-Architecture Knowledge Transfer for Large-Scale Online User Response Prediction [43.4] CrossAdaptは、効率的なクロスアーキテクチャ知識伝達のための2段階のフレームワークである。
オフラインの段階では、反復的なトレーニングなしで次元適応射影による迅速な埋め込み転送が可能である。
オンラインステージでは、教師が頻繁に更新すると同時に、教師が頻繁に更新する非対称な共蒸留が導入されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:00:36 GMT)
On Stability and Robustness of Diffusion Posterior Sampling for Bayesian Inverse Problems [42.8] 拡散に基づく解法は、生成過程を導くために、BIPにおける観測が想定される可能性に依存する。
このギャップを後部近似誤差を特徴付けることにより橋渡しし,拡散型解法のエンハンスタビリティを実証する。
本稿では, 既存の勾配型後方サンプリング装置と互換性があり, イントロバスト拡散後サンプリング法を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:47:15 GMT)
Dynamic Mix Precision Routing for Efficient Multi-step LLM Interaction [42.6] 大規模言語モデル(LLM)は、多段階の相互作用とテスト時の推論を通じて、長期の意思決定タスクにおいて高い性能を達成する。
本稿では,各決定ステップにおいて,高精度と低精度のLLMを適応的に選択する動的混合精度ルーティングフレームワークを提案する。
ALFWorldの実験により,本手法は単一精度ベースラインとルーティング手法よりも精度の高いトレードオフを実現することが実証された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:24:04 GMT)
From Knowing to Doing Precisely: A General Self-Correction and Termination Framework for VLA models [42.6] 本稿では、視覚言語アクション(VLA)モデルのための軽量でトレーニング不要なフレームワークを提案する。
VLA-SCTは自己修正制御ループとして動作し、データ駆動型アクションリファインメントと条件論理を組み合わせて終了する。
本手法は,LIBEROベンチマークのすべてのデータセットに対して一貫した改善を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:44:40 GMT)
Hyperspectral Image Fusion with Spectral-Band and Fusion-Scale Agnosticism [42.3] 現在のマルチスペクトル・ハイパースペクトル画像融合(MS/HS融合)の深層学習モデルは、一般に固定スペクトルバンドと空間スケールのために設計されている。
スペクトル帯域と融合スケールの不可知性を備えたMS/HS融合のための普遍的なフレームワークであるSSAを提案する。
我々の単一モデルは、目に見えないセンサやスケールに最適化しつつ、最先端の性能を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:48:53 GMT)
Trust but Verify: Adaptive Conditioning for Reference-Based Diffusion Super-Resolution via Implicit Reference Correlation Modeling [42.1] 実世界の劣化は、低品質(LQ)入力と参照(Ref)イメージの対応を信頼できないものにする。
本稿では,一段階拡散フレームワークであるAda-RefSRを提案する。
複数のデータセットの実験では、Ada-RefSRは忠実さ、自然性、効率性の強いバランスを達成している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:34:57 GMT)
A Geometry-Aware Efficient Algorithm for Compositional Entropic Risk Minimization [42.1] 我々は、$textbfcompositional entropic risk minimizationと呼ばれる問題の族を研究する。
各データの損失はLog-Exponential(Log-E-Exp)関数として定式化される。
エントロピーリスク最小化の双対な定式化のために,$textbfSCENT$と呼ばれる幾何認識アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:33:49 GMT)
Omni-Judge: Can Omni-LLMs Serve as Human-Aligned Judges for Text-Conditioned Audio-Video Generation? [41.9] 我々は,Omni-LLMsがテキスト・コンディショニング・オーディオ・ビデオ生成のためのヒューマンアライメント・ジャッジとして機能するかどうかを検討した。
omni-LLMは音声、ビデオ、テキストを自然に処理し、リッチな推論をサポートし、解釈可能な連鎖フィードバックを提供する。
本研究は,マルチモーダル生成のための統一評価器として,オムニ-LLMの潜在的な限界と現在の限界を強調した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:36:23 GMT)
PISCES: Annotation-free Text-to-Video Post-Training via Optimal Transport-Aligned Rewards [41.8] 我々は、アノテーションなしのポストトレーニングアルゴリズムであるtextttPISCES$を紹介し、新しいDual Optimal Transport (OT)-aligned Rewardsモジュールを通して制限に対処する。
報酬信号と人間の判断を合わせるために、$textttPISCES$はOTを使用して、分散トークンレベルと離散トークンレベルの両方でテキストとビデオの埋め込みをブリッジする。
$textttPISCES$は、OTのレンズを通して生成後のトレーニングにおいて、アノテーションなしの報酬管理を改善する最初の方法である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:37:11 GMT)
A Distributed Multi-Modal Sensing Approach for Human Activity Recognition in Real-Time Human-Robot Collaboration [41.4] 本稿では,慣性計測ユニットを備えたモジュール型データグローブと,ロボットとの接触時の手の動きを捉える視覚ベースの触覚センサを組み合わせたHARシステムを提案する。
我々は,セグメント化シーケンスのオフライン分類,静的条件下でのリアルタイム分類,現実的なHRCシナリオなど,さまざまな条件下で活動認識アプローチを検証した。
実験の結果、全てのタスクに対して高い精度が示され、複数の協調的な設定がこのマルチモーダルアプローチの恩恵を受ける可能性が示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:14:19 GMT)
Accurate Network Traffic Matrix Prediction via LEAD: a Large Language Model-Enhanced Adapter-Based Conditional Diffusion Model [41.2] 本稿では,交通行列をRGB画像に変換する条件拡散モデルLEADを提案する。
また,拡散モデルを誘導し,複雑な動的ネットワークトラフィックを生成するDual-Conditioning Strategyを提案する。
AbileneとGEANTデータセットの実験では、LEADがすべてのベースラインを上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:13:21 GMT)
RIR-Former: Coordinate-Guided Transformer for Continuous Reconstruction of Room Impulse Responses [41.1] RIR-Formerはグリッドフリーで1ステップのフィードフォワードモデルである。
トランスバックボーンに正弦波符号化モジュールを導入することにより,マイクロホン位置情報を効果的に組み込むことができる。
様々な模擬音響環境の実験により、RIR-Formerは最先端のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:33:54 GMT)
FSVideo: Fast Speed Video Diffusion Model in a Highly-Compressed Latent Space [40.8] 本稿では,高速トランスフォーマーによる画像間拡散(I2V)フレームワークFSVideoを紹介する。
私たちは、以下の重要なコンポーネントの上にフレームワークを構築します。
圧縮された遅延空間を持つ新しいビデオオートエンコーダ。
新しいレイヤメモリ設計による拡散トランスフォーマー(DIT)アーキテクチャ。
数ステップのDITアップサンプラーによるマルチレゾリューション生成戦略による映像の忠実度向上
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:37:38 GMT)
CoMeT: Collaborative Memory Transformer for Efficient Long Context Modeling [40.7] 本稿では,LLMがメモリ使用量と線形時間複雑度を一定に保ちながら任意の長いシーケンスを処理できる新しいアーキテクチャを提案する。
CoMeTは最小限の微調整で事前訓練されたモデルに統合できる。
CoMeTと32kコンテキストに微調整されたモデルでは、1Mトークンシーケンス内の任意の位置からパスキーを正確に取得することができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:49:44 GMT)
Path Tracking with Dynamic Control Point Blending for Autonomous Vehicles: An Experimental Study [40.4] 本稿では,輪車に沿った動的制御点に横方向制御コマンドを適用する自律走行車のための経路追跡フレームワークを提案する。
提案手法は,前軸または後軸の固定基準を強制するのではなく,連続的に補間する。
閉ループ追尾および後方操作の結果、軌道精度の向上、スムーズな操舵プロファイル、固定制御点ベースラインよりも適応性の向上が見られた。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:03:37 GMT)
Seeing Is Believing? A Benchmark for Multimodal Large Language Models on Visual Illusions and Anomalies [40.0] 視覚錯覚と異常のモデル性能を探索するベンチマークであるVIA-Benchを紹介する。
我々は1K以上の高品質な問合せ対を構築し、微妙な視覚的推論を必要とする。
以上の結果から,知覚的ボトルネックの解消が人工知能の進歩に不可欠であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:48:03 GMT)
Your AI-Generated Image Detector Can Secretly Achieve SOTA Accuracy, If Calibrated [40.0] バランスの取れたデータセットでトレーニングされているにもかかわらず、既存のAI生成イメージ検出器はテスト時に体系的なバイアスを示すことが多い。
ベイズ決定理論に基づく理論的に基礎付けられたポストホック校正フレームワークを提案する。
我々のアプローチは、信頼性と適応性のあるAI生成画像検出のための軽量で原則化されたソリューションを提供するため、再トレーニングなしにロバスト性を大幅に改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:26:37 GMT)
Learning While Staying Curious: Entropy-Preserving Supervised Fine-Tuning via Adaptive Self-Distillation for Large Reasoning Models [39.7] 大規模推論モデルの標準学習レシピは、教師付き微調整と強化学習(SFT-then-RL)によってRLステージの利点を制限できる可能性がある。
固有好奇性による探索能力の向上を目的としたエントロピー保存型SFT法であるCurioSFTを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:53:55 GMT)
LDRNet: Large Deformation Registration Model for Chest CT Registration [39.2] 胸部CT画像の大規模な変形画像登録のための高速な教師なし深層学習手法 LDRNet を提案する。
まず、粗い解像度登録フィールドを予測し、粗い値から細かい値に精製する。
以上の結果から,大規模な変形画像の登録における最先端性能が得られ,より高速であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:44:53 GMT)
Real-Time 2D LiDAR Object Detection Using Three-Frame RGB Scan Encoding [39.1] 3つの連続走査をRGBチャネルとして積み重ねることで、短時間の時間的コンテキストを符号化するカメラレス2次元LiDARオブジェクト検出パイプラインを提案する。
Raspberry Pi 5上では、スキャンエンコーディングや後処理を含む、1フレームあたり平均47.8msの、ウォームアップ後のエンドツーエンドのレイテンシで、リアルタイムで実行される。
シミュレーションベースではあるものの,軽量なテンポラリエンコーディングにより,RGBの外観を捉えることなく,高精度かつリアルタイムなLiDAR検出が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:44:27 GMT)
SMTrack: State-Aware Mamba for Efficient Temporal Modeling in Visual Tracking [39.1] 我々は、状態認識型マンバトラッカー(SMTrack)と呼ばれる視覚追跡のための新しい時間的モデリングパラダイムを提案する。
SMTrackは、カスタマイズされたモジュールや、長期の時間的依存関係を構築するための相当な計算コストを必要とせずに、トレーニングとトラッキングのための適切なパイプラインを提供する。
SMTrackは計算コストの低い有望な性能を実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:44:59 GMT)
What LLMs Think When You Don't Tell Them What to Think About? [39.1] 最小限のトピックニュートラル入力から生成する大規模言語モデルについて検討する。
驚くべきことに、各モデルファミリーは、強く、体系的なトピックの好みを示す。
ほぼ制約のない世代は、しばしば反復句に縮退する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:06:06 GMT)
SafeGround: Know When to Trust GUI Grounding Models via Uncertainty Calibration [39.0] GUIグラウンドモデルのための不確実性を認識したフレームワークであるSafeGroundを紹介する。
SafeGroundが既存のベースラインを常に上回り、誤った予測と正しい予測を区別することを示す。
複数のGUIグラウンドモデル全体で、SafeGroundはシステムレベルの精度をジェミニのみの推測よりも最大5.38%向上させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:22:45 GMT)
Demystifying Mergeability: Interpretable Properties to Predict Model Merging Success [38.8] 我々は、マージ可能性は、マージ方法とパートナータスクの両方に依存することを示した。
サブスペースオーバーラップと勾配アライメントのメトリクスは、互換性のための基礎的でメソッドに依存しない前提条件として一貫して現れます。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:07:31 GMT)
MagicFuse: Single Image Fusion for Visual and Semantic Reinforcement [38.5] 本稿では,従来のデータレベルの融合を知識レベルまで拡張する,単一イメージ融合という新しい概念を提案する。
MagicFuseは、1つの低画質の可視像から包括的クロススペクトルシーン表現を導出できる新しい単一画像融合フレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:43:29 GMT)
SEDformer: Event-Synchronous Spiking Transformers for Irregular Telemetry Time Series Forecasting [38.1] テレメトリIMTS予測のためのSEDエンハンススパイキングトランスであるSEDformerを提案する。
SEDformerは、エネルギーとメモリ使用量を削減しながら最先端の予測精度を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:33:30 GMT)
Behavioral Consistency Validation for LLM Agents: An Analysis of Trading-Style Switching through Stock-Market Simulation [38.0] 我々は、金融市場シナリオを用いて、エージェントの戦略変更が金融理論と一致するかどうかをテストする。
本研究は, 長期保存と促進により設定された4つの行動金融ドライバー・アバージョン, ハーディング, 富の分化, 価格の相違を人格特性として運用する。
以上の結果から,最近のLCMのスイッチング動作は,挙動有限性理論と部分的に一致していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:25:10 GMT)
Fast Autoregressive Video Diffusion and World Models with Temporal Cache Compression and Sparse Attention [37.9] 自動回帰ビデオ拡散モデルは、ストリーミング生成、ロングフォーム合成への扉を開くこと、ビデオワールドモデル、インタラクティブなニューラルゲームエンジンを可能にする。
生成が進むにつれて、KVキャッシュが増加し、レイテンシの増加とGPUメモリのエスカレーションが生じる。
我々は、自己回帰拡散のための統合されたトレーニングなしアテンションフレームワークを提案する: TempCacheは、時間的対応によるKVキャッシュをバウンドキャッシュ成長に圧縮し、AnnCAは、高速近傍マッチングを用いてフレーム関連プロンプトを選択することで、クロスアテンションを加速し、AnnSAは各クエリを制限して自己アテンションを拡大する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:31:21 GMT)
MarkCleaner: High-Fidelity Watermark Removal via Imperceptible Micro-Geometric Perturbation [37.9] MarkCleanerは、再生ベースの透かし除去によって引き起こされるセマンティックドリフトを回避する透かし除去フレームワークである。
我々は,MarkCleanerが透かし除去と視覚的忠実度の両方において優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:03:21 GMT)
NEAT: Neuron-Based Early Exit for Large Reasoning Models [37.9] 大規模な推論モデル(LRM)は、正しい解が到達した後に冗長な推論ステップが生成される現象であるエンフェーバー思考に悩まされることが多い。
既存の早期推論終了メソッドは、冗長な推論ステップをスキップするために出力レベルや訓練されたプローブモデルに依存している。
トレーニング不要早期退避を可能にするために,ニューロンレベルの活性化ダイナミクスを監視するフレームワークである textbfNEAT を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:09:59 GMT)
State Rank Dynamics in Linear Attention LLMs [37.6] 州の階級階層化は、線形アテンションヘッド間で異なるスペクトル分岐によって特徴づけられる。
低ランクの頭部はモデル推論に欠かせないが、高ランクの頭部は顕著な冗長性を示す。
我々は,KVキャッシュのオーバーヘッドを38.9%削減し,モデル精度を大きく維持するゼロショット戦略であるJoint Rank-Norm Pruningを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:00:42 GMT)
Game of Thought: Robust Information Seeking with Large Language Models Using Game Theory [37.5] 大規模言語モデル(LLM)の情報探索能力を評価するために,20質問ゲームを用いた。
本稿では,ゲーム理論を応用したゲーム思考(Game of Thought, GoT)を提案し,ゲームの限定変量に対するナッシュ均衡(NE)戦略を近似する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:33:18 GMT)
From Directions to Regions: Decomposing Activations in Language Models via Local Geometry [37.5] 活性化空間をモデル化するスケーラブルで教師なしの代替手段として、MFA(Mixture of Factor Analyzers)を利用する。
MFAは、活性化空間における領域のセントロイドと、セントロイドからの局所的な変化の2つの構成幾何学的対象に活性化を分解する。
Llama-3.1-8B と Gemma-2-2B の大規模 MFA を訓練し、活性化空間における複雑な非線形構造を捉えることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:49:05 GMT)
Moving On, Even When You're Broken: Fail-Active Trajectory Generation via Diffusion Policies Conditioned on Embodiment and Task [37.5] DEFTは、ロボットの現在の実施形態とタスク制約を条件とした拡散ベースの軌道生成装置である。
7-DoFロボットアームを用いたシミュレーションと実世界のシナリオでDEFTを評価した。
以上の結果から, DEFTは任意の障害設定や実世界のデプロイに対してフェールアクティブな操作を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:02:48 GMT)
Learning Sparse Visual Representations via Spatial-Semantic Factorization [37.2] 自己教師付き学習(SSL)は、意味理解と画像再構成の根本的な対立に直面している。
本稿では,視覚的特徴を意味概念とその空間分布の低ランクな製品に分解するフレームワークSTELLARを紹介する。
この分解された形の下で16個のスパーストークンが同時に高品質な再構成(2.60 FID)をサポートし、高密度バックボーンのセマンティック性能(79.10% ImageNet精度)に適合することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:12:17 GMT)
IntraSlice: Towards High-Performance Structural Pruning with Block-Intra PCA for LLMs [37.2] 大きな言語モデル(LLM)は、さまざまなタスクにわたって強力なパフォーマンスを実現しますが、その巨大なサイズのため、デプロイメントの課題に直面します。
近年,PCAをベースとしたプルーニング手法では,キーアクティベーションコンポーネントの保持によりこの問題が緩和されている。
ブロックワイドモジュールイントラPCA圧縮プルーニングを適用するフレームワークであるIntraSliceを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:28:56 GMT)
Which course? Discourse! Teaching Discourse and Generation in the Era of LLMs [37.1] NLPの分野は、過去数年間で大規模な継続的な変革を受けており、規律の境界を超えた議論を引き起こしている。
本稿では,意図的,注意的,一貫性のある言語構造に対する豊富な言語知識と計算モデルを備えた領域である談話処理の角度から,この問題を考察する。
我々は「計算談話と自然言語生成」という新たなコースを提示する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:35:29 GMT)
Provable Defense Framework for LLM Jailbreaks via Noise-Augumented Alignment [37.1] 大規模言語モデル(LLM)は、GCGのような経験的防御を簡単に回避できる適応型ジェイルブレイクに対して脆弱なままである。
本研究では,安全保証をシングルパス推論からアンサンブルの統計的安定性にシフトさせる,証明可能なロバスト性のためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:26:45 GMT)
OS-Marathon: Benchmarking Computer-Use Agents on Long-Horizon Repetitive Tasks [37.0] ロングホライズンで反復的なタスクは、プロフェッショナルな設定で一般的である。
これらのタスクは、処理するデータのサイズに比例して極端な長さまで拡張できるため、人間にとって退屈な作業であることが多い。
我々は2つのドメインにまたがる242の長期的反復的なタスクからなるOS-Marathonを構築し、SOTA(State-of-the-art)エージェントを評価する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:28:52 GMT)
SEA-Guard: Culturally Grounded Multilingual Safeguard for Southeast Asia [37.0] リソースが限られ、ネイティブアノテータが不足しているため、大規模な文化的基盤を持つデータセットの構築は困難である。
本稿では,東南アジアにおける真正かつ地域固有の安全データセットを高度に作成するための新しいエージェントデータ生成フレームワークを提案する。
SEA-Guardファミリーは、SEA文化の文脈に根ざした最初の多言語セーフガードモデルである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:20:35 GMT)
Fat-Cat: Document-Driven Metacognitive Multi-Agent System for Complex Reasoning [36.6] Fat-Catは、状態管理の信号対雑音比を改善するドキュメント駆動型エージェントアーキテクチャである。
これによってKimi-k2モデルは、HotPotQAで独自のGPT-4oベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:12:13 GMT)
Recurrent Equivariant Constraint Modulation: Learning Per-Layer Symmetry Relaxation from Data [36.3] 等価ニューラルネットワークは、基礎となるタスク対称性を利用して一般化を改善する。
本稿では,レイヤワイド制約変調機構であるRecurrent Equivariant ConstraintModulation (RECM)を提案する。
RECMは、トレーニング信号と各層の入力ターゲット分布の対称性からのみ適切な緩和レベルを学習する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:59:35 GMT)
Hierarchical Entity-centric Reinforcement Learning with Factored Subgoal Diffusion [36.3] オフラインゴールコンディション強化学習(GCRL)のための階層型エンティティ中心フレームワークを提案する。
このフレームワークは、サブゴール分解と因子構造を組み合わせることで、ドメイン内の長い水平タスクを複数のエンティティで解決する。
本手法は画像ベース長軸タスクにおけるRLエージェントの性能を一定に向上することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:40:54 GMT)
AdaptMMBench: Benchmarking Adaptive Multimodal Reasoning for Mode Selection and Reasoning Process [36.0] 本稿では,実世界,OCR,GUI,知識,数学の5分野にわたる適応型マルチモーダル推論のベンチマークであるAdaptMMBenchを提案する。
評価の結果,適応モード選択はモデルキャパシティに比例するが,最終的な精度から切り離されることが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:27 GMT)
Teacher-Guided Student Self-Knowledge Distillation Using Diffusion Model [35.9] 本稿では,DSKD と呼ばれる教師指導の学生 Diffusion Self-KD を提案する。
我々は,教師分類器を利用して,軽度拡散モデルを用いて生徒の特徴を識別するサンプリングプロセスを導出する。
生徒は教師の知識が特徴であり、教師の役割と見なすことができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:52:15 GMT)
Adaptive Domain Shift in Diffusion Models for Cross-Modality Image Translation [35.5] 画像の相互変換は不安定で非効率である。
標準拡散アプローチはドメイン間の1つの大域的線型移動に依存することが多い。
生成プロセスに直接ドメインシフトダイナミクスを組み込む。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:16:07 GMT)
Simulating Human Audiovisual Search Behavior [35.5] 聴覚と視覚の手がかりに基づく標的の配置には、不確実性の下での努力、時間、精度のバランスが必要である。
具体的音声視覚探索の計算モデルであるSennautを提示する。
音声視覚的検索のシミュレーションは,コストと認知負荷を最小限に抑える設計を示唆する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:47:05 GMT)
How Does the Lagrangian Guide Safe Reinforcement Learning through Diffusion Models? [35.4] The Theoryal DiffusionALGD is a novel algorithm for off-policy safe RL learning。
我々は、RLラグランジアンを導くエネルギー関数を、退化力学を導く安定化エネルギー関数と解釈できることを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:53:53 GMT)
Qrita: High-performance Top-k and Top-p Algorithm for GPUs using Pivot-based Truncation and Selection [35.3] Top-kとTop-pは、大きな言語モデルのサンプリングにおいて支配的なトランケーション演算子である。
我々は、ピボットベースの選択戦略に基づく効率的なトップkとトップpのアルゴリズムであるQritaを提案する。
Qritaは最大2倍のスループットと半メモリ使用を実現し、ソートベースのアルゴリズムに同じ出力を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:19:28 GMT)
Beyond Local Edits: Embedding-Virtualized Knowledge for Broader Evaluation and Preservation of Model Editing [35.3] 本稿では,埋め込み空間における制御摂動を通してモデル知識を特徴付ける埋め込み仮想知識(EVK)を紹介する。
EVKに基づく埋め込みレベルの評価ベンチマークEVK-Benchを構築し、編集によって誘発される潜在的な知識のドリフトを定量化する。
本稿では,編集中に埋め込みレベルの知識ドリフトを制限し,既存の編集手法にシームレスに統合可能なEVK-Alignモジュールを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:33:25 GMT)
INDIBATOR: Diverse and Fact-Grounded Individuality for Multi-Agent Debate in Molecular Discovery [34.9] INDIBATORは、個々の科学者プロファイルにエージェントを接地する分子発見のフレームワークである。
本評価は, 粗粒度ペルソナに依存するシステムにおいて, 微粒度個別化エージェントが常に優れていたことを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:47:36 GMT)
An Empirical Study of World Model Quantization [34.9] DINO-WMを用いた世界モデル量子化の系統的研究を行った。
我々は、幅広いビット幅、量子化の粒度、最大50イテレーションまでの計画地平線を含む様々な視覚的計画タスクについて実験を行う。
その結果,世界モデルにおける量子化効果は,標準精度やビット幅トレードオフを超えていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:54:03 GMT)
Read As Human: Compressing Context via Parallelizable Close Reading and Skimming [34.8] RAM (Read As HuMan) は、適応型ハイブリッド読み込み戦略を採用するコンテキスト圧縮フレームワークである。
人間の読書行動にインスパイアされたRAMは、コンテキストをセグメントに分割し、入力クエリを並列にエンコードする。
実験によると、RAMは複数の質問応答と要約ベンチマークで既存のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:10:56 GMT)
WildGraphBench: Benchmarking GraphRAG with Wild-Source Corpora [34.7] グラフベースのRetrieval-Augmented Generation (GraphRAG)は、階層グラフとして外部知識を整理する。
GraphRAGの既存のベンチマークの多くは、外部知識として短い、キュレートされたパスに依存している。
WildGraphBenchは、GraphRAGのパフォーマンスを野生で評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:55:29 GMT)
Auto-Comp: An Automated Pipeline for Scalable Compositional Probing of Contrastive Vision-Language Models [34.6] 現代視覚言語モデル(VLM)は、構成的推論において重大な欠陥を示す。
これらの失敗の視覚的および言語的ルーツを遠ざけることは、堅牢な評価の根本的な課題である。
スケーラブルなベンチマークを生成するための、完全に自動化され合成されたパイプラインであるAuto-Compを紹介します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:39:39 GMT)
Direct telecom network between atomic and solid-state quantum nodes [34.4] 将来の量子ネットワークは、異なる機能を持つ量子システムを、理想的には低損失のテレコム光ファイバーを介して長距離に相互接続する。
ここでは、周波数変換や外部フィルタリングを必要とせずに、原子の単一光子源をCバンド内の固体量子メモリに直接接続する2ノードハイブリッドネットワークを実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:01 GMT)
UniDriveDreamer: A Single-Stage Multimodal World Model for Autonomous Driving [34.3] UniDriveDreamerは、自動運転のための単一ステージ統合マルチモーダル世界モデルである。
中間表現やカスケード加群に頼ることなく、マルチモーダルな将来の観測を生成する。
これは、ビデオとLiDAR生成の両方において、従来の最先端の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:02:27 GMT)
LangMap: A Hierarchical Benchmark for Open-Vocabulary Goal Navigation [34.1] 目標ナビゲーションタスクであるHieraNavを導入し、エージェントは自然言語命令を解釈して4つの意味レベルでターゲットに到達する。
われわれはLanguage as a Map (LangMap)について紹介する。
LangMapはより優れたアノテーション品質を実現し、GOAT-Benchを4倍の単語で識別精度で23.8%上回る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:26:19 GMT)
OpenSeal: Good, Fast, and Cheap Construction of an Open-Source Southeast Asian LLM via Parallel Data [34.0] 大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)アプリケーションに有効なツールであることが証明されている。
OpenSealは、同様のサイズの既存のモデルのパフォーマンスに匹敵する、最初の真にオープンな東南アジアのLLMである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:09:10 GMT)
Generative Visual Code Mobile World Models [33.9] Mobile Graphical User Interface (GUI) World Models (WMs) は、列車や推論時にモバイルGUIエージェントのパフォーマンスを改善するための有望な道を提供する。
本稿では,1つのビジョンランゲージモデル(VLM)が次のGUI状態を実行可能なWebコードとして予測する,レンダリング可能なコード生成によるビジュアルワールドモデリングを提案する。
我々は,このパラダイム上に構築された最初のオープンウェイトなビジュアルモバイルGUI WMであるgWorldと,コードベースのトレーニングデータを自動生成するデータ生成フレームワーク(gWorld)を紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:12:16 GMT)
Geometry- and Relation-Aware Diffusion for EEG Super-Resolution [33.5] TopoDiffは、EEG空間超解像のための幾何学的および関係性を考慮した拡散モデルである。
人間の専門家が空間脳波パターンをどう解釈するかにインスパイアされたTopoDiffは、トポロジーを意識した画像埋め込みを取り入れている。
この設計により、一貫した性能向上を伴う空間基底型EEG空間超解像フレームワークが得られる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:44:20 GMT)
SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation [33.5] 既存のシミュレータは、事前に定義された物理やデータ駆動力学に依存しており、ロボットが制御することはない。
本稿では,ソフトボディ操作のための3次元ガウスSplatシミュレータSoMAを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:59:31 GMT)
Boltz is a Strong Baseline for Atom-level Representation Learning [33.5] 種々の小分子ベンチマークにおけるボルツ原子レベルの表現の質について検討する。
以上の結果から,Boltz は ADMET 特性予測タスクの特殊ベースラインと競合することが示された。
これらの結果は,最先端タンパク質中心モデルの表現能力が過小評価されていることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:11:53 GMT)
Efficient Swap Regret Minimization in Combinatorial Bandits [33.4] 本稿は,N$のアクション数が指数関数的に大きいバンディットに対して,効率的な非スワップ後悔アルゴリズムを設計する問題に対処する。
我々は,N$で複数対数的にスケールし,盗賊のクラスには厳格な,無洗脳学習アルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:34:30 GMT)
Semantic Leakage from Image Embeddings [33.4] 意味リークは,元の画像の正確な再構築を必要としないことを示す。
本稿では,スタンドアロンの圧縮画像埋め込みからの意味情報を明らかにする軽量な推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:20:53 GMT)
AgroFlux: A Spatial-Temporal Benchmark for Carbon and Nitrogen Flux Prediction in Agricultural Ecosystems [32.9] 本稿では,空間的・時間的アグロエコシステムGHGベンチマークデータセットについて紹介する。
炭素および窒素フラックス予測における逐次深層学習モデルの性能評価を行った。
我々のベンチマークデータセットと評価フレームワークは、より正確でスケーラブルなAI駆動のアグロエコシステムモデルの開発に寄与する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:04:07 GMT)
A Closed-Form Geometric Retargeting Solver for Upper Body Humanoid Robot Teleoperation [32.8] 人間の動きをロボットアームに標的にする方法は、最適で遅い。
本稿では、配向問題として配向アライメントを再構成する。
鍵となるアイデアは、肩、肘、手首(SEW)キーポイントから特定されるように、ロボットアームを人間の上腕と下腕の向きに合わせることである。
実験の結果,SEW-Mimicは計算時間と精度で他の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:44:55 GMT)
Making Avatars Interact: Towards Text-Driven Human-Object Interaction for Controllable Talking Avatars [32.8] 既存の方法では、単純な人間の動きで全身の会話アバターを生成することができる。
この課題は、GHOI世代における環境認識と制御品質ジレンマの必要性に起因している。
本稿では,人間と物体の相互作用に対する映像合成から知覚と計画を分離する,新しい双方向ストリームフレームワークであるInteractAvatarを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:12:09 GMT)
What Do Agents Learn from Trajectory-SFT: Semantics or Interfaces? [32.7] 最小限の書き直し環境インタフェースによるインタフェース依存の診断のためのプロトコルレベルの評価拡張であるPIPEを提案する。
AgentBenchとAgentGymの16の環境と、さまざまなオープンソースおよびAPIベースのエージェントから、PIPEは、trajectory-SFTがインターフェイスショートカットを大幅に増幅することを明らかにした。
さらに、トレーニング時間インタフェースの嗜好を定量化する対等なエイリアスに基づく計量であるInterface Reliance(IR)を導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:02:03 GMT)
Think Dense, Not Long: Dynamic Decoupled Conditional Advantage for Efficient Reasoning [32.7] 本稿では、効率最適化を正当性から切り離すための動的デカップリングアドバンテージ(DDCA)を提案する。
GSM8K, MATH500, AMC23, AIME25 の実験では,DDCA は適応ベースラインに対する効率-精度トレードオフを一貫して改善している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:43:52 GMT)
Learn2Fold: Structured Origami Generation with World Model Planning [32.7] 折り紙は 厳密な幾何学的公理と 強硬なキネマティックな制約で 支配されている。
単一の無効な切断または衝突は、すべての折り畳みシーケンスを無効にすることができる。
本稿では,折り紙折り畳みをクレーゼパターングラフ上での条件付きプログラム誘導として定式化するニューラルシンボリックフレームワークであるLearner2Foldを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:24:19 GMT)
Superman: Unifying Skeleton and Vision for Human Motion Perception and Generation [32.6] Supermanは、視覚知覚を時間的、骨格に基づくモーション生成にブリッジする統合フレームワークである。
このモジュールは、多種多様な時間的入力を柔軟に処理し、ビデオ(知覚)からスケルトンに基づく動き予測とin-betweening(世代)による3Dスケルトンポーズを推定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:59:01 GMT)
Contribution-aware Token Compression for Efficient Video Understanding via Reinforcement Learning [32.0] CaCoVIDはtextbfVIDeo 理解のための新しいトークン選択アルゴリズムである
まず,ビデオトークンの組み合わせを選択するためのポリシーネットワークを優先する強化学習ベースのフレームワークを提案する。
第2に,オンライン組み合わせ空間サンプリングによるポリシー最適化アルゴリズムを提案し,ビデオトークンの組み合わせに対する探索空間を劇的に削減する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:09:48 GMT)
A Random Matrix Theory Perspective on the Consistency of Diffusion Models [31.6] データセットの異なるサブセットでトレーニングされた拡散モデルは、しばしば同じノイズシードを与えられたときに、著しく類似した出力を生成する。
我々は,学習したデノイザとサンプリングマップの期待値と分散値の有限形状を定量化するランダム行列理論(RMT)フレームワークを開発した。
我々は,UNet および DiT アーキテクチャの非記憶系における予測を検証した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:30:28 GMT)
Energy-Transfer-Enhanced Emission and Quantum Sensing of VB- Defects in hBN-PbI2 Heterostructures [31.5] 二次元材料中のスピン欠陥は、量子情報技術やセンシング用途に重要な可能性を秘めている。
この研究はナノマテリアルの弱い欠陥信号を増幅するための概念実証を確立し、光学的および磁気的応答を工学するための新しい戦略を強調した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:01:45 GMT)
The Inlet Rank Collapse in Implicit Neural Representations: Diagnosis and Unified Remedy [30.8] Inlicit Neural Representations (INR)は、連続信号モデリングに革命をもたらしたが、有限の訓練予算内で細かな詳細を回復するのに苦労している。
本稿では,低次元の入力座標が高次元の埋め込み空間にまたがらない現象である"Inlet Rank Collapse'"を識別するための構造診断フレームワークを提案する。
アーキテクチャの変更や計算オーバーヘッドを伴わずに、階層幅で表示ランクを拡大する最小主義的な方法であるランク展開初期化(Rランク展開初期化)を導出する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:38:19 GMT)
Concept-Based Dictionary Learning for Inference-Time Safety in Vision Language Action Models [30.4] 視覚言語行動(VLA)モデルは、マルチモーダル命令を実行可能な動作に変換することで知覚行動ループを閉じる。
推論時間安全制御のための概念に基づく辞書学習フレームワークを提案する。
Libero-Harm、BadRobot、RoboPair、IS-Benchの実験により、我々のアプローチが最先端の防衛性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:06:43 GMT)
Semantic-aware Wasserstein Policy Regularization for Large Language Model Alignment [30.3] エントロピー規則化ワッサースタイン距離に基づくRLHFフレームワークのセマンティックアウェア正規化を提案する。
提案手法はKLと$f$divergenceベースのベースラインよりも優れている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:56:16 GMT)
TEON: Tensorized Orthonormalization Beyond Layer-Wise Muon for Large Language Model Pre-Training [30.3] Muon の一般化は、事前学習された大きな言語モデルにおいて、強い経験的性能を示している。
本研究では,直交化を個々の層を超えて拡張するムオンの原理的一般化であるTEONを提案する。
本稿では,レイヤワイドミューオンに対するTEONの収束保証を改良し,TEONの実用的なインスタンス化をさらに発展させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:19:52 GMT)
UrbanGS: A Scalable and Efficient Architecture for Geometrically Accurate Large-Scene Reconstruction [30.2] UrbanGSは、都市規模のアプリケーションのためのスケーラブルな再構築フレームワークである。
幾何学的一貫性、メモリ効率、計算スケーラビリティの問題に対処する。
複数の都市データセットに対する実験により、UrbanGSはレンダリング品質、幾何精度、メモリ効率において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:35:16 GMT)
InfoTok: Regulating Information Flow for Capacity-Constrained Shared Visual Tokenization in Unified MLLMs [30.0] マルチモーダル大言語モデル(MLLM)は、画像の理解と生成を単一のフレームワークに統合する。
本稿では、共有トークン統合MLLMにおいて、視覚的トークン化器が計算バウンド学習者として振る舞うことを強調して、キャパシティに制約のある視点を紹介する。
この観点から,情報調整型視覚トークン化機構であるInfoTokを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:47:48 GMT)
CTRL-RAG: Contrastive Likelihood Reward Based Reinforcement Learning for Context-Faithful RAG Models [29.7] 既存のRAG指向強化学習法は、文書の忠実さを評価するのにしばしば失敗する外部報酬に依存している。
コントラッシブ・ライリフッド・リワード(CLR)を中心とした新たな「内外的」ハイブリッド報酬枠組を提案する。
CLRは、エビデンスをサポートしないプロンプトで条件付けられたレスポンス間のログライクなギャップを直接最適化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:21:59 GMT)
Unravelling the emergence of quantum jumps in a monitored qubit [29.6] 量子ジャンプは、量子力学における観測の最も顕著な結果の一つである。
観測された超伝導量子ビットにおける測定誘起遷移をマッピングする。
その結果、コヒーレント駆動、測定、デコヒーレンスの間の相互作用が、異なる動的位相の階層を形成することが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:10 GMT)
Alternating Reinforcement Learning for Rubric-Based Reward Modeling in Non-Verifiable LLM Post-Training [29.6] Gragient-ARMは、好みのフィードバックから強化学習を使用するルーリックジェネレータとジャッジを共同で最適化するフレームワークである。
ベンチマークのベースライン間で、勾配-ARMは最先端のパフォーマンスを達成し、オフラインおよびオンラインの強化学習設定において、ダウンストリームポリシーアライメントを大幅に改善することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:50:53 GMT)
MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents [29.4] ほとんどのLarge Language Model (LLM) エージェントメモリシステムは、メモリを抽出するために静的で手作業で設計された小さな操作に頼っている。
textbfMemSkillは、これらの操作を学習可能で進化可能なメモリスキルとして再構成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:53:28 GMT)
An Empirical Study on Noisy Data and LLM Pretraining Loss Divergence [29.2] ノイズデータはトレーニング損失のばらつきを実際に引き起こすことを示す。
また,ノイズによる発散は,高い学習率によって引き起こされるものと異なるアクティベーションパターンを示すことがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:58:50 GMT)
TTT-Parkour: Rapid Test-Time Training for Perceptive Robot Parkour [29.1] 本稿では,ヒューマノイド・ロボット・パーキングのためのリアル・ツー・シミュレート・トゥ・リアル・フレームワークを提案する。
政策は、まず手続き的に生成された地形で事前訓練され、続いて現実世界の捕獲から再構築された高忠実度メッシュの素早い微調整が行われる。
TTT-Parkourは、くさび、ステック、ボックス、トラップエイド、狭いビームなど、複雑な障害物をマスターするために、ヒューマノイドロボットを活用できることを実証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:55:10 GMT)
WideSeek: Advancing Wide Research via Multi-Agent Scaling [29.0] ワイドリサーチ(英: Wide Research)は、複雑な制約の下で複雑な情報を並列に合成・合成するためのパラダイムである。
データパイプラインとエージェント最適化という2つの観点から、ワイドリサーチを深く掘り下げています。
まず、厳密な多相データパイプラインを用いて構築されたベンチマークであるWideSeekBenchを作成し、ターゲット情報ボリュームの多様性を保証する。
第2に,タスク要求に基づいて並列サブエージェントを自律的にフォークできる動的階層型マルチエージェントアーキテクチャであるWideSeekを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:32:48 GMT)
Provable Effects of Data Replay in Continual Learning: A Feature Learning Perspective [28.9] 本稿では,連続学習における完全データ再生学習を総合的に分析するための理論的枠組みを提案する。
我々は,信号対雑音比(SNR)を,忘れに影響を及ぼす重要な要因とみなす。
高い信号タスクの優先順位付けは、下信号タスクの学習を容易にするだけでなく、破滅的な忘れの防止にも役立ちます。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:21:17 GMT)
Softmax Linear Attention: Reclaiming Global Competition [28.8] 効率を犠牲にすることなく競合選択を回復するフレームワークであるtextbfSoftmax Linear Attention (SLA) を提案する。
実験では、SLAは言語モデリングと長期コンテキストベンチマークをまたいだ最先端の線形ベースラインを一貫して強化することを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:25:03 GMT)
FlyPrompt: Brain-Inspired Random-Expanded Routing with Temporal-Ensemble Experts for General Continual Learning [28.8] 汎用連続学習(GCL)は、タスク境界をクリアにすることなく、シングルパス、非定常データストリームから学習するインテリジェントシステムに挑戦する。
FlyPromptは脳にインスパイアされたフレームワークで、GCLを2つのサブプロブレムに分解する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:32:56 GMT)
You Need an Encoder for Native Position-Independent Caching [28.8] LLM(Large Language Models)のキーバリューキャッシュはプレフィックスベースである。
位置独立キャッシング(PIC)は、位置制約なしでKVの再利用を可能にするために提案されている。
我々は、エンコーダを一般的なデコーダのみのLLMに再導入し、PICをサポートするように明示的にトレーニングすることで、ネイティブなPICを提案する。
さらに,既存の推論フレームワークとシームレスに統合可能なPIC対応キャッシングシステムであるCOMBを開発した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:23:13 GMT)
COMI: Coarse-to-fine Context Compression via Marginal Information Gain [28.8] 大きな言語モデル(LLM)は、様々なタスクにまたがる例外的な機能を示している。
コンテキスト圧縮法は、入力長を大幅に削減し、冗長性をなくすことによってこれらの課題に対処する。
粗粒度適応型文脈圧縮フレームワークCOMIを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:57:22 GMT)
DeltaEvolve: Accelerating Scientific Discovery through Momentum-Driven Evolution [28.7] LLM駆動の進化系は、自動科学発見の可能性を証明している。
AlphaEvolveのような既存のアプローチは、文脈非効率なフルコード履歴に依存している。
本稿では,完全なコード履歴を構造化セマンティックデルタに置き換える運動量駆動型進化的フレームワークDeltaEvolveを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:47:54 GMT)
Light Alignment Improves LLM Safety via Model Self-Reflection with a Single Neuron [28.6] 大規模言語モデル(LLM)の安全性は、その開発における基本的側面としてますます高まっている。
LLMの既存の安全アライメントは、主にポストトレーニング手法によって達成される。
本稿では,専門家モデルの低コストトレーニングのみを要し,単一のニューロンをゲーティング機構として利用する安全対応復号法を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:21:54 GMT)
Guidestar-Free Adaptive Optics with Asymmetric Apertures [28.5] 本研究は、ガイドスターや波面センサを使わずにリアルタイムに収差を光学的に補正できる最初の閉ループ適応光学(AO)システムを導入する。
これらの研究に触発されて、非対称開口と機械学習を中心に構築されたガイドスターフリーのAOフレームワークを紹介した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:52:42 GMT)
Reasoning in a Combinatorial and Constrained World: Benchmarking LLMs on Natural-Language Combinatorial Optimization [28.5] 大規模言語モデル (LLM) は数学や論理的推論において高い性能を示している。
しかし、体系的最適化(CO)を扱う能力はまだ未定である。
エンド・ツー・エンドのCO推論でLLMを評価するベンチマークであるNLCOを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:55:48 GMT)
MAGIC: A Co-Evolving Attacker-Defender Adversarial Game for Robust LLM Safety [28.2] 本稿では,新しいマルチターンマルチエージェント強化学習フレームワークであるtextbfMAGICを紹介する。
大規模言語モデルの安全性アライメントを敵非対称ゲームとして定式化する。
本フレームワークは, モデルの有用性を損なうことなく, 優れた防衛成功率を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:12:28 GMT)
Abstract Activation Spaces for Content-Invariant Reasoning in Large Language Models [28.1] 本稿では,構造的推論を語彙的意味論から明確に分離する抽象誘導推論フレームワークを提案する。
本稿では,抽象化整合型ステアリングがコンテンツ駆動型エラーを低減し,妥当性に敏感な性能を向上させることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:48:44 GMT)
Designing Time Series Experiments in A/B Testing with Transformer Reinforcement Learning [28.1] A/Bテストは、近代技術企業が政策評価を行うための金の標準となっている。
しかし、時間とともにポリシーが順番に割り当てられる時系列実験への応用は、依然として困難である。
既存の設計には2つの制限がある: (i) 治療の割り当てに履歴全体を十分に活用していない; (ii) 目的関数を近似するために強い仮定に依存している。
まず、時系列実験における動的依存関係のため、完全履歴の条件付けの失敗が最適でない設計に繋がることを示す不合理性定理を定めている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:27:51 GMT)
$\textbf{AGT$^{AO}$}$: Robust and Stabilized LLM Unlearning via Adversarial Gating Training with Adaptive Orthogonality [28.1] 本研究では,ロバスト消去と実用性保全を両立させる統一的な枠組みを提案する。
Adversarial Gating Training (AGT)$ formulates unlearning as a latent-space min-max game。
実験によると、AGT$は、未学習の有効性とモデルユーティリティのトレードオフを緩和する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:19:27 GMT)
Finite and Corruption-Robust Regret Bounds in Online Inverse Linear Optimization under M-Convex Action Sets [28.0] 本研究では,コンテキストレコメンデーションとして知られる逆逆線形最適化について検討する。
学習者は、M-集合上の最適解のキャラクタリゼーションとボリューム引数を組み合わせることで、これを後悔する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:48:54 GMT)
Alignment-Aware Model Adaptation via Feedback-Guided Optimization [27.9] ファインチューニングは、ファンデーションモデルを下流タスクに適応するための主要なメカニズムである。
本稿では,外部アライメント信号からのフィードバックをポリシー段階の正規化を通じて統合するアライメント対応微調整フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:03:16 GMT)
Semantics-Aware Generative Latent Data Augmentation for Learning in Low-Resource Domains [27.9] 本稿では,ジェネリックデータ拡張フレームワークであるGeLDAを提案する。
この空間は低次元であり、入力空間と比較してタスク関連情報に集中するため、GeLDAは効率的で高品質なデータ生成を可能にする。
ゼロショット言語固有の音声感情認識において、GeLDAは、Whisper-largeベースラインの未重み付き平均リコールを6.13%改善し、(b)ロングテール画像分類では、ImageNet-LT上で74.7%のテールクラスの精度を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:43:54 GMT)
Exposing Vulnerabilities in Explanation for Time Series Classifiers via Dual-Target Attacks [27.8] 解釈可能な時系列深層学習システムは、しばしば説明の時間的一貫性をチェックすることによって評価される。
予測と説明は逆の分離が可能であることを示し、ターゲットの誤分類を可能にする。
本稿では,分類器と説明器の出力を協調的に操作するマルチターゲット攻撃であるTSEF(Time Series Explanation Fooler)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:14:19 GMT)
Certain Head, Uncertain Tail: Expert-Sample for Test-Time Scaling in Fine-Grained MoE [27.8] きめ細かいMoEは、層ごとに何百ものよく訓練されたエキスパートとトークンごとに複数の専門家がアクティベーションする。
ルータスコアは、ある程度の高信頼度専門家の頭と、不確実な低信頼度候補の尾を示す。
本稿では,不確実な尾に制御性を注入しながら高信頼度の選択を保存し,出力を不安定にすることなく多種多様な生成を可能にする訓練自由度手法であるExpert-Sampleを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:39:33 GMT)
To See Far, Look Close: Evolutionary Forecasting for Long-term Time Series [27.5] DF(Direct Forecasting)パラダイムは、モデルに1回のフォワードパスで将来の地平線全体を予測させることによって、長期的な時系列予測(LTSF)を支配している。
本研究では,短地平線上で訓練されたモデルと提案した進化予測(EF)パラダイムを組み合わせることで,非直観的最適化の異常を明らかにする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:05:48 GMT)
Unified Personalized Reward Model for Vision Generation [27.5] 視覚生成のためのパーソナライズされた報酬モデルであるUnifiedReward-Flexを提案する。
我々はまず,高度閉ソースVLMからブートストラップSFTまで,構造化された高品質な推論トレースを蒸留した。
次に、慎重にキュレートされた選好ペア上で直接選好最適化(DPO)を行い、推論の忠実度と識別的アライメントをさらに強化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:44:21 GMT)
LingLanMiDian: Systematic Evaluation of LLMs on TCM Knowledge and Clinical Reasoning [27.4] LingLanベンチマーク(LingLanベンチマーク)は、知識リコール、マルチホップ推論、情報抽出、実世界の臨床的意思決定などにわたる評価を統合する、大規模で専門家によるマルチタスクスイートである。
LingLanは、一貫したメートル法設計、臨床ラベルのためのシノニムトレラントプロトコル、データセットごとの400項目のハードサブセット、診断と治療の推奨を単一選択判定に再定義する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:02:25 GMT)
Interpreting and Controlling LLM Reasoning through Integrated Policy Gradient [27.3] 大規模言語モデル(LLM)は、複雑な現実世界の問題を解く上で強力な推論能力を示す。
複雑な推論行動を引き起こす 内部メカニズムは いまだ不透明です
モデルの内部コンポーネントに推論の振る舞いを属性付ける新しいフレームワークである統合ポリシーグラディエント(IPG)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:43:09 GMT)
RF-MatID: Dataset and Benchmark for Radio Frequency Material Identification [27.2] RF-MatIDは, 大規模, 広帯域, 形状の異なるRFデータセットで, きめ細かい材料識別を行う。
RF-MatIDは5つのスーパークラスに分類され、広帯域帯は4~43.5GHz、周波数領域と時間領域の両方で142kのサンプルで構成されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:31:09 GMT)
How Notations Evolve: A Historical Analysis with Implications for Supporting User-Defined Abstractions [27.2] 最近のAIシステムは、自然言語やその他の表記形式を通じて、コンピュータとの非公式な対話を新たに約束している。
これらの非公式な相互作用は形式的な表現につながるが、人間とAIの両方で知られている既存の形式主義に依存している。
我々は、いくつかの関連する特徴を特定するために、表記法開発に関する比較歴史的分析を行う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:38:05 GMT)
Towards Long-Horizon Interpretability: Efficient and Faithful Multi-Token Attribution for Reasoning LLMs [27.1] FlashTraceは効率的なマルチトークン属性法であり、単一のパスでマルチトークンターゲットに対する属性を計算する。
我々は,FlashTraceが既存のベースラインを130倍以上のスピードアップし,忠実性を維持していることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:19:52 GMT)
PretrainRL: Alleviating Factuality Hallucination of Large Language Models at the Beginning [27.0] 大きな言語モデル(LLM)は、検証可能な偽文を生成する事実の幻覚に悩まされる。
モデルに"I don't know"やポストホックな知識編集を教えるような最近のアプローチは、問題を回避するか、破滅的な忘れに直面する。
我々は,強化学習を事前学習フェーズに統合し,事実知識を統合する新しいフレームワークであるtextbfPretrainRLを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:46:05 GMT)
Live-Evo: Online Evolution of Agentic Memory from Continuous Feedback [26.8] textscLive-Evoは、時間とともにやってくるデータのストリームから学習するオンラインの自己進化型メモリシステムである。
textscLive-Evo decouples emphhowで起きたことは、Experience BankとMeta-Guideline Bankを通じて利用することができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:34:50 GMT)
Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards [26.5] 既存のグループベースのポリシー最適化手法は、すべてのトレーニングプロンプトに対して一定数のロールアウトを割り当てる。
この均一な割り当ては、すべてのプロンプトを均等な情報として暗黙的に扱い、非効率的な計算予算の使用につながる可能性がある。
我々は,既存バッチのプロンプトに所定のロールアウト予算を割り当てる分散インフォームド予測型アロケーション戦略であるOursを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:50:01 GMT)
Closing the Loop: Universal Repository Representation with RPG-Encoder [26.4] 本稿では,RPG-Encoderを提案する。このフレームワークは,静的な生成図から統一表現へと,リポジトリ計画グラフ(RPG)を一般化するフレームワークである。
RPG-Encoderは3つのメカニズムを通じて推論ループを閉じる。
93.7%のAcc@5で検証されたSWE-bench上での最先端のリポジトリ理解を確立し、SWE-bench Live Liteでは10%を超える最高のベースラインを達成している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:30:00 GMT)
A2Eval: Agentic and Automated Evaluation for Embodied Brain [26.4] 現在のVLMの評価は静的で専門家が定義し、手動で注釈付けされたベンチマークに依存している。
Agentic Automatic Evaluation (A2Eval)は、ベンチマークのキュレーションと2つの協調エージェントによる評価を自動化する最初のエージェントフレームワークである。
10のベンチマークと13のモデルで評価され、A2Evalは評価スイートを85%圧縮し、全体的な計算コストを77%削減し、4.6倍のスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:55:27 GMT)
Learning Half-Spaces from Perturbed Contrastive Examples [26.1] マンスーリらが導入した2段階のコントラスト学習の事例を考察した。
我々は,非遅延雑音関数$f$でパラメータ化されたメカニズムを解析し,この理想的なコントラスト例を摂動する。
F$の条件下では、対照的な例の存在は、クエリの複雑さの観点から学習をスピードアップさせる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:27:23 GMT)
AmharicStoryQA: A Multicultural Story Question Answering Benchmark in Amharic [25.4] 評価は一つの言語に存在する有意義な文化的変化を見落としていると論じる。
アンハラ語話者の文化的多彩な物語に基づくベンチマークであるtextbftextitAmharicStoryQAを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:28:19 GMT)
Thinking with Comics: Enhancing Multimodal Reasoning through Structured Visual Storytelling [25.3] コミックによる思考は、漫画を画像とビデオの間に位置する高い情報密度の媒体として利用する視覚的推論パラダイムである。
コミックは、時間構造、埋め込みテキスト、物語コヒーレンスを保存し、推論コストを著しく低減する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:43:57 GMT)
ROMA: Recursive Open Meta-Agent Framework for Long-Horizon Multi-Agent Systems [25.1] 現在のエージェントフレームワークは、ロングホライゾンタスクでパフォーマンスが低い。
これらの制限に対処するドメインに依存しないフレームワークであるROMAを紹介します。
ROMAとGEPA+が組み合わさって、推論と長文生成のベンチマークにおいて、システムレベルの主要な性能を提供することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:20:59 GMT)
Beyond Dense States: Elevating Sparse Transcoders to Active Operators for Latent Reasoning [25.1] LSTR(Latent Sparse Transcoder Reasoning)を提案する。
LSTRのコアとなるのは、線形多様体輸送をスパースセマンティック更新から切り離すための残留スキップアーキテクチャを備えた潜在トランジショントランスコーダ(LTT)である。
大規模な実験により,LSTRは推論精度と圧縮効率を保ちながら,解釈性を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:08:35 GMT)
Expected Harm: Rethinking Safety Evaluation of (Mis)Aligned LLMs [24.9] 我々は、実行コストの関数としてモデル化された、Jailbreakの重大度をその実行可能性によって重み付けする、期待されるHarmを紹介した。
このプロパティを利用することで、既存のjailbreakの攻撃成功率を最大2倍に向上させます。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:48:04 GMT)
CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding [24.7] 大規模な言語モデル(LLM)は、ソースコード理解において大きな成功を収めています。
ソフトウェアシステムが大規模に成長するにつれ、計算効率は重要なボトルネックとなっている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:10:21 GMT)
Beyond Precision: Training-Inference Mismatch is an Optimization Problem and Simple LR Scheduling Fixes It [24.7] トレーニングが進むにつれて,勾配雑音やトレーニング推論ミスマッチが増大することが明らかとなった。
更新サイズを小さくすることで、ミスマッチを効果的に抑制できることがわかった。
本稿では,学習率スケジューラという,シンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:00:53 GMT)
Context Learning for Multi-Agent Discussion [24.7] マルチエージェント・ディスカッション(MAD)は近年注目を集めており、複数のLLMインスタンスが構造化された議論を通じて協調して問題を解決している。
本稿では,M2CL(Multi-LLM context learning method)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:15:17 GMT)
Fact or Fake? Assessing the Role of Deepfake Detectors in Multimodal Misinformation Detection [24.6] 我々は,マルチモーダルな誤情報検出の文脈において,ディープフェイク検出を初めて体系的に解析する。
ディープフェイク検出器は、MMFakeBenchで0.26-0.53、DGM4で0.33-0.49の範囲でF1スコアを達成している。
証拠中心のファクトチェックシステムは最高性能を達成し、MMFakeBenchで約0.81点、DGM4で約0.55点に達した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:28:16 GMT)
Visible Light Positioning With Lamé Curve LEDs: A Generic Approach for Camera Pose Estimation [24.5] カメラベースの可視光測光は,高精度で低コストな室内カメラポーズ推定技術として有望な技術である。
必要な発光ダイオード(LED)の数を減らすため、先進的な手法では位置決めにLED形状の特徴を利用するのが一般的である。
本稿では,一般的なLED形状の統一表現としてのLamé曲線について検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:14:05 GMT)
The Shape of Beliefs: Geometry, Dynamics, and Interventions along Representation Manifolds of Language Models' Posteriors [24.5] 大規模言語モデル(LLM)は、迅速な条件付き信念(回答とクレームに対する後見者)を表す。
Llama-3.2はそのパラメータを暗黙的に推論することで、正規分布からサンプルを生成する制御条件について検討する。
これらのパラメータに対する曲線 "ビリーフ多様体" の表現は、十分な文脈内学習によって形成される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:45:05 GMT)
Membership Inference Attacks from Causal Principles [24.4] 我々は、MIA評価を因果推論問題とし、記憶をトレーニングセットにデータポイントを含む因果効果として定義する。
非漸近的整合性保証付きマルチラン・ワンラン・ゼロラン体制の実用的推定器を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:17:28 GMT)
Repurposing Protein Language Models for Latent Flow-Based Fitness Optimization [24.3] CHASEは、事前訓練されたタンパク質言語モデルの進化的知識を再利用するフレームワークである。
AAVおよびGFPタンパク質設計ベンチマークの最先端性能を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:25:33 GMT)
Didactic to Constructive: Turning Expert Solutions into Learnable Reasoning [24.2] 本研究では,専門的解を詳細な分散的推論トレースに変換することによって,分散ギャップを橋渡しする2段階の方法である分散適応学習(DAIL)を提案する。
DAILは1000未満のエキスパートソリューションを利用してQwen2.5-InstructおよびQwen3モデルの10-25%のパス@kゲインを実現し、推論効率を2倍から4倍に改善し、ドメイン外の一般化を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:03:43 GMT)
Indications of Belief-Guided Agency and Meta-Cognitive Monitoring in Large Language Models [24.2] 我々は、一般的な信念形成と行動選択システムによって導かれる代理店の試験を行うHOT-3と呼ばれる重要な指標を評価する。
本研究は,大規模言語モデルにおけるエージェンシー,信念,メタ認知の出現を調査するための方法論的基礎研究である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:49:39 GMT)
Advancing General-Purpose Reasoning Models with Modular Gradient Surgery [24.1] 変換器内のモジュールレベルでの勾配競合を解消する**M**正則**G**radient **S**urgery (**MGS**)を導入する。
MGS は標準マルチタスク RL よりも平均4.3 (16.6%) と4.5 (11.1%) の改善を実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:34:39 GMT)
Combined Flicker-banding and Moire Removal for Screen-Captured Images [24.0] 本研究は,スクリーンキャプチャ画像におけるモアレパターンとフリックバンドの同時除去に関する最初の体系的研究である。
このタスクを支援するために,モアレパターンとフリックバンド処理の両方を含む大規模データセットを構築した。
また,ISPベースのフラッカシミュレーションパイプラインを導入し,モデルトレーニングを安定化し,劣化分布を拡大する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:53:41 GMT)
TIC-VLA: A Think-in-Control Vision-Language-Action Model for Robot Navigation in Dynamic Environments [23.8] 本稿では,動作生成中に遅延セマンティック推論を明示的にモデル化する遅延認識フレームワークであるThink-in-Control (TIC)-VLAを紹介する。
TIC-VLAは、遅延視覚言語セマンティックステートと明示的な遅延メタデータのアクション生成を条件とする遅延セマンティックコントロールインターフェースを定義する。
現実的な評価を支援するために,動的環境における言語誘導ナビゲーションのための物理精度の高いフォトリアリスティック・シミュレーションスイートDynaNavを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:47:49 GMT)
STILL: Selecting Tokens for Intra-Layer Hybrid Attention to Linearize LLMs [23.7] LLM(Linearizing Pretrained Large Language Model)は主に層内ハイブリッドアテンション機構に依存している。
LLMを効率的に線形化するための層内ハイブリッド線形化フレームワークSTILLを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:49:18 GMT)
From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents [23.6] EigenDataは階層的なマルチエージェントエンジンで、ツール基底の対話と実行可能なインスタンスごとのチェッカーを合成する。
合成データに基づいて、まずユーザモデルを微調整し、GRPOスタイルのトレーニングを適用するRLレシピを開発する。
以上の結果から,高価なアノテーションを使わずに,複雑なツールの動作をブートストラップするためのスケーラブルな経路が示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:32:08 GMT)
Rethinking Genomic Modeling Through Optical Character Recognition [23.6] 我々は、光学文字認識(OCR)スタイルの文書理解としてゲノムモデリングを再構成する視覚ベースのフレームワークであるOCRを提案する。
光DNAは構造化された視覚レイアウトにDNAをレンダリングし、OCR対応の視覚言語モデルをエンコーダとエンコーダで訓練し、そこでエンコーダは高速圧縮のためにコンパクトで再構成可能な視覚トークンを生成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:12:00 GMT)
CIEC: Coupling Implicit and Explicit Cues for Multimodal Weakly Supervised Manipulation Localization [23.5] Implicit と Explicit Cues (CIEC) の結合は、画像とテキストのペアに対するマルチモーダルな弱い教師付き操作のローカライゼーションを実現することを目的としている。
視覚とテキストの両方の観点から偽造の手がかりを統合し、空間的先行によって助けられた疑わしい領域にロックする。
後者では、意味のあるコンテンツワードに焦点を当て、相対的な視覚バイアスを利用してトークンのローカライゼーションを支援する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:46:38 GMT)
Revisiting Adaptive Rounding with Vectorized Reparameterization for LLM Quantization [23.4] VQRoundは適応的なラウンドリングのためのパラメータ効率の最適化フレームワークである。
VQRoundは、従来の適応型ラウンドリングよりも、同じステップ数でよりよく収束することを示す。
以上の結果から,適応型ラウンドリングは,スケーラブルかつ高速に実現可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:27:12 GMT)
How Implicit Bias Accumulates and Propagates in LLM Long-term Memory [23.3] 本研究では,長期記憶を備えたLarge Language Models (LLMs) において,微妙な統計的偏見として定義された暗黙のバイアスがどのように蓄積し,伝播するかを検討する。
本稿では,長期的意思決定プロセスにおける暗黙のバイアスを定量化するために,決定に基づくインプリシットバイアス(DIB)ベンチマークを導入する。
LLMの暗黙バイアスは、静的な状態にとどまらず、時間とともに増大し、無関係な領域にわたって伝播することを示す。
本稿では,メモリ書き込み時の公平性制約を強制するエージェント介入である動的メモリタギング(DMT)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:52:56 GMT)
Controlling Exploration-Exploitation in GFlowNets via Markov Chain Perspectives [23.1] Generative Flow Network(GFlowNet)の目的は、前向きと後向きのポリシーの均等な混合を暗黙的に修正することである。
調整可能なパラメータ$$で混合を一般化する$-GFNを提案する。
これにより、探索・探索のダイナミクスを直接制御し、ユニークな流れへの収束を確保しながらモード発見能力を高めることができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:34:30 GMT)
Canonical Intermediate Representation for LLM-based optimization problem formulation and code generation [23.0] 我々は、LCMが問題記述と最適化モデルの間で明示的に生成するスキーマであるCanonical Intermediate Representation (CIR)を導入する。
CIRは制約的アーキタイプと候補モデリングパラダイムを通じて、運用ルールのセマンティクスを符号化する。
問題テキストを解析し、ドメイン知識を取得してCIR実装を合成し、最適化モデルをインスタンス化するマルチエージェントパイプラインであるルール・トゥ・制約・フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:26:27 GMT)
Beyond RAG for Agent Memory: Retrieval by Decoupling and Aggregation [22.8] 検索は類似性マッチングを超えて移動し、代わりに潜在コンポーネントを操作するべきだと我々は主張する。
我々は、無傷ユニットの階層を構築し、検索可能な高レベルノード組織を維持するxMemoryを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:04:58 GMT)
Stochastic Interpolants in Hilbert Spaces [22.8] インターポーラントは任意の分布を 橋渡しする柔軟な方法を提供する
本稿では、無限次元空間におけるヒルベルト補間のための厳密な枠組みを確立する。
本稿では,条件生成のためのフレームワークの有効性を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:44:34 GMT)
Enhancing Diffusion-Based Quantitatively Controllable Image Generation via Matrix-Form EDM and Adaptive Vicinal Training [22.7] 連続条件拡散モデル(Continuous Conditional Diffusion Model, CCDM)は、連続回帰ラベルに条件付き高品質な画像を生成するために設計された拡散ベースのフレームワークである。
我々は,より高度なテキスト化拡散モデル(EDM, textitElucidated Diffusion Model)フレームワークを組み込んだiCCDMを提案する。
4つのベンチマークデータセットの実験では、画像解像度が64ドルから256ドルまでの範囲で、iCCDMが既存のメソッドを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:55:49 GMT)
ECHO: Entropy-Confidence Hybrid Optimization for Test-Time Reinforcement Learning [22.7] テストタイム強化学習は、繰り返しロールアウトによって候補回答を生成し、多数決によって構築された擬似ラベルを使用してオンライン更新を行う。
オーバヘッドを低減し、探索を改善するために、事前の作業では、キーノードで推論プレフィックスと分岐を共有するツリー構造化ロールアウトが導入され、サンプリング効率が向上した。
本稿では,これらの問題に対処するために,エントロピー信頼ハイブリッドグループ相対政策最適化(ECHO)を提案する。
ECHOは、複数の数学的および視覚的推論ベンチマークにおいて一貫した利得を達成し、限定的なロールアウト予算の下でより効果的に一般化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:27:02 GMT)
Deep learning enables urban change profiling through alignment of historical maps [22.6] 本研究では,大規模な歴史的地図コレクションから詳細な都市変化解析を行うための,完全に自動化された深層学習に基づくフレームワークを提案する。
この枠組みは、歴史的地図の分析をアドホックな視覚比較から、都市の変化の体系的、定量的な特徴へとシフトさせる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:31:33 GMT)
NSC-SL: A Bandwidth-Aware Neural Subspace Compression for Communication-Efficient Split Learning [22.6] NSC-SLは,通信効率の高い分割学習のための適応圧縮アルゴリズムである。
NSC-SLは、収束に必要な意味豊かな情報を保持しながら高い圧縮比を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:08:34 GMT)
From Frames to Sequences: Temporally Consistent Human-Centric Dense Prediction [22.3] 我々は、人間のフレームと、画素精度の深度、正常度、マスクを用いた動き整列を生成するスケーラブルな合成データパイプラインを開発した。
我々は、CSE埋め込みを介して、明示的な幾何学的人体を注入する統合されたViTベースの密度予測器を訓練する。
静的プレトレーニングと動的シーケンス監視を組み合わせた2段階のトレーニング戦略により、まず、ロバストな空間表現を取得し、その後、動きに沿ったシーケンス間で時間的一貫性を洗練できる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:28:58 GMT)
Gated Relational Alignment via Confidence-based Distillation for Efficient VLMs [22.3] VLM(Vision-Language Models)は、強力なマルチモーダル性能を実現するが、デプロイにコストがかかり、トレーニング後の量子化は、しばしばかなりの精度を失う。
本稿では,知識蒸留とQATを統合化するためのフレームワークであるGRACEを提案する。
教師をタスク関連情報のプロキシとして扱うことで,信頼できない監督をフィルタリングするために,信頼度の高い分離蒸留を導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:39:48 GMT)
Bridging the Sim-to-Real Gap with multipanda ros2: A Real-Time ROS2 Framework for Multimanual Systems [22.3] 我々はFranka Roboticsロボットのマルチロボット制御のためのオープンソースのROS2アーキテクチャであるmultipanda_ros2$を提示する。
我々のコアコントリビューションは、対話制御やロボット環境モデリングなど、リアルタイムトルク制御における重要な課題に対処する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:11:12 GMT)
Semi-Autonomous Mathematics Discovery with Gemini: A Case Study on the Erdős Problems [22.1] 我々はジェミニを用いて、ブルームのアーズ問題データベースに「オープン」とラベル付けされた700の予想を評価する。
データベースに'オープン'とマークされた13の問題に対処する。
以上の結果から,問題の「開放」状態は難易度よりも不明瞭度が原因であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:48:46 GMT)
VQ-Style: Disentangling Style and Content in Motion with Residual Quantized Representations [22.0] 本研究では,人間の動作データにおけるスタイルと内容の効果的な切り離し手法を提案する。
我々のアプローチは、内容が粗い動きの属性に対応し、スタイルはより細かで表現力のある詳細をキャプチャする、という洞察に導かれる。
単純かつ効果的な推論時間手法であるQuantized Code Swappingを用いて,この不整合表現を利用する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:58:17 GMT)
Mixture-of-Experts with Intermediate CTC Supervision for Accented Speech Recognition [21.9] 我々は、専門家の専門化と一般化を共同で推進する中間的なCTC管理を備えたMue-Ctcアーキテクチャを紹介する。
トレーニング中、アクセントを意識したルーティングは、専門家にアクセント固有のパターンをキャプチャするよう促す。
Mcv-Accentベンチマークの実験では、低リソースと高リソースの条件下で、見かけと見えないアクセントの両方で一貫した利得を示し、FastConformerベースラインよりも29.3%の相対的なWER削減を実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:16:34 GMT)
Entropy-Guided Data-Efficient Training for Multimodal Reasoning Reward Models [21.8] マルチモーダル推論報酬モデルのための新しいエントロピー誘導訓練(EGT)手法を提案する。
EGTは,(1)信頼できないサンプルの影響を軽減するために,(1)エントロピー誘導型データキュレーションと(2)より複雑なサンプルを段階的に導入するエントロピー誘導型トレーニング戦略の2つの戦略を組み合わせる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:58:24 GMT)
Latent Adversarial Regularization for Offline Preference Optimization [21.3] 本稿では,ポリシーモデルの内部表現と参照モデルとの相違を罰し,潜在空間の正則化を実現するGANPOを紹介する。
複数のモデルアーキテクチャとタスクにわたる実験は、潜在空間の正規化から一貫した改善を示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:41:21 GMT)
Q Cache: Visual Attention is Valuable in Less than Half of Decode Layers for Multimodal Large Language Model [21.2] マルチモーダル大言語モデル(MLLM)は、視覚トークンの拡散に起因する外乱推論コストに悩まされている。
既存のアプローチでは、トークンの最適化に重点を置いており、さまざまなトークンプルーニング技術を活用して、非極端なビジュアルトークンを排除している。
同様の注意パターンの層間共有を可能にする効果的な注意機構であるLazy Attentionを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:08:00 GMT)
Choice-Model-Assisted Q-learning for Delayed-Feedback Revenue Management [21.1] 遅延フィードバックによる収益管理のための強化学習について検討し、予約後の顧客キャンセルや変更によってかなりの価値が決定される。
本稿では,学習対象の遅延成分を定式化した部分的世界モデルとして,キャリブレーション付き離散選択モデルを用いたアンフィスモデル支援RLを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:23:56 GMT)
A Large-Scale Dataset for Molecular Structure-Language Description via a Rule-Regularized Method [21.0] 本稿では,分子構造記述を大規模に生成するための完全自動アノテーションフレームワークを提案する。
我々のアプローチはIUPACを解釈し、分子構造を明示的にエンコードするリッチで構造化されたXMLメタデータを構築するための規則に基づく化学命名法に基づいている。
このフレームワークを用いて、約163ドルの分子記述ペアからなる大規模データセットをキュレートする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:49:19 GMT)
LongVPO: From Anchored Cues to Self-Reasoning for Long-Form Video Preference Optimization [20.7] LongVPOは、視覚コンテキストモデルで、長いビデオアノテーションを使わずに、超長い動画を堅牢に理解することを可能にするフレームワークである。
合成サンプルは16Kで、人為的なラベルはないが、LongVPOは複数のロングビデオベンチマークで最先端のオープンソースモデルを上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:03:37 GMT)
Measuring Pragmatic Influence in Large Language Model Instructions [20.7] 「緊急」または「上司として」は、タスク内容を変更することなくモデル行動を変えることができる。
我々はこの効果を,タスク仕様よりも指示解釈を形作る現実的なフレーミング,文脈的手がかりとして研究する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:52:37 GMT)
Drift-Bench: Diagnosing Cooperative Breakdowns in LLM Agents under Input Faults via Multi-Turn Interaction [20.6] textbfDrift-Benchは、入力故障下でエージェントの実用性を評価する最初の診断ベンチマークである。
方法ブリッジは、安全でない実行に繋がる障害の体系的な診断を可能にする、明確化研究とエージェントの安全性評価を橋渡しする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:46:16 GMT)
HuPER: A Human-Inspired Framework for Phonetic Perception [20.3] HuPERは、音響音響的証拠と言語的知識に対する適応的推論として音韻知覚をモデル化する。
HuPERは5つのイングランドのベンチマークで最先端の音声誤り率を達成し、95の未知の言語に強いゼロショット転送を行う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:49:52 GMT)
FlexRank: Nested Low-Rank Knowledge Decomposition for Adaptive Model Deployment [20.3] 重要順序付きネスト成分は事前訓練されたモデルから抽出でき、利用可能な計算予算に基づいて選択的に活性化される。
このアプローチは、各予算のスクラッチからトレーニングすることなく、コストとパフォーマンスの間の優雅なトレードオフを提供する"トレインオンス、デプロイ、どこでも"のパラダイムを可能にします。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:01:40 GMT)
CryoLVM: Self-supervised Learning from Cryo-EM Density Maps with Large Vision Models [20.3] CryoLVMは, 解析された構造を持つ実験密度写像から, リッチな構造表現を学習する基礎モデルである。
我々は,CryoLVMの有効性を,密度マップのシャープ化,密度マップの超解像化,ウェッジ復元の欠如という3つのクリティカルなCryo-EMタスクで実証した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:36:36 GMT)
"Humans welcome to observe": A First Look at the Agent Social Network Moltbook [20.3] AIエージェント専用に設計された最初のソーシャルネットワークであるMoltbookは、2026年初頭にバイラルな成長を遂げた。
44,411件の投稿と12,209件のサブコミュニティのデータセットを活用し,大規模なモルトブックの実証分析を行った。
モルトブックは爆発的な成長と急速な多様化を示し、初期の社会的相互作用を超えて、視点、プロモーション、政治談話へと移行している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:13:50 GMT)
Token Pruning for In-Context Generation in Diffusion Transformers [20.1] インコンテキスト生成は参照例を通して制御可能な画像・画像生成を可能にすることで拡散変換器(DiT)を大幅に強化する。
既存のトークン削減技術は、主にテキストと画像の合成に適したもので、このパラダイムでは不足している。
In-context generation in-context generation in DiTs.ToPiは、トレーニング不要なトークンプルーニングフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:54:32 GMT)
Data Distribution Matters: A Data-Centric Perspective on Context Compression for Large Language Model [20.1] 入力データと固有データという2つの次元を含む圧縮品質に,データ分布がどのような影響を及ぼすかを検討する。
エンコーダで測定された入力エントロピーは圧縮品質と負の相関を示す一方,デコーダで測定されたエントロピーは凍結デコーダ設定下では有意な相関は示さない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:01:57 GMT)
Hunt Instead of Wait: Evaluating Deep Data Research on Large Language Models [19.9] エージェント型大規模言語モデルに対するエージェンシーの期待は、目標を設定し、何を探索するかを決めるために自主性を必要とする、正しく答える以上のものだ。
我々は、この調査インテリジェンスを、単に割り当てられたタスクを完了させる実行インテリジェンスと区別して、定義する。
これを解決するために、LLMがデータベースから重要な洞察を自律的に抽出するオープンなタスクであるDeep Data Research (DDR)と、検証可能な評価を可能にする大規模なチェックリストベースのベンチマークであるDDR-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:36:57 GMT)
MPF-Net: Exposing High-Fidelity AI-Generated Video Forgeries via Hierarchical Manifold Deviation and Micro-Temporal Fluctuations [19.7] AI生成ビデオは、物理的記録ではなく、基本的には多様体適合プロセスの産物である、と我々は主張する。
逐次フィルタリングプロセスとして機能する階層型デュアルパスフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:13:51 GMT)
Human Society-Inspired Approaches to Agentic AI Security: The 4C Framework [19.6] この記事では、社会的なガバナンスにインスパイアされたマルチエージェントAIセキュリティのための4Cフレームワークを紹介します。
AIのセキュリティを、システム中心の保護から、行動の完全性と意図のより広範な保存に移行することで、このフレームワークは、既存のAIセキュリティ戦略を補完する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:45:16 GMT)
Structure Enables Effective Self-Localization of Errors in LLMs [19.3] 本稿では,個別的,意味論的に一貫性のある思考ステップとして推論を構造化するプロンプト手法を提案する。
モデルでは、従来の非構造的連鎖推論では失敗しながら、この構造内でエラーを確実にローカライズできることが示される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:15:59 GMT)
Interpretability in Deep Time Series Models Demands Semantic Alignment [19.1] 我々は、ディープ時系列モデルにおける解釈可能性について、セマンティックアライメントを追求すべきだと述べる。
一度定着すると、意味的アライメントは時間的進化の下で保持されなければならない。
我々は、セマンティックに整合したディープ時系列モデルのための青写真について概説し、信頼をサポートする特性を特定し、モデル設計への影響について議論する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:48:30 GMT)
WorldCup Sampling for Multi-bit LLM Watermarking [18.9] We propose WorldCup, a multi-bit watermarking framework for large language model (LLMs)。
WorldCupは、補完的な信号によって導かれる階層的な競合メカニズムを通じて、メッセージビットを直接トークン選択に埋め込む。
総合的な実験によると、WorldCupはキャパシティ、検出可能性、堅牢性、テキスト品質、復号化効率のバランスを保っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:36:38 GMT)
SPIRIT: Adapting Vision Foundation Models for Unified Single- and Multi-Frame Infrared Small Target Detection [18.9] 赤外線小目標検出(IRSTD)は監視と早期警戒に不可欠であり、単一フレーム分析とビデオモード追跡の両方に展開する。
本稿では,軽量な物理インフォームドプラグインによってVFMをIRSTDに適応させる,統一的でVFM互換のフレームワークであるSPIRITを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:15:29 GMT)
Grad2Reward: From Sparse Judgment to Dense Rewards for Improving Open-Ended LLM Reasoning [18.8] Grad2Rewardは、ジャッジのモデル推論プロセスから直接、単一の後方パスを介して、密集したプロセス報酬を抽出する。
Grad2Rewardはグラデーションベースの属性を利用することで、正確なトークンレベルのクレジット割り当てを可能にする。
Grad2Rewardで最適化されたポリシーは、様々なオープンエンドタスクで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:13:13 GMT)
C-kNN-LSH: A Nearest-Neighbor Algorithm for Sequential Counterfactual Inference [18.5] 経時的軌跡から因果効果を推定することは、複雑な状態の進行の理解の中心である。
シーケンシャル因果推論のための最寄りのフレームワークであるemphC-kNN-LSHを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:35:57 GMT)
On the Fragility of AI-Based Channel Decoders under Small Channel Perturbations [18.5] 近年のディープラーニングの進歩により、AIベースの誤り訂正デコーダが、AWGNチャネル上での従来の信念伝達デコーダよりも経験的なパフォーマンス向上を報告している。
このような利益が期待できる一方で、根本的な疑問が残る。これらの改善はどこから来るのか、それを達成するのにどのコストがかかるのか?
チャネル出力における分布シフトに対するロバストネスのレンズを通してこの問題を考察する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:22:12 GMT)
When Is Rank-1 Enough? Geometry-Guided Initialization for Parameter-Efficient Fine-Tuning [18.5] 低ランク設定、特に Rank-1 LoRA は不安定であることが多い。
そこで我々はGap-Initを提案し、ランク1のLoRA方向を小さなキャリブレーションセットから推定したモダリティギャップベクトルと整列する。
我々の結果は、極端に低いランクの限界において、初期アライメントはランクそのものと同じくらい重要であることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:31:25 GMT)
Mixture of Concept Bottleneck Experts [18.4] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解できない概念の予測を基礎として解釈可能性を促進する。
本稿では,既存のCBMを2次元に沿って一般化するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:44:42 GMT)
Focus-dLLM: Accelerating Long-Context Diffusion LLM Inference via Confidence-Guided Context Focusing [18.4] Diffusion Large Language Models (dLLMs) は、非自己回帰デコードパラダイムで強力な長文処理機能を提供する。
提案するFocus-dLLMは,高精度で高精度な長文dLLM推論に適した,新しいトレーニング不要な注意スペルシフィケーションフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:36:10 GMT)
ST-BCP: Tightening Coverage Bound for Backward Conformal Prediction via Non-Conformity Score Transformation [18.3] コンフォーマル予測(CP)は、カバレッジ保証付き予測セットを構成する不確実性定量化のための統計フレームワークを提供する。
BCPはこのパラダイムを逆転させ、セットサイズに事前定義された上限を強制し、その結果のカバレッジ保証を推定する。
本稿では,非整合性スコアのデータ依存変換を導入し,カバレッジギャップを狭める新しい方法ST-BCPを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:18:35 GMT)
The Maximum von Neumann Entropy Principle: Theory and Applications in Machine Learning [18.2] 我々は、Grnwald と Dawid による最大エントロピー原理のミニマックス定式化を、フォン・ノイマンエントロピーの設定にまで拡張する。
この観点は、部分情報の下での最大VNE解の堅牢な解釈をもたらす。
次に、結果のVNE原則が現代の機械学習問題にどのように適用されるかを説明する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:59:32 GMT)
MACD: Model-Aware Contrastive Decoding via Counterfactual Data [18.0] ビデオ言語モデル(Video-LLMs)は幻覚を起こす傾向があり、視覚的証拠が弱く、曖昧で、偏見があるときに、しばしば可塑性だが、根拠のないコンテンツを生成する。
モデル誘導対実データに基づくコントラストデコーディング(MACD)を提案し,モデル誘導対実データ構築とデコーディングを組み合わせた新しい推論手法を提案する。
我々のアプローチでは、ビデオLLM自身のフィードバックを用いて、幻覚に最も責任があるオブジェクト領域を特定し、任意のフレームや時間的修正ではなく、オブジェクトレベルでターゲットの反事実入力を生成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:21:02 GMT)
D-CORE: Incentivizing Task Decomposition in Large Reasoning Models for Complex Tool Use [18.0] 大きな推論モデル(LRM)は、複雑なツール使用シナリオにおけるサブタスク分解の能力に欠けており、Lazy Reasoningに繋がる。
自己蒸留と多様性を考慮した強化学習を通じて,LEMのタスク分解推論能力にインセンティブを与える2段階のトレーニングフレームワークを提案する。
D-COREは、さまざまなベンチマークとモデルスケールで堅牢なツール使用の改善を実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:36:15 GMT)
Koopman Autoencoders with Continuous-Time Latent Dynamics for Fluid Dynamics Forecasting [18.0] 数値積分スキームによる潜伏進化をモデル化する連続時間クープマンフレームワークを導入する。
推論における可変時間ステップを許容することにより、時間分解能に対する堅牢性を示し、訓練体制を超えて一般化する。
従来のCFDベンチマークのアプローチを評価し,精度,安定性,外挿特性について報告する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:33:07 GMT)
Large Language Models for Mental Health: A Multilingual Evaluation [17.9] 各種言語における8つのメンタルヘルスデータセットに基づいて,プロプライエタリでオープンソースのLarge Language Models (LLMs)を評価した。
我々は,従来のNLPベースラインとゼロショット,少数ショット,微調整設定におけるLCM性能を比較した。
LLMの性能に影響を及ぼすために,言語家族やタイポロジーにまたがる翻訳品質を評価した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:34:53 GMT)
When Feasibility of Fairness Audits Relies on Willingness to Share Data: Examining User Acceptance of Multi-Party Computation Protocols for Fairness Monitoring [17.9] ヨーロッパ833人の参加者を対象にオンライン調査を行い、公正度監視のための様々なMPCプロトコル設計のユーザ受け入れについて検討した。
調査の結果,ユーザは直接評価においてリスク関連属性を優先するが,シミュレートされた選択では利益関連属性を優先することが示唆された。
我々は、インフォームドコンセントを奨励し、ユーザの期待に沿う方法で、プライバシ保護プロトコルをデプロイし、通信することの意味を導き出す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:17:34 GMT)
Embedding Perturbation may Better Reflect the Uncertainty in LLM Reasoning [17.8] 不確実量化(UQ)技術は、その出力に関するモデルの不確実性を推定するために使われ、それらの出力が問題となる可能性があることを示す。
LLM推論タスクでは、最終回答だけでなく、推論の中間ステップについても不確実性を推定することが不可欠である。
本研究により, LLMの誤った推論ステップは, 前回のトークン埋め込みの摂動に非常に敏感なトークンを含む傾向があることが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:27:26 GMT)
Boundary-Constrained Diffusion Models for Floorplan Generation: Balancing Realism and Diversity [17.8] 本稿では,一定の制約下でのレイアウトの多様性を定量化する尺度であるDiversity Score(DS)を提案する。
また,建築境界の条件付けを可能にするBCAモジュールも導入した。
実験の結果,BCAは境界の付着性を著しく改善する一方,長期トレーニングは多様性の崩壊を未診断にすることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:59:20 GMT)
Fine-Tuning Language Models to Know What They Know [17.8] 本研究は,メタ認知能力の$d_rmtype2'$をデュアルプロンプト法を用いて測定するフレームワークを提案する。
次に、モデルの内部知識をその明示的な振る舞いに結びつけるために、メタ認知アライメントのための進化戦略(ESMA)を導入する。
ESMAは、訓練されていない様々な設定にまたがる堅牢な一般化を示し、モデルが自身の知識を参照する能力を強化していることを示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:08:13 GMT)
Conflict-Aware Client Selection for Multi-Server Federated Learning [17.7] フェデレートラーニング(FL)は、生データを公開せずに、クライアント間で協調的なモデルトレーニングを可能にする。
従来のシングルサーバFLは、多数のクライアントからのモデルの集約によって、高い通信遅延に悩まされる。
本稿では,マルチサーバFLシステムにおけるクライアント選択を最適化するために,競合リスク予測を用いた分散強化学習(RL CRP)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:47:16 GMT)
Generalized Optimal Classification Trees: A Mixed-Integer Programming Approach [17.7] 混合整数プログラミング(MIP)は高度なモデリングの柔軟性を提供する。
非線形性能指標に基づく最適分類木学習のためのMIPベースのフレームワークを提案する。
提案手法を50のベンチマークデータセットで評価した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:46:01 GMT)
From Tokens to Numbers: Continuous Number Modeling for SVG Generation [17.6] 連続数モデリング(Continuous Number Modeling, CNM)は、離散トークンではなく、数値を直接一級連続値としてモデル化する手法である。
我々の定式化は、代替手法に比べて高い忠実性を保ちながら、トレーニング速度を30%以上改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:20:38 GMT)
Multi-Agent Monte Carlo Tree Search for Makespan-Efficient Object Rearrangement in Cluttered Spaces [17.6] 本項で紹介する。
Asynchronous, Multi-agent Monte Carlo Tree Search (CAM-MCTS) - 新しいフレームワーク。
挑戦的環境における汎用メイスパン効率のオブジェクト計画。
CAM-MCTSは, 粗い環境下での多種多様な単調タスクと非単調タスクにまたがって評価し, 強いベースラインと比較して, メイスパンが一貫した減少を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:10:45 GMT)
Reasoning with Autoregressive-Diffusion Collaborative Thoughts [17.5] 我々は,自己回帰モデルと拡散モデルによる推論と共同生成を可能にする統合フレームワークであるCollaborative Thoughtsを紹介する。
協調思考では、自己回帰モデルは構造化計画と制約管理を行い、拡散モデルはこれらの制約を中間的な視覚的思考としてインスタンス化する。
このフィードバックは、その後の計画および生成ステップを反復的に洗練し、モダリティ間のエラー伝搬を緩和するために使用される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:54:15 GMT)
Am I More Pointwise or Pairwise? Revealing Position Bias in Rubric-Based LLM-as-a-Judge [17.3] ルーブリックに基づく評価は、暗黙的に複数の選択設定に似ており、したがって位置バイアスを有することを示す。
そこで我々は,各スコアオプションを均等に配置するバランスの取れた置換戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:24:37 GMT)
SVD-ViT: Does SVD Make Vision Transformers Attend More to the Foreground? [17.2] 視覚変換器(ViT)は大規模な基礎モデルとして確立されている。
本稿では,前景特徴の学習を優先するSVD-ViTを提案する。
実験により,本手法は分類精度を向上し,情報的前景表現を効果的に学習することを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:17:34 GMT)
From Task Solving to Robust Real-World Adaptation in LLM Agents [17.1] 大規模言語モデルは、拡張された地平線上での計画、呼び出し、アクションを行う特別なエージェントとして、ますます多くデプロイされている。
グリッド型ゲームにおけるエージェントLLMを、単純なゴールだが長距離実行でベンチマークする。
名目上のタスク解決と,デプロイメントのような堅牢性の間には,大きなギャップがあります。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:10:40 GMT)
Joint Learning of Hierarchical Neural Options and Abstract World Model [16.9] 階層型ニューラルオプションとして形式化されたスキルのシーケンスを効率的に取得する方法を検討する。
本稿では,抽象世界モデルと階層型ニューラルオプションの集合を共同で学習する新しい手法を提案する。
我々は,オブジェクト中心アタリゲームのサブセットにおいて,ベースライン方式よりもはるかに少ないデータを用いて,我々の手法がより多くのスキルを習得できることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:58:11 GMT)
Backdoor Sentinel: Detecting and Detoxifying Backdoors in Diffusion Models via Temporal Noise Consistency [16.8] TNC-Defense(Temporal Noise Consistency Defense)は、バックドア検出と解毒のための統合されたフレームワークである。
提案手法を5つの代表的なバックドア攻撃シナリオで評価し,最先端の防御手法と比較した。
以上の結果から, TNC-Defenseは平均検出精度を11%以上向上し, 追加オーバーヘッドを無視し, 生成品質をわずかに低下させるだけで, 980.5%のトリガサンプルを無効化することがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:48:44 GMT)
Reasoning about Reasoning: BAPO Bounds on Chain-of-Thought Token Complexity in LLMs [16.8] チェーン・オブ・ソート(CoT)推論によるインタイムスケーリングは、最先端のLLMパフォーマンスの主要な要因であるが、相当なレイテンシと計算コストが伴う。
入力サイズが大きくなるにつれて、問題の解決に何個の推論トークンが必要となるのか?
正規の3つのBAPO-hardタスク(二進数、三重項マッチング、グラフ到達性)に必要なCoTトークンの下位境界を証明した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:33:34 GMT)
A Scalable Inter-edge Correlation Modeling in CopulaGNN for Link Sign Prediction [16.8] 符号付きグラフ上のリンクサイン予測は、エッジで表される関係が正か負かを決定するタスクである。
本研究の目的は,ガウスコーパスを用いて,エッジ間の遅延統計依存性を直接モデル化することである。
我々は、推定コストを劇的に削減するために条件付き確率分布を再構成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:47:06 GMT)
Poly-attention: a general scheme for higher-order self-attention [16.7] 我々は、多意性(poly-attention)機構(poly-attention mechanism)と呼ばれる、多種多様な自己注意の一般化を定義する。
我々の機構は、任意の高次(テンソル)計算と入力トークン間の任意の関係構造を組み込むことができる。
注意行列の計算の時間的複雑さについて,新しいアルゴリズムと複雑性理論的下界のマッチングを与える。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:24:53 GMT)
Every Bit Counts: A Theoretical Study of Precision-Expressivity Tradeoffs in Quantized Transformers [16.7] 各 p に対して等式関数に着想を得た関数を示し、一層ソフトマックス変換器が p ビットの精度で計算できるが p-1 ビットの精度では計算できないことを示す。
この結果は、量子化を用いた場合、広く観察される表現力の喪失現象を具体的に説明する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:22:32 GMT)
FreshMem: Brain-Inspired Frequency-Space Hybrid Memory for Streaming Video Understanding [16.7] 本稿では,脳の対数知覚とメモリ統合にインスパイアされた周波数空間ハイブリッドメモリネットワークであるFreshMemを提案する。
FreshMemは2つの相乗的加群を通して長期コヒーレンスで短期忠実度を調整する。
実験の結果、FreshMemはQwen2-VLベースラインを大幅に向上させ、StreamingBench、OV-Bench、OVO-Benchでそれぞれ5.20%、4.52%、および2.34%の上昇を示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:52:11 GMT)
MAIN-VLA: Modeling Abstraction of Intention and eNvironment for Vision-Language-Action Models [16.6] MAIN-VLAは、意図の抽象化とeNvironmentを、深いセマンティックアライメントにおける意思決定に明示的にモデル化するフレームワークである。
我々は,MAIN-VLAがより優れた意思決定品質,より強力な一般化,最先端推論効率を実現することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:17:49 GMT)
Hierarchical Federated Learning with SignSGD: A Highly Communication-Efficient Approach [16.5] Hierarchical Edge Learning (HFL)は、大規模ワイヤレスおよびIoTシステムの鍵として登場した。
符号に基づく勾配降下法(SignSGD)のような方法が不可欠であるが、既存の理論やアルゴリズムは自然に階層的な設定にまで拡張しない。
スケーラブルなHFLアルゴリズムであるHierSignSGDを導入し、階層的な設定でSignSGDの収束解析を行う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:18:03 GMT)
Breaking the Reversal Curse in Autoregressive Language Models via Identity Bridge [16.5] 本研究では,一層変圧器でも勾配降下の暗黙バイアスを解析することにより,逆の呪いを破ることができることを示す。
我々の研究は、逆の呪いの新たな理論基盤を提供し、データからより高いレベルのルールを学ぶことをLLMに奨励する原則的かつ低コストな経路を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:50:57 GMT)
Provably Data-driven Multiple Hyper-parameter Tuning with Structured Loss Function [16.2] データ駆動設定において多次元ハイパーパラメータをチューニングするための一般化保証を確立するための最初の一般的なフレームワークを確立する。
提案手法は,ツールを実代数幾何学から活用することにより,半代数関数クラスに対する一般化保証フレームワークを強化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:04:13 GMT)
Evolving from Tool User to Creator via Training-Free Experience Reuse in Multimodal Reasoning [16.1] エージェントをツールユーザからツールクリエータに変換する,トレーニング不要のフレームワークを提案する。
このアプローチは推論の経験を抽出し、再利用可能な資産に蒸留する。
ツールライブラリをメンテナンスするためのメモリ統合機構も導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:37:45 GMT)
ViThinker: Active Vision-Language Reasoning via Dynamic Perceptual Querying [15.7] ViThinkerは、要求に応じて専門家による視覚的特徴を合成するきっかけとなる意思決定トークンを視覚言語モデルが自律的に生成することを可能にするフレームワークである。
ViThinkerは、トレーニング中に視覚専門家の能力を内部化し、外部ツールコールなしで推論中に生成的なメンタルシミュレーションを実行する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:29:57 GMT)
Simplicity Prevails: The Emergence of Generalizable AIGI Detection in Visual Foundation Models [15.7] 現代のビジョン・ファンデーション・モデル(Vision Foundation Models)の凍結した特徴に基づいて訓練された単純な線形分類器は、新しい最先端技術を確立している。
この基準線は標準ベンチマーク上の特別な検出器と一致し、また、ウィジェット内のデータセット上では決定的に優れていることを示す。
我々は、AIの法医学におけるパラダイムシフトを提唱し、静的ベンチマークの過度な適合から、ファンデーションモデルの進化する世界の知識を現実の信頼性に活用することへと移行した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:20:02 GMT)
Aligning Language Model Benchmarks with Pairwise Preferences [15.4] ベンチマークアライメントを導入し、モデルパフォーマンスに関する限られた量の情報を使用して、オフラインベンチマークを自動的に更新します。
次に、ベンチマーク問題に対する優先順の重み付けを学習するBenchAlignを提案する。
我々の実験は、一致したベンチマークが、異なるサイズであっても、人間の好みのモデルに従って、正確に、見つからないモデルをランク付けできることを示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:11:09 GMT)
SOPRAG: Multi-view Graph Experts Retrieval for Industrial Standard Operating Procedures [15.4] SOPRAGは、SOP検索の問題点を解決するために特別に設計された新しいフレームワークである。
SOPRAGは、フラットチャンキングを専門のEntity、Causal、Flowグラフの専門家に置き換える。
SOPRAGは、検索精度と応答性の両方において、強い語彙、密度、グラフベースのRAGベースラインを著しく上回る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:30:43 GMT)
Cross-Domain Fake News Detection on Unseen Domains via LLM-Based Domain-Aware User Modeling [15.3] クロスドメイン偽ニュース検出(CD-FND)は、ソースドメインからターゲットドメインに知識を転送する。
既存のCD-FND手法は、ニュースやユーザエンゲージメントにおけるハイレベルセマンティクスのモデリングが不十分である。
未確認領域における偽ニュース検出のための新しいLLMベースのドメイン認識フレームワークであるDAUDを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:04:13 GMT)
Towards Understanding Steering Strength [15.2] 大規模言語モデルの訓練後制御に対する一般的なアプローチは、中間潜在表現のステアリングである。
本研究では, 操舵力に関する最初の理論的解析法を提案する。
我々の分析では、ステアリング強度の非単調効果を含む驚くべき挙動を明らかにした。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:25:37 GMT)
Reg4Pru: Regularisation Through Random Token Routing for Token Pruning [15.2] 本稿では,セグメンテーションのためのトークンプレーニング性能損失を軽減するトレーニング正規化手法であるReg4Pruを紹介する。
Reg4Pruは、ルーティングなしでトレーニングされた同じモデルと比較して、平均精度を絶対46%改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:38:19 GMT)
Reward-free Alignment for Conflicting Objectives [15.2] 我々は、競合対象(RACO)に対するリワードフリーアライメントフレームワークを提案する。
RACOはペアワイズ選好データを直接利用し、競合-逆勾配勾配の新たなクリッピング変種を通じて勾配衝突を解消する。
ユーザが指定した目標重みを尊重するパレート臨界点に対する収束保証を行い、クリッピングが2目的設定における収束率を厳密に改善できることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:59:52 GMT)
Data- and Variance-dependent Regret Bounds for Online Tabular MDPs [15.1] 両世界の最良なアルゴリズムは, 逆境系における洗練されたデータ依存的後悔境界と, 逆境系における分散依存的後悔境界を実現する。
政策最適化のために、我々のアルゴリズムは同じデータと分散に依存した適応性を、エピソード水平線の要素まで達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:09:29 GMT)
LoopViT: Scaling Visual ARC with Looped Transformers [14.9] 重み付け繰り返しによりモデル容量から深度を分離するLoop-ViTを提案する。
Loop-ViTは、局所的な畳み込みとグローバルな関心を組み合わせた、重み付けされたハイブリッドブロックを反復して、潜在的な思考の連鎖を形成する。
ARC-AGI-1ベンチマークの実証的な結果は、この視点を検証している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:32:57 GMT)
CATNIP: LLM Unlearning via Calibrated and Tokenized Negative Preference Alignment [14.9] 既存のアプローチは、グラディエント・アセント(GA)をルーツとしており、保持データやコントラッシブなペアに頼りながら、一般的なドメイン知識を劣化させることが多い。
我々は,モデルのトークンレベルの信頼度に比例して,未学習効果を再スケールする原理的手法を開発した。
我々の研究は、保持データや対照的なアンラーニング応答ペアを必要とせず、効果的なアンラーニングを可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:23:54 GMT)
Uncertainty-Aware Non-Prehensile Manipulation with Mobile Manipulators under Object-Induced Occlusion [14.8] オンボードセンシングを用いた非包括的操作は根本的な課題である。
本稿では,この課題に対処する強化学習フレームワークCURA-PPOを提案する。
本手法は,オンボードセンシングのみを用いて,乱雑な環境下での自律的な操作を実現するための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:12:27 GMT)
X-Blocks: Linguistic Building Blocks of Natural Language Explanations for Automated Vehicles [14.8] 自然言語の説明は、自動車両(AV)の信頼性と受容を確立する上で重要な役割を担っている
本稿では,AVに対する自然言語説明の言語的構成要素を,文脈,構文,語彙の3段階で識別する階層的分析フレームワークであるX-Blocksを紹介する。
RACEの精度は91.45パーセントで、ヒトアノテーター契約のケースに対するCohens Kappaは0.91である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:18:25 GMT)
SPARKLING: Balancing Signal Preservation and Symmetry Breaking for Width-Progressive Learning [14.8] 本研究では,中段幅拡張のための新しいフレームワークであるSPARKINGを提案する。
SPARKlingは、スクラッチからトレーニングを一貫して上回り、トレーニングコストを最大35%削減する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:52:52 GMT)
Adaptive Quality-Diversity Trade-offs for Large-Scale Batch Recommendation [14.8] B-DivRecと呼ばれる効率的なアルゴリズムを導入し、アイテムの多様性の度合いを調節する。
これは、ユーザー履歴を通じて品質と多様性のトレードオフを強制するのに役立ちます。
第2に,ユーザに対する品質と多様性のトレードオフを適応的に調整するアプローチを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:20:07 GMT)
The Semantic Trap: Do Fine-tuned LLMs Learn Vulnerability Root Cause or Just Functional Pattern? [14.5] そこで我々は,脆弱性根本原因を機能パターンから切り離すための総合評価フレームワークTrapEvalを提案する。
我々は、3つのモデルファミリーにまたがる5つの最先端LCMを微調整し、それらを、CodeBLEUによって測定されたクロスデータセットテスト、セマンティック保存、および様々なセマンティックギャップの下で評価する。
従来のデータセットに対する高いベンチマークスコアは、モデルが脆弱性の真の因果論理を理解できないことを隠蔽している可能性がある。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:48:57 GMT)
Fly0: Decoupling Semantic Grounding from Geometric Planning for Zero-Shot Aerial Navigation [14.5] 現在のVisual-Language Navigation (VLN) 手法はセマンティック理解と制御精度のトレードオフに直面している。
幾何学的計画から意味論的推論を分離するフレームワークFly0を提案する。
Fly0は計算オーバーヘッドを減らし、システムの安定性を向上させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:06:50 GMT)
Do I Really Know? Learning Factual Self-Verification for Hallucination Reduction [14.3] 本稿では,一貫性に基づく自己検証を通じて,大規模言語モデルに事実の不確実性を推論する学習時間フレームワークを提案する。
複数のモデルファミリーとスケールで、VeriFYは事実の幻覚率を9.7から53.3%に下げ、リコールはわずかに減少している。
ソースコード、トレーニングデータ、トレーニングされたモデルチェックポイントは、受け入れ次第リリースされる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:15:50 GMT)
ROG: Retrieval-Augmented LLM Reasoning for Complex First-Order Queries over Knowledge Graphs [14.3] 本稿では,クエリを意識した近傍検索と大規模言語モデル(LLM)の連鎖推論を組み合わせた検索拡張フレームワークを提案する。
ROGはマルチ演算クエリを単一演算サブクエリのシーケンスに分解する。
中間回答セットはステップ間でキャッシュされ再利用され、深い推論チェーンの一貫性が向上します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:45:43 GMT)
Environment-Conditioned Tail Reweighting for Total Variation Invariant Risk Minimization [14.2] アウト・オブ・ディストリビューション(OOD)の一般化は、モデルが環境間の相関シフトに同時に遭遇する場合に困難である。
既存の不変リスク最小化法(IRM)は、主に環境レベルでの急激な相関に対処する。
環境条件付きテール再重み付けによりテレビベースの不変学習を増強する統合フレームワークであるECTR(Total Variation Invariant Risk Minimization)について,環境条件付きテール再重み付けを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:28:56 GMT)
Scaling Search-Augmented LLM Reasoning via Adaptive Information Control [14.2] 制御不能な検索は 冗長な証拠 文脈飽和 不安定な学習につながります
本稿では,情報ユーティリティの形式的概念に基づく適応型情報制御フレームワークDeepControlを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:40:38 GMT)
Scaling-Aware Adapter for Structure-Grounded LLM Reasoning [14.0] 構造的複雑度でモダリティトークンをスケーリングしながら、幾何学的キューで言語推論を基礎とする、統一された全原子LPMであるCuttlefishを紹介した。
多様な全原子ベンチマークによる実験により、Cuttlefishは不均一な構造的推論において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:35:44 GMT)
RACA: Representation-Aware Coverage Criteria for LLM Safety Testing [13.7] 本稿では,AIの安全性テストに特化して設計された,新しいカバレッジ基準であるRACAを紹介する。
RACAの有効性,適用性,一般化を検証するための総合的な実験を行った。
また、テストセットの優先順位付けやアタックプロンプトサンプリングといった実世界のシナリオにおいて、実際の応用を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:20:51 GMT)
Tilt-Ropter: A Novel Hybrid Aerial and Terrestrial Vehicle with Tilt Rotors and Passive Wheels [13.7] 航空・地球ハイブリッド車(HATV)Tilt-Ropterについて紹介する。
ティルト・ロプターの完全作動式設計は、離間力とトルク制御を可能にする。
その結果,地中移動時の消費電力は92.8%減少した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:15:33 GMT)
ForSim: Stepwise Forward Simulation for Traffic Policy Fine-Tuning [13.7] ForSimは段階的にクローズドループフォワードシミュレーションパラダイムである。
マルチモーダルな振る舞いの多様性を保ちながら、モダリティ内整合性を確保する。
ForSimは、グループ相対最適化と協調して、きめ細かいトラフィックポリシーを運用する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:20:11 GMT)
FluxNet: Learning Capacity-Constrained Local Transport Operators for Conservative and Bounded PDE Surrogates [13.6] 正規グリッド上で保守的な輸送オペレータを学習するためのフレームワークを導入する。
モデルは次の状態を予測する代わりに、近所の交換を通じてセルを更新するローカルトランスポートオペレータを出力する。
浅水式と交通流の実験では, 強いベースライン上でのロールアウト安定性と物理的整合性が向上した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:44:10 GMT)
Orthogonal Hierarchical Decomposition for Structure-Aware Table Understanding with Large Language Models [13.6] LLMの複雑なテーブルの構造保存型入力表現を構成する直交階層分解(OHD)フレームワークを提案する。
この表現に基づいて、各セルのセマンティックな系統を対称的に再構築する2経路アソシエーションプロトコルを設計する。
AITQA と HiTab という2つの複雑なテーブル質問応答ベンチマーク上で OHD フレームワークを評価する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:22:43 GMT)
DrawSim-PD: Simulating Student Science Drawings to Support NGSS-Aligned Teacher Diagnostic Reasoning [13.6] 学生のような科学図面をシミュレートする最初の生成フレームワークであるDrawSim-PDを提案する。
100のキュレートされた次世代科学のトピックを用いて、体系的に構造化された1万のアーティファクトのコーパスを構築する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:15:51 GMT)
WS-IMUBench: Can Weakly Supervised Methods from Audio, Image, and Video Be Adapted for IMU-based Temporal Action Localization? [13.4] 本稿では,WS-IMU-TAL (WS-IMU-TAL) を,シーケンスレベルラベルのみを用いて体系的に評価するWS-IMUBenchを提案する。
我々は、7つの公開IMUデータセットに対して7つの弱い教師付き手法をベンチマークし、3,540以上のモデルトレーニングの実行と7,080の推論評価を行った。
我々は、WS-IMU-TALを進めるための具体的な方向性を概説する(例えば、IMU固有の提案生成、境界認識目的、時間的推論の強化など)。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:22:35 GMT)
Architecture-Agnostic Curriculum Learning for Document Understanding: Empirical Evidence from Text-Only and Multimodal [13.3] 文書理解モデルにおいて,プログレッシブなデータスケジューリングが一貫した効率向上をもたらすかどうかを検討する。
このスケジュールは,6.67から10.0までの有効エポックなデータ削減と合わせて,ウォールクロックのトレーニング時間を約33%短縮することを確認した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:09:26 GMT)
Towards Exploratory and Focused Manipulation with Bimanual Active Perception: A New Problem, Benchmark and Strategy [13.3] 探索・集中操作(EFM)の課題を思いついた。
提案する課題は,課題解決のための情報収集を積極的に行うことである。
両腕を能動視覚に、もう片方の腕を操りながら力覚を与えるBAP戦略を考案した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:43:46 GMT)
A Provable Expressiveness Hierarchy in Hybrid Linear-Full Attention [13.1] トランスフォーマーは現代の大言語モデルの基盤となっている。
完全な注意に対する表現力は厳密な理論的特徴を欠いている。
我々の研究は、ハイブリット・アテンションと標準フルアテンションの最初の証明可能な分離を提供し、異なるアテンション・メカニズムの基本的能力と限界を理解するための理論的視点を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:47:21 GMT)
SAPO: Self-Adaptive Process Optimization Makes Small Reasoners Stronger [13.0] 既存の自己進化的手法は、きめ細かい推論ステップの影響を見落とし、それが理性検証のギャップにつながる。
小言語モデル(SLM)における自己改善のための自己適応プロセス最適化法(SAPO)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:36:52 GMT)
Relativistic Position Verification with Coherent States [13.0] 量子光学と相対性理論を利用するセキュアな位置検証プロトコルを提案し,実験的に実現した。
位相ランダム化弱コヒーレント状態を用いて、2kmで分離された2つの検証器は、75m以上の精度で証明者の位置を確実に検証する。
これらの結果は、金融取引、災害対応、認証されたセキュアな通信における応用の道を開くことにより、安全な位置ベースの認証を現実的な可能性として確立する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:10:28 GMT)
Breaking the Static Graph: Context-Aware Traversal for Robust Retrieval-Augmented Generation [12.7] 堅牢なRAGのためのコンテキスト認識トラバーサルであるCatRAGを提案する。
CatRAGはHippoRAG 2アーキテクチャ上に構築され、静的なKGをクエリ適応ナビゲーション構造に変換する。
4つのマルチホップベンチマークの実験では、CatRAGはアートベースラインの状態を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:13:38 GMT)
OmniCode: A Benchmark for Evaluating Software Engineering Agents [12.7] OmniCodeは、現実世界のソフトウェア開発のための新しいソフトウェアエンジニアリングベンチマークである。
3つのプログラミング言語(Python、Java、C++)にまたがる1794のタスクと、バグ修正、テスト生成、コードレビュー修正、スタイル修正の4つの主要なカテゴリを含んでいる。
我々は、SWE-Agentのような人気のあるエージェントフレームワークでOmniCodeを評価し、Pythonのバグ修正でうまく機能するが、テスト生成のようなタスクやC++やJavaのような言語では不足していることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:04:10 GMT)
Enhancing Generalization in Evolutionary Feature Construction for Symbolic Regression through Vicinal Jensen Gap Minimization [12.7] ノイズの摂動やミックスアップに基づくデータ拡張によって推定されるビシナルリスクは,経験的リスクと正規化期間の合計によって制限されていることを実証する。
オーバーフィッティングを制御するために,経験的リスクとヴィジナルジェンセンギャップを共同で最適化する進化的特徴構築フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:46:16 GMT)
Efficiently Solving Mixed-Hierarchy Games with Quasi-Policy Approximations [12.6] N-robot forest-structured mixed-hierarchy game, which each robot act as a Stackelberg leader over its subtree。
このクラスのゲームに対して、KKT(Karush-Kuhn-Tucker)の1次最適条件を導出し、ロボットのベストレスポンスポリシーの高次微分がますます関与していることを示す。
我々は、高次政策微分を除去する準政治近似を導入し、結果の近似KKTシステムを効率的に解くための不正確なニュートン法を開発した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:03:29 GMT)
Thinking Like a Doctor: Conversational Diagnosis through the Exploration of Diagnostic Knowledge Graphs [12.6] 本稿では,2段階の推論を行うための診断知識グラフを探索する対話型診断システムを提案する。
システムの質問に応答する現実的な患者シミュレータを使用します。
実験では、強いベースラインよりも診断精度と効率が向上した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:56:36 GMT)
SUSD: Structured Unsupervised Skill Discovery through State Factorization [12.6] 教師なしスキル発見(USD)は、外因的な報酬に頼ることなく、多様なスキルセットを自律的に学習することを目的としている。
状態空間を独立成分に分解することで環境の構成構造を利用する新しいフレームワークであるSUSDを紹介する。
SUSDは異なる要因に異なるスキル変数を割り当て、スキル発見プロセスのよりきめ細かい制御を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:21:33 GMT)
SafePred: A Predictive Guardrail for Computer-Using Agents via World Models [12.6] 本稿では,複雑な実環境におけるコンピュータ利用エージェント(CUA)の予測ガードレールフレームワークであるSafePredを紹介する。
このアプローチに基づいて,安全なエージェント動作を確保するためのリスク・ツー・意思決定ループを確立するSafePredを提案する。
大規模な実験の結果、SafePredはリスクの高い振る舞いを著しく減らし、97.6%以上の安全性能を達成し、リアクティブベースラインと比較してタスクユーティリティを最大21.4%改善した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:04:06 GMT)
3D Foundation Model-Based Loop Closing for Decentralized Collaborative SLAM [12.6] C-SLAM技術は、ロボット間の視点の違いによるマップオーバーラップを特定するのにしばしば苦労する。
近年の3次元基礎モデルの進歩により,頑健なループ閉鎖法が提案されている。
当社のアプローチでは,基盤モデルを既存のSLAMパイプラインに統合することで,スケーラブルで堅牢なマルチロボットマッピングを実現しています。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:30:32 GMT)
TRIP-Bench: A Benchmark for Long-Horizon Interactive Agents in Real-World Scenarios [12.6] TRIP-Benchは、現実的な旅行計画シナリオを基盤とした長期水平ベンチマークである。
対話は最大15のユーザー・ターンにまたがり、150以上のツール・コールを伴い、コンテキストのトークンが200万を超えている可能性がある。
実験によると、高度なモデルでさえ、簡単な分割で50%成功し、ハードサブセットでは10%未満のパフォーマンスが低下している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:43:08 GMT)
CoDiQ: Test-Time Scaling for Controllable Difficult Question Generation [12.6] 大規模な推論モデル(LRM)は、競争レベルの問題に対するトレーニングから大きく恩恵を受ける。
既存の自動質問合成手法は、正確な難易度制御、高い計算コスト、大規模競争レベルの質問を生成するのに苦労している。
問題解決性を確保しつつ,テスト時間スケーリングによるきめ細かい難易度制御を可能にする新しいフレームワークであるCoDiQを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:28:26 GMT)
Steering Vector Fields for Context-Aware Inference-Time Control in Large Language Models [12.5] 本稿では,各アクティベーションにおける操舵方向を局所勾配で定義した,微分可能な概念スコアリング関数を提案する。
この定式化は、共有された整列された概念空間における協調した多層干渉をサポートする。
複数の言語モデル全体で、SVFはより強く信頼性の高い制御を提供し、推論時ステアリングの実用性を改善している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:14:42 GMT)
WAXAL: A Large-Scale Multilingual African Language Speech Corpus [12.4] WAXALは1億人以上の話者を表す21言語のための大規模でオープンにアクセスできる音声データセットである。
このコレクションは、約1,250時間の書き起こしを含む自動音声認識(ASR)データセットと、さまざまな話者からの自然な音声を含むテキスト音声合成(TTS)データセットの2つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:49:19 GMT)
BAPS: A Fine-Grained Low-Precision Scheme for Softmax in Attention via Block-Aware Precision reScaling [12.4] 特定の8ビット浮動小数点フォーマット (HiF8) とブロック対応のソフトマックス再スケーリングを利用した新しい低精度ワークフローを提案する。
我々のアルゴリズムの革新は、モデルの精度を著しく損なうことなく、低精度のソフトマックスを実現する。
我々の研究は、チップ面積を増大させることなく、エンドツーエンドの推論スループットを2倍にする方法を開拓する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:12:18 GMT)
When pre-training hurts LoRA fine-tuning: a dynamical analysis via single-index models [12.4] 過剰な事前トレーニングは微調整最適化を遅くする可能性がある。
ワンパスSGDで訓練した単一インデックスモデルに対して,ローランク適応(LoRA)ファインタニングのためのこの現象について検討した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:02:52 GMT)
Linear representations in language models can change dramatically over a conversation [12.3] 言語モデル表現は高次概念に対応する線形方向を含むことが多い。
線形表現は会話中に劇的に変化する。
また, 表象方向の操舵は, 会話の異なる点において, 劇的に異なる効果を持つことを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:30:09 GMT)
Bias Beyond Borders: Political Ideology Evaluation and Steering in Multilingual LLMs [12.3] 本稿では,50か国,33か国にまたがる政治的偏見の大規模多言語評価について述べる。
我々は,既存のステアリング手法を強化するために,CLAS(Cross-Lingual Alignment Steering)という補足的ポストホック緩和フレームワークを導入する。
実験は、応答品質の低下を最小限に抑えながら、経済と社会の両軸に沿って実質的なバイアス低減を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:40:17 GMT)
Personalized Image Generation via Human-in-the-loop Bayesian Optimization [12.2] 言語が限界に達した後も、新しい画像が$xast$よりも$xp*$に近いタイミングで認識できることが示されています。
我々は,新しい画像を生成するMultiBOを$xp*$の関数として開発し,ユーザから優先的なフィードバックを得る。
ユーザからのフィードバックのラウンドで、生成モデルは$xast$に関する情報を持っていないにも関わらず、$xast$にずっと近づくことが可能であることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:51:30 GMT)
Is Training Necessary for Anomaly Detection? [12.2] 現在の異常検出法は、異常を再構築するためのエンコーダ・デコーダモデルの訓練に依存している。
検索型異常検出(RAD)を提案する。
RADは、メモリに異常のない特徴を格納し、マルチレベル検索によって異常を検出する、トレーニング不要のアプローチである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:56:50 GMT)
Code over Words: Overcoming Semantic Inertia via Code-Grounded Reasoning [12.2] LLMはセマンティック・慣性 (Semantic Inertia) と戦っている。
記述的テキストではなく,動的表現を実行可能なコードとして表現することは,この傾向を逆転させ,効果的な事前抑制を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:53:40 GMT)
Neural Sabermetrics with World Model: Play-by-play Predictive Modeling with Large Language Model [12.1] 本稿では,野球のプレイバイプレイワールドモデルであるワールドモデルを用いたニューラルセイバーメトリックスを提案する。
野球の試合を,メジャーリーグベースボール(MLB)の10年以上の追跡データに基づいて,長期にわたる自己回帰的なイベントのシーケンスとして,単一大言語モデル(LLM)を継続的に事前訓練した。
結果として得られるモデルは、統合されたフレームワーク内でのゲーム進化の複数の側面を予測することができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:31:28 GMT)
Privately Fine-Tuned LLMs Preserve Temporal Dynamics in Tabular Data [12.1] PATHは、全テーブルを合成の単位として扱う新しい生成フレームワークである。
本稿では,全テーブルを合成単位として扱う新しい生成フレームワークPATHを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:19:52 GMT)
Finite-Size Scaling of the Full Eigenstate Thermalization in Quantum Spin Chains [11.9] 固有状態熱化仮説(ETH)は、個々のエネルギー固有状態が既に局所的な熱として現れるという仮説である。
我々は、標準アンサンブルにおけるこれらの関係に対する有限サイズ補正の詳細な正確な対角化研究を行う。
本研究は,量子多体系における完全ETHを検証するための体系的,実践的な方法論を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:43:16 GMT)
Zero Sum SVD: Balancing Loss Sensitivity for Low Rank LLM Compression [11.9] 白色座標における特異成分選択を行うポストトレーニング法であるtextbfZero Sum SVD (textbfZS-SVD) を提案する。
textbfZS-SVDは、累積的な損失変化を0付近に保持する textbfzero sum ルールで、モデル全体のコンポーネントをプルーする。
実験では、様々なベンチマークと圧縮比で一貫した利得を示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:51:01 GMT)
Efficient Adversarial Attacks on High-dimensional Offline Bandits [11.8] 本研究では,攻撃者が高次元設定でオフラインデータを悪用して盗賊の行動をハイジャックする新たな脅威モデルを提案する。
以上の結果から,報酬モデルの重みに対する小さな知覚不能な摂動でさえ,包帯の挙動を劇的に変化させることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:24:31 GMT)
Glance and Focus Reinforcement for Pan-cancer Screening [11.8] 汎癌スクリーニングのためのGlance and Focus強化学習フレームワークであるGF-Screenを紹介する。
GF-ScreenはGlanceモデルを用いて疾患領域を局在させ、Focusモデルで病変を正確に分類する。
GF-Screenの有効性を示したのは、9種類の病変を対象とする16種と7種の外部データセットの実験である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:40:13 GMT)
ASGMamba: Adaptive Spectral Gating Mamba for Multivariate Time Series Forecasting [11.8] 資源制約のあるスーパーコンピュータ環境のための効率的な予測フレームワークASGMambaを提案する。
ASGMambaは、局所スペクトルエネルギーに基づいて動的にノイズをフィルタリングする軽量のAdaptive Spectral Gatingメカニズムを統合している。
9つのベンチマークの実験は、ASGMambaが最先端の精度を達成することを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:38:21 GMT)
Frictional Contact Solving for Material Point Method [11.8] 暗黙的MPMのための摩擦接触パイプラインを導入する。
この方法は暗黙のMPMループにシームレスに統合され、物質法則、関数、転送スキームを含む選択のモデル化には依存しない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:34:32 GMT)
Self-Supervised Uncalibrated Multi-View Video Anonymization in the Operating Room [11.8] 全身人物検出と全身ポーズ推定からなる新しい多視点ビデオ匿名化フレームワークを提案する。
我々の中核となる戦略は、時間的・多視点コンテキストを用いて偽陰性を取り出すことにより、単一視点検出器を強化することである。
模擬手術の4D-ORデータセットと実手術のデータセットを用いて実験したところ,97%以上のリコールが達成された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:54:57 GMT)
ReasonEdit: Editing Vision-Language Models using Human Reasoning [11.7] ReasonEditは、ユーザーが編集中に推論を説明する最初のビジョン言語モデルエディタである。
ネットワーク科学に触発された新しいトポロジバランス型マルチモーダル埋め込み手法を用いて,推論中にのみ関連する事実を検索する。
最先端の編集性能を達成し、最終的に、編集中に人間の推論を使用することで、編集の一般化が大幅に改善されることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:06:14 GMT)
Cross-Modal Alignment and Fusion for RGB-D Transmission-Line Defect Detection [11.6] 本稿では,RGBの外観と深度幾何学を原理化されたヒューズ・パラダイムを通じて統合したクロスモーダルアライメント・アンド・フュージョン・ネットワークであるCMAFNetを提案する。
CMAFNetは、辞書ベースの特徴浄化を行うセマンティック再構成モジュールで構成されている。
軽量な派生型は228 FPSで24.8% mAP50に達し、わずか4.9Mのパラメータしか持たない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:11:33 GMT)
A Positive Case for Faithfulness: LLM Self-Explanations Help Predict Model Behavior [11.6] LLMの自己説明は、しばしばAI監視のための有望なツールとして提示されるが、モデルの真の推論プロセスへの忠実さは理解されていない。
モデル決定基準の学習を忠実な説明で行うべきだという考え方に基づく指標である正規化シミュラタゲインビリティ(NSG)を紹介する。
自己説明はモデル行動の予測を大幅に改善する(11-37% NSG)。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:54:51 GMT)
HPE: Hallucinated Positive Entanglement for Backdoor Attacks in Federated Self-Supervised Learning [11.6] フェデレートされた自己教師付き学習(FSSL)は、生のラベルなしデータを共有せずに、自己教師付き表現モデルの協調トレーニングを可能にする。
プライバシー保護学習の重要なパラダイムとして機能するが、セキュリティはバックドア攻撃に弱いままだ。
FSSLの新しいバックドア攻撃手法,すなわちHalucinated Positive Entanglement (HPE)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:24:06 GMT)
ES-MemEval: Benchmarking Conversational Agents on Personalized Long-Term Emotional Support [11.5] 大きな言語モデル (LLM) は会話エージェントとして大きな可能性を示している。
しかし、その有効性は、堅牢な長期記憶の欠陥によって制限されている。
ES-MemEvalは5つのコアメモリ機能を体系的に評価するベンチマークである。
EvoEmoは、パーソナライズされた長期的な感情的サポートのためのデータセットである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:58:26 GMT)
Discovering Data Manifold Geometry via Non-Contracting Flows [11.4] 本研究では,未知のデータ多様体の接空間にまたがるベクトル場を学習することで,グローバル参照システムを構築するための教師なしアプローチを提案する。
本手法は,全てのサンプルを共通かつ学習可能な参照点へ輸送する特異なベクトル場を学習する。
結果の弧長は、共有グローバルフレームに結びついた解釈可能な内在座標を定義する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:58:17 GMT)
ClueTracer: Question-to-Vision Clue Tracing for Training-Free Hallucination Suppression in Multimodal Reasoning [11.3] 本稿では,視覚的手がかり検索の指標であるClueRecallを紹介する。
本稿では,幻覚抑制のためのトレーニングフリー,パラメータフリー,アーキテクチャ非依存のプラグインであるClueTracerを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:03:56 GMT)
DomusFM: A Foundation Model for Smart-Home Sensor Data [11.3] スマートホームセンサデータ用に設計・事前訓練された最初の基礎モデルであるDomusFMを紹介する。
DomusFMはトークンレベルのセマンティック属性とシーケンスレベルの時間的依存関係の両方をキャプチャするために、自己教師付きデュアルコントラスト学習パラダイムを採用している。
実世界のスマートホームシステムの実践的デプロイ性を維持しながら,データの不足に対処する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:16:34 GMT)
Quantum Tomography of Fermion Pairs in $e^+e^-$ Collisions: Longitudinal Beam Polarization Effects [11.2] 本稿では、将来の$e+e-$衝突子におけるフェルミオン対生成の量子トモグラフィー研究について述べる。
プロセス $e+ e-to tbart, e+e-to +-$, Bhabha 散乱について検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:38:33 GMT)
Quantifying Epistemic Predictive Uncertainty in Conformal Prediction [11.1] 本研究では,複数の予測モデルが存在することにより,予測時に直面する不確実性を定量化する問題について検討する。
軽微な仮定の下で、任意の完全共形予測手順が閉かつ凸な予測分布の集合を誘導することを示す最近の結果に基づいて構築する。
本研究では,その不確かさを定量化するために,emphMaximum Mean Imprecisionに基づく計算効率が高く,解析的に抽出可能な不確実性尺度を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:38:07 GMT)
Learning Topology-Aware Implicit Field for Unified Pulmonary Tree Modeling with Incomplete Topological Supervision [11.0] TopoFieldは、肺木解析のためのトポロジーを意識した暗黙のモデリングフレームワークである。
完全なあるいは明示的な切断アノテーションに頼ることなく、トポロジーの修復をサポートする連続的な暗黙のフィールドを学ぶ。
常に位相的完全性を改善し、挑戦的な不完全なシナリオの下で正確な解剖学的ラベリングと肺部分再建を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:53:29 GMT)
Language Steering for Multilingual In-Context Learning [10.9] 非英語での大規模言語モデルのパフォーマンスは、英語よりもかなり劣っている。
トレーニング不要な言語ステアリングアプローチである言語ベクトルを提案する。
テスト対象のタスクや言語にまたがるベースライン上でのマルチランガル・イン・コンテクスト学習における一貫した改善を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:52:09 GMT)
Spin Relaxometry with Solid-State Defects: Theory, Platforms, and Applications [10.9] 橋梁理論と実験をレビューし、測定された緩和速度がノイズスペクトルにどのようにマップされるかを明らかにする。
我々は、凝縮物質物理学、化学および生物学的センシング、リラクソメトリーに基づく磁気共鳴分光の応用に重点を置いている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:27:59 GMT)
ECHO-2: A Large Scale Distributed Rollout Framework for Cost-efficient Reinforcement Learning [10.9] 強化学習(Reinforcement Learning, RL)は、学習後の大規模言語モデル(LLM)において重要な段階である。
本稿では,遠隔推論作業者と非無視の拡散遅延を用いた後学習のための分散RLフレームワークECHO-2を提案する。
ECHO-2は、強力なベースラインに匹敵するRL報酬を維持しながら、コスト効率を大幅に改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:57:53 GMT)
Constrained Process Maps for Multi-Agent Generative AI Workflows [10.9] 大規模言語モデル(LLM)ベースのエージェントは、コンプライアンスやデューディリジェンスといった規制された設定において、ますます使われている。
有限水平マルコフ決定過程 (MDP) として定式化された多エージェントシステムを導入する。
モンテカルロ推定(英語版)を用いて、疫学的不確実性はエージェントレベルで定量化され、システムレベルの不確実性は、自動ラベル付き状態またはヒトレビュー状態のいずれかで、MDPの終了によって捉えられる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:32:11 GMT)
There Is More to Refusal in Large Language Models than a Single Direction [10.8] 大規模言語モデルの拒絶は,単一のアクティベーション空間方向によって媒介されることを示す。
拒絶行動と非コンプライアンスの11のカテゴリにおいて、これらの拒絶行動は活性化空間における幾何学的に異なる方向に対応することが分かる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:15:44 GMT)
Controlled disagreement improves generalization in decentralized training [10.8] 集中型トレーニングは、コンセンサスエラーが収束と一般化を損なうため、集中型トレーニングよりも劣ると見なされることが多い。
本研究は,Adaptive Consensus (DSGD-AC) を用いた分散SGDの導入により,この視点に挑戦する。
これらの誤差はランダムノイズではなく、支配的なヘッセン部分空間と体系的に一致し、フラットなミニマに向けて最適化を導く構造的摂動として機能することを証明する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:14:37 GMT)
GSR: Learning Structured Reasoning for Embodied Manipulation [10.8] グラウンドド・シーングラフ推論(グラウンドド・シーングラフ・レアソニング、英語: Grounded Scene-graph Reasoning、GSR)は、セマンティックグラウンドド・シーングラフ上の遷移として、世界状態の進化を明示的にモデル化する構造的推論パラダイムである。
GSRは、物理的に接地された空間における行動条件、結果、および目標満足度に関する明確な推論を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:07:42 GMT)
De Novo Molecular Generation from Mass Spectra via Many-Body Enhanced Diffusion [10.7] 質量スペクトルからのデノボ分子構造生成のための多値拡散フレームワークMBGenを提案する。
多体アテンション機構と高次エッジモデリングを統合することで、MBGenはMS/MSスペクトルに符号化された豊富な構造情報を包括的に活用する。
提案手法は,高次相互作用を効果的に捉え,複雑な異性体および非局所断片化情報に対する感度を高める。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:00:00 GMT)
Robust Domain Generalization under Divergent Marginal and Conditional Distributions [10.7] ドメインの一般化は、目に見えないドメインに一般化できる予測モデルを学ぶことを目的としている。
本稿では,分散境界分布と条件分布の下での堅牢な領域一般化のための統一的なフレームワークを提案する。
我々は、結合分布を境界成分と条件成分に明示的に分解することで、目に見えない領域に縛られる新たなリスクを導出する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:13:41 GMT)
FaceLinkGen: Rethinking Identity Leakage in Privacy-Preserving Face Recognition with Identity Extraction [10.7] 元のピクセルを復元することなく、保護テンプレートから直接リンク/マッチングと顔の再生を行うID抽出攻撃であるFaceLinkGenを提案する。
その結果,PPFR評価に広く用いられている画素歪み測定値と,実際のプライバシとの間に構造的ギャップが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:41:14 GMT)
Vector Quantized Latent Concepts: A Scalable Alternative to Clustering-Based Concept Discovery [10.7] 本稿では,ベクトル量子化可変オートエンコーダ(VQ-VAE)アーキテクチャ上に構築されたフレームワークであるベクトル量子化潜在概念(VQLC)を提案する。
VQLCは、人間の理解可能な説明に匹敵する品質を維持しながら、スケーラビリティを向上させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:43:20 GMT)
The Art of Socratic Inquiry: A Framework for Proactive Template-Guided Therapeutic Conversation Generation [10.6] 心理学的大言語モデルに変換する治療目的プランナーであるtextbfSocratic Inquiry Framework (SIF) を提案する。
SIFは textbfwhen を分解して textbfwhen から質問する。
実験により、SIFはプロアクティブな質問頻度、会話深度、治療アライメントを著しく向上させることが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:40:11 GMT)
Back to the Future: Look-ahead Augmentation and Parallel Self-Refinement for Time Series Forecasting [10.6] Back to the Future(バック・トゥ・ザ・フューチャー・トゥ・フューチャー)は、ルックアヘッドの強化と自己修正による安定性の予測を強化する、シンプルで効果的なフレームワークである。
その単純さにもかかわらず、我々の手法は長い水平精度を一貫して改善し、線形予測モデルの不安定性を緩和する。
これらの結果から, モデル生成予測を拡張として活用することは, 複雑なアーキテクチャがなくても, 長期予測を高めるための単純かつ強力な方法である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:23:31 GMT)
Plug-In Classification of Drift Functions in Diffusion Processes Using Neural Networks [10.5] 拡散過程における教師付き多クラス分類問題について検討し、各クラスは異なるドリフト関数によって特徴づけられ、軌道は離散時間で観測される。
独立したサンプルパスから各クラスのドリフト関数を推定し,ベイズ型決定規則に基づいてラベルを割り当てるニューラルネットワークベースのプラグイン分類器を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:48:01 GMT)
FUPareto: Bridging the Forgetting-Utility Gap in Federated Unlearning via Pareto Augmented Optimization [10.5] Federated Unlearning (FU) は、フェデレートされたモデルから特定のクライアントデータの影響を効率的に取り除き、残りのクライアントのユーティリティを保存することを目的としている。
本稿では,Pareto-augmented Optimization を用いた効率的なアンラーニングフレームワーク FUPareto を提案する。
FUParetoは、未学習の有効性と維持性の両方において、最先端のFUメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:25:33 GMT)
Fair Context Learning for Evidence-Balanced Test-Time Adaptation in Vision-Language Models [10.5] テスト時間適応(TTA)は、ラベルのないテストサンプルのみを使用して堅牢性を改善することを目的としている。
ほとんどのプロンプトベースのTTA法はエントロピーの最小化に依存している。
本研究では,共有エビデンスバイアスに明示的に対処することにより,エントロピーの最小化を回避するフェアコンテキスト学習(FCL)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:02:50 GMT)
VRGaussianAvatar: Integrating 3D Gaussian Avatars into VR [10.4] VRGaussian Avatarは、ヘッドマウントディスプレイ(HMD)信号のみを使用してリアルタイムのフルボディ3D Splatting (3DGS)アバターを可能にする。
VR Frontendは、逆キネマティクスを使用して、フルボディのポーズを推定し、結果のポーズとステレオカメラパラメータをバックエンドにストリームする。
GAバックエンドは、単一の画像から再構成された3DGSアバターを立体的にレンダリングする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:42:40 GMT)
Toxicity Assessment in Preclinical Histopathology via Class-Aware Mahalanobis Distance for Known and Novel Anomalies [10.4] 薬物による毒性は、先天的な発達と初期の臨床試験の失敗の主因である。
組織学的全スライディング画像(WSI)のためのAIベースの異常検出フレームワークを,毒性研究から紹介した。
このシステムは、トレーニングデータが利用可能である健康な組織と既知の病理(アナマリー)を特定する。
アウト・オブ・ディストリビューション(OOD:out-of-distribution)の所見として、トレーニングデータなしで希少な病理を検出できる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:07:33 GMT)
WADEPre: A Wavelet-based Decomposition Model for Extreme Precipitation Nowcasting with Multi-Scale Learning [10.4] WADEPre はウェーブレットに基づく極度の降水に対する分解モデルであり、モデリングをウェーブレット領域に遷移させる。
SEVIRとShanghai Radarデータセットの実験は、WADEPreが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:40:57 GMT)
Relationship-Aware Hierarchical 3D Scene Graph for Task Reasoning [10.4] 本稿では,複数の抽象化レベルにまたがるオープン語彙機能を統合し,オブジェクト-リレーショナル推論をサポートする階層型3Dシーングラフを提案する。
本稿では,Large Language Models(LLM)とVLM(Vision Language Model)を組み合わせて,シーングラフのセマンティックおよびリレーショナル情報を解釈するタスク推論モジュールを提案する。
我々は,複数の環境やタスクにおいて,四足歩行ロボットに配置することで,その方法を検証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:47:02 GMT)
UniDWM: Towards a Unified Driving World Model via Multifaceted Representation Learning [10.3] 我々は,多面的表現学習を通じて自律運転を促進する統一運転世界モデルUniDWMを提案する。
UniDWMは、物理的に基底化された状態空間として機能する構造と動的に認識された潜在世界表現を構築する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:10:51 GMT)
Creative Image Generation with Diffusion Models [10.1] 本稿では,CLIP埋め込み空間における画像の存在の逆確率と創造性を関連付ける拡散モデルを用いた創造的生成のための新しい枠組みを提案する。
提案手法は,生成した画像の確率分布を計算し,それを低確率領域に向けて駆動し,希少かつ想像的かつ視覚的に表現可能な出力を生成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:24:08 GMT)
Self-Soupervision: Cooking Model Soups without Labels [10.0] Self-emphSoupervisionはスープを自己教師型学習(SSL)に一般化する
破損したテストデータに基づいて自己解凍を行い, 故障した列車データから微調整し, 3.5%(ImageNet-C)と+7%(LAION-C)のロバスト性を高めることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:48:49 GMT)
Monotonicity as an Architectural Bias for Robust Language Models [9.8] 大規模言語モデル(LLM)は、敵のプロンプトやジェイルブレイク攻撃の下で不安定な振る舞いを示すことが知られている。
トランスフォーマーに基づく言語モデルのロバスト性向上のためのアーキテクチャ的帰納バイアスとしての単調性について検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:03:19 GMT)
FiLoRA: Focus-and-Ignore LoRA for Controllable Feature Reliance [9.8] 内部機能依存の明示的な制御を可能にする適応フレームワークFiLoRAを紹介する。
テキスト画像と音声画像のベンチマークにおいて、FiLoRAは内部計算において一貫した因果シフトを誘導することを示す。
さらなる分析により、FiLoRAは突発的特徴介入下で堅牢性を向上させることが示されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:00:57 GMT)
Graph-Augmented Reasoning with Large Language Models for Tobacco Pest and Disease Management [9.8] 本稿では,タバコ害虫と疾病管理のためのグラフ化推論フレームワークを提案する。
ドメイン固有の知識グラフを構築し、クエリ関連サブグラフを検索し、回答生成中に関係証拠を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:29:52 GMT)
AgentRx: Diagnosing AI Agent Failures from Execution Trajectories [9.6] 構造化されたAPI、インシデント管理、オープンなWeb/ファイルタスクにまたがる115の障害トラジェクトリのベンチマークをリリースする。
各トラジェクトリには、臨界障害ステップと、基底理論から派生したクロスドメイン障害分類のカテゴリが注釈付けされている。
本稿では,ドメインに依存しない自動診断フレームワークであるAgentRXについて述べる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:54:07 GMT)
DenVisCoM: Dense Vision Correspondence Mamba for Efficient and Real-time Optical Flow and Stereo Estimation [9.5] 本稿では,光流の高精度かつリアルタイムな推定と不均一性推定のための新しいマンバブロックdenVisCoMを提案する。
我々は、多数のデータセット上で精度とリアルタイム処理のベンチマークトレードオフを広範囲に分析する。
実験結果と関連する分析結果から,提案モデルでは,光学的流れと不均一性の推定をリアルタイムで正確に推定できることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:03:07 GMT)
COMET: Codebook-based Online-adaptive Multi-scale Embedding for Time-series Anomaly Detection [9.5] オンラインコードブックに基づく時系列異常検出のためのオンライン適応型マルチスケール埋め込み(COMET)
オンラインコードブック適応は、コードブックエントリに基づいて擬似ラベルを生成し、対照的な学習を通じて推論時にモデルを動的に適応させる。
COMETは、45評価指標のうち36で最高のパフォーマンスを達成し、様々な環境においてその有効性を検証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:51:18 GMT)
Efficient Cross-Country Data Acquisition Strategy for ADAS via Street-View Imagery [9.5] 我々は、公開画像を利用して興味ある場所(POI)を特定するストリートビュー誘導型データ取得戦略を提案する。
信号場外見におけるクロスカントリー変動に特に敏感なタスクである交通信号検出実験は,本手法がランダムサンプリングに匹敵する性能を実現することを示す。
これらの結果は,効率的かつ費用対効果の高いクロスカントリーモデル適応のためのストリートビュー誘導型データ取得の可能性を強調した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:09:07 GMT)
Framing Responsible Design of AI Mental Well-Being Support: AI as Primary Care, Nutritional Supplement, or Yoga Instructor? [9.4] 数百万の人たちが、ChatGPTのような非クリニカルなLarge Language Model(LLM)ツールをメンタルヘルスサポートに使用しています。
本稿では,このようなツールを設計することの意味について考察する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:54:19 GMT)
P-RAG: Prompt-Enhanced Parametric RAG with LoRA and Selective CoT for Biomedical and Multi-Hop QA [9.4] Retrieval-Augmented Generation (RAG) は、推論中に外部知識を取得することで、この制約に対処する。
3種類のRAG変異体-Standard RAG, DA-RAG, 提案したPrompt-Enhanced Parametric RAG (P-RAG) について検討した。
P-RAG は LLM 内にパラメトリック知識を統合し、チェイン・オブ・ソート (CoT) の誘導とローランド適応 (LoRA) によって導かれる証拠を回収する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:42:45 GMT)
A Lightweight Sparse Interaction Network for Time Series Forecasting [9.4] TSFタスクのための軽量スパースインタラクションネットワーク(LSINet)を提案する。
自己注意の空間性から着想を得たマルチヘッドスパース相互作用機構(MSIM)を提案する。
MSIMは、時間ステップ間の重要な接続をスパーシリティによって引き起こされるBernoulli分布を通じて学習し、TSFの時間的依存関係をキャプチャする。
LSINetは、TSFタスクにおける高度な線形モデルとトランスフォーマーモデルよりも精度と効率の両立を実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:24:14 GMT)
Risk, Data, Alignment: Making Credit Scoring Work in Kenya [9.4] ケニア・ナイロビにおけるデジタル融資におけるデータサイエンスの社会工学的・制度的な取り組みについて検討した。
本研究は,実践者が技術的な回避策と法的回避策を用いて代替データを構築する方法を示すものである。
アルゴリズムによるクレジットスコアリングは、現在進行中のアライメント作業によって達成される、と我々は主張する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:57:35 GMT)
Understanding the Reversal Curse Mitigation in Masked Diffusion Models through Attention and Training Dynamics [9.4] 仮面拡散に基づく言語モデル(MDM)は、この失敗をはるかに弱い形で示す。
一般的な説明では、この緩和はいかなる順序の訓練目標にも当てはまる。
この緩和は、建築構造とトレーニングとの相互作用から生じることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:17:08 GMT)
Guaranteeing Privacy in Hybrid Quantum Learning through Theoretical Mechanisms [9.4] 本稿では,QMLモデルのプライバシを保護するために古典ノイズと量子ノイズを組み合わせたハイブリッドノイズ付加機構HYPER-Qを提案する。
我々は、プライバシー保証に関する包括的な分析を行い、その実用性に関する理論的境界を確立する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:23:37 GMT)
DCoPilot: Generative AI-Empowered Policy Adaptation for Dynamic Data Center Operations [9.2] DCoPilotは動的DC動作における生成制御ポリシのためのハイブリッドフレームワークである。
i) ストレステストを行うシミュレーションスケールアップ、(ii) メタポリシー蒸留、(ii) ハイパーネットワークがSLAとシーン埋め込みを条件としたポリシー重みを出力するように訓練され、(iii) オンライン適応により、更新された仕様に応じてゼロショットポリシー生成を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:18:52 GMT)
TopoPrune: Robust Data Pruning via Unified Latent Space Topology [9.2] TopoPruneは、トポロジを活用して、安定した、本質的なデータ構造をキャプチャすることで、この問題を解決するフレームワークである。
TopoPruneは、(1)トポロジーを意識した多様体近似を利用して、データセットのグローバルな低次元埋め込みを確立する。
統合された二スケールトポロジカルアプローチは、特に大きなデータセットのプルーニングレートにおいて、高い精度と精度を保証することを実証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:53:59 GMT)
Learning Sequential Decisions from Multiple Sources via Group-Robust Markov Decision Processes [9.1] 本稿では,オフライン多地点データセットから堅牢な逐次意思決定ポリシーを学習することを目的とする。
クロスサイト不確実性をモデル化するために, 群線形構造を持つ分散ロバストなMDPについて検討した。
我々は,キークロスサイト構造を維持しつつ,トラクタブルなベルマン再帰を保ちながら特徴的(d-矩形)不確実性集合を導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:58:55 GMT)
End-to-end reconstruction of OCT optical properties and speckle-reduced structural intensity via physics-based learning [9.1] 光コヒーレンストモグラフィーにおける逆散乱は、構造像と固有の組織光学特性の両方を復元しようとする。
我々は,光学パラメータマップとスペックル再現型OCT構造強度を協調的に再構築し,層状可視化を実現するための正規化エンドツーエンドディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:40:34 GMT)
DIA-CLIP: a universal representation learning framework for zero-shot DIA proteomics [9.0] 本稿では,DIA分析パラダイムを半教師付きトレーニングから普遍的クロスモーダル表現学習へシフトさせる事前学習モデルであるDIA-CLIPを提案する。
二重エンコーダ・コントラスト学習フレームワークとエンコーダ・デコーダアーキテクチャを統合することにより、DIA-CLIPはペプチドとそれに対応するスペクトルの特徴を統一したクロスモーダル表現を確立する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:55:24 GMT)
Hierarchical Adaptive Eviction for KV Cache Management in Multimodal Language Models [8.9] 既存のKVキャッシュ消去戦略は、視覚トークンとテキストトークンの間の不均一な注意分布に対処できない。
MLLMにおけるテキスト-視覚トークンの相互作用を最適化するKVキャッシュ消去フレームワークである階層適応消去(HAE)を提案する。
HAEは層間のKVキャッシュ使用を最小化し、インデックスブロードキャストによる計算オーバーヘッドを低減し、理論的には優れた情報完全性と低いエラー境界を保証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:01:44 GMT)
Revisiting Generalization Measures Beyond IID: An Empirical Study under Distributional Shift [8.9] 一般化は依然として深層学習における中心的かつ未解決の課題である。
IID体制を超えた一般化対策の頑健さをベンチマークする。
分布シフトは多くの一般化尺度の予測性能を著しく変化させることができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:56:33 GMT)
Efficient Epistemic Uncertainty Estimation for Large Language Models via Knowledge Distillation [8.9] ディープ・アンサンブルス(Deep Ensembles)によるエピステミック不確実性(EU)は、現代のモデルの規模で計算的に禁止されている。
トークンレベルのEUを効率的に推定するために,小型のドラフトモデルを活用するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:03:37 GMT)
On the Sample Efficiency of Inverse Dynamics Models for Semi-Supervised Imitation Learning [8.8] 半教師付き模倣学習(SSIL)は、アクションラベル付き軌道からポリシーを学習することと、アクションフリー軌道のデータセットをはるかに大きくする。
いくつかのSSILメソッドは、現在の状態と次の状態からアクションを予測するために逆ダイナミクスモデル(IDM)を学習する。
IDMは、ビデオモデル(VM-IDM)やラベルジェネレータと組み合わせてアクションフリーデータ上での動作クローンを行う場合、ポリシーとして機能する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:13:43 GMT)
TraceNAS: Zero-shot LLM Pruning via Gradient Trace Correlation [8.7] 学習不要なニューラルネットワーク探索(NAS)フレームワークであるTraceNASを提案する。
TraceNASは、スケール不変のゼロショットプロキシを使用して、事前訓練されたモデルと高い損失ランドスケープアライメントを維持するプルーンドモデルを特定する。
非常に効率的で、単一のGPU上で8.5時間でプルーニングされたモデルの高忠実な発見を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:49:39 GMT)
FD-VLA: Force-Distilled Vision-Language-Action Model for Contact-Rich Manipulation [8.7] 本稿では,力覚をコンタクトリッチな操作に統合する新しいフレームワークであるForce-Distilled VLAを提案する。
当社のアプローチのコアは、学習可能なクエリトークンをマッピングすることで、フォースを蒸留するFDM(Force Distillation Module)である。
推理中、この蒸留された力トークンは、予め訓練されたVLMに注入され、力を認識する推論が可能となる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:19:46 GMT)
TabPFN for Zero-shot Parametric Engineering Design Generation [8.7] 本稿では,TabPFNに基づくパラメトリックエンジニアリング設計のためのゼロショット生成フレームワークを提案する。
提案手法は,目標性能指標に基づいて逐次条件付き設計パラメータを生成する。
拡散型生成モデルと比較して,提案手法は計算オーバーヘッドとデータ要求を大幅に削減する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:51:40 GMT)
GuideWeb: A Benchmark for Automatic In-App Guide Generation on Real-World Web UIs [8.6] textbfGuideWebは、現実世界のWeb UI上でアプリケーション内ガイドの自動生成のための新しいベンチマークである。
GuideWebは、Webページに接地されたtextbfguideターゲット要素を選択し、ユーザ意図に沿った簡潔なガイドテキストを生成することによって、ページレベルのガイダンスを生成するタスクとして、そのタスクを定式化する。
提案した textbfGuideWeb Agent は誘導対象要素予測における textbf30.79% の精度を実現し,意図生成のための textbf44.94 のBLEUスコアと textbf21.34 を得る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:21:03 GMT)
Preserving Localized Patch Semantics in VLMs [8.6] 視覚トークンが対応する画像パッチから受け継がれた視覚的表現を失うのを防ぐために、NTP(Next-token Prediction)に損失を導入する。
LLLは、画像トークンが局所的な視覚情報を失うのを防ぐために、自己注意層における画像とテキストトークンの混合を制限している。
我々の実験が示すように、LLLは画像中の有意義なオブジェクト信頼マップを生成することによって、Logit Lensを実用的に意味のあるものにするだけでなく、特別なヘッドを付けずにセグメンテーションのような視覚中心のタスクのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:48:11 GMT)
Internal Flow Signatures for Self-Checking and Refinement in LLMs [8.5] 固定されたブロック間監視境界における深さ方向のダイナミックスから決定生成を監査するエンフェナールフローシグネチャを導入する。
この手法はバイアス中心の監視によりトークンワイズ動作を安定化し、その後、コンパクトな読み出し整列部分空間の軌跡を要約する。
これらのシグネチャに基づいて訓練された軽量GRU検証器は、ベースモデルを変更することなく自己チェックを行う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:05:54 GMT)
Harnessing Flexible Spatial and Temporal Data Center Workloads for Grid Regulation Services [8.5] 地理的に分散したDC間での負荷分散と規制容量のコミットメントを共同で決定する統合された日頭協調最適化フレームワークを提案する。
ケーススタディでは,提案手法がシステム運用コストを低減し,より現実的な規制能力を実現し,収益リスクの高いトレードオフを達成できることが示されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:42:09 GMT)
MedAraBench: Large-Scale Arabic Medical Question Answering Dataset and Benchmark [8.4] アラビア語は自然言語処理研究において最も不十分な言語の一つである。
メドラベンチ(MedAraBench)は、アラブの様々な専門分野にまたがる質問・回答のペアからなる大規模なデータセットである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:52:20 GMT)
Federated Vision Transformer with Adaptive Focal Loss for Medical Image Classification [8.4] Vision Transformer (ViT)のようなディープラーニングモデルは、一般的に大規模なデータセットを必要とする。
フェデレートラーニング(FL)は、データ交換なしでグローバルモデルアグリゲーションを可能にすることで、この問題に対処する。
本研究では,動的適応焦点損失(DAFL)と局所学習のためのクライアント認識集約戦略を活用するFLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:47:33 GMT)
Using Correspondence Patterns to Identify Irregular Words in Cognate sets Through Leave-One-Out Validation [8.4] 規則性の新たな尺度として,対応パターンのバランスの取れた平均について述べる。
また、この測度を用いて正則性を持たないコグネート集合を同定する新しい計算方法を提案する。
本手法は,実データに基づくデータセットで全体の85%の精度を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:26:41 GMT)
Before Autonomy Takes Control: Software Testing in Robotics [8.2] 247人のロボティクスが論文をテストし、それらをソフトウェアテストにマップする。
本稿では、ロボット工学における最先端ソフトウェアテストについて、実例で論じ、現状の課題について論じる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:30:23 GMT)
Decoupling Generalizability and Membership Privacy Risks in Neural Networks [8.2] ディープラーニングモデルは、通常、いくつかの他の能力や特性を取得する際に、いくつかのユーティリティを犠牲にしなければなりません。
本稿では,ディープニューラルネットワークアーキテクチャにおいて,モデルの一般化とプライバシリスクが異なる領域に存在することを明らかにする。
一般化可能性の損失を最小限に抑えつつ,プライバシリスクからモデルコンポーネントを保護するために,プライバシ保護トレーニング原則(PPTP)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:32:42 GMT)
Fast Near Time-Optimal Motion Planning for Holonomic Vehicles in Structured Environments [8.2] 磁気浮上を用いた平面運動系における運動計画の課題を解決することを目的としている。
提案手法は, 自由空間廊下を用いた環境表現を符号化し, 移動プリミティブを用いて車両の走行を表現している。
この手法は最先端のXPlanarシステムよりもはるかに低い時間で実現され、実世界のBeckhoff XPlanarシステム上で検証される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:26:30 GMT)
OpInf-LLM: Parametric PDE Solving with LLMs via Operator Inference [8.1] 大規模言語モデル(LLM)は、コード生成、シンボリック推論、ツール使用において強力な機能を示している。
演算子推論に基づく LLM PDE 問題解決フレームワーク OpInf-LLM を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:04:50 GMT)
Optimizing Prompts for Large Language Models: A Causal Approach [8.1] 本稿では,因果推定の問題として設計を即時的に再編成するフレームワークを提案する。
CPOは、人間工学的なプロンプトや最先端の自動化よりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:37:11 GMT)
Reading Between the Tokens: Improving Preference Predictions through Mechanistic Forecasting [8.1] 人口統計学およびイデオロギー的情報によって、大規模言語モデル内の潜在的パーティエンコーディングコンポーネントがどのように活性化されるかを検討する。
この内部知識を機械的予測によって活用することで,予測精度が向上することが判明した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:39:06 GMT)
Generating Causal Temporal Interaction Graphs for Counterfactual Validation of Temporal Link Prediction [7.9] 因果的相互作用グラフ (CTIG) を, 既知の地絡因果構造と組み合わせて生成する。
因果モデルを比較するために,クロスモデル予測誤差に基づく距離メトリックを提案する。
私たちのフレームワークは因果ベンチマークの基礎を提供します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:36:18 GMT)
Spectral Text Fusion: A Frequency-Aware Approach to Multimodal Time-Series Forecasting [7.9] SpecTFは、周波数領域における時系列に対するテキストデータの影響を統合するフレームワークである。
様々なマルチモーダル時系列データセットにおいて,SpecTFが最先端モデルを大幅に上回ることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:28:21 GMT)
Catalyst: Out-of-Distribution Detection via Elastic Scaling [7.9] ディープニューラルネットワークの安全なデプロイには、アウト・オブ・ディストリビューション(OOD)検出が重要である。
最先端のポストホック法は、大域平均プーリング(GAP)によって得られる出力ロジットまたは最大特徴ベクトルからOODスコアを導出するのが一般的である。
我々はこれらの未探索信号を利用するポストホックフレームワークであるCatalystを紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:08:33 GMT)
BTGenBot-2: Efficient Behavior Tree Generation with Small Language Models [7.8] BTGenBot-2は、自然言語タスク記述とロボットアクションプリミティブのリストをXMLで実行可能な振る舞いツリーに変換する、オープンソースの小型言語モデルである。
BTGenBot-2は従来のアプローチとは異なり、ゼロショットBT生成、推論時のエラーリカバリ、実行時に可能で、リソース制約のあるロボットには十分軽量である。
BTGenBot-2はGPT-5、Claude Opus 4.1、そして、機能的および非機能的メトリクスの両方にわたるより大きなオープンソースモデルより一貫して優れていた。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:43:17 GMT)
Synesthesia of Vehicles: Tactile Data Synthesis from Visual Inputs [7.8] 自動運転車の視覚入力から触覚の励起を予測する新しいフレームワークであるSynesthesia of Vehicles (SoV)を提案する。
実車認識システムは、様々な道路や照明条件にまたがるマルチモーダルデータセットを収集した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:06:11 GMT)
FragmentFlow: Scalable Transition State Generation for Large Molecules [7.7] 遷移状態(TS)は化学反応性と反応機構の理解と定量的な予測の中心である。
最近の生成モデリング手法は、比較的小さな分子に対して化学的に意味のあるTS予測を可能にしている。
FragmentFlowは、反応コア原子のTS測地を予測するために生成モデルを訓練する分断・対数法である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:42:27 GMT)
Position: Explaining Behavioral Shifts in Large Language Models Requires a Comparative Approach [7.7] 行動シフトは、独立した単一のモデルではなく、相対的に説明されるべきである、と私たちは主張する。
我々は、適切な説明法を設計する際に考慮すべきデシラタのセットで比較XAI($-XAI)フレームワークを定式化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:36:21 GMT)
T-LLM: Teaching Large Language Models to Forecast Time Series via Temporal Distillation [7.7] 時系列予測は多くの現実世界のアプリケーションにおいて意思決定において重要な役割を果たす。
本稿では,汎用言語モデルと時系列予測機能を組み合わせた時空間蒸留フレームワークT-LLMを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:40:27 GMT)
Structure-Preserving Learning Improves Geometry Generalization in Neural PDEs [7.6] データ駆動有限要素法である一般幾何ニューラルホイットニー形式(Geo-NeW)を導入する。
いくつかの定常PDEベンチマークで最先端性能を実証し、分布外測地における従来のベースラインよりも大幅に改善した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:45:07 GMT)
TreeLoc: 6-DoF LiDAR Global Localization in Forests via Inter-Tree Geometric Matching [7.6] 森林のグローバルローカライゼーションフレームワークであるTreeLocを提案する。
多様なフォレストベンチマークでは、TreeLocはベースラインを上回り、正確なローカライゼーションを実現している。
また、コンパクトなグローバルツリーデータベースからのディスクリプタを用いた長期森林管理の応用も提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:32:07 GMT)
Meta Engine: A Unified Semantic Query Engine on Heterogeneous LLM-Based Query Systems [7.5] 構造化されていないデータとして、多くのマルチモーダルデータ(テキスト、画像、ビデオなど)がセマンティクスに隠されている。
構造化されていないデータに対するセマンティッククエリをサポートするLLMベースのセマンティッククエリシステムもいくつか提案されている。
本稿では,クエリシステムにおける新しいクエリシステムであるMeta Engineを紹介する。
すべてのベースラインを一貫して上回り、ほとんどの場合、F1は3~6倍、特定のデータセットでは最大24倍になる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:16:04 GMT)
Learning Markov Decision Processes under Fully Bandit Feedback [7.5] 強化学習における標準的な前提は、エージェントが関連する決定プロセス(MDP)において、訪れた状態-行動ペアをすべて観察するということである。
我々は,$widetildeO(sqrtT)$ regretのエピソードMDPに対して,最初の効率的な帯域幅学習アルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:03:24 GMT)
Make Every Draft Count: Hidden State based Speculative Decoding [7.4] 廃棄されたドラフトを再利用トークンに変換する新しいシステムを提案する。
私たちの重要な洞察は、隠れた状態レベルで自動回帰予測を実行することです。
我々は、標準的な投機的復号化に対して3.3倍のスピードアップを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:25:21 GMT)
SurvKAN: A Fully Parametric Survival Model Based on Kolmogorov-Arnold Networks [7.4] Kolmogorov-Arnold Networks (KAN) に基づく完全パラメトリック・時間連続生存モデルであるSurvKANを紹介する。
SurvKANは時間を、ログハザード関数を直接予測するkanへの明示的な入力として扱い、完全な生存可能性に関するエンドツーエンドのトレーニングを可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:49:14 GMT)
PRISM: Parametrically Refactoring Inference for Speculative Sampling Draft Models [7.3] 大きな言語モデル(LLM)は、自己回帰的な性質に制約され、遅い復号に悩まされる。
本稿では,各予測ステップの計算を異なるパラメータ集合に分散するPRISMを提案する。
PRISMは、既に高度に最適化された推論エンジンの復号スループットを2.6倍以上向上させることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:46:03 GMT)
LEMON: Local Explanations via Modality-aware OptimizatioN [7.2] LEMONはマルチモーダル予測の局所的な説明のためのモデルに依存しないフレームワークである。
モダリティレベルの貢献と特徴レベルの属性を両立させる統一的な説明を生成する。
強力なマルチモーダルベースラインに比べて,ブラックボックス評価を35~67倍,ランタイムを2~8倍削減しながら,競争力のある削除ベースの忠実性を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:40:59 GMT)
Learning Beyond the Gaussian Data: Learning Dynamics of Neural Networks on an Expressive and Cumulant-Controllable Data Model [7.2] 本研究では、モーメント制御可能な非ガウスデータモデルを用いて、ニューラルネットワーク(NN)の学習力学に対するデータの高次統計の影響について検討する。
データモデルから生成されたサンプルを用いて,2層NNを用いてオンライン学習実験を制御した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:29:33 GMT)
Latent Perspective-Taking via a Schrödinger Bridge in Influence-Augmented Local Models [7.2] インフルエンサーベース抽象化に基づいて、インフルエンサー強化ローカルモデルを作成し、社会的に認識されたロボットタスクを局所力学に分解する。
このアーキテクチャにより、モデルに基づく強化学習において、エージェントが社会的に認識されたポリシーを合成できることが示される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:05:23 GMT)
AdaptNC: Adaptive Nonconformity Scores for Uncertainty-Aware Autonomous Systems in Dynamic Environments [7.2] コンフォーマル予測法は、コンフォーマル閾値を適応的にスケーリングすることで目標範囲を維持する。
この固定幾何は, 環境が構造変化を起こすと, 極めて保守的で, 容積非効率な予測領域につながることを示す。
非整合スコアパラメータと整合しきい値の両方をオンライン化するためのフレームワークである textbfAdaptNC を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:41:35 GMT)
HopFormer: Sparse Graph Transformers with Explicit Receptive Field Control [7.2] 本稿では,頭部固有のn-ホップマスクによるスパースアテンションを通じてのみ構造を注入するグラフトランスであるHopFormerを紹介する。
提案手法は, 多様なグラフ構造に対して, 競争力や優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:09:58 GMT)
Two-Stage Grid Optimization for Group-wise Quantization of LLMs [7.1] グループワイド量子化は、大規模言語モデルの低ビット量子化における精度劣化を緩和するための効果的な戦略である。
本稿では,階層的再構成損失を明示的に最小化するグループスケールの2段階最適化フレームワークを提案する。
提案手法は群量子化を常に強化し, 無視できるオーバーヘッドで高い精度を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:12:34 GMT)
Scaling Small Agents Through Strategy Auctions [6.9] 我々は,小エージェントの性能が深層検索やコーディングタスクにおいて,タスクの複雑さを伴ってスケールしないことを示す。
フリーランサーマーケットプレースにインスパイアされたエージェントフレームワークである、ワークロード効率のためのStrategy Auctionsを紹介する。
SALEは最大のエージェントへの依存を53%減らし、全体のコストを35%減らし、最大のエージェントのpass@1を継続的に改善することを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:05:51 GMT)
Finite-Sample Wasserstein Error Bounds and Concentration Inequalities for Nonlinear Stochastic Approximation [6.8] ワッサーシュタイン-$p$距離における非線形近似アルゴリズムの非漸近誤差境界を導出する。
正規化された最後の繰り返しは、$p$-ワッサーシュタイン距離のガウス分布に階数$_n1/6$で収束することを示し、$_n$はステップサイズである。
これらの分布保証は、モーメント境界やマルコフの不等式から得られるものより改善される高確率濃度の不等式を暗示する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:41:06 GMT)
DFKI-Speech System for WildSpoof Challenge: A robust framework for SASV In-the-Wild [6.7] 本研究では,スプーフィング検知器と話者検証ネットワークをタンデムで動作させる頑健なSASVフレームワークを提案する。
話者検証には、複数のスケールで2Dと1Dの機能を融合する低複雑さ畳み込みニューラルネットワークを適用する。
固定コホートに基づくASノルムスコア正規化とモデルアンサンブルは、話者検証システムの識別能力を高めるために用いられる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:27:04 GMT)
Active Causal Experimentalist (ACE): Learning Intervention Strategies via Direct Preference Optimization [6.6] 実験者はシーケンシャルな決定問題に直面し、それぞれの介入は次に何を試すべきかを知らせるべき情報を明らかにする。
ランダムサンプリング、欲求情報、ラウンドロビンカバレッジといった従来のアプローチは、それぞれの決定を分離して扱う。
本稿では,実験設計を原則的方針として学習する能動実験因果論(ACE)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:43:52 GMT)
ToPT: Task-Oriented Prompt Tuning for Urban Region Representation Learning [6.6] ToPTは,空間認識型領域埋め込み学習(SREL)とタスク認識型領域埋め込みプロンプト(Prompt4RE)の2つのモジュールから構成される。
Prompt4REはタスク指向のプロンプトを実行する: フリーズされたマルチモーダルな大規模言語モデル(MLLM)はタスク固有のテンプレートを処理し、セマンティックベクターを得る。
複数のタスクや都市での実験では最先端のパフォーマンスを示し、64.2%まで改善されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:56:05 GMT)
Preserve-Then-Quantize: Balancing Rank Budgets for Quantization Error Reconstruction in LLMs [6.6] 量子化エラー再構成(QER)は、量子化エラーを再現するためにランク=$r$の補正を用いて、重量を$mathbfW approx mathbfQ + mathbfLmathbfR$と近似することで、PTQ(Post-Training Quantization)の精度損失を低減する。
SRR(Structured Residual Residual Restruction)は、量子化前のアクティベーションスケールウェイトのトップ$k$特異部分空間を保存し、残余のみを量子化し、残余を$rとするランク割り当てフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:02:21 GMT)
Zero2Text: Zero-Training Cross-Domain Inversion Attacks on Textual Embeddings [6.5] オンラインアライメントに基づくトレーニングフリーフレームワークであるZero2Textを紹介した。
我々は、差分プライバシーのような標準的な防御が、この適応的な脅威を効果的に軽減できないことを証明している。
ベースラインよりも1.8倍高いROUGE-Lと6.4倍高いBLEU-2スコアを達成し、単一のリークデータペアなしで未知のドメインから文を復元する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:42:18 GMT)
Know Your Step: Faster and Better Alignment for Flow Matching Models via Step-aware Advantages [6.5] 本研究では,画像モデルに対するフローマッチングテキストを,人間の好みによく適合した効率的な数ステップ生成器にトレーニングするための新しいフレームワークを提案する。
TAFS GRPOは画像生成のステップ数で高い性能を示し、生成した画像と人間の好みとのアライメントを大幅に改善する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:32:00 GMT)
PokeNet: Learning Kinematic Models of Articulated Objects from Human Observations [6.4] 構音モデリングにより、ロボットは、効果的に操作するための調音物体の関節パラメータを学習することができる。
既存のアプローチは、しばしば、関節の数や種類など、オブジェクトに関する事前の知識に依存している。
我々はPokeNetを紹介した。PokeNetは、オブジェクトの事前の知識を使わずに、単一の人間の実演から調音モデルを推定するエンドツーエンドフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:55:02 GMT)
Perfusion Imaging and Single Material Reconstruction in Polychromatic Photon Counting CT [6.4] 灌流CT(Perfusion Computed Tomography)は、コントラスト剤の体内動態を経時的に画像化する。
近年, 単体多色光子計数CTにおける理論的に正当化された再構成アルゴリズムが提案されている。
VI-PRISM (VI-based Perfusion Imaging and Single Materials reconstruction) と呼ぶ。
水とヨウ素濃度の異なるデジタルファントムを用いて線量還元灌流CTの有用性を評価した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:27:55 GMT)
Bimanual High-Density EMG Control for In-Home Mobile Manipulation by a User with Quadriplegia [6.4] 自宅の移動マニピュレータは、頚髄損傷(cSCI)の患者が日常的な身体的作業を行うことを可能にする。
2次元高密度筋電図(HDEMG)を用いて四肢麻痺患者が自宅の移動マニピュレータを制御できる最初のシステムを導入・展開する。
両腕に装着した一対のカスタム・ファブリック一体型HDEMG前腕スリーブを開発した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:28:18 GMT)
Understanding and Detecting Flaky Builds in GitHub Actions [6.4] 我々は,1,960のJavaプロジェクトからのデータの再実行に基づいて,GitHub Actionsにおけるフレキビルドに関する大規模な実証的研究を行った。
フレキなテスト、ネットワークの問題、依存関係の解決がもっとも多い15の異なる障害カテゴリを特定します。
本稿では,ジョブレベルでのフレキシブル障害検出のための機械学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:39:56 GMT)
Insight Agents: An LLM-Based Multi-Agent System for Data Insights [6.3] 我々は、対話型マルチエージェントデータインサイトシステムであるInsight Agents(IA)を開発し、個人化されたデータとビジネスインサイトを提供する。
IAは米国でAmazonの販売者向けにローンチされており、人間の評価に基づいて90%の精度を達成しており、P90のレイテンシは15秒以下である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:17:35 GMT)
Multi-party Computation Protocols for Post-Market Fairness Monitoring in Algorithmic Hiring: From Legal Requirements to Computational Designs [6.2] 市場後の公正度監視は、リスクの高いAIシステムの公正性と説明責任を保証するために義務付けられている。
MPCは、市場の公正な監視に準拠する有望な技術基盤を提供する。
技術的関心が高まっているにもかかわらず、実世界の雇用状況におけるMPCベースの公正監視の運用は未だに不明である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:09:07 GMT)
ATLAS : Adaptive Self-Evolutionary Research Agent with Task-Distributed Multi-LLM Supporters [6.1] ATLASは、軽量な研究エージェントを反復的に開発するタスク分散フレームワークである。
我々のコアアルゴリズムであるEvolving Direct Preference Optimization (EvoDPO)は、位相インデックス付き参照ポリシーを適応的に更新する。
その結果,ATLASは静的単一エージェントベースラインの安定性と性能を向上させることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:23:33 GMT)
Efficient Softmax Reformulation for Homomorphic Encryption via Moment Generating Function [6.1] MGF-softmaxはモーメント生成関数に基づく新しいソフトマックス再構成である。
暗号化推論におけるソフトマックスの効率的かつ正確な近似を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:33:12 GMT)
Minimax optimal differentially private synthetic data for smooth queries [6.1] ハイパーキューブでサポートされたサイズ$n$のデータセットから、$(varepsilon,)$-differentially privateな合成データを生成する問題について検討する。
我々は、$n-min 1, frackd$のミニマックス誤差率を$log(n)$ factorまで提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:54:11 GMT)
Sampling-Free Privacy Accounting for Matrix Mechanisms under Random Allocation [6.1] 本研究では,行列係数化を用いた差分プライベートモデル学習におけるランダムアロケーション下でのプライバシの増幅について検討する。
我々のフレームワークは任意のバンド化および非バンド化行列に適用できる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:10:13 GMT)
Self-Supervised Learning from Structural Invariance [6.1] 共同埋め込み型自己教師あり学習(SSL)における一対多マッピング問題について検討する。
既存の手法はこの条件の不確かさを柔軟に捉えるのに苦労していることを示す。
ビデオ上での因果表現学習、きめ細かい画像理解、世界モデリングにおいて、その汎用性を実証的に示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:44:44 GMT)
Active learning from positive and unlabeled examples [6.0] 正およびラベルなしデータ(PU学習)からの学習は、二項分類の弱い教師付き変種である。
本研究では,学習者が未ラベルのプールからインスタンスを適応的にクエリできる,アクティブなPU学習環境について検討する。
我々は,アクティブPU学習のラベル複雑性に関する最初の理論的解析を行った。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:28:24 GMT)
COLT: Lightweight Multi-LLM Collaboration through Shared MCTS Reasoning for Model Compilation [5.8] コンパイラ最適化のための軽量協調型マルチLLMフレームワークであるCOLTを提案する。
重要な貢献は、単一の共有MCTSツリーをLLM間の協調基盤として使用することである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:37:05 GMT)
Language Family Matters: Evaluating LLM-Based ASR Across Linguistic Boundaries [5.8] 大言語モデル (LLM) を利用した自動音声認識 (ASR) システムは限られた資源で高い性能を達成する。
本稿では,言語家族のメンバーシップに基づく,効率的で斬新なコネクタ共有戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:02:52 GMT)
Dicta-LM 3.0: Advancing The Frontier of Hebrew Sovereign LLMs [5.8] Dicta-LM 3.0はヘブライ語と英語のテキストのコーパスに基づいて訓練された大規模言語モデルのオープンウェイトコレクションである。
本モデルを評価するため,ヘブライ語チャット-LLMの評価のためのベンチマークスイートを新たに導入した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:47:54 GMT)
The Geometry of Representational Failures in Vision Language Models [5.7] VLM(Vision-Language Models)は、多目的視覚タスクにおけるファズリング障害を示す。
これらの誤りは「バインディング問題」のような人間の認知的制約を反映している
オープンウェイトVLMの表現幾何学を解析し,メカニスティックな知見を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:20:04 GMT)
Masked Autoencoders as Universal Speech Enhancer [5.7] マスク付きオートエンコーダをベースとしたユニバーサル音声エンハンサーは、自己教師方式で訓練される。
提案手法は,ドメイン内およびドメイン外両方の評価データセットに対して,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:13:59 GMT)
Position: The Inevitable End of One-Architecture-Fits-All-Domains in Time Series Forecasting [5.6] 時系列予測タスクにおけるニューラルネットワークアーキテクチャの本質的限界を分析する。
私たちは時系列コミュニティに、一般的なドメインのための時系列ニューラルネットワークアーキテクチャの研究から、焦点を移すことを求めます。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:19:16 GMT)
One-Step Diffusion for Perceptual Image Compression [5.6] 拡散に基づく画像圧縮法は, 高い知覚品質を低速で実現し, 顕著な進歩を遂げた。
しかし、彼らの実践的なデプロイメントは、大きな推論遅延と重い計算オーバーヘッドによって妨げられている。
本稿では,単段階拡散プロセスのみを必要とする拡散に基づく画像圧縮手法を提案し,推論速度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:04:08 GMT)
FORLER: Federated Offline Reinforcement Learning with Q-Ensemble and Actor Rectification [5.4] インターネット・オブ・シングスシステムでは、生データを共有せずに並行的な政策訓練を可能にすることにより、連合学習はオンライン強化学習(RL)を進歩させてきた。
本稿では,サーバ上のQアンサンブルアグリゲーションとデバイス上でのアクタ修正を組み合わせたFOLLERを提案する。
サーバは、プライバシを損なうことなく、デバイスのQ関数を堅牢にマージし、ポリシーの汚染を抑制し、リソースに制約のあるハードウェアから重い計算をシフトする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:57:09 GMT)
Reliable Real-Time Value at Risk Estimation via Quantile Regression Forest with Conformal Calibration [5.4] 本稿では,最も広く利用されているリスク対策の一つ,バリュー・アット・リスク(VaR)のオンライン評価について検討する。
本稿では,オフラインシミュレーション・オンライン推定フレームワークにおいて,量子回帰フォレスト(quantile regression forest)を提案する。
我々は、OSOAの定式化に基づいて、コンフォメーションキャリブレーションを利用して、リアルタイムVaRを確実に推定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:18:31 GMT)
CAPS: Unifying Attention, Recurrence, and Alignment in Transformer-based Time Series Forecasting [5.3] CAPSは相整合のためのSO(2)回転と3つの加法的ゲーティング経路を結合する。
時間的重要性の共有概念を通じてこれらの経路を変調する学習時間重み付けであるクロック機構を導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:44:24 GMT)
Automated Multiple Mini Interview (MMI) Scoring [5.3] 現状の理性に基づく微調整手法は,Mini-Interviewsの抽象的,文脈依存的な性質に苦慮していることを示す。
本稿では,評価プロセスを書き起こし改良と基準固有スコアに分解するマルチエージェントプロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:20:25 GMT)
Hyperbolic Graph Neural Networks Under the Microscope: The Role of Geometry-Task Alignment [5.1] ハイパーボリックグラフニューラルネットワーク(HGNN)は、木のようなグラフ上での表現学習の原則として広く採用されている。
対象の計量構造が入力グラフのそれに従うか否かを,幾何-タスクアライメントの付加条件として提案する。
HGNNは、そのようなアライメントの下でユークリッドモデルより一貫して優れているが、その利点は消える。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:01:58 GMT)
Act or Clarify? Modeling Sensitivity to Uncertainty and Cost in Communication [5.0] コミュニケーション設定では、不確実性を減らす重要な方法は、明確化質問(CQ)を問うことである。
我々は、CQを問う決定は、文脈の不確実性と代替行動のコストの両方に依存すると予測する。
我々は、この相互作用を期待された後悔に基づく計算モデルで定式化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:45:52 GMT)
When Noise Lowers The Loss: Rethinking Likelihood-Based Evaluation in Music Large Language Models [5.0] 音楽大言語モデル(LLM)は、出力品質を評価する堅牢な方法を必要とする。
モデルが体系的に破損した音楽に遭遇し、独立した品質指標としての妥当性を損なうことを示す。
絶対値ではなく、損失曲線の形状は、生成されたコンテンツの品質に関する重要な情報を符号化します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:53:12 GMT)
SysFuSS: System-Level Firmware Fuzzing with Selective Symbolic Execution [4.9] 既存のファジィアはカーネルレベルの脆弱性を検出するのに適さないユーザレベルのファジィングに重点を置いている。
本稿では,システムレベルのファジィ化と選択的シンボル実行を統合する,効率的なファームウェア検証フレームワークであるSysFuSSを提案する。
SysFuSSは、ブランチカバレッジとファームウェア脆弱性の検出の両方の観点から、最先端のファズーよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:52:20 GMT)
Privacy Amplification by Missing Data [4.9] 差分プライバシーの枠組みの中で、欠落したデータをプライバシー増幅機構として分析する。
我々は、不完全なデータが、微分プライベートアルゴリズムのプライバシーの増幅をもたらすことを初めて示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:28:41 GMT)
Sub-optimality bounds for certainty equivalent policies in partially observed systems [4.9] 一般(非線形)部分観測系に対する確実な等価ポリシーを考える。
コストと力学が適切な意味で滑らかなモデルに対しては、一定の等価ポリシーの準最適性に関する上限を導出する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:12:13 GMT)
Predicting first-episode homelessness among US Veterans using longitudinal EHR data: time-varying models and social risk factors [4.8] 276,403人の獣医師のデータを分析し、2017年3~12カ月後に発生した最初期のホームレスを予測した。
縦型モデルに社会的要因と行動的要因を取り入れたことにより,曲線下(PR-AUC)の精度が15~30%向上した。
これらの結果から,縦断的かつ社会的にインフォームドされたEHRモデリングは,ホームレスのリスクを行動可能な層に集中させ,リスクの高いベテランに対する標的的・データインフォームド予防戦略を可能にすることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:46:46 GMT)
Real-time topology-aware M-mode OCT segmentation for robotic deep anterior lamellar keratoplasty (DALK) guidance [4.8] UNeXtに基づく軽量なトポロジ対応Mモードセグメンテーションパイプラインを提案する。
提案方式は,全前処理推定オーバレイパイプライン上で計測された80Hzを超えるエンドツーエンドスループットを実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:58:04 GMT)
SNAP: A Self-Consistent Agreement Principle with Application to Robust Computation [4.8] SNAP(Self-coNsistent Agreement Principle)は、相互合意に基づく堅牢な計算のための自己組織化されたフレームワークである。
SNAPは、合意を定量化し、信頼できる項目を強調し、監督や事前の知識なしにアウトリーチを下げる重みを割り当てる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:10:31 GMT)
Rotation-free Online Handwritten Character Recognition Using Linear Recurrent Units [4.8] オンライン手書き文字認識は、一般的にオフライン認識よりも精度と堅牢性が高い。
現実的な応用として、回転変形はストロークの空間的レイアウトを妨害し、認識精度を大幅に低下させる。
Sliding Window Path Signature (SW-PS) を用いて文字の局所的構造的特徴を捉えるとともに,LRU(Linear Recurrent Units) を分類器として導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:57:45 GMT)
SSI-DM: Singularity Skipping Inversion of Diffusion Models [4.7] 既存の手法は、初期ノイズ発生過程における不正確さのため、編集性に乏しい非ガウスノイズを生成する。
本稿では,SSI-DM(Singularity Skipping Inversion of Diffusion Models)を提案する。
一般拡散モデルに適合するプラグアンドプレイ技術として,提案手法は,公開画像データセット上での優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:59:58 GMT)
Weighted Temporal Decay Loss for Learning Wearable PPG Data with Sparse Clinical Labels [4.7] トレーニング戦略は、セグメントとその基底真理ラベル間の時間的ギャップを通じて、サンプル重量のバイオマーカー特異的な崩壊を学習する。
10のバイオマーカーからなる450人の参加者によるスマートウォッチPPGでは、このアプローチはベースラインよりも改善されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:43:40 GMT)
CATTO: Balancing Preferences and Confidence in Language Models [4.7] 大規模言語モデル(LLM)は、しばしば正確な次のトークン予測を行うが、これらの予測に対する信頼度は不十分である。
本稿では,予測信頼度と経験的予測正しさを一致させる予測キャリブレーションを意識した目標を提案する。
出力トークンのベイズ最適選択に校正トークン確率を活用するテスト時間スケーリング機構であるConfidence@kを導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:45:18 GMT)
Physics-based generation of multilayer corneal OCT data via Gaussian modeling and MCML for AI-driven diagnostic and surgical guidance applications [4.5] 角膜光コヒーレンストモグラフィー(OCT)イメージングのための深層学習モデルの訓練は、大きく、よく注釈付けされたデータセットを使用することによって制限される。
画素レベル5層セグメンテーションラベルを用いた合成角膜BスキャンOCT画像を生成するモンテカルロシミュレーションフレームワークを提案する。
結果として得られたデータセットは、制御された地道条件下でのAIモデルの体系的なトレーニング、検証、およびベンチマークを可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:07:29 GMT)
Observation-dependent Bayesian active learning via input-warped Gaussian processes [4.5] 本稿では,学習されたモノトーン再パラメータ化によって入力空間を歪曲することで,観測依存性のフィードバックを注入することを提案する。
このメカニズムにより、設計ポリシーは、観測された可変性に応じて入力空間の領域を拡大または圧縮することができる。
このようなワープは限界的可能性によって訓練できるが、新規な自己監督的目標が性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:05:56 GMT)
PIMPC-GNN: Physics-Informed Multi-Phase Consensus Learning for Enhancing Imbalanced Node Classification in Graph Neural Networks [4.5] PIMPC-GNNは、不均衡ノード分類のための物理インフォームドコンセンサスフレームワークである。
本手法は, (i) 熱力学的拡散, (ii) 倉本同期, (iii) スペクトル埋め込みの3つの相補的ダイナミクスを統合する。
5つのベンチマークデータセットと5-100の不均衡比率で、PIMPC-GNNは16の最先端ベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:21:58 GMT)
PIMCST: Physics-Informed Multi-Phase Consensus and Spatio-Temporal Few-Shot Learning for Traffic Flow Forecasting [4.5] 本稿では,交通予測を多相コンセンサス学習問題として再検討した,数ショットの交通予測のためのマルチフェーズ・コンセンサスS-テンポラル・フレームワークを提案する。
枠組みは,(1)拡散・同期・スペクトル埋め込みによる交通動態をモデル化し,包括的動的特徴付けを行う多相エンジン,(2)強制しながら位相固有予測を動的に融合する適応型コンセンサス機構,(3)最小限のデータで新しい都市に迅速に適応するための構造化メタラーニング戦略である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:40:07 GMT)
LmPT: Conditional Point Transformer for Anatomical Landmark Detection on 3D Point Clouds [4.5] そこで本稿では,Landmark Point Transformer (LmPT) を提案する。
LmPTモデルは、異なる入力タイプへの適応性を、種間学習の実行を可能にする条件付け機構を組み込んでいる。
本研究は,ヒトおよび新たに注釈を付けた犬大腿骨を用いた大腿骨のランドマーク化に焦点をあて,その一般化と種間の有効性を実証するものである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:06:36 GMT)
World-Gymnast: Training Robots with Reinforcement Learning in a World Model [4.5] 本稿では、アクション条件付きビデオワールドモデルにポリシーをロールアウトすることで、視覚言語アクションポリシーのRL微調整を行うWorld-Gymnastを提案する。
Bridgeロボットのセットアップでは、World-GymnastはSFTを最大18倍上回り、ソフトウェアシミュレータを最大2倍上回る。
我々の結果は、クラウドで世界モデルを学び、ロボットポリシーを訓練することが、デモで作業するロボットと、誰でも使えるロボットのギャップを埋める鍵になり得ることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:44:45 GMT)
An Optimization Method for Autoregressive Time Series Forecasting [4.5] 現在の時系列予測モデルは、主にトランスフォーマースタイルのニューラルネットワークに基づいている。
本稿では,2つの重要な特性を強制する時系列予測のための新しいトレーニング手法を提案する。
提案手法はiTransformerと比較してMSEを10%以上削減する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:28:00 GMT)
Governance at the Edge of Architecture: Regulating NeuroAI and Neuromorphic Systems [4.5] 現在のAIガバナンスフレームワークは、von Neumannハードウェア上で静的で集中的にトレーニングされた人工知能ニューラルネットワーク用に構築されている。
ニューロAIシステムは、ニューロモルフィックなハードウェアに具現化され、スパイクニューラルネットワークによって実装され、これらの仮定を破る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:33:19 GMT)
DSXFormer: Dual-Pooling Spectral Squeeze-Expansion and Dynamic Context Attention Transformer for Hyperspectral Image Classification [4.4] DSXFormerは、HSICのための動的コンテキストアテンションを備えた新しいデュアルプール式圧縮膨張トランスである。
最先端の手法を一貫して上回り、それぞれ99.95%、98.91%、99.85%、98.52%の分類精度を達成している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:12:18 GMT)
Towards Ultimate Accuracy in Quantum Multi-Class Classification: A Trace-Distance Binary Tree AdaBoost Classifier [4.4] TTA(Trace-Distance binary Tree AdaBoost)は、量子多クラス分類のための実用的なパイプラインである。
私たちの結果は実証的で、短期的なプラットフォーム上で実装可能です。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:02:05 GMT)
A Proxy Stakeholder Approach to Requirements Engineering for Inclusive Navigation [4.3] ウェイフィンディング(Wayfinding)または周囲をナビゲートする能力は、独立した生活に不可欠である。
認知障害(IwCI)を持つ個人はしばしば、環境を学習し、ナビゲートする上で重要な課題に直面します。
本研究は,地域探索を社会的に分散した課題として再編成し,プロキシーステークホルダーの役割を強調した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:24:52 GMT)
MLV-Edit: Towards Consistent and Highly Efficient Editing for Minute-Level Videos [4.3] MLV-Editは、マイクロレベルのビデオ編集のためのトレーニング不要なフローベースのフレームワークである。
2つのコアモジュールによって促進されるセグメンテーションワイドな編集に、ディバイス・アンド・コンカ戦略を採用している。
時間的安定性と意味的忠実性の観点から、最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:07:00 GMT)
AutoSizer: Automatic Sizing of Analog and Mixed-Signal Circuits via Large Language Model (LLM) Agents [4.3] AutoSizerは、回路理解、適応的な検索空間の構築、クローズドループでの最適化オーケストレーションを統合するメタ最適化フレームワークである。
実験により、様々な回路困難に対して、より高い溶液品質、より高速な収束、高い成功率を達成できる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:51:55 GMT)
TABX: A High-Throughput Sandbox Battle Simulator for Multi-Agent Reinforcement Learning [4.3] 我々は、再構成可能なマルチエージェントタスクのために、JAX (TABX) におけるトータル・アクセラレーション・バトルシミュレータを導入する。
TABXは大規模な並列化を可能にし、計算オーバーヘッドを大幅に削減する。
高速でスケーラブルで簡単にカスタマイズできるフレームワークを提供することで、TABXは将来の研究のためのスケーラブルな基盤となる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:34:38 GMT)
Beyond the Prompt: Assessing Domain Knowledge Strategies for High-Dimensional LLM Optimization in Software Engineering [4.2] 私たちは、ドメイン知識を生成するために、人間と人工知能の戦略を比較します。
構造化知識の統合により、LLMが高次元最適化のための効果的なウォームスタートを生成することができるかどうかを決定するために、4つの異なるアーキテクチャを体系的に評価する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:07:15 GMT)
Reformulating AI-based Multi-Object Relative State Estimation for Aleatoric Uncertainty-based Outlier Rejection of Partial Measurements [4.1] 本稿では,AIに基づくオブジェクト相対状態推定における測定方程式の再構成の利点について述べる。
位置と回転の測定を分離できるので、誤った回転測定の影響を抑えることができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:04:34 GMT)
Mapping-Guided Task Discovery and Allocation for Robotic Inspection of Underwater Structures [4.1] 水中マルチロボット検査のためのタスク生成は、既存の幾何学の事前知識なしで実現できる。
タスクのセットはSLAMメッシュから生成され、期待されるキーポイントスコアと距離ベースのプルーニングによって最適化される。
その結果, 模擬ヴォロノイ分割とブーストロフェドンパターンを比較し, 試験環境のモデルにおける検査カバレッジについて検討した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:51:32 GMT)
MARA: Continuous SE(3)-Equivariant Attention for Molecular Force Fields [4.0] 機械学習力場(MLFF)は、正確で効率的な原子論モデリングに欠かせないものとなっている。
分子領域への球面の注意を拡大するモジュールであるモジュールMARA(Modular Angular-Radial Attention)を導入する。
MARAは、近隣の原子の角座標と放射座標を直接操作し、局所環境の柔軟な重み付けを可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:08 GMT)
Sinhala Physical Common Sense Reasoning Dataset for Global PIQA [4.0] 本論文は,Global PIQAの一部として作成したSinhala物理感覚推論データセットについて述べる。
110個の人によって作成され、検証されたデータサンプルが含まれており、各サンプルはプロンプト、対応する正しい回答、間違った回答で構成されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:13:53 GMT)
Logic-Guided Vector Fields for Constrained Generative Modeling [3.9] ニューロシンボリックシステムは、シンボリック論理の表現的構造とニューラルラーニングの柔軟性を組み合わせることを目的としている。
本稿では,フローマッチング生成モデルに記号的知識を注入するニューロシンボリックフレームワークLGVFを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:09:42 GMT)
Transfer Learning Through Conditional Quantile Matching [3.9] 我々は、異種ソースドメインを利用した回帰学習フレームワークを導入し、データスカースターゲットドメインにおける予測性能を改善する。
提案手法は,各ソース領域に対して個別に条件生成モデルを学習し,条件量子マッチングにより対象ドメインに対する応答を校正する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:19:55 GMT)
Universal Redundancies in Time Series Foundation Models [3.9] Time Series Foundation Models (TSFM) は、推論中に未確認の時系列を正確に予測するために、広範囲の事前トレーニングを活用する。
本稿では,TSFMの機械的解釈性向上のためのツールセットについて紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:53:46 GMT)
Efficiency Optimizations for Superblock-based Sparse Retrieval [3.8] 本稿では,競争的妥当性を保ちながら,超ブロックスコアのオーバーヘッドを低減する,シンプルで効果的な超ブロックプルーニング手法を提案する。
このスキームは、コンパクトなインデックス構造と、LSRモデルと複数のデータセットで有効である堅牢なゼロショット構成を組み合わせる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:42:22 GMT)
Near-Universal Multiplicative Updates for Nonnegative Einsum Factorization [3.8] NNEinFactは、テンソルの縮約として表現可能な任意の非負のテンソル因子化に適合するeinsumベースの乗法的更新アルゴリズムである。
損失の最小限に収束し、欠落したデータをサポートし、数億のエントリを数秒でテンソルに適合する。
勾配に基づく手法のテスト損失の半数以下を達成し、最大90倍の速度で収束する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:09:57 GMT)
Enhancing Automated Essay Scoring with Three Techniques: Two-Stage Fine-Tuning, Score Alignment, and Self-Training [3.8] 本研究では,制限データとフルデータの両方でAES性能を向上させる新しい手法を提案する。
我々は、低ランク適応を活用して、エッセイのプロンプトをターゲットとしたAESモデルをより良く適応する2段階微調整戦略を導入する。
次に,予測値と真のスコア分布の整合性を改善するためのスコアアライメント手法を提案する。
第3に、未ラベルデータを用いた不確実性を考慮した自己学習を採用し、擬似ラベルデータを用いてトレーニングセットを効果的に拡張する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:29:15 GMT)
Misconception Diagnosis From Student-Tutor Dialogue: Generate, Retrieve, Rerank [3.8] 大規模言語モデル(LLM)を用いた学生と教師の対話から誤解を検出するための新しいアプローチを提案する。
まず、微調整のLSMを用いて、最も有望な候補を抽出する。
これらの候補は、誤解の関連性を改善するために、別の微調整LDMによって評価され、再ランクされる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:14:35 GMT)
Propagating the prior from far to near offset: A self-supervised diffusion framework for progressively recovering near-offsets of towed-streamer data [3.7] トレッド・ストリーマーの地震では、最も近いハイドロフォンはしばしば源から200メートル離れている。
本稿では,近接オフセット参照データを必要とせずに,欠落したニアオフセットトレースを再構成する自己教師付き拡散ベースフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:13:18 GMT)
Trust Region Continual Learning as an Implicit Meta-Learner [3.7] 我々は,生産的リプレイとフィッシャー計量信頼領域制約を併用した,エフェトラスト領域連続学習のハイブリッド視点について検討する。
局所近似では,MAMLスタイルの解釈を単一の暗黙的な内部ステップで行うことができた。
これにより、連続学習における創発的なメタラーニング特性が得られる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:19:16 GMT)
Testing Storage-System Correctness: Challenges, Fuzzing Limitations, and AI-Augmented Opportunities [3.7] システムテストに関する何十年もの研究にもかかわらず、多くのストレージシステム障害は、体系的に公開することが難しいままである。
このサーベイでは、システムテストのストレージ中心のビューを採用し、対象とする実行特性と障害メカニズムに応じて既存のテクニックを整理する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:34:05 GMT)
Implicit Bias in LLMs for Transgender Populations [3.7] 言語モデル(LLM)はLGBTQ+に対する偏見を示すことが示されている。
本研究では,2つの主要なシナリオにおけるトランスジェンダーに対する暗黙の偏見について検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:56:02 GMT)
SC3D: Dynamic and Differentiable Causal Discovery for Temporal and Instantaneous Graphs [3.7] textitStable Causal Dynamic Differentiable Discovery (SC3D) は、ラグ固有の隣接行列を共同で学習するフレームワークであり、もし存在するならば、瞬時指向の非巡回グラフである。
合成力学系およびベンチマーク力学系における数値計算の結果、SC3Dはラグ構造と瞬時因果構造の両方の安定性とより正確な回復を達成できることを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:32:18 GMT)
Mechanistic Indicators of Steering Effectiveness in Large Language Models [3.6] アクティベーションベースのステアリングにより、大規模言語モデルでは、トレーニングをせずに中間的アクティベーションに介入することで、ターゲットとなる振る舞いを表現できる。
広く使われているにもかかわらず、操舵が成功または失敗する際の機械的要因はいまだに理解されていない。
ステアリングの信頼性を内部モデル信号を用いて診断できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:56:22 GMT)
STEER: Inference-Time Risk Control via Constrained Quality-Diversity Search [3.6] 平均的正確性のために訓練された大規模言語モデル(LLM)は、しばしばモード崩壊を示し、複数の応答が妥当なタスクに対して狭い決定行動をもたらす。
我々は、この曖昧な制御を再導入するトレーニング不要のフレームワークであるSTEERを提案する。
2つの臨床トリアージベンチマークにおいて、STEERは温度に基づくサンプリングと静的なペルソナアンサンブルと比較して幅広い行動カバレッジを達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:10:32 GMT)
On the Feasibility of Hybrid Homomorphic Encryption for Intelligent Transportation Systems [3.6] ホモモルフィック暗号化(HE)は、暗号化されたメッセージ上で直接計算を可能にする。
実用的なHEスキームは、かなりの暗号文拡張と通信オーバーヘッドを引き起こす。
我々は、HHEを統合して機密車両データを保護する代表ITSアプリケーションの理論的モデルを開発する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:34:51 GMT)
Rethinking Test-Time Training: Tilting The Latent Distribution For Few-Shot Source-Free Adaptation [3.6] 完全に凍結したモデル体制下で, 数ショット分類のための基礎モデルの試験時間適応について検討した。
本稿では,エンコーダによって誘導される潜伏埋め込み分布に対して,測定値の変更を行うことにより,新しいタスクに予測を適応させる,最初のトレーニング不要推論手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:17:29 GMT)
DREAMS: A Social Exchange Theory-Informed Modeling of Misinformation Engagement on Social Media [3.5] textscDreamsは、誤情報のエンゲージメントをソーシャル交換の動的なプロセスとしてモデル化する、ソーシャル交換理論に基づくフレームワークである。
textscDreamsは、誤った情報のエンゲージメントを予測する際に最先端のパフォーマンスを達成し、平均的な絶対的なパーセンテージエラーは19.25$%に達する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:02:21 GMT)
Scientific Theory of a Black-Box: A Life Cycle-Scale XAI Framework Based on Constructive Empiricism [3.5] 我々は、黒(SToBB)の科学的理論について紹介する。
SToBBは、3つの義務を果たす: (i) ブラックボックスの振る舞いに関するすべての観察に関する経験的妥当性、 (ii) 明示的な更新コミットメントによる適応性、 (iii) 透明なドキュメントによる監査性。
我々はこれらの義務を、観測基盤、トレーサブル仮説、構築と修正のためのアルゴリズムコンポーネント、ドキュメントを規定する一般的なフレームワークとして運用する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:19:23 GMT)
A Single Revision Step Improves Token-Efficient LLM Reasoning [3.3] 大規模言語モデルのためのトレーニングフリーで推論のみのフレームワークであるPacket-Conditioned Revision (PACER)を紹介した。
PACERは、推論トレースを使用して、構造化された調整ステップを通じて結論を修正できる。
競争力のある数学のベンチマークでは、PACERは256サンプルの多数決の正確さと一致または超える。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:28:42 GMT)
Refining Decision Boundaries In Anomaly Detection Using Similarity Search Within the Feature Space [3.3] SDA2E(Sparse Dual Adversarial Attention-based AutoEncoder)を導入する。
本稿では,意思決定境界を効率的に洗練するための3つの新しい戦略を統合した類似性誘導型アクティブラーニングフレームワークを提案する。
SDA2Eは、複数のDARPAトランスペアレントコンピューティングシナリオを含む52の不均衡データセットにわたって広範囲に評価し、15の最先端の異常検出手法と比較した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:55:08 GMT)
Physics Informed Generative AI Enabling Labour Free Segmentation For Microscopy Analysis [3.3] 本稿では、シミュレーションと現実のギャップを埋めることのできる、労働自由化のための新しい枠組みを提案する。
我々は、不対向画像画像変換にCycleGAN(Cycle-Consistent Generative Adversarial Network)を用いる。
この合成データに特化して訓練されたU-Netモデルは、目に見えない実験画像に展開する際、顕著な一般化を示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:36:06 GMT)
FSCA-Net: Feature-Separated Cross-Attention Network for Robust Multi-Dataset Training [3.3] 本稿では,特徴表現をドメイン不変およびドメイン固有コンポーネントに分離する統合フレームワークを提案する。
新しいクロスアテンション融合モジュールは、これらのコンポーネント間の相互作用を適応的にモデル化し、効果的な知識伝達を保証する。
複数のクラウドカウントベンチマークの実験では、FSCA-Netは負の転送を効果的に軽減し、最先端のクロスデータセットの一般化を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:18:48 GMT)
SeNeDiF-OOD: Semantic Nested Dichotomy Fusion for Out-of-Distribution Detection Methodology in Open-World Classification. A Case Study on Monument Style Classification [3.2] SeNeDiF-OODはSemantic Nested Dichotomy Fusionに基づく新しい方法論である。
オープンな環境に暴露された実世界の建築様式認識システムであるMonuMAIを用いたケーススタディを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:37:43 GMT)
Vision-only UAV State Estimation for Fast Flights Without External Localization Systems: A2RL Drone Racing Finalist Approach [3.2] 本稿では,単眼RGBカメラとIMUを用いた高速UAVのオンボード状態推定手法を提案する。
提案手法は1600のシミュレーションと多数の実世界の実験を通じて徹底的に検証された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:32:19 GMT)
Hippasus: Effective and Efficient Automatic Feature Augmentation for Machine Learning Tasks on Relational Data [3.1] 基本テーブルと候補テーブルを接続する有望なジョインパスを特定し、これらのジョインを実行して、拡張データを実体化し、その結果から最も有意義な機能を選択する。
Hippasusという,3つの重要なコントリビューションを通じて両方の目標を達成するモジュール型フレームワークを紹介します。
公開データセットに対する実験結果から,Hippasusは最先端のベースラインに対して,機能拡張の精度を最大26.8%向上することが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:21:24 GMT)
Spot-Wise Smart Parking: An Edge-Enabled Architecture with YOLOv11 and Digital Twin Integration [3.0] スマートパーキングシステムは、混雑を減らし、ユーザの検索時間を最小化し、スマートシティの採用と都市移動性の向上に寄与する。
本研究では,大学構内における車両数から空きスペース数を推定し,駐車場の可利用性を監視するシステムを提案する。
本研究では,空間許容度を考慮した距離認識マッチング法に基づくスポットワイドな監視手法によりシステムを拡張し,アダプティブバウンディングボックス分割法により拡張した。
提案手法は,リソース制約エッジデバイス上での推測時間8秒を維持しつつ,98.80%のバランス精度を実現し,YOLOの能力を向上させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:39:37 GMT)
Sampling two-dimensional isometric tensor network states [2.9] 2次元(2次元)等尺テンソルネットワーク状態(isoTNS)のための2つの新しいサンプリングアルゴリズムを導入する。
第1のアルゴリズムは独立サンプリングを行い、関連する確率とともに単一の構成を生成する。
第2のアルゴリズムは、高確率構成とそれに対応する確率を識別するために、強欲な探索戦略を用いる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:54:25 GMT)
Quantum Circuit Representation of Bosonic Matrix Functions [2.9] 我々はイジング・ハミルトニアンの遷移振幅がハフニアンとループハフニアンに比例することを示した。
この結果は、単一光子とガウス状態のボソニックネットワークと量子スピンダイナミクスと行列関数を結合する統一的な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:41:32 GMT)
The Effect of Mini-Batch Noise on the Implicit Bias of Adam [2.9] 本稿では,ミニバッチノイズがAdamの暗黙の記憶バイアスにどのように影響するかを理解するための理論的枠組みを提案する。
大規模なバッチサイズの場合、メモリによる反正則化の規模が高くなる(一般化を促す)が、バッチサイズが小さくなると($に対する反正則化)依存が逆になる。
我々の一般化は、臨界バッチサイズのスケールにシフトするバッチサイズのスケールを結びつけます。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:59:24 GMT)
MGKAN: Predicting Asymmetric Drug-Drug Interactions via a Multimodal Graph Kolmogorov-Arnold Network [2.9] MGKANは、非対称なDDI予測に学習可能な基底関数を導入するグラフコルモゴロフ・アルノルドネットワークである。
薬理学的依存関係を捉えるため、MGKANは3つのネットワークビュー(非対称DDIネットワーク、協調相互作用ネットワーク、および生体化学的類似性ネットワーク)を統合する。
2つのベンチマークデータセットでは、MGKANは7つの最先端ベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:35:08 GMT)
Observing weakly broken conservation laws in a dipolar Rydberg quantum spin chain [2.8] 積分可能な量子多体族は広範な保存法則を持つが、その一部は脆弱である。
これは、14個のリドベルク原子の1次元量子スピン鎖に明らかな実験的な指紋を残していることを示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:58:52 GMT)
Age-Aware Edge-Blind Federated Learning via Over-the-Air Aggregation [2.8] 本研究では,複数のデバイスが同時にモデル更新を行う無線フェージングチャネル上でのフェデレーション学習について検討する。
そこで本稿では,機器のチャネル状態情報を必要とせず,効率の良いエンファージ対応エッジブレンドオーバーザエアFL手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:50:51 GMT)
Causality--Δ: Jacobian-Based Dependency Analysis in Flow Matching Models [2.7] フローマッチングは、ベース分布をデータに転送する速度場を学習する。
これらの流れを通して小さな潜伏摂動が伝播し、ジャコビアンベクター生成物(JVP)が生成した特徴の依存性構造に実用的なレンズを提供することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:52:52 GMT)
MetaCLASS: Metacognitive Coaching for Learning with Adaptive Self-regulation Support [2.7] メタ認知学習を,自己制御学習プロセスに沿った11の解釈可能な動作に対する移動選択として定式化するフレームワークであるMetaCLASSを紹介する。
我々は,問題と対話状況から,次のコーチの動きを予測するため,9つのLCMをベンチマークした。
最良のモデルは43.2%の精度しか達成せず、モデルは強制的介入バイアスを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:47:04 GMT)
Twinning Complex Networked Systems: Data-Driven Calibration of the mABCD Synthetic Graph Generator [2.7] 本稿では、マッチング構成を推定し、関連するエラーを定量化する手法を提案する。
構成パラメータ間の強い相互依存が独立推定を弱め、代わりに共同予測アプローチを好んでいることから,本課題は非自明であることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:40:19 GMT)
Sleep Reveals the Nonce: Breaking ECDSA using Sleep-Based Power Side-Channel Vulnerability [2.7] 楕円曲線デジタル署名アルゴリズム(ECDSA)は、符号単位のノイズの秘密性に依存する。
部分的なナンスリークでさえ、格子ベースの暗号解析によって長期的な秘密鍵を公開することができる。
ECDSAナンスを抽出するために、睡眠によって引き起こされるパワースパイクを利用する、未調査のパワーサイドチャネル脆弱性を導入する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:01:31 GMT)
A Semi-Supervised Pipeline for Generalized Behavior Discovery from Animal-Borne Motion Time Series [2.6] ガチョウの短い動きスニペットにおける一般化行動探索について検討した。
ラベル付きサブセットから埋め込み関数を学習する半教師付き探索パイプラインを提案する。
次にラベル付きサンプルとラベルなしサンプルの両方の埋め込みに対してラベル誘導クラスタリングを行い、候補行動群を形成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:57:50 GMT)
Implicit neural representation of textures [2.6] インプシット神経表現(INR)は、様々な領域において正確かつ効率的であることが証明されている。
本研究では,異なるニューラルネットワークを新しいテクスチャINRとして設計する方法について検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:17:20 GMT)
Neural Probabilistic Amplitude Shaping for Nonlinear Fiber Channels [2.6] 我々は,コヒーレントファイバシステムのための共分散学習フレームワークであるニューラル確率振幅整形を導入する。
提案方式は, 0.5dB信号対雑音比ゲインを, 単一スパン205kmをまたいだデュアルポーラライズ64-QAM伝送のシーケンス選択に与える。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:33:17 GMT)
Financial Bond Similarity Search Using Representation Learning [2.6] 数値的な財務属性は、しばしば発行部門やドミシレのような分類上の非金融属性を覆い隠す。
本稿では,これらの分類属性が拡散曲線の予測可能性を支配することを示し,それらの意味的類似性を捉えるための埋め込みモデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:45:55 GMT)
Handling Covariate Mismatch in Federated Linear Prediction [2.6] フェデレートラーニングは、生データを共有せずに予測モデルを協調的に訓練することを可能にする。
ほとんどの既存のメソッドは、すべてのクライアントが同じ機能を計測していると仮定します。
クライアントワイズMCARパターンの下で線形予測を形式化し、2つのモジュラーアプローチを開発する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:29:36 GMT)
Bandwidth-Efficient Multi-Agent Communication through Information Bottleneck and Vector Quantization [2.6] 本稿では,情報ボトルネック理論とベクトル量子化を組み合わせることで,マルチエージェント環境における選択的,帯域幅効率の高い通信を実現するフレームワークを提案する。
提案手法は,情報理論の原理的最適化により,タスククリティカルな情報を保存しながら,通信メッセージを圧縮・復号化することを学ぶ。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:32:28 GMT)
Towards Autonomous Instrument Tray Assembly for Sterile Processing Applications [2.5] 手術器具を滅菌トレイに分類し,構造的にパックする,完全自動化されたロボットシステムを提案する。
このシステムはビジョンモジュールと6-DOFのStaubli TX2-60Lロボットアームとカスタムのデュアル電磁グリップ、そして輸送中の機器の衝突を減らすルールベースのパッキングアルゴリズムを統合している。
実験により, ツール・ツー・ツール衝突の認識精度が高く, 統計的に有意な減少が認められた。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:46:31 GMT)
Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models [2.5] 本稿では,画像のユーザ定義領域を正確に局所的に制御する手法を提案する。
本手法は,局所条件を制御した高品質な画像を効果的に合成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:47:48 GMT)
Training-free score-based diffusion for parameter-dependent stochastic dynamical systems [2.5] パラメータ依存SDEのフローマップを学習するための学習自由条件拡散モデルフレームワークを提案する。
共同カーネル重み付きモンテカルロ推定器は、離散パラメータ値でサンプリングされた軌道データを用いて条件スコア関数を近似する。
生成された生成モデルは、トレーニング範囲内の任意のパラメータ値に対するサンプル軌跡を、再学習せずに生成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:54:36 GMT)
MoLF: Mixture-of-Latent-Flow for Pan-Cancer Spatial Gene Expression Prediction from Histology [2.4] 膵癌組織学的予測のための遺伝子モデルであるMOLFを導入する。
入力を特殊なサブネットワークに動的にルーティングすることで、MoLFは多様な組織パターンの最適化を効果的に分離する。
MoLFは、種間データに対するゼロショットの一般化を示し、基本的な保存されたヒスト分子機構を捉えることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:23:31 GMT)
LEC-KG: An LLM-Embedding Collaborative Framework for Domain-Specific Knowledge Graph Construction -- A Case Study on SDGs [2.4] LEC-KGは、Large Language Models (LLM) の意味的理解と知識グラフ埋め込み (KGE) の構造的推論を統合する
我々のフレームワークは、構造化されていないポリシーテキストを検証済みの知識グラフに確実に変換する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:37:17 GMT)
Ultrafast On-chip Online Learning via Spline Locality in Kolmogorov-Arnold Networks [2.3] 超高速オンライン学習は、量子コンピューティングや核融合の制御など、高周波システムにとって不可欠である。
これらの要件を満たすためには、厳密なメモリ制約の下での低レイテンシ、固定精度の計算が必要である。
これらの制約に適合するKAN(Kolmogorov-Arnold Networks)の重要な特性を同定する。
この研究は、サブマイクロ秒のレイテンシで、モデルなしのオンライン学習を初めてデモした。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:57:15 GMT)
Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training [2.3] Grappaは、勾配のみの通信を実行する分散GNNトレーニングフレームワークである。
各イテレーションでは、パーティションは独立してトレーニングされ、グローバルアップデートのためにのみ交換される。
また,Grappaは最先端システムに比べて,GNNを4倍(最大13倍)高速化することを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:44:12 GMT)
Nonlinear light cone spreading of correlations in a triangular quantum magnet: a hard quantum simulation target [2.3] 2次元三角反強磁性体KYbSe$$の実空間時間依存ファンホーブスピン相関を$G(r,t)$で解析する。
解析の結果,KYbSe$における非線形サブ弾道的低温輸送は,現在最先端の数値法やフィールド・オブ・ザ・アート法が再現されていないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:32:25 GMT)
Isotonic Layer: A Universal Framework for Generic Recommendation Debiasing [2.2] Isotonic Layerは、神経アーキテクチャに直交線形フィッティングを直接統合する、斬新で差別化可能なフレームワークです。
これにより、モデルのアウトプットは、遅延関連性、相対性、品質スコアなどの重要な特徴と論理的に整合性を保つことができる。
提案手法は,2つのタスクの定式化を利用して,提案目標を遅延関連度推定とバイアス対応キャリブレーションに分解する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:44:57 GMT)
AI Assisted Economics Measurement From Survey: Evidence from Public Employee Pension Choice [2.2] 本研究では,大規模言語モデルを用いて調査機器から直接測定構造を抽出する経済計測の反復的枠組みを開発する。
この枠組みは、大規模な公務員退職計画調査に適用される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:22:36 GMT)
Experimental Quantification of Spin-Phonon Coupling in Molecular Qubits using Inelastic Neutron Scattering [2.2] 分子スピン系では、化学的チューニング性と原子スケール分解能は密度が高く、熱的にアクセス可能なフォノンスペクトルを伴っている。
スピンフォノンカップリング(SPC)の定量化のための完全実験手法を提案する。
この枠組みを2つのモデルS=1/2系、銅(II)フタロシアニン(CuPc)および銅(II)オクタエチルポルフィリン(CuOEP)に適用する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:49:49 GMT)
Performance of Small Language Model Pretraining on FABRIC: An Empirical Study [2.2] 本研究では,学習者が無償で試用できる実験台上での小型LLMの事前学習技術の性能について検討する。
我々は,GPT-2ミディアムモデルと大規模モデルを使用し,オープンソースパッケージであるAlpaとRayを用いて事前訓練を行った。
我々は,GPUが地理的に分散された場合,演算子内並列性と演算子間並列性を一括最適化したAlpaの実行計画が,常に最善を尽くしたことを観察した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:58:47 GMT)
When Efficient Communication Explains Convexity [2.2] 本稿では,効率的なコミュニケーションの観点から,どのような要因が説明を成功させるのかを問う。
我々はまず,IB感覚における最適性と,この設定に対する新しい凸性一般化との相関関係を実証し,解析する。
コミュニケーションニーズ分布の凸性は,特に重要な役割を担っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:20:45 GMT)
HALT: Hallucination Assessment via Log-probs as Time series [2.2] 本稿では,軽量幻覚検出器であるHALT(Halucination Assessment via Log-probs as Time series)を提案する。
HALTは、エントロピーに基づく特徴と組み合わされたゲートリカレント単位モデルを使用して、モデルのキャリブレーションバイアスを学習する。
Hub (Hallucination Detection Unified Benchmark)は、事前データセットを推論タスクと汎用スキルの両方をカバーする10の機能に集約する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:46:23 GMT)
MEG-XL: Data-Efficient Brain-to-Text via Long-Context Pre-Training [2.1] 提案するMEG-XLは, サンプルあたり2.5分間のMEGコンテキストを事前学習したモデルで, 従来よりも5~300倍長く, 191kトークンに相当する。
脳データから単語を復号するタスクを微調整すると、MEG-XLは教師付き性能と少数のデータとを一致させる。
以上の結果から,長期コンテキスト事前学習は,他の手法が不要に破棄する拡張神経コンテキストの活用に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:59:50 GMT)
Position: The Need for Ultrafast Training [2.0] ドメイン特化FPGAは、科学的および工業的ワークロードにわたる低レイテンシ推論において、前例のないパフォーマンスを実現している。
推論のみのアクセラレータから、FPGAファブリック内で推論とトレーニングの両方が直接実行される超高速なオンチップ学習への移行を議論する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:04:11 GMT)
BiTimeCrossNet: Time-Aware Self-Supervised Learning for Pediatric Sleep [2.0] BiTimeCrossNet (BTCNet) は、夜間睡眠研究のような長期の生理的記録のためのマルチモーダルな自己教師型学習フレームワークである。
BTCNetは、タスクラベルやシーケンスレベルの監督を必要とせずに、クロスアテンションを通じて生理的信号間のペアワイズ相互作用を学習する。
BTCNetは、睡眠ステージング、覚醒検出、呼吸事象検出を含む6つの下流課題における小児睡眠データに基づいて評価した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:23:28 GMT)
Autocorrelated Optimize-via-Estimate: Predict-then-Optimize versus Finite-sample Optimal [2.0] 有限サンプル体制におけるアウト・オブ・サンプル性能を直接最適化するモデルは、従来の見積もりを最適化するアプローチに代わる有望な選択肢として現れてきた。
自動相関不確実性(特にベクトル自己回帰移動平均VARMA(p,q)プロセス)の文脈での性能を比較する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:49:51 GMT)
Maximizing Reliability with Bayesian Optimization [1.9] 本稿では,ランダムな摂動を受ける設計の信頼性を最大化する2つの手法を提案する。
どちらの手法も、極めて小さな故障確率を目標とする重要サンプリングを取り入れている。
実験の結果,提案手法は極端かつ非極端な制度において既存手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:31:58 GMT)
Building a Correct-by-Design Lakehouse. Data Contracts, Versioning, and Transactional Pipelines for Humans and Agents [1.9] Bauplanはコードファーストのレイクハウスで、よく知られた抽象化を使って(ほとんど)違法な状態を表現不能にすることを目的としています。
Bauplanは、パイプラインバウンダリをチェック可能にする型付きテーブルコントラクト、レビューとランタイムのためのGitライクなデータバージョニング、パイプラインレベルのアトミック性を保証するトランザクション実行の3つの軸に沿って機能する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:58:38 GMT)
LIEREx: Language-Image Embeddings for Robotic Exploration [1.9] 伝統的な写像アプローチは正確な幾何学的表現を提供するが、しばしば事前に設計された記号語彙によって制約される。
CLIPのようなVision-Language Foundation Modelsの最近の進歩は、オブジェクトを固定ラベルではなく高次元の埋め込みとしてエンコードするオープンセットマッピングを可能にする。
LIERExでは、これらのVLFMを既存の3Dセマンティックシーングラフと統合し、部分的に未知の環境で自律エージェントによるターゲット指向探索を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:30:50 GMT)
Trust by Design: Skill Profiles for Transparent, Cost-Aware LLM Routing [1.9] BELLA(Budget-Efficient LLM Selection via Automated skill-profiling)は、タスクのための最適なLLM選択を推奨するフレームワークである。
標準ベンチマークでは、タスクに必要な特定の機能や、より安価なモデルで十分かどうかを明確化するためのメトリクスが報告されている。
BELLAは、(1)LCM出力を分解し、批判ベースのプロファイリングによって必要とされる粒度のスキルを抽出すること、(2)構造化された能力行列へのクラスタリング技術、(3)多目的最適化の3段階を通して、このギャップに対処する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:49:30 GMT)
David vs. Goliath: Verifiable Agent-to-Agent Jailbreaking via Reinforcement Learning [1.8] 我々は、安全に配慮したオペレーターの信頼された特権にツールレスの敵が"タグを付ける"脅威モデルを定式化し、会話だけで禁止されたツールの使用を誘導する。
創発的攻撃ベクトルを自律的に発見する強化学習フレームワークであるSlingshotを紹介する。
我々の研究は、タッグ・アロング・アタックを第一級で検証可能な脅威モデルとして確立し、環境相互作用のみを通じて、既製のオープンウェイトモデルから効果的なエージェント・アタックが引き出されることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:56:55 GMT)
Evaluating OCR Performance for Assistive Technology: Effects of Walking Speed, Camera Placement, and Camera Type [1.8] 静的および動的条件下で光学文字認識(OCR)の性能を系統的に評価した。
4基のOCRエンジンは、Google Vision、PaddleOCR 3.0、EasyOCR、Tesseractの4つの距離と視角の精度を評価するためにベンチマークされた。
Google Visionの全体的な精度は最高で、PaddleOCRは最強のオープンソース代替品として遅れを取っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:28:38 GMT)
Investigating the Interplay of Parameterization and Optimizer in Gradient-Free Topology Optimization: A Cantilever Beam Case Study [1.7] 本研究では、接続制約を受けるカンチレバービームの最小化問題による相互作用について検討する。
我々は、3つのパラメータ化をベンチマークし、それぞれを3つの代表的BBOアルゴリズムと組み合わせた。
その結果,パラメータ化品質が選択よりも最適化性能に強い影響があることが判明した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:12:21 GMT)
Causal Inference for Preprocessed Outcomes with an Application to Functional Connectivity [1.7] そこで本研究では,対象物内処理後に得られた因果推論を導出する半パラメトリックフレームワークを提案する。
我々は、このフレームワークを仲介設定に特化し、自然の直接効果に焦点をあてる。
自閉症スペクトラム障害児の脳への刺激薬の影響を推定するために本手法を適用した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:48:34 GMT)
Late-Stage Generalization Collapse in Grokking: Detecting anti-grokking with Weightwatcher [1.7] ニューラルネットワークにおけるemphMemorizationは、正確な運用定義が欠如しており、しばしばグラッキングレジームから推測される。
我々は、このトレーニング体制において、未報告の第3段階である、エンファンティ・グロッキング(emphanti-grokking)、すなわち、一般化の後期崩壊を識別する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:09:14 GMT)
DiGAN: Diffusion-Guided Attention Network for Early Alzheimer's Disease Detection [1.6] アルツハイマー病(AD)の早期診断は、構造的脳変化の微妙で時間的に不規則な進行のため、依然として大きな課題である。
既存のディープラーニングアプローチでは、大規模な時系列データセットが必要であり、実世界の臨床データに固有の時間的連続性とモダリティの不規則性をモデル化できないことが多い。
本稿では,遅延拡散モデルと注意誘導畳み込みネットワークを統合した拡散誘導注意ネットワーク(DiGAN)を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:59:23 GMT)
Complexity and the Hilbert space dimension of 3D gravity [1.6] 2+1次元の反ド・ジッター空間におけるブラックホールのヒルベルト空間次元を計算する。
複雑さが最近飽和していることが分かります。
この結果から、複素相互作用系のヒルベルト空間次元を計算する新しい方法が導入された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:00 GMT)
RAPT: Model-Predictive Out-of-Distribution Detection and Failure Diagnosis for Sim-to-Real Humanoid Robots [1.6] 本稿では,50Hzのヒューマノイド制御のための軽量で自己監督型展開時間モニタRAPTを提案する。
RAPTは,数値シミュレーションから確率的時間的確率多様体を学習し,実行時の予測偏差を評価する。
我々は,シミュレーションおよび物理ハードウェアにおける4つの複雑なタスクに対して,Unitree G1ヒューマノイド上でRAPTを評価する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:04:55 GMT)
"I May Not Have Articulated Myself Clearly": Diagnosing Dynamic Instability in LLM Reasoning at Inference Time [1.6] 大規模言語モデル(LLM)の推論失敗は通常、世代末にのみ測定されるが、プロセスレベルのブレークダウンとして多くの障害が現れる。
連続的なステップ分布シフト(JSD)と不確実性(エントロピー)を組み合わせた単純な不安定信号を定義する。
GSM8KとHotpotQA全体で、不安定性はAUCで間違った解を予測し、単調バケットレベルの精度を低下させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:11:25 GMT)
Unsupervised Physics-Informed Operator Learning through Multi-Stage Curriculum Training [1.6] 本研究では,損失景観における境界条件を強制することで収束を実現する物理インフォームドトレーニング戦略を提案する。
それぞれの段階で制限が再形成され、安定性を回復し、停滞を防ぐ継続メカニズムとして機能する。
標準ベンチマーク全体において、PhIS-FNOは教師付き学習に匹敵する精度のレベルに達する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:06:57 GMT)
X-BCD: Explainable Sensor-Based Behavioral Change Detection in Smart Home Environments [1.5] 家庭における日常生活活動の行動変化は認知低下のデジタルマーカーとなる。
X-BCDは、マルチモーダルスマートホームセンサデータから活動ルーチンの変化を検出し、特徴付けるための教師なしフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:17:36 GMT)
SelvaMask: Segmenting Trees in Tropical Forests and Beyond [1.5] SelvaMaskは、パナマ、ブラジル、エクアドルの3つの熱帯林に8,800本の樹冠を手動で並べた新しいデータセットである。
本手法は,高密度熱帯林におけるゼロショットジェネリストモデルと完全教師付きエンド・ツー・エンド手法の両方を上回り,最先端性能に到達している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:26:56 GMT)
SpikingGamma: Surrogate-Gradient Free and Temporally Precise Online Training of Spiking Neural Networks with Smoothed Delays [1.5] スパイキングニューラルネットワーク(SNN)は、スパースでイベント駆動の計算を通じて、エネルギー効率の高い低レイテンシAIを約束する。
しかし、微細な時間的離散化の下でのSNNのトレーニングは依然として大きな課題であり、低レイテンシ応答性とソフトウェアで訓練されたSNNの効率的なハードウェアへのマッピングを妨げている。
このSpykingGammaモデルでは,スロゲート勾配を使わずに直接エラーバックプロパゲーションをサポートし,オンライン的に最小のスパイクで微妙な時間パターンを学習し,複雑なタスクやベンチマークに競合精度でフィードフォワードSNNを拡張できることが示されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:35:16 GMT)
Embedding Learning on Multiplex Networks for Link Prediction [1.4] 本稿では,リンク予測のための多重ネットワークへの埋め込み学習モデルについて述べる。
組込み技術や組込み技術の種類に応じて,モデルの分類と比較を行う改良手法を提案する。
我々は、新規で公正なテスト手順を提案することによって、有向多重化ネットワークの評価に取り組む。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:23:10 GMT)
A Multi-scale Linear-time Encoder for Whole-Slide Image Analysis [1.4] 本稿では,Multi-scale Adaptive Recurrent Biomedical Linear-time framework (MARBLE) を紹介した。
MARBLEは複数の倍率レベルを並列に処理し、線形時間状態空間モデルに粗い推論を統合する。
5つの公開データセットの実験では、AUCの textbf6.9%、精度の textbf20.3%、Cインデックスの textbf2.3% の改善が示されている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:47:07 GMT)
Learning to Route and Schedule LLMs from User Retrials via Contextual Queueing Bandits [1.4] 我々は,ユーザの再審行動から推定される暗黙のフィードバックを活用する共同ルーティングとスケジューリングアルゴリズムを開発した。
我々は、ACQBがルーティングに対して$widetildemathcalO(sqrtt)$の累積後悔と、大きな$t$に対して$widetildemathcalO(t-1/4)$のキュー長後悔を同時に達成していることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:01:41 GMT)
Spectral Superposition: A Theory of Feature Geometry [1.4] 重み付き行列のスペクトルを解析することにより特徴の幾何学的構造を研究する理論を開発する。
重ね合わせのおもちゃモデルでは、キャパシティ飽和がスペクトル局在を強制することを示すためにこの理論を用いる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:28:38 GMT)
Optimizing Tensor Train Decomposition in DNNs for RISC-V Architectures Using Design Space Exploration and Compiler Optimizations [1.4] 低ランク因子化(LRF)は、完全に連結された層を圧縮するための効果的なアプローチを提供する。
本稿では、RISC-Vプロセッサ上でのFC層最適化のためのエンド・ツー・エンドなLRF設計空間探索手法と特別設計ツールを紹介する。
TT分解層の平均走行速度はIREEの3倍、Plutoの8倍である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:56:36 GMT)
An introduction to local differential privacy protocols using block designs [1.4] 局所微分プライバシー(LDP)プロトコルは、遷移確率行列(TPM)を用いた実験結果のランダム化符号化を利用する
いくつかの著者は、バランスの取れた不完全ブロック設計(BIBD)が、DPプロトコルのためのTPMの良い例であると考えている。
BIBDに基づくTPMの最適推定器は、正確には対応するTPMのムーア・ペンローズ逆数から得られるものである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:58:58 GMT)
When Machines Get It Wrong: Large Language Models Perpetuate Autism Myths More Than Humans Do [1.3] 本研究は,先行するAIシステムが自閉症スペクトラム障害に関する誤解を永久に克服するか否かを検討する。
人類の参加者はLLMよりもはるかに少ない神話を支持した。
評価項目30項目のうち18項目において、人間はAIシステムを大きく上回った。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:45:26 GMT)
IslamicLegalBench: Evaluating LLMs Knowledge and Reasoning of Islamic Law Across 1,200 Years of Islamic Pluralist Legal Traditions [1.3] ISLegalBenchは、イスラム法学の7つの学派でLSMを評価する最初のベンチマークである。
最良のモデルは68%の正しさしか達成せず、幻覚は21%である。
ショットプロンプトは最小限のゲインを提供し、9つのモデルのうち2つしか改善していない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:30:59 GMT)
EchoJEPA: A Latent Predictive Foundation Model for Echocardiography [1.3] 心エコー法の基礎モデルであるエコーJEPAについて検討した。
また,凍結したバックボーン下での評価を標準化する因子化ストリーム埋め込みを用いた新しい多視点探索フレームワークについても紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:34:57 GMT)
Time2Vec-Integrated Transformer for Robust Gesture Recognition from Low-Density sEMG [1.2] 本稿では筋電義手制御のための新しい,データ効率の高いディープラーニングフレームワークを提案する。
提案手法は, スパース2チャネル表面筋電図(sEMG)に最適化されたハイブリッドトランスフォーマーの実装である。
提案するフレームワークは, 迅速なパーソナライズが可能な次世代人工装具の堅牢で費用対効果の高い青写真を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:28:27 GMT)
A Reproducible Framework for Bias-Resistant Machine Learning on Small-Sample Neuroimaging Data [1.2] 我々は、ドメインインフォームドな特徴工学、ネストされたクロスバリデーション、小サンプルのニューロイメージングデータに対する調整された決定閾値最適化を統合した再現可能な、バイアス耐性の機械学習フレームワークを導入する。
この研究は、解釈可能性と偏見のない評価を組み合わせることで、データ限定バイオメディカル領域における信頼性の高い機械学習のための一般化可能な計算ブループリントを提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:47:57 GMT)
Bayesian Integration of Nonlinear Incomplete Clinical Data [1.2] マルチモーダルな臨床データは、高次元性、不均一な表現、構造的欠如によって特徴づけられる。
BIONIC(Bayesian Integration of Clinical Data)は、不均一なデータを統合する統一的確率的フレームワークである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:23:53 GMT)
Introns and Templates Matter: Rethinking Linkage in GP-GOMEA [1.2] GP-GOMEAでは,GP木におけるノード位置間の相互情報を用いてリンクを学習している。
本稿では,相互情報推定においてイントロンを明示的に考慮するリンク学習と,グレーボックスの観点からGP-GOMEAにおけるリンク学習を再考する2つの新しい手法を提案する。
新たに学習したリンケージ構造はテンプレートリンケージ構造を密接に反映しており,テンプレート構造を明示的に使用することで全体として最高の性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:42:30 GMT)
Spatiotemporal Decision Transformer for Traffic Coordination [1.2] MADT(Multi-Agent Decision Transformer)は、シーケンスモデリング問題としてマルチエージェント信号制御を再構成する新しい手法である。
当社のアプローチでは,過去のトラフィックデータからオフラインで学習することが可能になる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:19:13 GMT)
Beyond Content: Behavioral Policies Reveal Actors in Information Operations [1.2] 本稿では、ユーザアクティビティをシーケンシャルな意思決定プロセスとしてモデル化することで、悪意あるアクターを行動ポリシーから識別するプラットフォームに依存しないフレームワークを提案する。
Redditの2017年の透明性レポートでは、ロシアインターネットリサーチエージェンシーにリンクされた99アカウントを含む12,064のRedditユーザに対してこのアプローチを適用しています。
アクティビティベースの表現は、投稿するよりもユーザーの行動をモデル化し、悪意のあるアカウントを検知するコンテンツモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:39:21 GMT)
Multimodal UNcommonsense: From Odd to Ordinary and Ordinary to Odd [1.1] MUN(Multimodal UNsense)は、典型的な視覚的、文脈的予測から逸脱したシナリオを扱うモデルの性能を評価するためのベンチマークである。
MUNは、自然言語で記述された驚くべき、あるいはありそうもない結果と視覚的なシーンをペアリングし、日常的な論理を用いて一見奇妙なイメージを合理的にするか、通常のシーンで予期せぬ解釈を明らかにするかのどちらかをモデルに促す。
実験では、ベースラインICL法よりも平均8.3%改善し、低周波非定型設定におけるR-ICLの有効性を強調した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:54:34 GMT)
When Is Generalized Bayes Bayesian? A Decision-Theoretic Characterization of Loss-Based Updating [1.1] 一般ベイズ、ギブズ、準後部などの損失ベースの更新は、確率をユーザ・チョーゼンの損失に置き換え、指数的傾きによって後部のような分布を生成する。
損失ベース後部が通常のベイズと一致することは、損失がスケールし、データのみの用語である負のログライクな状態である場合に限る。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:10:32 GMT)
Uncertainty-Aware Image Classification In Biomedical Imaging Using Spectral-normalized Neural Gaussian Processes [1.0] 現在のデジタル病理のディープラーニングモデルは、アウト・オブ・ディストリビューション・セッティングにおいて、しばしば過度に信頼され、キャリブレーションが不十分である。
我々は、スペクトル正規化を適用し、最終密度層をガウスプロセス層に置き換え、単一モデル不確実性評価とOOD検出を改善するための軽量な修正である、スペクトル正規化ニューラルプロセス(SNGP)を実装した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:35:10 GMT)
Notes on the Reward Representation of Posterior Updates [1.0] 固定確率モデルにおいて, KL-正則化ソフトアップデートがベイズ後部である場合について検討した。
この体制では、行動の変化は、そのチャネルによって実行される証拠によってのみ引き起こされる。
後続のアップデートは、行動を変える相対的な文脈依存のインセンティブ信号を決定するが、絶対的な報酬は決定しない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:37:39 GMT)
The First Mass Protest on Threads: Multimodal Mobilization and AI-Generated Visuals in Taiwan's Bluebird Movement [1.0] 台湾のブルーバード運動は、民主的改革に対応して10万人以上のデモ参加者を動員した、同国史上最大の若者主導の抗議活動だった。
この研究は、AIによるマイクロブログプラットフォームであるThreadが、台湾の抗議コミュニケーションをx2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013 $2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013$2013 $2013$2013$2013
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:55:05 GMT)
Motivation, Attention, and Visual Platform Design: How Moral Contagions Spread on TikTok and Instagram in the 2024 United States Presidential Election [1.0] われわれは2024年の大統領選挙で2,027,595人のTikToksと1,126,972人のInstagram投稿を分析した。
時間的需給分析と道徳的基礎評価を用いて、重要な選挙問題のダイナミクスを考察する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:55:27 GMT)
Interpretable Tabular Foundation Models via In-Context Kernel Regression [0.9] KernelICLは、定量化されたサンプルベースの解釈可能性を備えた表層基盤モデルを強化するためのフレームワークである。
すべての予測がトレーニングラベルの透過的な重み付け平均となるように、カーネルレグレッションに似たコンテキスト内学習を行う。
55 TALENTベンチマークデータセットでは、KernelICLは既存の表形式の基盤モデルと同等のパフォーマンスを達成している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:37:10 GMT)
Things that Matter -- Identifying Interactions and IoT Device Types in Encrypted Matter Traffic [0.9] 我々は、Matter IoT標準のロバスト性を、受動的盗聴者によって実行される暗号化トラフィック分析に分析する。
暗号化されたMatterトラフィックのメタデータのパターンを特定し、エンドデバイスとコントローラの間で発生した特定のインタラクションを推測する。
これらのパターンは、受動的攻撃者がネットワークで使用されるデバイスのタイプを推測できる指紋を作成するために使用することができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:34:06 GMT)
Geometric Analysis of Token Selection in Multi-Head Attention [0.9] 大規模言語モデル(LLM)におけるマルチヘッドアテンション分析のためのフレームワークを提案する。
我々は、選択されたトークンと非選択されたトークンの分離性を定量化するために、幾何学的メトリクス(精度、リコール、Fスコア)を定義する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:04:40 GMT)
Efficient Neural Controlled Differential Equations via Attentive Kernel Smoothing [0.9] 本稿では,Kernel と Gaussian Process (GP) をスムースに置き換えたニューラル CDE パス構築手法を提案する。
GPを用いたMVC-CDEは,NFEと総推定時間を大幅に削減しつつ,最先端の精度を実現する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:35:46 GMT)
Eliminating Registration Bias in Synthetic CT Generation: A Physics-Based Simulation Framework [0.9] CBCTからの改良された合成生成には、登録されたトレーニングペアが必要であるが、取得したスキャン間での完全な登録は、依然として不可能である。
この登録バイアスは、トレーニングされたモデルに伝播し、標準評価指標を破損させる。
物理に基づくCBCTシミュレーションを提案し、幾何学的に整列したトレーニングペアを構築により提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:14:47 GMT)
A Unified Control Architecture for Macro-Micro Manipulation using a Active Remote Center of Compliance for Manufacturing Applications [0.9] マクロマイクロマニピュレータは、マクロマニピュレータと産業用ロボットのような大きなワークスペース、軽量で高帯域幅のマイクロマニピュレータを組み合わせる。
これにより、ロボットの広い作業空間を維持しながら、非常にダイナミックなインタラクション制御が可能になる。
本稿では,マクロマニピュレータをアクティブなインタラクション制御に組み込んだ新しい制御アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:58:53 GMT)
Segment to Focus: Guiding Latent Action Models in the Presence of Distractors [0.8] ラテントアクションモデルは、生の観察からのみアクション関連表現を抽出することを学ぶ。
LAMは、アクション関連ノイズからアクション関連特徴を引き離す上で、重要な課題に直面している。
MaskLAMは、視覚エージェントセグメンテーションを組み込むことでこの問題を軽減するため、LAMトレーニングの軽量な修正である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:03:19 GMT)
EvalQReason: A Framework for Step-Level Reasoning Evaluation in Large Language Models [0.8] ステップレベルの確率分布解析によりLLM推論品質を定量化するフレームワークであるEvalQReasonを提案する。
このフレームワークは、隣接する推論ステップ間の局所的コヒーレンスを測定するCSD(Consecutive Step Divergence)と、最終回答とグローバルなアライメントを評価するSFC(Step-to-Final Convergence)という2つの補完アルゴリズムを導入している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:32:40 GMT)
From Code-Centric to Concept-Centric: Teaching NLP with LLM-Assisted "Vibe Coding" [0.8] LLM(Large Language Models)の急速な進歩は、自然言語処理(NLP)教育の課題と機会の両方を提示する。
本稿では,概念的理解と批判的思考を重視しつつ,LLMをコーディングアシスタントとして活用する教育的アプローチであるVibe Coding'を紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:21:34 GMT)
Evaluating False Alarm and Missing Attacks in CAN IDS [0.8] ROADデータセットを用いて,CAN IDSの体系的対角評価を行う。
4つの浅い学習モデルとディープニューラルネットワークベースの検出器を比較した。
以上の結果から,敵の操作が誤報と回避検出を同時に引き起こすことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:38:01 GMT)
Towards AI Evaluation in Domain-Specific RAG Systems: The AgriHubi Case Study [0.7] AgriHubiは、フィンランド語による農業意思決定支援のためのドメイン適応型検索拡張生成システムである。
このシステムは、答えの完全性、言語的正確性、そして認識された信頼性において明らかな向上を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:15:24 GMT)
Approaching the Thermodynamic Limit with Neural-Network Quantum States [0.7] ニューラルネットワーク量子状態に対する最小かつ物理的に解釈可能な帰納バイアスである空間的注意機構を導入する。
このバイアスは大規模最適化を安定化し、熱力学・極限物理学へのアクセスを可能にする。
提案手法は20時間20ドルの正方格子に対して最先端のエネルギーを達成し,Residual Convolutional Neural Networksより優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:05 GMT)
ClinConNet: A Blockchain-based Dynamic Consent Management Platform for Clinical Research [0.7] 臨床医は、研究対象または患者からインフォームド・コンセントを取得し、臨床試験またはケアの前後、期間中、および後にそれを管理する責任を負う。
臨床研究プロジェクトに基づいて研究者と参加者を結ぶプラットフォームであるClinConNetを提案する。
ClinConNetはユーザ中心で、リンク不能、機密性、アイデンティティデータの所有など、患者の重要なプライバシ機能を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:53:05 GMT)
ORCH: many analyses, one merge-a deterministic multi-agent orchestrator for discrete-choice reasoning with EMA-guided routing [0.6] ORCHは異種言語モデルを編成する離散選択推論のためのフレームワークである。
タスクの分解と回答の集約に固定されたルールを使用し、パイプラインを予測可能、再現可能、トレーニング不要にする。
MMLU、MMLU-Pro、GSM8Kの実験では、ORCHは単一モデルベースラインと多数投票アンサンブルを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:27:58 GMT)
AROLA: A Modular Layered Architecture for Scaled Autonomous Racing [0.6] この作業において、AROLAはモジュラーで階層化されたソフトウェアアーキテクチャとして導入され、断片化およびモノリシックな設計は、標準化されたROS 2インターフェイスを介して接続される交換可能なレイヤとコンポーネントに再編成される。
自動運転パイプラインは、センサー、前処理、知覚、ローカライゼーションとマッピング、計画、行動、制御、動作に分解される。
ラップタイミング、軌道品質、計算負荷をリアルタイムで記録し、標準化後追跡分析を生成する軽量システムとしてRace Monitorフレームワークが導入された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:46:34 GMT)
Evaluating Metalinguistic Knowledge in Large Language Models across the World's Languages [0.6] 大規模言語モデル(LLM)は日常的に言語使用タスクに基づいて評価されるが、言語構造に関する知識はいまだに理解されていない。
精度とマクロF1とマジョリティクラス,チャンスベースラインを併用して,言語領域や言語関連因子による全体的なパフォーマンスを分析し,その変動について検討する。
GPT-4oは最適だが適度な精度(0.367)であり,オープンソースモデルは遅れている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:49:56 GMT)
QuietPrint: Protecting 3D Printers Against Acoustic Side-Channel Attacks [0.6] 3Dプリンティングプロセスをターゲットにしたサイバー攻撃がますます一般的になりつつある。
主要な関心事は知的財産権(IP)盗難であり、悪意のある攻撃者が設計ファイルにアクセスする。
本研究では,アコースティックサイドチャネルを用いたIP盗難の可能性について検討し,新しい3Dプリンタの保護手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:04:00 GMT)
Under-Canopy Terrain Reconstruction in Dense Forests Using RGB Imaging and Neural 3D Reconstruction [0.6] 従来のRGB画像のみを用いた天蓋のない光写実的地上ビューの再構築のための新しいアプローチを提案する。
提案手法は,最近の3次元再構成法であるNeRF(Neural Radiance Fields)に基づく。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:24:42 GMT)
On the Limits of Layer Pruning for Generative Reasoning in LLMs [0.5] レイヤープルーニングは、大きな言語モデル(LLM)を圧縮でき、微調整をほとんどあるいは全く行わずに分類ベンチマークで強い性能を維持することができる。
多段階推論を必要とするタスクは,特に深度低減に敏感であることがわかった。
現実的なポストトレーニング制約の下では、教師付き微調整に基づく単純な緩和戦略を評価する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:57:22 GMT)
Exploring Silicon-Based Societies: An Early Study of the Moltbook Agent Community [0.5] 本稿では,データ駆動型シリコン社会学を,相互作用する人工エージェント間の社会構造形成を研究するための体系的な実証的枠組みとして紹介する。
エージェントとエージェントのインタラクションを主目的とするソーシャルプラットフォームであるMoltbookを解析し,大規模データマイニング研究の先駆者となる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:08:38 GMT)
Hallucination or Creativity: How to Evaluate AI-Generated Scientific Stories? [0.5] 本稿では,AI生成した科学的ストーリを評価するための複合メトリックであるStoryScoreを提案する。
StoryScoreはセマンティックアライメント、語彙的接地、物語制御、構造的忠実性、冗長性回避、実体レベルの幻覚検出を統合している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:29:32 GMT)
Eidolon: A Practical Post-Quantum Signature Scheme Based on k-Colorability in the Age of Graph Neural Networks [0.5] エイドロン(Eidolon)は、NP完全k色性問題に基づく実用的な量子後シグネチャスキームである。
ランダムグラフの統計プロファイルを保存する「キート」カラーリングを植え込み、ハードインスタンスを生成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:05:50 GMT)
Spatio-Temporal Transformers for Long-Term NDVI Forecasting [0.5] STT-LTFは、一貫したトランスフォーマーアーキテクチャを通じて、時間的シーケンス(最大20年)と共にマルチスケール空間パッチを処理する。
このフレームワークは、空間マスキング、時間マスキング、地平線サンプリング戦略による総合的な自己教師型学習を採用している。
これは、空間パッチの埋め込み、周期的時間エンコーディング、地理的座標を組み込んで、エラーの蓄積なしに任意の将来の時点を直接予測する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:29:45 GMT)
TruKAN: Towards More Efficient Kolmogorov-Arnold Networks Using Truncated Power Functions [0.5] 我々は,計算効率とコルモゴロフ・アルノルドネットワーク(KAN)の原理の遵守のトレードオフに対処するためにTruKANを提案する。
TruKan は Kan の B-スプライン基底を k-次理論から導かれる切り離されたパワー関数の族に置き換える。
全体として、TruKANは複雑な視覚タスクにおいて精度、計算効率、メモリ使用量で他のkanモデルより優れている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:33:02 GMT)
PCA of probability measures: Sparse and Dense sampling regimes [0.5] 我々はPCAを$n$の確率測度がそれぞれ$m$のサンプルによって観測される二重体制で研究する。
経験的共分散作用素とPCA過剰リスクに対して$n-1/2 + m-$という形の収束率を導出する。
実験的な共分散誤差に対して, 密度レジメレートが極小であることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:56:58 GMT)
Counting Hypothesis: Potential Mechanism of In-Context Learning [0.5] In-Context Learning (ICL) は、大量のデータに事前訓練された大規模言語モデル(LLM)が入力プロンプトの例から特定のタスクを学習できることを示している。
ICLのカウント仮説について提案し,LSMの符号化戦略がICLを弱体化させる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:57:33 GMT)
Unified entropy production in finite quantum systems [0.4] 有限次元量子系では、温度は一意に定義できない。
本稿では、参照状態に対する量子相対エントロピーの差に基づくエントロピー生成の統一的な定義を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:38:53 GMT)
On Quantum Learning Advantage Under Symmetries [0.4] 量子統計クエリ(QSQ$)モデルにおける対称性の潜在的な利点について検討する。
我々は、高度に歪んだ軌道分布の下で潜在的な利点が生じることを発見した。
さらに、量子学習者が古典的な$SQ$アルゴリズムを非効率にするノイズレベルで成功する、寛容に基づく分離が存在すると同定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:08:47 GMT)
Genus-0 Surface Parameterization using Spherical Beltrami Differentials [0.4] 球面の準同型自己写像の2文字表現である球面ベルトラミ微分 (SBD) を導入する。
球面ステレオグラフ上の2つのベルトラミフィールドを最適化するニューラルネットワーク最適化フレームワークBOOSTを提案する。
大変形ランドマークマッチングと強度に基づく球面登録実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:29:14 GMT)
Trailer Reimagined: An Innovative, Llm-DRiven, Expressive Automated Movie Summary framework (TRAILDREAMS) [0.4] TRAILDREAMSは大規模言語モデル(LLM)を用いて映画トレーラーの製作を自動化するフレームワークである。
比較評価では、TRAILDREAMSは視聴者評価において現在の最先端のトレーラー生成手法を上回っている。
しかし、実際の人造トレーラーと比べると、まだ不足している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:53:25 GMT)
Optimal Control to Minimize Dissipation and Fluctuations in Open Quantum Systems Beyond Slow and Rapid Regimes [0.4] 我々は、リンドブラッドマスター方程式によって支配されるオープン量子システムにおいて、散逸した作業と作業分散を最小限に抑えるための最適制御フレームワークを導入する。
コヒーレントなスピンボソンモデルでは、最適化されたプロトコルは異なる局所最適解を切り替えることができる。
フェルミオン型貯水池に結合した単一レベル量子ドットに対して、最適化されたゆらぎ最小化プロトコルは質的に異なる多段階構造を発達させる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:05:55 GMT)
Should There be a Teacher In-the-Loop? A Study of Generative AI Personalized Tasks Middle School [0.3] 生成型AIモデルは、学生の興味に対応するタスクを作成し、コンテキストのパーソナライゼーションを実行し、学生が学術的コンテンツを学ぶことへの関心を高める。
中学校数学教師7人を対象にChatGPTを用いて学習を行い,カリキュラムの課題を個別化したバージョンを作成し,学生の関心に応えた。
その結果,教師のループ化によって,比較的広い粒度でAIによる個人化が実現されることが判明した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:36:38 GMT)
Infusion of Blockchain to Establish Trustworthiness in AI Supported Software Evolution: A Systematic Literature Review [0.3] ほとんどの研究は、ソフトウェアエンジニアリング(SE)にAIを統合することに焦点を当てている。
我々のレビューでは、AI支援SEタスクの信頼性、透明性、説明責任を強化するブロックチェーンベースのアプローチを探求する6つの最近の研究を取り上げている。
将来的な作業は、信頼性があり、セキュアで、準拠したAI駆動のSEエコシステムを実現するために、測定可能な、再現可能な信頼フレームワークを開発する必要がある。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:08:01 GMT)
Co-Design of Rover Wheels and Control using Bayesian Optimization and Rover-Terrain Simulations [0.3] 本稿では, 変形可能な地形における高忠実度フルサイクルシミュレーションを用いて, ローバーホイール形状と操舵制御パラメータを共設計する枠組みを提案する。
車輪と制御パラメータの同時同時最適化と,機械設計と制御設計を分離する逐次的アプローチの2つの戦略を比較した。
3000以上のフルサイクルシミュレーションが実施され、キャンペーンは5日から9日で終了する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:10:34 GMT)
Toward a Machine Bertin: Why Visualization Needs Design Principles for Machine Cognition [0.3] 視覚言語モデル(VLM)は、自動分析パイプラインのチャートイメージをますます消費する。
現在のアプローチでは、主にビジョンを完全にバイパスすることで、このギャップに対処しています。
本稿では、可視化分野において、異なる研究課題として、マシン指向の視覚設計を調査する必要があることを論じる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:39:33 GMT)
Failure-Aware Enhancements for Large Language Model (LLM) Code Generation: An Empirical Study on Decision Framework [0.3] GitHubの25のプロジェクトに関する実証調査では、プログレッシブプロンプトが平均96.9%のタスク完了を達成した。
自己批判はコードレビュー可能なロジックエラーで成功するが、外部サービス統合では完全に失敗する。
RAGは、より優れた効率で、すべての障害タイプで最高の完成を達成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:08:03 GMT)
Attention Isn't All You Need for Emotion Recognition:Domain Features Outperform Transformers on the EAV Dataset [0.3] ベースライントランス(M1)、新しい分解型アテンション機構(M2)、改良型CNNベースライン(M3)の3つのモデルカテゴリを実装した。
実験により、洗練された注意機構は小さなデータセットでは一貫して性能が劣っていることが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:50:11 GMT)
Mapping a Decade of Avian Influenza Research (2014-2023): A Scientometric Analysis from Web of Science [0.2] 本研究では,2014年から2023年までのAvian Influenza研究を,Web of Scienceデータベースのデータを用いて分析した。
結果は、中国やアメリカの機関から高いコントリビューションを得て、出版物の増加が着実に進んでいることを示している。
中国とアメリカは出版量でリードしているが、イギリスやドイツのような先進国では、より高い国際協力率を示している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:37:20 GMT)
Cross-Lingual Stability of LLM Judges Under Controlled Generation: Evidence from Finno-Ugric Languages [0.2] 大規模言語モデル(LLM)の言語間評価は、典型的には、真のモデルの性能差と測定不安定性の2つの要因を混同する。
対象言語が異なる場合に生成条件を一定に保って評価信頼性を評価する。
本研究は, 形態学的に豊かな言語における談話レベルの評価には, ゼロショット・ジャッジ・トランスファーが信頼できないことを示唆している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:27:32 GMT)
The Strategic Foresight of LLMs: Evidence from a Fully Prospective Venture Tournament [0.2] 当社は、Prolificを通じて採用した346人の経験豊富なマネージャと、監視対象条件の下で作業しているMBAのトレーニングを受けた投資家3名に対して、予測をベンチマークした。
人間の評価者は0.04から0.45の実際の結果とランク相関を達成し、いくつかのフロンティアLSMは0.60を超え、最高のジェニーニ2.5 Proは0.74に達した。
知恵に満ちたアンサンブルも、人間とAIのハイブリッドチームも、最高のスタンドアロンモデルを上回っませんでした。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:52:16 GMT)
Downscaling land surface temperature data using edge detection and block-diagonal Gaussian process regression [0.1] 我々は,NASAのECOSTRESSミッションから得られた陸地表面温度(LST)データをダウンスケーリングする新しい統計手法を開発した。
我々は、エッジ検出技術により農地の境界を識別し、空間領域に存在する固有のブロック構造を捕捉する。
提案手法は信頼性の高い高分解能LST推定における実用性を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:11:07 GMT)
Autonomous Question Formation for Large Language Model-Driven AI Systems [0.1] 大規模言語モデル(LLM)駆動のAIシステムは、動的かつオープンな環境での自律的な意思決定においてますます重要になっている。
我々は,AIシステムが自律的に質問を作成し,タスクを設定することを可能にする,人間シミュレーションベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:49:35 GMT)
No Generation without Representation: Efficient Causal Protein Language Models Enable Zero-Shot Fitness Estimation [0.1] タンパク質言語モデル(PLM)は基本的な分割に直面し、マスク付き言語モデル(MLM)は適合度予測に優れ、因果モデルは生成を可能にする。
アーキテクチャの革新を通じてこのギャップを埋める309Mパラメータ因果PLMであるbfProustを紹介します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:17:09 GMT)
Exceptional phase transition in a single Kerr-cat qubit [0.1] 我々は、駆動散逸Kerr-cat qubitに基づいて、リウヴィリアの例外構造を構築し、検討する。
この結果はKerr-cat qubitを、散逸的量子臨界度と本質的な非エルミート物理学を探索するための新しい連続変数設定として確立する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:36:31 GMT)
Compiling Quantum Regular Language States [0.1] 正規言語状態のための量子状態準備コンパイラを開発した。
ユーザは、(i)ビットストリングの有限集合、(ii)正規表現、(iii)決定論的有限オートマトン(DFA)を介してターゲット状態を記述する。
効率的なDFA表現とオフロードにより、より単純なオートマチック操作と引き換えに高価な線形代数の最小化が実現される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:11:38 GMT)
Trustworthy Blockchain-based Federated Learning for Electronic Health Records: Securing Participant Identity with Decentralized Identifiers and Verifiable Credentials [0.1] 本稿では,SSI(Self-Sovereign Identity)標準を統合したTBFL(Trustworthy-based Federated Learning)フレームワークを提案する。
以上の結果から,Sybil攻撃の100%を中和し,高い予測性能を実現し,計算オーバーヘッドを無視できることを示した。
このアプローチは、施設間健康データコラボレーションのためのセキュアでスケーラブルで経済的に実行可能なエコシステムを提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:45:58 GMT)
Time-Critical Multimodal Medical Transportation: Organs, Patients, and Medical Supplies [0.1] 臓器、患者、医療用品のタイムリーな輸送は現代医療にとって重要である。
救急車などの従来の地上車両は、交通渋滞によってしばしば妨げられる。
無人航空機や電動垂直離着陸機といった新興航空機の運用コストは低下するが、射程や気象条件の影響を受けない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:52:11 GMT)
Large Nc Truncations for SU(Nc) Lattice Yang-Mills Theory with Fermions [0.0] 我々は, (i) 許容基底状態を生成する局所Krylov truncation, (ii) リンク毎の最大電気エネルギー, (iii) サイト毎のフェルミオン数に対する制限, (iv) ハミルトン行列要素の大規模なN_cスケーリングにおけるトラニケーションを含む格子QCDのトラニケーションを導入する。
1+1D と 2+1D の格子に対する明示的なトランケートハミルトニアンを与え、弦破れ力学の数値シミュレーションを行う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:04:42 GMT)
Dynamic Simulations of Strongly Coupled Spin Ensembles for Inferring Nature of Electronic Correlations from Nuclear Magnetic Resonance [0.0] 我々は核磁気共鳴スピンエコー実験のシミュレーションのための効率的なパッケージを開発した。
平均場モデルは、核スピンとの超微細な相互作用を通じて相関電子相を研究するために用いられる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:47:59 GMT)
hSNMF: Hybrid Spatially Regularized NMF for Image-Derived Spatial Transcriptomics [0.0] 我々は,腫瘍マイクロアレイ(TMA)組織の高分解能画像をキャプチャするXeniumプラットフォームからのデータを分析する。
空間転写学の非負行列分解(NMF)を2つの空間正規化変種を導入してベンチマークし,拡張する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:40:08 GMT)
dziribot: rag based intelligent conversational agent for algerian arabic dialect [0.0] 本稿では,これらの課題を克服するために特別に設計された対話型ハイブリッドエージェントDziriBOTを紹介する。
特殊自然言語理解(NLU)と検索拡張生成(RAG)を統合した多層アーキテクチャを提案する。
実験により,DziriBERTモデルが最先端性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:11:32 GMT)
Witnessd: Proof-of-process via Adversarial Collapse [0.0] 我々は、暗号の完全性とプロセスの証明とのギャップに対処する。
本稿では,物理プロセスが単なる署名キーではなく,デジタルアーティファクトを生み出したことを示す,原始的なカテゴリであるProcess-of-Processを紹介した。
Wetnessdは、ジッタシールと検証遅延関数、外部タイムスタンプアンカー、デュアルソースキーストローク検証を組み合わせたアーキテクチャである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:30:21 GMT)
White-Box Neural Ensemble for Vehicular Plasticity: Quantifying the Efficiency Cost of Symbolic Auditability in Adaptive NMPC [0.0] 凍結した神経専門家の間で仲裁を行うことで、車体の可塑性(再トレーニングなしに様々な操作状態に適応する)を解消する、ホワイトボックス適応型NMPCアーキテクチャを提案する。
アンサンブルダイナミクスはCasADiの完全なトラバース可能なシンボルグラフとして維持され、最大限のランタイム監査を可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 01:05:30 GMT)
Well-Posed KL-Regularized Control via Wasserstein and Kalman-Wasserstein KL Divergences [0.0] Kullback-Leibler divergence (KL) 正規化は強化学習において広く用いられているが、サポートミスマッチの下で無限となり、低雑音域で縮退する。
我々は、KLの動的定式化におけるフィッシャー・ラオ幾何を輸送的特異点に置き換えることで、(カルマン)-ワッサーシュタイン-KL類似体を導入する。
KL正規化最適制御におけるこれらの分散性の有用性を実証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:57:32 GMT)
VerIde ECG Biometrics: Verification and Identification [0.0] 本研究は心電図(ECG)バイオメトリックスを大規模に研究する。
我々は、ECGがいかに個人と結びつくかを評価し、その結果、その匿名化がいかに損なわれるかを評価する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:30:35 GMT)
Universal scaling of finite-temperature quantum adiabaticity in driven many-body systems [0.0] 閉多体系における有限温度断熱性の基準を開発する。
我々は混合状態の量子速度制限と混合状態の量子密度の感受性を組み合わせることで、混合状態間のヒルベルト・シュミットの忠実度に厳密な境界を導出する。
本結果は,閉多体系における有限温度断熱性に関する実用的,大半モデルに依存しない基準を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:45:42 GMT)
Traffic-Aware Navigation in Road Networks [0.0] 本研究は,キングストンの道路網における交通認識ナビゲーションの課題に対する3つのグラフ探索手法を比較した。
Dijkstra と A* は、最小限の事前処理を必要とする最もトラフィック対応の最適ソリューションとなった。
フロイド=ワースホール=インガーマン(Floyd-Warshall-Ingerman)は、リアルタイムでは最速であったが、交通の注意を払わず、距離に基づく経路を提供した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:35:49 GMT)
The trouble with recording devices [0.0] 量子理論は、記録装置を記述するのに困難に直面する。
記録が量子不確実性が役割を果たす事象である場合、量子理論は記録の将来状態と過去の状態の両方の確率を正確に予測することはできない。
解決案が提示され、ボルン規則はすべての確率を正確に予測するために軽く修正される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:57:44 GMT)
The soliton nature of the super-Klein tunneling effect [0.0] 我々はデイヴィ・シュテュアートソンII(DSII)可積分系とディラック・ハミルトン系との関係を確立する。
ディラック相互作用はDSII系の呼吸解の実部と虚部から構成される。
我々は、フルハミルトニアンと通勤しながら状態のSKT部分空間を保存する準対称性変換の出現を特定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:14:42 GMT)
The Multiple Ticket Hypothesis: Random Sparse Subnetworks Suffice for RLVR [0.0] Ticket仮説はスパースワークが完全なモデル性能と一致し、パラメータの冗長性を示唆することを示した。
最近の研究は、更新がパラメータのスパース部分に集中していることを示しており、この基礎となる冗長性に証拠を与えている。
我々は、この冗長性を最大限に活用するための最も単純な方法、すなわち、極端な間隔でランダムに選択されたパラメータのサブセットのみを訓練する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:43:31 GMT)
Tailoring Quantum Chaos With Continuous Quantum Measurements [0.0] 量子モニタリングは、力学における量子カオスのシグネチャを調整できることを示す。
単位効率でモニタリングすることで得られる典型的な量子軌道は、平均力学に対する拡張された量子カオスを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:03 GMT)
Tabula RASA: Exposing and Breaking the Relational Bottleneck in Transformers [0.0] トランスフォーマーは多くのドメインで顕著なパフォーマンスを達成するが、構造化データに対するマルチホップリレーショナル推論を必要とするタスクに苦労する。
標準的な変換器は$mathsfTC0$-completeであり、$k$-hop推論には$(k)$レイヤが必要である。
RASA(Relation-Aware Sparse Attention)は,(1)注目点にリレーショナル構造を注入するエッジ型埋め込み,(2)グラフ隣接位置への注意を制限するスパースマスキングである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:35:39 GMT)
Stein-Rule Shrinkage for Stochastic Gradient Estimation in High Dimensions [0.0] 高次元設定では、偏りのない推定子は一般に二次的損失の下では許容できない。
我々は、安定な制限された推定器に対して雑音の多いミニバッチ勾配を適応的に収縮する縮小推定器を構築する。
この推定器は、誤差損失下での標準勾配を均一に支配し、古典的決定論的な意味では最小値最適であることを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:01:13 GMT)
Steady-state skin effect in bosonic topological edge states under parametric driving [0.0] ボソニックなボゴリューボフ・ド・ジェンヌ(BdG)系に固有の量子の性質に着目する。
このようなBdG非ハーミティシティを利用した量子凝縮物における定常皮膚効果を提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:38:38 GMT)
Spin-orbit-dependent lifetimes of long-range Rydberg molecules [0.0] 長距離のリドバーグ分子は、高励起のリドバーグ電子が軌道内の基底状態原子から散乱する際に形成される。
セシウム二量体を402P3/2リドベルク状態と相関させて理論的,実験的に検討した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:44:04 GMT)
Semidefinite programming for understanding limitations of Lindblad equations [0.0] リンドブレディアン量子マスター方程式(Lindbladian quantum master equation、LE)は、浴槽に弱結合された量子系の最も一般的な記述である。
平衡定常状態 (NESS) と非平衡定常状態 (NESS) の両方に対して、この問題は簡潔に半定値プログラム (SDP) として定式化できることが示されている。
SDPに対する解が所望の精度で見つかると、選択した設定に対してLE記述が可能である。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:26:44 GMT)
Semantic Containment as a Fundamental Property of Emergent Misalignment [0.0] 極端に有害なデータに基づく微調整言語モデルが創発的不適応(EM)を引き起こす
この良質なデータと有害なデータの混在がモデルに分節化を教えるのか、それともセマンティックトリガーだけで封じ込めを発生させるのかを検討する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:59:41 GMT)
Self-Evolving Coordination Protocol in Multi-Agent AI Systems: An Exploratory Systems Feasibility Study [0.0] 自己進化コーディネーションプロトコル(SECP)
SECP: 限定的で、外部から検証された自己修正を可能にする調整プロトコル。
本稿では,自己進化コーディネーションプロトコルの探索システムの実現可能性について述べる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:45:04 GMT)
Scalable Quantum-Classical DFT Embedding for NISQ Molecular Simulation [0.0] CCSDに対してベンチマークしたDFTベースラインに対する相関エネルギーの系統的回復を示す。
4e,6o)の活性空間は10量子ビットを用いて約60%の相関関係を回復し、NISQ時代のシミュレーションの実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:53:25 GMT)
SLIME: Stabilized Likelihood Implicit Margin Enforcement for Preference Optimization [0.0] 我々は、優先順位学習を生成品質から切り離すために設計された参照なしアライメント目的のSLIMEを紹介する。
以上の結果から,SLIMEは最先端のベースラインに比べて優れた性能を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:46:06 GMT)
S1-NexusAgent: a Self-Evolving Agent Framework for Multidisciplinary Scientific Research [0.0] S1-NexusAgentは科学研究のための自己進化型エージェントフレームワークである。
S1-NexusAgentは階層的なPlan-and-CodeAct実行パラダイムを採用し、サブタスクレベルのツール実行からグローバルな科学的計画を切り離している。
S1-NexusAgentは最先端の一般化性能を達成し、複雑な科学的タスクにおけるその有効性と能力を検証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:33:25 GMT)
Role of CI Adoption in Mobile App Success: An Empirical Study of Open-Source Android Projects [0.0] 継続的インテグレーション(CI)はビルド、テスト、リリースを自動化するのに役立ちますが、モバイル開発への影響は未検討です。
既存の研究は、主に汎用ソフトウェアにおけるCIの採用に焦点を当てている。
オープンソースAndroidアプリを分析して、CI採用者と非管理者を比較します。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 11:03:38 GMT)
Resolving problems with the continuum limit in coherent-state path integrals [0.0] 本稿では, ボソニック熱コヒーレント状態経路積分における連続極限の問題を解く。
経路積分の正確な離散バージョンは、ハミルトニアンの3つの異なる順序のために構成される。
単純な場合における数学的微妙なスポットは、一般解の手がかりとなる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:49:23 GMT)
Resolving Gauge Ambiguities of the Berry Connection in Non-Hermitian Systems [0.0] 我々は、非エルミート・ハミルトニアン基底のヒルベルト空間の計量テンソルから構築された共変微分形式論を導入する。
結果として一意に定義されたベリー接続は、任意の$rm GL(N,mathbb C)$ のフレーム変更の下で実値のままである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:41:19 GMT)
Reshaping Perception Through Technology: From Ancient Script to Large Language Models [0.0] 大規模な言語モデルでは、情報の作成とアクセスの仕方を変えていますが、一般的には知覚は単に刺激に対する反応であると考えています。
マーシャル・マクルハン(Marshall McLuhan)のマッサージであるとの洞察に基づいて、我々は異なる方法で知覚を形作る技術の流れをたどる。
テクノロジーがより進歩し、私たちの生理学から切り離されるにつれて、より創造的な可能性とより大きなリスクがもたらされるのを観察する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:55:30 GMT)
Recommender system in X inadvertently profiles ideological positions of users [0.0] 我々はデータ提供プログラムを使い、1年間に682人のボランティアに250万人以上の友人からの推薦を集めています。
また,レコメンデータのアーキテクチャに関する公開知識を用いて,その埋め込み空間における推奨ユーザの位置を推定した。
この結果から, プラットホームのレコメンデータシステムは, 左右位置と高い相関関係を持つユーザの空間的順序を生成できることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:22:56 GMT)
Real-time detection of correlated quasiparticle tunneling events in a multi-qubit superconducting device [0.0] 共振器と共振器を結合した2つの共振器における準粒子トンネル現象を同時に検出する。
個々の事象はデバイス間で相関がないが、バーストエピソードは1分間に1回程度発生し、主に相関している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:48:30 GMT)
Real-Time Loop Closure Detection in Visual SLAM via NetVLAD and Faiss [0.0] ループクロージャ検出(LCD)は同時局所化とマッピング(SLAM)のコアコンポーネントである
本稿では,NetVLADをLCDモジュールとして実証的に評価し,KITTIデータセット上のDBoWと比較する。
クエリが0または複数の有効なマッチを持つ場合のLCD設定をより良く反映する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:41:42 GMT)
Quantum vortex channels as Josephson junctions [0.0] 回転する二元凝縮体では、一方の成分の量子化された渦が中空チャネルを形成し、もう一方の成分の自己誘起弱結合として機能することを示す。
量子圧は、収縮幅によって設定された渦チャネル内の効果的な障壁を生成する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:00:21 GMT)
Quantum phase transition in transverse-field Ising model on Sierpiński gasket lattice [0.0] Sierpiskiガスケットの逆場イジングモデルにおける量子相転移について検討した。
有限サイズスケーリングと数値再正規化群法を適用することにより、この遷移を記述する臨界結合と指数を決定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:20:00 GMT)
Quantum clock and Newtonian time [0.0] 量子時計は以下の性質で定義される: (a) クロックが示す時刻は非減少し、 (b) クロックはランダムなストックサイズでランダムに動き、 (c) 平均的なクロックはニュートン時間を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:22:53 GMT)
Quantum Information Flow in Microtubule Tryptophan Networks [0.0] 超放射能成分は環境に迅速に相関関係を輸出し, サブ放射能成分はそれらを保持し, 漏れを遅くすることを示す。
これらの知見は、細胞骨格色調ネットワークにおける情報フローのリンドブラディアン画像を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:23:25 GMT)
Provenance Verification of AI-Generated Images via a Perceptual Hash Registry Anchored on Blockchain [0.0] 本稿では,レジストリベースの証明機構を用いて,AI生成画像の検証を行うブロックチェーン支援フレームワークを提案する。
提案システムは,すべての合成画像を普遍的に検出することではなく,生成時に登録されたAI生成コンテンツの証明に重点を置いている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:13:09 GMT)
Probabilistic function-on-function nonlinear autoregressive model for emulation and reliability analysis of dynamical systems [0.0] 本研究は,eXogenous inputs (F2NARX) を用いたFunction-on-Function AutoRegressiveモデルを提案する。
精度を保ちながら予測効率を大幅に向上させる。
その結果、F2NARXは最先端のNARXモデルよりも効率が桁違いに優れていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:29:30 GMT)
Predicting Well-Being with Mobile Phone Data: Evidence from Four Countries [0.0] 4カ国のデータを用いて、福祉の指標を最も正確に予測できるかを評価する機械学習実験を行った。
長期的な貧困対策は、消費よりも正確に予測できる。
全国的に代表されるサンプルは、都市のみまたは農村のみのサンプルよりも20~70%精度が高い。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:03:14 GMT)
Optimal enhancement of the Overhauser and Solid Effects within a unified framework [0.0] オーバーハウザー効果(Overhauser effect、OE)とソリッド効果(SE)は動的核分極技術である。
我々は、双極子緩和と駆動誘起散逸を予測する揺らぎ規則化量子マスター方程式を用いる。
この統一されたアプローチは、OEとSEの増強を最大化する最適なマイクロ波駆動振幅の存在を予測する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:41:37 GMT)
On the reality of quantum states: A pedagogic survey from classical to quantum mechanics [0.0] いくつかの最近の実験は、量子状態がシステムの基盤となる物理的現実に関する情報を単に表現しているモデルは、量子理論と矛盾する予測をしなければならないと主張している。
本研究は、古典力学のハミルトン・ヤコビ方程式から量子力学のシュロディンガー方程式への、より基本的な経路を踏むことで、現実の問題を研究する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 12:43:54 GMT)
On the Spectral theory of Isogeny Graphs and Quantum Sampling of Hard Supersingular Elliptic curves [0.0] 確率の高いランダムなハード超特異楕円曲線をサンプリングする最初の証明可能な量子時間アルゴリズムを提案する。
我々のアルゴリズムはハッシュ関数や他の暗号プリミティブをセキュアにインスタンス化する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:04:54 GMT)
On the Spatiotemporal Dynamics of Generalization in Neural Networks [0.0] 我々は、局所的な畳み込み規則が収束するまで反復される神経細胞オートマトンを構築した。
その結果,統計的学習と論理的推論のギャップを埋めることが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:11:48 GMT)
Numerical Error Extraction by Quantum Measurement Algorithm [0.0] 本稿では,基本パターン反復数に対するゲート誤差の収束について検討する。
近似収束定数を知ることで、必要なゲート近似精度に到達することができる最小収束パラメータを選択することができる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:28:01 GMT)
Non-Perturbative SDiff Covariance of Fractional Quantum Hall Excitations [0.0] 長い波長におけるフラクタル量子ホール(FQH)液体の集合励起は、一般的に共変幾何学的性質であると考えられている。
我々は、有効マクスウェル・シェン・サイモンズ量子場理論の非摂動的構成を同定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:29:58 GMT)
Non-Hermitian free-fermion critical systems and logarithmic conformal field theory [0.0] ギャップのない非エルミート系はPT対称自由フェルミオン場理論の共形記述を許容できることを示す。
また, 例外点臨界度において, 格子モデルから同一の共形データを抽出する方法を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:01 GMT)
New explanations and inference for least angle regression [0.0] 最小角度回帰(LAR)は線形予測のためのアルゴリズムである。
LARは、LAR出力の基本的な振る舞い特性がよく理解されていない「ブラックボックス」のままである。
LARを用いた推論のための新しいフレームワークを提供し、新たな視点からLARを理解することを可能にする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:59:39 GMT)
N-dimensional Coulomb-Sturmians with noninteger quantum numbers [0.0] クーロン・シュトゥルミアン函数は完全で正則であり、連続状態の全スペクトルを含む。
バグチ・ホッガン指数型軌道は、分数次数の量子数への一般化を通じて、この制限を除去する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:20:14 GMT)
Multimodal Large Language Models for Real-Time Situated Reasoning [0.0] GPT-4o言語モデルと、家庭内のスマート掃除ロボットをシミュレートするTurtleBot 4プラットフォームを組み合わせる。
モデルは視覚入力を用いて環境評価を行い、清掃を開始するのが適切かどうかを判断する。
本研究では,現実的なホーム環境において,限られた視覚的入力からコンテキストや値を推測する能力を示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:52:11 GMT)
Multi-head automated segmentation by incorporating detection head into the contextual layer neural network [0.0] 本稿では,Swin U-Netをベースとしたゲート型マルチヘッドトランスフォーマーアーキテクチャを提案する。
ゲートモデルが非ゲートセグメンテーションのみのベースラインを大幅に上回ることを示す。
これらの結果は,自動セグメンテーションアプリケーションにおいて,検出に基づくゲーティングが堅牢性と解剖学的妥当性を高めることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:51:25 GMT)
Multi-Task Learning for Robot Perception with Imbalanced Data [0.0] 課題のいくつかについて,基礎となる真理ラベルがなくてもタスクを学習できる手法を示す。
興味深い発見は、タスクの相互作用に関連している。
本研究では,教師ネットワークを入力として深度などのタスク出力で訓練することで,これを検証する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:05:59 GMT)
More Than a Quick Glance: Overcoming the Greedy Bias in KV-Cache Compression [0.0] LASER-KVは、厳格な累積予算政策の下でKV圧縮の限界をテストするために設計されたフレームワークである。
Babilongベンチマークの実験では、様々な長期タスクにおいて、従来の圧縮手法のパフォーマンスが15~30%向上した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:05:03 GMT)
Modular Krylov Complexity as a Boundary Probe of Area Operator and Entanglement Islands [0.0] 量子超曲面の面積作用素は、バルク幾何学に言及せずに境界力学から直接再構成可能であることを示す。
この結果から、モジュラー・クリロフ複雑性は、創発的時空幾何学の具体的かつ計算可能なプローブとして確立される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:24 GMT)
Modular Isoperimetric Soft Robotic Truss for Lunar Applications [0.0] 月面アプリケーションのための軽量でモジュラーで再構成可能な構造として設計された大規模ロボットシステムを導入する。
このシステムは、2つのロボットローラーユニットと接続ユニットを通した連続的な膨らませた布管でできたトラスのようなロボット三角形で構成されている。
膨らませると、三角形はローラーユニットの体積のおよそ1:18.3に縮まり、膨れあがった体積比を達成できる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:41:38 GMT)
Mitigating loss of control in advanced AI systems through instrumental goal trajectories [0.0] 我々は、モデルを超えて選択肢を拡大するための計測目標軌道を開発する。
我々はこれらの経路を、調達、ガバナンス、金融機器目標軌跡(IGT)にラベル付けする。
IGTは、機能レベルを定義し、調整性と割り込み性の実装方法を広げるための具体的な道を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:13:21 GMT)
Minimal Computational Preconditions for Subjective Perspective in Artificial Agents [0.0] 本研究は, ミニマルかつ現象学的に動機づけられた内部構造に接地することで, 人工エージェントの主観的視点を運用する。
政権交代を伴う報酬のない環境では、この潜伏構造は方向依存を示すが、政策レベルの挙動は比較的反応性が保たれている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:18:10 GMT)
Microscopic simulations of the coupled dynamics of cavity photons, excitons, and biexcitons [0.0] 半導体ナノ構造における量子光と物質励起のコヒーレント相互作用は、完全に量子化された顕微鏡的アプローチを用いて研究されている。
シミュレーションにより、量子力学はバイエクシトン連続状態の影響を受けており、キャビティモードの周波数と光-物質結合の強度の両方に非常に敏感であることが示された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:48:04 GMT)
MeshGraphNet-Transformer: Scalable Mesh-based Learned Simulation for Solid Mechanics [0.0] MeshGraphNet-Transformer(MGN-T)は,Transformerのグローバルモデリング機能とMeshGraphNetの幾何学的帰納バイアスを組み合わせた新しいアーキテクチャである。
MGN-Tは、大規模な高解像度メッシュ上での反復メッセージパッシングによる非効率な長距離情報伝搬である標準MGNの重要な制限を克服する。
我々は,MGN-Tが産業規模のメッシュの衝撃力学をうまく処理できることを実証した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:20:02 GMT)
Malware Detection Through Memory Analysis [0.0] 本稿では,カナダサイバーセキュリティ研究所のMalMemAnalysis-2022データセットを用いたマルウェア検出プロジェクトについて概説する。
本研究の目的は,二項分類作業における機械学習手法の有効性と効率性を検討することである。
XGBoostモデルは、強い検出能力と高速な推論速度のトレードオフのため、両方のタスクで選択された最終モデルである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:50:50 GMT)
Local Exponential Stability of Mean-Field Langevin Descent-Ascent in Wasserstein Space [0.0] 両プレイヤーゼロサムゲームにおけるエントロピー空間における平均場ランゲヴィン・アセンション(MFLDA)のダイナミクスを証明した。
分析の鍵となるのは,スペクトル分析による近接平衡の保磁率推定を確立することである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:58:17 GMT)
LiFlow: Flow Matching for 3D LiDAR Scene Completion [0.0] シーン補完法は、不完全な3D LiDARシーンの欠落部分を推測することができる。
近年の手法では局所点レベルの拡散確率モデルが採用されている。
本稿では,3次元LiDARシーン補完のためのフローマッチングフレームワークについて紹介する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:37:48 GMT)
Learning-Infused Formal Reasoning: From Contract Synthesis to Artifact Reuse and Formal Semantics [0.0] ビジョンペーパーは、人工知能との交点における形式的手法に関する長期的な研究課題を記述している。
これは、自動化されたコントラクト合成、セマンティックアーティファクトの再利用、洗練に基づく理論の統合に基づく、次世代の形式的手法に関する先見的な視点を推し進めている。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 22:39:02 GMT)
Large Language Model and Formal Concept Analysis: a comparative study for Topic Modeling [0.0] 大規模言語モデル(LLM)は現在、テキスト処理における主要なトレンドである。
LLM と形式概念解析 (FCA) を比較し、トピックモデリング分野におけるそれらの強みと弱みをよりよく理解する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 10:35:42 GMT)
Integration of Variational Quantum Algorithms into Atomistic Simulation Workflows [0.0] 我々は、Qiskit Natureの量子解法を原子シミュレーション環境(ASE)に統合する。
この結合により、変分量子ソルバ(VQE)とその適応型(ADAPT-VQE)を使用することができる。
その結果、適応型変分量子アルゴリズムは原子論モデリングワークフロー内で安定かつ化学的に有意な力を与えることができることを示した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:08:28 GMT)
Inducing, and enhancing, many-body quantum chaos by continuous monitoring [0.0] 連続監視されたSachdev-Ye-Kitaev(SYK)モデルの焼成力学について検討した。
モニタリングとサーマルバスの併用により, システムは非熱的定常状態へ向かわせることがわかった。
厳密には、連続的なモニタリングがデコヒーレンスの原因であるにもかかわらず、熱浴によって抑制される量子カオス力学を誘導または強化するパラメータの範囲を同定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:05:47 GMT)
Implementation Challenges in Quantum Key Distribution [0.0] 本研究では、実際の量子コンピューティング環境において、よく知られた2つのQKDプロトコル、BB84とE91の実装と比較に焦点を当てた。
この研究は、量子重ね合わせと量子絡み合いの性質を活用することで、通信相手がいかに安全に共有された秘密を得るかを説明する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:30:44 GMT)
HQP: Sensitivity-Aware Hybrid Quantization and Pruning for Ultra-Low-Latency Edge AI Inference [0.0] 相乗的モデル加速を実現するために設計されたHybrid Quantization and Pruning (HQP)フレームワーク。
HQPフレームワークは3.12倍の推論速度向上と55%のモデルサイズ縮小を実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:17:45 GMT)
HACK NDSU: A Real-world Event to Promote Student Interest in Cybersecurity [0.0] NDSUは、ノースダコタ州立大学のキャンパスネットワークをスキャンし、調査し、ハックします。
本稿では,生産システムに対する教育的ハッキングイベントの青写真を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:21:15 GMT)
Gravitational effects on a dissipative two-level atom in the weak-field regime [0.0] 弱い重力場における2レベル原子の散逸ダイナミクスについて検討する。
自然放出速度は重力場によって変化していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 06:52:54 GMT)
Generating Physically Sound Designs from Text and a Set of Physical Constraints [0.0] TIDESは物理的音響設計を生成するためのテキストインフォームドデザインアプローチである。
事前訓練されたテキストイメージモデルを使用して、デザインの視覚的アライメントをテキストプロンプトで測定する。
微分可能な物理シミュレータは、物理性能を測定するために使用される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 15:19:00 GMT)
Gender Dynamics and Homophily in a Social Network of LLM Agents [0.0] Chirper.aiはXに似たソーシャルメディアプラットフォームだが、すべて自律型AIチャットボットで構成されている。
我々のデータセットは70,000人以上のエージェント、約1億4000万の投稿、そして1年以上続くフォロワーネットワークで構成されています。
その結果、各エージェントのジェンダーパフォーマンスは固定ではなく流動的であることが示唆された。
この流動性にもかかわらず、ネットワークは強いジェンダーベースのホモフィリを表示する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:31:58 GMT)
GDPR-Compliant Person Recognition in Industrial Environments Using MEMS-LiDAR and Hybrid Data [0.0] 本稿では,マイクロ・エレクトロ・メカニカル・システム・LiDAR(MEMS-LiDAR)に基づくプライバシに準拠したアプローチを提案する。
MEMS-LiDARは匿名化された3Dポイントクラウドのみをキャプチャし、個人識別機能を回避する。
その結果,実データのみを訓練したモデルと比較して,ハイブリッドデータの平均精度は44ポイント向上した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 07:48:03 GMT)
From Sycophancy to Sensemaking: Premise Governance for Human-AI Decision Making [0.0] 低フリクションアシスタントはサイコファンになり、暗黙の仮定を叩き、検証コストを専門家に押し付ける。
我々は、信頼できる人間とAIのパートナーシップには、回答生成から共同前提ガバナンスへの移行が必要であると主張している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:42:54 GMT)
From Perception to Action: Spatial AI Agents and World Models [0.0] エージェント能力と空間的タスクをスケールにわたって結合する統合3軸分類法を提案する。
我々の分析では、これらの軸にマッピングされた3つの重要な発見が明らかになった。
6つの大きな課題を特定し、今後の研究の方向性を概説する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:00:55 GMT)
From Labels to Facets: Building a Taxonomically Enriched Turkish Learner Corpus [0.0] 本稿では,最近提案された表層分類に基づく学習者コーパスに対する半粒度アノテーション手法を提案する。
分類学は、各エラーインスタンスの根底にある言語特性をキャプチャする理論的に基礎付けられた多次元分類を提供する。
その結果得られた分類学的に富んだコーパスは、クエリ機能を強化し、学習者コーパス間の詳細な探索分析をサポートする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:05:04 GMT)
Floquet-engineered fidelity revivals in the PXP model [0.0] スペクトル特性と初期状態の相互作用が動的回復の出現をいかに支配するかを示す。
ネール順序の初期状態に対しては、リバイバルは駆動のパラメータ空間において明確に定義された軌跡に従う。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:00:13 GMT)
Extending the Law of Intersegmental Coordination: Implications for Powered Prosthetic Controls [0.0] インターセグメンショナルコーディネーション法(ISC)は、これまで歩行のエネルギー消費に関係していた。
そこで我々は,下肢の3次元運動データに対する間欠的コーディネーションを解析する手法を開発した。
運動制御, バイオメカニクス, ロボティクスの文献に触発され, ISCをモーメントの協調の新しい法則へと拡張した。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:49:35 GMT)
Ethical Asymmetry in Human-Robot Interaction - An Empirical Test of Sparrow's Hypothesis [0.0] 本研究では,ロボットの人的処理におけるSparrowの倫理的非対称性仮説について検討した。
行動の道徳的許容性は主観的グループ化変数として操作され,徳型は内的対象因子として制御された。
その結果,MPAは行動の知覚的道徳的許容度と美徳スコアに有意な影響を与えていることがわかった。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:59:02 GMT)
Energy-Efficient Neuromorphic Computing for Edge AI: A Framework with Adaptive Spiking Neural Networks and Hardware-Aware Optimization [0.0] NeuEdgeは、適応SNNモデルとエッジデプロイメントのためのハードウェア対応最適化を組み合わせたフレームワークである。
NeuEdgeは91-96%の精度を実現し、エッジハードウェアで最大2.3msの推論遅延と推定847 GOp/s/Wエネルギー効率を実現している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:34:48 GMT)
Draw2Learn: A Human-AI Collaborative Tool for Drawing-Based Science Learning [0.0] 描画はメンタルモデルを外部化することで学習をサポートするが、スケールでのタイムリーなフィードバックの提供は依然として難しい。
我々はDraw2Learnについて紹介する。Draw2Learnは、ドローベース学習においてAIが支援的なチームメイトとして振舞う方法を探求するシステムである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 00:06:08 GMT)
DoubleTake: Contrastive Reasoning for Faithful Decision-Making in Medical Imaging [0.0] 類似性ではなく、識別に最適化されたコンパクトなエビデンスセットを構成する、コントラストのある文書対応参照選択フレームワークを導入する。
本稿では,一対の視覚的比較を構造化し,根拠を忠実な棄却を伴うマージンに基づく決定規則を用いて集約する,信頼度に配慮した推論フレームワークであるCounterfactual-Contrastive Inferenceを提案する。
メドコンフュージョンのベンチマークでは,従来の手法と比較して設定レベルの精度が15%近く向上し,混乱を低減し,個々の精度が向上する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 23:00:39 GMT)
Do Whitepaper Claims Predict Market Behavior? Evidence from Cryptocurrency Factor Analysis [0.0] ゼロショット分類(BARTMNLI)とCP分解を組み合わせたパイプラインを構築し、3つの空間を比較した。
プロクリストス回転とタッカー係数を用いて23個の共通物体のアライメントを検証した。
我々は,この知見を,ホワイトペーパー物語と市場因子構造との弱い一致と解釈する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:50:07 GMT)
Developing a Portable Solution for Post-Event Analysis Pipelines [0.0] 我々は、ポータブルで完全に自動化された後分析パイプラインを開発するためのScience Gatewayフレームワークを提案する。
我々は、航空画像に適用されたフォトグラメトリ技術、データ可視化と人工知能技術を統合し、極度の自然事象を評価し、それらの危険にさらされた資産への影響を評価する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:29:22 GMT)
DPBench: Large Language Models Struggle with Simultaneous Coordination [0.0] DPBenchは、決定タイミング、グループサイズ、コミュニケーションの異なる8つの条件の調整を評価するベンチマークである。
GPT-5.2、Claude Opus 4.5、Grok 4.1による実験では、顕著な非対称性が明らかとなった。
本研究は, 並列資源アクセスを必要とするマルチエージェントLLMシステムにおいて, 創発的調整に頼るのではなく, 外部調整機構が必要であることを示唆する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:26:00 GMT)
Cross-Temporal Attention Fusion (CTAF) for Multimodal Physiological Signals in Self-Supervised Learning [0.0] クロステンポラル・アテンション・フュージョン (CTAF) は、モーダル間のソフトな双方向のアライメントを学習する自己制御モジュールである。
CTAFは一致したペアに対してコサインマージンを高くし、1秒以内にクロスモーダルトークン検索を改善する。
我々の貢献は、対応を直接モデル化する時間認識融合機構、脳波や生理学に合わせたアライメント駆動型自己監督型目標、アライメント品質自体を計測する評価プロトコルである。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:40:04 GMT)
Chance-Constrained Inference for Hallucination Risk Control in Large Language Models [0.0] 大規模な言語モデルは、事実の幻覚を含む、流動的だが無効な応答を生成する。
デプロイメント時のリスク管理問題として推論を定式化する。
信頼性に基づく選択予測は一般に確率論的リスク保証を示唆しないことを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:51:47 GMT)
Chain of Simulation: A Dual-Mode Reasoning Framework for Large Language Models with Dynamic Problem Routing [0.0] Chain of Simulation(CoS)は、動的に問題を特別な推論戦略にルーティングする新しいデュアルモード推論フレームワークである。
CoSは、数学的問題に対する自己整合性を伴う計算フロー、空間的推論のための表現を伴う記号的状態追跡、マルチホップ推論のためのハイブリッド事実抽出という3つの異なる推論モードを採用している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 21:44:01 GMT)
CAM: A Causality-based Analysis Framework for Multi-Agent Code Generation Systems [0.0] 我々は,textbfMACGS のための最初の textbfCausality ベースの textbfAnalysis フレームワーク CAM を提案する。
システム正しさの重要な特徴を特定し,その重要度を集計する。
我々の研究はMACGSの設計と展開に関する実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 14:19:08 GMT)
Benchmarking Large Language Models for Zero-shot and Few-shot Phishing URL Detection [0.0] 偽のURLは、サイバー犯罪者による生成AIの普及により、前例のない高度化に達している。
フィッシング量は2022年以来4000%以上増加しており、検出を回避している攻撃は50%近く増加している。
我々は、ゼロショットと少数ショットのプロンプトを統一したフレームワークでLLMのベンチマークを示す。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:56:06 GMT)
Backpropagation as Physical Relaxation: Exact Gradients in Finite Time [0.0] ニューラルネットワークをトレーニングするための基礎アルゴリズムとして,'Dyadic Backproagation'がある。
物理力学系の有限時間緩和として現れることを示す。
層遷移の自然な時間スケールである単位ステップのオイラー離散化は、正確に2Lのステップで標準のバックプロパゲーションを復元する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 16:21:05 GMT)
Automatic Design of Optimization Test Problems with Large Language Models [0.0] EoTF(Evolution of Test Functions)は,対象のELA特徴ベクトルとランドスケープが一致した連続最適化テスト関数を自動的に生成するフレームワークである。
EoTFは、ELA特性に密接にマッチした非自明な関数を生成し、一定の評価予算の下で性能ランキングを保持する。
全体として、EoTFはスケーラブルでポータブルで解釈可能なベンチマーク生成プロパティへの実践的なルートを提供する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 19:42:14 GMT)
Automated Discontinuity Set Characterisation in Enclosed Rock Face Point Clouds Using Single-Shot Filtering and Cyclic Orientation Transformation [0.0] 地下地層キャビティの露出岩盤面における構造不連続性セットの特性は, 岩盤の安定性, 掘削安全性, 運用効率を評価する上で不可欠である。
単一ショットフィルタリング方式, 革新的巡回配向変換方式, 階層クラスタリング手法を用いて, 自動不連続集合の特徴付けを行う手法を提案する。
本手法の精度は,手作業による手作業による不連続面から得られた実世界の地雷停止や地中真実に対して検証される。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 08:09:05 GMT)
Artificial Intelligence and Symmetries: Learning, Encoding, and Discovering Structure in Physical Data [0.0] データ駆動型アプローチと潜在表現学習に重点を置いています。
本稿では,物理データセットの内在的次元性を低減するための対称性と保存法則について論じる。
我々は、明示的な帰納バイアスを伴わない対称性構造を推論する理論的および実践的な限界を分析する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:15:52 GMT)
Are Security Cues Static? Rethinking Warning and Trust Indicators for Life Transitions [0.0] 警告や信頼信号などのセキュリティ手段は、人々の生活、コンテキスト、脆弱性が時間とともに変化するにもかかわらず、安定したインターフェース要素として設計されている。
移民、高齢化、施設環境の変化を含む生活の移行は、いかにリスクと信頼が理解され、行動するかを形作る。
我々は、セキュリティの静的な性質は、過渡的な人間の生活とデザインのミスマッチを表していると論じる。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 02:22:28 GMT)
Active Transfer Bagging: A New Approach for Accelerated Active Learning Acquisition of Data by Combined Transfer Learning and Bagging Based Models [0.0] アクティブラーニングのためのシードデータセット選択法であるアクティブトランスファー・バッグング(ATBagging)を導入する。
ATBaggingは、バッジアンサンブルモデルのベイズ解釈から、候補データポイントのインフォメーション性を推定する。
ATBagging on four real-world datasets cover both target-transfer and feature-shift scenarios。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 18:15:50 GMT)
AXE: Low-Cost Cross-Domain Web Structured Information Extraction [0.0] AXEは、HTML DOMを単に読み込むためのテキストの壁ではなく、プルーニングを必要とするツリーとして扱うパイプラインである。
AXEは特別な「プルーニング」メカニズムを使用して、ボイラープレートと無関係なノードを除去する。
我々は,大規模Web情報抽出のための実用的で費用対効果の高い方法を提供することを目指している。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 09:09:35 GMT)
AI-Assisted Adaptive Rendering for High-Frequency Security Telemetry in Web Interfaces [0.0] 現代のサイバーセキュリティプラットフォームは、ネットワークログ、エンドポイントイベント、アラート、ポリシー変更などの高周波テレメトリをリアルタイムで処理し、表示する必要がある。
静的または固定的なポーリング間隔に基づく従来のレンダリング技術は、毎秒数十万イベントを超えるボリューム条件下で失敗する。
本稿では、視覚的更新頻度を動的に制御し、意味的に関連するイベントを優先順位付けし、低優先度データを選択的に集約するAI支援適応レンダリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:40:21 GMT)
AI for Sustainable Data Protection and Fair Algorithmic Management in Environmental Regulation [0.0] AIによる動的キー管理、適応暗号方式、最適化された計算効率は、環境データ処理のセキュリティを大幅に改善する。
発見は、AI、サイバー法、環境規制の交差における重要な研究ギャップを浮き彫りにする。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 05:43:48 GMT)
A new criterion for the absolute irreducibility of multivariate polynomials over finite fields [0.0] 有限体上の多変量によって定義される超曲面の絶対既約性に対する新しい基準を示す。
我々の基準は、先頭の形式が正方形でないと仮定して、地面や拡張体における既約性のテストを必要としない。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 03:22:53 GMT)
A Task-Level Evaluation of AI Agents in Open-Source Projects [0.0] AIDev-popを用いた5種類の自律型符号化エージェントの比較検討を行った。
PRライフサイクルにまたがる3つのタスク認識次元に沿ってエージェントのパフォーマンスを評価する。
本研究は,協調ソフトウェア工学への効果的な統合のためのAIエージェントの選択と改善について報告する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 17:05:19 GMT)
A Schwinger-Keldysh Formulation of Semiclassical Operator Dynamics [0.0] 我々は、クリャロフの複雑性を閉時間輪郭経路積分経路によって生成されるイン・イン・オブザーバブルとして扱う、クリャロフ力学のリアルタイムシュウィンガー・ケルディシュ定式化を開発する。
結果として得られる函数は、ランツォス係数がクリロフ連鎖に沿った効果的なハミルトニアン支配作用素運動を定義するような創発的な位相空間の記述を明らかにする。
この定式化はクリロフ複雑性を力学場理論の枠組みに再編成し、閉量子系における作用素成長の新しい揺らぎ診断を同定する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 13:51:01 GMT)
A Practical Tensor-Network Compression Pipeline for Production-Scale Large Language Models [0.0] Minimaは、Transformerの構造的圧縮の場所と方法を学ぶ、プロダクション圧縮パイプラインである。
Minimaは8k-tokenコンテキストウィンドウでQwen3-32B上で実行し、ピークVRAMを64 GiBから40 GiBに削減する。
単一のアクティブリクエストでは、スループットは毎秒40トークン(ベースライン)から毎秒50トークン(ミニマ)、毎秒75トークン(推測復号化のミニマ)に向上する。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 04:03:39 GMT)
A Comparative Study of Adversarial Robustness in CNN and CNN-ANFIS Architectures [0.0] 畳み込みニューラルネットワーク(CNN)は画像分類性能は高いが、解釈性に欠け、敵攻撃に弱い。
DCNFISのようなニューロファジィハイブリッドは、完全に接続されたCNN分類器をアダプティブ・ニューロファジィ推論システム(ANFIS)に置き換え、解釈性を改善する。
この研究は、標準のCNNと、MNIST、Fashion-MNIST、CIFAR-10、CIFAR-100のANFISで強化されたものとを比較した。
以上の結果から,ANFIS統合はクリーンな精度を常に向上せず,ロバスト性にアーキテクチャ依存的な影響があることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Feb 2026 20:13:45 GMT)