Rethinking Memory Mechanisms of Foundation Agents in the Second Half: A Survey [211.0] 今年、何百もの論文が公開されたメモリは、ユーティリティギャップを埋めるための重要なソリューションとして現れます。
ファンデーションエージェントのメモリを3次元に統一したビューを提供する。
次に、異なるエージェントトポロジの下でメモリがどのようにインスタンス化され、操作されるかを分析する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:16:39 GMT)
RoboInter: A Holistic Intermediate Representation Suite Towards Robotic Manipulation [104.7] RoboInter Manipulation Suiteはデータ、ベンチマーク、中間表現のモデルを含む統一されたリソースである。
多様な表現の半自動アノテーションを可能にする軽量GUIであるRoboInter-Toolと、571の多様なシーンにわたる230万回以上のエピソードを含む大規模なデータセットであるRoboInter-Dataで構成されている。
RoboInter-VLAは、モジュールとエンドツーエンドのVLAバリアントをサポートする、統合されたプラン-then-executeフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:01:54 GMT)
Olaf-World: Orienting Latent Actions for Video World Modeling [101.0] アクションコントロール可能な世界モデルのスケーリングは、アクションラベルの不足によって制限される。
大規模受動的ビデオから行動条件付きビデオワールドモデルを事前訓練するパイプラインであるOraf-Worldを紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:58:41 GMT)
DLLM Agent: See Farther, Run Faster [94.7] 拡散大言語モデル(DLLM)は、自己回帰(AR)デコーディングの代替として、魅力的な効率とモデリング特性を持つ。
我々は、DLLMとARのバックボーンを同一のエージェントワークフロー内でインスタンス化することで、制御された環境でこれを研究する。
DLLMエージェントはARエージェントよりも平均30%以上速く、場合によっては8倍のスピードアップを達成している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:35:16 GMT)
Tele-Omni: a Unified Multimodal Framework for Video Generation and Editing [93.8] Tele-Omniはビデオ生成と編集のための統合されたフレームワークで、マルチモーダルな指示に従う。
テキスト・ツー・ビデオ生成、画像・ビデオ生成、ファースト・ラスト・フレーム・ビデオ生成、イン・コンテクスト・ビデオ生成、およびイン・コンテクスト・ビデオ編集をサポートする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:01:16 GMT)
MOVA: Towards Scalable and Synchronized Video-Audio Generation [91.6] 高品質で同期した映像コンテンツを生成できるオープンソースモデルMOVA(MOSS Video and Audio)を紹介する。
モデルウェイトとコードをリリースすることによって、研究を進め、クリエーターの活気あるコミュニティを育むことを目指しています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:29:18 GMT)
P1-VL: Bridging Visual Perception and Scientific Reasoning in Physics Olympiads [91.1] 我々は、先進的な科学的推論のために設計されたオープンソースのビジョン言語モデルのファミリーであるP1-VLを紹介する。
当社のフラッグシップモデルであるP1-VL-235B-A22Bは、12個の金メダルを確保し、オープンソースモデルで最先端のパフォーマンスを達成した最初のオープンソースVision-Language Modelになります。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:28:08 GMT)
M3-AD: Reflection-aware Multi-modal, Multi-category, and Multi-dimensional Benchmark and Framework for Industrial Anomaly Detection [87.3] M3-ADは産業的異常検出のための統合リフレクション対応フレームワークである。
RA-Monitorは、初期判断が信頼できない場合に、制御された自己補正を行うようにモデルをガイドする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:20:19 GMT)
VersaViT: Enhancing MLLM Vision Backbones via Task-Guided Optimization [87.3] マルチモーダル大言語モデルにおける視覚エンコーダは,その高密度な特徴表現に欠けていることを示す。
本稿では,協調学習のための新しいマルチタスクフレームワークであるVersaViTを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:08:19 GMT)
Reason-IAD: Knowledge-Guided Dynamic Latent Reasoning for Explainable Industrial Anomaly Detection [85.3] Reason-IADは、説明可能な産業異常検出のための知識誘導型動的潜在推論フレームワークである。
実験により、Reason-IADは最先端の手法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:54:17 GMT)
Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery [81.0] DBench-Bioは、AIの生物学的知識発見能力を評価するための、動的で完全に自動化されたベンチマークである。
このパイプラインをインスタンス化し、12のバイオメディカルサブドメインをカバーする月次更新ベンチマークを構築します。
我々の研究は、AIシステムの新しい知識発見能力を評価するための、最初の動的で自動的なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:47:22 GMT)
Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.8] 時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:16:27 GMT)
ST4VLA: Spatially Guided Training for Vision-Language-Action Models [80.4] 大規模視覚言語モデル(VLM)はマルチモーダル理解において優れるが、具体化されたタスクに拡張されると不足する。
本稿では,動作学習と空間的先行時間との整合性を実現するための2元系ビジョン・ランゲージ・アクション・フレームワークST4VLAを紹介する。
ST4VLAは、Google Robotでは66.1 -> 84.6、WidowX Robotでは54.7 -> 73.2、バニラVLAよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:17 GMT)
Forecasting as Rendering: A 2D Gaussian Splatting Framework for Time Series Forecasting [79.4] 時系列予測(TSF)は、周期内変動と周期間トレンドの複雑な絡み合いのため、依然として困難な問題である。
形状変化テンソルを静止画像として扱うと、トポロジカルミスマッチが発生する。
均一な固定サイズの表現に依存することは、モデリング能力を非効率に割り当てる。
TimeGSは、予測パラダイムをレグレッションから2D生成レンダリングに根本的にシフトする、新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:13:36 GMT)
Emergent Structured Representations Support Flexible In-Context Inference in Large Language Models [78.0] 大型言語モデル(LLM)は、人間のような推論を示唆する創発的な行動を示す。
テキスト内概念推論におけるLLMの内部処理について検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:44:17 GMT)
4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere [77.8] 単眼ビデオからの4次元再構成のための統合フィードフォワードフレームワークである4RCを提案する。
4RCは、密集したシーン形状と動きのダイナミクスを共同でキャプチャする総体的な4D表現を学習する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:57:04 GMT)
Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing [76.5] Parallel-Probeは、オンライン並列思考を最適化するために設計されたトレーニング不要のコントローラである。
競合精度を維持しつつ、シーケンシャルトークンを最大$textbf35.8$%、トータルトークンコストを$textbf25.8$%まで削減する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:56:16 GMT)
VK-LSVD: A Large-Scale Industrial Dataset for Short-Video Recommendation [74.7] 本稿では,VK-LSVD(Large Short-Video dataset)を紹介する。
VK-LSVDは、コンテンツ埋め込み、多様なフィードバック信号、コンテキストメタデータなどの豊富な機能に加えて、これまでになく1000万人のユーザーと約2000万のビデオからの400億以上のインタラクションを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:09:13 GMT)
Advancing Block Diffusion Language Models for Test-Time Scaling [73.5] BDLMにおけるテスト時間スケーリングのための統一的なフレームワークを提案する。
復号化とブロックワイズ生成の両方に適応性を導入する。
BACD, TCCFをTDAR-8Bに適用すると, 強いベースラインよりも顕著な改善が得られた。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:05:07 GMT)
LLaDA2.1: Speeding Up Text Diffusion via Token Editing [72.9] 我々は、復号速度と生成品質のトレードオフを超越するパラダイムシフトであるLLaDA2.1を発表した。
従来のマスク・ツー・Token(M2T)方式にT2T編集をシームレスに織り込むことで,共同でしきい値復号方式を導入する。
この構造的革新は、2つの異なるペルソナをもたらす: Speedy Mode (S Mode) は、M2T閾値を大胆に下げ、出力を洗練させるためにT2Tに依存しながら従来の制約を回避し、優れたベンチマークを確保するために保守的なしきい値に傾くQuality Mode (Q Mode) である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:11:18 GMT)
Robo3R: Enhancing Robotic Manipulation with Accurate Feed-Forward 3D Reconstruction [70.1] 3D空間認識は、一般的なロボット操作の基本であるが、信頼性が高く高品質な3D形状の取得は依然として困難である。
本稿では,RGB画像やロボットの状態から直接,正確な距離スケールのシーン形状をリアルタイムで予測する操作可能な3次元再構成モデルであるRobo3Rを紹介する。
我々は、ロボット操作のためのこの代替3Dセンシングモジュールの約束を示唆し、パフォーマンスの連続的な向上を観察する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:58:15 GMT)
Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.1] モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:08:53 GMT)
Thinking with Geometry: Active Geometry Integration for Spatial Reasoning [68.6] 我々は,能動的知覚にパラダイム・パッシブ・フュージョンをシフトさせるフレームワークであるGeoThinkerを提案する。
特徴混合の代わりに、GeoThinkerはモデルが内部の推論要求に応じて条件付けられた幾何学的証拠を選択的に検索することを可能にする。
その結果,次世代の空間知能には,空間構造を積極的に統合する能力が不可欠であることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:22:54 GMT)
X-Mark: Saliency-Guided Robust Dataset Ownership Verification for Medical Imaging [67.9] 高品質な医用画像データセットは深層学習モデルの訓練には不可欠であるが、その無許可の使用は重大な著作権と倫理的懸念を提起する。
医用画像は、自然画像用に設計された既存のデータセットの所有権検証方法に固有の課題を示す。
胸部X線著作権保護のためのサンプル特異的クリーンラベル透かし法であるX-Markを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:03:43 GMT)
SAGE: Scalable Agentic 3D Scene Generation for Embodied AI [67.4] 既存のシーン生成システムは、しばしばルールベースまたはタスク固有のパイプラインに依存し、アーティファクトと物理的に無効なシーンを生成する。
本稿では,ユーザが特定した具体的タスクを与えられたエージェントフレームワークであるSAGEについて,その意図を理解し,大規模にシミュレーション可能な環境を自動的に生成する。
得られた環境は現実的で多様性があり、政策訓練のための現代的なシミュレーターに直接デプロイできる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:55 GMT)
Non-Fungible Blockchain Tokens for Traceable Online-Quality Assurance of Milled Workpieces [67.2] 本研究は, オンライン品質保証プロセスからミツバチの品質関連データのセキュアな保管と転送を実現するための概念と実装について述べる。
この概念はバリューチェーン全体のトレーサビリティを可能にし、時間とコストのかかる手動品質チェックの必要性を最小限にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:53:11 GMT)
AUHead: Realistic Emotional Talking Head Generation via Action Units Control [67.2] リアルなトークヘッドビデオ生成は、仮想アバター、映画制作、インタラクティブシステムにとって重要である。
現在の方法は、きめ細かい感情制御が欠如しているため、ニュアンス的な感情表現に苦慮している。
本稿では、音声から感情制御、すなわちアクションユニット(AU)をアンタングルし、制御可能な生成を実現するための新しい2段階手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:45:51 GMT)
EgoHumanoid: Unlocking In-the-Wild Loco-Manipulation with Robot-Free Egocentric Demonstration [67.1] EgoHumanoidは、エゴセントリックな人間のデモを使って視覚言語アクションポリシーを共同訓練する最初のフレームワークである。
スケーラブルな人的データ収集のためのポータブルシステムを開発した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:03 GMT)
Towards Uniformity and Alignment for Multimodal Representation Learning [66.9] マルチモーダル体制における2つの対立は、モダリティの数が増えるにつれて悪化する。
マルチモーダル表現に対するアライメントと均一性の原理的分離を提案する。
次に,本手法が複数モード分布上の大域的Hlder分散の効率的なプロキシとして機能することを理論的に保証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:08:07 GMT)
Rethinking Visual-Language-Action Model Scaling: Alignment, Mixture, and Regularization [65.4] VLA(Vision-Language-Action)モデルは、ジェネラリストロボットの制御を強く約束する。
標準的な「スケールデータ」レシピがロボット工学に翻訳されるかどうかはまだ不明だ。
本稿では,多様なロボットを対象とした事前学習のためのコアトレーニング選択を再考する,VLAスケーリングの体系的かつ制御された研究を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:25:43 GMT)
ConsisDrive: Identity-Preserving Driving World Models for Video Generation by Instance Mask [65.4] ConsisDriveは、インスタンスレベルで時間的一貫性を強制するために設計された、ID保存駆動の世界モデルである。
当社のフレームワークには,インスタンスマインド・アテンションとインスタンスマインド・ロスという,2つの重要なコンポーネントが組み込まれています。
ConsisDriveは最先端の駆動ビデオ生成品質を実現し、nuScenesデータセット上での下流での自律運転タスクを大幅に改善した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:10:55 GMT)
Bridging Efficiency and Transparency: Explainable CoT Compression in Multimodal Large Reasoning Models [64.3] 思考の長い連鎖(Long CoTs)は、視覚情報を取得することで複雑なタスクに対処するマルチモーダル推論モデルに広く採用されている。
既存のアプローチは,(1)本質的なアライメントの手がかりを取り除き,視覚的テキスト推論の整合性を損なう可能性,(2)圧縮プロセスは説明可能性に欠ける,という2つの大きな課題に直面している。
強化学習により最適化された逐次決定過程として圧縮を定式化する,eXplainable Multi Language CoT である XMCC を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:29:50 GMT)
ERGO: Excess-Risk-Guided Optimization for High-Fidelity Monocular 3D Gaussian Splatting [63.1] 本稿では,ERGOと呼ばれる過度のリスク分解によって導かれる適応最適化フレームワークを提案する。
ERGOはビュー固有の過剰リスクを動的に推定し、最適化中の損失重みを適応的に調整する。
Google Scanned ObjectsデータセットとOmniObject3Dデータセットの実験は、既存の最先端メソッドよりもERGOの方が優れていることを示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:44:43 GMT)
MedVerse: Efficient and Reliable Medical Reasoning via DAG-Structured Parallel Execution [63.1] 複雑な医学推論のための推論フレームワークであるMedVerseを提案する。
データ作成には、知識に基づく医学推論経路を合成するMedVerse Curatorを導入する。
我々は、追加のオーバーヘッドを伴わずに並列実行をサポートするカスタマイズされた推論エンジンを開発した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:03:52 GMT)
Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning [62.5] 大規模言語モデル(LLM)は、ツールや環境とのマルチターンインタラクションを必要とする複雑なタスクを実行するために、自律エージェントに権限を与えている。
完全合成環境生成パイプラインであるエージェント・ワールド・モデル(AWM)を提案する。
私たちは、エージェントがリッチなツールセットと対話できる、毎日のシナリオをカバーする1,000の環境にスケールします。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:55:41 GMT)
AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild [62.5] 視覚言語ナビゲーション(VLN)は、視覚的観察とともに言語指示を解釈することで、知的エージェントが環境をナビゲートする必要がある。
無人航空機(UAV)の現在のVLN研究は、所定のルートに沿ってUAVを誘導するための詳細な指示に依存している。
本稿では,自律型UAVナビゲーションのためのエンド・ツー・エンドのビジョン・ランゲージ・アクションモデルであるAutoFlyを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:08:07 GMT)
Position: Message-passing and spectral GNNs are two sides of the same coin [60.5] グラフニューラルネットワーク(GNN)は通常、メッセージパッシングニューラルネットワーク(MPNN)とスペクトルグラフニューラルネットワーク(SGN)に分けられる。
本稿は、この分割が主に人工的であり、この分野の進歩を妨げると主張している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:53:40 GMT)
Immersion in the GitHub Universe: Scaling Coding Agents to Mastery [60.4] ScaleSWEは、高品質なSWEデータを大規模に構築するために設計された、自動化されたサンドボックス化されたマルチエージェントワークフローである。
このシステムは、環境設定、テスト生成、問題記述合成のための3つの特別なエージェントをコーディネートし、5200リポジトリにわたる600万のプルリクエストを処理する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:30:19 GMT)
Improved Approximate Regret for Decentralized Online Continuous Submodular Maximization via Reductions [59.6] 近似凸設定境界と後悔境界のギャップを利用する方法を示す。
また,集中型自由度アルゴリズムは複雑な決定集合を効率的に処理できることを示す。
我々の主要な技術は、D-OCSMから分散オンライン凸最適化(D-OCO)までである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:59:30 GMT)
EcoGym: Evaluating LLMs for Long-Horizon Plan-and-Execute in Interactive Economies [59.1] 対話型経済における継続的計画・実行意思決定のためのベンチマークであるEcoGymを紹介する。
EcoGymは、透明性のある長期的なエージェント評価のためのオープンなテストベッドとしてリリースされ、現実的な経済環境下でのコントロール可能性とユーティリティのトレードオフを研究するためのものだ。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:12:23 GMT)
The CLEF-2026 CheckThat! Lab: Advancing Multilingual Fact-Checking [58.9] CheckThat!ラボは、オンラインコミュニケーションにおける偽情報と操作の取り組みと戦う革新的な技術の開発を進めることを目的としている。
今年のエディションでは、検証パイプラインが、次のタスクで再び中心に置かれている。
これらのタスクは、文書とスパンのレベルで、多言語設定を含む、挑戦的な分類と検索の問題を表現している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:20:18 GMT)
Autonomous Continual Learning of Computer-Use Agents for Environment Adaptation [57.7] ACuRLは自律的なカリキュラム強化学習フレームワークで、エージェントを人間データゼロの特定の環境に継続的に適応させる。
本研究では,環境内学習と環境横断学習の両方を効果的に実現し,既存の環境を忘れずに4~22%の性能向上を実現した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:06:02 GMT)
The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies [57.4] 大規模言語モデルから構築されたマルチエージェントシステムは、スケーラブルな集合知性と自己進化のための有望なパラダイムを提供する。
エージェント社会が継続的自己進化、完全隔離、安全性の不変性を満たすことは不可能であることを示す。
我々は、特定された安全上の懸念を軽減するために、いくつかの解決方法を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:18:19 GMT)
DexImit: Learning Bimanual Dexterous Manipulation from Monocular Human Videos [56.6] DexImitは、人間の操作映像を物理的に妥当なロボットデータに変換する自動フレームワークである。
DexImitは、インターネットまたはビデオ生成モデルから、人間のビデオに基づいて大規模なロボットデータを生成することができる。
ツールの使用、長距離タスク、きめ細かい操作を含む多様な操作タスクを処理できる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:02 GMT)
OSI: One-step Inversion Excels in Extracting Diffusion Watermarks [56.2] ガウスシェーディングスタイルの透かしを抽出する手法であるワンステップインバージョン(OSI)を提案する。
OSIは、透かし抽出を学習可能な記号分類問題として再構成し、初期雑音の正確な回帰を不要にする。
我々のOSIは,20倍高速で,抽出精度が向上し,透かしペイロード容量が2倍になる多段拡散インバージョン法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:43:16 GMT)
AgentCAT: An LLM Agent for Extracting and Analyzing Catalytic Reaction Data from Chemical Engineering Literature [55.7] 本稿では,化学工学論文から触媒反応データを抽出し,解析する大規模言語モデル (LLM) エージェントであるAgentCATを提案する。
AgentCATは、化学工学分野における長年のデータボトルネックを克服する代替手段として機能する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:30:11 GMT)
AlgoVeri: An Aligned Benchmark for Verified Code Generation on Classical Algorithms [55.0] 既存のベンチマークでは、個々の言語/ツールのみをテストするため、パフォーマンス番号は直接比較できない。
このギャップに対処するAlgoVeriは、Dafny、Verus、Leanで77ドルの古典的アルゴリズムのベリコーディングを評価するベンチマークです。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:58:26 GMT)
GPU-Accelerated Algorithms for Graph Vector Search: Taxonomy, Empirical Study, and Research Directions [54.6] 本稿では,GPU加速グラフに基づくベクトル探索アルゴリズムについて包括的に研究する。
我々は、GPU最適化戦略の詳細な分類を確立し、アルゴリズムタスクとハードウェア実行ユニット間のマッピングを明確にする。
我々の発見は、スケーラブルで堅牢なGPUベースの近接検索システムを設計するための明確なガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:18:04 GMT)
Revisiting Content-Based Music Recommendation: Efficient Feature Aggregation from Large-Scale Music Models [54.4] Music Recommendation Systems (MRS)は、現代のストリーミングプラットフォームの基盤である。
我々は,音楽レコメンデーションにおけるマルチモーダル情報の役割を強調するために,総合的なデータセットとベンチマークフレームワークであるTASTEを提案する。
近年の大規模自己監督型音楽エンコーダの活用により,レコメンデーションタスク間で抽出された音声表現の意義を実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:24:41 GMT)
Hoi! -- A Multimodal Dataset for Force-Grounded, Cross-View Articulated Manipulation [54.0] 本稿では,力場付きクロスビュー調音操作のためのデータセットを提案する。
データセットは381個の調音されたオブジェクトに3048個のシーケンスを含む。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:42:26 GMT)
Stroke3D: Lifting 2D strokes into rigged 3D model via latent diffusion models [53.3] Stroke3Dは、ユーザ入力から2D描画ストロークと記述テキストプロンプトを直接生成する新しいフレームワークである。
私たちの知識を最大限に活用するために、私たちの研究は、ユーザ引き起こされた2Dストロークに条件付けされたトリグされた3Dメッシュを初めて生成しました。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:17:00 GMT)
Dense Neural Networks are not Universal Approximators [53.3] ニューラルネットワークは任意の連続関数の普遍性を持たないことを示す。
ReLUニューラルネットワークは、重みと入出力次元の自然な制約を受ける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:37:28 GMT)
Safeguarding Privacy: Privacy-Preserving Detection of Mind Wandering and Disengagement Using Federated Learning in Online Education [53.3] 遠隔学習における行動・認知障害の相違に対処するために,デバイス間フェデレーション学習を利用したフレームワークを提案する。
顔の表情と視線特徴を用いた映像ベース認知解離検出モデルに適合する。
以上の結果から,学習者のエンゲージメントを促進するプライバシー保護教育技術への大きな期待が示された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:40:01 GMT)
Sparse Layer Sharpness-Aware Minimization for Efficient Fine-Tuning [52.6] シャープネス対応計算(SAM)は、細調整を含む機械学習タスクの一般化性能を改善するために、平らなロスランドスケープを持つミニマを求める。
本稿では,層にスパース手法を導入することにより,このボトルネックを解消するアプローチSL-SAMを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:05:43 GMT)
Towards Autonomous Mathematics Research [52.1] Aletheiaは、自然言語のエンドツーエンドの解を反復的に生成し、検証し、修正する数学研究エージェントである。
我々は、オリンピアード問題から博士レベルのエクササイズまで、AI支援数学研究におけるいくつかのマイルストーンを通じて、アレクシアを実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:50:15 GMT)
StructLens: A Structural Lens for Language Models via Maximum Spanning Trees [52.0] StructLensは、内部構造が全体構造とどのように関係しているかを明らかにするために設計された分析フレームワークである。
以上の結果から,StructLensは従来のコサイン類似性とは大きく異なる層間類似性パターンを呈することが明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:30:32 GMT)
K-Sort Eval: Efficient Preference Evaluation for Visual Generation via Corrected VLM-as-a-Judge [51.9] 視覚生成モデルの急速な開発により、よりスケーラブルで人間に合わせた評価方法の必要性が高まっている。
K-Sort Evalは,後方補正と動的マッチングを統合した信頼性と効率的なVLMに基づく評価フレームワークである。
実験の結果、K-Sort EvalはK-Sort Arenaと一致した評価結果を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:07:46 GMT)
PeroMAS: A Multi-agent System of Perovskite Material Discovery [51.9] ペロブスカイト太陽電池(PSC)は優れた光電子性能とコストポテンシャルで有名である。
既存のAIアプローチは主に、マテリアルデザイン、プロセス最適化、プロパティ予測など、独立したモデルに焦点を当てている。
ペロブスカイト材料発見のためのマルチエージェントシステムPeroMASを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:33:06 GMT)
Temper-Then-Tilt: Principled Unlearning for Generative Models through Tempering and Classifier Guidance [51.5] 本研究では,タスクを目標分布に対する密度比推定としてフレーミングすることで,大規模生成モデルにおける機械学習について検討する。
左折集合がシャープで集中したデータ分布を表す場合、有限サンプルで忠実に解けないことを示す。
本稿では,基本モデルを凍結し,二段階の推論手法を適用したTemper-Then-Tilt Unlearning(T3-Unlearning)を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:08:40 GMT)
Para-B&B: Load-Balanced Deterministic Parallelization of Solving MIP [50.9] MIP(Mixed-integer Programming)は、連続型と整数型の両方の決定変数を組み込むことで線形プログラミングを拡張する。
本稿では,高性能MIPソルバであるHiGHSに対して,決定論的並列分岐結合の完全なオープンソース実装を初めて提案する。
本手法では,ワーカスレッド間で完全なソルバ状態を複製することにより,厳密な決定性を保証する新しいデータ並列アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:17:53 GMT)
Benchmarking Knowledge-Extraction Attack and Defense on Retrieval-Augmented Generation [50.9] Retrieval-Augmented Generation (RAG) は知識集約型アプリケーションの基礎となっている。
近年の研究では、悪意あるクエリによって知識抽出攻撃が機密知識ベースコンテンツを回復できることが示されている。
本稿では,RAGシステムに対する知識抽出攻撃のための最初の体系的ベンチマークを紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:27:46 GMT)
ALIVE: Animate Your World with Lifelike Audio-Video Generation [50.7] ALIVEは、Soraスタイルのオーディオビデオ生成とアニメーションに事前訓練されたテキスト・トゥ・ビデオ(T2V)モデルを適用する世代モデルである。
音声-視覚同期と参照アニメーションをサポートするため,共用音声-ビデオブランチによるMMDiTアーキテクチャの強化を行った。
ALIVEは優れたパフォーマンスを示し、一貫してオープンソースモデルを上回り、最先端の商用ソリューションにマッチするか、超えている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:53:52 GMT)
Parallel Complex Diffusion for Scalable Time Series Generation [50.0] PaCoDiは周波数領域における生成モデリングを分離するスペクトルネイティブアーキテクチャである。
本研究では,PaCoDiが生成品質と推論速度の両方において,既存のベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:31:53 GMT)
Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs [50.0] 本稿では,モデル精度と推論性能を捉えるハードウェア共同設計法を提案する。
我々はNVIDIA Jetson Orin上で1,942の候補アーキテクチャを実証的に評価した。
我々のアーキテクチャはWikiText-2で19.42%低いパープレキシティを実現している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:51:00 GMT)
GEBench: Benchmarking Image Generation Models as GUI Environments [49.5] GUI生成における動的相互作用と時間的コヒーレンスを評価するためのベンチマークであるGEBenchを紹介する。
GE-Scoreは、ゴール達成、インタラクションロジック、コンテンツ一貫性、UIの可視性、視覚品質を評価する新しい5次元メトリックである。
そこで本研究では,アイコンの解釈,テキストレンダリング,局所化精度を重要なボトルネックとして認識した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:30:57 GMT)
Contextual and Seasonal LSTMs for Time Series Anomaly Detection [49.5] CS-LSTM (Contextual and Seasonal LSTMs) という新しい予測型フレームワークを提案する。
CS-LSTMはノイズ分解戦略に基づいて構築され、コンテキスト依存と季節パターンを併用する。
彼らは一貫して最先端の手法を上回り、堅牢な時系列異常検出における有効性と実用的価値を強調した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:46:15 GMT)
Sci-VLA: Agentic VLA Inference Plugin for Long-Horizon Tasks in Scientific Experiments [49.0] 最近のビジョン言語アクションモデルは、ロボット研究所にとって有望な基盤を提供する。
実験は通常、複数の原子タスクからなる長い水平タスクを含む。
科学的なタスクのために微調整されたVLAモデルは、原子実験的なアクションを確実に実行することができるが、これらの既知の原子のアクションを再順序付けして構成することによって形成される複合的なタスクの実行に失敗することが多い。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:50:19 GMT)
Confounding Robust Continuous Control via Automatic Reward Shaping [48.9] オフラインデータセットから連続制御問題に対する報酬形成機能を自動的に学習することを提案する。
提案手法は,最近提案された因果ベルマン方程式に基づいて,最適状態値の厳密な上界を学習する。
私たちの研究は、因果的観点から堅牢な継続的制御を分離する第一歩です。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:23:12 GMT)
Learning on the Manifold: Unlocking Standard Diffusion Transformers with Representation Encoders [48.7] 標準拡散変換器は直接表現に収束しないことを示す。
我々は幾何学的干渉を根本原因とみなす。
我々の手法RJFは、標準のDiT-Bアーキテクチャを効果的に収束させ、3.37のFIDを実現する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:58:04 GMT)
Frame-Level Internal Tool Use for Temporal Grounding in Audio LMs [48.5] 大規模な音声言語モデルは、複雑な音声理解タスクにますます使われている。
彼らは、単語アライメントや話者ダイアリゼーションのような正確な時間的根拠を必要とする時間的タスクに苦労する。
本稿では,フレームレベルの内部ツール使用法を提案する。これは,内部の音声表現を用いて時間的グラウンドを直接行うように音声LMを訓練する手法である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:19:52 GMT)
Monocular Normal Estimation via Shading Sequence Estimation [48.3] 単分子正規推定は、任意の光の下で物体の1つのRGB画像から正規写像を推定することを目的としている。
既存の手法は、通常の地図を直接予測するディープモデルに依存している。
シェーディングシーケンス推定として正規推定を再構成する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:59:42 GMT)
Overview of the TREC 2025 RAGTIME Track [48.0] RAGTIMEには、多言語レポート生成、英語レポート生成、多言語情報検索(MLIR)の3つのタスクタイプが含まれている。
合計125回の参加チーム(トラックコーディネーターによるベースライン)が3つのタスクに出場した。
この3つのタスクについて概説し、利用可能な結果を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:47:20 GMT)
Are Language Models Sensitive to Morally Irrelevant Distractors? [47.9] 低あいまいなシナリオであっても、道徳的気晴らし者が大きな言語モデルの道徳的判断を30%以上シフトできることを示す。
この研究は、人間の道徳的判断の安定性を仮定する理論に挑戦する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:18:05 GMT)
UniVTAC: A Unified Simulation Platform for Visuo-Tactile Manipulation Data Generation, Learning, and Benchmarking [47.9] シミュレーションベースのビジュオ触覚データプラットフォームUniVTACを提案する。
大規模なシミュレーション合成データに基づいて訓練されたビジュオ触覚エンコーダであるUniVTACエンコーダを紹介する。
代表的な8つのビジュオ触覚操作タスクからなるUniVTACベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:57:00 GMT)
Fine-R1: Make Multi-modal LLMs Excel in Fine-Grained Visual Recognition by Chain-of-Thought Reasoning [47.9] Fine-R1は、ファイングラインド視覚認識用に設計されたR1スタイルのMLLMである。
4ショットのトレーニングだけで、Fine-R1は既存のMLLMよりも優れており、MLLMの推論や、対照的なCLIPモデルも優れている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:29:03 GMT)
SMES: Towards Scalable Multi-Task Recommendation via Expert Sparsity [47.8] 産業推薦システムはマルチタスク学習に頼り、多様なユーザフィードバック信号を推定し、それらをランキングに集約する。
モデルスケーリングの最近の進歩は、推薦において有望な利益を示している。
この一様パラメータスケーリングと異種タスクキャパシティ要求のミスマッチは、スケーラブルなマルチタスクレコメンデーションに根本的な課題をもたらす。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:56:12 GMT)
Geographically Weighted Canonical Correlation Analysis: Local Spatial Associations Between Two Sets of Variables [47.7] 本稿では,古典的統計手法であるカノニカル相関解析(CCA)の空間関係研究への応用を批判的に評価する。
本研究では,2つの変数間の局所的空間的関連を探索する新しい手法として,地理重み付き標準相関解析(GWCCA)を提案する。
その結果,GWCCAは都市計画,環境科学,公衆衛生,交通といった空間データ集約分野に広く応用できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:36:49 GMT)
Shifting the Breaking Point of Flow Matching for Multi-Instance Editing [47.3] 本稿では,共同注意操作を分割し,インスタンス固有のテキスト命令と空間領域間の結合を強制する機構であるインスタンス・ディスタングル・アテンションを紹介する。
提案手法は,グローバルな出力コヒーレンスを保ちながら,編集のゆがみと局所性を促進し,単一パスのインスタンスレベルの編集を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:18:27 GMT)
Q-DiT4SR: Exploration of Detail-Preserving Diffusion Transformer Quantization for Real-World Image Super-Resolution [47.1] 提案するQ-DiT4SRは,DiTベースのReal-ISRに適したPTQフレームワークである。
H-SVDは,グローバルな低ランク分岐とローカルなブロックワイドランク1分岐をマッチングパラメータ予算の下で統合する階層的SVDである。
複数の実世界のデータセットの実験により、我々のQ-DiT4SRは、W4A6とW4A4設定の両方でSOTA性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:16:36 GMT)
Toward Fine-Grained Facial Control in 3D Talking Head Generation [47.0] Fine-Grained 3D Gaussian Splattingは、時間的に一貫した高忠実なヘッド生成を可能にする新しいフレームワークである。
提案手法は,高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細・高精細な音声
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:49:50 GMT)
ClinAlign: Scaling Healthcare Alignment from Clinician Preference [46.6] 今回,HealthRubricsについて紹介する。
119は広く再利用され、臨床的に根ざした原則である。
私たちのフレームワークでトレーニングされた推論で3Bパラメータのみを活性化する30BパラメータモデルはHealthBench-Hardで33.4%を達成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:02:57 GMT)
Learning to Discover Iterative Spectral Algorithms [46.4] AutoSpecは、大規模数値線形代数の反復スペクトルアルゴリズムを発見するニューラルネットワークフレームワークである。
代用数値線形代数タスクの探索アルゴリズムにAutoSpecを適用した。
実世界の解法では、学習された手順は精度および/またはカウントの減少のオーダー・オブ・マグニチュードの改善をもたらす。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:39:59 GMT)
Targum -- A Multilingual New Testament Translation Corpus [46.4] 657の新約聖書の多言語コーパスを導入し、そのうち352語は独特で、英語(合計396語から208語)、フランス語(78語から41語)、イタリア語(33語から18語)、ポーランド語(48語から30語)、スペイン語(102語から55語)の5言語で前例のない深さである。
各翻訳にはメタデータが手動でアノテートされ、そのテキストを作業の標準化された識別子、その特定のエディション、その修正年をマップする。
この標準化により、研究者は自身のニーズに対して「普遍性」を定義することができる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:27:57 GMT)
Reward Modeling for Reinforcement Learning-Based LLM Reasoning: Design, Challenges, and Evaluation [46.4] 大きな言語モデル(LLM)は変革の可能性を示しているが、その推論は矛盾し、信頼できないままである。
この研究は、報酬モデリングは単なる実装の詳細ではなく、推論アライメントの中心的なアーキテクトであると主張している。
本枠組みでは,報奨機構の分類,報奨ハッキングを広範にわたる障害モードとして分析し,報奨が課題を統一する方法について検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:45:24 GMT)
Emergent Analogical Reasoning in Transformers [46.1] 認知における中心的な役割にもかかわらず、トランスフォーマーがアナログ推論を習得し実装するメカニズムはいまだに理解されていない。
類推的推論をカテゴリー間の実体間の対応の推論として定式化する。
変換器における類似推論は、埋め込み空間における関係構造の幾何学的アライメントと、変換器内の関手の適用の2つの重要な構成要素に分解されることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:54:46 GMT)
Decoupled Reasoning with Implicit Fact Tokens (DRIFT): A Dual-Model Framework for Efficient Long-Context Inference [45.8] DRIFTは、推論プロセスから知識抽出を明示的に分離するために設計された、新しいデュアルモデルアーキテクチャである。
静的プロンプト圧縮とは異なり、DRIFTは軽量な知識モデルを用いて文書チャンクを動的に圧縮し、クエリで条件付けられた暗黙の事実トークンに変換する。
我々のアプローチは、大規模言語モデルの効果的なコンテキストウィンドウと推論能力を拡張するためのスケーラブルで効率的なパラダイムを提供します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:42:31 GMT)
Predictive Query Language: A Domain-Specific Language for Predictive Modeling on Relational Databases [45.6] 我々は、関係データベース上の予測タスクを定義するための予測クエリ言語(PQL)を提案する。
PQLでは、単一の宣言型クエリで予測タスクを指定することが可能で、トレーニングラベルの自動計算が可能になる。
我々は、その汎用性を2つの実装で示している。1つは、小規模で低レイテンシな使用のためのもので、もう1つは、大規模データベースを処理できるものだ。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:22:17 GMT)
ArtifactLens: Hundreds of Labels Are Enough for Artifact Detection with VLMs [43.9] ArtifactLensは、5つの人間のアーティファクトベンチマークで最先端を達成する。
事前訓練されたVLMは、すでにアーティファクトを検出するのに必要な知識をコード化している。
本手法は他のアーティファクトタイプ – 対象形態学,動物解剖学,実体的相互作用 – に一般化する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:16:22 GMT)
Fundamental Reasoning Paradigms Induce Out-of-Domain Generalization in Language Models [43.8] 本研究では,これらのパラダイム間の相互作用がLarge Language Model (LLM) の推論にどのように影響するかを明らかにした。
まず,3つの基本パラダイムのうちの1つを対象とする,記号的タスクからの推論トラジェクトリの新しいデータセットを収集する。
次に、これらのスキルをLLMに導入するための効果的な方法を検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:47:40 GMT)
Controlling Chat Style in Language Models via Single-Direction Editing [43.1] 本稿では,モデルのアクティベーション空間において,異なるスタイリスティック属性が線形方向として符号化されるという仮説を検証した。
そこで我々は,厳密なスタイル制御のための軽量でトレーニング不要な手法を提案する。
提案手法は, 線形スタイル構成をサポートし, 好ましくない動作を損なうことにより安全性を高めるとともに, 10 モデル以上の実験により, 最小計算コストでコア能力を保ちながら, 高いスタイルの順守を実現する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:05:04 GMT)
A Behavioral Fingerprint for Large Language Models: Provenance Tracking via Refusal Vectors [43.1] 安全アライメントによって引き起こされる行動パターンを活用する新しいフィンガープリントフレームワークを提案する。
76の子孫モデルを対象とした大規模識別タスクにおいて,本手法は正しいモデル群を同定する際の精度を100%向上する。
本稿では,このプライベートフィンガープリントを,公開で検証可能なプライバシー保護アーティファクトに変換するための理論的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:57:35 GMT)
Fast Motion Planning for Non-Holonomic Mobile Robots via a Rectangular Corridor Representation of Structured Environments [43.1] 非ホロノミックな自律移動ロボットの高速動作計画のための完全なフレームワークを提案する。
提案手法では,重なり合う矩形廊下のコンパクトグラフを生成する決定論的自由空間分解を導入する。
このフレームワークは、長方形の列を見つけて、最適に近い運動可能な軌道を生成することで、オンラインのモーションプランニングを行う。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:18:14 GMT)
Tighter Information-Theoretic Generalization Bounds via a Novel Class of Change of Measure Inequalities [42.8] 特定事例として、$f$-divergencesや$2$-divergenceなど、幅広い情報手段のファミリーで測度の不等式を変更する。
次に、これらの不等式を学習アルゴリズムの一般化誤差の解析に組み込むとともに、簡易な解析によって最もよく知られた結果を復元する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:48:16 GMT)
Online Learning in MDPs with Partially Adversarial Transitions and Losses [42.6] 遷移関数がほとんどのステップであるが,1エピソードあたり$$$の固定サブセットで逆向きに振る舞うことができるMDPの強化学習について検討した。
両エピソードの相違が相変わらず安定なエンプレクショナル・コンディショニング・コンディショナー(Emphconditioned occupancy measures)を導入する。
我々は,全情報フィードバックと盗賊フィードバックの両面から,敵対的MDPの反抗的設定(=H-1$)の後悔を特徴づける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:13:11 GMT)
PRISM: A Principled Framework for Multi-Agent Reasoning via Gain Decomposition [42.3] 大規模言語モデル(LLM)の推論能力を高めるための有望なパラダイムとして,マルチエージェントコラボレーションが登場した。
既存のアプローチは、パフォーマンス向上を駆動する原則的なガイダンスや、マルチエージェント推論を体系的に最適化する方法が欠如している。
マルチエージェント推論ゲインを3つの概念的に独立な次元に分解する統合理論フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:47:22 GMT)
Autoregressive Direct Preference Optimization [42.2] 我々はBradley-Terryモデルを適用する前に自己回帰的仮定を明示的に導入する新しい定式化を導入する。
我々は、自己回帰モデリングを優先最適化フレームワークに明示的に統合する、自己回帰 DPO (Autoregressive DPO) と呼ばれる新しい変種を導出する。
DPOに基づくアルゴリズムを設計する際に考慮すべき2つの長さ尺度が存在することを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:45:30 GMT)
Online Monitoring Framework for Automotive Time Series Data using JEPA Embeddings [42.2] 本研究では,オブジェクト状態表現の異常を検出するオンラインモニタリングフレームワークを提案する。
JEPAベースの自己教師型予測タスクが構築され、異常ラベルのないトレーニングが可能になる。
結果として表現力のあるJEPA埋め込みは、確立された異常検出方法の入力として機能する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:10:29 GMT)
MieDB-100k: A Comprehensive Dataset for Medical Image Editing [41.8] 既存の医用画像編集データセットは、限られた多様性、医療用画像理解の欠如、品質とスケーラビリティのバランスの取れないことがしばしばある。
テキスト誘導医療画像編集のための大規模で高品質で多様なデータセットであるMieDB-100kを提案する。
編集作業は、理解能力と生成能力の両方を考慮して、知覚、修正、変換の観点に分類する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:37:05 GMT)
NMRTrans: Structure Elucidation from Experimental NMR Spectra via Set Transformers [41.6] 我々は化学文献から抽出した実験的な1ドルHと13ドルCのスペクトルの大規模コーパスであるNMRSpecを構築した。
NMRTransは、スペクトルを無秩序なピークセットとしてモデル化し、モデルの帰納バイアスとNMRの物理的性質を一致させる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:37:41 GMT)
Improving Data and Reward Design for Scientific Reasoning in Large Language Models [40.5] 我々は、異質なオープンソース科学データをSCIデータセットに変換する大規模で体系的なデータ処理パイプラインを開発した。
SCIデータセットは、8つのSTEM被験者に対して100万の質問で構成されており、明確な検証可能な/オープンエンドの分割、スケーラブルな難易度アノテーション、そしてオープンエンドの回答の評価を運用するきめ細かいルーリックが提供されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:26:18 GMT)
Robust Processing and Learning: Principles, Methods, and Wireless Applications [40.0] 本稿では,無線センシング・通信(WSC)によるロバストネスの基本原理と手法について概説する。
本研究は,ロバストな推定とテスト,分布的にロバストな最適化,正規化とトレーニングの敵関係といった重要な手法について検討する。
一般信号処理コミュニティに古典的発展と最近のロバストネス理論の進歩を紹介することを目的としている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:53:52 GMT)
When Less Is More? Diagnosing ASR Predictions in Sardinian via Layer-Wise Decoding [39.9] 多言語音声モデルの中間層は、最終的な出力層よりも音声的に正確な表現を符号化することが多い。
上変圧器層をトラッピングするとPhonme Error Rates (PER) が向上し, 最良性能は最終層ではなく, 2層先に達成された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:45:03 GMT)
Amplitude-Phase Separation toward Optimal and Fast-Forwardable Simulation of Non-Unitary Dynamics [39.7] 振幅-位相分離法(Amplitude-Phase separation、APS)は、任意の非単体進化を、ユニタリ作用素とエルミート作用素の別個のシミュレーションに定式化する。
APSは、一般の非単位力学のための効率的な量子アルゴリズムを開発するための効率的で汎用的な経路を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:23:55 GMT)
Kunlun: Establishing Scaling Laws for Massive-Scale Recommendation Systems through Unified Architecture Design [39.6] モデル効率とリソース割り当てを改善するスケーラブルなアーキテクチャであるKunlunを紹介します。
Kunlunは現在、主要なMeta Adsモデルにデプロイされており、運用上の大きな影響を与えている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:37:55 GMT)
Blockwise Advantage Estimation for Multi-Objective RL with Verifiable Rewards [39.5] グループ相対ポリシー最適化(GRPO)は、完了時にすべてのトークンに対して単一のスカラーの利点を割り当てる。
明確なセグメントと目的を持つ構造化世代では、このカップルはセグメント間で無関係な報酬信号を生成し、客観的な干渉と不正な信用につながる。
我々は、GRPO互換メソッドのファミリーであるBlockwise Advantage Estimationを提案し、それぞれの目的をそれぞれ独自の利点を割り当て、対応するテキストブロックのトークンにのみ適用する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:22:37 GMT)
Fine-T2I: An Open, Large-Scale, and Diverse Dataset for High-Quality T2I Fine-Tuning [39.4] Fine-T2Iは、テキストから画像への微調整のための大規模で高品質で完全にオープンなデータセットである。
すべてのサンプルは、テキストイメージアライメント、視覚的忠実度、即興品質のために厳格にフィルタリングされる。
最後のデータセットには600万以上のテキストイメージペアが含まれており、ディスク上では約2TBである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:06:54 GMT)
What Does Preference Learning Recover from Pairwise Comparison Data? [39.2] ペアワイズな嗜好学習は機械学習の中心であり、近年は言語モデルと人間の嗜好の整合に応用されている。
典型的なデータセットは三つ子$(x, y+, y-)$で構成されており、レスポンス$y+$はコンテキストに対するレスポンス$y-$よりも好まれる。
我々は、条件付き嗜好分布(CPRD)を通じて符号化される嗜好情報を形式化する。
これらの結果は、好みの学習が実際に回復するものを理解するための、データ中心の基盤を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:59:55 GMT)
Entanglement percolation in random quantum networks [39.1] エンタングルメント・パーコレーション(Entanglement Percolation)は、量子ネットワークの任意の2つのノード間の最大エンタングルを生成することを目的としている。
同じ部分的に絡み合った状態のネットワークでは、ネットワークトポロジーはパーコレーションに必要な最小の絡み合いを決定する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:00:01 GMT)
How effective are VLMs in assisting humans in inferring the quality of mental models from Multimodal short answers? [38.3] メンタルモデルは、学生のトピックの概念的理解を評価する上で重要な役割を果たす。
MMGraderは、概念グラフを分析フレームワークとして、学生のメンタルモデルの品質をマルチモーダル応答から推定する。
精度の向上により、これらは教室全体のメンタルモデルを推定する上で、教師にとって非常に効果的なアシスタントとなる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:01:05 GMT)
Causality in Video Diffusers is Separable from Denoising [38.1] 因果関係は、ビデオ、言語、ロボット軌道など、多くの複雑な生成過程の基盤となっている。
現在の因果拡散モデルでは、時間的推論を反復的妄想と結び付け、すべての層に因果的注意を向ける。
これらのモデルにおける因果推論は、多段階の分極過程から分離可能であることを示す。
これらの知見に触発されて、多段階フレームワイドレンダリングから因果トランスフォーマーエンコーダを介して、1フレーム毎の時間的推論を明示的に分離する新しいアーキテクチャであるSCD(Separable Causal Diffusion)を導入する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:57:21 GMT)
Code2World: A GUI World Model via Renderable Code Generation [38.0] 我々は、レンダリング可能なコード生成によって次の視覚状態をシミュレートするビジョンフィードバックコーダであるCode2Worldを提案する。
Code2World-8Bは、競合するGPT-5やGemini-3-Pro-Imageに対抗して、パフォーマンスの高い次のUI予測を実現している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:56:19 GMT)
Grow with the Flow: 4D Reconstruction of Growing Plants with Gaussian Flow Fields [37.9] 植物成長をガウスパラメータ上の時間変化微分としてモデル化する3次元ガウス流場表現を提案する。
成熟した植物を再構築し、逆成長の過程を学習し、植物の発達史を効果的に逆向きにシミュレートする。
本手法は,植物成長のマルチビュータイムラプスデータセットにおける先行手法と比較して,画像品質と幾何的精度を向上する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:00:19 GMT)
Compiler-Assisted Speculative Sampling for Accelerated LLM Inference on Heterogeneous Edge Devices [37.0] リソース制約のあるエッジデバイス上のLLMデプロイメントは、厳しいレイテンシ制約に直面している。
この研究は、不均一なハードウェア構成を探索し、LLMサブグラフの粗粒度パーティショニングをガイドする分析コストモデルを用いている。
このモデルは、投機サンプリングとヘテロジニアス実行が共同で有用であると予測し、ヘキサコアのCortex-A CPUとMali GPUを備えたエッジデバイスで検証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:08:09 GMT)
AtomicRAG: Atom-Entity Graphs for Retrieval-Augmented Generation [36.2] 最近のGraphRAG法では、グラフ構造をテキストインデックスと検索に組み込んでいる。
知識表現と索引付けのためのより正確で信頼性の高いアーキテクチャを提案する。
我々のアプローチでは、知識は粗粒のテキストチャンクではなく、知識原子として保存される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:57:47 GMT)
Learning from the Irrecoverable: Error-Localized Policy Optimization for Tool-Integrated LLM Reasoning [36.2] 長い水平ツール統合推論軌道では、早期発見不可能な誤りが成功または失敗を決定できる。
本研究は,まず発見不可能なステップをローカライズし,それをきめ細かなクレジット代入に活用するために,ELPO(Error-Localized Policy Optimization)を提案する。
私たちのコードはまもなく公開されます。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:50:24 GMT)
Knowledge Integration Decay in Search-Augmented Reasoning of Large Language Models [36.2] 本研究では,知識利用の安定化を目的とした,学習不要な推論時間戦略であるSelf-Anchored Knowledge Integration (SAKE)を提案する。
SAKEはKnowledge Decay(KID)を大幅に軽減し、パフォーマンスを改善し、エージェントLLMにおける知識統合のための軽量で効果的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:20:26 GMT)
AdaptMMBench: Benchmarking Adaptive Multimodal Reasoning for Mode Selection and Reasoning Process [36.0] 本稿では,実世界,OCR,GUI,知識,数学の5分野にわたる適応型マルチモーダル推論のベンチマークであるAdaptMMBenchを提案する。
評価の結果,適応モード選択はモデルキャパシティに比例するが,最終的な精度から切り離されることが明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:57:54 GMT)
Anatomy-Preserving Latent Diffusion for Generation of Brain Segmentation Masks with Ischemic Infarct [35.7] 脳のセグメンテーションマスクの無条件合成のための解剖学的保存型生成フレームワークを提案する。
提案手法は,解剖学的潜在表現を学習するために,セグメンテーションマスクに特化して訓練された変分オートエンコーダを組み合わせる。
その結果、生成したマスクは、大域的な脳解剖、離散的な組織意味論、および現実的な変動を保っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:50:54 GMT)
MedFeat: Model-Aware and Explainability-Driven Feature Engineering with LLMs for Clinical Tabular Prediction [35.5] フィードバック駆動でモデル対応の機能エンジニアリングフレームワークであるMedFeatを紹介します。
MedFeatは、下流モデルがその特性のために直接学習することが難しい情報信号の優先順位付けを行う。
様々なベースラインを安定的に改善し、分布シフトの下で一般化する臨床的に意味のある特徴を発見する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:05:42 GMT)
SAKED: Mitigating Hallucination in Large Vision-Language Models via Stability-Aware Knowledge Enhanced Decoding [35.4] LVLM(Large Vision-Language Models)の幻覚は、現実世界のアプリケーションに重大なセキュリティと信頼性のリスクをもたらす。
モデルの内部知識の不安定性がLVLM幻覚にどのように寄与するかを考察する。
本稿では,階層的知識安定性スコア(KSS)を導入し,モデル全体にわたって知識安定性を定量化するSAKEDを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:33:24 GMT)
CIC-Trap4Phish: A Unified Multi-Format Dataset for Phishing and Quishing Attachment Detection [35.2] フィッシング攻撃は、サイバー攻撃者が使用する主要な攻撃方法の1つである。
CIC-Trap4Phishデータセットには、フィッシングキャンペーンで一般的に使用される5つのカテゴリにわたる悪意のあるサンプルと良性のあるサンプルの両方が含まれている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:11:35 GMT)
In-Hospital Stroke Prediction from PPG-Derived Hemodynamic Features [34.9] 病院内脳卒中発症タイムスタンプを非構造的臨床ノートから抽出するLLM支援データマイニングパイプラインを開発した。
次に、PSGから血行動態の特徴を抽出し、ResNet-1Dモデルを用いて、複数の早期警戒地平線を横断する差し迫ったストロークを予測する。
これらの結果は、PTGが発症の数時間前に脳卒中の予測的徴候を含むという実世界の臨床データから最初の実証的証拠となる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:50:26 GMT)
SPARC: Separating Perception And Reasoning Circuits for Test-time Scaling of VLMs [34.3] 我々は,視覚的知覚を推論から切り離すモジュール型フレームワーク(知覚と推論回路の分離)を導入する。
脳のシーケンシャルな知覚から認知への処理にインスパイアされたこのパイプラインは、2段階のパイプラインを実装し、まずモデルが明示的な視覚探索を行い、質問関連領域をローカライズする。
難しいビジュアル推論ベンチマーク全体において、モノリシックなベースラインと強力なビジュアルグラウンドアプローチよりも優れています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:30:46 GMT)
Free(): Learning to Forget in Malloc-Only Reasoning Models [34.3] 本稿では,Free-Moduleを介し,本質的な自己鍛造機能を導入するモデルであるFree()LMを提案する。
Free()LMはすべてのモデルスケールで一貫した改善を提供します。
最上位の推論基準よりも平均3.3%向上している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:58:13 GMT)
Model soups need only one ingredient [34.2] 目標分布上の微調整済みの大規模な事前学習モデルは、しばしば分布内(ID)の精度を改善するが、ロバスト性は犠牲となる。
Model Soupsのような重み空間のアンサンブルメソッドは、複数のチェックポイントを平均化することによって、この効果を緩和する。
単一チェックポイントのみを使用して強力なID-OODバランスを実現する,シンプルでデータフリーでハイパーパラメータフリーなポストホック方式であるMonoSoupを紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:44:19 GMT)
Where Do Images Come From? Analyzing Captions to Geographically Profile Datasets [33.9] LLMを用いてキャプションから抽出した位置情報に基づいて、画像キャプチャペアを国にマッピングすることで、大規模マルチモーダルデータセットを地理的にプロファイリングする。
アメリカ合衆国、イギリス、カナダはそれぞれ48.0%のサンプルを保有しており、南アメリカ、アフリカ諸国はそれぞれ1.8%のイメージと3.8%のイメージしか表現されていない。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:36:16 GMT)
Beyond Next-Token Alignment: Distilling Multimodal Large Language Models via Token Interactions [33.5] 本稿では,トークンインタラクションの観点から設計された新しいKDフレームワークであるAlign-TIを紹介する。
我々のアプローチは、MLLMが視覚情報抽出のための視覚-指示トークン相互作用とコヒーレント生成のための応答トークン相互作用の2つの主要な相互作用に依存しているという洞察に動機付けられている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:26:56 GMT)
Hand2World: Autoregressive Egocentric Interaction Generation via Free-Space Hand Gestures [33.3] エゴセントリックなインタラクティブな世界モデルは、拡張現実と具体的AIにとって不可欠であり、視覚生成は低レイテンシ、幾何的一貫性、長期的な安定性でユーザの入力に応答する必要がある。
自由空間ハンドジェスチャ下での単一シーン画像からのエゴセントリックなインタラクション生成について検討し、シーンに手を入れたり、オブジェクトと対話したり、ヘッドモーション下でプラプティブルな世界ダイナミクスを誘導するフォトリアリスティックな映像を合成することを目的とした。
この設定には、自由空間のジェスチャーと接触重大なトレーニングデータとの分配シフト、モノクロビューにおける手の動きとカメラの動きのあいまいさ、任意の長さのビデオ生成の必要性など、基本的な課題が導入されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:51:07 GMT)
PaperRepro: Automated Computational Reproducibility Assessment for Social Science Papers [33.1] PaperReproは、自動評価のための新しい2段階のマルチエージェントアプローチである。
実行段階では、エージェントが複製パッケージを実行し、コードを編集して再生結果を明示的な成果物としてキャプチャする。
評価段階では、エージェントは明確な証拠を用いてエージェントを評価する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:04:59 GMT)
Theoretical Analysis of Contrastive Learning under Imbalanced Data: From Training Dynamics to a Pruning Solution [33.0] 不均衡なデータの下でトランスフォーマーベースのエンコーダを用いて、コントラスト学習のトレーニングダイナミクスを解析するための理論的枠組みを開発する。
その結果、ニューロンの重みはトレーニングの3つの異なる段階を通じて進化し、多数派の特徴、少数派の特徴、ノイズのダイナミクスが異なることが明らかとなった。
これらのニューロンレベルの行動に触発されて、プルーニングは不均衡によって劣化した性能を回復し、特徴分離を強化し、概念的洞察と実践的ガイダンスの両方を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:06:12 GMT)
Personalized Parameter-Efficient Fine-Tuning of Foundation Models for Multimodal Recommendation [32.9] マルチモーダルレコメンデーションのためのパーソナライズされたPEFT戦略であるPerPEFTを提案する。
PerPEFTはユーザを興味を持ってグループ化し、それぞれのグループに異なるPEFTモジュールを割り当てる。
PerPEFTが最強のベースラインを最大15.3%上回っていることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:30:03 GMT)
ADORA: Training Reasoning Models with Dynamic Advantage Estimation on Reinforcement Learning [32.9] textbfOnline textbfRollout textbfAdaptation, textbfADORA (textbfAdvantage textbfDynamics via textbfOnline textbfRollout textbfAdaptation)を導入する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:40:39 GMT)
Robust Depth Super-Resolution via Adaptive Diffusion Sampling [32.1] AdaDSは任意の劣化した入力から高分解能深度マップを頑健に復元する。
AdaDSはガウス平滑化の収縮特性に乗じている。
実世界および合成ベンチマークの実験は、AdaDSの優れたゼロショット一般化を実証している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:10:02 GMT)
ATTNPO: Attention-Guided Process Supervision for Efficient Reasoning [32.0] 本稿では,低オーバーヘッドプロセス管理RLフレームワークであるATTNPOを提案する。
まず、冗長な注意を抑えながら、自然に重要なステップに焦点をあてる、特別な注意のヘッドのセットを特定します。
次に、2つのサブストラテジーを用いて、冗長なステップを回避し、重要なステップに対する罰則を減らし、精度を保ちながら過度な思考を緩和する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:40:22 GMT)
Residual Decoding: Mitigating Hallucinations in Large Vision-Language Models via History-Aware Residual Guidance [31.8] LVLM(Large Vision-Language Models)は、画像テキスト入力から効果的に推論し、様々なマルチモーダルタスクでうまく機能する。
彼らは言語の先行性に影響され、しばしば幻覚を生じさせる。
この問題に対処するためにResidual Decoding (ResDec)を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:46:48 GMT)
SpotAgent: Grounding Visual Geo-localization in Large Vision-Language Models through Agentic Reasoning [31.7] SpotAgentは、地理的ローカライゼーションをエージェント推論プロセスにフォーマル化するフレームワークである。
外部ツール(例えば、Web検索、マップ)をReActダイアグラムを通じて活用することで、視覚的手がかりを積極的に探索し検証する。
最先端のパフォーマンスを実現し、効果的に幻覚を緩和し、正確で検証可能なジオローカライゼーションを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:57:12 GMT)
From Correspondence to Actions: Human-Like Multi-Image Spatial Reasoning in Multi-modal Large Language Models [31.6] マルチモーダル大言語モデル (MLLM) は, 単一画像空間推論において大きく進歩している。
クロスビュー対応と視点cHangeのためのヒューマン・アウェア・トレーニングを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:48:17 GMT)
BiasScope: Towards Automated Detection of Bias in LLM-as-a-Judge Evaluation [31.3] BiasScopeは,モデル評価中の潜在的なバイアスを自動的に,あるいは大規模に検出するフレームワークである。
judgeBench-Pro は LLM-as-a-judge の堅牢性を評価する上で,より難しいベンチマークである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:51:03 GMT)
LitBench: A Graph-Centric Large Language Model Benchmarking Tool For Literature Tasks [31.1] 本稿では,ドメイン固有言語モデルの開発と評価を可能にするベンチマークツールLitBenchを紹介する。
LitBenchの中核となるのは、ドメイン固有の文学のサブグラフを生成するデータキュレーションプロセスである。
データセットのキュレーションに加えて、LitBenchは、ノードやエッジレベルの分析から高度なアプリケーションまで、包括的な文学タスクスイートを定義している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:12:29 GMT)
STRAND: Sequence-Conditioned Transport for Single-Cell Perturbations [31.1] STRANDは、制御DNA配列の条件付けによって単一細胞の応答を予測する生成モデルである。
配列による摂動を表現することは、遺伝子識別子の固定セットではなく、訓練中に見えないlociでのゼロショット推論をサポートする。
K562, Jurkat, RPE1細胞におけるCRISPR摂動データセットのSTRANDを評価する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:57:38 GMT)
Effective MoE-based LLM Compression by Exploiting Heterogeneous Inter-Group Experts Routing Frequency and Information Density [30.9] Mixture-of-Experts (MoE) ベースのLarge Language Models (LLM) は優れたパフォーマンスを実現している。
複数の専門家ネットワークを格納することによる大量のメモリオーバーヘッドは、実践的なデプロイメントを著しく妨げます。
我々は、不均一なルーティング周波数と情報密度を利用して、MoE圧縮のための効果的なフレームワークRFID-MoEを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:24:28 GMT)
Free-GVC: Towards Training-Free Extreme Generative Video Compression with Temporal Coherence [30.8] Free-GVCは、トレーニング不要な生成ビデオ圧縮フレームワークである。
本手法は,ビデオセグメントをコンパクトなラテント空間に符号化し,グループ・オブ・ピクチャーズレベルで動作させる。
実験の結果、Free-GVCは最新のニューラルDCVC-RTよりも平均93.29%のBD-Rate還元を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:12:51 GMT)
Enhancing Affine Maximizer Auctions with Correlation-Aware Payment [30.8] correlation-Aware AMA (CA-AMA)は、Affine Maximizer Auctionsを新しい相関対応支払いで強化するフレームワークである。
本稿では,任意のCA-AMAがDSIC特性を保持し,制約最適化問題として最適なCA-AMAを求めることを述べる。
対象関数の連続性と一般化は、厳密な IR からの偏差度に依存する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:44:27 GMT)
UniARM: Towards a Unified Autoregressive Reward Model for Multi-Objective Test-Time Alignment [30.7] ARMトレーニングのためのPreference-Modulated and Shared Low-Rank Adaptation (MoSLoRA)を提案する。
MoSLoRAは特徴の絡みを緩和し、推論中に好みのトレードオフを正確に制御できる。
我々は,多目的テストタイムアライメントのための新しいフレームワークUnified Autoregressive Reward Model(UniARM)を紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:49:28 GMT)
AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis [30.5] 大規模言語モデルエージェントは、ツールを介して現実世界の問題を解決する可能性を実証するが、汎用的な知性は、質の低い長期データによってボトルネックとなる。
本稿では,現実的なセマンティックなドメイン間でのマルチターンインタラクションデータを合成する,完全に自動化されたフレームワークであるAgentSkillerを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:21:42 GMT)
Simple LLM Baselines are Competitive for Model Diffing [29.9] 本稿では,キーデシダータの評価基準(一般化,面白さ,抽象化レベル)を提案し,既存の手法と比較する。
以上の結果から,LLMベースのベースラインの改良はSAEベースの手法と相容れないが,より抽象的な振る舞いの相違が指摘されるのが普通である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:45:26 GMT)
UTOPIA: Unlearnable Tabular Data via Decoupled Shortcut Embedding [29.5] 非学習不可能な例(UE)は、プライベートビジョンデータにおける不正なモデルトレーニングを防止するための実践的なメカニズムとして現れている。
汚染スペクトルがクリーンなセマンティックスペクトルを超過すると、証明不能が実現可能であることを示す。
提案するUnlearnable Tabular Data via DecOuPled Shortcut EmbeddIng (UTOPIA)は,特徴冗長性を利用して最適化を2つのチャネルに分離する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:06:53 GMT)
VideoAfford: Grounding 3D Affordance from Human-Object-Interaction Videos via Multimodal Large Language Model [29.5] 3Dの空き地は、ロボット操作に欠かせない3Dオブジェクトの動作可能な領域を強調することを目的としている。
本稿では,余剰セグメンテーション機能を付加したマルチモーダルな大規模言語モデルを活性化するVideoAffordを提案する。
我々のモデルは、確立された手法を著しく上回り、手頃な推論能力を備えた強力なオープンワールド一般化を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:36:57 GMT)
Efficient Unsupervised Environment Design through Hierarchical Policy Representation Learning [29.0] 非教師なし環境設計(UED)は、自動化カリキュラムを通じて汎用エージェントを開発するための有望なアプローチとして登場した。
環境設計のための階層型マルコフ決定プロセス(MDP)フレームワークを提案する。
本手法は,教師と教師の交流を1エピソードで減らしながら,ベースラインのアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:19:40 GMT)
Investigating the Effects of Eco-Friendly Service Options on Rebound Behavior in Ride-Hailing [29.0] エコフレンドリーなサービスオプション(EFSO)は、個人の二酸化炭素排出量を減らすことを目的としている。
環境にやさしいフレーミングは、消費の増加を許容し、意図した影響を弱める可能性がある。
Eco-feedbackの一般的なアプローチが、ライドシェアリングのコンテキストでどのようにそれらを形成するかを検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:34:02 GMT)
TokenMixer-Large: Scaling Up Large Ranking Models in Industrial Recommenders [28.6] TokenMixer-Largeは,超大規模レコメンデーションのために設計された,体系的に進化したアーキテクチャである。
また, 混合反転操作, 層間残留物, 補助損失を導入することにより, 安定な勾配伝播を確実にする。
TokenMixer-Largeは、オンライントラフィックとオフライン実験でパラメータを7ビリオン、15ビリオンにスケールすることに成功した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:17:46 GMT)
AGMark: Attention-Guided Dynamic Watermarking for Large Vision-Language Models [28.4] 視覚に依存しない透かしは、視覚的に無関係なトークンを導入し、視覚的な接地を妨害する。
我々は注意誘導動的透かし (AGMark) を提案する。
AGMarkは、視覚的忠実さを厳密に保ちながら検出可能な信号を埋め込む。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:02:29 GMT)
Internalizing Meta-Experience into Memory for Guided Reinforcement Learning in Large Language Models [28.3] RLVR(Reinforcement Learning with Verifiable Rewards)は、Large Language Models(LLM)の推論能力を高める効果的なアプローチとして登場した。
本稿では,メタ実験学習(Meta-Experience Learning, MEL)を提案する。
MELはベンチマークで一貫した改善を実現し、様々なモデルサイズで3.92%--4.73%のPass@1ゲインを得る。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:16:09 GMT)
Linear-LLM-SCM: Benchmarking LLMs for Coefficient Elicitation in Linear-Gaussian Causal Models [28.3] 大型言語モデル(LLM)を評価するためのプラグイン・アンド・プレイベンチマークフレームワークであるLinear-LLM-SCMを紹介する。
このようなベンチマークタスクにおける課題、すなわち、いくつかのモデルにおける結果の強みと、連続的なドメインの急激なエッジによるDAGの誤特定に対する感受性を示す。
また,ベンチマークフレームワークをオープンソースとして公開し,DAGと既製のLCMのプラグイン・アンド・プレイを,各ドメインで積極的に評価することができるようにした。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:49:01 GMT)
Quantum Multiple Rotation Averaging [28.3] 多重二次平均化(MRA)は3次元視覚とロボット工学の基本的な最適化問題である。
我々は,MRAを列として再構成する最初のアルゴリズムであるIQARS(Iterative Quantum Anneal Rotationing for Synchronization)を紹介する。
我々は、IQARSの性能を合成および実世界のデータセット上で評価する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:54 GMT)
RAWDet-7: A Multi-Scenario Benchmark for Object Detection and Description on Quantized RAW Images [28.1] RAWDet-7は25kのトレーニングと7.6kのテストRAW画像の大規模なデータセットで、様々なカメラ、照明条件、環境にまたがって収集される。
我々は、RAW画像処理と低ビット量子化によるオブジェクトレベルの情報保存の容易化を目的として、対応する高解像度sRGB画像から導出されたオブジェクトレベルの記述を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:51:35 GMT)
TeleGate: Whole-Body Humanoid Teleoperation via Gated Expert Selection with Motion Prior [27.9] 本稿では,ヒューマノイドロボットのための統合された全身遠隔操作フレームワークTeleGateを提案する。
私たちのキーとなる考え方は、軽量なゲーティングネットワークをトレーニングすることで、ドメイン固有の専門家ポリシーの完全な能力を維持することです。
リアルタイム遠隔操作における将来の参照軌跡の欠如を補うため,VAEベースのモーション先行モジュールを導入する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:14:06 GMT)
Toeplitz Based Spectral Methods for Data-driven Dynamical Systems [27.9] 動的システムにおける線形進化演算子のデータ駆動スペクトル推定のためのToeplitzベースのフレームワークを提案する。
本手法は, 固有値, 固有関数, スペクトル測度を抽出するために, 無限小発生器にToeplitzフィルタを適用する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:53:21 GMT)
Hydra-Nav: Object Navigation via Adaptive Dual-Process Reasoning [27.8] 探索履歴を解析し,高レベルプランを定式化するための検討段階の遅いシステム間を切り替える統合VLMアーキテクチャであるHydra-Navを紹介する。
実験の結果、Hydra-NavはHM3D、MP3D、OVONのベンチマークで最先端のパフォーマンスを達成し、それぞれ11.1%、17.4%、21.2%で2番目に良い手法を上回った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:00:16 GMT)
MVISTA-4D: View-Consistent 4D World Model with Test-Time Action Inference for Robotic Manipulation [27.7] 本研究は,幾何学的に一貫した任意のRGBD生成が可能な,新しい4次元世界モデルを提案する。
3つのデータセットの実験は、4Dシーン生成と下流操作の両方で強いパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:19:17 GMT)
Unified Personalized Reward Model for Vision Generation [27.5] 視覚生成のためのパーソナライズされた報酬モデルであるUnifiedReward-Flexを提案する。
我々はまず,高度閉ソースVLMからブートストラップSFTまで,構造化された高品質な推論トレースを蒸留した。
次に、慎重にキュレートされた選好ペア上で直接選好最適化(DPO)を行い、推論の忠実度と識別的アライメントをさらに強化する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:52:22 GMT)
Delving into Spectral Clustering with Vision-Language Representations [27.4] 本稿では,事前学習された視覚言語モデルにおけるクロスモーダルアライメントを利用したニューラルタンジェントカーネルスペクトルクラスタリングを提案する。
この定式化はクラスタ内の接続を増幅し,クラスタ間のスプリラスな接続を抑えることを示す。
我々の手法は、常に最先端の手法よりも大きなマージンで優れています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:36:24 GMT)
GHS-TDA: A Synergistic Reasoning Framework Integrating Global Hypothesis Space with Topological Data Analysis [27.3] CoT (Chain-of-Thought) は,大規模言語モデル (LLM) の推論精度を大幅に向上することが示されている。
既存のCoTメソッドには2つの基本的な制限がある。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:00:30 GMT)
From Average Sensitivity to Small-Loss Regret Bounds under Random-Order Model [26.9] ランダム順序モデルにおいて、損失関数の多元集合が逆向きに選択されるが、一様ランダムな順序で表されるオンライン学習について検討する。
提案手法は,無作為順序モデルにおける小さめの後悔境界の確立において,スパーシフィケーションと関連する手法のパワーに光を当てるものである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:46:01 GMT)
How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge [26.8] HybridRAG-Benchは、ハイブリッド知識よりも検索集約的なマルチホップ推論を評価するためのベンチマークを構築するためのフレームワークである。
そこで,HybridRAG-Benchはパラメトリックリコールよりも真の検索と推論に報いることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:04:01 GMT)
The Subjectivity of Respect in Police Traffic Stops: Modeling Community Perspectives in Body-Worn Camera Footage [26.1] ボディウーンカメラ(BWC)は警察と市民の相互作用のユニークな記録を提供する。
複数の視点から評価と自由文の有理性を付加した,最初の大規模トラフィックストップデータセットを紹介した。
警察系,司法系,無所属のロサンゼルス住民からアノテーションを抽出することにより,知覚的差異の系統的研究を可能にした。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:22:05 GMT)
AnyTouch 2: General Optical Tactile Representation Learning For Dynamic Tactile Perception [25.9] ToucHDは、触覚のアトミックアクション、実世界操作、タッチフォースペアデータにまたがる大規模な階層的触覚データセットである。
我々は,様々な光触覚センサのための汎用触覚表現学習フレームワークであるAnyTouch 2を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:05:53 GMT)
KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware [25.8] 新しいAIアクセラレータは、しばしば開発者が手動で低レベルのカーネルを作る必要がある。
これにより、新興ハードウェアプラットフォームが市場に到達するのを効果的に防ぐことができる。
KernelCraftは、エージェントがカスタマイズされたアクセラレーターのために低レベルのカーネルを生成し最適化する能力を評価する最初のベンチマークである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:52:02 GMT)
Reward-Guided Discrete Diffusion via Clean-Sample Markov Chain for Molecule and Biological Sequence Design [25.7] 離散拡散モデルに対する試験時間報酬誘導サンプリング法を提案する。
clean-Sample Markov Chain (CSMC) Smplerは、中間報酬に頼らずにローカル検索を可能にする。
我々の手法は、中間報酬に依存する先行アプローチを一貫して上回る。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:39:48 GMT)
MacrOData: New Benchmarks of Thousands of Datasets for Tabular Outlier Detection [25.7] 表形式のデータの外部検出は、多くの現実世界のアプリケーションを支える。
注目すべきODベンチマークAdBenchは、文献のデファクトスタンダードであるが、57のデータセットのみで構成されている。
我々は3つの注意深くキュレートされたコンポーネントからなる表型ODのための大規模ベンチマークスイートであるMacrODataを紹介した。
スケールと多様性のため、MacrODataはODメソッドの包括的かつ統計的に堅牢な評価を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:51:41 GMT)
E-VAds: An E-commerce Short Videos Understanding Benchmark for MLLMs [25.6] E-Commerce Video Ads Benchmark (E-VAds)は、Eコマースのショートビデオ理解に特化した最初のベンチマークである。
MG-GRPOと呼ばれる多粒度報酬設計を特徴とするRLに基づく推論モデルであるE-VAds-R1を開発した。
実験の結果、E-VAds-R1は、数百のトレーニングサンプルだけで商業目的の推論で109.2%の性能向上を達成した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:35:43 GMT)
Self-Regulated Reading with AI Support: An Eight-Week Study with Students [25.5] 8週間の縦断調査を15名の大学生を対象に実施した。
239件の読解セッションで838件のプロンプトを収集し,4つの認知テーマに分類した。
学生は理解から推論への自然な認知的進歩を示したが、この進歩は途絶えた。
認知的エンゲージメントを足場としたAI読解システムの設計について論じる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:41:15 GMT)
A Universal Action Space for General Behavior Analysis [25.0] 動物や人間の行動を分析することは、コンピュータビジョンにおいて長年、難しい課題だった。
既存のラベル付きヒューマンアクションデータセットを用いた大規模ユニバーサルアクションスペース(UAS)を構築した。
次に、このUASを哺乳類とチンパンジーの行動データセットの分析と分類の基礎として使用します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:22:17 GMT)
Steer2Edit: From Activation Steering to Component-Level Editing [24.8] 我々は、ステアリングベクトルをコンポーネントランク1の重み付けのための診断信号に変換する、トレーニング不要のフレームワークであるSteer2Editを提案する。
安全性のアライメント、属性緩和、推論効率などを通じて、Steer2Editは一貫して、より好ましい属性ユーティリティトレードオフを実現している。
全体として、Steer2Editは表現ステアリングとウェイト編集の間に原則化されたブリッジを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:15:15 GMT)
EvoCodeBench: A Human-Performance Benchmark for Self-Evolving LLM-Driven Coding Systems [24.5] 大規模言語モデル(LLM)は、ワンショットコード生成から推論時に反復的な改善が可能な複雑なシステムへと進化してきた。
EvoCodeBench(エボCodeBench)は、プログラミング言語間で自己進化するLLM駆動型コーディングシステムを評価するためのベンチマークである。
その結果, 自己進化システムは時間とともに効率が向上し, 人間の相対的・多言語的分析は, 精度だけでは不可能な洞察を与えることがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:04:22 GMT)
Learning Agile Quadrotor Flight in the Real World [24.3] 学習ベースのコントローラは、アジャイルの4倍体飛行で素晴らしいパフォーマンスを達成したが、一般的にはシミュレーションの大規模なトレーニングに依存している。
システム識別やオフラインのSim2Real転送を必要としない自己適応型フレームワークを提案する。
本稿では、適応時間スケーリング(ATS)を導入し、プラットフォーム物理限界を積極的に探求し、オンライン残差学習を用いて単純な名目モデルを強化する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:28 GMT)
Advancing General-Purpose Reasoning Models with Modular Gradient Surgery [24.1] 変換器内のモジュールレベルでの勾配競合を解消する**M**正則**G**radient **S**urgery (**MGS**)を導入する。
MGS は標準マルチタスク RL よりも平均4.3 (16.6%) と4.5 (11.1%) の改善を実現している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:50:45 GMT)
Mitigating the Likelihood Paradox in Flow-based OOD Detection via Entropy Manipulation [24.1] エントロピー制御は,分布内とOODサンプル間の対数類似のギャップを増大させ,分布内を優先する。
提案手法は,標準ベンチマークを用いた可能性に基づくOOD検出器に対して評価し,ベースラインよりも一貫したAUROCの改良を見出した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:31:03 GMT)
MSP-LLM: A Unified Large Language Model Framework for Complete Material Synthesis Planning [24.1] 2つのサブプロブレムからなる構造化プロセスとしてMSPを定式化する統合フレームワークであるMSP-LLMを提案する。
本手法では,両タスクを化学的に一貫した決定連鎖に整理する中間決定変数として,離散材料クラスを導入する。
MSP-LLM は、PP と SOP の両方の既存の手法と完全な MSP タスクを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:34:33 GMT)
AlphaForgeBench: Benchmarking End-to-End Trading Strategy Design with Large Language Models [23.5] リアルタイム取引性能の現在の評価は、重大な障害モードを見落としている:不確実性の下でのシーケンシャルな意思決定における厳しい行動不安定性である。
提案するAlphaForgeBenchは,大規模言語モデル(LLM)を,実行エージェントではなく定量的研究者として再構成する,原則化されたフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:29:33 GMT)
ContextBench: A Benchmark for Context Retrieval in Coding Agents [23.1] コーディングエージェントにおけるコンテキスト検索のプロセス指向評価であるContextBenchを紹介する。
ContextBenchは、8つのプログラミング言語にわたる66のリポジトリから1,136のイシュー解決タスクで構成されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:46:20 GMT)
Beyond Closed-Pool Video Retrieval: A Benchmark and Agent Framework for Real-World Video Search and Moment Localization [23.1] 実世界のビデオメモリ検索を総合的に評価するシステムである textbfRVMS-Bench について述べる。
textbf1,440のサンプルからなり、textbf20の多様なカテゴリとtextbffourの持続時間グループで構成されている。
我々は,人間のリコール-検索-検証の認知過程をシミュレートするために,帰納的推論を用いたエージェントフレームワークであるtextbfRACLOを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:50:59 GMT)
Internalizing Multi-Agent Reasoning for Accurate and Efficient LLM-based Recommendation [22.9] LLM(Large Language Models)は、幅広い世界の知識と意味論的推論を活用して、ユーザの意図を解釈することでレコメンデーションシステムを再構築している。
単エージェント軌道アライメントレコメンダ(STAR)を開発するための軌道駆動型内部化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:36:59 GMT)
SpatialReward: Bridging the Perception Gap in Online RL for Image Editing via Explicit Spatial Reasoning [22.8] 本研究では,空間的推論による正確な検証を行う報酬モデルを提案する。
予測された編集領域に推論を固定することにより、SpatialRewardはピクセルレベルの証拠に意味判断を基礎付ける。
我々のモデルはMMRB2とEditReward-Benchの最先端性能を実現し,提案したMultiEditReward-Benchのプロプライエタリ評価器よりも優れている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:38:11 GMT)
Self-Play Only Evolves When Self-Synthetic Pipeline Ensures Learnable Information Gain [22.8] 大規模言語モデル(LLM)は、自己進化ループを通じて改善されるシステムを構築するのにもっとも適している。
持続可能な自己進化には、繰り返しにまたがる学習可能な情報を備えた自己合成データパイプラインが必要です。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:12:09 GMT)
Discovering Differences in Strategic Behavior Between Humans and LLMs [22.7] 大規模言語モデル(LLM)は、社会的および戦略的シナリオにますます多くデプロイされている。
我々は、最先端のプログラム発見ツールであるAlphaEvolveを用いて、データから人間とLLMの動作の解釈可能なモデルを直接発見する。
繰り返し岩盤紙のシッセについて分析したところ、フロンティアLSMは人間よりも深い戦略行動が可能であることが判明した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:02:41 GMT)
Efficient-SAM2: Accelerating SAM2 with Object-Aware Visual Encoding and Memory Retrieval [22.6] Segment Anything Model 2 (SAM2) は、ビデオオブジェクトのセグメンテーションタスクにおいて優れたパフォーマンスを示す。
本稿では,タスク非関連計算を排除しつつ,SAM2がオブジェクト領域に適応的に焦点を合わせることを促すEfficient-SAM2を提案する。
無視可能な追加パラメータと最小限のトレーニングオーバーヘッドにより、Efficient-SAM2はSAM2.1-Lモデルで1.68倍の高速化を実現し、SA-Vテストセットでは1.0%の精度低下しか達成できない。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:41:46 GMT)
From Scalar Rewards to Potential Trends: Shaping Potential Landscapes for Model-Based Reinforcement Learning [22.6] SLOPE (Shaping Landscapes with Optimistic potential Estimates) は、報酬モデリングをスカラー予測から情報的潜在的景観構築に移行する新しいフレームワークである。
SLOPEは楽観的な分布回帰を用いて高信頼な上限を推定し、希少な成功信号を増幅し、十分な探査勾配を確保する。
5つのベンチマークで30以上のタスクを評価すると、SLOPEは、完全にスパース、半スパース、密度の高い報酬において、ベースラインを一貫して上回っていることが示される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:16:29 GMT)
AdaTSQ: Pushing the Pareto Frontier of Diffusion Transformers via Temporal-Sensitivity Quantization [22.5] 拡散変換器(DiT)は、高忠実度画像とビデオ生成のための最先端のバックボーンとして登場した。
後学習量子化(PTQ)は、大規模言語モデル(LLM)に有効であることが証明された。
本稿では,DiTの時間感度を利用して効率と品質のフロンティアを推し進める新しいPTQフレームワークであるAdaTSQを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:23:18 GMT)
IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference [22.2] IntProは、検索条件付きインテント推論を通じて個々のユーザへの適応を学ぶプロキシエージェントである。
IntProは、効果的なコンテキスト認識推論機能によって、パフォーマンスを強く理解することを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:20:58 GMT)
LiveMedBench: A Contamination-Free Medical Benchmark for LLMs with Automated Rubric Evaluation [22.2] LiveMedBenchは、オンライン医療コミュニティからリアルな臨床ケースを抽出する、継続的に更新されたベンチマークである。
LiveMedBenchは、38の専門医と複数の言語にまたがる2,756の現実世界のケースで構成され、16,702のユニークな評価基準と組み合わせている。
大規模な評価では、最高のパフォーマンスモデルでさえ39.2%しか達成せず、84%のモデルがカット後のケースで性能劣化を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:38:25 GMT)
VLA-JEPA: Enhancing Vision-Language-Action Model with Latent World Model [22.2] VLA-JEPAは、インターネットスケールビデオにおけるビジョン・ランゲージ・アクション(VLA)ポリシーのためのJEPAスタイルの事前トレーニングフレームワークである。
VLA-JEPAは、画素空間ではなく潜時空間で予測することにより、カメラモーションに対して堅牢なダイナミックス抽象化を学習する。
LIBERO, LIBERO-Plus, SimplerEnv, および実世界の操作タスクの実験は、VLA-JEPAが一般化と堅牢性において一貫した利益を達成することを示した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:58:01 GMT)
Text summarization via global structure awareness [22.2] GloSA-sumは、トポロジカルデータ解析を通じてグローバルな構造認識を実現する最初の要約手法である。
我々は文の埋め込みから意味重み付きグラフを構築し、永続的ホモロジーはコアセマンティクスと論理構造を識別する。
複数のデータセットの実験では、GloSA-sumは意味論的および論理的整合性を保ちながら冗長性を低下させることを示した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:29:54 GMT)
PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning [22.0] Photoplethysmographyは、連続した心血管および生理的モニタリングに広く用いられている非侵襲的なセンシングモダリティである。
既存のPSGデータセットは、数値測定やタスク固有のラベルの形で監督する。
我々はPulseLMを紹介した。PulseLMは生のPPG波形と自然言語をブリッジするために設計された大規模PPGテキストデータセットである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:46:03 GMT)
SWE-AGI: Benchmarking Specification-Driven Software Construction with MoonBit in the Era of Autonomous Agents [21.9] SWE-AGIはMoonBitで書かれたソフトウェアシステムのエンドツーエンド、仕様駆動の構築を評価するためのオープンソースのベンチマークである。
それぞれのタスクには1000~10,000行のコアロジックを実装する必要がある。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:31:47 GMT)
Expert Divergence Learning for MoE-based Language Models [21.9] 本稿では,専門家間の機能的専門化を明確に促進する,新しい事前学習戦略であるExpert Divergence Learningを紹介する。
本手法は,事前学習コーパスに固有のドメインラベルを活用するラベル駆動補助損失を組み込む。
我々は,最大150億パラメータのMoEモデルをスクラッチから事前学習することで,我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:58:38 GMT)
Stop Training for the Worst: Progressive Unmasking Accelerates Masked Diffusion Training [21.8] Masked Diffusion Models (MDMs) は離散空間における生成モデリングのための有望なアプローチとして登場した。
MDMは指数関数的に大きなマスキングパターンのセットでトレーニングする。
本稿では,プログレッシブ・アンマスキング(PUMA)を提案する。プログレッシブ・アンマスキング(PUMA)は,トレーニング時間と推論時間のマスキングパターンを調整したフォワード・マスキングプロセスの簡単な修正である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:42:50 GMT)
PlugSI: Plug-and-Play Test-Time Graph Adaptation for Spatial Interpolation [21.6] PlugSIは2つの重要な革新を通じてテストタイムグラフを洗練するプラグイン・アンド・プレイフレームワークである。
まず、テスト時に各小バッチの新しいグラフ構造に適応する未知のトポロジ適応器(UTA)を設計する。
第2に,UTA適応を導くため,安定した歴史的コンセンサスを維持したテンポラルバランスアダプタ(TBA)を導入する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:33:23 GMT)
Training deep physical neural networks with local physical information bottleneck [21.5] ディープラーニングは現代の社会に革命をもたらしたが、エネルギーとレイテンシの制約が増大している。
本稿では,情報理論と局所学習を統合するフレームワークであるPhysical Information Bottleneck(PIB)を紹介する。
PIBは厳しいハードウェア障害に適応し、地理的に分散したリソースによる並列トレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:20:12 GMT)
Why the Counterintuitive Phenomenon of Likelihood Rarely Appears in Tabular Anomaly Detection with Deep Generative Models? [21.4] 抽出可能で解析的に計算可能な確率を持つ深層生成モデルは、確率に基づくスコアリングによる異常検出に有効な基礎を提供することを示す。
まずドメインに依存しない定式化を導入し,その反直観的現象を一貫した検出と評価を可能にした。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:47:34 GMT)
Towards Training-free Multimodal Hate Localisation with Large Language Models [21.4] 本稿では,ヘイトビデオローカライゼーションのための学習自由なLarge Language Model (LLM) ベースのフレームワークであるLELAを提案する。
提案手法は,映像,音声,OCR,音楽,映像コンテキストの5つのモードに分割し,多段プロンプト方式を用いて,各フレームの微妙なヘイトフルスコアを計算する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:32:46 GMT)
Rollout-Training Co-Design for Efficient LLM-Based Multi-Agent Reinforcement Learning [21.3] 既存のトレーニングフレームワークは、マルチエージェント強化学習におけるユニークなシステムレベルの課題に対処できない。
私たちはFlexMARLを提案します。FlexMARLは、ロールアウト、トレーニング、およびそれらのオーケストレーションを均等に最適化する最初のエンドツーエンドのトレーニングフレームワークです。
FlexMARLは、既存のフレームワークと比較して最大7.3倍のスピードアップを実現し、ハードウェア利用率を最大5.6倍改善することを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:27:03 GMT)
SciFlow-Bench: Evaluating Structure-Aware Scientific Diagram Generation via Inverse Parsing [21.3] SciFlow-Benchは,画素レベルの出力から直接科学的図を生成するための,構造第一のベンチマークである。
実際の科学的PDFから構築されたSciFlow-Benchは、各ソースフレームワークのフィギュアを標準の接地木グラフと組み合わせ、ブラックボックスイメージジェネレータとしてモデルを評価する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:15:35 GMT)
SWE-Bench Mobile: Can Large Language Model Agents Develop Industry-Level Mobile Applications? [21.2] SWE-Bench Mobileは、実運用iOSから派生した現実的なソフトウェアエンジニアリングタスクのコーディングエージェントを評価するためのベンチマークである。
孤立した問題やバグ修正に焦点を当てた既存のベンチマークとは異なり、SWE-Bench Mobileは産業開発における完全な複雑さを捉えている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:51:11 GMT)
Adaptive Optimization via Momentum on Variance-Normalized Gradients [21.2] MVN-Gradは、分散に基づく正規化と正規化後の運動量という2つの相補的なアイデアを組み合わせることにより、安定性と性能を向上させる。
CIFAR-100イメージ分類とGPTスタイルの言語モデリングベンチマーク、MVN-GradマッチやAdam、AdaBelief、LaPropPropよりも優れている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:00:25 GMT)
Visual Para-Thinker: Divide-and-Conquer Reasoning for Visual Comprehension [21.1] MLLMの最初の並列推論フレームワークであるVisual Para-Thinkerを紹介する。
経路独立性を維持し,推論における多様性を促進するため,LPRoPEとPa-Attentionを統合した。
V*、CountBench、RefCOCO、HalusionBenchといったベンチマークデータセットの実証的な結果によると、Visual Para-Thinkerは、並列推論の利点をビジュアルドメインに拡張することに成功している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:53:25 GMT)
A Large-Scale Dataset for Molecular Structure-Language Description via a Rule-Regularized Method [21.0] 本稿では,分子構造記述を大規模に生成するための完全自動アノテーションフレームワークを提案する。
我々のアプローチはIUPACを解釈し、分子構造を明示的にエンコードするリッチで構造化されたXMLメタデータを構築するための規則に基づく化学命名法に基づいている。
このフレームワークを用いて、約163ドルの分子記述ペアからなる大規模データセットをキュレートする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:28:30 GMT)
RxnNano:Training Compact LLMs for Chemical Reaction and Retrosynthesis Prediction via Hierarchical Curriculum Learning [20.9] 私たちは、これらの知識をモデルに取り入れることが、中心的な課題であると主張している。
3つの重要な革新を通じて,化学的な理解を大規模に優先する統一的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:42:23 GMT)
DiffuReason: Bridging Latent Reasoning and Generative Refinement for Sequential Recommendation [20.8] 逐次レコメンデーションのための統合された「シンク・テン・ディフューズ」フレームワークであるDiffuReasonを提案する。
潜時推論のための多段階思考トークン、中間表現をデノナイズするための拡散ベースの洗練、およびエンドツーエンドのグループ相対ポリシー最適化を統合している。
4つのベンチマークの実験では、DiffuReasonはさまざまなバックボーンアーキテクチャを一貫して改善している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:55:30 GMT)
Rank-Accuracy Trade-off for LoRA: A Gradient-Flow Analysis [20.0] 動的システムの観点から,LoRAの精度が更新ランクに依存することを検討する。
我々は,LoRAの下での2つの損失関数のランクと精度の明確な関係を確立するために,フルランクとローランクのいずれにおいても勾配流解析を行う。
次に、結果の力学系方程式を用いて、トレース二乗およびフロベニウス-ノルム低ランク近似損失関数に対するLoRAランクと精度の閉形式関係を求める。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:05:27 GMT)
ARK: A Dual-Axis Multimodal Retrieval Benchmark along Reasoning and Knowledge [19.9] 本稿では,2つの相補的な視点からマルチモーダル検索を解析するためのベンチマークARKを紹介する。
ARKは、不均質なクエリとマルチモーダルなクエリと候補で検索を評価し、16の異種視覚データ型をカバーする。
我々は,知識集約型検索と推論集約型検索の明確なギャップを観察し,視覚的・空間的推論を永続的ボトルネックとして生み出す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:45:02 GMT)
FM SO.P: A Progressive Task Mixture Framework with Automatic Evaluation for Cross-Domain SOP Understanding [19.9] 既存の言語モデルは標準オペレーティング手順(SOP)と競合する
FM SO.Pを提案する。
まず、累積データを伴う3つのタスクタイプにまたがって、段階的に機能を構築するプログレッシブなタスクミックスを紹介する。
次に,3つのエージェントからなる自動マルチエージェント評価システムを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:09:48 GMT)
Understanding and Enhancing Encoder-based Adversarial Transferability against Large Vision-Language Models [19.9] 大規模視覚言語モデル (LVLM) は、マルチモーダルタスクで顕著な成功を収めた。
視覚的な入力への依存は、大きな敵の脅威に晒される。
既存のエンコーダベースの攻撃は、LVLM全体ではなく、視覚エンコーダのみに最適化することで、入力画像を摂動させる。
本研究は,LVLMにおけるエンコーダを用いた対向転送性に関する最初の体系的研究である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:51:02 GMT)
Flexible Entropy Control in RLVR with Gradient-Preserving Perspective [19.9] RLVR(Reinforcement Learning with Verifiable Rewards)は、Large Language Models(LLM)の推論能力を高める重要な手法として登場した。
本稿では, 勾配保存クリッピングの観点からRLのエントロピー制御を提案する。
エントロピーを正確に管理するための動的クリッピングしきい値を用いた新しい制御機構を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:42:12 GMT)
Dialogue Model Optimization via Agent Game and Adaptive Tree-based GRPO [19.8] オープンエンド対話エージェントは、ユーザの特性に適応して、エンゲージメントでパーソナライズされた対話を提供することを目的としている。
本稿では,オンラインパーソナライズと適応木に基づくグループ相対的ポリシー最適化を統合した新しい長軸フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:34:47 GMT)
CyberExplorer: Benchmarking LLM Offensive Security Capabilities in a Real-World Attacking Simulation Environment [19.8] CyberExplorerは、現実世界のCTF課題から派生した40の脆弱なWebサービスをホストする仮想マシン上に構築された、オープンな環境ベンチマークである。
フラグのリカバリ,インタラクションダイナミクスのキャプチャ,コーディネーション動作,障害モード,脆弱性検出信号といった,詳細な評価が可能になる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:48:10 GMT)
Measuring What AI Systems Might Do: Towards A Measurement Science in AI [19.7] 能力、妥当性、スキル、価値、能力は、常に相互に使用され、観測可能なパフォーマンスと混同されます。
我々は、能力と妥当性は、反事実関係によって特徴づけられるシステムの安定した特徴である配置特性であると主張する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:59:41 GMT)
Configuration-to-Performance Scaling Law with Neural Ansatz [19.7] textitConfiguration-to-Performance Scaling Law (CPL)を学習する
CPLはトレーニング設定が最終トレーニング前損失にどのように影響するかを正確に予測する。
設定に依存しないチンチラ法よりも20~40%低い予測誤差を達成している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:16:59 GMT)
When the Prompt Becomes Visual: Vision-Centric Jailbreak Attacks for Large Image Editing Models [19.7] 本稿では,視覚的・視覚的ジェイルブレイク攻撃として視覚中心ジェイルブレイク攻撃(VJA)を提案する。
VJAは視覚入力を通じて悪意のある命令を純粋に伝達する。
イントロスペクティブなマルチモーダル推論に基づく無訓練防衛を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:55 GMT)
The Complexity of Bayesian Network Learning: Revisiting the Superstructure [19.6] ベイズネットワーク構造学習(BNSL)のパラメータ化複雑性について検討する。
我々は、フィードバックエッジセットのサイズによって、異なる種類のパラメータ化が、固定パラメータのトラクタビリティをもたらすことを示す。
この結果が,ポリツリー学習の密接に関連する問題にどのように拡張できるかを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:58:24 GMT)
SoulX-FlashHead: Oracle-guided Generation of Infinite Real-time Streaming Talking Heads [19.5] 本稿では,リアルタイム,無限長,高忠実なストリーミングビデオ生成のための統合フレームワークであるSoulX-FlashHeadを提案する。
ストリーミングシナリオにおける音声機能の不安定性に対処するために,テンポラルオーディオコンテキストキャッシュ機構を備えたストリーム対応時空間事前学習を導入する。
VividHeadは大規模で高品質なデータセットで、厳格なトレーニングをサポートするために、782時間の厳格なアライメントされた映像を格納しています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:02:47 GMT)
QP-OneModel: A Unified Generative LLM for Multi-Task Query Understanding in Xiaohongshu Search [19.4] QP-OneModelはSNS検索エンジンにおけるユーザの意図とコンテンツの供給を橋渡しする。
新規な高忠実な意味信号として意図的記述を生成する。
また、32Bモデルを7.60%精度で上回り、より優れた一般化を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:38:17 GMT)
Adaptive Value Decomposition: Coordinating a Varying Number of Agents in Urban Systems [19.2] Adaptive Value Decomposition (AVD)は、動的に変化するエージェントに適応する協調的なMARLフレームワークである。
トレーニング実行戦略は、エージェントが異なるタイミングで行動するときの非同期な意思決定に対応するように設計されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:41:14 GMT)
SceneReVis: A Self-Reflective Vision-Grounded Framework for 3D Indoor Scene Synthesis via Multi-turn RL [19.0] 現行のワンパス3Dシーン合成法は、議論的推論の欠如により、衝突などの空間幻覚に悩まされることが多い。
SceneReVisは、空間的衝突を明示的にインターセプトし解決するために反復的な診断と対処のループを利用する視覚的な自己回帰フレームワークである。
そこで我々は,2段階のトレーニングレシピを提案し,モデルからアクティブな空間プランナへと進化させた。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:55:56 GMT)
Monte Carlo Maximum Likelihood Reconstruction for Digital Holography with Speckle [18.9] コヒーレントイメージングでは、スペックルは統計的に乗法ノイズとしてモデル化され、画像再構成の根本的な課題となっている。
本稿では,勾配計算における行列逆変換を伴わずに,スケーラブルなMLE最適化を実現するランダム化線形代数手法を提案する。
私たちのコードは、https://github.com/Computational-Imaging-RU/MC_Maximum_Likelihood_Digital_Holography_Speckleで利用可能です。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:31:22 GMT)
Auditing Multi-Agent LLM Reasoning Trees Outperforms Majority Vote and LLM-as-Judge [18.8] 我々はAgentAuditorを導入し、投票をReasoning Tree上のパス検索に置き換える。
AgentAuditorは、分岐を重要な分岐点で比較することで競合を解決する。
最大5%の得票率で絶対精度が向上し、最大3%の得票率でLLM-as-Judgeを使用する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:24:53 GMT)
Self-Evolving Recommendation System: End-To-End Autonomous Model Optimization With LLM Agents [18.7] 複雑なモデル変更を自律的に生成し、訓練し、デプロイする自己進化システムを提案する。
私たちのエージェントは、機械学習エンジニア(MLE)として機能します。
このアプローチの有効性は、YouTubeで成功したいくつかのプロダクションローンチを通じて実証されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:16:52 GMT)
Priority-Aware Shapley Value [18.7] プライオリティを意識する共有価値(PASV)には、ハード優先度制約と、ソフトでコントリビュータ固有のプライオリティ重みの両方が組み込まれている。
スケーラブルモンテカルロ推定のための効率的な隣接スワップ型メトロポリス・ハスティングスサンプリング器を開発した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:41:32 GMT)
WildCat: Near-Linear Attention in Theory and Practice [18.5] ニューラルネットワークの注意機構を圧縮するための高精度で低コストなアプローチであるWildCatを紹介する。
我々は、高速だがスペクトル精度の低いサブサンプリングアルゴリズム(ランダムにピボットされたチョレスキー)を用いてコアセットを選択し、再構成誤差を最小限に抑えるために最適な要素を重み付けする。
注目すべきは、有界な入力が与えられたとき、WildCat は超多項式 $O(n-sqrtlog(log(n))$エラー崩壊と正確な注意を近似し、ニア線形 $O(n1+o(1))$時間で走る。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:22:32 GMT)
LEMUR: A Corpus for Robust Fine-Tuning of Multilingual Law Embedding Models for Retrieval [18.5] 大規模言語モデル(LLM)は、法律情報へのアクセスにますます利用されている。
しかし、その多言語法的設定への展開は、信頼性の低い検索と、ドメイン適応型、オープンな埋め込みモデルの欠如によって制限されている。
LEMURは、EUの環境法律の大規模多言語コーパスであり、24,953のEUR-Lex PDF文書から25の言語をカバーする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:20:24 GMT)
Comprehensive Comparison of RAG Methods Across Multi-Domain Conversational QA [18.5] 本稿では,マルチターン対話型QAにおけるRAG手法の体系的比較の欠如に対処する。
本研究では,8種類の対話型QAデータセットを対象とした,バニラ法と高度なRAG法に関する総合的研究を行った。
以上の結果から,再ランク付けやハイブリッドBM25,HyDEなどの頑健で簡便な手法がバニラRAGより一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:59:23 GMT)
A benchmark for joint dialogue satisfaction, emotion recognition, and emotion state transition prediction [18.5] インタラクション中のユーザの感情を監視し、理解することは、満足度を予測し改善するのに役立ちます。
関連する中国のデータセットは限定的で、ユーザの感情はダイナミックです。
我々は、満足度認識と感情認識と感情状態遷移予測をサポートするマルチタスク・マルチラベル中国語対話データセットを構築した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:37:56 GMT)
Learning Force-Regulated Manipulation with a Low-Cost Tactile-Force-Controlled Gripper [18.4] TF-グリッパー(TF-Gripper)は、触覚をフィードバックとして統合する低コストのパラレルジャウグリップである。
RETAFは、アームポーズ予測から握力制御を分離するフレームワークである。
TF-Gripper と RETAF は,実世界の5つのタスクにおいて,正確な力規制を必要とする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:36:33 GMT)
Beyond Student: An Asymmetric Network for Neural Network Inheritance [18.3] InherNetは、教師の体重に対して非対称な低ランク分解を行うニューラルネットワーク継承手法である。
InherNetは、同一のパラメータサイズを持つ学生ネットワークと比較して高い性能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:09:10 GMT)
CaST-POI: Candidate-Conditioned Spatiotemporal Modeling for Next POI Recommendation [18.3] Next Point-of-Interest (POI)レコメンデーションは、ユーザの将来のモビリティパターンを予測することによって、位置情報ベースのサービスにおいて重要な役割を果たす。
既存の手法は通常、歴史的軌跡から単一のユーザ表現を計算し、すべての候補POIを均一にスコアする。
本稿では,次のPOI推薦のための候補条件付きモデルであるCaST-POIを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:10:18 GMT)
ADS-POI: Agentic Spatiotemporal State Decomposition for Next Point-of-Interest Recommendation [18.3] Next-of-interest (POI)レコメンデーションでは、時間的シーケンスとしてユーザモビリティをモデル化する必要がある。
既存のほとんどのメソッドは、ユーザの履歴を単一の潜在表現に圧縮する。
我々は,次のPOIレコメンデーションのための時相状態分解フレームワークであるADS-POIを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:16:47 GMT)
Omni-Safety under Cross-Modality Conflict: Vulnerabilities, Dynamics Mechanisms and Efficient Alignment [18.1] Omni-modal Large Language Models (OLLM) の脆弱性について検討する。
我々は介入強度を適応的に変調するOmniSteerを提案する。
実験により,本手法はすべてのモダリティにまたがる汎用性を効果的に維持できることが示されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:04:08 GMT)
Differentiable Modeling for Low-Inertia Grids: Benchmarking PINNs, NODEs, and DP for Identification and Control of SMIB System [18.0] 本稿では、電力系統力学のモデリング、識別、制御のための異なる微分可能プログラミングパラダイムの比較研究を行う。
軌道外挿,パラメータ推定,線形擬似レギュレータ(LQR)合成における性能評価を行った。
我々の結果は、データ駆動の柔軟性と物理的構造との根本的なトレードオフを強調します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:22:59 GMT)
LLM-Grounded Dynamic Task Planning with Hierarchical Temporal Logic for Human-Aware Multi-Robot Collaboration [17.9] 大規模言語モデル(LLM)は、オープンワールドのマルチロボットタスクを非専門家が指定できるようにする。
LLMの計画は実現性に欠けることが多く、特に長期のシナリオでは効率的ではない。
階層的仕様の推論を基礎としたニューロシンボリックな枠組みを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:11:36 GMT)
Phase-Aware Policy Learning for Skateboard Riding of Quadruped Robots via Feature-wise Linear Modulation [17.4] 四足歩行ロボットを用いたスケートボードに適した強化学習フレームワークを提案する。
位相対応政策学習(PAPL)は、位相条件付き特徴量線形変調層をアクターおよび批評家ネットワークに統合する。
PAPLは、フェーズ間でロボット固有の知識を共有しながら、フェーズ依存の振る舞いをキャプチャする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:20:37 GMT)
Learning to Evict from Key-Value Cache [17.4] 我々はKV Policyを紹介した。KV Policyはトークンのランク付けを学習するためのフレームワークであり、将来的な復号化に役立つと予測されている。
長文ベンチマークRULERとマルチターンダイアログベンチマークOASST2-4kの2種類のモデルファミリで評価した。
その結果、将来のトークンユーティリティを予測する学習は、適応的なKVキャッシュ管理のための強力でスケーラブルなパラダイムであることが示されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:34:15 GMT)
Perception with Guarantees: Certified Pose Estimation via Reachability Analysis [17.3] 安全クリティカルな領域では、安全を正式に判断するには大まかな見積もりが不十分である。
本稿では、カメラ画像とよく知られたターゲット形状から、3Dで認証されたポーズ推定を行う。
これは、リーチビリティ分析とフォーマルニューラルネットワーク検証の最近の結果を活用することで計算されるポーズを正式に境界付けることで実現される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:55:49 GMT)
Taming the Monster Every Context: Complexity Measure and Unified Framework for Offline-Oracle Efficient Contextual Bandits [17.3] 一般報酬関数近似による文脈的帯域学習をオフライン回帰に還元するアルゴリズムフレームワークOE2Dを提案する。
このフレームワークは、$O(log(T))$のオフライン回帰オラクルを$T$のラウンドで呼び出す大きなアクション空間を持つコンテキスト的バンディットに対して、ほぼ最適に後悔することができる。
我々の後悔分析の中心は、Decision-Offline Estimation Coefficient (DOEC)と呼ばれる新しい複雑さ尺度であり、これはコンテキストごとの有界エルダー次元とスムーズな後悔設定で表される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:45:57 GMT)
Where-to-Unmask: Ground-Truth-Guided Unmasking Order Learning for Masked Diffusion Language Models [17.2] Masked Diffusion Language Modelsは、マスク付きトークンを反復的に充填することでテキストを生成する。
Gt-Marginは、部分的にマスキングされた各状態の下で、より簡単な位置を優先するオラクルアンマスキング順序を与える。
マスク付きコンテキストからオーラクルの注文を模倣するために,教師付きアンマスキングプランナーを学習 to ランクで訓練する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:56:46 GMT)
Data Sharing with Endogenous Choices over Differential Privacy Levels [17.1] エージェントが不均一なプライバシコストを持つ場合、差分プライバシー下でのデータ共有のための連立形成について検討する。
私たちの目標は、どの連立が安定しているか、プライバシの選択が均衡の結果をどのように形成するかを理解することです。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:01:14 GMT)
TreeCUA: Efficiently Scaling GUI Automation with Tree-Structured Verifiable Evolution [16.7] そこで本研究では,木構造検証によるGUI自動化を効果的にスケールするために,TreeCUAを提案する。
効率を向上させるため、重複探索ノードの保存と再生を行う新しいツリーベースのトポロジーを考案した。
我々は、低品質な生成を避けるため、世界知識ガイダンスとグローバルメモリバックトラックを開発する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:16:57 GMT)
Large Language Models for Designing Participatory Budgeting Rules [16.3] 大規模言語モデル(LLM)は、アルゴリズム設計の自動化にますます採用されている。
LLMRuleと呼ばれる新しいフレームワークを導入し,LLMを進化的探索手順に組み込むことで,既存の作業の限界に対処する。
以上の結果から, LLM生成ルールは, 実用性の観点からも既存の手作りルールよりも優れており, 同等の公平性を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:55:19 GMT)
A Task-Centric Theory for Iterative Self-Improvement with Easy-to-Hard Curricula [16.2] 繰り返し自己改善は、報酬検証された出力に対する自己回帰型大規模言語モデル(LLM)を微調整する。
我々は、各ラウンドの自己改善を最大限の微調整としてモデル化することで、この目標に向かって前進する。
我々の分析では、より良いモデルがより多くのデータを受け取り、持続的な自己改善をサポートする明示的なフィードバックループが明らかになっている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:36:41 GMT)
Aligning Tree-Search Policies with Fixed Token Budgets in Test-Time Scaling of LLMs [16.2] 既存の木探索政策は予算に依存せず、予算を終了条件として扱い、最終段階のオーバーブランチや早期終了につながる可能性がある。
本稿では,Budget-Guided MCTS (BG-MCTS)を提案する。
BG-MCTS は、MATH500 と AIME24/25 の様々な予算において、オープンウェイト LLM で予算に依存しない木探索ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:23:26 GMT)
Closing Reasoning Gaps in Clinical Agents with Differential Reasoning Learning [16.1] 本稿では, 臨床薬品の理性差を学習し, 臨床薬品の改善を図るためのフレームワークDRLを提案する。
DRLは、有向非巡回グラフ(DAG)として推論グラフを抽出し、臨床重み付きグラフ編集距離(GED)に基づく不一致解析を行う。
推論では、エージェントプロンプトを増強し、可能性のあるロジックギャップをパッチするために、トップ$k$命令を検索します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:29:32 GMT)
Device-independent quantum key distribution over 100 km with single atoms [16.1] デバイス独立量子鍵分布(DI-QKD)は、量子インターネットの鍵となる応用である。
100km繊維でリンクされた2つの単一原子ノード間のDI-QKDの実現について報告する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:48:47 GMT)
Features as Rewards: Scalable Supervision for Open-Ended Tasks via Interpretability [16.1] オープンエンドタスクのスケーラブルな監視機能としての機能。
本稿では,機能言語における教師の基盤として,オープンエンドタスクの学習における解釈可能性の利用という,新たなパラダイムを導入する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:33:45 GMT)
Skirting Additive Error Barriers for Private Turnstile Streams [15.9] 本研究では,ターンタイルストリームにおける各項目数の個人的連続的解放について検討した。
長さ'23のストリームの場合、空間制限がなくても$(T1/4)$の加算誤差が必要である。
加法的インプハンド乗算誤差の両方で推定値の出力が許された場合、この誤差の下限を回避できることが示される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:10:34 GMT)
TaCo: A Benchmark for Lossless and Lossy Codecs of Heterogeneous Tactile Data [15.9] Tactile Codecsの最初の包括的なベンチマークであるTaCoを紹介します。
TaCoは、既製の圧縮アルゴリズムやニューラルコーデックを含む30の圧縮方法を評価する。
我々は触覚データに基づいて明示的に訓練されたデータ駆動コーデックの開発を開拓した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:30:44 GMT)
Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions [15.8] 我々のフレームワークであるInfusionは、スケーラブルな影響関数近似を用いて、ドキュメントのトレーニングに小さな摂動を計算する。
Infusionは、少数の明示的な動作例を挿入するベースラインと競合する可能性があることを示す。
予備的な言語実験では、我々のアプローチが目標となる行動の確率を高め、失敗すると、モデルが既に学習した行動の増幅に最も効果的であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:13:42 GMT)
Mag-Mamba: Modeling Coupled spatiotemporal Asymmetry for POI Recommendation [15.7] Next-of-valued (PO)レコメンデーションは、位置情報ベースのサービスにおいて重要なタスクである。
グラフやシーケンスバックボーン上に構築される既存の手法は、対称演算子やリアルタイムアグリゲーションに依存している。
複素領域における非対称性駆動の回転力学をモデル化する枠組みであるMag-Mambaを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:20:27 GMT)
Step-resolved data attribution for looped transformers [15.5] 本研究では,各学習例がループ変換器の内部計算をどう形成するかを検討する。
我々は、TracInを長さ$$$影響軌道に分解する textStep-De Influence (Sketch) を導入する。
ループ型GPTスタイルモデルとアルゴリズムタスクの実験により、SDIは優れたスケールを示し、フルグレートなベースラインと低いエラーにマッチし、潜在推論プロセスへのステップ毎の洞察を伴う幅広いデータ属性および解釈可能性タスクをサポートする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:57:53 GMT)
Improving Interpretability of Lexical Semantic Change with Neurobiological Features [15.5] 本稿では,事前学習言語モデルにより得られた単語の文脈的埋め込みのセマンティック空間を神経生物学的特徴空間にマッピングする手法を提案する。
神経生物学的特徴空間では、各次元は単語の原始的特徴に対応し、その値はその特徴の強さを表す。
LSCの度合いを推定するために用いられる場合,本手法は従来の手法に比べて優れた性能を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:20:08 GMT)
The Laplacian Mechanism Improves Transformers by Reshaping Token Geometry [15.3] ラプラシアン機構をトランスフォーマーに組み込むことで、コンピュータビジョンと言語におけるベンチマーク間で一貫した改善がもたらされることを示す。
本研究は,ラプラシアン機構が最大分離性の幾何へのトークン埋め込みを再現することを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:27:45 GMT)
Stemphonic: All-at-once Flexible Multi-stem Music Generation [15.1] 音楽のステム生成により、ユーザーコントロールが向上し、ミュージシャンとの整合性が向上する。
本稿では,1つの推論パスで同期された幹の可変集合を生成する拡散/フローベースのフレームワークであるStemphonicを提案する。
フルミックス生成過程を25~50%加速させながら, 高品質な出力が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:30:12 GMT)
Beyond Input-Output: Rethinking Creativity through Design-by-Analogy in Human-AI Collaboration [15.1] デザイン・バイ・アナロジー(Design-by-Analogy, DbA)は、ドメイン間のインスピレーションをマッピングすることによって、新しいソリューションを育むための認知的基盤を持つアプローチである。
創造プロセスの7段階にわたる6種類の表現とテクニックの分類を行う。
この合成に基づいて、DbAを人間とAIのコラボレーションの仲介技術として位置づける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:37:05 GMT)
Flow Matching with Uncertainty Quantification and Guidance [15.0] 不確実性認識フローマッチング(英: Uncertainty-aware flow matching、UA-Flow)は、不確定性不確実性とともに速度場を予測するフローマッチングの軽量拡張である。
UA-Flowは流れのダイナミクスによる速度の不確かさの伝播によるサンプル当たりの不確かさを推定する。
画像生成実験により,UA-Flowはベースライン法よりも試料の忠実度に強く相関した不確実性信号を生成することが示された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:03:13 GMT)
Context-Aware Counterfactual Data Augmentation for Gender Bias Mitigation in Language Models [14.9] 微調整言語モデル(LM)における社会的バイアス軽減の課題は、言語モデリング能力の潜在的な低下である。
本研究では,大きなLMを用いたコンテキスト拡張データ拡張手法であるContext-CDAを提案し,デバイアスコーパスの多様性とコンテキスト関連性を高める。
次に,不確実性に基づくフィルタリングを用いて,ターゲットの小さいLMによる低品質とみなすデファクトを除外する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:45:21 GMT)
RoboSubtaskNet: Temporal Sub-task Segmentation for Human-to-Robot Skill Transfer in Real-World Environments [14.9] 人間とロボットのコラボレーションを安全にするためには、細かなサブタスクのセグメントを、長い、トリミングされていないビデオで一時的に見つけて分類することが不可欠だ。
本稿では,マルチステージのヒューマン・ロボット・サブタスクセグメンテーションフレームワークであるRoboSubtaskNetを紹介する。
また、サブタスクレベルで注釈付けされた医療および産業デモのデータセットであるRoboSubtaskを紹介します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:37:35 GMT)
Instruct2Act: From Human Instruction to Actions Sequencing and Execution via Robot Action Network for Robotic Manipulation [14.8] 我々は、自然言語コマンドを信頼性の高い操作に変換する軽量で完全なオンデバイスパイプラインを開発した。
Instruct2Actは91.5%のサブアクション予測精度を達成し、フットプリントは小さい。
その結果, DATRNに基づく軌道生成と視覚誘導グラウンド化と相まって, 決定論的, リアルタイムな操作を行うための実践的な経路が得られた。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:25:39 GMT)
LingxiDiagBench: A Multi-Agent Framework for Benchmarking LLMs in Chinese Psychiatric Consultation and Diagnosis [14.8] 精神疾患は世界中で広く普及している。
精神科医の不足と面接に基づく診断の固有の主観性は、タイムリーで一貫した精神的健康評価に重大な障壁をもたらす。
大規模マルチエージェントベンチマークであるLingxiDiagBenchを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:46:05 GMT)
Squeezing More from the Stream : Learning Representation Online for Streaming Reinforcement Learning [14.8] ストリーミング強化学習(RL)では、トランジッションが観察され、1回の更新直後に破棄される。
本稿では,SPR(Self-Predictive Representations)をストリーミングパイプラインに拡張して,観測フレームの有効性を最大化することを提案する。
本稿では,リプレイバッファの欠如による性能ギャップを埋めることで,よりリッチな表現を学習できることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:06:32 GMT)
MDL: A Unified Multi-Distribution Learner in Large-scale Industrial Recommendation through Tokenization [14.5] 産業レコメンデータシステムは、多様なユーザインタラクションやコンテキストを扱うために、MSL(Multi-scenario Learning)とMulti-task Learning(MTL)を採用するようになっている。
既存のアプローチでは,(1)複雑な特徴モジュールとの相互作用が限られているため,大規模モデルパラメータの非活用,(2)統合されたフレームワークにおけるシナリオとタスク情報の共同モデリングの難しさ,という2つの重大な欠点がある。
大規模言語モデル(LLM)における「プロンプト」パラダイムにインスパイアされた、統一された textbfMulti-textbfDistribution textbfL MSL フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:55:40 GMT)
Blind denoising diffusion models and the blessings of dimensionality [14.5] 我々は,視覚障害者を対象とした生成拡散モデルの性能を理論的,実証的に分析した。
目立ったことに、スケジュールのないBDDMは、非盲人に比べて高品質なサンプルを生成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:38:16 GMT)
Framework for (non-)adiabatic chiral state conversion: from non-Hermitian Hamiltonians to Liouvillians [14.5] 非エルミート系においてCSCを説明する統一的なフレームワークを提案する。
我々の枠組みは、断熱進化に対する摂動的非断熱的補正に依存している。
CSCは例外的な点を伴わないモデルで観測可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:21:56 GMT)
When Less is More: The LLM Scaling Paradox in Context Compression [14.3] 圧縮機サイズの増大は、再構成されたコンテキストの忠実度を低下させる。
原因はパラメータ数ではなく,過剰な意味能力と,スケーリングに伴う生成の不確実性の増幅である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:49:08 GMT)
Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement [14.2] 大規模な言語モデル (LLM) は、しばしば過剰な拒絶に悩まされる。
この振る舞いはモデルの有用性を損なうものであり、センシティブまたはニュアンスドコンテキストにおけるユーザビリティを制限する。
我々は、この問題は、モデルの学習力学に有毒で一見有毒なプロンプトのあいまいな影響から生じると論じる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:53:10 GMT)
Chain of Mindset: Reasoning with Adaptive Cognitive Modes [14.2] Chain of Mindset(CoM)は、ステップレベルの適応的マインドセットオーケストレーションを可能にする、トレーニング不要のエージェント型フレームワークである。
CoMは推論を、空間、収束、ダイバージェント、アルゴリズムの4つの機能的に異質な考え方に分解する。
メタエージェントは進化する推論状態に基づいて最適マインドセットを動的に選択し、双方向コンテキストゲートはモジュール間の情報フローをフィルタリングする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:31:47 GMT)
MEVER: Multi-Modal and Explainable Claim Verification with Graph-based Evidence Retrieval [14.2] 本稿では,エビデンス検索,マルチモーダルクレーム検証,説明生成を共同で行う新しいモデルを提案する。
マルチモーダル検証のためのクレームとエビデンスを一体化するためのトークンおよびエビデンスレベルの融合を提案する。
ほぼすべてのデータセットが一般的なドメインにあるので、クレーム検証コミュニティを補完するために、AIドメインに科学データセットであるAIChartClaimを作成します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:44:57 GMT)
ConsID-Gen: View-Consistent and Identity-Preserving Image-to-Video Generation [14.1] 画像対ビデオ生成(I2V)は、静的画像をテキスト命令に従って時間的に一貫性のあるビデオシーケンスに変換する。
既存のI2Vパイプラインは、しばしば外観のドリフトと幾何学的歪みに悩まされる。
本稿では、第1フレームを非表示の補助ビューで拡張するビュー支援I2V生成フレームワークであるConsID-Genを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:51 GMT)
ParisKV: Fast and Drift-Robust KV-Cache Retrieval for Long-Context LLMs [13.8] 本稿では,衝突型候補選択に基づくドリフトロバスト,GPUネイティブなKV-cache検索フレームワークを提案する。
ParisKVはUnified Virtual Addressing (UVA)を介してCPUオフロードされたKVキャッシュをサポートする
ParisKVは、長期のインプットと長期のベンチマークにおいて、完全な注目の質にマッチする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:05:56 GMT)
Preference Aligned Visuomotor Diffusion Policies for Deformable Object Manipulation [13.7] 人間は自然に、操作タスクの実施方法の好みを発達させます。
RKOは、RPOとKTOという2つの新しいフレームワークの利点を組み合わせた、新しい選好アライメント手法である。
特にRKOは,標準拡散政策の微調整よりも優れた性能とサンプル効率が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:35:22 GMT)
Latent Thoughts Tuning: Bridging Context and Reasoning with Fused Information in Latent Tokens [13.7] Latent Thoughts Tuning(LT-Tuning)は、潜在思想の構築とデプロイ方法を再定義するフレームワークである。
本研究では,コンテキスト隠蔽状態と予測意味指導を協調的に活用するコンテキスト予測融合機構を提案する。
提案手法は,既存の潜在推論ベースラインより優れ,機能崩壊を効果的に軽減し,頑健な推論精度を実現する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:19:10 GMT)
Anagent For Enhancing Scientific Table & Figure Analysis [13.6] アナジェント(Anagent)は、4つの特殊エージェントを通して科学的テーブルとフィギュア解析を強化するためのフレームワークである。
Anagentはトレーニングフリー設定で最大で$uparrow 13.43%の大幅な改善を実現している。
タスク指向推論と文脈認識問題解決は,高品質な科学表と図形解析に不可欠であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:46:28 GMT)
Biases in the Blind Spot: Detecting What LLMs Fail to Mention [13.6] 大型言語モデル (LLM) は、しばしばチェーン・オブ・シント (CoT) 推論のトレースを提供するが、内部バイアスを隠蔽する可能性がある。
タスク固有の非言語バイアスを検出するために,完全に自動化されたブラックボックスパイプラインを導入する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:56 GMT)
Semi-supervised Liver Segmentation and Patch-based Fibrosis Staging with Registration-aided Multi-parametric MRI [13.3] そこで本研究では, マルチパラメトリックMRIを用いた肝セグメンテーション(LiSeg)と肝線維症ステージング(LiFS)のためのマルチタスク深層学習フレームワークを提案する。
LiSegフェーズは、画像のセグメンテーションと登録を統合する半教師付き学習モデルを使用することで、限られたアノテートイメージの課題に対処する。
LiFS相では,分類出力に基づいて肝線維化の段階を可視化するパッチベースの手法を採用した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:40:43 GMT)
"Bespoke Bots": Diverse Instructor Needs for Customizing Generative AI Classroom Chatbots [13.3] パーソナ、ガードレール、パーソナライゼーションなど、カスタマイズの一般的な10のカテゴリを特定します。
10人の大学STEMインストラクターにインタビューを行い、カテゴリを優先順位に分類するよう依頼した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:41:12 GMT)
Learning to Detect Baked Goods with Limited Supervision [13.1] 画像から焼成品を識別するオブジェクト検出モデルを訓練する。
平均精度(mAP)は0.91である。
擬似ラベルを用いたファインタニングは、非理想的な配置条件下でモデル性能を19.3%向上させる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:06:36 GMT)
A Low-Rank Defense Method for Adversarial Attack on Diffusion Models [13.1] 本稿では,Low-Rank Defense (LoRD) という,LDM(Latent Diffusion Models) に対する敵攻撃を効果的に防御する戦略を提案する。
LoRDは、対向サンプルの検出と防御のために、マージアイデアとバランスパラメータを導入し、ローランク適応(LoRA)モジュールと組み合わせた。
本手法は, 逆方向とクリーンなサンプルの両方で微調整されたLCMが, 高品質な画像を生成することを保証している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:56:59 GMT)
Empowering Contrastive Federated Sequential Recommendation with LLMs [13.0] フェデレートシーケンシャルレコメンデーション(FedSeqRec)は、ユーザのデータを分散化しながら、次のイテム予測を実行することを目的としている。
パラメータ分離型FedSeqRecアーキテクチャである textbfLUMOS を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:47:43 GMT)
ECHO-2: A Large-Scale Distributed Rollout Framework for Cost-Efficient Reinforcement Learning [13.0] 強化学習(Reinforcement Learning, RL)は、学習後の大規模言語モデル(LLM)において重要な段階である。
本稿では,遠隔推論作業者と非無視の拡散遅延を用いた後学習のための分散RLフレームワークECHO-2を提案する。
ECHO-2は、強力なベースラインに匹敵するRL報酬を維持しながら、コスト効率を大幅に改善する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:56:18 GMT)
Optimistic World Models: Efficient Exploration in Model-Based Deep Reinforcement Learning [12.9] 楽観的探索のための原則的でスケーラブルなフレームワークであるOptimistic World Models (OWMs)を紹介する。
OWMは楽観的なダイナミクス損失を伴う拡張によるモデル学習に直接楽観性を取り入れる。
OWMは2つの最先端の世界モデルアーキテクチャ内でインスタンス化され、Optimistic DreamerV3とOptimistic STORMに導かれる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:11:00 GMT)
AutoHarness: improving LLM agents by automatically synthesizing a code harness [12.8] 最近のKaggle GameArenaチェス大会では、ジェミニ2.5-Flashの損失の78%が違法な動きによるものだった。
本稿では,Gemini-2.5-Flashがこのようなコードハーネスを自動的に生成できることを実証する。
その結果、コードポリシーは16のTextArena 1-playerゲームでGemini-2.5-ProやGPT-5.2-Highよりも平均的な報酬を受ける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:12:54 GMT)
Cross-Project Flakiness: A Case Study of the OpenStack Ecosystem [12.7] Flakinessは、テスト結果に対する開発者の信頼を損ね、計算リソースを浪費し、継続的インテグレーションの信頼性を損なう。
我々は、複数のプロジェクトに影響を与えるフレキネスと、いくつかのプロジェクトでテストがフレキネスを示すが、他のプロジェクトでは安定している不一致フレキネスに焦点を当てる。
これらの調査結果は、複雑なエコシステム間のコーディネーションの改善、CI設定の標準化、テスト分離戦略の改善の必要性を浮き彫りにしたものだ。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:03:28 GMT)
Attention to details, logits to truth: visual-aware attention and logits enhancement to mitigate hallucinations in LVLMs [12.6] 本稿では,タスク関連トークンの注意力を高めるための学習自由注意介入アルゴリズムを提案する。
視覚的トークンの寄与を高めるため,ビーム探索復号法に視覚的注意値を注入し,より高い視覚的注意力を持つ解を同定する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:26:50 GMT)
Unsupervised Layer-Wise Dynamic Test Time Adaptation for LLMs [12.4] 大規模言語モデル(LLM)のためのテスト時適応(TTA)は、デプロイ時に利用可能な信号を使用して、推論時にモデルパラメータを更新する。
本報告では, 教師なし, サンプル特異的なTTAという, 一般的だが未探索のシステムに焦点を当てる。
本稿では,TTA強度をプロンプト表現,LLM構造,適応ステップの関数として明示的に変調するフレームワークである層ワイド動的テスト時間適応を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:22:14 GMT)
FlashSinkhorn: IO-Aware Entropic Optimal Transport [12.3] シンクホーン反復によるエントロピック最適輸送(EOT)は、現代の機械学習で広く使われているが、解法は大規模に非効率である。
正方形ユークリッドコストに対するIO対応EOTソルバである textbfFlashSinkhorn を提案する。
A100$では、FlashSinkhornは、ポイントクラウドOT上の最先端のオンラインベースラインよりも、32倍のフォワードパスと161倍のエンドツーエンドのスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:30:25 GMT)
Bi-Adapt: Few-shot Bimanual Adaptation for Novel Categories of 3D Objects via Semantic Correspondence [12.3] Bi-Adaptは、意味的対応による双方向操作の効率的な一般化のために設計された新しいフレームワークである。
Bi-Adaptは、ビジョンファウンデーションモデルの強力な能力を活用して、カテゴリ横断のアプライアンスマッピングを実現する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:21:32 GMT)
The Entropic Signature of Class Speciation in Diffusion Models [12.2] 雑音状態が与えられた潜在意味変数のクラス条件エントロピーを追跡することで、遷移状態の信頼できるシグネチャが得られることを示す。
EDM2-XS と安定拡散 1.5 では,クラス条件エントロピーが意味構造形成に不可欠なノイズ機構を一貫して分離する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:56:46 GMT)
Synthesizing the Kill Chain: A Zero-Shot Framework for Target Verification and Tactical Reasoning on the Edge [12.2] 本稿では,コンパクトな視覚言語モデル(VLM)を用いた軽量物体検出を実現する階層型ゼロショットフレームワークを提案する。
我々は,このパイプラインを,偽陽性フィルタリング(100%精度),損傷評価(97.5%),きめ細かい車両分類(55-90%)の3つのタスクで,バトルフィールド6の55個の高忠実合成ビデオ上で評価した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:00:19 GMT)
Focus Session: LLM4PQC -- An Agentic Framework for Accurate and Efficient Synthesis of PQC Cores [12.2] ポスト量子暗号(PQC)ハードウェアの設計は複雑で階層的なプロセスである。
主なボトルネックは、PQC参照コードをCから高レベル合成(HLS)仕様に変換することである。
本稿では,高レベルPQC仕様と参照Cコードを合成可能なCコードに合成するエージェントフレームワーク LLM4PQC を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:53:37 GMT)
CompSplat: Compression-aware 3D Gaussian Splatting for Real-world Video [12.2] 文化遺産保存、デジタル双生児、没入型メディアなどの応用には、現実世界のビデオからの高品質なノベルビュー合成(NVS)が不可欠である。
本稿では,フレーム単位の圧縮特性を明示的にモデル化する圧縮対応学習フレームワークCompSplatを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:23:42 GMT)
Life Cycle-Aware Evaluation of Knowledge Distillation for Machine Translation: Environmental Impact and Translation Quality Trade-offs [12.1] 知識蒸留(KD)は、より大きなシステム(教師)をより小さなシステム(学生)に圧縮するツールである。
機械翻訳において、研究は通常、学生の翻訳品質とKDを実行する際の計算複雑性を省略する。
我々は,翻訳品質と計算コストの両面を考慮した代表KD手法の評価を行った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:46:32 GMT)
Latent Poincaré Shaping for Agentic Reinforcement Learning [12.1] LaPhaは、AlphaZeroに似たLLMエージェントをポアンカレ潜在空間で訓練する方法である。
MATH-500では、Qwen2.5-Math-1.5Bを66.2%から88.2%に改善している。
AIME'24ではLaPha-1.5Bが56.7%、AIME'24ではLaPha-7Bが60.0%、AIME'25では53.3%に達する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:35:52 GMT)
Signature-Kernel Based Evaluation Metrics for Robust Probabilistic and Tail-Event Forecasting [12.0] 確率予測は、金融学や疫学から気候科学まで、高水準の領域でますます重要になっている。
現在の評価フレームワークにはコンセンサス基準がなく、2つの重大な欠陥に悩まされている。
Sig-MMD(Sig-MMD)と、新しい検閲されたSig-MMD(Sig-MMD)の2つのカーネルベースメトリクスを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:00:00 GMT)
Triggered: A Statistical Analysis of Environmental Influences on Extremist Groups [12.0] 我々は,オンライン過激派コミュニティが,現実世界のイベントやニュース報道,コミュニティ間の交流によって形成されるより広範な情報エコシステムの中でどのように機能するかを検討する。
過激主義の暴力がコミュニティの行動にどのような影響を及ぼすか、政治団体のニュース報道が会話のダイナミクスの変化を予測するのか、そして、主流と過激主義の空間と過激主義のイデオロギーの間で言語的拡散が起こるのか、という3つの質問を行う。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:15:46 GMT)
Cosmo3DFlow: Wavelet Flow Matching for Spatial-to-Spectral Compression in Reconstructing the Early Universe [11.6] 我々は次元と空間性に対処する新しい生成フレームワーク、Cosmo3DFlowを考案した。
Wavelet Transformは空間空度をスペクトル空間に変換することで「空白問題」に対処する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:47:18 GMT)
Diffusion-Guided Pretraining for Brain Graph Foundation Models [11.5] 両制約に対処する拡散型事前学習フレームワークを提案する。
まず、拡散は、構造を意識したドロップとマスキング戦略をガイドし、脳グラフのセマンティクスを保存するように設計されている。
第二に、拡散はトポロジを意識したグラフレベルの読み出しとノードレベルのグローバルな再構築を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:03:24 GMT)
DECKBench: Benchmarking Multi-Agent Frameworks for Academic Slide Generation and Editing [11.5] マルチエージェントスライド生成および編集のための評価フレームワークであるDeck Edits and Compliance Benchmark (DECKBench)を紹介する。
評価プロトコルは,スライドレベルとデッキレベルの忠実度,コヒーレンス,レイアウト品質,マルチターン命令を体系的に評価する。
さらに,スライド生成と編集タスクをペーパー解析,要約,スライド計画,HTML作成,反復編集に分解するモジュール型マルチエージェントベースラインシステムを実装した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:49:06 GMT)
On the Optimal Reasoning Length for RL-Trained Language Models [11.4] 本稿では,2つのモデル,Qwen3-1.7B BaseとDeepSeek-R1-Distill-Qwen-1.5Bを比較した。
提案手法により,提案手法の精度向上が期待できるが,提案手法の精度向上が期待できる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:45:42 GMT)
Egocentric Bias in Vision-Language Models [11.4] 本稿では、視覚言語モデルにおけるレベル2視覚視点撮影(L2 VPT)の診断ベンチマークであるFlipSetを紹介する。
このタスクは、他のエージェントの視点から2D文字列の180度の回転をシミュレートする必要がある。
FlipSetは、マルチモーダルシステムにおける視点取得能力を診断するための認知的基盤のあるテストベッドを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:51:00 GMT)
Power-SMC: Low-Latency Sequence-Level Power Sampling for Training-Free LLM Reasoning [11.4] トレーニング不要なSequential Monte CarloスキームであるPower-SMCを導入する。
MATH500では、Power-SMCはMHの電力サンプリングと一致し、レイテンシを16$---28times$から1.4$---3.3times$に下げる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:31:40 GMT)
IDPruner: Harmonizing Importance and Diversity in Visual Token Pruning for MLLMs [11.3] 視覚トークンのプルーニングはMLLM推論を加速させる重要な手法として登場した。
IDPrunerは最先端のパフォーマンスを実現し、様々なアーキテクチャやタスクにまたがる優れた一般化を実現している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:20:24 GMT)
Sample-Efficient Real-World Dexterous Policy Fine-Tuning via Action-Chunked Critics and Normalizing Flows [11.2] 実世界のインタラクション予算の制限と多モードなアクション分布のため、厳密な操作ポリシーの現実世界の微調整は困難である。
正規化フロー(NF)を用いたサンプル効率の良いオフポリチック微調整フレームワークSOFT-FLOWを提案する。
これは、可能性に基づくマルチモーダルな生成ポリシーと、実際のロボットハードウェアにおけるチャンクレベルの価値学習を組み合わせた最初の実証である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:28:20 GMT)
LARV: Data-Free Layer-wise Adaptive Rescaling Veneer for Model Merging [11.1] LARVは、トレーニングフリー、データフリー、マージ非依存、レイヤワイド・アダプティブ・リスケーリング・ベネアである。
LARVは浅層干渉を適応的に抑制し、単純な決定論的スケジュールを用いて深層アライメントを増幅する。
階層解析と汚職試験は、LARVが浅層干渉を抑制する一方で、より深くタスク安定な特徴を緩やかに増幅していることを示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:10:31 GMT)
XMap: Fast Internet-wide IPv4 and IPv6 Network Scanner [11.1] XMapは、高速インターネットワイドIPv4およびIPv6ネットワーク研究スキャンを実行するために設計されたオープンソースのネットワークスキャナである。
XMapは、2020年にインターネット全体の高速IPv6ネットワークスキャンをサポートする最初のツールである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:06:48 GMT)
The Theory and Practice of MAP Inference over Non-Convex Constraints [11.1] 安全クリティカルな設定では、確率的MLシステムは代数的制約の下で予測を行う必要がある。
これにより、制約された最大値 (MAP) の予測を効率的にかつ確実に行うことができる。
この抽出可能なフラグメントに対して,スケーラブルなメッセージパッシングアルゴリズムを考案する。
そこで我々は,領域を凸可能な領域に分割する一般的なMAP戦略を考案した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:49:02 GMT)
Properties of Bose-Einstein condensates with altermagnetism [11.0] 弱相互作用する2成分のボース=アインシュタイン凝縮体を, 不可解な状態下で調べる。
我々は準粒子スペクトルとコヒーレンス因子を導出し、反磁性秩序が低エネルギー励起の角依存性を全般的に引き起こすことを示す。
今後,超低温原子実験を実施すべきである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:26:19 GMT)
Beware of the Batch Size: Hyperparameter Bias in Evaluating LoRA [10.9] ローランク適応(ローランク適応、LoRA)は、大規模言語モデルの微調整のための標準手法である。
矛盾は1つの見過ごされた要因、すなわちバッチサイズから生じます。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:40:35 GMT)
"Death" of a Chatbot: Investigating and Designing Toward Psychologically Safe Endings for Human-AI Relationships [10.9] character AI、Replika、ChatGPTといったAIコンパニオンに感情的なアタッチメントを作るユーザーは数百万いる。
これらの関係がモデル更新、安全性の介入、あるいはプラットフォームシャットダウンを通じて終わると、ユーザーは閉鎖されることなく、人間の損失に匹敵する悲しみを報告します。
中止は、ユーザーがエージェンシーを判断し、最終性を認識し、仲間を人為的に形作る方法によって形作られた感覚形成プロセスであることがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:51:07 GMT)
Budgeting Discretion: Theory and Evidence on Street-Level Decision-Making [10.8] そこで本研究では,実運用制約下での意思決定の時間的制限について,基本的モデルを提案する。
我々は、オーバライドがダイナミックなしきい値ルールに従うことを示し、機会が時間と予算に依存したカットオフを超えた場合にのみ、裁量を使用する。
これらの結果から,判断は手続き的制約と福祉的改善の両面において,明確に予算化された資源として扱われることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:02:14 GMT)
A Unified Assessment of the Poverty of the Stimulus Argument for Neural Language Models [10.8] 本稿では, 質問形成, 島移動, その他の英語現象を対象とする, 学習・評価スイートであるposhbenchを紹介する。
直接的正の証拠がなくても、すべての現象に対する一般化の兆候が見つかる。
我々の発見は、自然構文が一般化への唯一の経路である、という主張に挑戦する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:16:29 GMT)
SnareNet: Flexible Repair Layers for Neural Networks with Hard Constraints [10.8] 本稿では,SnareNetを提案する。
制約マップのレンジ空間をナビゲートし、実現可能性に向けて操縦し、ユーザが指定した寛容性に対する制約を満たす修復可能な出力を生成する。
制約を以前の作業よりも確実に満たしながら、改善された客観的品質を継続的に達成します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:24:32 GMT)
Fake-HR1: Rethinking reasoning of vision language model for synthetic image detection [10.8] CoT推論(Chain-of-Thought, Chain-of-Thought)は、モデルが合成画像を検出する能力を向上する。
大規模ハイブリッド推論モデルであるFake-HR1を提案する。
実験結果から,Fake-HR1は様々な種類の問合せに対して適応的に推論を行い,推論能力と生成検出性能の両方において既存のLLMを上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:10:08 GMT)
SchröMind: Mitigating Hallucinations in Multimodal Large Language Models via Solving the Schrödinger Bridge Problem [10.8] MLLMは画像を理解することができるが、正確なトークンシーケンスを生成するのに苦労している。
マイナーな摂動は、真理から不合理な状態へと注意を移すことができ、テキスト生成の自己回帰的な性質は、しばしばエラー訂正を妨げる。
我々はシュルディンガー橋問題を解くことで幻覚を減らす新しいフレームワークSchrMindを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:36:40 GMT)
Scalpel: Fine-Grained Alignment of Attention Activation Manifolds via Mixture Gaussian Bridges to Mitigate Multimodal Hallucination [10.8] より信頼性の高い領域への注意活性化分布を精製することにより幻覚を低減する方法である textbfScalpel を提案する。
スカペルは幻覚を効果的に緩和し、以前の方法より優れ、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:53:43 GMT)
A Deep Multi-Modal Method for Patient Wound Healing Assessment [10.6] 患者の入院は、高い創傷治療コストの要因の1つである。
本稿では,患者が入院するリスクを予測するためのマルチモーダル手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:21:32 GMT)
With Argus Eyes: Assessing Retrieval Gaps via Uncertainty Scoring to Detect and Remedy Retrieval Blind Spots [10.5] ニューラル検索には盲点があることを示し、クエリに関連するエンティティを検索できないが、クエリの埋め込みと類似性は低いと定義している。
我々は,このような盲点物質を埋め込み空間の到達不能な部分にマッピングする訓練によって引き起こされるバイアスについて検討した。
本稿では,高リスク(低RPS)エンティティの検索を可能にするパイプラインであるARGUSを紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:04:55 GMT)
KORAL: Knowledge Graph Guided LLM Reasoning for SSD Operational Analysis [10.5] Solid State Drives(SSD)は、データセンタ、コンシューマプラットフォーム、ミッションクリティカルなシステムに不可欠である。
既存の方法は、限られた洞察のみを提供しながら、大規模なデータセットとエキスパートインプットを要求する。
構造化知識グラフ(KG)とLarge Language Models(LLM)を統合した知識駆動推論フレームワークKORALを提案する。
生成したSSD固有のKGを公開し、知識ベースストレージシステム分析における再現可能な研究を進める。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:40:36 GMT)
Is Memorization Helpful or Harmful? Prior Information Sets the Threshold [10.4] 我々は,事前分布に固有の因子が$$であることに気付き,最適な一般化を行うためには,学習誤差がノイズサイズに対してほぼ補間される必要があることを明示した条件を与える。
注目すべきは、これらの現象はフィッシャー情報と以前の$$の分散パラメータによって決定された閾値に達したときに発生する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:35:29 GMT)
Environment-in-the-Loop: Rethinking Code Migration with LLM-based Agents [10.3] ソフトウェア進化の成功には、コードと環境の両方を統合した総合的な視点が必要だ、と私たちは主張する。
自動環境設定とコードマイグレーションワークフローを緊密に統合する新しいフレームワークパラダイムを提案する。
私たちの発見は、自動化された環境相互作用がなければ、コードマイグレーションの自動化は半分しか完了していないことを強調しています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:29:09 GMT)
SAGE: Scalable AI Governance & Evaluation [10.2] textbfSAGEは、スケーラブルな評価信号として高品質な製品判断を運用するフレームワークである。
SAGEはLinkedIn Searchエコシステム内にデプロイされ、モデルバリエーションの増大を計測し、エンゲージメントメトリクスに見えない回帰を検出する、ポリシの監視に使用された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:26:08 GMT)
RAD: Retrieval-Augmented Monocular Metric Depth Estimation for Underrepresented Classes [10.2] 探索された近傍を構造的幾何学的プロキシとして利用することにより,多視点ステレオの利点を近似した検索拡張フレームワークを提案する。
提案手法はまず不確実性を考慮した検索機構を用いて,RGB-Dコンテキストサンプルの入力と検索の低信頼領域を同定する。
次に、入力コンテキストと検索コンテキストの両方をデュアルストリームネットワークで処理し、マッチしたクロスアテンションモジュールを使用してそれらを融合する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:44:31 GMT)
NavDreamer: Video Models as Zero-Shot 3D Navigators [10.1] 本稿では,生成的映像モデルを言語命令と軌跡間の普遍的なインターフェースとして活用する3次元ナビゲーションのための映像ベースのフレームワークを提案する。
我々の主要な仮説は、映像が情報と物理力学をエンコードし、インターネットスケールの可用性と組み合わせることで、ナビゲーションにおけるゼロショットの強力な一般化を可能にする、というものである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:24:12 GMT)
Breaking the Pre-Sampling Barrier: Activation-Informed Difficulty-Aware Self-Consistency [10.1] 自己整合性(英: Self-Consistency, SC)は、大規模言語モデル(LLM)の推論性能を改善する効果的な復号化戦略である。
大量のサンプルを必要とするため、かなりの推論コストに悩まされる。
これらの制約に対処するために,アクティベーション・インフォームド・ディフルティ・アウェア・セルフ一貫性(ACTSC)を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:05:11 GMT)
Conformal Prediction Sets for Instance Segmentation [10.0] 本稿では,適応的信頼度セットを生成するための共形予測アルゴリズムを提案する。
画像と画素座標クエリが与えられた場合、このアルゴリズムはその画素のインスタンス予測の信頼性セットを生成する。
本アルゴリズムは, 農業分野のデライン, 細胞セグメンテーション, 車両検出におけるセグメンテーションの例に適用する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:15:06 GMT)
Time2General: Learning Spatiotemporal Invariant Representations for Domain-Generalization Video Semantic Segmentation [9.9] ドメイン一般化ビデオセマンティック(DGVSS)は、単一のラベル付き駆動ドメインでトレーニングされる。
Time2Generalは、以前のDGVSSとVSSベースラインよりも、クロスドメインの精度と時間的安定性を大幅に改善する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:55:25 GMT)
Step-Size Stability in Stochastic Optimization: A Theoretical Perspective [9.9] ステップサイズに対する感度の観点から,最適化手法の理論的解析を行う。
ステップサイズが大きくなるにつれて,各手法で性能が低下することを示す重要な量を特定する。
非凸問題であっても、我々の理論的境界は実性能をステップサイズとして反映することを示した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:46:14 GMT)
Don't Shoot The Breeze: Topic Continuity Model Using Nonlinear Naive Bayes With Attention [9.9] トピックの急激なシフトは、ユーザエクスペリエンスの低下と、計算リソースの非効率利用につながる可能性がある。
本稿では、応答が初期会話トピックと一致しているかどうかを評価することを目的としたトピック連続性モデルを提案する。
我々のモデルは、特に長く複雑な会話を扱う場合、伝統的な手法よりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:05:31 GMT)
Coupled Inference in Diffusion Models for Semantic Decomposition [9.8] 拡散モデルにおける結合推論を用いた意味分解のためのフレームワークを提案する。
提案手法は, 合成意味分解タスクの多岐にわたる共振器ネットワークより優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:10:05 GMT)
How Do People Quantify Naturally: Evidence from Mandarin Picture Description [9.7] 量子化は日常的な言語の使用の基本的な要素である。
中国語の自然主義生産における話者の定量化について検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:45:00 GMT)
From FusHa to Folk: Exploring Cross-Lingual Transfer in Arabic Language Models [9.7] アラビア語モデル (LM) は、現代標準アラビア語 (MSA) で事前訓練されており、その方言に移行することが期待されている。
これは、その方言がMSAと類似性が異なるため、アラビア語のLMに制限を与える。
本研究では,3つの自然言語処理タスクの探索と表現的類似性を用いて,アラビア語モデルの言語間移動について検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:34:04 GMT)
DR.Experts: Differential Refinement of Distortion-Aware Experts for Blind Image Quality Assessment [9.7] 我々は、歪み事前を明示的に組み込むように設計された、新しい事前駆動型BIQAフレームワークであるDR.Expertsを紹介する。
DR.Expertsは、劣化認識型視覚言語モデルを利用して歪み特異的な先行情報を取得することから始まる。
洗練された事前表現とセマンティクスとブリッジ表現は、提案されたミックス・オブ・エキスパート・スタイルのモジュールによって融合される。
このメカニズムは、それぞれの歪み特有の特徴を知覚的影響に従って重み付け、最終的な品質予測が人間の知覚と一致することを保証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:41:40 GMT)
TraceMem: Weaving Narrative Memory Schemata from User Conversational Traces [9.7] 長期的な相互作用を維持することは、大規模言語モデルにとって依然としてボトルネックである。
ユーザの会話トレースから構造化された物語記憶スキーマを織り込むフレームワークであるTraceMemを提案する。
TraceMemは、ブレインインスパイアされたアーキテクチャで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:14:58 GMT)
Test vs Mutant: Adversarial LLM Agents for Robust Unit Test Generation [9.4] LLM(Large Language Model)ベースの手法は、より可読性の高いテストを生成するが、しばしば低カバレッジとコンパイル性に悩まされる。
本稿では,LLMを用いたテストケース生成のための新しい逆フレームワークであるAdverTestを提案する。
提案手法は, 既存のLLM法よりも8.56%, EvoSuiteより63.30%, 故障検出率の向上を図っている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:06:28 GMT)
SAQNN: Spectral Adaptive Quantum Neural Network as a Universal Approximator [9.4] 近年,量子機械学習 (QML) が注目されている。
現在、量子ニューラルネットワーク(QNN)の表現性に関する不完全な理論的基礎のため、この分野全体が課題に直面している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:22:02 GMT)
BRAVA-GNN: Betweenness Ranking Approximation Via Degree MAss Inspired Graph Neural Network [9.4] 道路網などの高次元グラフに一般化する軽量なグラフニューラルネットワークアーキテクチャを提案する。
我々は,BRAVA-GNNによるKendall-Tau相関の最大214%向上と,最先端手法による推論時間の最大70倍の高速化を実現していることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:20:09 GMT)
FLINGO -- Instilling ASP Expressiveness into Linear Integer Constraints [9.4] 上述した数値制約に表現性を組み込んだFlingO言語(およびツール)を提案する。
また、新たに導入されたFlingO構文から通常のCASPプログラムへの変換をClingCON入力形式に従って提示する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:08:05 GMT)
Efficient Learning of Sparse Representations from Interactions [9.4] 従来の密集層の代わりに高次元スパース埋め込み層を学習するためのトレーニング戦略を提案する。
製品グレードの協調フィルタリングオートエンコーダELSAを改良し,推奨精度を損なうことなく,最大10倍の埋め込みサイズを実現した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:09:58 GMT)
Online Selective Conformal Prediction with Asymmetric Rules: A Permutation Test Approach [9.3] Selective conformal predictionは、データ駆動メカニズムによって選択されたテスト単位条件に対して有効なカバレッジを持つ予測セットを構築することを目的としている。
既存の方法は限られた選択機構にのみ対処する。
任意の非対称選択規則を用いた選択的共形予測のためのPErmutation-based Mondrian Conformal Inference (PEMI)を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:39:36 GMT)
Breaking 5G on The Lower Layer [9.3] 現代5Gにおける低層利用について検討する。
最近のリリースは、下位層のコントロールメッセージとプロシージャの数を増やしている。
本研究は,2つの実践的攻撃を報告し,実験室の試験室で評価した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:54:32 GMT)
JMigBench: A Benchmark for Evaluating LLMs on Source Code Migration (Java 8 to Java 11) [9.3] ソースコードマイグレーションタスクのための大規模言語モデル(LLM)を評価するベンチマークを構築した。
最初にオープンソースリポジトリから関数ペアのデータセットを収集しましたが、データ品質の制限により、洗練されたデータセットを構築することができました。
このデータセットを用いて、Mistral CodestralモデルをCodeBLEUとメトリクスで評価し、語彙的および意味的類似性およびマイグレーションの正確性を測定した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:04:00 GMT)
Routing, Cascades, and User Choice for LLMs [9.3] ユーザ行動に対するLLMルーティングの効果について検討する。
2つのモデルを持つLLMプロバイダと,タスクの再実行や放棄が可能なユーザとの間でのゲームを提案する。
ユーザの目的は、モデルの使用の遅延を抑えるためにユーティリティを最大化することであり、一方、プロバイダは、ユーザをサービスするコストを最小限にすることである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:39:31 GMT)
Boltzmann Generators for Condensed Matter via Riemannian Flow Matching [9.3] 凝縮相系の平衡サンプリングは、ほとんど探索されていない。
これらのシステムに固有の周期性を連続正規化フローに組み込むことで、この問題に対処する。
我々のアプローチは単原子氷上で検証され、前例のない大きさのシステムで訓練し、高精度な自由エネルギー推定値を得る能力を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:32:31 GMT)
ATPO: Adaptive Tree Policy Optimization for Multi-Turn Medical Dialogue [9.2] 本稿では,新しい不確実性を考慮した適応木ポリシー最適化 (ATPO) アルゴリズムを提案する。
提案手法は,ベルマン誤差とアクション値分散の複合測定値を用いて,高い不確実性のある状態にロールアウト予算を適応的に割り当てる。
3つの公開医療対話ベンチマークの実験により、我々のアルゴリズムはいくつかの強力なベースラインを著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:47:23 GMT)
Computationally Efficient Replicable Learning of Parities [9.2] 第一の貢献は、任意の分布上のパリティの実学習のための計算効率の良い初のレプリカブルアルゴリズムである。
私たちのメインビルディングブロックは、ベクトルの集合が与えられた場合、そのほとんどをカバーする線形スパンの部分空間を出力する、新しく、効率的で、複製可能なアルゴリズムです。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:53:46 GMT)
Designing Multi-Robot Ground Video Sensemaking with Public Safety Professionals [9.1] 地上ロボットからの映像は、スケーラブルな状況認識を提供し、専門家の負担を軽減することで、公共の安全を向上することができる。
しかし、マルチロボットビデオを公共の安全のために設計し、統合する方法については、ほとんど知られていない。
我々は,マルチロボットグラウンド・ビデオ・センスメイキングのための最初のテストベッドを提示した。
MRVSは、マルチロボットパトロールビデオストリームを、プロンプトエンジニアリングのビデオ理解モデルで強化するツールです。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:41:40 GMT)
Geometry-Aware Decoding with Wasserstein-Regularized Truncation and Mass Penalties for Large Language Models [9.1] トップW(Top-W)は、トークン埋め込み幾何学上のワッサーシュタイン距離定義を用いた幾何対応トランケーション規則である。
我々は、Top-Wが、最先端のデコードアプローチにおいて、最大33.7%の改善を継続的に達成していることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:36:48 GMT)
PRISM: Differentially Private Synthetic Data with Structure-Aware Budget Allocation for Prediction [9.0] 差分プライバシー(DP)は、相手が解放されたデータからどんな個人について学べるかを制限する数学的保証を提供する。
既存のDP合成データ手法は、データが特定の予測タスクに役立つ場合でも、全ての特徴を対称に扱い、ノイズを均一に拡散する。
我々は、利用可能な構造知識に依存して、3つの体制で機能する予測中心のアプローチを開発する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:17:55 GMT)
TwistNet-2D: Learning Second-Order Channel Interactions via Spiral Twisting for Texture Recognition [8.9] 指向性空間変位下での局所的な対流路積を計算する軽量モジュールTwistNet-2Dを導入する。
中心となるコンポーネントであるSpral-Twisted Channel Interaction (STCI)は、要素ワイドチャネル乗算の前に所定の方向に1つの特徴マップをシフトする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:43:51 GMT)
CODE-SHARP: Continuous Open-ended Discovery and Evolution of Skills as Hierarchical Reward Programs [8.8] 階層的リワードプログラム(CODE-SHARP)として継続的オープンエンド発見とスキルの進化を紹介する。
発見したスキルが生み出す報酬に特化して訓練された目標条件エージェントが,ますます長い水平目標の解決を学習することを示す。
高レベルのFMベースのプランナーによって構成されたこの技術により、単一の目標条件付きエージェントが複雑な長期的タスクを解決し、事前訓練されたエージェントとタスク固有の専門家ポリシーを平均134$%以上のパフォーマンスで達成できる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:51:39 GMT)
Design and Evaluation of an Assisted Programming Interface for Behavior Trees in Robotics [8.8] 本稿では,Behavior TRee GUI (BETR-GUI) を導入し,動作木 (BT) プログラム表現を作成する。
60人の参加者によるユーザスタディによると、BETR-GUIは、異なる支援方法を組み合わせることで、ロボットプログラミングタスクの解法をより良く行うことができる。
また、BETR-GUIの完全な派生版を使用している人間は、AIアシスタントが単独で実行しているものよりもパフォーマンスが良いことも示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:34:00 GMT)
Learning to Select Like Humans: Explainable Active Learning for Medical Imaging [8.7] 本稿では,空間的注意のアライメントをサンプル取得プロセスに統合する,説明可能性誘導型アクティブラーニングフレームワークを提案する。
3つの専門家による医用画像データセットを用いて,その枠組みを評価する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:20:37 GMT)
Quantum-Audit: Evaluating the Reasoning Limits of LLMs on Quantum Computing [8.7] 言語モデルは量子コンピューティングの教育と研究のための実用的なツールとなっている。
量子監査(Quantum-Audit)は、コア量子コンピューティングに関する2,700の質問でこのギャップに対処する。
被験者は23%から86%で、専門家は74%だった。
トップパフォーマンスモデルはエキスパート平均を超え、クロードオプス4.5は84%の精度に達した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:56:04 GMT)
TriPilot-FF: Coordinated Whole-Body Teleoperation with Force Feedback [8.6] 本稿ではTriPilot-FFについて紹介する。TriPilot-FFは、カスタムバイマニュアル移動マニピュレータのためのオープンソース全体遠隔操作システムである。
低コストのベースマウントライダーのみを使用して、TriPilot-FFは命令方向の近接障害物信号からペダルキューを描画する。
本稿では,TriPilot-FFが長期間にわたって人間の操作者を効果的にコパイロット化できることを実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:26:42 GMT)
5Gone: Uplink Overshadowing Attacks in 5G-SA [8.4] 我々は、5G-SAに対する強力なソフトウェア定義無線(SDR)ベースのアップリンクオーバーシャドーイング攻撃手法である5Goneを紹介する。
アップリンクオーバーシャドーイング(Uplink overshadowing)とは、攻撃者が被害者UEと全く同じ時間と周波数で送信することを意味するが、出力パワーはわずかに高い。
5Goneは、多数のUEが並列に接続している場合でも、非常にスケーラブルであることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:31:04 GMT)
Breaking the Simplification Bottleneck in Amortized Neural Symbolic Regression [8.4] SimpliPyはルールベースの単純化エンジンで、SymPyよりも100倍のスピードアップを実現している。
この利点をFlash-ANSRフレームワークで示しています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:11:06 GMT)
Is Retraining-Free Enough? The Necessity of Router Calibration for Efficient MoE Compression [8.3] Mixture-of-Experts (MoE)モデルは、効率よくキャパシティをスケールするが、その巨大なパラメータフットプリントは、デプロイメント時のメモリボトルネックを生み出す。
我々は、トレーニングなしのMoE圧縮を、Expert Pruning、Expert Editing、Expert Mergingの3つのパラダイムに分類する。
圧縮後の持続的な劣化は、主に無視された要因である: 専門家が変更されてもルータは触れられていないときのルータ-専門家ミスマッチである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:04:07 GMT)
Evaluating Disentangled Representations for Controllable Music Generation [8.2] 探索型フレームワークを用いた制御可能生成のための音楽音響モデルにおける不整合表現の評価を行った。
選択されたモデルは、インダクティブバイアス、データ拡張、敵対的目標、ステージドトレーニング手順など、さまざまな教師なしの非絡み合い戦略を反映している。
本研究により, 埋め込みの意図的意味論と実際の意味論の矛盾が明らかとなり, 現状の戦略が真に不整合表現を生み出すには至っていないことが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:25:04 GMT)
CAPER: Constrained and Procedural Reasoning for Robotic Scientific Experiments [8.1] 本稿では,ロボット科学実験のための制約付きおよびプロデューラル推論のためのフレームワークであるCAPERを提案する。
解釈可能な中間表現を通じて手続き的なコミットメントを符号化することにより、CAPERは実験ロジックの実行時違反を防止する。
科学ワークフローベンチマークとパブリックな長期操作データセットの実験は、成功率と手続き的正確性において一貫した改善を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:18:41 GMT)
Beyond Calibration: Confounding Pathology Limits Foundation Model Specificity in Abdominal Trauma CT [8.1] 基礎モデルを臨床実践に翻訳するには、複合分布シフト下での性能を評価する必要がある。
基礎モデルの特異性欠陥が負のクラスにおける不均一性と関連しているかどうかを検討した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:08:06 GMT)
Can Image Splicing and Copy-Move Forgery Be Detected by the Same Model? Forensim: An Attention-Based State-Space Approach [8.0] Forensimは画像偽造検出のための注目ベースの状態空間フレームワークである。
操作された(ターゲット)領域とソース領域の両方を共同でローカライズする。
Forensimは標準ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:46:04 GMT)
The Wisdom of Many Queries: Complexity-Diversity Principle for Dense Retriever Training [8.0] この矛盾を特定し、多様性の影響を定量化するためにQ-Dメトリクスを設計する。
マルチホップデータの深い分析は、多様性の利点がクエリの複雑さと強く関連していることを示している。
我々はこれを複雑性・多様性原理(CDP: Complexity-Diversity Principle: Complexity-Diversity Principle)として定式化し、クエリの複雑さは最適な多様性を決定する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:33:10 GMT)
PMMA: The Polytechnique Montreal Mobility Aids Dataset [7.8] 本研究では,PMMAと呼ばれる移動補助具を用いた歩行者の物体検出データセットを提案する。
データセットは屋外の環境で収集され、ボランティアは車椅子、杖、歩行器を使った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:04:20 GMT)
Entropy-Aware Structural Alignment for Zero-Shot Handwritten Chinese Character Recognition [7.6] ゼロショット手書き漢字認識は、急進的な意味合成を活用することで、目に見えない文字を認識することを目的としている。
本稿では,情報理論モデリングにより視覚と意味のギャップを埋めるエントロピー対応構造アライメントネットワークを提案する。
ICDAR 2013データセットで55.04%の精度を達成し,新しい最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:46:50 GMT)
AI-Generated Letters from the Future: A Randomized Test of Personalized Climate Communication [7.6] 将来のAIによる個人化された手紙が、気候活動への公的な関与を高めることができるかどうかを検討した。
米国の1,654人の親による事前登録されたオンライン実験では、参加者は事実に基づく気候レポート、ジェネリック・フューチャーのAI生成レター、または将来の子供によって書かれたAI生成レターのいずれかを受け取るようにランダムに割り当てられた。
どちらの物語条件も将来の世代に対する共感的な関心を高めたが、気候政策の支援や環境慈善団体への寄付には影響しなかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:36:53 GMT)
AD$^2$: Analysis and Detection of Adversarial Threats in Visual Perception for End-to-End Autonomous Driving Systems [7.5] 本研究では,CARLAにおけるブラックボックスの敵対的脅威モデルの下で,最先端の自律走行エージェントの閉ループ評価を行う。
視覚知覚パイプラインにおける3つの代表的な攻撃ベクトルについて考察する: (i) 音波によって誘発される物理ベースのぼかし攻撃、 (ii) 捉えた画像を歪ませる電磁干渉攻撃、 (iii) ゴーストオブジェクトを画像上に慎重に構築した有界摂動として付加するデジタル攻撃。
TransfuserとInterfuserという2つの高度なエージェントの実験では、そのような攻撃に対する深刻な脆弱性が明らかとなり、運転スコアは最大99%低下した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:13:37 GMT)
Red Teaming LLMs as Socio-Technical Practice: From Exploration and Data Creation to Evaluation [7.5] この作業を支えるデータプラクティスと標準について検討する。
敵対的データセットはモデル評価のスコープと精度を決定するため、大きな言語モデルから潜在的損害を評価するための重要な人工物である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:25:35 GMT)
Separating Quantum and Classical Advice with Good Codes [7.4] 検証可能な言語のクラス間で、無条件の古典的なオラクル分離を示す。
Bostanci, Haferkamp, Nirkhe, Zhandryの最近の研究と比較すると、我々の証明は概念的にも技術的にもシンプルである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:53:09 GMT)
Risk-sensitive reinforcement learning using expectiles, shortfall risk and optimized certainty equivalent risk [7.4] 本稿では,リスク対策の3つのファミリーに対応する,リスクに敏感な強化学習アルゴリズムを提案する。
各リスク測度について、有限地平面マルコフ決定過程の文脈で、まずポリシー勾配定理を導出する。
一般的なRLベンチマークの理論的結果を検証するため,数値実験を行った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:38:21 GMT)
Evaluating Social Bias in RAG Systems: When External Context Helps and Reasoning Hurts [7.3] 大規模言語モデル(LLM)に固有の社会的バイアスは、かなりの公平さを懸念する。
この研究は、RAGの社会的バイアスの影響を評価し、理解することに焦点を当てている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:27:56 GMT)
ViSpeechFormer: A Phonemic Approach for Vietnamese Automatic Speech Recognition [7.3] ベトナム語自動音声認識(ASR)のための音素ベースアプローチViSpeechFormer(textbfVietnamese textbfSpeech TranstextbfFormer)を提案する。
ベトナムの2つのASRデータセットに対する実験は、ViSpeechFormerが強いパフォーマンスを実現し、語彙外単語よりも一般化し、トレーニングバイアスの影響を受けないことを示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:26:55 GMT)
Scalable Mean-Field Variational Inference via Preconditioned Primal-Dual Optimization [7.2] 我々は、拡張ラグランジアン定式化に基づく新しい原始双対アルゴリズム(PD-VI)を開発した。
PD-VIは、グローバルおよび局所的な変動パラメータを、スケーラブルな方法で下限のエビデンスで共同で更新する。
PD-VIとP$2$D-VIのコンバージェンス保証を、適切に選択された一定のステップサイズで確立する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:36:49 GMT)
Beyond Sparsity: Quantum Block Encoding for Dense Matrices via Hierarchically Low Rank Compression [7.2] 線形方程式の大規模システムを解くための量子アルゴリズムは、潜在的なスピードアップを提供する。
この研究は、これらのアルゴリズムの範囲を、構造化された高密度行列の幅広いクラスに拡張する。
我々は、これらのシステムを量子解法に適合させる2つの異なる方法を開発した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:56:49 GMT)
ECHO: An Open Research Platform for Evaluation of Chat, Human Behavior, and Outcomes [7.0] ECHOはオープンな研究プラットフォームであり、対話型AIシステムとWeb検索エンジンの両方とのインタラクションの混合研究をサポートするように設計されている。
さまざまな分野の研究者が、同意とバックグラウンド調査、チャットベースの検索ベースの情報検索セッション、書き込みや判断タスク、そして、統合されたローコーディング・ロード・フレームワーク内での事前タスク評価を統合する、エンドツーエンドの実験を編成することが可能になる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:10:38 GMT)
ReSIM: Re-ranking Binary Similarity Embeddings to Improve Function Search Performance [6.9] 本稿では,ニューラルリランカを用いた埋め込み型検索を補完する新しい機能検索システムであるReSIMを紹介する。
2つのベンチマークデータセット上に7つの埋め込みモデルにまたがってReSIMを評価し、探索効率を一貫した改善を実証した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:57:49 GMT)
Measuring Dataset Diversity from a Geometric Perspective [6.9] トポロジカルデータ解析(TDA)とパーシステンスランドスケープ(PL)に基づくフレームワークを導入し,データから幾何学的特徴を抽出し定量化する。
提案するPLs-based diversity metric (PLDiv) は強力で信頼性が高く,解釈可能である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:17:16 GMT)
Impact of domain adaptation in deep learning for medical image classifications [6.8] ドメイン適応(DA)は、あるドメインでトレーニングされたモデルを他のドメインでうまく機能させるために調整することを含む、機械学習における急速に拡大する領域である。
一般的なDA手法をシミュレートするために10のディープラーニングモデルを使用し、4つの医用画像データセットでそれらの応用を探索する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:59:03 GMT)
Privacy Amplification for BandMF via $b$-Min-Sep Subsampling [6.8] 我々はモンテカルロ会計を用いてほぼ正確なプライバシー分析を行う。
高騒音下でのサイクリックサブサンプリングに$b$-min-sepが一致し,中低騒音下での保証が厳格に向上したことを示す。
これまでのBandMFサブサンプリングとは違って、当社の$b$-min-sepサブサンプリングは、当然、マルチ属性のユーザレベルのプライバシ設定に拡張されます。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:10:38 GMT)
MATA: Multi-Agent Framework for Reliable and Flexible Table Question Answering [6.8] マルチエージェントのテーブルQAフレームワークであるMATAを導入し、複数の補完的推論パスと、小さな言語モデルで構築されたツールセットを紹介する。
MATAは、与えられたテーブルと質問に対する多様な推論スタイルを通じて候補回答を生成し、その後、最適な回答を洗練または選択する。
高価なLarge Language Modelsエージェントコールを最小限に抑え、全体的な効率を向上させるために設計されたアルゴリズムが組み込まれている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:43:02 GMT)
ImprovEvolve: Ask AlphaEvolve to Improve the Input Solution and Then Improvise [6.8] 我々は、AlphaEvolveのようなLSMベースの進化的アプローチを強化するための、シンプルで効果的な手法である ImprovEvolveを提案する。
我々は、AlphaEvolveの論文から、六角形内の六角形充填と2番目の自己相関不等式という難題について、PuccessEvolveの評価を行った。
ヘキサゴンパッキングでは、進化したプログラムは、11、12、15、16ヘキサゴンの新たな最先端結果を達成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:23:13 GMT)
SCORE: Specificity, Context Utilization, Robustness, and Relevance for Reference-Free LLM Evaluation [6.8] 大規模言語モデル (LLMs) は、ハイテイクなドメイン固有の設定において、質問応答と意思決定をサポートするために、ますます使われている。
本研究では,LLM出力を4つの相補次元に沿って評価する多次元参照フリー評価フレームワークを提案する。
我々は、40の専門職と7つの自然危険タイプにまたがる1,412のドメイン固有の質問応答ペアをキュレートしたデータセットを紹介した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:39:17 GMT)
Symbolic Pattern Temporal Numeric Planning with Intermediate Conditions and Effects [6.6] パターンが行動間の因果順序を示す数値計画のための記号パターン計画(SPP)手法が提案された。
本稿では,中間条件と効果(ICE)の断片化による時空間計画へのSPPアプローチの拡張について述べる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:03:40 GMT)
Traceable Cross-Source RAG for Chinese Tibetan Medicine Question Answering [6.6] 中国のチベット医学では、百科事典のエントリは、しばしば密度が高く、一致し易い。
本稿では,トレーサビリティを改善し,幻覚を低減し,クロスKB検証を可能にする2つの補完手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:34:45 GMT)
$k$-Positivity and high-dimensional bound entanglement under symplectic group symmetry [6.5] シンプレクティック群対称性を示す線形写像と二部量子状態のクラスに対する$k$-陽性とシュミット数の構造について検討する。
本研究は,PPTエンタングルメントの強い形式と高次エンタングルメントの両方を系統的に研究できる,自然かつ解析的に抽出可能なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:03:58 GMT)
Learning Where It Matters: Geometric Anchoring for Robust Preference Alignment [6.4] 本稿では,固定参照を動的な幾何学的アンカーに置き換えたGeometric Anchor Preference Optimization (GAPO)を提案する。
GAPOは標準のLCMアライメントと推論ベンチマークのパフォーマンスをマッチングまたは改善しながら、ロバストさを一貫して改善する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:32:46 GMT)
Query-Mixed Interest Extraction and Heterogeneous Interaction: A Scalable CTR Model for Industrial Recommender Systems [6.3] HeMixは適応シーケンストークン化と異種相互作用構造を統合するスケーラブルなランキングモデルである。
我々は、コンテキスト認識とコンテキスト非依存のユーザ関心を共同でモデル化するQuery-Mixed Interest extractモジュールを導入する。
産業規模のデータセットの実験では、HeMixは効果的にスケールし、一貫して強いベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:56:14 GMT)
Humanoid Factors: Design Principles for AI Humanoids in Human Worlds [6.2] 本研究では,身体,認知,社会,倫理の4つの柱を中心に構成された枠組みとしてヒューマノイド因子の概念を紹介する。
このフレームワークは、AI基盤モデルを利用した汎用ヒューマノイドと人間の能力の重複とばらつきを特徴付ける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:34:43 GMT)
Long Chain-of-Thought Compression via Fine-Grained Group Policy Optimization [6.2] 大規模言語モデル(LLM)は、不要に冗長なChain-of-Thought(CoT)推論を生成する。
textbfFine-fine textbfGroup policy textbfOptimization (textbfFGO)を提案する。
FGOは、グループを分割し、長さとエントロピーに基づいて適切な重みを割り当てることで、グループ応答を洗練し、効果的なCoT圧縮を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:15:58 GMT)
Deep Modeling and Interpretation for Bladder Cancer Classification [6.1] 視覚変換器(ViT)と畳み込みニューラルネットワーク(CNN)に基づくディープモデルは、自然データセット上で顕著な性能を示した。
本研究では,膀胱癌分類における最新の深層モデルについて検討した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:35:12 GMT)
Measuring Privacy Risks and Tradeoffs in Financial Synthetic Data Generation [6.0] 我々は、合成データ生成方式と金融データセットのプライバシとのトレードオフを考察する。
GANとオートエンコーダシンセサイザーの新しいプライバシ保護実装を提供する。
その結果,重度のクラス不均衡と混合型属性を示すデータセットから合成データを生成する上での課題について考察した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:14:19 GMT)
Understanding Remote Mental Health Supporters' Help-Seeking in Online Communities [6.0] 522個のRedditスレッドを分析して、遠隔介護者のオンラインヘルプ検索行動を理解する。
本稿では、遠隔介護者とレシーバー間のコミュニケーション支援の必要性、危機管理のためのケア調整、介護者コミュニティのためのデザインレコメンデーションについて論じる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:57:05 GMT)
Sparse Axonal and Dendritic Delays Enable Competitive SNNs for Keyword Classification [5.9] スパイキングニューラルネットワーク(SNN)のトレーニング伝達遅延は、複雑な時間的タスクにおける性能を大幅に改善することが示されている。
本研究では, 軸索的あるいは樹状的遅延の学習により, 既存のシナプス的遅延学習手法と同等の精度で, フィードフォワードSNNに到達できることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:57:02 GMT)
Statistical-Computational Trade-offs in Learning Multi-Index Models via Harmonic Analysis [5.8] マルチインデックスモデル(MIM)の学習問題について検討する。
球対称入力を持つMIMの学習複雑性の鋭い調和解析特性を得る。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:46:32 GMT)
Bridging the Modality Gap in Roadside LiDAR: A Training-Free Vision-Language Model Framework for Vehicle Classification [5.7] インテリジェントトランスポートシステム(ITS)におけるきめ細かいトラックの分類
現在のLiDARベースの手法は、教師付きディープラーニングと労働集約型マニュアルアノテーションに依存しているため、スケーラビリティの課題に直面している。
パラメータの微調整を伴わないきめ細かいトラック分類のために,市販のビジョンランゲージモデルを適用することで,このギャップを埋めるフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:39:48 GMT)
LCLA: Language-Conditioned Latent Alignment for Vision-Language Navigation [5.5] LCLAは視覚言語ナビゲーションのためのフレームワークであり、感覚観察を専門家ポリシーの潜在表現に整合させることで、モジュラー認識インタフェースを学習する。
ライトウェイトアダプターは、凍結した視覚言語モデルを介して生の視覚言語観測を専門家の潜伏空間にマッピングするように訓練される。
このデカップリングは、知覚と制御の間の安定した契約を強制し、知覚のモダリティと環境変動をまたいで専門家の振る舞いを再利用することを可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:40:47 GMT)
Towards Poisoning Robustness Certification for Natural Language Generation [5.5] 我々は2つのセキュリティ特性を定式化し、安定性(世代変更に対するロバスト性)と妥当性(世代におけるターゲットに対するロバスト性、世代における有害な変化)を定式化する。
我々は、特定の有害なクラス、トークン、フレーズを誘導するのに必要となる最小限の中毒予算を計算し、妥当性/標的攻撃を認証する最初のアルゴリズムであるTPA(Targeted Partition Aggregation)を紹介する。
実験的に、TPAの有効性をさまざまな設定で示す。 敵がデータセットの最大0.5%を変更したとき、エージェントツール呼び出しの妥当性を検証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:09:44 GMT)
Efficient Special Stain Classification [5.5] スライド画像全体を用いた染色の自動分類のための2つの手法を比較した。
マルチインスタンス学習(MIL)パイプラインと,ライトウェイトサムネイルに基づくアプローチを提案する。
我々は、サムネイルに基づく分類が、デジタル病理データセットにおける日常的な視覚的品質制御のためのスケーラブルで堅牢なソリューションを提供すると結論付けている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:15:13 GMT)
Vendi Novelty Scores for Out-of-Distribution Detection [5.5] Vendi Novelty Score(VNS)はVendi Scores(VS)に基づくOOD検出器である。
VNSは線形時間であり、非パラメトリックであり、クラス条件(ローカル)とデータセットレベル(グローバル)のノベルティ信号とを自然に組み合わせている。
VNSは、トレーニングデータの1%しか使用せず、メモリやアクセス制限のある設定でのデプロイメントを可能にすると、このパフォーマンスを維持する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:30:29 GMT)
The quantum multinomial distribution: a combinatorial formulation of multiphoton interference [5.4] 本稿では, 線形光干渉計を用いて, 転移確率$m$同一光子の多項分布の量子一般化について述べる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:31:50 GMT)
Redundancy-Free View Alignment for Multimodal Human Activity Recognition with Arbitrarily Missing Views [5.4] RALISは、マルチビューのコントラスト学習とエキスパートの混合モジュールを組み合わせて、トレーニングと推論の両方で任意のビューアベイラビリティをサポートするモデルである。
RALISは、慣性と人間のポーズのモダリティを含む4つのモードで検証され、3から9までのビューの数は、そのパフォーマンスと柔軟性を示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:53:51 GMT)
Mapping Drivers of Greenness: Spatial Variable Selection for MODIS Vegetation Indices [5.3] 本研究はMODIS植生指標を用いて, スペクトル帯, 生産性, エネルギーフラックス, 観測幾何学, 陸地表面特性の予測因子について検討した。
本研究では,各係数面が基底係数に先行してテンソル積B-スプライン基底とベイズ群ラッソを用いる空間変化係数モデルを提案する。
95パーセントの信頼区間が0を除いた位置をマークする空間的重要度マップを用いて,保持効果を要約し,信頼区間が0を除いた位置の比率として空間的カバレッジ確率を定義する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:20:10 GMT)
LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations [5.3] 我々は,前世代のアクティベーションに関する線形プローブを訓練し,数学やコーディングタスクにおける政策固有の成功を予測する。
モデルが人間の難易度とは異なる難易度のモデル固有の概念を符号化していることを示す。
モデルプールをまたいでクエリをルーティングすることは、最高のパフォーマンスモデルを超えることができることを実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:57:00 GMT)
AlignTune: Modular Toolkit for Post-Training Alignment of Large Language Models [5.2] トレーニング後のアライメントは、大規模言語モデル(LLM)のデプロイの中心である
本稿では,教師付きファインチューニング(SFT)とRLHFスタイルの最適化のための統一インターフェースを公開するモジュールツールキットAlignTuneを紹介する。
単一のファクトリ境界の後方でバックエンド固有のロジックを分離することで、AlignTuneは制御された比較と再現可能な実験を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:08:51 GMT)
Seeing the Goal, Missing the Truth: Human Accountability for AI Bias [5.2] 本研究では,人間定義目標が大規模言語モデル(LLM)の行動に与える影響について検討する。
財務予測タスクを用いて、下流での活用を明らかにすることで、LCMは偏りのある感情や競争の指標を生成することが示される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:01:45 GMT)
Limits of Residual-Based Detection for Physically Consistent False Data Injection [5.2] FDIA(False Data Injection attack)は、AC電力系統の状態を推定する手法である。
本稿では,AC電力流の一般機能構造を組み込んだデータ駆動型構成機構について述べる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:29:45 GMT)
Certified Gradient-Based Contact-Rich Manipulation via Smoothing-Error Reachable Tubes [5.1] 我々は接触リッチな操作のための新しい勾配に基づくポリシー合成法を開発した。
提案手法は,平面プッシュ,オブジェクト回転,手動操作など,複数の接触に富むタスクに対して評価する。
定値ロバスト制御で微分可能な物理をブリッジすることにより,接触リッチな操作を行うための,初めて証明可能な勾配式ポリシー合成法である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:19:42 GMT)
The Global Landscape of Environmental AI Regulation: From the Cost of Reasoning to a Right to Green AI [5.1] 生成的Web検索と推論モデルは、従来の世代のAIアプローチよりも累積的環境の影響が大きいことを示す。
我々は、推論消費、ベンチマーク、計算位置をカバーするモデルレベルの透明性を必須に提案する。
我々は、他の司法管轄区域のテンプレートとして機能する具体的な立法案で締めくくります。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:20:22 GMT)
Why Linear Interpretability Works: Invariant Subspaces as a Result of Architectural Constraints [5.1] 線形プローブとスパースオートエンコーダは変圧器表現から意味のある構造を常に復元することを示す。
我々はこれを EmphInvariant Subspace Necessity theorem として定式化し、emphSelf-Reference Property を導出する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:42:55 GMT)
Circuit Fingerprints: How Answer Tokens Encode Their Geometrical Path [5.1] 変圧器における回路発見とアクティベーションステアリングは同じ表現空間で動作する。
答えトークンは独立して処理され、それらを生成する方向をエンコードします。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:43:59 GMT)
A Scoping Review of Deep Learning for Urban Visual Pollution and Proposal of a Real-Time Monitoring Framework with a Visual Pollution Index [5.0] UVP(Urban Visual Pollution)は重要な問題として浮上しているが、自動検出と応用の研究はいまだに断片化されている。
このスコーピングレビューは、視覚汚染管理のための包括的なアプリケーションフレームワークを検出し、分類し、設計するための、既存のディープラーニングベースのアプローチをマッピングする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:30:27 GMT)
Kernel-Based Learning of Chest X-ray Images for Predicting ICU Escalation among COVID-19 Patients [5.0] 多重カーネル学習(MKL)は、より単純なカーネルから複合カーネルを構築し、異種ソースからの情報を統合することで、これらの制限に対処する。
我々はMKLを拡張して指数族に属する結果変数を対応させ、より広範なデータ型を表現し、提案手法をカーネルと統合された多重加算回帰を持つ一般化線形モデル(GLIMARK)として参照する。
我々は, GLIMARKを新型コロナウイルス胸部X線データセットに適用し, ICUエスカレーションのバイナリ結果を予測し, 臨床的に有意な特徴を抽出した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:11:43 GMT)
ICODEN: Ordinary Differential Equation Neural Networks for Interval-Censored Data [5.0] ICODENは、間隔知覚データのための通常の微分方程式に基づくニューラルネットワークである。
常に良好な予測精度を達成し、予測器の数が増加するにつれて安定である。
これらの結果はICODENを高次元バイオメディカル環境下でのインターバルセンシングサバイバルデータによる予測のための実用的な仮定型ツールとして確立する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:18:38 GMT)
Protection of quantum steering ellipsoids in non-Markovian environments [4.8] ほとんどの現実的な環境では、量子系は周囲の環境と必然的に結合し、デコヒーレンスと量子ステアリング楕円体(QSE)の結果として劣化する。
ここでは、各キュービットに別々に結合した局所散逸環境が、QSEによってジオメトリされた操舵特性にどのように影響するかを調べることにより、各パーティのQSEの幾何学が、全キュービット環境系のエネルギースペクトルに有界状態が形成されるか否かに密接に関連していることが分かる。
我々の研究は、オープンシステムにおける量子ステアリングの保護と制御のための調整可能な戦略として量子貯水池工学を確立し、ロバストへの実践的な経路を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:39:50 GMT)
QEMI: A Quantum Software Stacks Testing Framework via Equivalence Modulo Inputs [4.8] 我々は量子ソフトウェアスタックの新しいテスト手法であるQuantum EMIを提案する。
QEMIは、量子制御フロー構造に基づくデッドコードでコードを生成する。
11のクラッシュバグと1つの動作不整合の発見に成功しました。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:26:34 GMT)
TVTSyn: Content-Synchronous Time-Varying Timbre for Streaming Voice Conversion and Anonymization [4.8] リアルタイム音声変換と話者匿名化は、不明瞭さや自然性を犠牲にすることなく因果的、低レイテンシ合成を必要とする。
本稿では、コンテンツ同期、時間変化の音色表現を通じて、個人とコンテンツの時間的粒度を調整可能な音声合成装置を提案する。
結果として得られるシステムは、ストリーム可能なエンドツーエンドで、80msのGPUレイテンシを持つ。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:57:30 GMT)
CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation [4.7] LG-Flow Policyは、連続的な潜在アクション空間でフローマッチングを実行する軌道レベルの模倣学習フレームワークである。
動作シーケンスを時間的に規則化された潜在軌道に符号化し、明示的な潜在空間の流れを学習することにより、提案手法は低レベル制御ノイズからグローバルな運動構造を分離する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:16:20 GMT)
Scalable and Reliable State-Aware Inference of High-Impact N-k Contingencies [4.6] ACパワーフローやACOPFによる全機能停止組合せの排他的評価は日常的な操作では不可能である。
本稿では,高インパクトな$N!-k$の停止シナリオを直接生成するように設計された,スケーラブルでステートアウェアな並行性推論フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:55:59 GMT)
On Emergent Social World Models -- Evidence for Functional Integration of Theory of Mind and Pragmatic Reasoning in Language Models [4.5] 本稿では、LMが一般心の理論(ToM)と言語固有の実践的推論のための共有計算機構を採用できるかどうかを検討する。
ToM能力の7つのサブカテゴリにまたがるLMの性能を,より大規模なローカライザデータセット上で解析する。
厳密な仮説駆動統計テストの結果は、汎関数積分仮説の示唆的な証拠である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:12:12 GMT)
Allure of Craquelure: A Variational-Generative Approach to Crack Detection in Paintings [4.5] 本研究では, き裂検出を逆問題としてモデル化し, 観察された画像を無き裂塗料とき裂成分に分解するハイブリッド手法を提案する。
クラック構造は,マンフォード-シャー型変分関数とそれ以前のクラック構造を併用して取得する。
共同最適化により、絵画のクラック局在のピクセルレベルマップが得られる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:34:53 GMT)
Efficient and deterministic high-dimensional controlled-swap gates on hybrid linear optical systems with high fidelity [4.5] 線形光学のみを用いて制御NOT(CNOT)ゲートと制御スワップ(Fredkin)ゲートを効率よく実装する手法を提案する。
ハイブリッドエンコーディングに基づいて、CNOTとFredkinゲートは、借用された補助光子や測定誘起非線形性なしで決定論的に構築される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:02:18 GMT)
Empirically Understanding the Value of Prediction in Allocation [4.5] 我々は,計画立案者がアロケーション問題に対する原則的回答を形成するのを支援するための経験的ツールキットを開発した。
我々は、他の政策レバーに対する予測に対する投資のボトムラインの福祉効果を定量化する。
我々は,エチオピアにおけるドイツの雇用サービスと貧困ターゲティングに関する実世界のケーススタディに,我々の枠組みを適用した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:17:10 GMT)
Systematic Optimization of Real-Time Diffusion Model Inference on Apple M3 Ultra [4.5] 我々はApple M3 Ultraをターゲットとした10段階の最適化実験を行った。
リアルタイムカメラimg2img変換を22.7FPSで512x512解像度で達成した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:40:45 GMT)
R2RAG-Flood: A reasoning-reinforced training-free retrieval augmentation generation framework for flood damage nowcasting [4.4] R2RAG-Flood は、暴風雨後の被害に対処するためのトレーニング不要な検索拡張生成フレームワークである。
R2RAG-Floodは、関連する推論軌跡を検索し条件付けするコンテキスト拡張プロンプトを発行する。
予測は2段階の手順に従い、まず最初に損傷発生を判定し、3段階の損傷極度分類内で深刻度を補正する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:31:33 GMT)
Learning with Multiple Correct Answers -- A Trichotomy of Regret Bounds under Different Feedback Models [4.4] 本稿では,複数の正解のオンライン学習問題について検討し,各インスタンスが有効なラベルのセットを付与し,各ラウンドにおいて,質問されたサンプルに対して有効なラベルを出力しなければならない。
この設定は言語生成タスクによって動機付けられ、プロンプトは多くの許容可能な完了を認めるが、すべての完了が許容されるわけではない。
我々は,この問題を3つのフィードバックモデルの下で研究し,各モデルに対して,適切な次元を用いて実現可能な設定における最適誤差を特徴付ける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:17:02 GMT)
Detecting Jailbreak Attempts in Clinical Training LLMs Through Automated Linguistic Feature Extraction [4.4] テキストから直接特徴を予測するために、専門家の4つの中核言語的特徴のアノテーションを使用します。
抽出した特徴からジェイルブレイクの可能性を決定するための予測モデル群を評価する。
本研究は、安全クリティカルな臨床対話システムにおいて、ジェイルブレイクの振る舞いを検出するためのスケーラブルで解釈可能なアプローチを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:57:55 GMT)
Tunable many-body burst in isolated quantum systems [4.4] 量子体系の熱化は、その過程は初期状態に依存するため、単調である。
初期状態から低絡みのx2013$aずれを構成する数値計算法を提案する。
衝突が支配的になるまで,この体制では情報のバーストが維持可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:20:44 GMT)
The Catastrophic Failure of The k-Means Algorithm in High Dimensions, and How Hartigan's Algorithm Avoids It [4.3] ロイドのk平均アルゴリズムは高次元高雑音環境において破滅的な故障を示すことを示す。
我々は、ハーディガンのk-平均アルゴリズムがこの病理を示さないことを証明した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:10:59 GMT)
Architectural Foundations for Checkpointing and Restoration in Quantum HPC Systems [4.3] 量子状態のチェックポイントを試みるのではなく、制御フローとアルゴリズム状態問題としてチェックポイントを再定義する。
この設計は、変分固有解法、量子近似最適化、量子シミュレーションや科学計算でよく使われる時間ステッピング法などの反復的および段階的な量子アルゴリズムと自然に一致する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:37:58 GMT)
Understanding Risk and Dependency in AI Chatbot Use from User Discourse [4.2] 本稿では,2023年から2025年にかけての2つのコミュニティ,r/AIDangers と r/ChatbotAddiction から収集したポストを大規模に解析した。
14の反復的主題カテゴリーを同定し、5つの高次経験次元に合成する。
この結果から,実世界のユーザ談話に基礎を置くAI関連心理的リスクの5つの経験的次元が明らかとなった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:16:57 GMT)
DEGMC: Denoising Diffusion Models Based on Riemannian Equivariant Group Morphological Convolutions [4.2] DDPM(Denoising Diffusion Probabilistic Models)における2つの問題に対処する。
より一般的なユークリッド群の同値性と幾何学的アプローチを導入する。
MNIST、RotoMNIST、CIFAR-10データセットの実験結果は、ベースラインDDPMモデルと比較して顕著に改善された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:13:47 GMT)
Accelerating Post-Quantum Cryptography via LLM-Driven Hardware-Software Co-Design [4.1] 量子後暗号(PQC)は、出現する量子脅威に対するデータ保護に不可欠である。
LLMは、PQCアルゴリズムのFPGAアクセラレータ設計を自動化することで、設計の労力と開発時間を最小化することができる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:56:08 GMT)
ArtisanGS: Interactive Tools for Gaussian Splat Selection with AI and Human in the Loop [4.1] 本稿では,多彩なガウススプラッター選択とセグメンテーションを中心に,インタラクティブなツールスイートを紹介する。
ユーザガイド付き2D選択マスクを3DGS選択に伝達する高速AI駆動方式を提案する。
これによりユーザは、構造化されていない3DGSシーンの事実上のバイナリセグメンテーションを達成できる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:00:03 GMT)
ViMultiChoice: Toward a Method That Gives Explanation for Multiple-Choice Reading Comprehension in Vietnamese [4.0] MCRC(Multiple-choice Reading)モデルは、与えられた質問に対する候補オプションのセットから正しい回答を選択することを目的としている。
本稿では,説明生成機能を備えたMCRCモデルの訓練と評価を目的としたベトナムの新たなデータセットを提案する。
ベトナム語読解をモデル化するための新しい手法であるViMultiChoiceを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:48:07 GMT)
Rashomon Sets and Model Multiplicity in Federated Learning [4.0] 我々は、フェデレートラーニング(FL)におけるラショモン集合の最初の形式化を提供する。
FLのプライバシー制約の下で、標準的な多重度メトリクスをどのように推定できるかを示す。
提案した3つのRashomon集合定義はいずれも有意義な洞察を与えることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:25:35 GMT)
Fully Differentiable Bidirectional Dual-Task Synergistic Learning for Semi-Supervised 3D Medical Image Segmentation [4.0] 半教師付き学習は、ラベルなしデータを活用することにより、画像セグメンテーションのための大きなピクセル単位のラベル付きデータセットの必要性を緩和する。
我々は,4つの重要なSSLコンポーネントをシームレスに統合し,拡張する,完全に微分可能な双方向シナジスティックラーニング(DBiSL)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:44:24 GMT)
SPEED-Bench: A Unified and Diverse Benchmark for Speculative Decoding [3.9] 投機的復号化(SD)は,Large Language Model(LLM)推論を高速化する重要な手法として登場した。
以前のベンチマークでは、タスクの多様性の制限、スループット指向の評価の不十分なサポート、プロダクション環境を反映できないハイレベルな実装への依存に悩まされていた。
SPEED-Benchは多種多様な意味領域と現実的なサービス体制をまたいだSD評価を標準化するために設計された総合的なスイートである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:19:56 GMT)
Unbalanced optimal transport for robust longitudinal lesion evolution with registration-aware and appearance-guided priors [3.9] 不平等な病変を許容し,患者の腫瘍レベルの変化に先行して適応する登録対応整形器を提案する。
縦断的CTでは, エッジ検出精度とリコールが一貫して向上し, 病変状態のリコールが改善し, F1スコアが良好であった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:06:57 GMT)
Trade-Offs in Deploying Legal AI: Insights from a Public Opinion Study to Guide AI Risk Management [3.8] ジェネレーティブAIツールは、法的タスクにますます使われています。
EUはいくつかのユースケースの市場導入前にリスクアセスメントと監査を義務付けている。
その他のユースケースは、AI Actsのハイリスクな分類に該当しない。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:32:40 GMT)
Look-Ahead and Look-Back Flows: Training-Free Image Generation with Trajectory Smoothing [3.8] 流速場調整による画像生成を改善するため, 各種トレーニングフリーなフローマッチング手法が開発されている。
本研究では, 曲率ゲートウェイトを用いて, 電流および次ステップの潜伏を平均化するemphLook-Aheadと, 指数移動平均を用いて潜伏を滑らかにするemphLook-Backの2つの学習自由軌道平滑化手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:34:47 GMT)
Clarifying Shampoo: Adapting Spectral Descent to Stochasticity and the Parameter Trajectory [3.7] ShampooとMuonは、AdamやSignumのような要素ワイドアルゴリズムよりもデータ効率が高い。
ShampooはMuonよりも高いトークン効率を実現しており、AdamのSignumに対する優位性を反映している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:19:40 GMT)
Operationalizing Human Values in the Requirements Engineering Process of Ethics-Aware Autonomous Systems [3.5] 倫理に配慮した自律システムのための要求工学的アプローチを提案する。
人間の価値を規範的な目標として捉え、機能的および適応的な目標と整合させます。
本稿では,医療用ボディセンサネットワークのケーススタディを通じて,アプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:54:25 GMT)
QRS: A Rule-Synthesizing Neuro-Symbolic Triad for Autonomous Vulnerability Discovery [3.5] 我々はQRS(Query, Review, Sanitize)という,このパラダイムを逆転するニューロシンボリックなフレームワークを紹介します。
静的ルールから結果をフィルタリングする代わりに、QRSは構造化スキーマ定義といくつかの例からCodeQLクエリを生成する3つの自律エージェントを使用して、セマンティック推論と自動エクスプロイト合成を通じて検証する。
人気のPyPIライブラリの20の歴史的CVEでは、QRS 90.6%の精度が検出された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:35:24 GMT)
AmharicIR+Instr: A Two-Dataset Resource for Neural Retrieval and Instruction Tuning [3.5] ニューラルネットワークと命令追従型テキスト生成の研究を支援する2つのデータセットをリリースする。
検索ランクデータセットは、クエリ正負の文書三つ子を手作業で検証する1,091を含む。
命令プロンプト応答データセットは、複数のドメインと命令タイプにまたがる6,285個のAmharicプロンプト応答ペアからなる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:45:20 GMT)
Single-Slice-to-3D Reconstruction in Medical Imaging and Natural Objects: A Comparative Benchmark with SAM 3D [3.5] 本稿では,5つの最先端画像-3Dモデルに対して,単一スライス医療画像-3D再構成のベンチマークを示す。
本研究は, 単一スライス医療再建の限界を定量化し, 2次元医療データの平面的性質による深度あいまいさを強調した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:47:27 GMT)
SCA-Net: Spatial-Contextual Aggregation Network for Enhanced Small Building and Road Change Detection [3.4] 本稿では,両時間画像の正確な構築と道路変更検出のために,Change-Agentフレームワーク上に構築された拡張アーキテクチャであるSCA-Netを提案する。
本モデルでは, マルチスケール変更分析のための新しい差分ピラミッドブロック, 形状認識と高分解能拡張ブロックを組み合わせた適応型マルチスケール処理モジュール, 共同処理のための多レベルアテンション機構(PPM, CSAGate)を取り入れた。
LEVIR-CDとLEVIR-MCIデータセットの総合評価は、SCA-NetがChange-Agentや他の状態よりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:38:24 GMT)
Resilient Class-Incremental Learning: on the Interplay of Drifting, Unlabelled and Imbalanced Data Streams [3.4] 本稿では,これらの課題に対処するためのSCIL(Streaming Class-Incremental Learning)を提案する。
このフレームワークは、マルチクラスの予測のための多層パーセプトロンと自動エンコーダ(AE)を統合し、予測と新しいクラス検出にデュアルロス戦略(分類と再構築)を使用し、オンライントレーニングに修正済みの擬似ラベルを採用し、キューでクラスを管理し、不均衡を処理するためにオーバーサンプリングを適用する。
以上の結果から,SCILは強いベースラインや最先端手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:37:39 GMT)
AI-Assisted Scientific Assessment: A Case Study on Climate Change [3.4] 我々は、協調的な科学的評価を支援するように設計されたジェミニベースのAI環境を評価する。
我々は、大西洋平均転回循環(AMOC)の安定性という、複雑なトピックでシステムをテストした。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:26:58 GMT)
Self-Supervised Learning as Discrete Communication [3.3] ほとんどの自己教師付き学習(SSL)メソッドは、同じ入力の異なるビューを整列させることで、連続的な視覚表現を学習する。
我々は,教師と学生ネットワーク間の個別のコミュニケーションプロセスとして,視覚的自己教師型学習の枠組みを定めている。
プロジェクションヘッドの周期的再起動は、予測的のままの埋め込みを促進することによって、この効果を高めることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:24:06 GMT)
Timing and Memory Telemetry on GPUs for AI Governance [3.3] 本稿では,計算活動と相関する時間とメモリベースの観測値を生成する計測フレームワークを提案する。
これらのプリミティブは、信頼できるファームウェア、エンクレーブ、ベンダーが管理するカウンタなしでも観測可能なGPUエンゲージメントの統計的および行動的指標を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:20:06 GMT)
Beyond Uniform Credit: Causal Credit Assignment for Policy Optimization [3.3] ポリシー勾配法は、全ての生成されたトークンに均一なクレジットを割り当てる。
本稿では,マスク推論,解答確率の低下,それに伴うアップウェイトトークンの重み付けを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:57:02 GMT)
Comp2Comp: Open-Source Software with FDA-Cleared Artificial Intelligence Algorithms for Computed Tomography Image Analysis [3.2] FDA-510(k)-cleared Deep Learning Pipelinesをオープンソース化した最初の2つのディープラーニングパイプラインの開発と検証について報告する。
これらのアルゴリズムをオープンソース化することで、通常不透明なFDAクリアランスプロセスの透明性が向上する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:30:40 GMT)
Diverse Skill Discovery for Quadruped Robots via Unsupervised Learning [2.9] 教師なしのスキル発見は、本質的なモチベーションによって引き起こされる有用なスキルの多様なレパートリーを学ぶことによって、負担を軽減する可能性がある。
オーソゴナル・ミックス・オブ・エキスパートアーキテクチャを導入し、多様な振る舞いが重なり合う表現に衝突することを防ぐ。
また、異なる識別器が異なる観測空間で動作し、報酬ハッキングを効果的に軽減する多識別器フレームワークを設計する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:28:13 GMT)
From Lightweight CNNs to SpikeNets: Benchmarking Accuracy-Energy Tradeoffs with Pruned Spiking SqueezeNet [2.9] 進化型ニューラルネットワーク(CNN)のエネルギー効率の代替としてスパイキングニューラルネットワーク(SNN)が研究されている。
小型CNNアーキテクチャをスパイクネットワークに変換することで得られた軽量SNNの最初の体系的ベンチマークを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:20:11 GMT)
AgentCgroup: Understanding and Controlling OS Resources of AI Agents [2.8] AIエージェントは、サンドボックスコンテナ内でさまざまなツールコールを実行するマルチテナントクラウド環境にますますデプロイされている。
サンドボックス型AI符号化エージェントにおけるOSレベルの資源動態の系統的特徴について述べる。
予備評価は, マルチテナント分離の改善と資源廃棄物の削減を実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:37:42 GMT)
Quantum Integrated Sensing and Computation with Indefinite Causal Order [2.7] 両タスクで同じ量子状態を使用する統合センシングと計算の手法を提案する。
提案手法は,磁気ナビゲーションにおける代表的タスクにおいて,小さなトレーニングとテストの損失を達成可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:16:20 GMT)
Adaptive Physics Transformer with Fused Global-Local Attention for Subsurface Energy Systems [2.7] textbfAdaptive Physics Transformer (APT)
APTは、幾何学的、メッシュ的、物理的に依存しないニューラル演算子である。
適応メッシュ精錬シミュレーションから直接学習する最初のアーキテクチャ。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:48:58 GMT)
Towards an OSF-based Registered Report Template for Software Engineering Controlled Experiments [2.7] 登録報告書(RR)は、これらの問題に対処するためにESEコミュニティで議論されている。
RRは、実行前に研究の仮説、方法、および/または分析を登録する。
これは、p-hacking、パブリッシュバイアス、不適切なポストホック分析などの問題的なプラクティスを軽減するのに役立つ。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:21:23 GMT)
ExO-PPO: an Extended Off-policy Proximal Policy Optimization Algorithm [2.7] より効率的な非政治データ利用による保守的オン・ポリティクス反復の安定性保証に基づく新しいPPO変種を提案する。
PPOと他の最先端の変種と比較して、バランスの取れたサンプル効率と各種タスクの安定性により、ExO-PPOの性能が向上することを示した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:29:57 GMT)
Linear Model Extraction via Factual and Counterfactual Queries [2.6] モデル抽出攻撃では、ブラックボックス機械学習モデルのパラメータを明らかにすることが目的である。
線形モデルと3種類のクエリについて検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:57:53 GMT)
QSolver: A Quantum Constraint Solver [2.6] 第1の量子制約解法であるQrを提示する。
Qrは5種類の量子制約を扱うための構造化フレームワークを提供する。
量子状態を検証するための自動アサーション生成モジュールが組み込まれている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:42:32 GMT)
karl. - A Research Vehicle for Automated and Connected Driving [2.6] 私たちは、自動運転とコネクテッドドライブのための新しい研究車両Karl.を紹介します。
大企業とは別に、世界中でL4対応の研究車両にアクセスできる機関は少ない。
本稿は、Karl.をフレキシブルで強力な研究プラットフォームにする上での、推論、設計選択、技術的な詳細を共有することによって、そのギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:50:04 GMT)
Causal Identification in Multi-Task Demand Learning with Confounding [2.6] 価格とタスク構造に任意の依存があるにもかかわらず因果同定を実現する新しい推定フレームワークを提案する。
我々の結果は、運用環境に因果的、データ駆動型価格モデルを展開するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:58:50 GMT)
Hidden Kinematics and Dual Quantum References in Magnetic Resonance [2.6] 回転磁場中のスピンは、共通の量子化演算子を共有する2つの量子記述を含む構成を構成するが、運動学的および力学的な役割が異なることを示す。
この枠組みは、一貫したエネルギー会計を復元し、回転磁場におけるスピンダイナミクスの基礎となる二重参照構造を明らかにする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:14:07 GMT)
Human Control Is the Anchor, Not the Answer: Early Divergence of Oversight in Agentic AI Communities [2.5] エージェントAIの監視は、しばしば単一の目標("ヒューマンコントロール")として議論されるが、早期採用はロール固有の期待をもたらす可能性がある。
r/OpenClaw(デプロイと運用)とr/Moltbook(エージェント中心のソーシャルインタラクション)の2つの社会技術的役割を反映したRedditコミュニティの比較分析を行った。
r/OpenClawは、実行ガードレールとリカバリ(アクションリスク)を強調し、r/Moltbookは、公共の相互作用におけるアイデンティティ、正当性、説明責任を強調している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:10:20 GMT)
CAPID: Context-Aware PII Detection for Question-Answering Systems [2.5] CAPIDは、ローカルに所有する小型言語モデル(SLM)を微調整し、QAのためにLLMに渡される前に機密情報をフィルタリングする実践的手法である。
既存のデータセットは、そのようなモデルを効果的に訓練するために必要なPIIの文脈依存の関連性を捉えていない。
実験の結果,細調整SLMを用いたPII検出は,既存のベースラインのスパン,関連性,型精度を大きく上回ることがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:41:31 GMT)
Physics-informed diffusion models in spectral space [2.5] 本稿では,生成潜在拡散モデルと物理インフォームド機械学習を組み合わせた手法を提案する。
我々は、スケールされたスペクトル表現の潜在空間における拡散過程を通じて、PDEパラメータと解の合同分布を学習する。
提案したPoisson, Helmholtz, and incompressible Navier--Stokes 方程式に対するアプローチを評価し,精度と計算効率を向上した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:11:07 GMT)
XSPLAIN: XAI-enabling Splat-based Prototype Learning for Attribute-aware INterpretability [2.5] 3DGSは急速に高忠実度3D再構築の標準となっているが、その採用は解釈可能性の欠如によって妨げられている。
3DGS分類に特化して設計された最初のアンテホックなプロトタイプベースの解釈可能性フレームワークであるXSPLAINを紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:35:42 GMT)
Dissipative phase transitions of the Dicke-Ising model [2.5] 開放横方向および縦方向Dicke-Isingモデル(DIM)における散逸相転移について検討する。
以上の結果から,スピン相互作用,光-物質結合,散逸の相互作用は,非平衡相転移の多種多様な集合を支えていることが明らかとなった。
これらの発見は、現実的なオープンな固体量子系における非平衡物理学の理論的基礎を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:44:02 GMT)
Flash-SD-KDE: Accelerating SD-KDE with Tensor Cores [2.4] SD-KDEを再順序付けして行列乗算構造を公開することで、CoresをGPU実装の高速化に利用できることを示す。
131kクエリで評価された1Mサンプル16次元タスクにおいて、Flash-SD-KDEは1つのGPU上で$ sで完了する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:56:03 GMT)
Decomposing Reasoning Efficiency in Large Language Models [2.4] 我々はトークン効率を、固定されたトークン予算の下での完了、与えられた完了条件の正確性、冗長性といった、解釈可能な要因に分解する。
推論トレースが利用可能であれば、冗長だが拡張された推論からループを分離するために決定論的トレース品質尺度を追加します。
我々の分解は、異なる効率の介入を示唆する異なるボトルネックプロファイルを明らかにします。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:09:18 GMT)
How Far Can You Grow? Characterizing the Extrapolation Frontier of Graph Generative Models for Materials Science [2.4] RADIIは75,000ドルのナノ粒子のベンチマークで、連続的なスケーリングノブとして、トレース生成の品質を扱います。
RADIIはフロンティア固有の診断を提供する: ラジウス毎のエラープロファイルは、各アーキテクチャのスケーリング天井をピンポイントし、エラーが境界から発生したか、あるいはバルクで発生したかの表面分解テストを行い、クロスメトリックな障害シークエンシングは、構造的忠実性のどの側面が最初に壊れるかを明らかにする。
これらの結果は、幾何生成モデルの第一級評価軸として出力スケールを確立した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:59:13 GMT)
Trustworthy Agentic AI Requires Deterministic Architectural Boundaries [2.4] 現在のエージェントAIアーキテクチャは、高度な科学領域のセキュリティと要求と根本的に相容れない。
3つのメカニズムを通じてセキュリティを強制するトリニティ・ディフェンス・アーキテクチャを導入する。
疑わしい証明と決定論的調停がなければ、Lethal Trifecta'(信頼できない入力、特権データアクセス、外部アクション能力)は、認証セキュリティをエクスプロイト発見の問題にします。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:33:40 GMT)
Actions Speak Louder Than Chats: Investigating AI Chatbot Age Gating [2.4] 一般消費者のチャットボットが、会話のみに基づいて、ユーザの年齢を推定できるかどうかを検討する。
チャットボットは年齢を推定できるが、子どもが特定された場合、いかなる行動も取らないことがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:55:55 GMT)
Sim2Radar: Toward Bridging the Radar Sim-to-Real Gap with VLM-Guided Scene Reconstruction [2.4] Sim2Radarは、単一ビューのRGBイメージから直接レーダーデータを合成するエンドツーエンドのフレームワークである。
Sim2Radarは、単眼深度推定、セグメンテーション、視覚言語推論を組み合わせることで、素材を意識した3Dシーンを再構築する。
Sim2Radarは、現実世界の屋内シーンで評価され、トランスファーラーニングを通じて下流の3Dレーダー知覚を改善する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:56:47 GMT)
Dissecting Performative Prediction: A Comprehensive Survey [2.3] パフォーマンス予測の分野は、2020年にPerdomoらによる論文"Performative Prediction"で始まった。
我々は、性能予測設定をレイアウトし、性能安定性と性能最適性という、異なる最適化目標を説明する。
本稿では,分布マップの情報量に基づいて,異なる性能予測設定を分類する新しい方法を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:40:01 GMT)
Anyon Permutations in Quantum Double Models through Constant-depth Circuits [2.3] 局所ユニタリ回路は、北エフの量子二重モデルにおける一般的なエノン置換を実現する。
D(G)$量子双対の一般のエノン置換は、1次元の自己双対の3つのクラスの構成に対応する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:59:23 GMT)
Grounding LTL Tasks in Sub-Symbolic RL Environments for Zero-Shot Generalization [2.3] サブシンボリックな環境下で時間的に拡張された指示に従うために強化学習エージェントを訓練する問題に対処する。
提案手法は,真のシンボル接地法に匹敵する性能を実現し,準記号環境における最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:20:29 GMT)
Toward Linking Declined Proposals and Source Code: An Exploratory Study on the Go Repository [2.2] 本稿では、下降したコントリビューションと関連するソースコードのトレーサビリティリンクを確立するための最初の試みを示す。
これは、新しい機能や言語変更の提案に使用されるGitHubの問題です。
その結果, 削減された各提案に対して, 0.836の精度で正しい粒度を選択し, 平均0.643の精度でその粒度で正しいリンクを生成した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:01:13 GMT)
Preventing Barren Plateaus in Continuous Quantum Generative Models [2.2] 変分量子回路(VQC)の分野での最近の発展は、多くのバレンプラトーフリーモデルのトレーニング容易性のための前提条件をシフトしてきた。
本研究では,バレン高原に悩まされず,従来のシミュレーション手法に対して頑健な完全回路モデルを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:17:28 GMT)
Causal Effect Estimation with Learned Instrument Representations [2.2] 本稿では,観測された共変量から楽器表現を構成する表現学習手法を提案する。
ZNetは、因果効果の幅広い下流2段階IV推定器と互換性がある。
このことは、ZNetが一般的な観察設定における因果推論のための Plug-and-play' モジュールとして使用できることを示唆している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:41:11 GMT)
Identifying Evidence-Based Nudges in Biomedical Literature with Large Language Models [2.2] 我々は、非構造化バイオメディカル文献から証拠に基づく行動分類を識別し、抽出するスケーラブルなAI駆動システムを提案する。
栄養は微妙で非強制的な介入であり、選択を制限することなく行動に影響を与える。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:36:07 GMT)
Generative AI Adoption in an Energy Company: Exploring Challenges and Use Cases [2.1] 本研究では、エネルギー企業の従業員がAIの採用についてどのように理解し、AIとLLMをベースとしたエージェント従業員が日々の活動を支援できる領域を特定するかを検討する。
この分析では、報告作業、予測、データハンドリング、メンテナンス関連のタスク、異常検出など、従業員がAIを有用と位置付けている領域を特定した。
この研究は、エネルギーセクターにおけるAI導入の概観を提供し、実践的実装のためのエントリポイントの特定と産業間の比較研究のための構造化された基盤を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:50:26 GMT)
FD-DB: Frequency-Decoupled Dual-Branch Network for Unpaired Synthetic-to-Real Domain Translation [2.1] 周波数分離型2分岐モデルであるFD-DBを提案する。
YCB-Vデータセットの実験により、FD-DBは実際のドメインの外観の整合性を改善し、下流セマンティックセマンティクスの性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:16:53 GMT)
Building a Correct-by-Design Lakehouse. Data Contracts, Versioning, and Transactional Pipelines for Humans and Agents [1.9] Bauplanはコードファーストのレイクハウスで、よく知られた抽象化を使って(ほとんど)違法な状態を表現不能にすることを目的としています。
Bauplanは、パイプラインバウンダリをチェック可能にする型付きテーブルコントラクト、レビューとランタイムのためのGitライクなデータバージョニング、パイプラインレベルのアトミック性を保証するトランザクション実行の3つの軸に沿って機能する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:46:24 GMT)
Discovering High Level Patterns from Simulation Traces [1.9] 本稿では,詳細なシミュレーションログから粗粒度パターンを検出する自然言語ガイド手法を提案する。
具体的には、シミュレーションログを操作するプログラムを合成し、それらを一連の高レベル活性化パターンにマッピングする。
2つの物理ベンチマークを通して、このアノテートされたシミュレーションログの表現は、物理系についての自然言語の推論により適していることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:31:39 GMT)
Would a Large Language Model Pay Extra for a View? Inferring Willingness to Pay from Subjective Choices [1.9] 大規模言語モデル(LLM)は、旅行支援や購入支援といったアプリケーションにますます導入されている。
我々は、選択ジレンマを持つモデルを提示し、それらの応答を解析することにより、旅行支援文脈におけるLCM意思決定について検討する。
提案手法では,より大きなLLMに対して有意なWTP値が導出可能である一方で,属性レベルでの系統的偏差も示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:05:42 GMT)
Error-mitigated quantum state tomography using neural networks [1.9] 教師あり学習を通して未知の雑音を緩和する多層パーセプトロンネットワークに基づくスケーラブルなトモグラフィー手法を提案する。
提案手法は, 雑音を緩和しない場合と比較して, 広範囲のシナリオで効果的にノイズを緩和する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:42:23 GMT)
Hybrid Responsible AI-Stochastic Approach for SLA Compliance in Multivendor 6G Networks [1.8] 本稿では,ネットワーク制御ループに直接公平性,堅牢性,監査性を組み込むハイブリッド型AI確率学習フレームワークを提案する。
RAAPは、AI駆動の意思決定軌跡を継続的に記録し、ユーザレベルのSLAサマリーとオペレータレベルの責任分析を生成する。
合成2クラスマルチグループデータセットの実験的評価により、提案されたハイブリッドモデルは、最悪のグループの精度を最大10.5%向上させることが示された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:45:59 GMT)
A Trainable-Embedding Quantum Physics-Informed Framework for Multi-Species Reaction-Diffusion Systems [1.8] 本研究では, 非線形反応拡散系の文脈において, トレーニング可能な量子物理学インフォームドニューラルネットワーク(TE-QPINN)の埋め込み戦略について検討する。
本稿では,古典的および完全量子埋め込みをサポートする拡張TE-QPINN(x-TE-QPINN)アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:19:12 GMT)
Positive-Unlabelled Active Learning to Curate a Dataset for Orca Resident Interpretation [1.7] この研究は、サザン・レジデント・キラー鯨 (SRKW) の音響データの最大のキュレーションを行っている。
探索は、海洋哺乳類のすべての事例を特定するために、弱く監督された、ポジティブな、活発な学習戦略から成り立っている。
919時間のSRKWデータ、230時間のBiggのオルカデータ、1374時間のエコタイプからのオルカデータ、1501時間のハンプバックデータ、88時間の海ライオンデータ、246時間の白面イルカデータ、そして784時間の海哺乳類データを生成しました。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:25:38 GMT)
Conceptual Cultural Index: A Metric for Cultural Specificity via Relative Generality [1.7] 文レベルでの文化的特異性を推定する概念文化指標(CCI)を提案する。
CCIは、対象文化における一般性推定と、他の文化における平均的一般性推定との違いとして定義される。
バイナリ分離性については、CCIは直接LLMスコアよりも優れており、ターゲット文化に特化したモデルに対して、AUCでは10ポイント以上改善されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 06:29:33 GMT)
Near-optimal entanglement-communication tradeoffs for remote state preparation [1.7] このタスクの一般的な形式は、リモート状態準備(RSP)として知られている。
両状態のRSPの絡み合いコストと通信コストについて, ほぼ一致した下限と上限をP/k$で表す。
我々の境界は混合状態の RSP 上界と下界にほぼ一致する最初のものであり、純粋状態の特別な場合、我々の下界は最もよく知られている下界よりも優れる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:46:41 GMT)
ECG-IMN: Interpretable Mesomorphic Neural Networks for 12-Lead Electrocardiogram Interpretation [1.7] 深層学習は心電図(ECG)の診断において専門家レベルのパフォーマンスを達成したが、これらのモデルの「黒い箱」の性質は臨床展開を妨げている。
本稿では,高分解能12リードECG分類に適した解釈可能なメソモルフィックニューラルネットワークECG-IMNを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:17:29 GMT)
SPECA: Specification-to-Checklist Agentic Auditing for Multi-Implementation Systems -- A Case Study on Ethereum Clients [1.7] SPECAは、標準要件をチェックリストに変換する仕様からChecklistフレームワークである。
SPECAは,11社を対象とし,フサカアップグレードのセキュリティ監査コンテストの会場内でインスタンス化を行う。
我々の改善されたエージェントは、競争監査の基礎的真実に対して評価され、高影響の脆弱性について27.3%の厳格なリコールを達成した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:04:48 GMT)
ENIGMA: EEG-to-Image in 15 Minutes Using Less Than 1% of the Parameters [1.7] ENIGMA(エニグマ)は、多目的脳波(EEG)-画像デコードモデルである。
ENIGMAはよりシンプルなアーキテクチャを持ち、以前のアプローチに必要なトレーニング可能なパラメータの1%未満を必要とする。
隣接領域のfMRI-to- Image研究において標準化された画像再構成指標を用いて,提案手法の評価を行った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:20:51 GMT)
Spinel: A Post-Quantum Signature Scheme Based on SLn(Fp) Hashing [1.7] SL_n(F_p)上の拡張グラフのナビゲートの難しさに根ざしたセキュリティを備えた、量子後デジタル署名スキームSpinelを紹介する。
まず、このハッシュ関数の安全性を実証的に証明し、元の理論的解析を補完する。
次に,提案手法のセキュリティ劣化をモデル化し,解析し,次に議論するパラメータの選択を通知する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:22:01 GMT)
Comparing and correcting robustness metrics for quantum optimal control [1.7] 本稿では,隣接端点とトグリングフレームのアプローチにおける重要な数値的違いを示す,新しい体系的な研究を提案する。
また、広く使われているロバストネスフレーム推定器に臨界離散化補正を導入する。
提案手法は制御と忠実性の制約を一意に処理すると同時に,厳密な最適化をクリーンに分離する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:44:16 GMT)
Learning Under Extreme Data Scarcity: Subject-Level Evaluation of Lightweight CNNs for fMRI-Based Prodromal Parkinsons Detection [1.7] 本研究では、データ不足下での学習を主眼とした機械学習問題として、静止状態fMRIからのプロドロマパーキンソンの検出について検討する。
プロドロマルなパーキンソン病20例,健常なコントロール20例を含む40名の被験者のfMRIデータを用いて,ImageNet-pretrained convolutional neural networkを評価した。
その結果, 画像レベルのスプリットは, トレーニングセットとテストセットの両方に同一対象のスライスを表示できることがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:32:55 GMT)
Going with the Flow: Koopman Behavioral Models as Implicit Planners for Visuo-Motor Dexterity [1.7] 本稿では,一様挙動モデル (UBMs) を紹介する。
Koopman-UBM は UBM の最初のインスタンス化であり、潜在視覚的特徴と固有受容的特徴の結合フローが構造化線形システムによって制御される統一表現を学習する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:20:36 GMT)
Not-in-Perspective: Towards Shielding Google's Perspective API Against Adversarial Negation Attacks [1.7] サイバーいじめは 効果的な オンラインインタラクションの監視と 穏健化の必要性を増大させました
自動毒性検出システムの既存のソリューションは、マシンまたはディープラーニングアルゴリズムに基づいている。
本稿では,既存の機械学習毒性検出システムを取り巻く形式的推論に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:27:28 GMT)
Bladder Vessel Segmentation using a Hybrid Attention-Convolution Framework [1.6] 膀胱がんの監視には、反復的介入による腫瘍部位の追跡が必要であるが、変形可能で中空の膀胱は、向き付けのための安定したランドマークを欠いている。
CNNの前にトランスフォーマーを組み合わせてグローバルな容器トポロジをキャプチャするハイブリッドアテンション・コンボリューションアーキテクチャを導入する。
構造接続を優先するために、Transformerはショートブランチとターミナルブランチを除外した最適化された真実データに基づいて訓練される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:34:17 GMT)
Are More Tokens Rational? Inference-Time Scaling in Language Models as Adaptive Resource Rationality [1.6] 本稿では,変数が与えられた候補変数,入出力試行,事前定義された論理関数をどの変数が決定するかを推定する可変属性タスクを提案する。
どちらのモデルも、複雑さが増加するにつれて、ブルートフォースから分析戦略への移行を示す。
これらの結果から,コストベースの報酬を伴わないモデルでも,タスクの複雑さに応じて推論動作を調整できることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:07:05 GMT)
Towards Explainable Federated Learning: Understanding the Impact of Differential Privacy [1.6] 本稿では,データプライバシの強化と説明可能性を組み合わせた機械学習(ML)モデルの実現を目的とする。
FEXT-DP(Federated Explainable Trees with Differential Privacy)と呼ばれるFLソリューションを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:58:11 GMT)
Continual Learning for non-stationary regression via Memory-Efficient Replay [1.6] オンラインタスクフリー連続回帰のためのプロトタイプベース生成再生フレームワークを提案する。
提案手法は適応的な出力空間の離散化モデルを定義し, 原データを保存することなく, 連続回帰のためのプロトタイプベースの生成再生を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:22:59 GMT)
A benchmark for video-based laparoscopic skill analysis and assessment [1.6] 本稿では,4つの腹腔鏡下トレーニングタスクのステレオビデオ記録1270件からなる腹腔鏡下スキル分析・アセスメントデータセットについて紹介する。
各録音には3つの独立したレーダから集約された構造化されたスキル評価と、タスク固有のエラーの有無を示すバイナリラベルがアノテートされる。
ビデオベースのスキルアセスメントとエラー認識のための既存手法と新規手法のベンチマークを容易にするため、各タスクに予め定義されたデータ分割を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:59:19 GMT)
AnalyticsGPT: An LLM Workflow for Scientometric Question Answering [1.6] AnalyticsGPTは、科学的質問応答のための、直感的で効率的な大規模言語モデル(LLM)ベースのワークフローである。
本稿では,直感的で効率的な大規模言語モデル (LLM) を用いた科学的な質問応答のためのワークフローであるAnalyticsGPTを紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:23:55 GMT)
The Role of Learning in Attacking Intrusion Detection Systems [1.6] 本稿では、強化学習(RL)を用いて訓練された戦略を実装し、MLベースのNIDSを回避する軽量な敵エージェントを提案する。
これらの軽量エージェントによる攻撃は、非常に効果的(最大48.9%の攻撃成功率)であり、非常に高速(攻撃を行うには5.72ms未満)であり、無視できる資源を必要とすることを実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:15:20 GMT)
DIALEVAL: Automated Type-Theoretic Evaluation of LLM Instruction Following [1.6] 本稿では,2つのLLMエージェントを用いた型理論フレームワークであるDIALEVALを紹介し,型付き述語への命令分解を自動化する。
このフレームワークは、自動抽出中に正式な原子性と独立性の制約を強制する。
評価基準は、コンテンツ述語に対する意味的等価性、数値述語に対する正確な精度、経験的に観察された人間の評価パターンを反映する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:21:43 GMT)
Kyrtos: A methodology for automatic deep analysis of graphic charts with curves in technical documents [1.4] 本稿では,技術文書のグラフィック画像における曲線付きチャートの自動認識と解析のためのKyrtos手法を提案する。
認識処理部は、クラスタリングに基づくアプローチを採用して、図示曲線を構成する線分を分離する中間点を認識する。
解析処理部は、抽出した曲線の線分を解析して、方向、傾向等の挙動特徴をキャプチャする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:09:57 GMT)
Controllable and explainable personality sliders for LLMs at inference time [1.4] 連続多次元パーソナリティ制御のためのモジュラーフレームワークを提案する。
我々の重要な革新は、逐次適応ステアリング(SAS)である。これは、先行介入によってシフトした残流上のその後のプローブをトレーニングすることで、ステアリングベクトルを変換する手法である。
我々は,ビッグファイブの性格特性に関する枠組みを検証し,ゴール順守とコヒーレンスの両方において,ナイーブ・ベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:16:59 GMT)
MILE-RefHumEval: A Reference-Free, Multi-Independent LLM Framework for Human-Aligned Evaluation [1.3] MILE-RefHumEvalは,Large Language Models (LLM) を評価するための参照レスフレームワークである。
これは、人間に沿ったスキーマによって導かれる独立に誘導される評価者のアンサンブルを活用し、離散的および連続的なスコアリング判定の両方をサポートする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:10:41 GMT)
Faster-GS: Analyzing and Improving Gaussian Splatting Optimization [1.3] 我々は,従来の3DGS研究から最も効果的で広く適用可能な戦略を統合し,評価する。
Faster-GSは、包括的なベンチマークスイートで評価する、厳格に最適化されたアルゴリズムを提供します。
我々の実験では、Faster-GSは視覚的品質を維持しながら、最大5ドル以上のトレーニングを達成できることを示した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:22:59 GMT)
EchoJEPA: A Latent Predictive Foundation Model for Echocardiography [1.3] 我々は,3K患者の心エコー図を1800万回トレーニングした基礎モデルであるEchoJEPAを提示する。
遅延予測の目的を活用することで、EchoJEPAはスペックルノイズを無視した堅牢な解剖学的表現を学ぶ。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:54:21 GMT)
Surrogate-Guided Quantum Discovery in Black-Box Landscapes with Latent-Quadratic Interaction Embedding Transformers [1.2] 量子誘導型サンプリング器は、構造的多様性と排他的発見を継続的に改善しながら競争力を発揮する。
本手法は, 従来のベースラインの約2倍の構造的尾尾リスクのアウトレイアを復元する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:32:23 GMT)
A Collaborative Safety Shield for Safe and Efficient CAV Lane Changes in Congested On-Ramp Merging [1.2] コネクテッド・アンド・オートマチック・ビークルズ(CAV)にとって、高密度交通における車線変更は重要な課題である
安全で協調的な車線変更を可能にするマルチエージェント安全シールド(MASS)を提案する。
集中型オンランプマージシミュレーションにおけるMASSの評価を行った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:30:09 GMT)
Semantic Waveforms for AI-Native 6G Networks [1.1] 本稿では,AIネイティブな6Gネットワークのためのセマンティック・アウェア・波形設計フレームワークを提案する。
提案手法は,無線伝送信号の制御による劣化を制御し,意味的に重要な内容の保存を可能にする。
OSSDMはスペクトル効率とセマンティック忠実度において従来のOFDM波形より優れる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:55:37 GMT)
Why Do AI Agents Systematically Fail at Cloud Root Cause Analysis? [1.1] 大規模なクラウドシステムの障害は、かなりの財政的損失をもたらします。
大規模言語モデル(LLM)エージェントを活用した根本原因分析(RCA)の自動化
本稿では,LCMをベースとしたRCAエージェントのプロセスレベルの故障解析について述べる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:14:05 GMT)
From We to Me: Theory Informed Narrative Shift with Abductive Reasoning [1.1] 本稿では,社会科学理論と帰納的推論に基づくニューロシンボリックアプローチを提案する。
提案手法は,大規模言語モデルを導くために必要な特定のストーリ要素を抽出するためのルールを自動的に抽出する。
我々はLlama-4とGrok-4の両方向で同様の性能を示し、Deep-seek-R1の競合性能を示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:10:19 GMT)
SARS: A Novel Face and Body Shape and Appearance Aware 3D Reconstruction System extends Morphable Models [1.1] 3DMMは、アイデンティティと表現を基本的なフェイスメッシュと組み合わせて、詳細な3Dモデルを作成する。
3次元Morphableモデルの可変性は、多様なパラメータをチューニングすることによって制御できる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:52:30 GMT)
Maastricht University at AMIYA: Adapting LLMs for Dialectal Arabic using Fine-tuning and MBR Decoding [1.1] 大規模言語モデル(LLM)はますます多言語化され、数百の言語をサポートしている。
残念なことに、Dialectのバリエーションは、限られたデータと言語的なバリエーションのために、まだ不足している。
本研究では,事前学習したLLMを適用し,方言のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:02:34 GMT)
Learning Self-Interpretation from Interpretability Artifacts: Training Lightweight Adapters on Vector-Label Pairs [1.0] 自己解釈法は言語モデルに自身の内部状態を記述するよう促す。
本報告では,LMを完全に凍結する一方で,軽量アダプタの操作性を向上させることで,信頼性の高い自己解釈が得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:50:02 GMT)
Characterizing and Predicting Wildfire Evacuation Behavior: A Dual-Stage ML Approach [0.9] 本研究では、教師なしおよび教師なしの機械学習手法を統合し、潜伏行動型を解明し、主要な避難結果を予測する。
本研究は,カリフォルニア州,コロラド州,オレゴン州の住民を対象とした大規模MTurkサーベイを用いて,機械学習手法を統合し,潜伏した行動型を解明し,主要な避難結果を予測する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:34:16 GMT)
Drug Release Modeling using Physics-Informed Neural Networks [0.8] 物理インフォームドニューラルネットワーク(PINN)とベイズ型PINN(BPINN)を用いた新しいアプローチを提案する。
物理法則と実験データを組み合わせることにより,提案手法は短時間測定から高精度な長期リリース予測を導出する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:51:50 GMT)
Weakly Supervised Contrastive Learning for Histopathology Patch Embeddings [0.8] 弱教師付きコントラスト学習(WeakSupCon)と呼ばれる特徴表現学習フレームワークを提案する。
提案手法は, インスタンスレベルの擬似ラベル付けに依存しないが, 特徴空間内の異なるラベルのパッチを効果的に分離する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:17:11 GMT)
A Goal-Oriented Chatbot for Engaging the Elderly Through Family Photo Conversations [0.8] 高齢者を対象としたパーソナライズされたボットを提案する。
これは家族写真に基づく議論を開始し、ユーザーが自然に対話するように促す。
認知機能を刺激するためにWの質問を生成し、続いてポジティブな思い出を促進するためのオープンエンドの質問を生成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:54:32 GMT)
The Hidden Costs of Domain Fine-Tuning: Pii-Bearing Data Degrades Safety and Increases Leakage [0.8] ドメインファインチューニング(Domain fine-tuning)は、小さな命令チューニング言語モデルをカスタマーサポートアシスタントとしてデプロイする一般的な方法である。
本研究では,8Bパラメータまでのオープンソースのチャットモデルにおいて,微調整による構成の安全性とドメイン外動作について検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:17:52 GMT)
Where Are We At with Automatic Speech Recognition for the Bambara Language? [0.7] 本稿では,バンバラ語における音声認識(ASR)の評価のための最初の標準ベンチマークを提案する。
このベンチマークは、Bambaraで訓練されたシステムから大規模商用モデルまで、37のモデルの評価に使用された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:44:51 GMT)
Contrastive explanations of BDI agents [0.7] 我々は、反トラスト的な質問に答えられるように、以前の作業を拡張します。
計算的評価は、対照的な質問を用いた場合、説明の長さが大幅に減少することを示している。
このような対照的な回答が望ましいかどうかを評価するために,人間の被験者評価を行った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:12:18 GMT)
Effectiveness of Binary Autoencoders for QUBO-Based Optimization Problems [0.7] ブラックボックス最適化では、客観的評価は高価であるため、高品質なソリューションは限られた予算の下で見つける必要がある。
最近の研究は、FMQAとバイナリオートエンコーダを組み合わせて、実現可能なソリューションからコンパクトなバイナリ潜在コードを学ぶ。
また,BAEは,同様の圧縮で手作業で設計したエンコーディングに比べて,ツアー距離と潜伏するハミング距離との整合性が良好であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:59:29 GMT)
A Collision-Free Sway Damping Model Predictive Controller for Safe and Reactive Forestry Crane Navigation [0.7] 森林クレーンにおける衝突のないスウェイ減衰モデル予測制御器(MPC)について述べる。
提案手法は,オンラインユークリッド距離場(EDF)を用いて,LiDARに基づく環境マッピングを直接MPCに統合する。
制御器は、ペイロードスウェイを減衰させながら衝突制約を同時に実施し、(i)準静環境変化を再現し、(ii)外乱下での衝突のない動作を維持し、(iii)バイパスが存在しない場合に安全に停止する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:58:25 GMT)
High-performance source of indistinguishable polarization-entangled photons with a local oscillator reference for quantum networking [0.6] 偏光絡み合った光子の自由空間、コンパクト、識別不能な対の源を実証する。
このソースは、$(99.11 pm 0.01)%$分極絡みの可視性、$(96.3 pm 0.6)%$次光子Hong-Ou-Mandel干渉可視性を達成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:46:54 GMT)
From Classical to Topological Neural Networks Under Uncertainty [0.6] この章では、ニューラルネットワーク、トポロジカルデータ分析、およびトポロジカルディープラーニング技術について、軍事領域における人工知能の可能性の最大化について論じる。
我々は,画像,ビデオ,音声,時系列認識,不正検出,リンク予測など,グラフィカルデータにまたがる実用的応用を強調した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:21:04 GMT)
Modeling Programming Skills with Source Code Embeddings for Context-aware Exercise Recommendation [0.6] 本稿では,学生が提出したソースコードの埋め込みを用いて,学生のプログラミングスキルをモデル化するコンテキスト認識レコメンデータシステムを提案する。
これらの埋め込みは、複数のプログラミングトピックにまたがる生徒のスキルを予測する。
大学における入門プログラミングコースにおいて,学生の実際のデータと演習を用いて,我々のアプローチを評価した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:51:48 GMT)
Stability and Concentration in Nonlinear Inverse Problems with Block-Structured Parameters: Lipschitz Geometry, Identifiability, and an Application to Gaussian Splatting [0.6] ブロック構造パラメータを持つ非線形逆問題における安定度と統計的集中度に関する演算子理論の枠組みを開発する。
全体として、この分析は、現代の画像と微分可能レンダリングで生じる幅広い高次元非線形逆問題に対する演算子レベル限界を特徴づける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:11:06 GMT)
Digital Linguistic Bias in Spanish: Evidence from Lexical Variation in LLMs [0.5] 本研究では,Large Language Models (LLMs) がスペイン語の地理的語彙変化をどの程度捉えているかを検討する。
LLMを仮想情報量として扱うことで、2つの調査スタイルの質問形式を用いて弁証的知識を探索する。
スペイン語圏21カ国で900以上の語彙項目を対象とし,国と方言圏の双方で実施した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:42:22 GMT)
Fully-automated sleep staging: multicenter validation of a generalizable deep neural network for Parkinson's disease and isolated REM sleep behavior disorder [0.5] 睡眠行動障害(iRBD)はパーキンソン病(PD)の指標である
ディープニューラルネットワークであるU-SleepをPDおよびIRBDの一般的な睡眠段階に適用した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:00:13 GMT)
Spatio-Temporal Attention for Consistent Video Semantic Segmentation in Automated Driving [0.5] マルチフレームコンテキストを組み込むためにトランスフォーマーアテンションブロックを拡張したApatio S-Temporal Attention (STA) 機構を提案する。
提案手法は,計算効率を保ちながら,プロセス時間的特徴系列に標準的自己アテンションを付加する。
CityscapesとBDD100kデータセットに関する包括的な評価は、時間的一貫性のメトリクスにおいて、9.20ポイントの大幅な改善を示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:18:37 GMT)
GeoFormer: A Swin Transformer-Based Framework for Scene-Level Building Height and Footprint Estimation from Sentinel Imagery [0.4] GeoFormerは、Sentinel-1/2画像とオープンDEMデータのみを使用して、100mグリッド上の高さとフットプリントを推定する。
54以上の多様な都市で評価され、GeoFormerは3.19mのBH RMSEと0.05のBF RMSEを達成し、最強のCNNベースラインよりも7.5%と15.3%改善している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:04:53 GMT)
Quantum Correlation Dynamics Subjected to Quantum Reset-Driven Environment [0.4] 環境として機能する横場イジング鎖と相互作用する2つの中心量子ビットについて検討する。
環境は量子臨界点(QCP)を越えて線形に駆動され、進化の過程では、量子リセット(QR)を受ける。
このようなQRは、量子ビット間の絡み合いや量子不協和のダイナミクスをどのように修飾するかを考察する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:52:29 GMT)
PiTPM: Partially Interactive Signatures for Multi-Device TPM Operations [0.4] 本稿では、Schnorrのデジタル署名に基づいて構築されたアグリゲータフレームワークであるPiTPMについて述べる。
本プロトコルは,ハイブリッド信頼アーキテクチャを用いた対話的要求を解消する。
結果は、TPMベースの暗号システム設計におけるパラダイムシフトの可能性を示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:09:05 GMT)
Accelerating Classical and Quantum Tensor PCA [0.4] 我々は、古典的アルゴリズムと量子的アルゴリズムの両方を加速させる方法を示し、同じクォート的分離を維持する。
これらのスピードアップは、リカバリではなく、検出のためにのみ証明するが、我々のアルゴリズムはリカバリも達成できるという強い妥当性の議論を与える。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:35:30 GMT)
WristMIR: Coarse-to-Fine Region-Aware Retrieval of Pediatric Wrist Radiographs with Radiology Report-Driven Learning [0.4] WristMIRは、地域対応の小児手首画像検索フレームワークである。
手動のイメージレベルのアノテーションなしで、きめ細かい、臨床的に意味のある画像表現を学習する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:05:17 GMT)
How much technical talent is there? A systematic estimate of the ML research pool among 3 million consultants [0.4] 2121の組織をスクリーニングし、幅広いMLコンサルティングを提供する403の組織を見つけました。
これらの組織全体での'非常に技術的'なML研究才能の50パーセントは、1121でした。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:25:06 GMT)
Behavioral Economics of AI: LLM Biases and Corrections [0.4] 大規模言語AIモデル(LLM)は、経済と財政の判断において体系的な行動バイアスを示す。
嗜好に基づくタスクでは、モデルがより進歩するにつれて、応答はより人間らしくなる。
信念に基づくタスクでは、高度な大規模モデルはしばしば有理応答を生成する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:10:48 GMT)
Image Quality in the Era of Artificial Intelligence [0.4] このコミュニケーションの目的は、AIが放射線画像の再構成や拡張に使用されるときの限界に注意を向けることである。
このコミュニケーションの目的は、リスクを最小限にしつつ、ユーザーがテクノロジーの利点を享受できるようにすることである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 02:52:13 GMT)
Puda: Private User Dataset Agent for User-Sovereign and Privacy-Preserving Personalized AI [0.4] Pudaは、サービス間でデータを集約し、クライアント側管理を可能にする、ユーザソブリンアーキテクチャである。
Pudaでは,データの共有を3つのプライバシレベル – (i)詳細なブラウジング履歴, (ii)抽出キーワード, (iii)定義済みカテゴリサブセット –でコントロールすることができる。
以上の結果から,プライバシ・パーソナライゼーションのトレードオフを軽減するための実践的な選択肢として,効果的に多粒度管理を可能にすることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:00:53 GMT)
Compressing Quantum Fisher Information [0.4] 純量子状態の族に符号化された任意の位相パラメータに関する量子フィッシャー情報は、忠実に1つの量子ビットに圧縮できることを示す。
位相がブロッホ球の赤道上のキュービット状態の多くの同一のコピーに符号化されると、圧縮が順次実施可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:08:24 GMT)
Unsupervised Cross-Lingual Part-of-Speech Tagging with Monolingual Corpora Only [0.3] 本稿では,モノリンガルコーパスのみに依存する完全教師なしクロスランガル・パート・オブ・音声(POS)タグ付けフレームワークを提案する。
我々は28言語対の枠組みを評価し、4つのソース言語(英語、ドイツ語、スペイン語、フランス語)と7つのターゲット言語(アフリカ語、バスク語、フィニス語、インドネシア語、リトアニア語、ポルトガル語、トルコ語)をカバーしている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:13:52 GMT)
Effective vocabulary expanding of multilingual language models for extremely low-resource languages [0.3] 対象言語コーパスを用いてモデルの語彙を拡張する。
我々は、原語の表現に偏った、モデルの本来の語彙のサブセットをスクリーニングする。
これらの拡張語彙の表現に基づいて,ターゲット言語コーパスを用いてmPLMの事前学習を継続する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:57:07 GMT)
Sample- and Hardware-Efficient Fidelity Estimation by Stripping Phase-Dominated Magic [0.3] 本研究は、実現可能な量子デバイスで手頃な価格のサンプルおよびゲート効率の高い忠実度推定アルゴリズムを提案する。
サンプル効率のよいDFEが強い絡み合いと魔法によって制限される位相状態の構造に近い純状態による忠実度推定は、$mathcalO(mathrmpoly(n))$ サンプリングコピーを使用することで、単一の$n$-qubit ファンアウトゲートで可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:13:25 GMT)
AfriNLLB: Efficient Translation Models for African Languages [0.3] AfriNLLBはスワヒリ語、ハウサ語、ヨルバ語、アムハラ語、ソマリ語、ズールー語、リンガラ語、アフリカーン語、ウルフ語、アラビア語を含む15の言語ペア(30の翻訳方向)をサポートしている。
私たちのトレーニングデータは、英語と13の言語、およびフランス語と2つの言語(リンガラ語とウーロフ語)間の双方向翻訳をカバーしています。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:23:59 GMT)
Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement [0.2] 事前訓練された大言語モデル(LLMs)は、幻覚として知られる事実的不正確なテキストを生成する傾向にある。
本研究では,中間層でこれらの信号を聴くことによって,推論時に幻覚を緩和する,新しい学習自由復号アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:32:37 GMT)
Understanding Image2Video Domain Shift in Food Segmentation: An Instance-level Analysis on Apples [0.2] 食品モニタリングやインスタンスカウントといった現実世界のアプリケーションでは、セグメンテーションのアウトプットは時間的に一貫性を持っていなければならない。
本研究は,リンゴを代表的な食品カテゴリーとする事例分割と追跡の視点を通して,この失敗を分析した。
その結果,フレーム単位のセグメンテーション精度は時間とともに安定したインスタンス識別に変換されないことがわかった。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:17:02 GMT)
Situation Graph Prediction: Structured Perspective Inference for User Modeling [0.2] 状況グラフ予測は、視点モデリングを逆推論問題としてフレーム化するタスクである。
実際のラベルを使わずに接地を可能にするために,構造第一合成生成戦略を用いる。
その結果、SGPは非コンテキストであり、構造優先のデータ合成戦略の証拠となることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:58:15 GMT)
Stop Testing Attacks, Start Diagnosing Defenses: The Four-Checkpoint Framework Reveals Where LLM Safety Breaks [0.2] 大きな言語モデル(LLM)は有害な出力を防ぐための安全メカニズムを配置するが、これらの防御は敵のプロンプトに弱いままである。
textbfFour-Checkpoint Frameworkを導入し、処理ステージ(インプット対出力)と検出レベル(リテラル対インテント)の2次元に沿って安全メカニズムを整理する。
GPT-5, Claude Sonnet 4, Gemini 2.5 Proを3,312個の単ターンブラックボックステストケースで評価した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:17:25 GMT)
EVA: Towards a universal model of the immune system [0.2] 免疫学と炎症の多モード基盤モデルとして,最初のクロス種EVAを紹介した。
EVAは、種、プラットフォーム、解像度のトランスクリプトミクスデータを調和させ、組織データを統合してリッチで統一された患者表現を生成する。
薬物開発パイプラインにまたがる39のタスクの総合的な評価スイートを紹介する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:51:09 GMT)
Knowledge-guided generative surrogate modeling for high-dimensional design optimization under scarce data [0.2] RBF-Genは知識誘導型の代理モデリングフレームワークで、不足するデータとドメイン知識を組み合わせたものです。
RBF-Genは,データスカース設定における1次元および2次元構造最適化問題に対して,標準RBFサロゲートよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:47:17 GMT)
Robust Vision Systems for Connected and Autonomous Vehicles: Security Challenges and Attack Vectors [0.2] 本稿では、コネクテッド・アンド・オートマチック・ビークル(CAV)における視覚システムの堅牢性について検討する。
我々は、CAVナビゲーションに必要なキーセンサーとビジョンコンポーネントを分析し、CAVビジョンシステム(CAVVS)の参照アーキテクチャを導出する。
攻撃面を対象とする特定攻撃ベクトルについて詳しく検討し、機密性、完全性、可用性(CIA)に対するその影響を厳格に評価する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:52:00 GMT)
LLM Reasoning Predicts When Models Are Right: Evidence from Coding Classroom Discourse [0.2] 大規模言語モデル(LLM)は、大規模に教育対話を自動的にラベル付けし分析するために、ますます多くデプロイされている。
本研究では,LLMが生成した推論がモデル自身の予測の正確性を予測するのに有効かどうかを検討する。
授業の対話から30,300人の教師の発話を分析し,複数の最先端LPMでラベル付けし,指導的移動構造とそれに伴う推論を行った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:38:13 GMT)
Optimal Control of Microswimmers for Trajectory Tracking Using Bayesian Optimization [0.1] マイクロスウィマーの軌道追跡は、マイクロロボティクスにおける重要な課題である。
B-スプラインパラメトリゼーションとベイズ最適化を組み合わせた最適制御問題として軌道追跡問題を定式化する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:14:32 GMT)
Versor: A Geometric Sequence Architecture [0.1] 従来の基本非線形演算の代わりにCGA(Conformal Geometric Algebra)を使用する新しいシーケンスアーキテクチャであるVersorが導入された。
VersorはカオスN体力学、トポロジカル推論、標準マルチモーダルベンチマークで検証されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:00:02 GMT)
NOWJ @BioCreative IX ToxHabits: An Ensemble Deep Learning Approach for Detecting Substance Use and Contextual Information in Clinical Texts [0.1] バイオCreative IXのToxHabits Shared TaskにNOWJを提出する。
この課題は、スペインの臨床文献における有害物質の使用と文脈的属性の検出を目標とする。
本システムでは、BETOとCRF層を統合してシーケンスラベリングを行い、多様なトレーニング戦略を採用し、文フィルタリングを用いて精度を向上させる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:04:44 GMT)
When Handshakes Tell the Truth: Detecting Web Bad Bots via TLS Fingerprints [0.0] 普及するボットは、本物のユーザーであるふりをして、Captchasを解決し、人間のインタラクションパターンを模倣するかもしれない。
実際のユーザからボットを区別するために、JA4技術を使用したTLSフィンガープリント(TLS fingerprinting)を使用する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:56:20 GMT)
Variational Sparse Paired Autoencoders (vsPAIR) for Inverse Problems and Uncertainty Quantification [0.0] 逆問題は、ノイズ測定から隠れた、根底にある量を再構築しようとするときに生じる。
本研究では,不確実性推定とともに高速な推論を実現するために,可変スパースペア自動符号化器 (vsPAIR) を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:33:37 GMT)
Universal Foundations of Thermodynamics: Entropy and Energy Beyond Equilibrium and Without Extensivity [0.0] 熱力学の基礎の基礎を普遍的に定式化する。
エントロピーとエネルギーは 平衡を超えて定義されます
この論文は、教育と近代的応用の両方に一貫性のある基礎を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:12:20 GMT)
Uncertainty-Aware Ordinal Deep Learning for cross-Dataset Diabetic Retinopathy Grading [0.0] 糖尿病網膜症の早期かつ確実な検出は、失明の予防に重要である。
本稿では,DR重度自動評価のための不確実性を考慮したディープラーニングフレームワークを提案する。
提案手法は, 畳み込み後骨に病変性アテンションプールと明らかなディリクレに基づく順序回帰ヘッドを併用する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:44:04 GMT)
Uncertainty and Wigner negativity in Hilbert-space classical mechanics [0.0] 古典的正準変換は、一般に非可換であるエルミート作用素によって生成される。
量子力学の2つの特徴は、古典力学のヒルベルト空間の定式化において再現され、明らかになる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:24:45 GMT)
UltraLIF: Fully Differentiable Spiking Neural Networks via Ultradiscretization and Max-Plus Algebra [0.0] Spiking Neural Networks (SNN) は、エネルギー効率が高く、生物学的に妥当な計算を提供するが、非微分可能なスパイク生成に苦しむ。
シュロゲート勾配を超離散化に置き換える原理的なフレームワークであるUltraLIFを紹介する。
静的画像、ニューロモルフィック視覚、オーディオにまたがる6つのベンチマークの実験では、サロゲート勾配ベースラインよりも改善が示されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:21:54 GMT)
Tucker iterative quantum state preparation [0.0] 本稿では,浅い決定論的量子回路を適応的に構築する新しい手法であるTucker Iterative Quantum State Preparation (Q-Tucker)を紹介する。
タッカー分解に基づいて,本手法は,対象の量子状態をコアテンソルとモード固有演算子に分解し,複数のサブシステム間の直接分解を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:41:32 GMT)
Tracking Finite-Time Lyapunov Exponents to Robustify Neural ODEs [0.0] 有限時間リアプノフ指数(FTLE)が入力出力ダイナミクスの強力なオーガナイザであることを示す。
FTLE正則化によりロバスト性を向上させる新しいトレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:04:08 GMT)
Time resolution at the quantum limit of two incoherent sources based on frequency resolved two-photon-interference [0.0] 基準光源から放射される光子のビームスプリッタにおける干渉から周波数領域における2光子量子ビートの発生を示す。
この技術は天文学、顕微鏡、リモートクロック同期、レーダーレンジに適用できる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:45:58 GMT)
The minimal width of universal $p$-adic ReLU neural networks [0.0] 連続な$mathbb Q_p$値関数に対する普遍近似特性を持つ$p$進ニューラルネットワークの最小幅を決定する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:53:53 GMT)
The hidden risks of temporal resampling in clinical reinforcement learning [0.0] 実運用において,時間的再サンプリングはオフライン強化学習アルゴリズムの性能を著しく低下させることを示す。
本稿では,この障害を誘発するメカニズムとして,反現実軌道の生成,時間的期待の歪み,一般化誤差の複合化の3つを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:51:38 GMT)
The chiral random walk: A quantum-inspired framework for odd diffusion [0.0] 標準散逸動力学に反する堅牢なエッジ電流の出現について検討する。
この結果から, 異常拡散の微視的説明が得られ, 閉じ込められた媒体と乱れた媒体の輸送を予測する強力なツールキットが提供される。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:54:03 GMT)
The arrangement of anisotropic spin couplings can optimize sensitivity of the cryptochrome radical pair to the direction of geomagnetic field [0.0] 磁気方向検出のシャープさは、半径間電子スピンカップリングによって強く抑制されることを示す。
1つの特定の配置は、超微粒子カップリングの異方性によってのみ寄与されるものよりも、よりシャープな磁場方向感度を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:16:03 GMT)
The Trouble with Weak Values [0.0] 弱さの値は1987年と1988年の2つの論文で研究論文に初めて登場した。
弱い値に関する論文は、多くの重要な実用的なスピンオフを生み出している。
本稿では、これらの解釈的主張にいくつかの誤認的推論を含むことを論じて挑戦する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:49:42 GMT)
The Need for Standardized Evidence Sampling in CMMC Assessments: A Survey-Based Analysis of Assessor Practices [0.0] 本研究では,サイバーセキュリティ成熟度モデル認定エコシステム内にエビデンスサンプリングプラクティスの不整合が存在するかどうかを検討する。
その結果,エビデンスサンプリングの実践は,形式化された基準ではなく,評価者の判断,認識されたリスク,環境の複雑さによって引き起こされていることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:40:44 GMT)
The Critical Horizon: Inspection Design Principles for Multi-Stage Operations and Deep Reasoning [0.0] 初期ステップと最終結果とを繋ぐ信号は指数関数的に深さとともに減衰し、終端データのみからアルゴリズムが学べない限界的な地平線を形成する。
これらの結果は、AIの操作におけるインスペクション設計とインスペクション設計のための共通の分析基盤を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:02:29 GMT)
Synthetic Reflections on Resource Extraction [0.0] 本稿では、景観の解釈をAIモデルに拡張し、適応させる方法について述べる。
本稿では、統計演算、人的判断、生成AIモデルを組み合わせたSentinel-2衛星資産解釈パイプラインの技術的枠組みについて述べる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:38:04 GMT)
Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks [0.0] PINNは、分岐のような急激な状態遷移を持つ力学系をモデル化する際に、しばしば課題に直面している。
我々は,この課題を,Supervised Metric Regularizationによる潜在空間によって緩和することを目的としたTopology-Aware PINN(TAPINN)を提案する。
Duffingの予備実験では、標準ベースラインはスペクトルバイアスと高容量勾配ネットワークのオーバーフィットに悩まされているが、本手法は、マルチ出力ソボレフ誤差ベースラインよりも2.18倍低い分散と、ハイパーネットワークベースの代替よりも5倍少ないパラメータで安定した収束を実現する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:06:57 GMT)
Strategy optimization for Bayesian quantum parameter estimation with finite copies: Adaptive greedy, parallel, sequential, and general strategies [0.0] 1つ以上の未知の物理量を符号化するプロセスの有限個の使用量からベイズ量子パラメータ推定について検討する。
最適解を求めるアルゴリズムを開発し、半定値プログラミングに基づく効率的な数値実装を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:05:45 GMT)
Stochastic Thermodynamics of Quantum-Induced Stochastic Dynamics [0.0] 量子誘起ダイナミクスは、古典的なシステムと量子環境の結合から生じる。
熱, 作業, エントロピー生成を定式化して, この半古典的状態に対する熱力学の枠組みを定式化する。
我々は、スクイーズのような非平衡量子的特徴を考慮に入れた修正された第二法則を導出する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:51:25 GMT)
Stochastic Parrots or Singing in Harmony? Testing Five Leading LLMs for their Ability to Replicate a Human Survey with Synthetic Data [0.0] 本稿では,シリコンバレーのプログラマ420名を対象にした人間対応サーベイと,実際のシークエンサーをシミュレートする合成サーベイデータの比較を行った。
以上の結果から,AIエージェントが予想以上に再現性と調和性を重視した技術的に妥当な結果を生み出したことが判明した。
本研究は, 厳密な調査手法の代わりに, より信頼性の高い前・後調査機器として, 総合的な調査に基づく研究を行なわなければならないと結論付けた。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:50:33 GMT)
Statistical benchmarking of transformer models in low signal-to-noise time-series forecasting [0.0] 時間的・横断的な自己注意を交互に行う双方向アテンショントランスフォーマーは,標準ベースラインより優れていることを示す。
また、トレーニング中に適用された注意行列の動的スペーシフィケーション手法を導入し、ノイズの多い環境において顕著に有効であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:13:57 GMT)
Stabilized Maximum-Likelihood Iterative Quantum Amplitude Estimation for Structural CVaR under Correlated Random Fields [0.0] Conditional Value-at-Risk (CVaR) は構造力学における中心的なテールリスク尺度である。
本研究では,CVaR評価を信頼性制約付き最大形振幅推定問題として用いた量子強化推論フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:53:26 GMT)
Spin-entanglement of an atomic pair through coupling to their thermal motion [0.0] 本稿では、相対運動がkBTで熱状態にあるときのスピン状態が、ダイナミクスに関与するスピン状態のエネルギーよりもはるかに大きいときに生じるスピン状態について研究する。
最初は絡み合わなかったスピン状態が絡み合わされた状態に進化することを発見した。
これは、量子系を熱い自由度に結合すると、その生成ではなく絡み合いを失うという一般的な場合とは逆である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:45:54 GMT)
Solving Geodesic Equations with Composite Bernstein Polynomials for Trajectory Planning [0.0] 軌道は、離散境界ではなく連続体として障害物を符号化するコスト面上に計画されている。
障害物に近い地域は高いコストが割り当てられており、自然に軌道は安全な距離を維持しつつ、制約された空間を効率的にルーティングすることを奨励している。
この方法は2次元と3次元の両方の環境に適用され、地上、空中、水中、宇宙システムに適している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 23:33:15 GMT)
Simpler Presentations for Many Fragments of Quantum Circuits [0.0] 制限量子ゲートフラグメントを対称モノイダル圏(PROP)として研究する。
クビットClifford, real Clifford, Clifford+T (最大2 qubits), Clifford+CS (最大3 qubits) および CNOT-dihedral である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:17:24 GMT)
Simple Image Processing and Similarity Measures Can Link Data Samples across Databases through Brain MRI [0.0] 頭部MRI(Head Magnetic Resonance Imaging)は、厳格な規制枠組みの下で研究のために日常的に収集され、共有される。
頭蓋骨を切断した後でも、脳小葉には、データベースをまたいだ同じ参加者の他のMRIと一致する、ユニークなシグネチャが含まれている。
ここでは,頭蓋骨を張ったT1強調MRIのリンクが,他の識別子が利用可能であれば再同定につながる可能性があることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 18:10:12 GMT)
Self-Service or Not? How to Guide Practitioners in Classifying AI Systems Under the EU AI Act [0.0] EU人工知能法(AIA)は2024年8月に施行された。
AIAの中心はリスクベースのアプローチであり、AIシステムによって引き起こされる潜在的な害と規制義務を整合させる。
リスク分類スキーム(RCS)の応用は複雑で、法律、技術、ドメイン固有の分野の専門知識を必要とする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:06:11 GMT)
S1-NexusAgent: a Self-Evolving Agent Framework for Multidisciplinary Scientific Research [0.0] S1-NexusAgentは科学研究のための自己進化型エージェントフレームワークである。
S1-NexusAgentは階層的なPlan-and-CodeAct実行パラダイムを採用し、サブタスクレベルのツール実行からグローバルな科学的計画を切り離している。
S1-NexusAgentは最先端の一般化性能を達成し、複雑な科学的タスクにおけるその有効性と能力を検証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:14:24 GMT)
Rigorous no-go theorems for heralded linear-optical state generation tasks [0.0] 光量子技術における大きな課題は、適切な離散量子状態を作成するための戦略を開発することである。
代数幾何学のNullsatzアルゴリズムを量子状態生成に適用する。
これは、問題の状態準備タスクに解決策がない場合に、実現不可能性を証明することによって、決定的なノーゴー結果を与えることができる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:48:39 GMT)
Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion [0.0] ハイブリッド検索-拡張生成(RAG)パイプラインは、ベクトル類似性探索と知識グラフ拡張を組み合わせたマルチホップ推論である。
ベクター検索した"シード"チャンクがエンティティリンクを介してセンシティブなグラフ近傍にピボットできることを示し、テナント間のデータ漏洩を引き起こす。
ベクトル-グラフ境界を利用する7つの検索型Pivotアタックを提示し、逆噴射は不要であることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:19:20 GMT)
Resources of the advantage in quantum Illumination: Discord and entanglement [0.0] 量子照明において、達成可能な利点は、初期絡み合いと不協和の間の相互作用によって決定される。
与えられた状態に対する量子的優位性は、照明のために消費される不協和の量と等しいことを示す。
任意の初期不協和に対して、高い絡み合いはより高い優位性のために十分な(しかし必要ではない)資源である、と結論付ける。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:04:05 GMT)
RANT: Ant-Inspired Multi-Robot Rainforest Exploration Using Particle Filter Localisation and Virtual Pheromone Coordination [0.0] RANTは、騒々しく不確実な環境のための、アリにインスパイアされたマルチロボット探索フレームワークである。
ディファレンシャルドライブロボットのチームは、10×10mの地形をナビゲートし、ノイズの多いプローブ測定を収集し、局所確率マップを構築する。
我々は、チームサイズ、ローカライゼーションの忠実度、コーディネーションがカバレッジ、ホットスポットリコール、冗長性にどのように影響するかを実験的に分析する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:11:22 GMT)
Questioning the reasonableness of the quantum nonlocality debate [0.0] 量子非局所性に関する議論に侵入する論理的厳密さの明らかな欠如について論じる。
強い信念は、しばしば合理的な評価よりも一般的であり、定着したドグマとなる緩やかな考えが受け入れられる。
論理的推論の規則に対する健全な合理性の欠如と固執は、ほとんど概念的な精査を受けない広く採用されているアンチノミーに繋がる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:15:03 GMT)
Quantum-accelerated conjugate gradient methods via spectral initialization [0.0] フォールトトレラント量子アルゴリズムは、古典的共役勾配解法(CG)のスペクトル情報の初期推定を構築するためにのみ用いられる。
QACGの中心的な特徴は、量子と古典的解法の間の条件数の制御可能な分解である。
その結果,早期のフォールトトレラント量子コンピューティングの科学的,産業的利用への具体的な道筋が示されている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:51:42 GMT)
Polycontrolled PROPs for Qudit Circuits: A Uniform Complete Equational Theory For Arbitrary Finite Dimension [0.0] 我々は、dレベル系(量子)上の量子回路の有限スキーマ公理化を提案する。
各 d に対して、制御関手群を備えた PROP を定義し、制御を原始的な分類的コンストラクタとして扱う。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:16:46 GMT)
Physically Interpretable AlphaEarth Foundation Model Embeddings Enable LLM-Based Land Surface Intelligence [0.0] 環境変数26に対して,Google AlphaEarthの64次元埋め込みを包括的に解析する。
次に、FAISSによる1210万ベクトルの埋め込みデータベース上での検索拡張生成を実装するランドサーフェスインテリジェンスシステムを開発した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:58:50 GMT)
Parallel Composition for Statistical Privacy [0.0] データベースのサブサンプリングとランダムなパーティショニングに基づいて、クエリ間の依存関係をバインドするプライバシーメカニズムが提案されている。
これらの境界は、分散のエントロピーを考慮に入れた現実的なアプリケーションシナリオにおいて、プライバシと精度保証の改善をもたらすことを示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:13:44 GMT)
Neural Network Quantum Field Theory from Transformer Architectures [0.0] 本稿では,変圧器のアテンションヘッドを用いたユークリッドスカラー量子場理論のニューラルネットワーク構築を提案する。
単一の注意ヘッドに対して、共有ランダムなソフトマックス重みは異なる幅座標を結合し、非ガウス場統計を誘導する。
標準の1/N_h$正規化で多くの独立ヘッドをまとめると、接続された非ガウスの相関子を1/N_h$に抑え、大きな上限でガウスのNN-QFTが得られることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:02:03 GMT)
Metric geometry for ranking-based voting: Tools for learning electoral structure [0.0] 我々は、ランキング統計学の計量幾何学を開発し、統計学における2つの主要な置換、ケンドール・タウとスピアマン・フットルールが自然に不完全ランキングにまで拡張されることを証明した。
重要な応用として、メートル法構造は、投票者のブロックと選好候補者のスレートの効率的な識別を可能にする。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:07:46 GMT)
MerkleSpeech: Public-Key Verifiable, Chunk-Localised Speech Provenance via Perceptual Fingerprints and Merkle Commitments [0.0] 本稿では,公開鍵検証・チャンク局所音声認識システムであるMerkleSpeechを提案する。
このシステムは、短い音声チャンク上で知覚指紋を計算し、それを発行キーで署名されたMerkleツリーにコミットする。
我々は,再サンプリング,帯域通過フィルタ,付加雑音下での極めて低い偽陽性率を目標とした実験を行った。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:58:19 GMT)
MedCalc-Bench Doesn't Measure What You Think: A Benchmark Audit and the Case for Open-Book Evaluation [0.0] ベンチマークの現在のフレーミングに挑戦する3つのコントリビューションを提示します。
重要な公式の不正確さから実行時のバグまで、20以上のエラーを特定し、修正します。
以上の結果から,MedCalc-Benchは臨床推論よりも公式記憶と算術精度を主に測定することが示唆された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:43:41 GMT)
LLMAC: A Global and Explainable Access Control Framework with Large Language Model [0.0] 今日のビジネス組織は、複雑なセキュリティ要件の変更を処理できるアクセス制御システムを必要としています。
役割ベースアクセス制御(RBAC)、属性ベースアクセス制御(ABAC)、離散アクセス制御(DAC)といった現在のアプローチは、特定の目的のために設計されている。
LLMACはLarge Language Models (LLMs) を用いた新しい統一的アプローチであり,これらの異なるアクセス制御手法を包括的で理解可能なシステムに統合する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:02:11 GMT)
LLM-FS: Zero-Shot Feature Selection for Effective and Interpretable Malware Detection [0.0] 従来の手法の代替として,機能名とタスク記述のみを用いて,ゼロショット設定で機能選択を導出できるかどうかを検討する。
その結果,LLM誘導ゼロショット特徴選択は従来のFS法と競合する性能を達成し,解釈可能性,安定性,ラベル付きデータへの依存性の低減といった利点を生かした。
これらの知見は,ゼロショットLPMベースのFSを,セキュリティクリティカルなアプリケーションにおける知識誘導機能選択の方法として,効果的かつ解釈可能なマルウェア検出のための将来的な代替戦略として位置付けている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:29:34 GMT)
Information Theory of Action : Reconstructing Quantum Dynamics from Inference over Action Space [0.0] 我々は,行動空間上の推論に基づく量子力学の情報理論的再構成を開発する。
最大エントロピー推論は、作用における有限分解能スケールを導入する。
この不明瞭性は、確率正規化と作用付加性と共に、複雑な振幅とユニタリ進化を選択することを示します。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:10:26 GMT)
In-Situ Rewiring of Two-Dimensional Ion Lattice Interactions Using Metastable State Shelving [0.0] 実効的なイオン格子形状と結果として生じる量子ビットと量子ビットの相互作用がその場でどのように再構成されるかを示す。
この系にグローバルイジング様ハミルトニアンを適用し、シェルヴェッド量子ビットが量子力学への参加から完全に取り除かれることを検証する。
我々は,レーザー駆動イオン-イオン相互作用の存在下での準安定状態の寿命を特徴付け,スピンスピン相互作用速度よりも桁違い遅いデシェルビング速度を求める。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:25:11 GMT)
Historical Debates over the Physical Reality of the Wave Function [0.0] 粒子に付随する物理的波動のアイデアは、アインシュタインとド・ブロイ(英語版)によって、もともとこれらの波動は3次元物理空間で伝播すると考えられていた。
デ・ブロイはすぐにこの波動粒子の双対性を初期のパイロット波理論に変え、粒子の関連する位相波がその軌道に沿って粒子を操縦したり誘導したりした。
シュルディンガーはド・ブロイの位相波仮説に基づいて、生まれたばかりの量子論の包括的な説明を提供した。
本研究は、この3次元物理空間から多次元構成空間への移動が重要な理由であると主張する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 04:06:35 GMT)
Gravitationally-induced Conversion of Local Coherence to Entanglement [0.0] 量子資源理論の観点から重力誘起絡み合いのメカニズムを解析する。
重力相互作用は、空間的に重畳された2つの質量の間で量子資源を再分配するユニタリチャネルとして機能することを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:37:51 GMT)
Generalized Prediction-Powered Inference, with Application to Binary Classifier Evaluation [0.0] PPIを任意の正規線型推定器に一般化する。
PPIは、非常に制限的かつ非現実的なシナリオの外側の半パラメトリック効率を低くすることができないことを示す。
我々は、その文献との接続を利用して、修正されたPPI推定器を提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:11:26 GMT)
Generalized Kramers-Wannier Self-Duality in Hopf-Ising Models [0.0] 有限次元半単純ホップ代数$H$に基づいて一般化された1+1dイジングモデルを構築する。
このような自己双対対称性はテンソル積ヒルベルト空間におけるアーベル群のゲージングを超えて拡張する。
この結果は、非可逆対称性、双対性、およびそれらを実現するテンソル積格子モデルのための統一ホップ代数フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:00:00 GMT)
GenSeg-R1: RL-Driven Vision-Language Grounding for Fine-Grained Referring Segmentation [0.0] 分離された因果分離パイプラインを用いて,詳細な参照画像セグメンテーションについて検討した。
視覚言語モデル(VLM)は、画像と自然言語クエリを受信し、シーンの理由を判断し、構造化された空間的プロンプトを出力する。
フリーズプロンプト可能なセグメンタ(SAM2)はこれらのプロンプトを高品質なマスクに変換する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:59:14 GMT)
GAFR-Net: A Graph Attention and Fuzzy-Rule Network for Interpretable Breast Cancer Image Classification [0.0] 病理画像分類のための頑健で解釈可能なグラフ注意とファジィルールネットワークであるGAFRNetを提案する。
GAFR-Netは、複数の倍率および分類タスクにおいて、様々な最先端手法を一貫して上回ることを示す。
これらの結果は,医用医用画像解析における信頼性の高い意思決定支援ツールとして,GAFR-Netの優れた一般化と実用性を検証した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:25:57 GMT)
From Multi-sig to DLCs: Modern Oracle Designs on Bitcoin [0.0] Bitcoinは、主に、条件付きアプリケーションのプログラム可能性を制限する、ネイティブ通貨のトランザクション台帳として設計された。
本稿では、2015年のスマートコントラクト移行以降、Bitcoin Layer 1の新しいオラクル設計が出現したかどうかを検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:31:03 GMT)
Finite-time Stable Pose Estimation on TSE(3) using Point Cloud and Velocity Sensors [0.0] 本研究は, 有限時間安定ポーズ推定器 (FTS-PE) を3次元の回転運動および転動運動を行う剛体に対して提案する。
FTS-PEはポーズ(位置と向き)と速度のフルステートオブザーバーであり、リャプノフ解析によって得られる。
FTS-PEと2重四元数拡張カルマンフィルタを比較した数値シミュレーション(VPE)
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:11:01 GMT)
Field-Dependent Qubit Flux Noise Simulated from Materials-Specific Disordered Exchange Interactions Between Paramagnetic Adsorbates [0.0] 超伝導量子デバイスは、常磁性表面欠陥と不純物から生じる磁束ノイズの影響を受けている。
我々は、Al$$O$_3$表面上の常磁性O$$分子からなるスピン格子の第一原理シミュレーションを示す。
本研究では, 磁束ノイズ周波数, 温度, 応用外部磁場依存性, および感受性-流束ノイズ相互相関を計算する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:07:22 GMT)
Fidelity-Age-Aware Scheduling in Quantum Repeater Networks [0.0] 我々は、フィデリティが閾値Fminを超える状態の間隔を測定するフィデリティ・エイジ(FA)測度を導入する。
FA対応スケジューリングはスループットを保ち、極端な年齢イベントを最大2桁まで削減する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:14:28 GMT)
Extended Isolation Forest with feature sensitivities [0.0] 本稿では,異方性孤立林(AIF)と呼ばれる特徴感のある拡張孤立林について紹介する。
AIFは、特徴空間内の異なる特徴または方向の偏差に対して制御可能な感度で異常検出を可能にする。
合成および実世界のデータセットに適用することで,アルゴリズムの性能を実証する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 12:03:15 GMT)
Explainability in Generative Medical Diffusion Models: A Faithfulness-Based Analysis on MRI Synthesis [0.0] 本研究では,医療画像の文脈における生成拡散モデルの説明可能性について検討した。
本稿では,プロトタイプベースの説明可能性手法が生成機能とトレーニング機能の関係をリンクする方法を,忠実度に基づく説明可能性フレームワークで分析する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:41:48 GMT)
Entanglement suppression for $ΩΩ$ scattering [0.0] 我々は、各バリオンが3/2ドルのスピンを持つ、$s$-wave $$散乱における絡み込み抑制について研究する。
システム内の絡み合いの発生を最小限に抑えるスピンチャネルの位相シフトの条件を定量化する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 10:18:50 GMT)
Energy-Efficient Fast Object Detection on Edge Devices for IoT Systems [0.0] 本稿では,フレーム差分法による高速物体検出にAI分類器を用いたモノのインターネット(IoT)アプリケーションを提案する。
AMD AlveoT M U50, Jetson Orin Nano, Hailo-8T M AI Acceleratorの3つのエッジデバイスでこの技術を実装した。
我々は、鳥、車、列車、飛行機など様々なクラスを調査した。
提案アルゴリズムは,平均精度向上率を28.314%,平均効率向上率を3.6倍,平均遅延低減率を39.305%向上させた。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 08:18:06 GMT)
Empirical Stability Analysis of Kolmogorov-Arnold Networks in Hard-Constrained Recurrent Physics-Informed Discovery [0.0] 我々は、KAN(Kolmogorov-Arnold Networks)とHRPINN(Hard-Constrained Recurrent Physics Architectures)の統合について検討する。
我々は, カンが重度の不安定性, より深い構成における不安定性, および乗法的項における一貫した失敗(Van der Pol)を示すことを示す。
これらの経験的課題は、元の Kan の定式化における加法的帰納的バイアスの限界を強調し、将来のハイブリッドモデルに対する帰納的バイアスの予備的証拠を提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:13:51 GMT)
Emergence of a Luttinger Liquid Phase in an Array of Chiral Molecules [0.0] 本研究では, 閉じ込められた非対称トップ分子の線形配列を用いたキラル量子磁性をシミュレーションするためのロバストなプラットフォームを提案する。
スターク型回転状態を実効スピン-1/2$部分空間にマッピングすることにより、基礎となる多体力学を統括する一般化された$XXZ$ハイゼンベルク・ハミルトニアンを厳格に導出する。
その結果,1,2-プロパンジオールアレイを多目的量子シミュレータとして確立し,分子キラリティとトポロジカル多体相の直接顕微鏡的リンクを提供することができた。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:23:36 GMT)
Efficient reduction of stellar contamination and noise in planetary transmission spectra using neural networks [0.0] そこで本稿では,デノナイズドオートエンコーダを用いた外惑星スペクトルの恒星汚染と計器固有のノイズを低減する手法を提案する。
我々は、地球型(TRAPPIST-1eアナログ)と海王星型(K2-18bアナログ)の大規模な合成データセット上で、自己エンコーダアーキテクチャを設計し、訓練する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:07:18 GMT)
Effect of initial intrasystem entanglement on entropy growth in generalized Jaynes-Cummings models [0.0] 初期のシステム内絡み合いは、フォトニック環境と相互作用する原子系のエントロピーに影響を及ぼす。
本研究では, 純粋なハールランダム状態と混合ハールランダム状態, 固定平均エネルギーあるいは固定混合状態のアンサンブル, 環境における初期光子数の変化を含む初期系状態のアンサンブルについて考察する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:43:20 GMT)
Disentangling orbital and confinement contributions to $g$-factor in Ge/SiGe hole quantum dots [0.0] 励起(単粒子)および付加(多体)スペクトルを用いたGe量子ドットの面外$g$-factorについて検討する。
15%のレベルで$g$-factorsのゲート可変性を見いだし、全電気量子ビット操作の関連性を強調した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:44:12 GMT)
Disambiguating Anthropomorphism and Anthropomimesis in Human-Robot Interaction [0.0] 本研究では,人間のような特徴をロボットにデザインするロボット開発者として,人間同型をロボットの人間的品質を知覚するユーザとして定義する。
この貢献は、将来のHRI奨学金のためにこれらの概念を明確にし、探求することを目的としている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 00:13:30 GMT)
Differentiable Tripartite Modularity for Clustering Heterogeneous Graphs [0.0] 相互作用を通して連結された3つのノードタイプからなるグラフに対して,三部分母モジュラリティの微分可能な定式化を導入する。
コミュニティ構造は、三部グラフ上の重み付きコパスと、高密度な三階テンソルの明示的な構成を避けるための正確な分解計算によって定義される。
提案手法を大規模都市カダストラルデータに適用し,頑健な収束挙動を示し,空間的コヒーレントな分割を生成する枠組みを検証した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:06:53 GMT)
Diagnostic Benchmarks for Invariant Learning Dynamics: Empirical Validation of the Eidos Architecture [0.0] Eidosアーキテクチャは、PolyShapes-Ideal(PSI)データセット上で99%の精度を達成する。
構造的に制約されたアーキテクチャにおける一般化は、統計スケールではなく幾何学的整合性の性質である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:04:44 GMT)
Detecting radar targets swarms in range profiles with a partially complex-valued neural network [0.0] 本稿では,近接エコーと歪みエコーの異なる複数のターゲットを含むレーダレンジプロファイルにおけるターゲット検出の問題点について述べる。
この研究は、レーダーと信号処理の文献における最近の貢献に触発され、適応範囲プロファイル処理として部分的に複雑に評価されたニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:49:19 GMT)
Cosmological Expansion Induces Interference Between Communication and Entanglement Harvesting [0.0] 宇宙空間における局所粒子検出器のエンタングルメント収穫と通信媒介相関の相互作用について検討した。
宇宙論的な設定における時間-逆対称性の欠如は、一般に、通信媒介相関と収穫場相関との間に構成的あるいは破壊的な干渉をもたらすことが判明した。
宇宙論的な展開はコミュニケーションと収穫のバランスを質的に改善し,検出器内部の凝集が急速に膨張する宇宙において検出器の絡み合いが生き残るかどうかを判断する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:00:24 GMT)
Contractual Deepfakes: Can Large Language Models Generate Contracts? [0.0] LLMは言葉の意味を理解しておらず、文脈の感覚を持っておらず、説明できない。
その出力は統計的に支配的な単語パターンの近似を構成する。
本稿は、そのような不合理な考えに終止符を打とうとしている。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 03:52:29 GMT)
Contesting Artificial Moral Agents [0.0] 本稿では, 倫理的, 説明可能, 経験的, 評価の5つの観点から, 人工モラルエージェント(AMA)と競合する5Eフレームワークを提案する。
このフレームワークは、AMA技術の開発者がコンテストを予想するか、真に道徳的なAIシステムの価値に整合した開発に固執するために自己議論をするかを示す暫定的なタイムラインを提供する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 16:38:45 GMT)
Construction of the full logical Clifford group for high-rate quantum Reed-Muller codes using only transversal and fold-transversal gates [0.0] 我々は、部分集合論理ゲートがアドレス可能なクリフォードゲートであることを示す。
これは、$k$が1/[![!][![![!]]![![!]]![![![!]![![![![![![![!]![![!]![![!]![![!]![!]![!]![!]![!]![!]![!]![!]![!]!]!
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:49:00 GMT)
Conditional Uncertainty-Aware Political Deepfake Detection with Stochastic Convolutional Neural Networks [0.0] 生成画像モデルは、非常に現実的な政治的ディープフェイクの作成を可能にし、情報の完全性、公的な信頼、民主的なプロセスにリスクを及ぼす。
自動ディープフェイク検出器は、モデレーションと探索パイプラインにますます配備されているが、既存のシステムの多くは点予測のみを提供し、出力が信頼できないことを示さない。
本研究では,畳み込みニューラルネットワークを用いた条件付き,不確実性を考慮した政治的ディープフェイク検出を,経験的,意思決定指向の信頼性フレームワーク内で検討する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 22:31:18 GMT)
Computing Conditional Shapley Values Using Tabular Foundation Models [0.0] TabPFNのようなタブラル基礎モデルは、文脈内学習を活用することで、この計算ハードルを克服する。
我々は,Shapley値をTabPFNの複数変種で計算し,その性能をシミュレーションと実データの両方の最先端手法と比較する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 07:36:41 GMT)
Communication complexity bounds from information causality [0.0] 通信複雑性は分散計算に必要な最小限の通信を定量化する。
本稿では,相互情報の公理のみに基づいて,一方的な通信複雑性を研究するための情報理論的アプローチを提案する。
拡張情報因果原理は,非自明な通信複雑性の原理と同程度に強いことが証明された。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:01:02 GMT)
Colorimeter-Supervised Skin Tone Estimation from Dermatoscopic Images for Fairness Auditing [0.0] 我々は,Fitzpatrickの皮膚型を予測するニューラルネットワークを,順序回帰(ordinal regression)と色回帰(Personal Typology Angle,ITA)により構築する。
高速なスキントーンアノテーションとバイアス監査のためのオープンソースツールとして,コードと事前訓練されたモデルをリリースする。
これは、我々の知る限り、最初の皮膚内視鏡的皮膚-音色推定ニューラルネットワークであり、色調測定に対して有効である。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 20:20:45 GMT)
Certainty-Validity: A Diagnostic Framework for Discrete Commitment Systems [0.0] 「マシーン学習評価尺度」は、全てのエラーが等価な離散的なコミットメントシステムであると仮定する。
信頼不正確」な振る舞いは、モデルが曖昧なデータの中で構造を幻覚させる場所である。
推論システムのための「Good Training」は、精度ではなく、Certainty-Validity Scoreの最大化によって定義されなければならない。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 21:53:02 GMT)
BiJEPA: Bi-directional Joint Embedding Predictive Architecture for Symmetric Representation Learning [0.0] BiJEPAは、データセグメント間のサイクル一貫性予測を強制する。
合成周期信号,カオス的ロレンツ誘導軌道,高次元画像データという3つの異なるモードでBiJEPAを評価した。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 01:16:20 GMT)
Beyond SMILES: Evaluating Agentic Systems for Drug Discovery [0.0] 薬物発見のためのエージェントシステムは、自律的な計画、文献採掘、分子設計を実証している。
ペプチド治療,in vivo薬理学,資源制約設定から抽出した15のタスククラスに対する6つのフレームワークの評価を行った。
タンパク質言語モデルやペプチド特異的な予測のサポートなし,in vivoデータとサイリコデータ間のブリッジなし,MLトレーニングや強化学習への道のないLPM推論に依存しない,5つの機能ギャップがある。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 09:01:09 GMT)
BabyMamba-HAR: Lightweight Selective State Space Models for Efficient Human Activity Recognition on Resource Constrained Devices [0.0] ウェアラブルおよびモバイルデバイス上のヒューマンアクティビティ認識(HAR)は、メモリフットプリントと計算予算によって制限される。
選択状態空間モデル(SSM)は入力依存ゲーティングによる線形時間列処理を提供する。
BabyMamba-HARは、リソース制約されたHARのための2つの新しい軽量なMambaインスパイアされたアーキテクチャからなるフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 15:16:32 GMT)
Autonomous Action Runtime Management(AARM):A System Specification for Securing AI-Driven Actions at Runtime [0.0] 本稿では,AI駆動型動作を実行時にセキュアにするためのオープン仕様であるAutonomous Action Management(AARM)を紹介する。
AARMは実行前にアクションをインターセプトし、セッションコンテキストを蓄積し、ポリシーと意図の整合性を評価し、承認決定を強制し、法医学的な再構築のための未確認のレシートを記録する。
AARMはモデルに依存しない、フレームワークに依存しない、ベンダーに依存しない、アクション実行を安定したセキュリティ境界として扱う。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 05:57:30 GMT)
Automatic regularization parameter choice for tomography using a double model approach [0.0] そこで本研究では,同じ問題の2つの異なる離散化を用いた自動パラメータ選択手法を提案する。
フィードバック制御アルゴリズムは、正規化強度を動的に調整し、2つのグリッド上の再構成に十分な類似性をもたらす最小パラメータに向けて反復的再構成を駆動する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 13:59:43 GMT)
Administrative Law's Fourth Settlement: AI and the Capability-Accountability Trap [0.0] 1887年以降、行政法は「能力と責任の罠」をナビゲートしてきた。
本条では,この可能性を実現するために行政法における教義改革を3つ提案する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 11:36:01 GMT)
A Representation-Consistent Gated Recurrent Framework for Robust Medical Time-Series Classification [0.0] 隠れ状態表現における時間的一貫性を強制する規則化された正規化戦略を導入するための表現一貫性を持つゲートリカレントフレームワーク(RC-GRF)を提案する。
提案するフレームワークはモデルに依存しないため,内部ゲーティング機構を変更することなく,既存のゲート型リカレントアーキテクチャに統合することができる。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 17:16:49 GMT)
A Function-Space Stability Boundary for Generalization in Interpolating Learning Systems [0.0] 我々は,関数空間軌道としてのトレーニングをモデル化し,この軌道に沿った単一サンプル摂動に対する感度を測定する。
小さい証明は安定性に基づく一般化を暗示するが、小さなリスクを持つ補間体制が存在することも証明する。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 19:29:02 GMT)
A Controlled Study of Double DQN and Dueling DQN Under Cross-Environment Transfer [0.0] 本稿では,DQN(Double Deep Q-Networks)とDQN(Dueling DQN)とのアーキテクチャ的差異について検討する。
実験の結果,DDQNは検査条件下での負の移動を一貫して避けていることがわかった。
デューリングDQNは、劣化した報酬と不安定な最適化挙動を特徴とする、同一条件下での負の転移を一貫して示している。
論文参考訳(メタデータ) (Tue, 10 Feb 2026 14:18:03 GMT)