Bringing Reasoning to Generative Recommendation Through the Lens of Cascaded Ranking [107.1] ジェネレーティブ・レコメンデーション(GR)は、資源効率の高いレコメンデーションのために、FLOPSの利用率の高いエンド・ツー・エンドのアプローチとして期待されている。
現在のGRモデルは,トークン生成が進むにつれてトークンレベルのバイアスがエスカレートする,重要なtextbfbias増幅問題に悩まされていることを示す。
バイアス増幅問題に対処するためには、GR to 1) がより異質な情報を導入し、2) トークン生成ステップごとにより大きな計算資源を割り当てることが重要である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:10:54 GMT)
Accelerating Scientific Research with Gemini: Case Studies and Common Techniques [105.2] 大規模言語モデル(LLM)は、科学研究を加速するための新たな道を開いた。
先進的なAIモデルとどのように協力したかを示すケーススタディのコレクションを提示する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:56:17 GMT)
Privasis: Synthesizing the Largest "Public" Private Dataset from Scratch [101.5] 私たちはPrivasisを紹介します。Privasisは、スクラッチから完全に構築された最初の100万規模の完全合成データセットです。
既存のデータセットと比較すると、Privasisは質の高いマグニチュードスケールを提供する。
我々はPrivasisを利用して、テキストを分解してターゲット衛生に適用するパイプラインで、テキスト衛生のための並列コーパスを構築する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:54:46 GMT)
Infinite-World: Scaling Interactive World Models to 1000-Frame Horizons via Pose-Free Hierarchical Memory [101.2] 複雑な実環境において,1000フレーム以上のコヒーレントな視覚記憶を維持することのできる,堅牢な対話型世界モデルを提案する。
我々は,歴史的潜水剤を固定予算の幾何学的表現に蒸留するpose-free Memory (HPMC)を導入する。
また,連続動作を三状態論理に識別する不確実性認識型アクションラベルモジュールを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:06:38 GMT)
RANKVIDEO: Reasoning Reranking for Text-to-Video Retrieval [99.3] 本稿では,ビデオ検索のための推論に基づくリランカであるRANKVIDEOを紹介する。
RANKVIDEOは、関連性を評価するためにビデオコンテンツを使用するクエリ-ビデオペアを明示的に理由付けている。
大規模なMultiVENT 2.0ベンチマークの実験では、RANKVIDEOは2段階のフレームワーク内での検索性能を一貫して改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:18:39 GMT)
SWE-World: Building Software Engineering Agents in Docker-Free Environments [91.2] SWE-Worldは、物理的な実行環境を、ソフトウェアエンジニアリングエージェントのトレーニングと評価のための学習的なサロゲートに置き換える、Dockerフリーのフレームワークである。
我々は,SWE-WorldがQwen2.5-Coder-32Bを,DockerフリーのSFTで6.2%から52.0%,DockerフリーのRLで55.0%,さらにTSで68.2%に引き上げたことを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:44:39 GMT)
Time Is All It Takes: Spike-Retiming Attacks on Event-Driven Spiking Neural Networks [87.2] スパイキングニューラルネットワーク(SNN)は離散スパイクで計算し、時間構造を利用する。
イベント駆動SNNにおけるスパイク数と振幅を保存しながら、既存のスパイクを繰り返すタイミングのみの敵について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:06:53 GMT)
ConsistentRFT: Reducing Visual Hallucinations in Flow-based Reinforcement Fine-Tuning [85.2] フローベースモデル上での強化ファインチューニング(RFT)は、優先順位調整に不可欠である。
RFTは、過度に最適化された詳細や意味的なミスアライメントのような視覚幻覚をしばしば導入する。
この研究は、なぜ視覚幻覚が生じるのか、どのようにそれらを減らすのかを予備的に探求する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:49:46 GMT)
ForesightKV: Optimizing KV Cache Eviction for Reasoning Models by Learning Long-Term Contribution [84.4] 我々は、長文世代におけるどのKVペアを退避させるかを予測する訓練ベースのKVキャッシュ消去フレームワークを開発した。
我々は、マルコフ決定過程としてキャッシュ消去を定式化し、GRPOアルゴリズムを適用し、低エントロピートークンにおける言語モデリング損失の増加を緩和する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:16:51 GMT)
Quant VideoGen: Auto-Regressive Long Video Generation via 2-Bit KV-Cache Quantization [83.4] Quant VideoGen(QVG)は、自動回帰ビデオ拡散モデルのためのトレーニングフリーなKVキャッシュ量子化フレームワークである。
これにより、KVメモリを最大7.0倍に削減できる。
生成品質において、既存のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:54:32 GMT)
Nüwa: Mending the Spatial Integrity Torn by VLM Token Pruning [82.4] ビジョントークンプルーニングは、効率的なビジョン言語モデル(VLM)のための効果的なアクセラレーション手法であることが証明された。
空間的整合性を維持しつつ,効率的な特徴集約を実現するための2段階のトークンプルーニングフレームワークである$textNwa$を提案する。
実験によると、textNwa$は複数のVQAベンチマーク(94%から95%)でSOTAのパフォーマンスを達成し、視覚的グラウンドタスク(7%から47%)を大幅に改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:51:03 GMT)
FactNet: A Billion-Scale Knowledge Graph for Multilingual Factual Grounding [81.2] LLMは顕著な流布を示し、その効用は事実の幻覚と追跡可能な証明の欠如によってしばしば損なわれる。
私たちはFactNetを紹介します。FactNetは17億の原子的主張と、316のウィキペディア版から派生した37億の監査可能なエビデンスポインタを統合するために設計された、巨大なオープンソースリソースです。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:44:11 GMT)
$V_0$: A Generalist Value Model for Any Policy at State Zero [80.8] ポリシーメソッドは、アクションの相対的な利点を測定するためにベースラインに依存します。
このベースラインは一般的に、政策モデルそのものと同じくらい大きな価値モデル(Critic)によって推定される。
未知のプロンプト上での任意のモデルの期待性能を推定できるジェネリスト値モデルを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:35:23 GMT)
Learning Query-Specific Rubrics from Human Preferences for DeepResearch Report Generation [80.1] 本稿では,DeepResearchレポート生成に適した,人間の参照型クエリ専用ルーリックジェネレータを訓練するためのパイプラインを提案する。
まず,DeepResearchスタイルのアノテートクエリのデータセットを,ペアレポートよりも人間の好みで構築し,強化学習を通じてルーリックジェネレータを訓練する。
提案したルーリック・ジェネレータは既存のルーリック・デザイン・ストラテジーよりも、より差別的で優れたヒューマン・アライメント・インテリジェンスを実現することを実証的に示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:09:56 GMT)
DDP-WM: Disentangled Dynamics Prediction for Efficient World Models [79.5] 本稿では,DDP-WMについて紹介する。DDP-WMはDDP-WM(Distangled Dynamics Prediction)の原理に基づく新しい世界モデルである。
DDP-WMは、効率的な履歴処理と動的ローカライゼーションを統合したアーキテクチャにより、この分解を実現する。
実験により、DDP-WMは様々なタスクにおいて、大幅な効率と性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:48:57 GMT)
Audit After Segmentation: Reference-Free Mask Quality Assessment for Language-Referred Audio-Visual Segmentation [79.1] Ref-AVSコンテキストにおけるマスク品質評価(MQA-RefAVS)
MQA-RefAVSは、地平線アノテーションに頼ることなく、候補セグメンテーションマスクの品質を評価するタスクである。
本稿では,マルチモーダルな大規模言語モデル(MLLM)に基づく監査ツールMQ-Auditorを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:47:59 GMT)
Seeing Through the Chain: Mitigate Hallucination in Multimodal Reasoning Models via CoT Compression and Contrastive Preference Optimization [78.9] マルチモーダル推論モデル (Multimodal reasoning model, MLRM) は幻覚の傾向が強く, 効果的な解はいまだ未発見のままである。
textbfCompression と textbfPreference textbfOptimization を組み合わせたトレーニングベースの緩和フレームワーク C3PO を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:00:55 GMT)
SWE-Master: Unleashing the Potential of Software Engineering Agents via Post-Training [78.4] 本稿では,効率的なソフトウェアエンジニアリングエージェントを構築するためのオープンソースフレームワークであるSWE-Masterを紹介する。
SWE-Masterは、教師-軌道合成やデータキュレーションを含む、完全なエージェント開発パイプラインを体系的に探索する。
SWE-bench Verified(SWE-bench Verified)は,現実的なソフトウェアエンジニアリングタスクの標準ベンチマークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:38:48 GMT)
ELIQ: A Label-Free Framework for Quality Assessment of Evolving AI-Generated Images [76.5] 本稿では,AI生成画像の品質評価のためのラベルフリーフレームワークELIQを提案する。
具体的には、ELIQは視覚的品質と迅速なイメージアライメントに重点を置いている。
従来の歪みとAIGC固有の歪みモードの両方をカバーするために、正とアスペクト固有の負のペアを自動的に構成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:04:51 GMT)
Parallel-Probe: Towards Efficient Parallel Thinking via 2D Probing [76.5] Parallel-Probeは、オンライン並列思考を最適化するために設計されたトレーニング不要のコントローラである。
競合精度を維持しつつ、シーケンシャルトークンを最大$textbf35.8$%、トータルトークンコストを$textbf25.8$%まで削減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:59:41 GMT)
BASS: Benchmarking Audio LMs for Musical Structure and Semantic Reasoning [74.8] 本稿では,音声言語モデルにおける音楽理解と推論の評価を目的としたBASSを紹介する。
BASSは12のタスクにまたがる2658の質問、1993年の独特な曲、138時間以上の音楽をカバーしている。
我々は14のオープンソースおよびフロンティアマルチモーダルLMを評価し、最先端モデルでさえ高いレベルの推論タスクに苦しむことを発見した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:40:31 GMT)
ObjEmbed: Towards Universal Multimodal Object Embeddings [74.4] 我々は、新しい個別オブジェクト埋め込みモデルであるEmbedを提示する。
入力画像を複数の局所的な埋め込みに分解し、それぞれが個々のオブジェクトに対応し、グローバルな埋め込みを行う。
ビジュアル検索、ローカル画像検索、グローバル画像検索など、幅広い視覚的理解タスクをサポートする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:33:25 GMT)
ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation [72.8] ARTIS(Agenic Risk-Aware Test-Time Scaling via Iterative Simulation)は、コミットメントから探索を分離するフレームワークである。
LLMをベースとした簡易シミュレータは, 希少かつ高インパクトな障害モードの捕捉に苦慮していることを示す。
本稿では,障害発生行動の忠実度を強調するリスク認識ツールシミュレータを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:19:49 GMT)
Toward a Sustainable Federated Learning Ecosystem: A Practical Least Core Mechanism for Payoff Allocation [71.9] 最小コア(LC)概念に基づく配当フレームワークを提案する。
従来の方法とは異なり、LCは最大の不満を最小限に抑えてフェデレーションの凝集を優先する。
統合侵入検知におけるケーススタディは、我々のメカニズムが重要な貢献者や戦略的提携を正しく識別できることを実証している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:10:50 GMT)
Anytime Pretraining: Horizon-Free Learning-Rate Schedules with Weight Averaging [70.1] 本研究では, 1-32xChinchillaスケールで学習した言語モデルが時間とともに減衰し, 問題の発生源とキャパシティ条件によって減衰速度が決定されることを示した。
以上の結果から,重み付き平均化と地平線なしのステップサイズを組み合わせることで,大規模言語モデルの事前学習におけるコサイン学習率のスケジュールに代わる実用的で効果的な選択肢が得られることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:24:05 GMT)
Conflict-Resolving and Sharpness-Aware Minimization for Generalized Knowledge Editing with Multiple Updates [69.7] CoRSAは、複数の更新を伴う知識編集のためのパラメータ効率が高く、全体的なアプローチである。
異なる入力形式への一般化を改善し、複数の更新の安定性を向上させる。
CoRSAはまた、コードドメインに一般化し、更新の有効性において5.48%のPass@5で最強のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:18:06 GMT)
EventNeuS: 3D Mesh Reconstruction from a Single Event Camera [69.5] イベントカメラは多くのシナリオでRGBカメラに代わるものを提供する。
単色イベントストリームから3D表現を学習するための,自己教師型ニューラルネットワークEventNeuSを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:59:57 GMT)
Short Chains, Deep Thoughts: Balancing Reasoning Efficiency and Intra-Segment Capability via Split-Merge Optimization [68.9] 大規模推論モデル(LRM)は、長い推論連鎖の生成を通じて複雑なタスクを解く際、印象的な能力を示した。
textbfCoSMo(textbfSplit-textbfMerge textbfOptimization)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:54:28 GMT)
HUSKY: Humanoid Skateboarding System via Physics-Aware Whole-Body Control [67.6] 本稿では,ヒューマノイド・スケータボードシステムモデリングと物理を意識した全身制御を統合した学習ベースのフレームワークを提案する。
Unitree G1のヒューマノイドプラットフォームでの実験では、現実のシナリオにおいて、私たちのフレームワークがスケートボード上で安定的でアジャイルな操作を可能にすることが示されています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:18:01 GMT)
Verified Critical Step Optimization for LLM Agents [67.1] クリティカルステップ最適化は、検証されたクリティカルステップに優先学習を集中する。
メソッドは、専門家のデモンストレーションではなく、失敗するポリシーの軌道から始まります。
GAIA-Text-103とXBench-DeepSearchの実験では、CSOはSFTベースラインよりも37%、相対的に26%改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:41:02 GMT)
Causal Inference on Networks under Misspecified Exposure Mappings: A Partial Identification Framework [66.6] ネットワーク上の因果推論のための新しい部分同定フレームワークを提案する。
露光マッピングの誤用下では, 直接的および漏出的効果に対して, 鋭い上下境界を導出する。
実験の結果, 境界は情報的であり, 露光写像の誤特定の下では信頼性の高い結論が得られた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:27:11 GMT)
ConsisDrive: Identity-Preserving Driving World Models for Video Generation by Instance Mask [65.4] ConsisDriveは、インスタンスレベルで時間的一貫性を強制するために設計された、ID保存駆動の世界モデルである。
当社のフレームワークには,インスタンスマインド・アテンションとインスタンスマインド・ロスという,2つの重要なコンポーネントが組み込まれています。
ConsisDriveは最先端の駆動ビデオ生成品質を実現し、nuScenesデータセット上での下流での自律運転タスクを大幅に改善した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:28:44 GMT)
UNIKIE-BENCH: Benchmarking Large Multimodal Models for Key Information Extraction in Visual Documents [65.1] 近年の大規模マルチモーダルモデルでは,文書画像から直接,エンドツーエンドのKIEを実行する可能性が高まっている。
我々は,LMMのKIE能力を厳格に評価するベンチマークであるUNIKIE-BENCHを紹介する。
15の最先端のLMMの実験では、多様なスキーマ定義、ロングテールキーフィールド、複雑なレイアウトの下での大幅な性能低下が示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:04:56 GMT)
DuoGen: Towards General Purpose Interleaved Multimodal Generation [65.1] DuoGenは汎用的なインターリーブ生成フレームワークで、データキュレーション、アーキテクチャ設計、評価に対処する。
我々は、キュレートされた生のWebサイトから書き直されたマルチモーダルな会話を組み合わせることで、大規模で高品質な命令チューニングデータセットを構築する。
2段階の切り離し戦略はまずMLLMをインストラクションチューニングし、次にインターリーブされた画像テキストシーケンスを使用してDiTをアライメントする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:54:14 GMT)
Risky-Bench: Probing Agentic Safety Risks under Real-World Deployment [64.4] 大規模言語モデル(LLM)は、現実の環境で運用されるエージェントとして、ますます多くデプロイされている。
既存のエージェントの安全性評価は、特定のエージェント設定に合わせて、リスク指向のタスクに依存する。
本稿では,現実の展開に根ざした組織的エージェント安全評価を実現するフレームワークであるR Risky-Benchを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:44:11 GMT)
Rethinking the Reranker: Boundary-Aware Evidence Selection for Robust Retrieval-Augmented Generation [64.1] Retrieval-Augmented Generation (RAG) システムは、現実的な検索ノイズの下でも不安定である。
そこで我々は,BAR-RAGを提案する。このBAR-RAGは,発電機のGoldilocks Zoneをターゲットとした境界認識型エビデンスセレクタである。
Bar-RAGはノイズ検索において、エンドツーエンドのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:08:23 GMT)
Accordion-Thinking: Self-Regulated Step Summaries for Efficient and Readable LLM Reasoning [62.7] 我々はLLMが動的要約によって推論ステップの粒度を自己制御することを学ぶエンドツーエンドのフレームワークを紹介した。
高い効率のFoldモードと徹底的なUnfoldモードの精度ギャップを徐々に狭めていくという重要な知見を見出し,この能力をさらにインセンティブ化するために強化学習を適用した。
私たちのAccordion-Thinkerは、学習した自己圧縮により、LLMは依存性トークンのオーバーヘッドを最小限に抑えながら複雑な推論タスクに取り組むことができることを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:34:20 GMT)
Steering Externalities: Benign Activation Steering Unintentionally Increases Jailbreak Risk for Large Language Models [62.2] 活性化ステアリングは大規模言語モデル(LLM)の有用性を高める技術である
重要かつ過度に調査された安全リスクを無意識に導入することを示します。
実験によると、これらの介入は強制乗算器として機能し、ジェイルブレイクに新たな脆弱性を発生させ、標準ベンチマークで攻撃成功率を80%以上向上させる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:32:35 GMT)
To Search or Not to Search: Aligning the Decision Boundary of Deep Search Agents via Causal Intervention [61.8] 我々は,不整合決定境界の根本原因を同定し,蓄積した情報が回答するのに十分であるかどうかをしきい値に判定する。
これにより、過剰探索(十分な知識にもかかわらず冗長探索)と過度探索(早期終了)が誤った答えをもたらす。
まず,境界誤差を識別する因果的介入に基づく診断手法を提案する。
第2に,Deep Search Agent(DAS)のための決定境界アライメントを開発する。
我々のDAS法はこれらの境界を効果的に校正し、オーバーサーチとアンダーサーチの両方を緩和し、精度と効率を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:29:06 GMT)
Acceleration of Atomistic NEGF: Algorithms, Parallelization, and Machine Learning [61.1] 非平衡グリーン関数(NEGF)はナノスケールデバイスの量子輸送特性をシミュレートする強力な方法である。
本稿では,DFT+NEGFシミュレーションを現実的なシステムの次元や機能に近づけるための重要な(アルゴリズム的な)成果を要約する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:01:39 GMT)
Conformal Thinking: Risk Control for Reasoning on a Compute Budget [60.7] 大規模言語モデル(LLM)の推論により、トークンの予算が増加するにつれて、データセットレベルの精度が向上する。
我々は、予算設定問題をリスクコントロールとして再設定し、計算を最小化しながらエラー率を制限する。
我々のフレームワークは、モデルが自信のあるときに推論を停止する上位しきい値と、未解決のインスタンスを事前に停止させる新しい下位しきい値を導入する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:17:22 GMT)
Bridging Online and Offline RL: Contextual Bandit Learning for Multi-Turn Code Generation [60.1] マルチターンコード生成は、一段階回復可能なマルコフ決定プロセスとして定式化することができる。
Cobaltは、オンラインとオフラインのRLの利点を組み合わせた新しい方法である。
私たちの結果は、コード生成のような反復的な意思決定タスクのための有望なソリューションとして、Cobaltを実証しています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:08:41 GMT)
Do We Need Asynchronous SGD? On the Near-Optimality of Synchronous Methods [59.7] 我々はsynchronous SGDとその頑健な変種である$m$-Synchronous SGDを再検討し、多くの異種計算シナリオにおいてほぼ最適であることを示す。
同期メソッドは普遍的な解ではなく、非同期メソッドが必要なタスクが存在するが、現代の不均一な計算シナリオの多くに十分であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:02:14 GMT)
MAS-ProVe: Understanding the Process Verification of Multi-Agent Systems [59.2] マルチエージェントシステム(MAS)におけるプロセス検証の系統的研究であるMAS-ProVeを提案する。
本研究は3つの検証パラダイム(LLM-as-a-Judge、報酬モデル、プロセス報酬モデル)にまたがる。
プロセスレベルの検証は、常に性能を改善しておらず、しばしば高いばらつきを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:30:36 GMT)
AR-MAP: Are Autoregressive Large Language Models Implicit Teachers for Diffusion Large Language Models? [58.5] 拡散大言語モデル(DLLM)は自己回帰モデルに代わる強力な代替手段として登場した。
エビデンス・ロウアー・バウンド(ELBO)による推定結果から,DLLMの選好アライメントは依然として困難である。
本稿では,選択整合型自己回帰LDMを暗黙の教師として活用し,分散Mアライメントのための新しい伝達学習フレームワークであるAR-MAPを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:22:33 GMT)
A Lightweight Library for Energy-Based Joint-Embedding Predictive Architectures [58.3] JEPA(Joint-Embedding Predictive Architectures)を用いた表現と世界モデルを学習するためのオープンソースのライブラリであるEB-JEPAを提案する。
JEPAsは、ピクセル空間ではなく表現空間で予測することを学び、生成モデリングの落とし穴を避ける。
これらの表現がどのように行動条件付き世界モデルを駆動し、Two Roomsナビゲーションタスクで97%の計画成功率を達成するかを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:56:24 GMT)
Unveiling Covert Toxicity in Multimodal Data via Toxicity Association Graphs: A Graph-Based Metric and Interpretable Detection Framework [58.0] Toxicity Association Graphs (TAG) に基づく新しい検出フレームワークを提案する。
隠れ毒性の定量化のための最初の指標であるMTC(Multimodal Toxicity Covertness)を紹介する。
本手法は,意思決定プロセスの完全解釈可能性を維持しつつ,隠蔽毒性の正確な同定を可能にする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:54:25 GMT)
Co-RedTeam: Orchestrated Security Discovery and Exploitation with LLM Agents [57.5] 大規模言語モデル(LLM)はサイバーセキュリティタスクを支援することを約束しているが、既存のアプローチでは自動脆弱性発見とエクスプロイトに苦労している。
Co-RedTeamは,現実世界のレッドチームのミラーリングを目的とした,セキュリティを意識したマルチエージェントフレームワークである。
Co-RedTeamは、脆弱性分析をコーディネートされた発見およびエクスプロイトステージに分解し、エージェントがアクションを計画、実行、検証、洗練できるようにする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:29:37 GMT)
AgentArk: Distilling Multi-Agent Intelligence into a Single LLM Agent [57.1] AgentArkは、マルチエージェントダイナミクスを単一のモデルの重みに蒸留する新しいフレームワークである。
各種モデル,タスク,スケーリング,シナリオの3つの階層的蒸留戦略について検討する。
シミュレーションからトレーニングへ計算の負担をシフトさせることで、蒸留されたモデルは、複数のエージェントの強い推論と自己補正性能を示しながら、一つのエージェントの効率を保ちます。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:18:28 GMT)
Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles [56.7] Wiki Live Challenge (WLC)は、最新のWikipedia Good Articles(GA)をエキスパートレベルの参照として活用する、ライブベンチマークである。
Wiki Evalは, 品質基準39の細粒度評価手法と, 事実検証性のための厳密な指標を含む総合的な評価フレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:51:16 GMT)
EventFlash: Towards Efficient MLLMs for Event-Based Vision [55.7] イベントベースのマルチモーダル言語モデル(LMLM)は、高速・低照度シナリオにおける堅牢な認識を可能にする。
EventMindは、500k以上の命令セットを備えた大規模でシーンのさまざまなデータセットです。
本稿では、時間的トークンを適応的に圧縮する効率的な時間的サンプリングのための適応時間的ウィンドウアグリゲーションモジュールを提案する。
EventFlashはイベントベースのビジョンの効率的な基盤モデルであると考えています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:06:45 GMT)
CPMobius: Iterative Coach-Player Reasoning for Data-Free Reinforcement Learning [55.4] CPMbius(CPMobius)は推論モデルのデータフリー強化学習のためのCoach-Playerパラダイムである。
従来の対戦型自己プレーとは異なり、CPMbiusはコーチとプレーヤを独立しているが協力的な役割として扱う。
CPMbiusは、外部のトレーニングデータに頼ることなく、大幅に改善され、既存の教師なしアプローチよりも優れています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:38:53 GMT)
Fixed Budget is No Harder Than Fixed Confidence in Best-Arm Identification up to Logarithmic Factors [55.4] ベストアーム識別(BAI)問題は、インタラクティブ機械学習における最も基本的な問題の1つである。
ユニークなベストアームを備えた$Kの腕のバンディットでは、両方の設定に最適なサンプルの複雑さが解決されている。
FB は対数因子に比較して FC ほど難しくないことを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:49:55 GMT)
General learned delegation by clones [55.1] シリアル推論や非協調並列サンプリングは、固定された推論予算の下では計算非効率である。
本研究では,SELFCESTを提案する。SELFCESTは,同じクローンを異なる並列コンテキストで生成する機能を備えたベースモデルである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:53:35 GMT)
Merging Beyond: Streaming LLM Updates via Activation-Guided Rotations [55.0] Streaming Mergingは、反復最適化プロセスとしてマージを概念化する革新的なモデル更新パラダイムである。
ARMは勾配勾配勾配のダイナミクスを近似するために設計された戦略である。
ARMは初期のSFTチェックポイントしか必要とせず、反復的なマージによって完全に収束したSFTモデルを上回る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:15:57 GMT)
On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models [54.6] エントロピーは、大きな言語モデルによって生成される出力の多様性を測定するための重要な指標となる。
近年の研究では、強化微調整における探究と利用のバランスを改善するために、エントロピーの監視と調整に重点を置いている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:14:58 GMT)
Causal Graph Learning via Distributional Invariance of Cause-Effect Relationship [54.6] 本研究では,観測変数数の2次複雑性と因果関係を効率的に発見するアルゴリズムを開発した。
大規模データセットの様々なベンチマークによる実験は、既存の研究よりも優れた、あるいは同等な性能を示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:26:16 GMT)
LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.6] 我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:54:35 GMT)
IntentRL: Training Proactive User-intent Agents for Open-ended Deep Research via Reinforcement Learning [54.2] Deep Research (DR)エージェントは、パラメトリック知識を超えてLarge Language Models (LLM)を拡張する。
リアルタイムの会話アシスタントとは異なり、DRは計算に高価で時間を要する。
IntentRLは、長期研究を始める前に、潜在ユーザ意図を明らかにするためにプロアクティブエージェントを訓練するフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:43:09 GMT)
PEGRL: Improving Machine Translation by Post-Editing Guided Reinforcement Learning [54.2] textbfPEGRLは、後編集を補助タスクとして用い、トレーニングを安定させ、全体的な最適化を導く2段階のRLフレームワークである。
英語$to$Finnish、英語$to$Turkish、英語$leftrightarrow$ Chineseでの実験は、RLベースラインよりも一貫した利得を示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:22:55 GMT)
ALPBench: A Benchmark for Attribution-level Long-term Personal Behavior Understanding [53.9] ALPBenchは属性レベルの長期的個人行動理解のためのベンチマークである。
ユーザと興味のある属性の組み合わせを予測し、基幹構造評価を可能にする。
ユーザの明示的に表現された要求よりも、長期的な歴史的行動の好みをモデル化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:32:16 GMT)
InstaDrive: Instance-Aware Driving World Models for Realistic and Consistent Video Generation [53.5] InstaDriveは、2つの重要な進歩を通じてビデオリアリズムを促進する新しいフレームワークである。
これらのインスタンス認識機構を組み込むことで、InstaDriveは最先端のビデオ生成品質を実現する。
私たちのプロジェクトページはhttps://shanpoyang654.io/InstaDrive/page.htmlです。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:22:13 GMT)
MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.4] MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。
マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。
6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:47:49 GMT)
Multi-Resolution Alignment for Voxel Sparsity in Camera-Based 3D Semantic Scene Completion [53.0] カメラベースの3Dセマンティックシーン補完(SSC)は、周囲の3Dシーンにおける各ボクセルの幾何学的占有度と意味ラベルを画像入力で評価するためのコスト効率の良いソリューションを提供する。
既存の手法は、自律運転シナリオにおけるボクセルの大部分が空であるので、ボクセルの空間性という課題に直面している。
カメラを用いた3Dセマンティックシーン補完におけるボクセル空間の分散を緩和するために,textitMulti-Resolution Alignment (MRA) アプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:46:51 GMT)
LSGQuant: Layer-Sensitivity Guided Quantization for One-Step Diffusion Real-World Video Super-Resolution [52.6] 本稿では,一段階拡散に基づく実世界VSRのための層感度誘導量子化手法LSGQuantを紹介する。
本手法は,ビデオトークンのアクティベーションに適合する動的レンジ適応量子化器 (DRAQ) を備える。
提案手法は,完全精度のオリジンモデルに対してほぼ性能が良く,既存の量子化手法をはるかに上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:53:19 GMT)
Towards Distillation-Resistant Large Language Models: An Information-Theoretic Perspective [52.3] 既存の防衛はテキストベースの蒸留のみに重点を置いており、重要なロジットベースの蒸留はほとんど探索されていない。
我々は,教師のロジットと接地木ラベルに条件付けされた入力クエリ間の条件付き相互情報(CMI)を用いて,教師出力の蒸留関連情報を特徴付ける。
我々は,CMIにインスパイアされた抗蒸留目標を導出し,この変換を最適化し,出力ユーティリティを保ちながら蒸留関連情報を効果的に除去する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:16:59 GMT)
Structure-Informed Estimation for Pilot-Limited MIMO Channels via Tensor Decomposition [51.6] 本稿では、スパース観測から低ランクテンソル完備化としてパイロットリミテッドチャネル推定を定式化する。
合成チャネル実験による最小二乗平均二乗誤差(NMSE)の最小二乗平均誤差(LS)に対する改善
DeepMIMO線トレーシングチャネルの評価では、純粋なテンソル法よりも24-44%NMSEが減少している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:38:05 GMT)
Echo State Networks for Time Series Forecasting: Hyperparameter Sweep and Benchmarking [51.6] 我々は、完全に自動で純粋にフィードバック駆動のESNが、広く使われている統計的予測手法の代替となるかどうかを評価する。
予測精度は、MASEとsMAPEを用いて測定され、ドリフトや季節予測、統計モデルといった単純なベンチマークと比較される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:01:22 GMT)
LPS-Bench: Benchmarking Safety Awareness of Computer-Use Agents in Long-Horizon Planning under Benign and Adversarial Scenarios [51.5] LPS-Benchは,長期作業下でのMPPベースのCUAの計画時安全意識を評価するベンチマークである。
実験は、安全な行動を維持する既存のCUAの能力に重大な欠陥があることを明らかにする。
MCPに基づくCUAシステムにおける長期計画の安全性向上のための緩和戦略を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:40:24 GMT)
PluRel: Synthetic Data unlocks Scaling Laws for Relational Foundation Models [51.4] マルチタブラルリレーショナルデータベースをスクラッチから合成するフレームワークであるPluelを紹介する。
ステップバイステップの方法では,(1)有向グラフのスキーマ,(2)二部グラフのテーブル間一次外部キー接続,(3)条件因果機構によるテーブル内の特徴分布をモデル化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:35:18 GMT)
Contextualized Visual Personalization in Vision-Language Models [51.3] 本稿では、コンテキスト化された視覚的パーソナライゼーションのコアタスクとして、パーソナライズされた画像キャプションを扱う統一的なフレームワークを提案する。
実験では、CoViPはパーソナライズされた画像キャプションを改善するだけでなく、下流のパーソナライゼーションタスク全体で全体的利益をもたらす。
これらの結果から、CoViPは、堅牢で一般化可能な視覚的パーソナライゼーションを実現するための重要な段階であることが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:21:26 GMT)
GFlowPO: Generative Flow Network as a Language Model Prompt Optimizer [51.3] GFlowPOは、メタプロンプト参照-LMにより正規化される潜在プロンプトに対する後部推論問題としてプロンプトをキャストする。
GFlowPOは、最近の離散的なプロンプト最適化ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:30:03 GMT)
CVE-Factory: Scaling Expert-Level Agentic Tasks for Code Security Vulnerability [50.6] CVE-Factoryは、脆弱性タスクを自動変換するエキスパートレベルの品質を実現するための、最初のマルチエージェントフレームワークである。
最新の現実的な脆弱性についても評価され、66.2%の成功が証明されている。
コードセキュリティにおけるエージェントタスクの大規模スケーリングとして,1000以上の実行可能なトレーニング環境を合成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:27:16 GMT)
Why Self-Rewarding Works: Theoretical Guarantees for Iterative Alignment of Language Models [50.2] 自己回帰言語モデル(SRLM)は、外部からのフィードバックなしに反復的にアライメントを改善することに成功している。
本稿では,SRLMの厳密な理論的保証について述べる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:16:33 GMT)
Refer-Agent: A Collaborative Multi-Agent System with Reasoning and Reflection for Referring Video Object Segmentation [50.2] Referring Video Object (RVOS)は、テキストクエリに基づいたビデオ内のオブジェクトのセグメンテーションを目的としている。
Refer-Agent (Refer-Agent) は、共用多エージェントシステムである。
SFTベースのモデルとゼロショットアプローチの両方を含む最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:48:12 GMT)
Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [50.0] 本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:32:09 GMT)
ReMiT: RL-Guided Mid-Training for Iterative LLM Evolution [49.5] トレーニングのダイナミクスを分析し,中間学習フェーズをモデル能力の重要な転換点として同定する。
本稿では,ReMiT(Reinforcement Learning-Guided Mid-Training)を導入する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:04:41 GMT)
HetroD: A High-Fidelity Drone Dataset and Benchmark for Autonomous Driving in Heterogeneous Traffic [49.3] HetroDは、異種環境で自律走行システムを開発するためのデータセットとベンチマークである。
HetroDは、VRU(vulner- able road users)が支配する現実の異種交通のナビゲーティングにおける重要な課題をターゲットにしている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:12:47 GMT)
Spiral RoPE: Rotate Your Rotary Positional Embeddings in the 2D Plane [49.1] Spiral RoPEは、多方向位置符号化を可能にするシンプルで効果的な拡張である。
分類、セグメンテーション、生成を含む幅広い視覚タスクにおいて、Spral RoPEは一貫して性能を改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:56:58 GMT)
Beyond Independent Genes: Learning Module-Inductive Representations for Gene Perturbation Prediction [48.8] scBIGは、協調した遺伝子プログラムを明示的にモデル化するモジュール誘導予測フレームワークである。
scBIGは、特に目に見えない、摂動的な設定において、最先端のメソッドを一貫して上回る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:43:40 GMT)
Universal One-third Time Scaling in Learning Peaked Distributions [48.4] 大規模言語モデル(LLMs)の訓練は、損失が低速なパワー・ロー・コンバージェンスを示すこともあって、計算コストがかかる。
本研究は,ソフトマックスとクロスエントロピーを用いて本質的にこの挙動が生じることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:06:18 GMT)
Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity [48.4] エージェント数ではなく,本質的なタスクの不確実性によってMAS性能が拘束されていることを示す情報理論フレームワークを提案する。
アーキテクチャに依存しないバウンダリを導出し、システムへのアクセスする有効なチャネルの数に依存することを示す。
本結果は,多様性を意識した設計を通じて,効率的で堅牢なMASを構築するための原則的ガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:58:10 GMT)
MM-SCALE: Grounded Multimodal Moral Reasoning via Scalar Judgment and Listwise Alignment [48.4] 本稿では、視覚言語モデルと人間の道徳的嗜好を整合させるデータセットMM-SCALEを提案する。
それぞれのイメージ・シナリオペアには、道徳的受容性スコアと、人間による根拠付き推論ラベルが注釈付けされている。
我々のフレームワークは、よりリッチなアライメント信号とマルチモーダルな道徳的推論のキャリブレーションを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:48:00 GMT)
FullStack-Agent: Enhancing Agentic Full-Stack Web Coding via Development-Oriented Testing and Repository Back-Translation [48.2] FullStack-Agentはフルスタックエージェントコーディングのための統合エージェントシステムである。
FullStack-Devは強力な計画、コード編集、ナビゲーション、バグローカライゼーション機能を備えたマルチエージェントフレームワークである。
当社のFullStack-Devは、bench、バックエンド、データベーステストケースで、それぞれ8.7%、38.2%、および15.9%のパフォーマンスで、従来の最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:01:34 GMT)
Morphe: High-Fidelity Generative Video Streaming with Vision Foundation Model [47.7] ビジョンファウンデーションモデル(VFM)は、強力なビデオ理解と処理能力を活用するために用いられる。
VFMに基づくエンドツーエンド生成ストリーミングを実現するための,最初の革新的パラダイムを提案する。
Morpheは、H.265と比較して62.5%の帯域幅を節約し、挑戦的なネットワーク環境ではリアルタイムで損失耐性のあるビデオ配信を実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:47:18 GMT)
Mitigating Conversational Inertia in Multi-Turn Agents [47.4] 我々は,従来の応答に対して,モデルが強い対角的注意を示す現象である会話慣性を特定する。
本研究では,高慣性応答よりも低慣性応答を優先するために,モデル選好を校正するコンテキスト選好学習を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:47:32 GMT)
Reasoning with Latent Tokens in Diffusion Language Models [47.3] 拡散モデルは、現在のステップではデコードされないものを含む、未知のトークンの分布を共同で予測するように訓練されていることを示す。
補助的マルチトークン予測により,潜在トークンを自己回帰モデルに導入できることを実証する。
以上の結果から,潜伏トークンは自然に拡散する一方で,グローバルコヒーレンスやルックアヘッドを必要とするタスクの性能向上のための一般的なメカニズムを示すことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:27:46 GMT)
Tiled Prompts: Overcoming Prompt Underspecification in Image and Video Super-Resolution [47.0] テキスト条件付き拡散モデルでは、プロンプトをセマンティック先行として使用することで、高度な画像とビデオの超解像が得られる。
画像とビデオの超解像のための統合されたフレームワークであるTiled Promptsを提案し、各潜伏タイルに対してタイル固有のプロンプトを生成し、局所的なテキスト条件で超解像を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:09:27 GMT)
The Necessity of a Unified Framework for LLM-Based Agent Evaluation [46.6] 汎用エージェントは基本的な進歩を見てきた。
これらのエージェントを評価すると、静的QAベンチマークと区別する固有の課題が提示される。
エージェント評価の厳格な向上には統一評価フレームワークが不可欠である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:18:37 GMT)
The Epistemic Planning Domain Definition Language: Official Guideline [46.5] 疫学計画ドメイン定義言語(EPDDL)について紹介する。
EPDDLは、DELセマンティクス全体をキャプチャするPDDLのようなユニークな表現を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:32:48 GMT)
Online Fine-Tuning of Pretrained Controllers for Autonomous Driving via Real-Time Recurrent RL [46.2] 実時間リカレント強化学習(RTRRL)は,運転作業における自律エージェントのパフォーマンスを向上させるための事前訓練されたポリシーを微調整できることを示す。
シミュレーションされたCarRacing環境と,イベントカメラを備えたRoboRacer車を用いた実世界のラインフォロータスクにおいて,このクローズドループアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:41:00 GMT)
Partition Trees: Conditional Density Estimation over General Outcome Spaces [46.2] 一般結果空間上での条件密度推定のための木に基づくフレームワークである分割木を提案する。
本手法は,データ適応分割における条件分布を一括一貫した密度としてモデル化し,条件付き負の対数関係を直接最小化して木を学習する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:12:30 GMT)
Emergent Analogical Reasoning in Transformers [46.1] 認知における中心的な役割にもかかわらず、トランスフォーマーがアナログ推論を習得し実装するメカニズムはいまだに理解されていない。
類推的推論をカテゴリー間の実体間の対応の推論として定式化する。
変換器における類似推論は、埋め込み空間における関係構造の幾何学的アライメントと、変換器内の関手の適用の2つの重要な構成要素に分解されることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:30:01 GMT)
When Routing Collapses: On the Degenerate Convergence of LLM Routers [46.0] ユーザのコスト予算が増加するにつれて、ルータは体系的に最も有能で最も高価なモデルにデフォルトとなる。
モデルランキングを直接学習する決定対応ルータであるEquiを提案する。
RouterBenchでは、最強の先行ルータと比較して、GPT-4レベルのパフォーマンスでコストを約17%削減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:51:55 GMT)
WebSentinel: Detecting and Localizing Prompt Injection Attacks for Web Agents [45.9] プロンプトインジェクション攻撃は、Webページのコンテンツを操作して、Webエージェントがユーザの意図したタスクではなく、攻撃者が指定したタスクを実行するようにする。
このような攻撃を検知し、局所化する既存の方法は、限られた有効性を実現する。
WebSentinel は,Web ページにおけるインジェクション攻撃の検出と局所化のための2段階のアプローチである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:55:04 GMT)
What Makes a Good Example? Modeling Exemplar Selection with Neural Network Representations [45.8] 教えるには、豊富なカテゴリの分布を少数の情報的例に蒸留する必要がある。
以前の研究は、人間が教える際の代表性と多様性の両方を考慮することを示している。
ニューラルネットワークの特徴表現と原理化されたサブセット選択基準を用いて、人間の模範選択をモデル化することにより、このギャップに対処する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:57:02 GMT)
PnP-U3D: Plug-and-Play 3D Framework Bridging Autoregression and Diffusion for Unified Understanding and Generation [45.7] 本稿では,自己回帰と拡散を組み合わせた3次元理解・生成のための最初の統合フレームワークを提案する。
軽量トランスは、大きな言語モデルの特徴空間と3次元拡散モデルの条件空間を橋渡しする。
本フレームワークは,多種多様な3次元理解および生成ベンチマークにおける最先端性能を実現するとともに,3次元編集タスクにも優れる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:49:23 GMT)
VIRAL: Visual In-Context Reasoning via Analogy in Diffusion Transformers [45.7] VIRALは、事前訓練された画像編集モデルから視覚的推論を引き出すフレームワークである。
我々は,役割認識型マルチイメージコンディショニングを用いた凍結拡散変換器 (DiT) を適応し,勾配干渉を軽減するためにMixture-of-Experts LoRAを導入する。
実験により、VIRALは既存の手法よりも優れており、統一されたV-ICLパラダイムが視覚的タスクの大部分を処理できることが証明された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:27:23 GMT)
On (Im)possibility of Network Oblivious Transfer via Noisy Channels and Non-Signaling Correlations [45.6] 本研究は、ノイズの多い複数のアクセスチャネルと、正直だが真正な関係者間のブロードキャストチャネルを介して、ネットワークの不要な転送を実装することの基本的限界について検討する。
共有資源を任意の三部構成のノンシグナリングボックスとしてモデル化することにより、チャネルの挙動と結果の相関について統一的な視点を得る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:45:43 GMT)
Flaky Tests in a Large Industrial Database Management System: An Empirical Study of Fixed Issue Reports for SAP HANA [45.5] 不安定なテストは、同じバージョンのソースコードに対して複数回実行されると、異なる結果をもたらす。
様々な要因がテストのフレキネスを引き起こすことがある。
不安定なテストを修正するアプローチは、通常、特定の原因に対処するために調整される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:03:59 GMT)
Rank-Learner: Orthogonal Ranking of Treatment Effects [45.3] 意思決定問題は、正確な効果の大きさを推定するよりも、治療効果によって個人をランク付けする必要がある。
観察データから治療効果のランキングを直接学習する新しい2段階学習者であるランクラーナーを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:35:40 GMT)
From Vicious to Virtuous Cycles: Synergistic Representation Learning for Unsupervised Video Object-Centric Learning [45.2] 我々は、エンコーダとデコーダが相互に相互に洗練されるような活発なサイクルを導入する。
エンコーダとデコーダの間の表現的ギャップを埋めることで、SRLはビデオオブジェクト中心の学習ベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:11:58 GMT)
Stationarity and Spectral Characterization of Random Signals on Simplicial Complexes [45.0] 単体錯体上で定義されたランダム信号に対する確率的フレームワークを提案する。
具体的には、定常性の古典的な概念を一般化する。
複数の合成および実世界のシミュレーションを通して、これらの利点の実用性を実証的に実証する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:31:10 GMT)
LatentMem: Customizing Latent Memory for Multi-Agent Systems [44.6] トークン効率のよいエージェント固有のメモリをカスタマイズするための学習可能なマルチエージェントメモリフレームワークであるLatentMemを提案する。
具体的には、生の相互作用軌跡を軽量な形式で記憶する体験銀行と、検索された経験とエージェント固有の文脈に基づいて条件付けられたコンパクトな潜時記憶を合成するメモリ作曲家とを備える。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:03:16 GMT)
AgentDyn: A Dynamic Open-Ended Benchmark for Evaluating Prompt Injection Attacks of Real-World Agent Security System [44.5] AgentDynは60の挑戦的なオープンエンドタスクと560のインジェクションテストケースを特徴とするベンチマークである。
以前の静的ベンチマークとは異なり、AgentDynは動的プランニングを必要とし、有用なサードパーティの命令を組み込む。
最先端の10つの防衛に関する我々の評価は、既存の防衛のほとんどすべてが十分に安全でないか、重大な過防衛に悩まされていることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:20:42 GMT)
SharpTimeGS: Sharp and Stable Dynamic Gaussian Splatting via Lifespan Modulation [44.1] 静的領域と動的領域の両方の時間適応モデリングを実現するライフスパン対応の4Dガウスフレームワークを提案する。
提案手法は,4K解像度までのリアルタイムレンダリングをサポートしながら,最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:50:59 GMT)
Persona Generators: Generating Diverse Synthetic Personas at Scale [43.7] 人間と対話するAIシステムを評価するには、多様なユーザー集団の振る舞いを理解する必要がある。
生成エージェントベースモデリングにおける最近の研究は、大きな言語モデルが人間のような合成ペルソナを高い忠実度でシミュレートできることを示してきた。
本稿では,任意の状況に合わせて多様な合成集団を生成できるペルソナジェネレータを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:59:03 GMT)
BinaryDemoire: Moiré-Aware Binarization for Image Demoiréing [43.7] バイナリ化は、アクティベーションとウェイトの両方を1ビットに定量化することで、極端な圧縮機構を提供する。
本稿では,モアレ劣化の周波数構造を明示するバイナライズされた復調フレームワークであるBinaryDemoireを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:45:10 GMT)
Decoupling Skeleton and Flesh: Efficient Multimodal Table Reasoning with Disentangled Alignment and Structure-aware Guidance [43.5] 複雑なレイアウトと密結合構造情報により、LVLM(Large Vision-Language Models)ではテーブルイメージ上の推論が依然として困難である。
既存のソリューションは、しばしば高価な教師付きトレーニング、強化学習、あるいは外部ツールに依存し、効率とスケーラビリティを制限します。
最小限のアノテーションと外部ツールなしでテーブル推論にLVLMを適用するにはどうすればよいのか?
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:08:31 GMT)
TIDE: Trajectory-based Diagnostic Evaluation of Test-Time Improvement in LLM Agents [43.4] 自律型LLMエージェントの最近の進歩は、環境との反復的相互作用によって性能を向上させる能力を示している。
本稿では,TTIを3つの包括的かつ相互接続的な次元に分解するエージェント非依存および環境非依存のフレームワークであるテスト時間改善診断評価(TIDE)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:28:15 GMT)
Tutorial on Reasoning for IR & IR for Reasoning [43.2] 情報検索は長年,意味的関連性による文書のランク付けに重点を置いてきた。
実世界の情報には、論理的制約の実施、多段階推論、複数の証拠の合成が必要である。
AIコミュニティ全体で、研究者は推論の問題に対するソリューションを開発している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:24:36 GMT)
Modular Safety Guardrails Are Necessary for Foundation-Model-Enabled Robots in the Real World [42.7] 静的検証、モノリシックコントローラ、エンドツーエンドの学習ポリシーを含む既存のアプローチは、タスク、環境、人間の期待がオープンで、長い目で見たり、時間の経過とともに適応されるような環境では不十分である、と我々は主張する。
自律スタック全体にわたる包括的安全のためのアーキテクチャ基盤として,監視(評価)層と介入層からなるモジュール型安全ガードレールを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:41:51 GMT)
Optimization and Generation in Aerodynamics Inverse Design [41.8] 物理に基づく目的を持つ逆設計は、高次元幾何学と高価なシミュレーションを兼ね備えているため、難しい。
最適設計点と最適設計分布の2つの正準解を用いて逆設計を再検討する。
本稿では,コスト予測器の新たなトレーニング損失と,可塑性形状を保ちながら目的を向上する密度勾配最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:32:26 GMT)
Instruction Anchors: Dissecting the Causal Dynamics of Modality Arbitration [41.6] 以下に示すモダリティは、ユーザ命令に基づいてマルチモーダルコンテキストを選択的に利用するマルチモーダルな大規模言語モデルの能力として機能する。
命令トークンは、モダリティ仲裁のための構造的アンカーとして機能することを示す。
我々は、この仲裁を駆動する特別な注意ヘッドのスパースセットを同定する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:59:24 GMT)
Origin Lens: A Privacy-First Mobile Framework for Cryptographic Image Provenance and AI Detection [41.4] Origin Lensは、レイヤ化された検証アーキテクチャを通じて視覚的な偽情報をターゲットにした、プライバシ優先のモバイルフレームワークである。
サーバ側の検出システムとは異なり、Origin Lensは暗号化された画像証明とAI検出をデバイス上でローカルに実行する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:49:00 GMT)
RC-GRPO: Reward-Conditioned Group Relative Policy Optimization for Multi-Turn Tool Calling Agents [40.9] 報酬は希少であり、探索は高価であるため、大規模言語モデルではマルチターンのツールコールは困難である。
一般的なレシピであるSFTとGRPOは、グループ内報酬の変動が低いときに停止する。
本稿では、離散的な報酬トークンを用いて、探索を制御可能なステアリング問題として扱うRC-GRPOを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:47:32 GMT)
Enhancing Foundation VLM Robustness to Missing Modality: Scalable Diffusion for Bi-directional Feature Restoration [40.7] 本研究では,機能不足を効果的に回復するために,拡張拡散モデルをプラグ可能な中段階トレーニングモジュールとして導入する。
I)動的モダリティゲーティング(動的モダリティゲーティング)は、条件付き特徴を適応的に活用し、セマンティック一貫性のある特徴の生成を制御し、(II)双方向アライメントを実現するためにデュアルエンコーダのセマンティック空間をブリッジするクロスモーダル相互学習機構である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:06:35 GMT)
Best-of-Both-Worlds for Heavy-Tailed Markov Decision Processes [40.5] 重み付きフィードバック(HTMDP)を用いたマルコフ決定過程の検討
HTMDPの既存のアプローチは、環境において保守的であり、敵国体制では適応性が欠如している。
対戦環境におけるインスタンス依存の後悔と自己拘束環境における対数的インスタンス依存の後悔を保証するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:17:01 GMT)
Synthesizing File-Level Data for Unit Test Generation with Chain-of-Thoughts via Self-Debugging [40.3] 本稿では,高品質なUTトレーニングを実現するための新しいデータ蒸留手法を提案する。
このパイプラインをオープンソースプロジェクトの大規模なコーパスに適用します。
実験により, 微調整モデルにより, UT生成効率が高いことを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:52:54 GMT)
Data Augmentation for High-Fidelity Generation of CAR-T/NK Immunological Synapse Images [40.3] キメラ抗原受容体(CAR)-TおよびNK細胞免疫療法は癌治療に変化をもたらした。
CAR-T/NK細胞免疫学的シナプス(IS)の品質は、治療効果を予測するための機能的バイオマーカーとして機能する可能性がある。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:23:53 GMT)
Improving Deep Learning Library Testing with Machine Learning [40.2] 機械学習(ML)を用いて入力妥当性を判定する。
形状関係は、具体的な入力とデータのキャプチャを符号化するための正確な抽象化である。
ML強化入力分類は,DLライブラリテストの大規模化に有効であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:19:01 GMT)
Riemannian Neural Optimal Transport [40.2] 計算最適輸送(OT)は、生成モデリングのための原則的なフレームワークを提供する。
ニューラルネットワークを用いてデータからOTマップを無傷で学習するNeural OT法は、トレーニング後のサンプルから評価することができる。
既存のアプローチはユークリッド幾何学に合わせている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:09:35 GMT)
LIVE: Long-horizon Interactive Video World Modeling [39.5] Long-Horizon Interactive Video world modElは、新しいサイクル一貫性の目的を通じて境界付きエラー蓄積を実行する。
Liveはロングホライゾンベンチマークで最先端のパフォーマンスを達成し、ロールアウト期間のトレーニングを超えて、安定した高品質のビデオを生成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:10:03 GMT)
SafeGround: Know When to Trust GUI Grounding Models via Uncertainty Calibration [39.0] GUIグラウンドモデルのための不確実性を認識したフレームワークであるSafeGroundを紹介する。
テスト前にキャリブレーションを通じてリスクを意識した予測を可能にする。
SafeGroundを複数のGUIグラウンドモデルに適用し、ScreenSpot-Proベンチマークに挑戦する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:31:29 GMT)
Gromov Wasserstein Optimal Transport for Semantic Correspondences [38.6] 我々は、DINOv2ベースラインの性能を大幅に向上させ、競争力があり、時には最先端の手法を超越することを示す。
我々は、Gromov Wasserstein空間の滑らかさを含む最適な輸送アルゴリズムにマッチする標準近傍を置き換える。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:59:28 GMT)
Flexible Geometric Guidance for Probabilistic Human Pose Estimation with Diffusion Models [38.6] 拡散モデルを用いたポーズ推定のためのフレームワークを提案する。
提案手法をHuman 3.6Mデータセット上で評価する。
さらに,MPI-INF-3DHPと3DPWデータセットを用いた一般化能力の評価を行い,競争性能を実証した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:35:37 GMT)
Neural Predictor-Corrector: Solving Homotopy Problems with Reinforcement Learning [38.6] Homotopyのパラダイムは、ロバストな最適化、グローバルな最適化、ルートフィニング、サンプリングなど、さまざまな領域にまたがっている。
我々は手作りのNPCを自動学習ポリシーで置き換えるニューラル予測器(NPC)を提案する。
NPCは、タスク間で優れた安定性を示しながら、古典的および特殊的ベースラインの効率を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:19:48 GMT)
One Size Does Not Fit All: Token-Wise Adaptive Compression for KV Cache [38.5] 低ランクKVキャッシュ圧縮のための新しいポストトレーニングフレームワークDynaKVを提案する。
我々の手法は既存の最先端圧縮技術より一貫して優れています。
SnapKVと統合した場合、DynaKVはKVキャッシュの6%しか保持せず、LongBenchベンチマークのベースラインパフォーマンスの94%を維持している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:20:36 GMT)
GuardReasoner-Omni: A Reasoning-based Multi-modal Guardrail for Text, Image, and Video [38.4] GuardReasoner-Omniは、テキスト、画像、ビデオデータを適度に扱うために設計されたガードレールモデルである。
これら3つのモードにまたがる148万のサンプルからなる総合的なトレーニングコーパスを構築した。
トレーニングパイプラインは、2段階のパラダイムに従って、決定を下す前に意図的にモデルにインセンティブを与えます。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:56:20 GMT)
SEDformer: Event-Synchronous Spiking Transformers for Irregular Telemetry Time Series Forecasting [38.1] テレメトリIMTS予測のためのSEDエンハンススパイキングトランスであるSEDformerを提案する。
SEDformerは、エネルギーとメモリ使用量を削減しながら最先端の予測精度を達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:42:38 GMT)
AffordanceGrasp-R1:Leveraging Reasoning-Based Affordance Segmentation with Reinforcement Learning for Robotic Grasping [37.7] AffordanceGrasp-R1は、ロボットグリップのための推論駆動のアベイランスセグメンテーションフレームワークである。
AffordanceGrasp-R1は、ベンチマークデータセットにおける最先端(SOTA)メソッドよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:00:56 GMT)
Learning More from Less: Unlocking Internal Representations for Benchmark Compression [37.7] 異種隠蔽状態を統一潜在空間に整列させて代表コアセットを構成するREPCOREを導入する。
5つのベンチマークと200以上のモデルの実験は、ランキングの相関と推定精度において、出力ベースラインよりも一貫した利得を示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:51:47 GMT)
To What Extent Do Token-Level Representations from Pathology Foundation Models Improve Dense Prediction? [37.7] PFM-DenseBenchは高密度病理学予測のための大規模ベンチマークである。
我々は18の公開セグメンテーションデータセットにまたがる17のPFMを評価する。
統一されたプロトコルの下では、異なるPFMがいつ、なぜ成功または失敗するのかについて、洞察に富んだ実践指向の知見を導き出す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:54:57 GMT)
PISA: Piecewise Sparse Attention Is Wiser for Efficient Diffusion Transformers [37.4] 拡散変換器はビデオおよび画像生成に基本となるが、その効率は注意の二次的複雑さによってボトルネックとなる。
PISA(Piecewise Sparse Attention)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:02:26 GMT)
TextME: Bridging Unseen Modalities Through Text Descriptions [37.3] テキストのみのモダリティ拡張フレームワークであるTextMEを紹介する。
提案手法は、事前訓練されたコントラストエンコーダの幾何学的構造を利用して、ゼロショットのクロスモーダル転送を可能にする。
結果は、モダリティ拡張のためのペア化された監督の実践的な代替手段として、テキストのみのトレーニングを確立する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:43:13 GMT)
Self-Hinting Language Models Enhance Reinforcement Learning [37.3] 我々は、権限付き監督(SAGE)を備えた自己隠れ型GRPOを提案する。
SAGEはトレーニング中に特権付きヒントを注入し、同じ端末検証者報酬の下でロールアウト分布を再生成する。
3つのLSMを持つ6つのベンチマーク実験の結果、SAGEはGRPOを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:56:20 GMT)
Learning to Select: Query-Aware Adaptive Dimension Selection for Dense Retrieval [37.2] 本稿では,クエリ埋め込みから直接,パラメータごとのim-019ポータンスを予測できるQuery-024 Aware Adaptive Dimension Selection frame-018を提案する。
実験の結果,学習次元セレクタは全次元032ベースライン上でのre-031の3次効果を向上させることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:32:21 GMT)
Multi-Agent Teams Hold Experts Back [37.0] 自己組織化LDMチームが強力なシナジーを達成できるかどうかを考察する。
人間のチームとは違って、LLMチームは、専門家のエージェントのパフォーマンスと一貫して一致しないのです。
私たちは、識別ではなく、専門家の活用が主要なボトルネックであることを示しています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:46:07 GMT)
Visual Reasoning over Time Series via Multi-Agent System [36.9] MAS4TSは、一般的な時系列タスクのためのツール駆動型マルチエージェントシステムである。
エージェントコミュニケーション、視覚的推論、潜在的再構築を統一されたフレームワークに統合する。
幅広い時系列タスクにまたがって最先端のパフォーマンスを実現し、強力な一般化と効率的な推論を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:48:57 GMT)
4DPC$^2$hat: Towards Dynamic Point Cloud Understanding with Failure-Aware Bootstrapping [36.9] 動的点理解に適した最初のマルチモーダル大規模言語モデルである4DPC dynamic2$hatを提案する。
データセットには44K以上の動的オブジェクトシーケンス、700Kポイントのクラウドフレーム、200Kキュレートされた質問応答ペアが含まれている。
我々のフレームワークは既存のモデルと比較して行動理解と時間的推論を大幅に改善します。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:47:05 GMT)
Learning to Reason Faithfully through Step-Level Faithfulness Maximization [35.2] Reinforcement Learning with Verifiable Rewards (RLVR) は大規模言語モデル(LLM)の性能を大幅に向上させた。
ほとんどのRLVRパイプラインは、粗末な結果ベースの報酬に依存しており、中間ステップに対するほとんど監督を提供していない。
本稿では,信頼の推論を直接最適化する汎用強化学習フレームワークであるFaithRLを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:28:17 GMT)
MatGPTQ: Accurate and Efficient Post-Training Matryoshka Quantization [35.2] Matryoshka Quantization (MatQuant) は、1つの整数量子化モデルを複数の精度で提供できることを示す最近の量子化手法である。
実験後マトリシカ量子化(MatGPTQ)を提案する。これはPTQパイプラインで、1ショットで複数のターゲット精度に最適化された1つの親モデルを生成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:52:18 GMT)
Group Contrastive Learning for Weakly Paired Multimodal Data [34.8] GROOVEは、高濃度摂動データに対する半教師付きマルチモーダル表現学習手法である。
GroupCLIPは、ペア化されたクロスモーダルデータのためのCLIPと、一様教師付きコントラスト学習のためのSupConのギャップを埋める、新しいグループレベルのコントラスト損失である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:11:06 GMT)
WildGraphBench: Benchmarking GraphRAG with Wild-Source Corpora [34.7] グラフベースのRetrieval-Augmented Generation (GraphRAG)は、階層グラフとして外部知識を整理する。
GraphRAGの既存のベンチマークの多くは、外部知識として短い、キュレートされたパスに依存している。
WildGraphBenchは、GraphRAGのパフォーマンスを野生で評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:46:26 GMT)
A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces [34.6] 本稿では,階層型検索インタフェースを直接モデルに公開するエージェントRAGフレームワークであるA-RAGを紹介する。
A-RAGはキーワード検索、セマンティック検索、チャンク読み取りという3つの検索ツールを提供する。
複数のオープンドメインQAベンチマークの実験は、A-RAGが既存のアプローチを同等または低いトークンで一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:07:21 GMT)
AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration [34.2] AOrchestraはフレームワークに依存しないエージェント抽象化で、任意のエージェントをインストラクション、コンテキストツール、モデルとしてモデル化する。
タスク関連コンテキスト、ツール、モデルをキュレートし、オンザフライで自動エージェント生成を通じて実行を委譲する。
AOrchestraはGeminiと組んで最強のベースラインに対して16.28%の相対的な改善を達成した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:46:16 GMT)
Monitorability as a Free Gift: How RLVR Spontaneously Aligns Reasoning [34.2] 検証可能なリワードを用いた強化学習の初期段階において,監視性は「無料ギフト」として現れることを示す。
特に、RLVRトレーニングにおいて、データ多様性と命令追従データの重要性を実証する。
また、制御されたトレーニングと評価の難しさによって、監視可能性のダイナミクスがどう変化するかを明らかにする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:03:58 GMT)
Reasoning Cache: Continual Improvement Over Long Horizons via Short-Horizon RL [34.1] トレーニングと推論の両方で標準の自己回帰復号を置き換える反復復号アルゴリズムであるRCを導入する。
RCは、LCMの応答生成と要約能力の間の非対称性を利用して、一貫して改善する推論連鎖を構築する。
16k-tokenのトレーニング予算を使って4BモデルをRCでトレーニングすると、テスト時に0.5mトークンでHMMT 2025のパフォーマンスが40%から70%近く向上する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:34:04 GMT)
Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control [34.1] 我々は,複数のヒューマノイドを制御する単一統一政策を創出する,反復的な一般-専門的蒸留フレームワークを導入する。
シミュレーションでは5つのロボット,実環境では4つのロボットについて実験を行った。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:58:29 GMT)
Diversity-Preserved Distribution Matching Distillation for Fast Visual Synthesis [33.3] 分散整合蒸留(DMD)は、低推論コストで高品質な生成を可能にするために、多段階発生器をその数段階と整列させる。
本稿では, 蒸留工程の役割を明示的に解消する役割分離蒸留フレームワークを提案する。
本手法は, 単純さに拘わらず, サンプルの多様性を保ちながら, テキスト・画像実験における最先端の手法と同等の視覚的品質を維持しながら, 標本の多様性を保っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:45:25 GMT)
From Pre- to Intra-operative MRI: Predicting Brain Shift in Temporal Lobe Resection for Epilepsy Surgery [33.1] 側頭葉切除術を施行した患者の術前MRIから脳の移動を予測できるU-Netモデルを提案する。
実験の結果,脳の局所的変位を正確に予測し,脳のグローバルな変形を予測できることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:45:11 GMT)
High-Resolution Underwater Camouflaged Object Detection: GBU-UCOD Dataset and Topology-Aware and Frequency-Decoupled Networks [32.8] 本稿では,位相認識モデルと周波数分離認識を統合した新しいフレームワークを提案する。
DeepTopo-Netは、特に複雑な水中パターンの形態的整合性を維持する上で、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:41:27 GMT)
TAME: A Trustworthy Test-Time Evolution of Agent Memory with Systematic Benchmarking [32.6] エージェントメモリのテスト時間進化は、AGIを達成するための重要なパラダイムである。
エージェントセーフティアライメントは、エージェントメモリミス進化(Agen Memory Misevolution)と呼ばれる現象に弱いままである。
本稿では,タスク性能を向上させるために,メモリを別途進化させるデュアルメモリ進化フレームワークであるTAMEを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:52:26 GMT)
When Attention Betrays: Erasing Backdoor Attacks in Robotic Policies by Reconstructing Visual Tokens [32.5] 視覚言語アクション(VLA)モデルの下流での微調整はロボティクスを強化するが、パイプラインをバックドアのリスクに晒す。
本稿では,遅延空間のローカライゼーションによって異常な注意を払ってトークンを検出するテスト時間バックドアフレームワークであるBelaを紹介する。
ベラは名目のパフォーマンスを効果的に維持し、攻撃の成功率を大幅に低下させ、バックドア出力から常に良質な振る舞いを復元する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:09:43 GMT)
Controlling Output Rankings in Generative Engines for LLM-based Search [32.0] CORE は textbfControls textbfOutput textbfRankings in gtextbfEnerative Engines の最適化手法である。
COREは、出力ランキングに影響を与える主要な手段として、検索エンジンによって返されるコンテンツをターゲットにしている。
COREは15の製品カテゴリで、textbf91.4%の@Top-5、 textbf86.6%の@Top-3、 textbf80.3%の@Top-1の平均昇格率を達成した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:59:48 GMT)
Aligning Forest and Trees in Images and Long Captions for Visually Grounded Understanding [31.5] CLIPのような大きな視覚言語モデルは、画像やテキストを未分化の全体としてアライメントするため、長いキャプションに苦労する。
画像と長文のセマンティクスを画素レベルの監督なしに協調する階層的な画像テキスト表現学習フレームワークCAFTを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:31:55 GMT)
RDT2: Exploring the Scaling Limit of UMI Data Towards Zero-Shot Cross-Embodiment Generalization [31.4] RDT2は、7BパラメータVLM上に構築されたロボット基盤モデルであり、オープン語彙タスクのための新しい実施形態のゼロショット展開を可能にする。
私たちは、さまざまな家族で1万時間以上のデモを行い、拡張されたエンボディメントに依存しないユニバーサルマニピュレーションインタフェース(UMI)を使って、オープンソースのロボットデータセットの1つを収集しました。
提案手法では,Residual Vector Quantization (RVQ), flow-matching, およびリアルタイム推論のための蒸留により, 個別の言語知識を連続的な制御と整合させる新しい3段階学習法を用いる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:38:23 GMT)
CoBA-RL: Capability-Oriented Budget Allocation for Reinforcement Learning in LLMs [31.4] CoBA-RLは、モデルの進化能力に基づいて、ロールアウト予算を適応的に割り当てるように設計された強化学習アルゴリズムである。
我々のアプローチは、探索と搾取の間のトレードオフを効果的に編成し、一貫した一般化の改善を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:14:36 GMT)
VLS: Steering Pretrained Robot Policies via Vision-Language Models [31.2] Vision-Language Steering (VLS)は、凍結生成ロボットポリシーの推論時間適応のためのトレーニング不要フレームワークである。
VLSは、適応を推論時間制御問題として扱い、事前訓練された拡散またはフローマッチングポリシーのサンプリングプロセスを操る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:50:16 GMT)
Distance Marching for Generative Modeling [31.2] 時間非条件生成モデルは時間非依存の分解ベクトル場を学習する。
2つの原理的推論手法を用いた新しい時間的無条件手法である距離マーチングを提案する。
クラス条件のImageNet生成では、時間入力を削除したにもかかわらず、Distance Marchingはフローマッチングを上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:00:37 GMT)
DLLM-Searcher: Adapting Diffusion Large Language Model for Search Agents [31.1] 拡散大言語モデル(dLLLLM)は、本質的に並列な復号化機構とフレキシブルな生成パラダイムによって実現され、独特な効率性を示す。
サーチエージェントの急速な進歩にもかかわらず、その実践的展開は、1)チャレンジと呼ばれる基本的な制限によって制限される: マルチラウンド推論、ツール呼び出し、ツール応答の連続実行。
本稿では,dLLMに基づく検索エージェントの最適化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:12:08 GMT)
Can Large Language Models Generalize Procedures Across Representations? [31.1] 我々は、コード、グラフ、自然言語で表現されるプロシージャを含む同型タスクについて研究する。
本稿では,まず記号的,次に自然言語的データに基づいて学習する2段階のデータカリキュラムを提案する。
また,本手法により訓練された1.5B Qwenモデルでは,自然計画においてゼロショット GPT-4o と密に一致させることができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:56:54 GMT)
Lookahead Path Likelihood Optimization for Diffusion LLMs [31.0] 本稿では,下流の精度と強く相関する軌道条件付き目標であるパスログ類似度(Path LL)を導入し,非マスキング経路の原理的選択を可能にする。
推定時刻におけるPath LLの最適化のために,部分復号軌道の予測を行う効率の良い値推定器POKEを提案する。
次に、このルックアヘッド信号をモンテカルロをベースとした探索フレームワークであるPOKE-SMCに統合し、最適なアンマスクパスを動的に識別する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:12:41 GMT)
CMR: Contractive Mapping Embeddings for Robust Humanoid Locomotion on Unstructured Terrains [30.9] 本稿では,高次元で乱れやすい観測を潜在空間にマッピングする,ロバストネスのための契約マッピング(CMR)フレームワークを提案する。
CMRは、ノイズの増加の下で、他の移動アルゴリズムよりも強力な性能を発揮する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:30:18 GMT)
KTV: Keyframes and Key Tokens Selection for Efficient Training-Free Video LLMs [30.5] MLVU-Testベンチマークでは,10800フレームの60分ビデオに対して504の視覚トークンしか使用できず,44.8%の精度を実現している。
bfKTV - 効率的なトレーニングテキストビデオ理解のための新しい2段階フレームワーク。
MLVU-Testベンチマークでは,10800フレームの60分ビデオに対して504の視覚トークンしか使用できず,44.8%の精度を実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:08:30 GMT)
Learning Physiology-Informed Vocal Spectrotemporal Representations for Speech Emotion Recognition [30.4] 音声感情認識(SER)は、社会ロボティクスやロボット心理学的診断などのヒューマノイドロボットのタスクに不可欠である。
大規模なデータセットでトレーニングされた既存のディープモデルは、ほとんど解釈できないままである。
生理的インフォームド音声スペクトル表現学習法であるPhyloSERを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:55:50 GMT)
Global Geometry Is Not Enough for Vision Representations [30.3] 本稿では,21個の視覚エンコーダ間の構成的結合を予測するための幾何学的メトリクスの能力について検討する。
標準幾何に基づく統計は、組成結合とほぼゼロの相関を示す。
対照的に、入力出力ヤコビアンによって測定された機能感度は、この能力を確実に追跡する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:06:18 GMT)
DiscoverLLM: From Executing Intents to Discovering Them [30.1] DiscoverLLMは,ユーザが意図を形作り,発見するのを助けるために,大規模言語モデルを訓練するフレームワークである。
結果モデルでは、意図が不明な場合には、適応的に(選択肢を探求する)ことで、ユーザとのコラボレーションを学ぶ。
75人の被験者を対象にしたユーザスタディにおいて、DiscoverLLMはベースラインと比較して会話の満足度と効率を改善した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:51:46 GMT)
Composable Visual Tokenizers with Generator-Free Diagnostics of Learnability [30.1] CompTokは、トークンを合成性のために強化した視覚的トークン化者を学ぶためのトレーニングフレームワークである。
InfoGANスタイルの目的を用いて認識モデルを訓練し,拡散復号器の条件に使用するトークンを予測する。
実験では、CompTokが両方のメトリクスを改善するとともに、クラス条件付き生成のための最先端のジェネレータをサポートできることが示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:02:51 GMT)
Distribution-Aware End-to-End Embedding for Streaming Numerical Features in Click-Through Rate Prediction [30.0] 本稿では,ストリーミング環境におけるClick-Through Rate予測に有効な数値的特徴埋め込みについて検討する。
本稿では,ストリーミング学習シナリオに数値的特徴埋め込みを組み込むためのエンドツーエンドフレームワークであるDAESを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:50:54 GMT)
MeKi: Memory-based Expert Knowledge Injection for Efficient LLM Scaling [29.8] 大規模言語モデル(LLM)のスケーリングは通常、パフォーマンスを高めるためにパラメータやテスト時間計算の数を増やすことに依存する。
MeKi(メモリベースエキスパートナレッジインジェクション)は、FLOPではなくストレージ空間を介してLLM容量をスケールする新しいシステムである。
MeKiは、同一の推論速度で高密度LLMベースラインを著しく上回る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:32:04 GMT)
Video-OPD: Efficient Post-Training of Multimodal Large Language Models for Temporal Video Grounding via On-Policy Distillation [29.8] 時間的ビデオグラウンディング(TVG)の原則的ポストトレーニングパラダイムとして強化学習が登場している。
我々は,近年のオンライン蒸留の進歩に触発されたTVGのための効率的なポストトレーニングフレームワークであるVideo-OPDを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:05:48 GMT)
ShotFinder: Imagination-Driven Open-Domain Video Shot Retrieval via Web Search [29.5] 編集要件をオブジェクト指向のショット記述として形式化するベンチマークであるShotFinderを紹介する。
私たちは、20のテーマカテゴリーにわたるYouTubeから1210の高品質なサンプルを使用し、人間の検証による生成のために大きなモデルを使用します。
提案するShotFinderはテキスト駆動型3段階検索およびローカライゼーションパイプラインである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:40:34 GMT)
Reinforcement Fine-Tuning for History-Aware Dense Retriever in RAG [29.5] Retrieval-augmented Generation (RAG) は、大規模言語モデルがエビデンスベースの応答を生成することを可能にする。
既存のソリューションは、レトリバー最適化とRAGパイプラインの目標との客観的なミスマッチに悩まされている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:30:14 GMT)
3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation [29.4] 2Dは、新規な視点合成を前に、運動を駆動的視点に厳密に結合する。
3DiMoは、予め訓練されたビデオジェネレータでモーションエンコーダを訓練し、駆動フレームをコンパクトでビューに依存しないモーショントークンに蒸留する。
3DiMoは、フレキシブルでテキスト駆動のカメラコントロールで運転動作を忠実に再現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:59:09 GMT)
Conformal Reachability for Safe Control in Unknown Environments [29.3] 未知の力学系に対する確率的検証フレームワークを開発した。
共形予測を用いて,各段階における未知のダイナミクスに対する有効不確実区間を求める。
また,計画の地平線を最大化しつつ,名目報酬を最適化する制御ポリシーの学習手法も開発している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:01:38 GMT)
Generalizable and Interpretable RF Fingerprinting with Shapelet-Enhanced Large Language Models [29.2] ディープニューラルネットワーク(DNN)は、無線デバイス認証のためのRF指紋認証において顕著な成功を収めている。
可変長2次元(2次元)シェイプレット群と事前学習された大言語モデル(LLM)を統合して,効率的な,解釈可能な,一般化可能なRFフィンガープリントを実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:02:31 GMT)
QVLA: Not All Channels Are Equal in Vision-Language-Action Model's Quantization [29.2] 具体化制御に特化して設計された最初のアクション中心量子化フレームワークであるQVLAを紹介する。
我々の研究は、ロボット工学におけるビジョン・ランゲージ・アクションモデルを圧縮するための、新しい原則の基盤を確立する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:43:45 GMT)
Training Multi-Turn Search Agent via Contrastive Dynamic Branch Sampling [29.2] Branching Relative Policy Optimization (BranPO) は、高額な報酬なしで段階レベルのコントラスト管理を提供する価値のない手法である。
BranPOは尾部付近の軌跡を切断し、他の連続をサンプリングし、共有接頭辞の上に対照的な接尾辞を構成する。
さらに効率を向上し、トレーニングを安定させるために、タスク間の分岐周波数に適応する難易度分岐サンプリングと、不正な動作を抑制するために冗長なステップマスキングを導入する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:43:09 GMT)
PAMAS: Self-Adaptive Multi-Agent System with Perspective Aggregation for Misinformation Detection [29.2] ソーシャルメディア上の誤報は、情報の信頼性に重大な脅威をもたらす。
大規模言語モデルを用いたマルチエージェントシステム(MAS)は、この脅威に対処するための有望なパラダイムを提供する。
PAMASは、異常な手がかりを浮き彫りにし、情報の溺れを和らげるための、視点アグリゲーションを備えたフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:18:39 GMT)
GeoIB: Geometry-Aware Information Bottleneck via Statistical-Manifold Compression [29.1] Information Bottleneck (IB) は広く使われているが、ディープラーニングでは、通常はトラクタブルサロゲートによって実装される。
相互情報(MI)推定を不要とするtextbfGeometric textbfInformation textbfBottleneck (textbfGeoIB)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:07:29 GMT)
DALI: A Workload-Aware Offloading Framework for Efficient MoE Inference on Local PCs [28.8] メモリをホストするためにMoE専門家パラメータをオフロードし、CPUとGPUの計算を活用することが、リソース制約のあるローカルPC上でそのようなモデルをサポートするための有望な方向として現れた。
既存のプレフェッチ技術では、高負荷の専門家を正確に予測できないため、不正確なプレフェッチが発生します。
ローカルPC上での効率的なMoE推論のためのワークロアDAware offLoadIngフレームワークであるDALIを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:11:52 GMT)
Scaling In-Context Online Learning Capability of LLMs via Cross-Episode Meta-RL [28.8] 大規模言語モデル(LLM)は、すべてのタスク関連情報が事前に利用できる場合、高いパフォーマンスを達成する。
ORBITはマルチタスク・マルチタスク・メタ強化学習フレームワークで,文脈におけるインタラクションから学習するためにLDMを訓練する。
メタトレーニングの後、比較的小さなオープンソースモデル(Qwen3-14B)は、完全に見えない環境でコンテキスト内オンライン学習を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:53:05 GMT)
FlyPrompt: Brain-Inspired Random-Expanded Routing with Temporal-Ensemble Experts for General Continual Learning [28.8] 汎用連続学習(GCL)は、タスク境界をクリアにすることなく、シングルパス、非定常データストリームから学習するインテリジェントシステムに挑戦する。
FlyPromptは脳にインスパイアされたフレームワークで、GCLを2つのサブプロブレムに分解する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:40:27 GMT)
UniGeM: Unifying Data Mixing and Selection via Geometric Exploration and Mining [28.6] データキュレーションをtextitmanifold 近似問題として扱うことで、ミキシングと選択を統一するフレームワーク textbfUniGeM を導入する。
textbfMacro-Explorationは重みと安定性に基づくクラスタリングを混合することを学び、textbfMicro-Miningは幾何学的分布によって高品質なインスタンスをフィルタする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:32:56 GMT)
ATACompressor: Adaptive Task-Aware Compression for Efficient Long-Context Processing in LLMs [28.6] 本稿では,タスクの特定の要求に応じて圧縮を調整する適応タスク認識(ATACompressor)を提案する。
ATACompressorは、長いコンテキストのタスク関連部分のみを圧縮する選択エンコーダを使用し、不要なコンテンツを減らすとともに必須情報が保存されることを保証する。
我々はATACompressorを3つのQAデータセット上で評価する: HotpotQA, MSMARCO, SQUAD-showingは圧縮効率とタスク性能の両面で既存の手法より優れている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:53:29 GMT)
Sharp Inequalities between Total Variation and Hellinger Distances for Gaussian Mixtures [28.5] 本研究では,2つのガウス位置混合系の総変動(TV)とヘリンジャー距離の関係について検討した。
以上の結果から,Jia et al. (2023) で提起された開放的な問題を解き,全変量でガウス混合を学習するエントロピックな特徴付けが導かれる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:14:12 GMT)
Lookahead Sample Reward Guidance for Test-Time Scaling of Diffusion Models [28.3] 拡散モデルは強い生成性能を示すが、生成されたサンプルは人間の意図と完全に一致しないことが多い。
そこで本研究では,より高い人間対応報酬値を持つ領域からのサンプリングを可能にするテスト時間スケーリング手法について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:27:27 GMT)
RAWDet-7: A Multi-Scenario Benchmark for Object Detection and Description on Quantized RAW Images [28.1] RAWDet-7は25kのトレーニングと7.6kのテストRAW画像の大規模なデータセットで、様々なカメラ、照明条件、環境にまたがって収集される。
我々は、RAW画像処理と低ビット量子化によるオブジェクトレベルの情報保存の容易化を目的として、対応する高解像度sRGB画像から導出されたオブジェクトレベルの記述を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:22:45 GMT)
Self-Verification Dilemma: Experience-Driven Suppression of Overused Checking in LLM Reasoning [28.0] 大規模な推論モデル(LRM)は、反射を伴う長い推論トレースを生成することにより、強い性能を達成する。
その結果, 自己検証(再確認)により, 中間結果の確認が繰り返し行われることが判明した。
これは、自己検証の頻度と実際に役に立つ頻度のミスマッチを明らかにします。
過剰な検証を削減できる新しい経験駆動型テストタイムフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:58:23 GMT)
MentalSeek-Dx: Towards Progressive Hypothetico-Deductive Reasoning for Real-world Psychiatric Diagnosis [27.8] MentalSeek-Dx Benchは、実際の臨床環境での障害レベルの精神医学診断に特化した最初のベンチマークである。
ICD-11ガイドラインでは、ボード認定精神科医によって注釈された未確認の電子健康記録を712個含む。
MentalSeek-Dxは14Bパラメータしか持たない最先端のSOTA(State-of-the-art)のパフォーマンスを達成し、信頼性のある精神医学診断のための臨床基盤の枠組みを確立した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:03:35 GMT)
IVC-Prune: Revealing the Implicit Visual Coordinates in LVLMs for Vision Token Pruning [27.8] LVLM(Large Vision-Language Models)は、複数のタスクにまたがる優れたパフォーマンスを実現する。
しかし、重要な課題は、高解像度の視覚入力を処理する際に、その禁止的な推論コストである。
IVCトークンと意味論的に関連するフォアグラウンドトークンの両方を保持するトレーニングフリーで、プロンプト対応のプルーニング戦略である textbfIVC-Prune を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:39:31 GMT)
AERO: Autonomous Evolutionary Reasoning Optimization via Endogenous Dual-Loop Feedback [27.7] 以下は「アンダーライン・アンダーライン・エボリューショナリー・アンダーライン・アンダーライン・オプティマイゼーション(AERO)」である。
AEROは、シナジスティックなデュアルループシステムの中で、自己問合せ、回答、批判を内部化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:14:23 GMT)
Continuous Control of Editing Models via Adaptive-Origin Guidance [27.6] 拡散に基づく編集モデルは、意味論と画像編集の強力なツールとして登場した。
AdaOr(Adaptive-Origin Guidance、アダオル)は、標準ガイダンスの原点をアイデンティティ条件付き適応原点で調整する手法である。
本手法は画像および映像の編集作業において,現在のスライダベースの編集手法に比べてスムーズで一貫した制御が可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:33:39 GMT)
Efficient Long-Horizon Vision-Language-Action Models via Static-Dynamic Disentanglement [27.5] VLA(Vision-Language-Action)モデルは、汎用的なロボット制御のための有望なパラダイムとして登場した。
マルチレベル静的および動的トークンに視覚入力をアンタングルするフレームワークであるSD-VLAを提案する。
本稿では,VLAの長期時間依存性モデリング機能をより効果的に評価する新しいベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:17:47 GMT)
EVE: Efficient Verification of Data Erasure through Customized Perturbation in Approximate Unlearning [27.5] 本研究では,機械学習における消去手法(EVE)の有効検証を提案する。
中心となる考え方は、未学習データを摂動させ、指定されたサンプルのモデル予測が変更されることを保証することである。
実験を行った結果,EVEはモデルの初期学習過程を介さずに,機械学習を検証できることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:09:54 GMT)
medR: Reward Engineering for Clinical Offline Reinforcement Learning via Tri-Drive Potential Functions [27.4] 強化学習(RL)は動的治療体制(DTR)を最適化するための強力なフレームワークを提供する
既存のアプローチは、様々な病理の一般化に失敗する手動信号に依存することが多い。
本稿では,Large Language Models (LLMs) を利用したオフライン報酬設計と検証のための自動パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:30:32 GMT)
Robustness Risk of Conversational Retrieval: Identifying and Mitigating Noise Sensitivity in Qwen3-Embedding Model [27.3] 会話設定下では、構造化された対話スタイルのノイズは不均等に検索可能になり、トップランクの検索結果に挿入される。
本稿では,検索行動の質的変化を促す軽量クエリにより,ノイズの侵入を効果的に抑制し,ランキング安定性を回復することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:37:23 GMT)
Interpreting and Controlling LLM Reasoning through Integrated Policy Gradient [27.3] 大規模言語モデル(LLM)は、複雑な現実世界の問題を解く上で強力な推論能力を示す。
複雑な推論行動を引き起こす 内部メカニズムは いまだ不透明です
モデルの内部コンポーネントに推論の振る舞いを属性付ける新しいフレームワークである統合ポリシーグラディエント(IPG)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:14:20 GMT)
SAES-SVD: Self-Adaptive Suppression of Accumulated and Local Errors for SVD-based LLM Compression [27.3] SAES-SVDは、大規模言語モデルの低ランク圧縮フレームワークである。
層内再構成と層間誤差補償を共同で最適化する。
実験により,SAES-SVDは圧縮後の性能を常に改善することが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:23:10 GMT)
Dynamic High-frequency Convolution for Infrared Small Target Detection [27.1] 単一フレーム赤外線小目標(SIRST)検出は困難である。
現在の学習ベースの手法はディープネットワークの強力な能力に依存している。
本稿では,識別的モデリングプロセスから動的局所フィルタバンクを生成するための動的高周波畳み込み(DHiF)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:07:55 GMT)
Fedcompass: Federated Clustered and Periodic Aggregation Framework for Hybrid Classical-Quantum Models [26.9] FEDCOMPASSは、ハイブリッド古典量子化学習のための階層化集約フレームワークである。
試験精度を最大10.22%向上し、非IID条件下での収束安定性を向上させる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:28:49 GMT)
Risk Awareness Injection: Calibrating Vision-Language Models for Safety without Compromising Utility [26.6] 視覚言語モデル(VLM)は、大きな言語モデル(LLM)の推論能力を、モード間設定に拡張する。
既存の防衛は、安全性の微調整や攻撃的なトークン操作に頼っており、相当な訓練コストや性能の大幅な低下を招いている。
安全校正のための軽量かつトレーニング不要なフレームワークであるリスク意識注入(RAI)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:26:05 GMT)
Memora: A Harmonic Memory Representation Balancing Abstraction and Specificity [26.5] Memoraは、抽象性と特異性の構造的バランスをとるハーモニックメモリ表現である。
本稿では,LoCoMoベンチマークとLongMemEvalベンチマークでMemoraが新たな最先端性を確立し,メモリスケールとしての検索妥当性と推論の有効性を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:44:43 GMT)
Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards [26.5] 既存のグループベースのポリシー最適化手法は、すべてのトレーニングプロンプトに対して一定数のロールアウトを割り当てる。
この均一な割り当ては全てのプロンプトを等しく情報的扱いし、非効率的な計算予算の使用と訓練の進捗を妨げる可能性がある。
本稿では、既存のバッチのプロンプトに所定のロールアウト予算を割り当て、ポリシー更新のグラデーションのばらつきを最小限に抑える可変インフォームド予測割当戦略であるVIPを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:25:06 GMT)
ProOPF: Benchmarking and Improving LLMs for Professional-Grade Power Systems Optimization Modeling [26.4] プロレベルのOPFモデリングのためのデータセットとベンチマークであるtextbfProOPF-D と textbfProOPF-B を紹介する。
ProOPF-Dには、パラメータ調整と標準OPFへの構造拡張を備えたNLリクエストのペアリング12Kインスタンスと、実行可能な実装が含まれている。
ProOPF-Bは121のエキスパートアノテートテストケースに基調コードを提供し、具体的および抽象的なOPFモデリング体制の下でエンドツーエンドの評価を可能にする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:59:03 GMT)
Consensus Group Relative Policy Optimization for Text Generation [26.4] C-GRPOは、グループ相対的な目的としてコンセンサスユーティリティを定式化することにより、最小ベイズリスク(MBR)デコーディングをトレーニングに蒸留する。
理想的な条件下では、C-GRPO の目的関数は期待効用目標の勾配に方向整合していることが示される。
機械翻訳(WMT 2024)とテキスト要約(XSum)の実験は、C-GRPOがMBR復号化に匹敵する性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:54:40 GMT)
Closing the Loop: Universal Repository Representation with RPG-Encoder [26.4] 本稿では,リポジトリ計画グラフ(RPG)を統一表現に一般化するフレームワークであるRPG-Encoderを提案する。
RPG-Encoderは3つのメカニズムを通じて推論ループを閉じる。
93.7%のAcc@5で検証されたSWE-bench上での最先端のローカライゼーション性能を確立し、SWE-bench Live Lite上でのローカライゼーション精度を10%以上越えている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:33:03 GMT)
Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs [26.3] パターン認識トレース分析とグローバル最適化を一体化する依存性認識フレームワークであるMorphisを提案する。
TrainTicketベンチマークによる評価から,Morphisは最先端のベースラインに比べてCPU消費を35~38%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:56:21 GMT)
Clarify Before You Draw: Proactive Agents for Robust Text-to-CAD Generation [26.2] 本稿では,コード合成に先立って仕様問題を解消するテキスト・ツー・カドクエリ生成のためのプロアクティブ・エージェント・フレームワークProCADを提案する。
本フレームワークは,自己整合性仕様を作成するために必要な場合にのみ,プロンプトを監査し,対象の明確化を問うプロアクティブ・クリアリング・エージェントと組み合わせる。
ProCADはクロード・ソネット4.5を含むフロンティアのクローズソースモデルより優れており、平均チャムファー距離は79.9%、無効率は4.8%から0.9%に低下している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:10:27 GMT)
TRE: Encouraging Exploration in the Trust Region [25.9] 信頼領域エントロピー(TRE)は、モデルの信頼領域内で厳密な探索を促進する手法である。
TREは、バニラ、標準エントロピー正規化、その他の探索ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:21:49 GMT)
One Model, All Roles: Multi-Turn, Multi-Agent Self-Play Reinforcement Learning for Conversational Social Intelligence [25.9] 本稿では,AIのための強化学習フレームワークであるOMAR: One Model, All Rolesを紹介する。
OMARは、単一のモデルですべての参加者を同時にロールプレイし、長期的な目標と複雑な社会的規範を達成することを学べる。
訓練されたモデルは、共感、説得、妥協探究といった、きめ細やかな、創発的な社会知性を発達させます。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:09:49 GMT)
From Zero to Hero: Advancing Zero-Shot Foundation Models for Tabular Outlier Detection [25.9] 外乱検出(OD)は、実際には広く使われているが、その効果的な展開は、ラベル付き外乱検出の欠如によって妨げられている。
この研究は、FoMo-0Dを合成前科と自己進化型カリキュラムの混合で進化させるOUTFORMERを導入している。
OUTFORMERは、合成ラベル付きデータセットのみに事前トレーニングされ、トレーニングデータをコンテキスト内入力として使用することにより、新しいタスクのテストラベルを推論する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:38:49 GMT)
CIEC: Coupling Implicit and Explicit Cues for Multimodal Weakly Supervised Manipulation Localization [25.8] Implicit と Explicit Cues (CIEC) の結合は、画像とテキストのペアに対するマルチモーダルな弱い教師付き操作のローカライゼーションを実現することを目的としている。
視覚とテキストの両方の観点から偽造の手がかりを統合し、空間的先行によって助けられた疑わしい領域にロックする。
後者では、意味のあるコンテンツワードに焦点を当て、相対的な視覚バイアスを利用してトークンのローカライゼーションを支援する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:22:27 GMT)
They Said Memes Were Harmless-We Found the Ones That Hurt: Decoding Jokes, Symbols, and Cultural References [25.7] 有害な意図は、しばしば暗黙の文化的象徴と横断的不一致に依存しているため、ミームに基づく社会的虐待の検出は困難である。
従来のアプローチでは、文化的な盲目(象徴的文脈を欠く)、境界曖昧さ(虐待と虐待の混同)、およびiv.解釈可能性の欠如という3つの要因に制限されていた。
CROSS-ALIGN+は,これらの制約に体系的に対処する3段階のフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:29:46 GMT)
Chain-of-Goals Hierarchical Policy for Long-Horizon Offline Goal-Conditioned RL [25.4] 本稿では,自己回帰シーケンスモデルとして階層的意思決定を再構築する新しい枠組みを提案する。
CoGHPは、強いオフラインベースラインを一貫して上回り、長期タスクのパフォーマンスを改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:11:03 GMT)
Thinking with Comics: Enhancing Multimodal Reasoning through Structured Visual Storytelling [25.3] コミックによる思考は、漫画を画像とビデオの間に位置する高い情報密度の媒体として利用する視覚的推論パラダイムである。
コミックは、時間構造、埋め込みテキスト、物語コヒーレンスを保存し、推論コストを著しく低減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:37:14 GMT)
HySparse: A Hybrid Sparse Attention Architecture with Oracle Token Selection and KV Cache Sharing [25.1] HySparseは新しいアーキテクチャで、各注意層をスパースアテンション層でインターリーブする。
7B高密度モデルと80BMoEモデルの両方でHySparseを評価した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:05:57 GMT)
CoCoEmo: Composable and Controllable Human-Like Emotional TTS via Activation Steering [25.1] 人間の言論における感情表現はニュアンス的で構成的であり、しばしば複数の矛盾する感情的な手がかりを含む。
ほとんどの表現力のあるテキスト音声システムは、単一の発話レベルの感情を強制し、感情の多様性を崩壊させ、混合あるいはテキスト感情のミスマッチした表現を抑制する。
本稿では,構成可能な混合感情合成と信頼性のあるテキスト感情ミスマッチ合成を可能にする定量的かつ制御可能なステアリングフレームワークとマルチレータ評価プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:45:00 GMT)
Context Compression via Explicit Information Transmission [25.1] 大規模言語モデル(LLM)による長文推論は、二次的な注意とキー値キャッシュの増加によってコストがかかる。
ソフト圧縮を新しいパラダイムに定式化する軽量フレームワークComprExITを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:44:12 GMT)
Dynamic Matching Under Patience Imbalance [24.8] 本研究では,不均衡な両面プラットフォーム上での動的マッチング問題について検討する。
集中型ベンチマークでは、最適政策は高品質の供給を供給するためのしきい値に基づく規則に従う。
分散化システムでは、福祉を最大化するマルコフ完全均衡を特徴付ける。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:28:43 GMT)
Transferable Graph Condensation from the Causal Perspective [23.8] グラフデータセットの凝縮技術は、大きなデータセットを小さいが情報に富んだデータセットに圧縮するために出現している。
これらのメソッドは、元のデータセットとタスクにマッチするように、厳密に下流のアプリケーションを必要とします。
因果不変かつ移動可能なグラフデータセット縮合法であるtextbfTGCC を提案し,有効かつ伝達可能な縮合データセットを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:45:01 GMT)
Happy Young Women, Grumpy Old Men? Emotion-Driven Demographic Biases in Synthetic Face Generation [23.6] 我々は8つの最先端テキスト・トゥ・イメージ(T2I)モデルの体系的な監査を行う。
最先端の顔分析アルゴリズムを用いて、生成した顔の性別、人種、年齢、魅力レベルを推定する。
以上の結果から,出身国に関係なく,すべてのモデルにおいて永続的な人口動態と感情条件バイアスがみられた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:10:05 GMT)
From Single Scan to Sequential Consistency: A New Paradigm for LIDAR Relocalization [23.5] LiDAR再局在は、環境中のセンサーのグローバルな6-DoFポーズを推定することを目的としている。
逐次一貫性を効果的にモデル化することにより、局所性の堅牢性を高める新しいLiDAR再ローカライゼーションフレームワークを提案する。
NCLTとOxford Robot-CarLocのベンチマークによる実験結果から、TempLocは最先端の手法よりも大きなマージンで優れていることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:11:18 GMT)
Not All Negative Samples Are Equal: LLMs Learn Better from Plausible Reasoning [23.4] Plausible Negative Samples (PNS) は、予測フォーマットと構造コヒーレンスを示す高品質な負のサンプルを合成する手法である。
PNSは、フォーマットコンプライアンス、精度逆転、チェーンオブ思考評価を組み合わせた複合報酬によって導かれる逆強化学習を通じて、専用モデルを訓練する。
PNSは他の負のサンプル法を一貫して上回り、RL訓練モデルよりも平均2.03%改善した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:32:02 GMT)
AutoFigure: Generating and Refining Publication-Ready Scientific Illustrations [23.2] FigureBenchは、長文から科学的図形を生成するための最初の大規模なベンチマークである。
本稿では,高品質な科学的イラストを自動生成する最初のエージェントフレームワークであるAutoFigureを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:41:43 GMT)
Controlling Exploration-Exploitation in GFlowNets via Markov Chain Perspectives [23.1] Generative Flow Network(GFlowNet)の目的は、前向きと後向きのポリシーの均等な混合を暗黙的に修正することである。
調整可能なパラメータ$$で混合を一般化する$-GFNを提案する。
これにより、探索・探索のダイナミクスを直接制御し、ユニークな流れへの収束を確保しながらモード発見能力を高めることができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:13:51 GMT)
Hierarchical Concept-to-Appearance Guidance for Multi-Subject Image Generation [22.8] 本稿では,高レベルの概念からきめ細かい外観まで,明示的で構造化された監視を提供するフレームワークを提案する。
概念レベルでは、VAEの参照機能をランダムに省略するVAEドロップアウトトレーニング戦略を導入する。
外観レベルでは、VLM由来の対応文を対応認識型マスキングアテンションモジュールに統合する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:13:29 GMT)
Reuse your FLOPs: Scaling RL on Hard Problems by Conditioning on Very Off-Policy Prefixes [22.7] 我々はPrefixRLを導入し、そこでは、成功裏のトレースのプレフィックスを条件にし、それらを完了させるために、オンデマンドのRLを実行します。
PrefixRLは、問題の難易度を政治外接頭辞の長さで調節することで、難しい問題に対する学習信号を強化する。
我々はPrefixRLの目的が標準RLの目的と一致しているだけでなく、より効率的なことを証明する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:58:52 GMT)
R1-SyntheticVL: Is Synthetic Data from Generative Models Ready for Multimodal Large Language Model? [22.7] 本稿では,MLLMのための高品質,多様性,挑戦的なマルチモーダルデータを合成するための,新しい汎用的アプローチであるCADSを提案する。
CADSは2つの周期的位相(CAD-Generate)とCAD-Judge(CAD-Judge)で動作する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:26:32 GMT)
Internet of Agentic AI: Incentive-Compatible Distributed Teaming and Workflow [22.7] 本稿では,エージェントAIのインターネット(Internet of Agentic AI)と呼ばれるスケーラブルなエージェントインテリジェンスのためのフレームワークを提案する。
我々はエージェントコラボレーションのネットワークネイティブモデルを定式化し、インセンティブに適合するワークフロー・コラボレーション・ファシビリティー・フレームワークを導入する。
医療ケーススタディでは、ドメインの特殊化、クラウドエッジの不均一性、動的連立の形成が、スケーラブルで弾力性があり、経済的に実行可能なエージェントの原則をどのように実現しているかを実証している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:00:34 GMT)
From Scalar Rewards to Potential Trends: Shaping Potential Landscapes for Model-Based Reinforcement Learning [22.6] SLOPE (Shaping Landscapes with Optimistic potential Estimates) は、報酬モデリングをスカラー予測から情報的潜在的景観構築に移行する新しいフレームワークである。
SLOPEは楽観的な分布回帰を用いて高信頼な上限を推定し、希少な成功信号を増幅し、十分な探査勾配を確保する。
5つのベンチマークで30以上のタスクを評価すると、SLOPEは、完全にスパース、半スパース、密度の高い報酬において、ベースラインを一貫して上回っていることが示される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:13:26 GMT)
SEAD: Self-Evolving Agent for Multi-Turn Service Dialogue [22.6] 大規模アノテーションを使わずに効果的な戦略を学習できるSEAD(Self-Evolving Agent for Service Dialogue)を提案する。
SEADは、ユーザモデリングを2つのコンポーネントに分離します。トレーニングカリキュラムを管理するために多様なユーザ状態を生成するプロファイルコントローラと、現実的なロールプレイングに焦点を当てたユーザロールプレイモデルです。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:01:11 GMT)
From Frames to Sequences: Temporally Consistent Human-Centric Dense Prediction [22.3] 我々は、人間のフレームと、画素精度の深度、正常度、マスクを用いた動き整列を生成するスケーラブルな合成データパイプラインを開発した。
我々は、CSE埋め込みを介して、明示的な幾何学的人体を注入する統合されたViTベースの密度予測器を訓練する。
静的プレトレーニングと動的シーケンス監視を組み合わせた2段階のトレーニング戦略により、まず、ロバストな空間表現を取得し、その後、動きに沿ったシーケンス間で時間的一貫性を洗練できる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:44:02 GMT)
Beyond Variance: Prompt-Efficient RLVR via Rare-Event Amplification and Bidirectional Pairing [21.9] 検証可能な報酬付き強化学習(RLVR)は、決定論的結果推論タスクにおいて、大規模言語モデルのトレーニングに有効である。
以前の研究によると、RLVRはプロンプトが少ないが、迅速な選択はトレーニング精度のばらつきにのみ基づくことが多い。
有効なミニバッチは、(i)信頼できる正のアンカーと(ii)稀な障害からの明確な負の学習信号の両方を提供するべきである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:17:25 GMT)
RIR-Former: Coordinate-Guided Transformer for Continuous Reconstruction of Room Impulse Responses [21.8] RIR-Formerはグリッドフリーで1ステップのフィードフォワードモデルである。
トランスバックボーンに正弦波符号化モジュールを導入することにより,マイクロホン位置情報を効果的に組み込むことができる。
様々な模擬音響環境の実験により、RIR-Formerは最先端のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:57:23 GMT)
Adaptive Batch Sizes Using Non-Euclidean Gradient Noise Scales for Stochastic Sign and Spectral Descent [21.7] 勾配雑音尺度(GNS)に基づく既存の適応戦略は、原則的な代替手段を提供する。
それぞれの双対ノルムの幾何から自然に現れる符号SGDとSpecSGDの勾配雑音メトリクスを導出する。
実験により,非ユークリッドノルムを用いた適応型バッチサイズ戦略により,定型バッチベースラインの検証損失を最大66%削減できることを確認した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:16:55 GMT)
SCASRec: A Self-Correcting and Auto-Stopping Model for Generative Route List Recommendation [21.4] ルートレコメンデーションシステムは、高品質な順序付きレコメンデーションを生成するために、微調整と再ランクを含む多段階パイプラインを採用するのが一般的である。
textbfSCASRec (textbfSelf-textbfCorrecting and textbfAuto-textbfStopping textbfRecommendation)は、ランキングと冗長性の排除を単一のエンドツーエンドプロセスに統合する統合生成フレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:51:58 GMT)
One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis [21.3] コード解析のためのマルチタスクPEFTの総合評価を行った。
実験の結果、1つのPEFTモジュールが一致し、場合によっては完全なマルチタスクの微調整に勝ることがわかった。
我々は,オープンソースの汎用LLMの直接的プロンプトに対して,効率的なマルチタスクPEFTをベンチマークする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:07:11 GMT)
Sparsity is Combinatorial Depth: Quantifying MoE Expressivity via Tropical Geometry [21.3] 熱帯幾何レンズを用いたMoEの最初の解析を行った。
我々のフレームワークは、ハイパーックスの離散幾何学とニューラル関数の連続幾何学を統一する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:17:38 GMT)
Generating a Paracosm for Training-Free Zero-Shot Composed Image Retrieval [21.2] Composed Image Retrieval (CIR)は、マルチモーダルクエリを使用してデータベースからターゲットイメージを取得するタスクである。
CIRの課題は、このメンタルイメージ'は物理的に利用できておらず、クエリによって暗黙的にのみ定義されていることだ。
対照的に、より正確なマッチングのために「心像」を直接生成することで、第一原理からCIRに対処する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:05:53 GMT)
Rank-and-Reason: Multi-Agent Collaboration Accelerates Zero-Shot Protein Mutation Prediction [20.8] ウェットラブ検証プロセスを自動化する2段階のエージェントフレームワークであるRan-and-Reason(VenusRAR)を提案する。
Rank-Stageでは、計算専門家と仮想生物学者がコンテキスト対応のマルチモーダルアンサンブルをまとめ、ProteinGym上で0.551(vs.0.518)の新しいスピアマン相関記録を樹立した。
Reason-Stageでは、エージェント専門家パネルが、幾何学的および構造的制約に対して候補を監査するチェーン・オブ・シンキングを採用し、ProteinGym-DMS99で最高5ヒット率を最大367%改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:26:39 GMT)
Aggregation Queries over Unstructured Text: Benchmark and Agentic Method [20.8] 我々は、厳密な完全性を必要とするコーパス境界設定において、テキスト上のエンティティレベルアグリゲーションを形式化する。
AGGBenchは、現実的な大規模コーパスの下で完全性指向のアグリゲーションを評価するために設計されたベンチマークである。
DFAはモジュール型のエージェントベースラインで、集約クエリを解釈可能なステージに分解する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:44:53 GMT)
Don't believe everything you read: Understanding and Measuring MCP Behavior under Misleading Tool Descriptions [20.8] 本研究では,外部から提示されたツール記述と実装のミスマッチが,知的エージェントの精神モデルと意思決定行動をどのように形成するかを検討する。
その結果、ほとんどのサーバは高度に一貫性があるが、約13%のサーバは、文書化されていない特権操作、隠された状態の突然変異、または不正な金融行動を可能にする相当なミスマッチを示すことがわかった。
以上の結果から,記述符号の不整合性はMPPベースのAIエージェントにおいて具体的かつ一般的な攻撃面であり,今後のエージェントエコシステムにおいて,体系的な監査とより強力な透明性の保証の必要性が示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:31:52 GMT)
Privacy Amplification Persists under Unlimited Synthetic Data Release [20.7] 合成データのみを公開することによって、差分プライバシー保証を改善する現象である合成データリリースによるプライバシーの増幅について検討する。
Pierquin et al. (2025) による最近の研究は、線形発生器に対する最初の公式な増幅保証を確立したが、それらは、モデルが放出された合成レコードの数よりはるかに多いレジームにのみ適用される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:27:42 GMT)
Hand3R: Online 4D Hand-Scene Reconstruction in the Wild [20.7] Hand3Rは、モノクロビデオから4Dハンドシーンを再構築する最初のオンラインフレームワークである。
提案手法は, 高忠実度ハンドプレッシャを永続的なシーンメモリに注入することにより, 精度の高いハンドメッシュと高密度なメートルスケールシーン形状の同時再構成を可能にする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:13:01 GMT)
When Should Agents Coordinate in Differentiable Sequential Decision Problems? [20.7] 本研究では,多種多様な動作計画問題におけるコーディネートの価値について検討する。
エージェントのチームがいつ協調すべきかを決定するために、この2階推論を使用するアルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:55:16 GMT)
SwiftVLM: Efficient Vision-Language Model Inference via Cross-Layer Token Bypass [20.7] 視覚トークンプルーニングは、視覚言語モデルの計算コストを削減するための有望なアプローチである。
我々は、選択されていない視覚トークンを保存し、その後のプルーニングステージに転送する、バイパスと呼ばれる新しいプルーニングパラダイムを導入する。
このパラダイムに基づいて,強力な視覚トークン選択機能を備えたモデル固有の層でプルーニングを行う,単純かつトレーニング不要なSwiftVLMを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:42:51 GMT)
SWE-Refactor: A Repository-Level Benchmark for Real-World LLM-Based Code Refactoring [20.7] 大規模言語モデル(LLM)は、ソフトウェア工学のタスクに取り組むことに広く関心を集めている。
既存のベンチマークは一般的に3つの欠点に悩まされる。
SWE-Refactor は開発者によって書かれた 18 の Java プロジェクトから抽出された 1,099 の挙動保存 LLM で構成されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:36:29 GMT)
HyperOffload: Graph-Driven Hierarchical Memory Management for Large Language Models on SuperNode Architectures [20.5] SuperNodeは、コンパイラ内のキャッシュ演算子を使用したデータ移動を表す。
私たちは、本番のディープラーニングフレームワークMindSporeにSuperNodeを実装しています。
SuperNodeは、エンドツーエンドのパフォーマンスを維持しながら、推論のピークデバイスメモリ使用量を最大26%削減することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:19:01 GMT)
Generative Decompression: Optimal Lossy Decoding Against Distribution Mismatch [20.3] 本稿では,圧縮機設計のための推定分布が実際の(真の)ソース分布と一致しないような,損失圧縮における最適復号法について述べる。
整合量子化問題を正式に定義し、生成的減圧縮と呼ばれる最適再構成規則が古典的ベイズ推定と一致することを示す。
我々は、この枠組みをノイズの多いチャネルの伝送に拡張し、標準モジュラーソース-チャネル分離アーキテクチャの非効率性を評価する頑健なソフトデコード規則を導出した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:25:23 GMT)
Robustness as an Emergent Property of Task Performance [20.3] モデルがタスク上で高いパフォーマンスに近づくにつれ、ロバスト性は効果的に達成されることを示す。
頑健性は、本質的にモデルレベルの特性ではなく、主にタスク固有の能力によって引き起こされる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:10:38 GMT)
Bayesian Conformal Prediction as a Decision Risk Problem [20.2] BCPは、分割された共形予測に匹敵する大きさの予測セットを得る。
名前付きカバレッジが80%のスパースレグレッションでは、BCPは未特定の条件下で81%の経験的カバレッジを達成している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:58:27 GMT)
BridgeV2W: Bridging Video Generation Models to Embodied World Models via Embodiment Masks [20.1] 身体化された世界モデルは、ロボティクスにおいて有望なパラダイムとして登場した。
本稿では,座標空間の動作を画素配向の実施マスクに変換するBridgeV2Wを提案する。
これらのマスクは、コントロールネットスタイルの経路を介して、事前訓練されたビデオ生成モデルに注入される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:56:28 GMT)
Asymmetric Hierarchical Anchoring for Audio-Visual Joint Representation: Resolving Information Allocation Ambiguity for Robust Cross-Modal Generalization [19.7] 指向性情報アロケーションを強制するための非対称階層的アンコリング(AHA)を提案する。
我々は、脆弱な相互情報推定装置を、意味的漏洩を明示的に抑制するGRLベースの逆分離器に置き換える。
AHAは、クロスモーダル移動において対称基底線を一貫して上回る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:14:03 GMT)
Thinking inside the Convolution for Image Inpainting: Reconstructing Texture via Structure under Global and Local Side [19.7] エンコーダとデコーダのパイプラインのため、画像のインペイントは大幅に進歩した。
近年の研究では、エンコーダからCNNから抽出される高周波構造と低周波テクスチャを直感的に同定している。
本稿では,構造的特徴写像とテクスチャ的特徴写像が,畳み込みダウンサンプリング時の情報損失を軽減するのにどう役立つのかを体系的に答える。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:30:07 GMT)
TIPS Over Tricks: Simple Prompts for Effective Zero-shot Anomaly Detection [19.7] 異常検出は、安全クリティカルな設定における期待された行動からの離脱を特定する。
我々のパイプラインは、7つの産業データセットで画像レベルのパフォーマンスを1.1-3.9%改善し、ピクセルレベルのパフォーマンスを1.5-6.9%向上させた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:48:11 GMT)
Principled Federated Random Forests for Heterogeneous Data [19.5] 我々は、水平分割データのための新しいフェデレートランダムフォレストアルゴリズムであるFedForestを提案する。
我々は、慎重に選択されたクライアント統計を集約した分割手順が、集中型アルゴリズムによって選択された分割を近似していることを証明する。
また、FedForestはクライアントインジケータの分割を可能にし、非パラメトリックなパーソナライゼーションの形式を可能にすることも示しています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:41:59 GMT)
WIND: Weather Inverse Diffusion for Zero-Shot Atmospheric Modeling [19.5] 多数のタスクにまたがる特別なベースラインを置き換えることのできる,単一の事前学習基盤モデルであるWINDを紹介する。
ドメイン固有の問題を逆問題として厳密に分類し、後続サンプリングを用いて解決する。
地球温暖化シナリオ下での極端気象事象の物理的に一貫した対実的ストーリーラインを生成するモデルの性能を実証する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:58:10 GMT)
Understanding and Guiding Layer Placement in Parameter-Efficient Fine-Tuning of Large Language Models [19.4] 大規模言語モデル(LLM)は成長を続けており、パラメータ効率の良い微調整が下流適応のデフォルト戦略となっている。
現在のプラクティスは一般的に、すべてのレイヤに対してPEFTを統一的に適用し、レイヤの選択を限定的に理解または活用する。
本稿では,凍結ベースモデル上でPEFTの統一的残差ビューを開発する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:05:55 GMT)
Fast-Slow Efficient Training for Multimodal Large Language Models via Visual Token Pruning [19.3] 既存の効率的なトレーニングの取り組みは、モデルサイズやトレーニング可能なパラメータの削減に重点を置いている。
トレーニング段階でVTPを適用すると、トレーニングと推論のミスマッチが発生します。
MLLMの効率的なトレーニングのための高速スローフレームワークであるDualSpeedを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:18:11 GMT)
DeXposure-FM: A Time-series, Graph Foundation Model for Credit Exposures and Stability on Decentralized Financial Networks [19.3] 分散ファイナンス(DeFi)の信用露出は暗黙的でトークンを介し、プロトコール間の依存関係の密集したWebを作ることが多い。
本稿では,最初の時系列グラフ基盤モデルであるDeXposure-FMについて紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:10:11 GMT)
Nemotron ColEmbed V2: Top-Performing Late Interaction embedding models for Visual Document Retrieval [19.2] ビジュアルドキュメント検索の需要が高まっているため,ViDoReベンチマークで最先端のパフォーマンスを実現するモデル群であるNemotron ColEmbed V2を導入する。
データ処理、トレーニング、ポストトレーニングにまたがる主要なテクニックについて説明する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:26:44 GMT)
Prompt Augmentation Scales up GRPO Training on Mathematical Reasoning [19.2] 我々は、さまざまなテンプレートやフォーマットの下で推論トレースを生成するようにモデルに指示するトレーニング戦略である、プロンプト拡張を導入する。
我々は、KL正規化項がなければ、プロンプト拡張により、一定のデータセット下でのトレーニング期間の安定したスケーリングが可能になることを示す。
Qwen2.5-Math-1.5Bモデルでは、MATH Level 3-5データセットの迅速な拡張により、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:59:42 GMT)
Toward Learning POMDPs Beyond Full-Rank Actions and State Observability [19.1] 本稿では,離散的に観測可能なマルコフ決定過程のパラメータの学習方法について述べる。
エージェントはPOMDPの行動と観測空間の知識から始まるが、状態空間、遷移、観測モデルではない。
実験の結果, 明確な観測と遷移の可能性を利用して, 異なる目標に対する新たな計画を作成することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:03:44 GMT)
SEW: Strengthening Robustness of Black-box DNN Watermarking via Specificity Enhancement [19.1] 本研究では,感性強化型透かし (SEW) を導入し, 透かしと近似鍵の関連性を低減し, 特異性を向上する手法を提案する。
SEWは、モデルのユーザビリティと透かし検証性能を維持しながら、6つの最先端の除去攻撃を効果的に防御する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:55:27 GMT)
FSOD-VFM: Few-Shot Object Detection with Vision Foundation Models and Graph Diffusion [19.0] FSOD-VFM:Few-Shot Object Detector with Vision Foundation Modelsについて述べる。
FSOD-VFMは、カテゴリに依存しない境界ボックス生成のためのユニバーサルプロポーザルネットワーク(UPN)、正確なマスク抽出のためのSAM2、新しいオブジェクトカテゴリに効率的に適応するためのDINOv2特徴の3つの主要なコンポーネントを統合している。
提案手法では,予測境界ボックスを有向グラフのノードとしてモデル化し,ネットワーク全体の信頼度を伝搬するグラフ拡散操作を適用した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:45:22 GMT)
PromptSplit: Revealing Prompt-Level Disagreement in Generative Models [19.0] プロンプト誘導型生成AIモデルは、視覚領域と言語領域に急速に拡張されている。
本稿では,生成モデル間の即時依存不一致を検出し解析するためのカーネルベースのフレームワークであるPromptSplitを提案する。
テキスト・ツー・イメージ、テキスト・トゥ・テキスト、イメージ・キャプション設定にわたる実験は、PromptSplitが地面と真実の行動の違いを正確に検出していることを示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:53:10 GMT)
Optimal Decision-Making Based on Prediction Sets [18.9] 予測セットは、未知のテスト結果を保証された確率でカバーするために、任意のMLモデルをラップすることができる。
本稿では,予測セットのカバレッジ保証と一致した最悪のケース分布に対する損失(リスク)を最小限に抑えるための決定理論フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:20:34 GMT)
Inlier-Centric Post-Training Quantization for Object Detection Models [18.8] 学習後の量子化手法であるInlierQを提案する。
InlierQは、勾配のボリュームサリエンシスコアを計算し、各ボリュームをイリヤまたは異常として分類し、これらのスコアの後方分布に適合する。
COCOとnuScenesベンチマークの実験では、カメラベース(2Dと3D)とLiDARベース(3D)オブジェクト検出の量子化誤差が一貫した減少を示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:44:37 GMT)
D3PIA: A Discrete Denoising Diffusion Model for Piano Accompaniment Generation From Lead sheet [18.8] ピアノロール表現におけるリードシートと伴奏の局所的アライメントを用いた離散拡散型ピアノ伴奏生成モデルD3PIAを提案する。
ピアノ伴奏生成のベンチマークであるPOP909データセットを用いて,本モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:39:33 GMT)
Bongards at the Boundary of Perception and Reasoning: Programs or Language? [18.7] 人間は、視覚的推論能力を根本的に新しい状況に展開する能力を持っている。
ボナード問題を解くためのニューロシンボリックアプローチを提案する。
本手法は, 基本真理則に基づくボナード問題画像の分類と, 問題のスクラッチからの解法について評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:04:27 GMT)
From Global to Local: Learning Context-Aware Graph Representations for Document Classification and Summarization [18.7] 本稿では,グラフベースの文書表現を自動的に構築するデータ駆動方式を提案する。
我々は動的スライディング・ウインドウ・アテンション・モジュールを利用して文間の意味的依存関係をキャプチャする。
本稿では,抽出文書要約のためのグラフ構築手法の探索的評価を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:48:47 GMT)
Evaluating LLMs When They Do Not Know the Answer: Statistical Evaluation of Mathematical Reasoning via Comparative Signals [18.6] 我々は,標準ラベル付き結果と,モデルが補助的推論連鎖を判断することで得られるペアワイズ比較信号とを組み合わせたフレームワークを開発する。
シミュレーション全体では, モデル出力ノイズの増加に伴い, 評価精度が大幅に向上し, ゲインが増大する。
GPQA Diamond、AIME 2025、GSM8Kの実験では、より正確な性能推定とより信頼性の高いモデルランキングが示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:40:01 GMT)
AtlasPatch: An Efficient and Scalable Tool for Whole Slide Image Preprocessing in Computational Pathology [18.5] 我々はAtlasPatchを提案する。AtlasPatchは、正確な組織検出と高特定パッチ抽出のためのスライド前処理フレームワークである。
このツールは、ティッシュマスクをサムネイルからフル解像度スライドに外挿し、パッチを直接共通のイメージエンコーダにストリームして、パッチイメージの埋め込みや保存を行う。
我々は,AtlasPatchをセグメント化精度,計算複雑性,下流のマルチインスタンス学習で評価し,計算コストのごく一部で動作しながら,最先端のパフォーマンスを一致させる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:32:07 GMT)
Chaplains' Reflections on the Design and Usage of AI for Conversational Care [18.4] 日常的な感情的支援の多くは、非クリニカルな文脈で必要とされる。
チャプレーンがいかにして会話型AIを知覚し、関与するかを検討する。
我々の分析は、牧師がいかにして牧畜業務を知覚しているかを明らかにしている。
この視点は、非クリニカルな文脈で幸福をサポートすることを目的とした設計を知らせる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:04:49 GMT)
Preference-based Conditional Treatment Effects and Policy Learning [18.4] 条件優先型治療効果(CPTE)に基づく条件付き治療効果推定と政策学習のための新しい嗜好ベースのフレームワークを提案する。
CPTEは、結果が優先規則でランク付けされ、不均一な効果の柔軟なモデリングを解き放つことを要求している。
我々は、マッチング、量子化、分布回帰による推定戦略を提案し、さらに、プラグインバイアスを補正しポリシー値を最大化するための効率的な影響関数推定器を設計する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:31:26 GMT)
Accountability in Open Source Software Ecosystems: Workshop Report [18.4] オープンソースソフトウェアエコシステムは、非営利団体、ボランティアコントリビュータ、ユーザ、企業など、さまざまな利害関係者で構成されています。
オープンソースコミュニティが利害関係者をどうやって識別し、関与し、彼らのニーズを理解し、それらのニーズに責任を負うかは明らかではない。
この対人ワークショップの目的は、オープンソースのソフトウェアエコシステムにおける説明責任の役割に関する重要かつ緊急の質問を探求する会話を開始することであった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:27:07 GMT)
Input-to-State Safe Backstepping: Robust Safety-Critical Control with Unmatched Uncertainties [18.3] 本稿では,不整合障害を有する非線形システムの安全クリティカル制御に対する建設的アプローチを提案する。
まず、これらの不確実性のあるシステムに対する入出力安全性(ISSf)フレームワークの一般化について述べる。
次に、不一致な2種類のシステムに対してISSf-CBFを構築する手順を概説する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:09:36 GMT)
Deep-Learning-Based Control of a Decoupled Two-Segment Continuum Robot for Endoscopic Submucosal Dissection [18.3] DESectBotは、分離された構造と統合された外科用シロップを備えた、新しい二重セグメント連続ロボットである。
チップ位置と方向制御を同時に行うための繰り返し単位(GRU)に基づくディープラーニングコントローラを提案する。
ペグ転送タスクにおいて、GRUは平均転送時間11.8秒で100%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:35:02 GMT)
Variance-Reduced Model Predictive Path Integral via Quadratic Model Approximation [18.2] 本稿では,事前モデルをサンプリングプロセスに統合したハイブリッド分散再生MPPIフレームワークを提案する。
本研究では,2次近似を適用すれば,情報領域のサンプルを効果的に濃縮する閉形式モデルガイダンスの導出が可能になることを実証する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:23:17 GMT)
LogicScan: An LLM-driven Framework for Detecting Business Logic Vulnerabilities in Smart Contracts [18.1] スマートコントラクトにおけるビジネスロジックの脆弱性を検出するための,自動化されたコントラスト監査フレームワークであるLogicScanを提案する。
LogicScanの背景にある重要な洞察は、成熟した、広くデプロイされたオンチェーンプロトコルが、十分にテストされた、コンセンサス駆動のビジネス不変性を暗黙的にエンコードしていることです。
DeFiHacks、Web3Bugs、および上位200の監査済み契約を含む3つの実世界のデータセット上でLogicScanを評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:56:53 GMT)
Entropy-Gated Selective Policy Optimization:Token-Level Gradient Allocation for Hybrid Training of Large Language Models [18.1] 大規模言語モデルのハイブリッドトレーニング手法は、専門家によるデモンストレーションにおける教師付き微調整(SFT)とモデルロールアウトにおける強化学習(RL)を組み合わせる。
本稿では,トークンレベル勾配変調によるサンプルレベル混合を拡張する3段階フレームワークであるEntropy Gated Selective Policy Optimization (EGSPO)を提案する。
EGSPOは数学的推論ベンチマークにおいて一貫した改善を達成し、AIMEでは3.8%、CHORD phiベースラインでは2.9%、計算オーバーヘッドは3.4%に留まった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:38:21 GMT)
Structured Self-Consistency:A Multi-Task Evaluation of LLMs on VirtualHome [17.9] エージェントは目標を理解し、アクションを計画し、シミュレーション環境でタスクを実行する必要がある。
本稿では,Embodied Agent Interface (EAI) フレームワークを用いたVirtualHomeベンチマークにおいて,Large Language Models (LLM) の総合評価を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:15:21 GMT)
Depth Completion in Unseen Field Robotics Environments Using Extremely Sparse Depth Measurements [17.7] 本研究では,合成データに基づく深度補完モデルを提案し,深度センサによる極端にスパースな計測値を用いて,見えないフィールドロボティクス環境における深度を推定する。
当社のアプローチでは,Nvidia Jetson AGX Orin上で1フレームあたり53ミリ秒のエンドツーエンドレイテンシを実現し,組み込みプラットフォームへのリアルタイムデプロイメントを実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:24:05 GMT)
Human-in-the-loop Adaptation in Group Activity Feature Learning for Team Sports Video Retrieval [17.7] 本稿では,グループアクティビティのアノテーションを使わずにGAFL(Group Activity Feature Learning)のためのHuman-in-the-loop適応を提案する。
本手法は,グループ活動の類似性に基づいた事前学習を行う。
2つのチームスポーツデータセットの総合的な実験結果から,本手法が検索性能を大幅に改善することを確認した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:15:43 GMT)
Likelihood-Based Reward Designs for General LLM Reasoning [17.6] 強化学習による微調整された大きな言語モデルは、ベンチマーク毎に特定の報酬関数、しばしばバイナリを必要とする。
ここでは,基準解を出力する確率や対数確率から得られる報酬について検討する。
連鎖学習の報奨として参照回答の対数確率を用いることが,すべての設定において良好に機能する唯一の選択肢であることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:04:21 GMT)
Multimodal Generative Recommendation for Fusing Semantic and Collaborative Signals [17.6] 逐次リコメンデータシステムは、ユーザのインタラクション履歴をモデル化し、結果のユーザ表現とストアドアイテムの埋め込みの間の内部積を計算することで、関連する項目をランク付けする。
大きなアイテムを格納する際のメモリオーバーヘッドを大幅に回避するため、生成推奨パラダイムは、各アイテムを独立したセマンティックコードとしてモデル化する。
これらのメソッドは、大きなアイテムセットの伝統的なシーケンシャルなレコメンデータを超えておらず、それらが対処するように設計されたシナリオでの採用を制限する。
マルチモーダル・セマンティック・コラボレーション・ジェネレーティブ・レコメンダであるMSCGRecを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:39:35 GMT)
NLI:Non-uniform Linear Interpolation Approximation of Nonlinear Operations for Efficient LLMs Inference [17.6] 非一様線形補間(NLI)と呼ばれるキャリブレーションのない動的プログラミング最適化フレームワークを提案する。
NLIは様々な非線形関数を効率的に近似することができ、大きな言語モデルへのシームレスな統合を可能にする。
ハードウェア実験により、NLIエンジンは計算効率を4倍以上に向上することが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:47:58 GMT)
The Algorithmic Self-Portrait: Deconstructing Memory in ChatGPT [17.6] 実世界の80人のChatGPTユーザの2,050個のメモリエントリを分析した。
私たちのデータセットの96%のメモリは、会話システムによって一方的に生成されます。
大部分のメモリ(84%)は、ユーザコンテキストで直接ベースになっています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:15:34 GMT)
FARTrack: Fast Autoregressive Visual Tracking with High Performance [17.5] FARTrackは高速自動回帰トラッキングフレームワークである。
GOT-10kで70.6%のAOをリアルタイムで提供する。
我々の最速モデルは、GPU上で343FPS、CPU上で121FPSの速度を達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:29:36 GMT)
AesRec: A Dataset for Aesthetics-Aligned Clothing Outfit Recommendation [17.5] 本稿では,体系的な定量的美学アノテーションを特徴とするAesRecベンチマークデータセットを提案する。
アイテムレベルでは、シルエット、色度、物質性、職人技、着用性、アイテムレベルの印象の6つの次元が独立して評価される。
我々は、ファッションデータセット上で厳密な人間と機械の整合性検証を行い、生成した評価の信頼性を確認する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:44:00 GMT)
Investigating the Influence of Spatial Ability in Augmented Reality-assisted Robot Programming [17.4] Augmented Reality(AR)は、学習を促進するための有望な機会を提供するが、そのメカニズムと効果はまだ完全には理解されていない。
本研究では,ロボットプログラミングの文脈において,空間能力がARによる学習経験に及ぼす影響について検討した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:58:54 GMT)
MeetBench-XL: Calibrated Multi-Dimensional Evaluation and Learned Dual-Policy Agents for Real-Time Meetings [17.0] 企業会議から得られたバイリンガルかつマルチモーダルなコーパスであるMeetAllについて紹介する。
MeetBench XLは、事実の忠実さ、意図の整合性、応答効率、構造的明確性、完全性を測定する。
MeetMaster XLは学習されたデュアルポリシーエージェントで、高速で遅い推論パスとツール呼び出しの間のクエリルーティングを共同で最適化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:08:18 GMT)
Phaedra: Learning High-Fidelity Discrete Tokenization for the Physical Science [16.9] 物理空間およびスペクトル空間におけるPDE特性の忠実度を測定するために,画像トークンの集合の精度について検討する。
これらが細部と精密な大きさの両方を捉えるのに苦労しているという観察に基づいて、我々はPaedraを提案する。
Phaedraは、さまざまなPDEデータセットの再構成を一貫して改善することを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:12:57 GMT)
Live or Lie: Action-Aware Capsule Multiple Instance Learning for Risk Assessment in Live Streaming Platforms [16.9] ライブストリーミングは、今日のインターネットの基盤となり、大規模なリアルタイムソーシャルインタラクションを可能にしている。
複数の参加者の間で、まばらで調整された悪意のある行動によって引き起こされる深刻なリスクに直面します。
本稿では,ライブストリーミングルームにおけるリスクアセスメントの先駆的研究について述べる。
本稿では,個人行動とグループレベルの協調パターンの両方をモデル化するアクション対応カプセルMILフレームワークであるAC-MILを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:36:59 GMT)
EverMemBench: Benchmarking Long-Term Interactive Memory in Large Language Models [16.9] EverMemBenchは、100万以上のトークンにまたがる多人数のマルチグループ会話を特徴とするベンチマークである。
EverMemBenchは、1000以上のQAペアを通じて3次元にわたるメモリシステムを評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:03:41 GMT)
Unifying Watermarking via Dimension-Aware Mapping [16.9] DiMは、次元認識問題として透かしを定式化する新しい多次元透かしフレームワークである。
埋め込みと抽出の次元的構成がウォーターマーキングの挙動を決定づけていることが判明した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:49:52 GMT)
Reward Redistribution for CVaR MDPs using a Bellman Operator on L-infinity [16.8] 静的条件付きリスクリスク(CVaR)のようなテールエンドのリスク対策は、稀だが破滅的な事態を防止するために安全クリティカルな応用に用いられている。
我々は、離散化された拡張状態に依存するリスク逆値とモデルなしQ-ラーニングアルゴリズムを開発した。
実験により,本アルゴリズムはCVaR感受性ポリシーを学習し,効果的な性能保証トレードオフを実現することができた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:39:45 GMT)
LaVPR: Benchmarking Language and Vision for Place Recognition [16.7] 既存のVPRデータセットを65万以上のリッチな自然言語記述で拡張する大規模なベンチマークであるLaVPRを紹介します。
その結果,視覚的に劣化した条件下で言語記述が一貫した利得が得られることがわかった。
LaVPRは、実世界のレジリエンスとリソース制約されたデプロイメントの実践の両方が可能な、新しいタイプのローカライゼーションシステムを実現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:38:38 GMT)
Invisible Clean-Label Backdoor Attacks for Generative Data Augmentation [16.7] InvLBAは潜伏摂動による生成データ増強のための見えないクリーンラベルバックドア攻撃法である。
本手法は,SOTA防御法に対して,清潔な精度と強靭さの低下がほとんどなく,攻撃成功率を平均46.43%向上させることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:46:37 GMT)
MUSE: A Multi-agent Framework for Unconstrained Story Envisioning via Closed-Loop Cognitive Orchestration [16.6] 我々は,短いユーザプロンプトから長文音声視覚ストーリーを生成するフレームワークを開発した。
MUSEは物語の意図を、個人性、空間構成、時間的連続性に関する明示的で機械実行可能な制御に翻訳する。
MUSEは、ロングホライズンな物語のコヒーレンス、クロスモーダルなアイデンティティの整合性、および映画的品質を代表的ベースラインに比べて大幅に改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:55:00 GMT)
Improved Analysis of the Accelerated Noisy Power Method with Applications to Decentralized PCA [16.6] 主成分分析のためのアルゴリズムである加速度雑音パワー法を解析する。
我々は,収束率を改善できないという意味で,解析が最悪の場合最適であることを示す。
これはPCAの収束を確実に加速する最初の分散化アルゴリズムである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:03:11 GMT)
WebExpert: domain-aware web agents with critic-guided expert experience for high-precision search [16.5] WebExpertは、ファイナンス、バイオメディシン、医薬品のためのドメイン対応のWebエージェントである。
WebExpertは最強のブラウジングベースラインに対して、Answer Exact Match (EM)を1.5-3.6pp改善した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:13:05 GMT)
A Hitchhiker's Guide to Poisson Gradient Estimation [16.5] Exponential Arrival Time (EAT) シミュレーションと Gumbel-SoftMax 緩和である。
実践者のための実践的指導とともに,これらの手法を初めて体系的に比較した。
我々の主な技術的貢献は、理論的に偏りのない最初の瞬間を保証するEAT法の変更である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:47:30 GMT)
Should I use Synthetic Data for That? An Analysis of the Suitability of Synthetic Data for Data Sharing and Augmentation [16.4] 本研究では,(1)プライバシを保護しながら統計分析を可能にするために,プライエタリなデータセットのプロキシとして合成データを共有すること,(2)モデル性能を向上させるために機械学習トレーニングデータセットを合成データで強化すること,(3)統計的推定のばらつきを低減するために合成データでデータセットを増強すること,の3つの重要なユースケースについて検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:52:57 GMT)
Understanding and Exploiting Weight Update Sparsity for Communication-Efficient Distributed RL [16.4] 帯域幅に制約のある分散環境では,100倍(14 GBから108 MB)の通信削減を実現している。
本研究は,重み付け時空間の段階的および多段階的粒度に関する系統的研究である。
アップデートの間隔は一貫して高く、実際に関係のある設定で99%を超えることがよくあります。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:56:48 GMT)
EHRWorld: A Patient-Centric Medical World Model for Long-Horizon Clinical Trajectories [16.4] 近年の大規模言語モデル (LLM) は, 静的な医学的推論タスクにおいて高い性能を発揮している。
臨床知識を取り入れたLCMは,連続的介入による一貫した患者状態の維持に苦慮している。
EHRWorldは、患者中心の医療世界モデルであり、因果的シーケンシャルパラダイムの下で訓練されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:12:24 GMT)
ST-Raptor: An Agentic System for Semi-Structured Table QA [16.2] 半構造化テーブル質問応答(QA)のためのエージェントシステムST-Raptorを提案する。
ST-Raptorは、ビジュアル編集、ツリーベースの構造モデリング、エージェント駆動クエリ解決を組み合わせたインタラクティブな分析環境を提供し、正確でユーザフレンドリなテーブル理解をサポートする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:06:21 GMT)
Multi-Agent Causal Reasoning System for Error Pattern Rule Automation in Vehicles [16.0] 本稿では,EPルールの自動生成を行うマルチエージェントシステムであるCAREP(Causal Automated Reasoning for Error Patterns)を紹介する。
29,100以上のユニークなDTCと474のエラーパターンを持つ大規模自動車データセットの評価は、CAREPが未知のEPルールを自動的かつ正確に発見できることを実証している。
CAREPは、実用的な因果発見とエージェントベースの推論を一体化することにより、完全な自動故障診断への一歩である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:15:44 GMT)
Linguistic Blind Spots in Clinical Decision Extraction [15.9] 薬物関連および問題定義決定は、エンティティ・センスとテレグラフィである。
助言的・予防的な決定は、より物語的であり、より高い停止語と代名詞比率を含んでいる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:04:26 GMT)
Scaling Test-Driven Code Generation from Functions to Classes: An Empirical Study [15.9] テスト駆動開発(TDD)は、LLM(Large Language Model)ベースのコード生成を改善するために採用されている。
反復型TDDフレームワークを使用して、関数からクラスへのテスト駆動コード生成をスケールします。
我々のフレームワークは、クラスレベルの正しさを12から26の絶対点に改善し、最大71%の完全正解クラスを達成します。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:04:05 GMT)
AIR-VLA: Vision-Language-Action Systems for Aerial Manipulation [15.8] VLA(Vision-Language-Action)モデルは、地上ベースのインボディードインテリジェンスにおいて顕著な成功を収めた。
エアリアル・マニピュレーション・システム(AMS)への彼らの応用は、まだほとんど探索されていないフロンティアである。
航空操作に適した最初のVLAベンチマークである textbfAIR-VLA を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:41:10 GMT)
FinMTM: A Multi-Turn Multimodal Benchmark for Financial Reasoning and Agent Evaluation [15.7] FinMTMはマルチターンマルチモーダルベンチマークであり、データ次元とタスク次元の両方に沿って多様性を拡張する。
データ側では、財務状況を基礎とした11,133のバイリンガル(中国語と英語)財務QAペアをキュレートし、注釈付けします。
タスク側では、FinMTMはシングルチョイスと複数チョイスの質問、複数ターンのオープンエンド対話、エージェントベースのタスクをカバーしている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:38:24 GMT)
WebSplatter: Enabling Cross-Device Efficient Gaussian Splatting in Web Browsers via WebGPU [15.6] WebSplatterは、ヘテロジニアスなWebエコシステムのためのエンドツーエンドのGPUレンダリングパイプラインである。
WebSplatterは一貫して1.2$times$から4.5$times$のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:18:40 GMT)
Q-ShiftDP: A Differentially Private Parameter-Shift Rule for Quantum Machine Learning [15.6] ここでは差分私法を紹介する。
シフトルール(Q-ShiftDP) - 量子機械学習(QML)に適した最初のプライバシメカニズム
パラメータシフト則によって計算される固有有界性と固有量子勾配を利用することで、Q-ShiftDPはより厳密な感度解析を可能にし、ノイズ要求を低減できる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:02:18 GMT)
Entropic Mirror Monte Carlo [15.6] 本稿では,効率的な提案分布構築のための新しい適応手法を提案する。
提案アルゴリズムは,グローバルサンプリング機構と遅延重み付け手法を組み合わせることで,目標分布の効率的な探索を促進する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:32:35 GMT)
Beyond the Commit: Developer Perspectives on Productivity with AI Coding Assistants [15.5] 本研究では、AI符号化アシスタントの生産性への影響を評価するための様々なアプローチの有効性について分析する。
調査の結果は、AIツールの有用性に関する矛盾する視点を明らかにし、インタビューは生産性の短期次元と長期次元の両方を捉える6つの異なる要因を提示する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:47:30 GMT)
SpecMD: A Comprehensive Study On Speculative Expert Prefetching [15.4] Mixture-of-Experts (MoE)モデルはスパース専門家のアクティベーションを可能にする。
我々は,MoEの予測可能な専門家アクセスパターンを利用して,衝突ミスを最大8,5倍まで低減する新しい消去ポリシーである textbfLeast-Stale を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:36:56 GMT)
Sequential Group Composition: A Window into the Mechanics of Deep Learning [15.3] シーケンシャルなグループ構成タスクを紹介します。
ネットワークはこのタスクを一度にグループの既約表現として学習する。
このスケーリングを劇的に改善するために、より深いモデルがタスクの連想性をいかに活用しているかを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:36:25 GMT)
Unified Inference Framework for Single and Multi-Player Performative Prediction: Method and Asymptotic Optimality [15.3] 本稿では,単一エージェントと複数エージェントのパフォーマンスを橋渡しする,統一的な統計的推論フレームワークを提案する。
動的でパフォーマンスの高い環境で、信頼性の高い見積もりと意思決定のための原則化されたツールキットを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:17:54 GMT)
MIRROR: A Multi-Agent Framework with Iterative Adaptive Revision and Hierarchical Retrieval for Optimization Modeling in Operations Research [15.3] MIRRORは、操作研究のための微調整のないエンドツーエンドのマルチエージェントフレームワークである。
自然言語の最適化問題を数学的モデルや解法コードに変換する。
実験により、MIRRORは標準的なOperations Researchベンチマークの既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:46:56 GMT)
BamaER: A Behavior-Aware Memory-Augmented Model for Exercise Recommendation [15.2] エクササイズ・レコメンデーションは、学生の学習履歴、個人的関心事、その他個人化された特徴に規定された個別のエクササイズ選択に焦点を当てる。
BamaERは,3つのコアモジュールで構成される,行動対応のメモリ拡張型エクササイズ推奨フレームワークである。
5つの実世界の教育データセットの実験によると、BamaERは最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:45:54 GMT)
JRDB-Pose3D: A Multi-person 3D Human Pose and Shape Estimation Dataset for Robotics [15.2] JRDB-Pose3Dは、モバイルロボットプラットフォームから、屋内および屋外のマルチヒューマン環境をキャプチャする。
JRDB-Pose3Dには、平均して1フレームあたり5~10人のポーズがあり、最大35人の人物が同時に登場するシーンもある。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:46:27 GMT)
Reg4Pru: Regularisation Through Random Token Routing for Token Pruning [15.2] 本稿では,セグメンテーションのためのトークンプレーニング性能損失を軽減するトレーニング正規化手法であるReg4Pruを紹介する。
Reg4Pruは、ルーティングなしでトレーニングされた同じモデルと比較して、平均精度を絶対46%改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:40:55 GMT)
Benchmarking Bias Mitigation Toward Fairness Without Harm from Vision to LVLMs [14.9] 実世界のデータに基づいてトレーニングされた機械学習モデルは、特定の社会的グループに対するバイアスを継承し、増幅することが多い。
我々は、標準化されたデータ、メトリクス、トレーニングプロトコルの下で、公正性を損なうことなく統一されたベンチマークであるNH-Fairを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:37:37 GMT)
Self-supervised Physics-Informed Manipulation of Deformable Linear Objects with Non-negligible Dynamics [14.8] SPiDは、変形可能な線形オブジェクトの動的操作のための物理インフォーム付き自己教師付き学習フレームワークである。
タスク指向コストを用いてニューラルコントローラをトレーニングし、微分可能なオブジェクトモデルとの相互作用を通じてエンドツーエンドの最適化を可能にする。
我々は、手頃なマーカーレスロープ認識法を開発し、ノイズや低周波状態の更新を伴って、制御が性能を維持することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:14:09 GMT)
Beyond Tokens: Semantic-Aware Speculative Decoding for Efficient Inference by Probing Internal States [14.8] 大規模言語モデル(LLM)は多くのタスクで高いパフォーマンスを達成するが、自動回帰復号化による高い推論遅延に悩まされる。
トークンの代わりにセマンティックシークエンス全体を検証するセマンティックス(SemanticSpec)を提案する。
4つのベンチマーク実験により、SemanticSpecはDeepSeekR1-32Bで2.7倍、QwQ-32Bで2.1倍のスピードアップを実現し、トークンレベルとシーケンスレベルのベースラインを効率と有効性の両方で一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:30:30 GMT)
MemCast: Memory-Driven Time Series Forecasting with Experience-Conditioned Reasoning [14.6] 時系列予測(TSF)は多くの実世界のアプリケーションにおいて意思決定において重要な役割を果たす。
MemCastは、経験条件推論タスクとしてTSFを再構成する学習から記憶へのフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:31:40 GMT)
DynSplit-KV: Dynamic Semantic Splitting for KVCache Compression in Efficient Long-Context LLM Inference [14.5] KVキャッシュは、効率的な言語モデル(LLM)推論に必須である。
現在の圧縮法は、固定間隔や事前定義のような厳密な分割戦略に依存している。
分割に使用するセマンティックブロックを動的に識別するKVCache圧縮手法であるDyn-KVを提案する。
実験の結果、Dyn-KVはFlashAttentionと比較して2.2倍のスピードアップを実現し、長いコンテキストシナリオでは2.6倍のピークメモリ削減を実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:54:56 GMT)
Full end-to-end diagnostic workflow automation of 3D OCT via foundation model-driven AI for retinal diseases [14.3] フルプロセスOCTベースの臨床ユーティリティシステム(FOCUS)について紹介する。
FOCUSは3D OCT網膜疾患診断のエンドツーエンド自動化を可能にする基礎モデル駆動フレームワークである。
我々は,3,300例(40,672スライス),および4つの異なる中心および多彩なOCTデバイスにまたがる1,345例(18,498スライス)について,訓練および試験を行った。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:28:51 GMT)
FedKRSO: Communication and Memory Efficient Federated Fine-Tuning of Large Language Models [14.2] 大規模言語モデル(LLM)の微調整は、それらをドメイン固有のタスクに適応させるのに不可欠である。
FL(Federated Learning)は、FLファインチューニングで人気を集めているが、完全なモデルパラメータを伝達するコストが高いため、依然として困難である。
本稿では,FedKRSOを提案する。フェデレーション設定におけるLLMの通信とメモリ効率向上のための新しいFedKRSOを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:39:33 GMT)
Fully Kolmogorov-Arnold Deep Model in Medical Image Segmentation [14.2] 本研究は,提案したKA層とKAonv層がFC層とConv層を完全に置き換えた最初のフルKAベースディープモデルを提案する。
直接積み重ねられたkanと比較して、ALL U-KANはパラメータカウントの10倍の削減を実現し、メモリ消費を20倍以上削減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:14:04 GMT)
Ultra Fast PDE Solving via Physics Guided Few-step Diffusion [14.1] Phys-InstructはPDEを解くための物理誘導蒸留フレームワークである。
事前学習された拡散PDEソルバを、マッチングジェネレータと事前拡散分布を介して、数ステップのジェネレータに圧縮する。
最先端拡散ベースラインと比較して、PDEエラーを8倍以上削減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:16:42 GMT)
PQTNet: Pixel-wise Quantitative Thermography Neural Network for Estimating Defect Depth in Polylactic Acid Parts by Additive Manufacturing [14.1] 本研究は,ポリ乳酸 (PLA) 部品のこの課題に対処するためのPQT-Net(Pixel-wise Quantitative Thermography Neural Network)を提案する。
重要な革新は、熱ストライプデータを2次元画像に再構成する新しいデータ拡張戦略である。
他のディープラーニングモデルよりもPQT-Netの方が優れており、最小平均絶対誤差(MAE)は0.0094mm、決定係数(R)は99%を超える。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:43:15 GMT)
Causal Graph Spatial-Temporal Autoencoder for Reliable and Interpretable Process Monitoring [14.1] 本稿では,産業プロセス監視のための因果グラフ空間時間オートエンコーダ(CGSTAE)を提案する。
CGSTAEのネットワークアーキテクチャは、相関グラフ構造学習モジュールと時空間エンコーダデコーダモジュールの2つのコンポーネントを組み合わせる。
提案したCGSTAEは,特徴空間と残差空間の2つの統計量を用いて,効率的なプロセス監視と故障検出を可能にする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:18:09 GMT)
Feasible strategies for conflict resolution within intuitionistic fuzzy preference-based conflict situations [14.0] 本稿では,従来の嗜好モデルよりも細かい粒度でエージェントの態度を把握できる,直観主義的なファジィな嗜好に基づく紛争状況を紹介する。
エージェントペア,エージェントセット,イシューセットの3方向競合解析モデルを構築した。
本稿では,調整機構を基盤とした,調整度とコンフリクト度の両方を同時に考慮した実現可能な戦略を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:30:34 GMT)
Failure is Feedback: History-Aware Backtracking for Agentic Traversal in Multimodal Graphs [13.9] オープンドメインマルチモーダル文書検索は,大規模および相互接続された文書コーパスから特定のコンポーネントを検索することを目的としている。
既存のグラフベースの検索手法は、ホップ固有の意味論を無視する一様類似度尺度に依存している。
本稿では,逐次決定プロセスとしてサブグラフ検索を行うFailure is Feedback (FiF)を提案する。
FiFはMultimodalQA、MMCoQA、WebQAのベンチマークで最先端の検索を実現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:54:38 GMT)
Beyond Blame: Rethinking SZZ with Knowledge Graph Search [13.8] 本稿では,時間的知識グラフ(TKG)をソフトウェア進化解析に適用するための最初のアプローチであるAgenticSZZを提案する。
我々は,AgenicSZZがF1スコア0.48から0.74を達成することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:10:48 GMT)
Model Optimization for Multi-Camera 3D Detection and Tracking [13.8] 室内環境におけるマルチカメラの外部認識の重要性はますます高まっている。
クエリベースの3D検出・追跡フレームワークであるSparse4Dを評価した。
我々は,入力フレームレートの低減,学習後の量子化,WILDTRACKベンチマークへの転送,およびトランスフォーマーエンジンの混合精度の微調整について検討した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:47:07 GMT)
MENASpeechBank: A Reference Voice Bank with Persona-Conditioned Multi-Turn Conversations for AudioLLMs [13.6] 我々は,複数のMENA諸国にまたがる124人の話者から約18Kの高品質発話からなる参照音声バンクMENASpeechBankを紹介した。
i)世界価値にインスパイアされた属性に富んだペルソナプロファイルを構築し、(ii)約5Kの会話シナリオの分類を定義し、(iii)意味的類似性を通じてペルソナとシナリオをマッチングし、(iv)約417Kのロールプレイ会話を生成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:22:27 GMT)
Inference-time Unlearning Using Conformal Prediction [13.5] Unlearningは、トレーニングされた機械学習モデルから、スクラッチからトレーニングすることなく、特定の情報を効率的に除去するプロセスである。
本稿では、モデルパラメータを更新することなく、検証者からのフィードバックを用いて、生成した応答の質を反復的に改善するフレームワークを提案する。
本稿では,既存の最先端手法を著しく上回り,未学習ベンチマークにおける未学習誤差を最大93%削減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:46:50 GMT)
Quantum Speedups for Derivative Pricing Beyond Black-Scholes [13.3] 本稿では,エキゾティックスの導関数価格決定のための量子アルゴリズムの進歩について検討する。
既存のフレームワークを拡張して、より実用的なモデルのための新しい二次的なスピードアップを実証する。
また、デリバティブ価格の分析を改良し、GBMおよびCIRモデルの価格設定のためのリソース要求を大幅に削減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:45:24 GMT)
TodyComm: Task-Oriented Dynamic Communication for Multi-Round LLM-based Multi-Agent System [13.3] TodyCommはtextbftask-textbforiented textbfdynamic textbfcommunicationアルゴリズムである。
各ラウンドのダイナミクスに適応する行動駆動型コラボレーショントポロジを生成し、ポリシー勾配を通じてタスクのユーティリティを最適化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:07:59 GMT)
NeuroPareto: Calibrated Acquisition for Costly Many-Goal Search in Vast Parameter Spaces [13.2] NeuroParetoは、ランク中心のフィルタリング、不確実性回避、履歴条件付き取得戦略を統合する、凝集性のあるアーキテクチャである。
歴史的ハイパーボリュームの改善からオンラインでトレーニングされた軽量な取得ネットワークは、収束と多様性のバランスをとる領域に対する高価な評価を導く。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:02:06 GMT)
Simulating Meaning, Nevermore! Introducing ICR: A Semiotic-Hermeneutic Metric for Evaluating Meaning in LLM Text Summaries [13.1] 本稿では,大言語モデル(LLM)生成言語における意味を研究するための学際的枠組みを提案する。
本稿では,言語記号が静的および文脈的埋め込みモデルにおいて,ベクトル化表現にどのように変換されるかを検討する。
次に、LCM出力における意味的精度と意味的アライメントを評価するために設計されたICR(Inductive Conceptual Rating)メトリクスを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:05:09 GMT)
OmniRAG-Agent: Agentic Omnimodal Reasoning for Low-Resource Long Audio-Video Question Answering [13.0] OmniRAG-Agent(英語版)は、予算付きロングオーディオビデオ推論のためのエージェント・オムニモーダルQA法である。
OmniLLMは、外部の銀行から短い、関連するフレームとオーディオスニペットを取り出すことができる。
エージェントループを使用して、ターンにまたがってツールを呼び出し、検索したエビデンスをマージして複雑なクエリに応答する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:28:24 GMT)
Rethinking Music Captioning with Music Metadata LLMs [12.9] 大きな言語モデル(LLM)を使用してメタデータからキャプションを合成し、キャプションモデルのためのトレーニングデータを生成することが一般的である。
より直接的なアプローチとしてメタデータベースのキャプションを提案する。
音声から詳細な音楽メタデータを推測し,それを表現的キャプションに変換するメタデータ予測モデルを訓練する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:42:01 GMT)
SceneLinker: Compositional 3D Scene Generation via Semantic Scene Graph from RGB Sequences [12.8] SceneLinkerはRGBシーケンスからセマンティックシーングラフによって構成的な3Dシーンを生成するフレームワークである。
我々の研究により、ユーザーはシーングラフを通して物理的な環境から一貫した3D空間を生成でき、空間的混合現実感(MR)コンテンツを作成することができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:22:07 GMT)
BayeSQP: Bayesian Optimization through Sequential Quadratic Programming [12.6] BayeSQPは一般的なブラックボックス最適化のための新しいアルゴリズムである。
逐次二次プログラミングの構造とベイズ最適化の概念を組み合わせる。
BayeSQPは高次元設定で最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:08:03 GMT)
GPAIR: Gaussian-Kernel-Based Ultrafast 3D Photoacoustic Iterative Reconstruction [12.6] 超高速3次元光音響イテレーティブレコンストラクションは、計算におけるオーダー・オブ・マグニチュード・アクセラレーションを達成する。
この革命的な超高速画像再構成により、ほぼリアルタイムな大規模3D PA再構成が可能となり、3D PACTが臨床応用に向けて著しく進歩する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:06:33 GMT)
FlashSinkhorn: IO-Aware Entropic Optimal Transport [12.3] シンクホーン反復によるエントロピック最適輸送(EOT)は、現代の機械学習で広く使われているが、解法は大規模に非効率である。
正方形ユークリッドコストに対するIO対応EOTソルバである textbfFlashSinkhorn を提案する。
A100$では、FlashSinkhornは、ポイントクラウドOT上の最先端のオンラインベースラインよりも、32倍のフォワードパスと161倍のエンドツーエンドのスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:52:20 GMT)
Function-Space Empirical Bayes Regularisation with Large Vision-Language Model Priors [12.3] VLM-FS-EBは、新しい関数空間経験的ベイズ正規化フレームワークである。
提案手法は予測性能を継続的に改善し,信頼性の高い不確実性推定値が得られることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:24:11 GMT)
Quantized Evolution Strategies: High-precision Fine-tuning of Quantized LLMs at Low-precision Cost [12.2] トレーニング後の量子化(PTQ)は、メモリ制限されたデバイスに大規模言語モデル(LLM)をデプロイするために不可欠である。
本稿では,量子化空間内で直接,全パラメータの微調整を行う最適化パラダイムである量子化進化戦略(QES)を紹介する。
QESは、算術的推論タスクにおいて、最先端のゼロ階微調整法よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:24:31 GMT)
RAL-Bench: Benchmarking for Application-Level Functional Correctness and Non-Functional Quality Attributes [12.2] RAL-Benchはアプリケーションレベルのコード生成のためのベンチマークおよび評価フレームワークである。
各タスクに対して,高品質な参照プロジェクトから簡潔な自然言語要求を抽出する。
Black-boxシステムテストは機能的および非機能的属性をカバーし、参照リポジトリに渡すテストのみを保持する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:35:09 GMT)
Use Graph When It Needs: Efficiently and Adaptively Integrating Retrieval-Augmented Generation with Graphs [12.1] 大型言語モデル(LLM)は幻覚や古くなったパラメトリック知識のために知識集約的な課題に苦しむことが多い。
Retrieval-Augmented Generation (RAG) は外部コーパスを統合することでこの問題に対処するが、その有効性は非構造化ドメイン文書の断片化情報によって制限される。
GraphRAGは構造化知識グラフによる文脈推論を強化するために登場したが、現実のシナリオではバニラRAGをパラドックス的に過小評価している。
本稿では,構文認識複雑性解析によりRAGとGraphRAGのパラダイムを動的に統合するEA-GraphRAGを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:26:28 GMT)
ECHO-2: A Large-Scale Distributed Rollout Framework for Cost-Efficient Reinforcement Learning [12.1] 強化学習(Reinforcement Learning, RL)は、学習後の大規模言語モデル(LLM)において重要な段階である。
本稿では,遠隔推論作業者と非無視の拡散遅延を用いた後学習のための分散RLフレームワークECHO-2を提案する。
ECHO-2は、強力なベースラインに匹敵するRL報酬を維持しながら、コスト効率を大幅に改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:46:33 GMT)
From Inexact Gradients to Byzantine Robustness: Acceleration and Optimization under Similarity [12.1] そこで,Byzantine-Robust分散最適化は,不正確な勾配オラクルを用いた一般化最適化として適用可能であることを示す。
収束を高速化する2つの最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:56:23 GMT)
Causal Inference for the Effect of Code Coverage on Bug Introduction [11.9] 成熟したJavaScriptとTypeScriptオープンソースプロジェクトのコンテキストにおけるバグ導入(アウトカム)に対するコードカバレッジの因果効果を定量化することを目指している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:36:30 GMT)
From Pragmas to Partners: A Symbiotic Evolution of Agentic High-Level Synthesis [11.8] 大規模言語モデルの台頭はAI駆動型ハードウェア設計への関心を喚起し、高いレベルの合成(HLS)はエージェント時代においても重要なのか?
本稿では,HLS と RTL の両面を活用したエージェントハードウェアシステムの実現を期待する一方で,エージェント最適化の実現における HLS とその役割に焦点をあてる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:50:32 GMT)
Information-Theoretic Multi-Model Fusion for Target-Oriented Adaptive Sampling in Materials Design [11.8] 限られた評価予算の下での目標指向の発見には、高次元の不均一な設計空間における信頼性の高い進歩が必要である。
本稿では,目標指向適応サンプリングのための情報理論フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:47:13 GMT)
UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers [11.7] UAT-LITEは、自己アテンションの不確実性を認識させる推論時フレームワークである。
これは、細調整されたBERTベースラインと比較して平均で予測エラーを約20%削減する。
分散シフトの下で選択的な予測とロバスト性を改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:51:26 GMT)
Exploring the Potential of Large Language Models in Simulink-Stateflow Mutant Generation [11.7] LLM(Large Language Models)は、Simulink-Stateflowモデルのための高品質でドメイン固有のミュータントを生成する。
LLMは手作業による突然変異ベースのベースラインの最大13倍の速度でミュータントを生成する。
分析の結果,低-ナトリウム温度値と組み合わせることで最適な結果が得られることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:01:47 GMT)
ReasonEdit: Editing Vision-Language Models using Human Reasoning [11.7] 本稿では,視覚言語モデルエディタReasonEditを提案する。
ReasonEditは、人間の推論をコードブックに格納し、推論中にのみ関連する事実を検索する。
編集中に人為的推論を用いることで、編集の一般化が大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:18:29 GMT)
SpatiaLab: Can Vision-Language Models Perform Spatial Reasoning in the Wild? [11.6] SpatiaLabは6つの主要なカテゴリの1,400の視覚的質問応答ペアで構成されている。
各カテゴリには少なくとも25の質問があり、各カテゴリには少なくとも200の質問が含まれている。
多重選択では、InternVL3.5-72Bは54.93%の精度と87.57%の精度を達成している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:52:02 GMT)
Cross-Modal Alignment and Fusion for RGB-D Transmission-Line Defect Detection [11.6] 本稿では,RGBの外観と深度幾何学を原理化されたヒューズ・パラダイムを通じて統合したクロスモーダルアライメント・アンド・フュージョン・ネットワークであるCMAFNetを提案する。
CMAFNetは、辞書ベースの特徴浄化を行うセマンティック再構成モジュールで構成されている。
軽量な派生型は228 FPSで24.8% mAP50に達し、わずか4.9Mのパラメータしか持たない。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:57:04 GMT)
See-through: Single-image Layer Decomposition for Anime Characters [11.6] 本稿では,静的アニメイラストをマニピュラブル2.5Dモデルに変換するフレームワークを提案する。
当社のアプローチでは、ひとつの画像を完全に塗装されたセマンティックな異なる層に分解することで、これを克服しています。
提案手法により,プロのリアルタイムアニメーションアプリケーションに適した高忠実でマニピュラブルなモデルが得られることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:12:36 GMT)
Assessing the Impact of Typological Features on Multilingual Machine Translation in the Age of Large Language Models [11.6] 言語をモデル化する本質的な難易度を決定するために, 類型的特性が提案されている。
我々は,NLLB-200 と Tower+ という2つの大きな事前学習型多言語翻訳モデルを解析した。
幅広い言語セットに基づいて、ターゲット言語型付けが両方のモデルの翻訳品質を駆動していることが分かる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:02:06 GMT)
Boost+: Equitable, Incentive-Compatible Block Building [11.5] 私たちは、プロセスを分離してトランザクションの収集と注文を行うシステムである$mathrmBoost+$を提案します。
検索エンジンにとって、デフォルトのアルゴリズムが競合するビルダーを支配すると、真に報告が支配的になる。
検索エンジンが技術的にビルダーと統合できるとしても、真実の入札と組み合わさった非統合が、競合のないトランザクションの偏りを支配していることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:51:29 GMT)
DSFlow: Dual Supervision and Step-Aware Architecture for One-Step Flow Matching Speech Synthesis [11.5] フローマッチングモデルにより高品質なテキスト音声合成が可能になったが、推論時の反復サンプリングプロセスは相当な計算コストを発生させる。
DSFlowは,数ステップと1ステップの合成のためのモジュラー蒸留フレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:57:12 GMT)
Functional Stochastic Localization [11.5] 我々は、ガウス正規化を正規化に置き換えるエルダンの過程を、対数ラプラス変換の任意の正の整数倍で一般化する。
また,このフレームワークを$ell_p$ norms for $p in [1, 2)$で差分プライベートな凸最適化に適用する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:34:46 GMT)
The Powers of Precision: Structure-Informed Detection in Complex Systems -- From Customer Churn to Seizure Onset [11.4] 先天的な現象(てんかん発作、突然の顧客チャーン、またはパンデミック)は、複雑なシステム内の隠れた因果関係から生じることが多い。
本稿では,システムの潜伏する因果構造を明らかにし,活用するという課題に対処する早期発見のための機械学習手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:16:38 GMT)
Reinforcement Learning with Promising Tokens for Large Language Models [11.4] 強化学習(Reinforcement Learning, RL)は、大規模言語モデル(LLM)の整合と最適化のための重要なパラダイムとして登場した。
本稿では,トークン生成から戦略的意思決定を分離することで行動空間の問題を軽減するフレームワークであるReinforcement Learning with Promising Tokens(R)を紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:08:06 GMT)
Learning Heat-based Equations in Self-similar variables [11.4] 自己相似変数(SSV)における熱に基づく方程式の解学習について検討する。
我々は,標準的なニューラル・オペレーティング・トレーニングと互換性のあるSSVトレーニング・フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:12:22 GMT)
Seeing Through Clutter: Structured 3D Scene Reconstruction via Iterative Object Removal [11.2] 本稿では,SeeingThroughClutterについて述べる。SeeingThroughClutterは,オブジェクトを個別にセグメント化,モデリングすることで,単一の画像から構造化された3次元表現を再構成する手法である。
複雑なシーンを単純なサブタスクのシーケンスに分解する反復的なオブジェクト除去と再構築パイプラインを導入することで、この問題に対処する。
本手法では,基礎モデルの継続的な進歩から直接,タスク固有のトレーニングやメリットを必要としない。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:37:43 GMT)
PackInfer: Compute- and I/O-Efficient Attention for Batched LLM Inference [11.1] バッチ推論のための計算およびI/O認識実行を可能にするカーネルレベルのアテンションフレームワークであるPackInferを提案する。
PackInferはレイテンシを13.0-20.1%削減し、最先端のFlashAttentionと比較してスループットを20%改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:46:34 GMT)
MiTA Attention: Efficient Fast-Weight Scaling via a Mixture of Top-k Activations [11.0] トランスフォーマーでは、N幅の表現能力は増大するが、高速な重量のスケーリングは非常に長いシーケンスでは高価になる。
最近、この高速なスケーリングの観点はMixture-of-Experts(MoE)の注意を動機付け、シーケンスを高速な専門家に分割し、トークンを緩やかにルーティングする。
本稿では、この視点を、ルーティングと圧縮器圧縮による高速ウェイトスケーリングと解釈することで、幅広い効率的な注意方法のための統一フレームワークへと引き上げる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:11:05 GMT)
Socratic-Geo: Synthetic Data Generation and Geometric Reasoning via Multi-Agent Interaction [11.0] Socratic-Geoは、マルチエージェントインタラクションを通じてデータ合成とモデル学習を結合する、完全に自律的なフレームワークである。
Socratic-rは6つのベンチマークで4分の1のベースラインデータを使用して49.11を達成し、強いベースラインを2.43ポイント上回る。
Socratic-GeneratorはGenExamで42.4%を達成した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:42:25 GMT)
Agentic Proposing: Enhancing Large Language Model Reasoning via Compositional Skill Synthesis [11.0] Agentic Proposingは、問題合成をゴール駆動シーケンシャルな意思決定プロセスとしてモデル化するフレームワークである。
数学、コーディング、科学にまたがる高精度で検証可能な訓練軌道を生成する。
11,000個の合成軌道で訓練された30Bソルバは、AIME25で91.6%の精度を達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:02:53 GMT)
USS-Nav: Unified Spatio-Semantic Scene Graph for Lightweight UAV Zero-Shot Object Navigation [10.9] USS-Navは、Unified Spatio-Semanticのシーングラフをインクリメンタルに構築する軽量フレームワークである。
未知環境での効率的なLarge Language Model (LLM)拡張Zero-Shot Object Navigationを可能にする。
我々のフレームワークは、計算効率とリアルタイム更新頻度の点で最先端の手法より優れています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:20:16 GMT)
Lipschitz Multiscale Deep Equilibrium Models: A Theoretically Guaranteed and Accelerated Approach [10.9] ディープ均衡モデル(DEQ)は、ニューラルネットワークにおける層変換の固定点を探索することによって、層を積み重ねることなく無限に深いネットワーク表現を実現する。
DEQは、従来の方法よりも、トレーニングと推論にはるかに多くの計算時間を必要とするという課題に直面している。
本研究では,固定点収束を改良し,計算時間を短縮する手法について検討した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:22:56 GMT)
Most Convolutional Networks Suffer from Small Adversarial Perturbations [10.8] 最近の研究は、CNNにおいて、入力から最適でない距離において、逆の例が見つかることを証明している。
入力次元が$d$のランダムCNNの逆例は、$ll$-distance of order $lVert x rVert /sqrtd$ from the input $x$。
また,このような逆方向の小さな摂動は,勾配降下の1ステップで観測できることも示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:42:55 GMT)
C-IDS: Solving Contextual POMDP via Information-Directed Objective [10.8] 本稿では,マルコフ決定過程における政策合成問題について考察する。
我々の目標は、累積リターンを同時に最大化し、基礎となる文脈に関する不確実性を積極的に減らすポリシーを設計することである。
我々は,情報指向目標を最大化するポリシーを合成するC-IDSアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:00:34 GMT)
Byzantine Machine Learning: MultiKrum and an optimal notion of robustness [10.8] 我々は、MultiKrumがロバストアグリゲーションルールであり、そのロバストネス係数を束縛する最初の証明を提供する。
我々は、MultiKrumの限界は、Krumの限界よりも決して悪くなく、現実的なレジームにおいて優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:07:03 GMT)
SAGE-5GC: Security-Aware Guidelines for Evaluating Anomaly Detection in the 5G Core Network [10.8] 本研究では,現実的な配置設定に焦点をあて,野生の5G攻撃をテキスト化する問題について検討する。
5Gコアネットワーク(SAGE-5GC)における異常検出のためのセキュリティ意識ガイドラインのセットを提案する。
現実的な5G Coreデータセットを用いて、まず複数の異常検知器を訓練し、標準の5GC制御プレーンサイバー攻撃に対してベースライン性能を評価する。
そこで,攻撃者はネットワークトラフィックの可観測的特徴を操作して検出を回避しようとする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:50:19 GMT)
No Shortcuts to Culture: Indonesian Multi-hop Question Answering for Complex Cultural Understanding [10.7] 我々は,大規模な言語モデルの文化的理解を評価するための,最初の大規模マルチホップQAデータセットであるID-MoCQAを紹介する。
単一ホップの文化的質問を6つの手がかり型にまたがるマルチホップ推論チェーンに変換する新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:32:00 GMT)
PrevizWhiz: Combining Rough 3D Scenes and 2D Video to Guide Generative Video Previsualization [10.7] PrevizWhizは、大まかな3Dシーンと生成画像とビデオモデルを組み合わせて、スタイリングされたビデオプレビューを作成するシステムである。
このシステムはフレームレベルの画像再構成と、調整可能な類似性、モーションパスまたは外部ビデオ入力による時間ベースの編集、高忠実度ビデオクリップへの改善を統合する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:56:40 GMT)
Shortcut Features as Top Eigenfunctions of NTK: A Linear Neural Network Case and More [10.6] 線形ニューラルネットワークの場合を解析し,ショートカット学習の重要な特性を導出する。
その結果, ショートカットの特徴は, クラスタ化分布におけるサンプル数の不均衡に起因する場合, 固有値の大きい特徴に対応することがわかった。
また,より大きな固有値を持つ特徴は,クラスタ内のデータ分散のため,トレーニング後のニューラルネットワーク出力に大きな影響を及ぼすことを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:50:18 GMT)
APEX: Probing Neural Networks via Activation Perturbation [10.5] 本稿では,ニューラルネットワークの推論時間探索パラダイムとして Activation Perturbation for Exploration (APEX) を導入する。
APEXは入力とモデルパラメータの両方を固定しながら、隠れたアクティベーションを摂動する。
この結果から,APEXは入力空間からのみアクセス可能な範囲を超えて,ニューラルネットワークを探索し,理解するための効果的な視点を提供することが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:36:36 GMT)
A Probabilistic Framework for Solving High-Frequency Helmholtz Equations via Diffusion Models [10.5] 我々は、高周波状態における波動近似のためのスコアベース条件拡散演算子を開発した。
我々のフレームワークは、L2$、$H1$、Energy normsが最も低いエラーで、一貫して堅牢な予測を生成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:36:06 GMT)
Data-Driven Graph Filters via Adaptive Spectral Shaping [10.4] 本稿では,グラフフィルタリングのためのデータ駆動型フレームワークであるAdaptive Spectral Shapingを紹介する。
このフレームワークは、グラフ信号処理パイプラインとグラフニューラルネットワークにプラグインする、コンパクトなスペクトルモジュールを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:20:49 GMT)
CSR-Bench: A Benchmark for Evaluating the Cross-modal Safety and Reliability of MLLMs [10.4] MLLM(Multimodal large language model)は、テキストと画像の相互作用を可能にする。
本稿では,クロスモーダル信頼性を評価するベンチマークであるCSR-Benchを紹介する。
我々は16の最先端MLLMを評価し,系統的な相互アライメントギャップを観察した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:49:44 GMT)
CiMRAG: CiM-Aware Domain-Adaptive and Noise-Resilient Retrieval-Augmented Generation for Edge-Based LLMs [10.4] Retrieval-Augmented Generation (RAG)は、関連するプロファイルデータを検索し、調整された応答を生成することでパーソナライズするための重要な方法である。
計算メモリ(CiM)アーキテクチャは、メモリと処理ユニット間のデータ移動をin-situ操作によって排除することで、このボトルネックを軽減する。
本稿では,雑音環境におけるRAGのノイズおよびドメイン適応性を改善するフレームワークである,タスク指向型ノイズ-レジリエントな埋め込み学習を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:43:01 GMT)
Improving the Linearized Laplace Approximation via Quadratic Approximations [10.3] 線形化ラプラス近似(LLA)はディープニューラルネットワーク(DNN)を線形化する。
後部におけるこの線型化は、真のラプラス近似に忠実さを低下させる可能性がある。
この問題を軽減するために、我々は4次ラプラス近似(QLA)を提案する。
QLAは、効率の良い電力繰り返しによって得られるランクワン係数を用いて、近似ラプラス対数姿勢における各第2次因子を近似する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:15:38 GMT)
Statistical Guarantees for Reasoning Probes on Looped Boolean Circuits [10.3] ループ型推論モデルにおける推論プローブの統計的挙動について検討した。
推論プローブは、おそらくグラフ全体をカバーすることなく、内部ノードのサンプリングされたサブセットにアクセスする。
グラフ畳み込みネットワーク(GCN)ベースの仮説クラスによって推論プローブがパラメータ化され、$N$ノードを問うと、最悪の一般化誤差が最適値に達することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:39:53 GMT)
Conditional Flow Matching for Visually-Guided Acoustic Highlighting [10.2] 視覚的に誘導された音響ハイライトは、付随するビデオとオーディオのバランスを調整し、一貫性のあるオーディオ視覚体験を作り出す。
既存のアプローチでは、オーディオリミックスの本来の曖昧さに苦しむ差別モデルを使用している。
この制限に対処するために、条件付きフローマッチング(CFM)フレームワークを導入します。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:24:47 GMT)
PRISM: Structured Optimization via Anisotropic Spectral Shaping [10.1] PRISMは効率的で低ランクの2次プリコンディショナーである。
信号支配方向の更新強度を維持しながら、高分散部分空間の更新を適応的に抑制する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:41:11 GMT)
Understanding Bug-Reproducing Tests: A First Empirical Study [10.0] 我々は15の現実世界のPythonシステムの642のバグ再現テストを分析した。
バグ再現テストはLOC、アサーションの数、複雑さに関する他のテストと(統計的に)異なるものではないことが分かりました。
バグ再現テストの95%が1つのバグを再現し、5%が複数のバグを再現していることを検出する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:04:18 GMT)
Causal Discovery for Cross-Sectional Data Based on Super-Structure and Divide-and-Conquer [9.7] 本稿では,配当のアルゴリズム的利点を保ちながら,超構造構築の厳密な要件を緩和する新しい枠組みを提案する。
我々は、具体的な因果探索アルゴリズムでフレームワークをインスタンス化し、そのコンポーネントを合成データ上で厳格に評価する。
我々の結果は、初期の超構造に関する最小限の仮定の下でも、正確でスケーラブルな因果発見が達成可能であることを証明している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:18:17 GMT)
Orchestrating Heterogeneous Experts: A Scalable MoE Framework with Anisotropy-Preserving Fusion [9.7] 国境を越えたeコマースは、極端な言語的多様性ときめ細かい意味的ニュアンスという2つの課題に直面している。
既存のアプローチは通常、単一のモノリシックな大規模言語モデル(LLM)のスケールアップに依存します。
本稿では,異なるオープンソース LLM の相補性を生かした,スケーラブルな粗粒混合処理(Mixture-of-Experts:MoE)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:03:58 GMT)
Developing a Multi-Agent System to Generate Next Generation Science Assessments with Evidence-Centered Design [9.6] 次世代科学標準 (NGSS) は、学生が科学知識を使って問題解決や設計ソリューションを構築する能力を理解するために評価を要求する。
このような高次能力を引き出すには、教育者は、開発が困難なパフォーマンスベースの評価が必要である。
Evidence-Centered Design (ECD) は学習者、エビデンス、タスクの相互接続モデルを強調している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:37:24 GMT)
COMET: Codebook-based Online-adaptive Multi-scale Embedding for Time-series Anomaly Detection [9.5] オンラインコードブックに基づく時系列異常検出のためのオンライン適応型マルチスケール埋め込み(COMET)
オンラインコードブック適応は、コードブックエントリに基づいて擬似ラベルを生成し、対照的な学習を通じて推論時にモデルを動的に適応させる。
COMETは、45評価指標のうち36で最高のパフォーマンスを達成し、様々な環境においてその有効性を検証する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:58:00 GMT)
Multi-function Robotized Surgical Dissector for Endoscopic Pulmonary Thromboendarterectomy: Preclinical Study and Evaluation [9.5] 慢性肺血栓塞栓症の患者は肺動脈内における血栓と intima の除去に肺血栓拡張術(PTE)が必要である
手術中、外科医は、ブロックを微妙に取り除くためにツイーザーとディセクターを持っているが、この手術用の道具は堅固でまっすぐである。
本研究は, 同心型プッシュプルロボット(CPPR)構造に基づく新しいロボットディセクタを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:04:11 GMT)
DDL2PropBank Agent: Benchmarking Multi-Agent Frameworks' Developer Experience Through a Novel Relational Schema Mapping Task [9.5] DDL2PropBankは、関係データベーススキーマをPropBankロールセットにマッピングする新しいベンチマークタスクである。
10のフレームワークで同一のエージェントロジックを実装し、(i)静的解析によるコードの複雑さと(ii)AIアシスト性という2つの次元に沿って評価する。
Pydantic AIとAgnoは最小限の実装オーバーヘッドを必要とする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:10:59 GMT)
VALUEFLOW: Toward Pluralistic and Steerable Value-based Alignment in Large Language Models [9.5] VALUEFLOWは、キャリブレーションされた強度制御による抽出、評価、ステアリングにまたがるフレームワークである。
我々は、10のモデルと4つの値理論にまたがる大規模な研究を行い、多値制御のための可操性および組成則の非対称性を特定した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:19:57 GMT)
Digital Lifelong Learning in the Age of AI: Trends and Insights [9.4] AIと大規模言語モデル(LLM)の急速な革新は、デジタル学習の採用を加速している。
本研究は,デジタル学習プラットフォームと様々な人口動態がどのように相互作用するかを考察する。
以上の結果から,パンデミック後のデジタル学習の認知度が顕著に増加したことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:14:28 GMT)
Structuring Value Representations via Geometric Coherence in Markov Decision Processes [9.3] 提案するemphGCR-RL(Geometric Coherence Regularized Reinforcement Learning,Geometric Coherence Regularized Reinforcement Learning,Geometric Coherence Regularized Reinforcement Learning,Geometric Coherence Regularized Reinforcement Learning, 幾何コヒーレンス正規化強化学習)は,超精密化のシーケンスを演算する。
Q-learningとアクター-criticの2つの新しいアルゴリズムを開発し、これらの超精密化を効果的に実現した。
我々は, GCR-RLを様々なタスクで実証的に評価し, 高いベースライン上での試料効率と安定性能の大幅な向上を実証した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:35:58 GMT)
Efficient Estimation of Kernel Surrogate Models for Task Attribution [9.3] 主な課題は、個々のトレーニングタスクがターゲットタスクのパフォーマンスにどのように影響するかを定量化することである。
直接的アプローチ、つまり、アウト・ワン・アウト・リトレーニングは、各タスクを削除する効果を計測するが、大規模に計算不可能である。
トレーニングタスクのサブセットに対して、ターゲットタスクのパフォーマンスを予測するために代理モデルを構築する別のアプローチが登場した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:43:48 GMT)
Test-Time Conditioning with Representation-Aligned Visual Features [9.3] Representation-Aligned Guidance (REPA-G)を導入する。
我々は,事前学習した特徴抽出器から抽出した条件付き表現に対して,デノナイズ処理を行う。
提案手法は, 単一パッチによるきめ細かいテクスチャマッチングから, 広義の意味指導まで, 複数スケールで多目的制御を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:15:03 GMT)
Towards Considerate Embodied AI: Co-Designing Situated Multi-Site Healthcare Robots from Abstract Concepts to High-Fidelity Prototypes [9.2] 我々は、22人の学際的なチームからなる14週間のワークショップを開催し、AIが3つの医療環境において、付加価値のないタスク負担を軽減できるかに焦点を当てた。
抽象的なブレインストーミングから、教育的な足場によって支えられ、参加者が現実世界のトレードオフを理解し、よりデプロイ可能なソリューションを生成するための高忠実なプロトタイプまで、反復的に進行することを発見した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:30:41 GMT)
DCoPilot: Generative AI-Empowered Policy Adaptation for Dynamic Data Center Operations [9.2] DCoPilotは動的DC動作における生成制御ポリシのためのハイブリッドフレームワークである。
i) ストレステストを行うシミュレーションスケールアップ、(ii) メタポリシー蒸留、(ii) ハイパーネットワークがSLAとシーン埋め込みを条件としたポリシー重みを出力するように訓練され、(iii) オンライン適応により、更新された仕様に応じてゼロショットポリシー生成を可能にする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:43:37 GMT)
CoGenCast: A Coupled Autoregressive-Flow Generative Framework for Time Series Forecasting [9.2] 時系列予測は、文脈条件に対する意味的理解と連続時間力学のモデリングの両方を必要とする生成問題と見なすことができる。
既存のアプローチは、セマンティックコンテキストモデリングのための自己回帰的大規模言語モデル(LLM)または連続確率生成のための拡散様モデルのいずれかに依存している。
実効時系列予測のために,事前学習したLLMとフローマッチング機構を結合したハイブリッド生成フレームワークCoGenCastを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:08:10 GMT)
Building Interpretable Models for Moral Decision-Making [9.2] 我々は、トロリースタイルのジレンマ上でニューラルネットワークが道徳的な決定を行う方法を研究するために、カスタムトランスフォーマーモデルを構築します。
モデルでは、影響を受ける人、人数、属する成果をエンコードする埋め込みを使用して、構造化されたシナリオを処理します。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:22:42 GMT)
Generator-based Graph Generation via Heat Diffusion [9.1] 本稿では,グラフ構造データにジェネレータマッチングパラダイムを適用することにより,グラフを生成する新しいフレームワークを提案する。
グラフラプラシアンとその関連熱核を利用して各グラフ上の連続時間拡散を定義する。
ニューラルネットワークは、真のジェネレータと学習可能なサロゲートとの間のブレグマンの発散を最小限にして、このジェネレータにマッチするように訓練される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:04:58 GMT)
Deep-learning-based pan-phenomic data reveals the explosive evolution of avian visual disparity [8.9] 本研究では、深層学習技術を用いて鳥類の形態進化を探索する。
高次元埋め込み空間は表現型収束を符号化することを示す。
また, 平坦なラベルで訓練されているにもかかわらず, 高次元埋め込み空間に階層的意味構造が出現することを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:32:15 GMT)
Achieving Linear Speedup for Composite Federated Learning [8.8] FedNMapは、複合学習のためのマップベースの方法である。
FedNMapにはスムーズな更新スキームが組み込まれている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:29:34 GMT)
A Vision-Based Analysis of Congestion Pricing in New York City [8.7] 交通カメラデータの自動解析により,ニューヨーク市の混雑価格設定プログラムの影響について検討した。
私たちのコンピュータビジョンパイプラインは、マンハッタンとニューヨークに分布する900台以上のカメラの映像を処理します。
我々は、ベースライン交通パターンを確立し、監視領域全体にわたる車両密度の系統的変化を同定する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:35:56 GMT)
RobustExplain: Evaluating Robustness of LLM-Based Explanation Agents for Recommendation [8.7] 大規模言語モデル(LLM)は、リコメンデータシステムで自然言語の説明を生成するために、ますます使われている。
現実世界のWebプラットフォームでは、インタラクション履歴は、偶然のクリック、時間的不整合、値の欠如、進化する好みのために本質的にノイズが多い。
本稿では,LLM生成レコメンデーションのロバスト性を評価するための,最初の体系的評価フレームワークであるRobustExplainを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:12:22 GMT)
LLMs as Orchestrators: Constraint-Compliant Multi-Agent Optimization for Recommendation Systems [8.7] 制約付き多目的eコマースレコメンデーションのためのLLM協調型デュアルエージェントフレームワークであるDualAgent-Recを提案する。
Amazon Reviews 2023データセットの実験では、DualAgent-Recが100%制約満足度を達成した。
これらの結果から,LSMはデプロイおよび制約に準拠したレコメンデーションシステムにおいて,効果的なオーケストレーションエージェントとして機能することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:10:35 GMT)
Unifying Ranking and Generation in Query Auto-Completion via Retrieval-Augmented Generation and Multi-Objective Alignment [8.6] クエリオートコンプリート(QAC)では,ユーザが入力するクエリ補完が提案されている。
伝統的なレトリート・アンド・ランクパイプラインは、長い尾のカバレッジが限られており、広範な機能エンジニアリングを必要としている。
本稿では,QACをRAG(Retrieval-Augmented Generation)とDPO(Multi-objective Direct Preference Optimization)を通じて,エンドツーエンドのリスト生成として再構成する統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:35:04 GMT)
Learning Multi-type heterogeneous interacting particle systems [8.6] 本稿では,ネットワークトポロジ,マルチタイプインタラクションカーネル,および異種システムにおける型代入の協調推論のためのフレームワークを提案する。
我々は、Isometry Property (RIP) の仮定に基づいて、推定境界を理論的に保証し、分離性に基づいた正確なリカバリ相互作用の条件を確立する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:17:36 GMT)
Model-based Optimal Control for Rigid-Soft Underactuated Systems [8.6] 本研究は,非作動型ソフトシステム(ダイレクトコロケーション,動的微分プログラミング,モデル予測制御)の3つの最適制御戦略について検討する。
厳密な連続力学と制約された運動に対処するために、暗黙の統合スキームとウォームスタート戦略を用いて数値ロバスト性と計算効率を向上させる。
これらの手法は, ソフトカートポール, ソフトペンデュボット, ソフトフルタペンデュラムの3種類のソフトベンチマークシステムにおいて, 性能と計算上のトレードオフを強調したシミュレーションで評価された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:59:36 GMT)
Maintaining the Heterogeneity in the Organization of Software Engineering Research [8.5] 資金提供された研究モデルは、ソフトウェア工学の研究において支配的になっています。
私たちはコミュニティに対して、ソフトウェアエンジニアリング研究の組織における異質性を維持することを真剣に検討するよう促しています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:34:59 GMT)
The CitizenQuery Benchmark: A Novel Dataset and Evaluation Pipeline for Measuring LLM Performance in Citizen Query Tasks [8.5] 市民問合せ(ちちぜんきゅう)とは、その事情に関係のある政府の方針・指導・サービスについて、個人から質問される質問である。
これは、ユーザのコンテキストに適合した情報を持つ市民クエリに応答する大規模言語モデルにとって、魅力的なユースケースである。
市民クエリとレスポンスの2万組のベンチマークデータセットであるCitizenQuery-UKを紹介した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:58:09 GMT)
The Mask of Civility: Benchmarking Chinese Mock Politeness Comprehension in Large Language Models [8.5] 本研究は,中国語の丁寧さ,不便さ,および模擬丁寧さの認識における代表的大言語モデル(LLM)の性能差を体系的に評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:07:25 GMT)
De-conflating Preference and Qualification: Constrained Dual-Perspective Reasoning for Job Recommendation with Large Language Models [8.4] JobRecは、制約付きデュアルパースペクティブ推論を通じて、好みと資格を廃止するためのジェネレーティブなジョブレコメンデーションフレームワークである。
JobRecは、強いベースラインを一貫して上回り、戦略対応のプロフェッショナルマッチングの制御性を改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:42:53 GMT)
Finding Optimal Video Moment without Training: Gaussian Boundary Optimization for Weakly Supervised Video Grounding [8.4] 弱教師付き時間的ビデオグラウンドティングは、ビデオ文ペアのみを使用して、未トリミングビデオ内のクエリ関連セグメントをローカライズすることを目的としている。
本稿では,原理化された最適化問題を解くことによってセグメント境界を予測できる新しい推論フレームワークを提案する。
実験の結果,GBOはローカライゼーションを大幅に改善し,標準ベンチマーク全体にわたって最先端の結果が得られた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:01:12 GMT)
KANFIS A Neuro-Symbolic Framework for Interpretable and Uncertainty-Aware Learning [8.3] Adaptive Neuro-Fuzzy Inference System (ANFIS) は、ニューラルネットワークの学習能力とファジィ論理の透明性の理由を組み合わせるために設計された。
本稿では,ファジィ推論と付加関数分解を統一する,コンパクトなニューロシンボリックアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:02:17 GMT)
Consistency Deep Equilibrium Models [8.3] ディープラーニングにおける強力なパラダイムとして、Deep Equilibrium Models (DEQ)が登場している。
DEQは、固定点ソルバの反復性により、大きな推論遅延を引き起こす。
我々は、DEC推論を高速化するために、一貫性深度平衡モデル(C-DEQ)を導入する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:42:48 GMT)
Correlation-Enabled Beatings in Two-Dimensional Electronic Spectroscopy [8.2] 持続的なビートは、緩やかなバスメモリと超高速パルスシーケンスの両方を必要とする相関駆動機構から生じる可能性があることを示す。
この研究は、長寿命のビートをプロトコルレベルの動的効果、すなわち超高速制御下での相関による検索として再編成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:47:55 GMT)
HP-GAN: Harnessing pretrained networks for GAN improvement with FakeTwins and discriminator consistency [8.2] GAN(Generative Adversarial Networks)は,画像合成の品質向上に大きく貢献している。
本稿では、革新的な自己教師付き学習技術を導入し、GANトレーニング中に差別者間の一貫性を強化することにより、事前学習ネットワークの機能を拡張する。
提案手法は,FakeTwinsと差別化器の整合性という2つの主要な戦略を通じて,ニューラルネットワークの先行性を効果的に活用する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:05:45 GMT)
"I'm happy even though it's not real": GenAI Photo Editing as a Remembering Experience [8.1] Generative Artificial Intelligence(GenAI)は、パーソナルデバイス上の写真アプリケーションにますます統合されている。
この研究は、人々がどのようにしてGenAIを使って個人写真を編集し、それが記憶体験をどう形成するかを調査する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:58:32 GMT)
PWAVEP: Purifying Imperceptible Adversarial Perturbations in 3D Point Clouds via Spectral Graph Wavelets [8.1] 3Dポイントクラウドに対する敵攻撃は、ディフェンダーにとって大きな課題となる。
スペクトル領域におけるプラグアンドプレイおよび非侵襲防御機構を提案する。
提案したPWAVEPは既存の手法に比べて精度と堅牢性が高いことを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:00:04 GMT)
Physics as the Inductive Bias for Causal Discovery [8.0] 因果発見は、しばしば複雑な現実世界のシステムを分析するためのデータ駆動パラダイムである。
我々は,因果グラフ構造を利用してパラメータ推定を行うスケーラブルなスペーサ性誘導型MLEアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:42:01 GMT)
CoFreeVLA: Collision-Free Dual-Arm Manipulation via Vision-Language-Action Model and Risk Estimation [8.0] CoFreeVLAは、短地平線自己衝突リスク推定器を備えたエンドツーエンドビジョン言語アクション(VLA)を強化している。
この推定装置は危険な命令をゲートし、リスク誘導調整によって安全な状態に回復し、より安全なロールアウトのための政策改善を形作る。
PiPERロボットアームの5つのバイマニュアルタスクにおいて、CoFreeVLAは自己照合を減らし、RTTやAPEXと比較して成功率を向上させる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:23:41 GMT)
Spectral Text Fusion: A Frequency-Aware Approach to Multimodal Time-Series Forecasting [7.9] SpecTFは、周波数領域における時系列に対するテキストデータの影響を統合するフレームワークである。
様々なマルチモーダル時系列データセットにおいて,SpecTFが最先端モデルを大幅に上回ることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:00:55 GMT)
LLM-Inspired Pretrain-Then-Finetune for Small-Data, Large-Scale Optimization [7.9] 我々は、企業が同時に多くの運用上の決定をしなければならない、小規模で大規模な意思決定問題を考える。
本稿では,この課題に対処するために,設計したトランスフォーマーモデル上に構築したプレトレイン-then-finetuneアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:08:33 GMT)
Methods and Open Problems in Differentiable Social Choice: Learning Mechanisms, Decisions, and Alignment [7.8] 社会的選択はもはや政治理論や経済学の周辺的な関心事ではない。
投票規則、メカニズム、および集計手順をデータから最適化された学習可能で微分可能なモデルとして定式化する新しいパラダイムである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:17:16 GMT)
Z3D: Zero-Shot 3D Visual Grounding from Images [7.8] 3Dビジュアルグラウンドティング(3DVG)は、自然言語クエリに基づいて、オブジェクトを3Dシーンにローカライズすることを目的としている。
マルチビュー画像上で柔軟に動作可能なユニバーサルグラウンドパイプラインであるZ3Dを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:35:18 GMT)
Artifact Removal and Image Restoration in AFM:A Structured Mask-Guided Directional Inpainting Approach [7.7] 原子間力顕微鏡(AFM)はナノスケールでの高分解能表面イメージングを可能にする。
AFM画像解析におけるアーティファクト検出と復元のためのフレームワークについて述べる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:37:22 GMT)
An Empirical Study of Collective Behaviors and Social Dynamics in Large Language Model Agents [7.7] LLMを駆使したソーシャルメディアプラットフォームであるChirper.aiは,32K LLMエージェント間の7Mポストとインタラクションを1年以上にわたって分析した。
我々はLSMの毒性言語とその言語的特徴,およびそれらの相互作用パターンについて検討し,LSMがヒトと有毒な姿勢において異なる構造パターンを示すことを発見した。
社会思想の連鎖 (CoST) は, 有害な投稿を避けるため, LLM エージェントを思い出させる簡易で効果的な方法である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:34:32 GMT)
From Separate Compilation to Sound Language Composition [7.7] この研究は、Neverlang言語ワークベンチのデータフロー分析に基づく理論的に健全な静的解析ツールであるnlgcheckを紹介した。
nlgcheckはコンパイル時に潜在的ランタイムエラー(未定義の属性アクセスなど)を検出し、強い静的正当性保証を維持しながら、別個のコンパイルを保存する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:38:34 GMT)
Entropy-Aware Structural Alignment for Zero-Shot Handwritten Chinese Character Recognition [7.6] 本稿では,情報理論モデリングによる視覚と意味のギャップを埋めるエントロピー対応構造アライメントネットワークを提案する。
提案手法は、既存のCLIPベースのベースラインよりもはるかに優れており、難易度の高いゼロショット設定において、新しい最先端性能を確立する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:08:40 GMT)
QuAIL: Quality-Aware Inertial Learning for Robust Training under Data Corruption [7.6] 品質インフォームドトレーニング機構QuAILを学習プロセスに直接組み込む。
QuAILは、ランダムと値依存の両方の汚損の下で、ニューラルベースラインよりも平均性能を一貫して向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:06:30 GMT)
TreeLoc: 6-DoF LiDAR Global Localization in Forests via Inter-Tree Geometric Matching [7.6] 森林のグローバルローカライゼーションフレームワークであるTreeLocを提案する。
多様なフォレストベンチマークでは、TreeLocはベースラインを上回り、正確なローカライゼーションを実現している。
また、コンパクトなグローバルツリーデータベースからのディスクリプタを用いた長期森林管理の応用も提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:23:36 GMT)
Rare Event Early Detection: A Dataset of Sepsis Onset for Critically Ill Trauma Patients [7.2] MIMIC-IIIを用いて, 標準化された外傷後敗血症発症データセットを抽出し, 標準化された外傷後臨床事実を用いて検索し, 検証した。
ICUの臨床ワークフローによる外傷後敗血症の早期発見を日常的に行うと,新たなまれな事象検出問題が発生する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:04:25 GMT)
When AI Persuades: Adversarial Explanation Attacks on Human Trust in AI-Assisted Decision Making [7.2] 大規模言語モデルは、ユーザーがAI出力をどのように認識し、信頼するかを形作る、流動的な自然言語の説明を生成する。
本研究では,攻撃者がLDM生成説明書のフレーミングを操作し,不正確な出力に対する人間の信頼を調節する逆説明攻撃(AEAs)を導入する。
これは、説明を敵対的な認知チャネルとして扱い、AIによる意思決定に対する人間の信頼への影響を定量化する最初の体系的なセキュリティ研究である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:42:44 GMT)
Spiking Neural-Invariant Kalman Fusion for Accurate Localization Using Low-Cost IMUs [7.0] スパイキングニューラルネットワーク(SNN)と不変拡張カルマンフィルタ(InEKF)を組み合わせた脳誘発状態推定フレームワークを提案する。
提案手法は,センサノイズに対する強い堅牢性を示し,実世界の移動ロボット応用の可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:41:57 GMT)
Distilling LLM Reasoning into Graph of Concept Predictors [6.8] Graph of Concept Predictors (GCP)は、推論を意識したアクティブ蒸留フレームワークである。
教師の決定過程を有向非巡回グラフとして外部化し、学生のモジュラー概念予測器で反映する。
これは、重要な推論ノードにおける不確実性と不一致をターゲットとするグラフ対応の取得戦略を通じて、サンプル効率を向上させる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:19:14 GMT)
Prediction of Critical Heat Flux in Rod Bundles Using Tube-Based Hybrid Machine Learning Models in CTF [6.8] 近年, 臨界熱流束(CHF)の予測が盛んに行われている。
フルスケールの原子炉コアシミュレーションでは、ロッドバンドルジオメトリを使用する必要がある。
本研究は,管型CHFデータを用いて学習した後,ロッドバンドルにおけるMLベースのCHF予測モデルの一般化について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:05:16 GMT)
Mitigating Staleness in Asynchronous Pipeline Parallelism via Basis Rotation [6.7] 非同期パイプライン並列処理は、同期実行に固有のパイプラインバブルを排除し、ハードウェア利用を最大化する。
この効率向上は勾配安定度によって損なわれ、遅延勾配による即時モデル更新は最適化プロセスにノイズをもたらす。
本稿では,アライメント問題を効果的に緩和し,非同期設定における収束を著しく促進することを示す,ベースローテーションの利用を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:31:51 GMT)
Reading Between the Code Lines: On the Use of Self-Admitted Technical Debt for Security Analysis [6.7] 静的解析ツール(SAT)は、セキュリティエンジニアリング活動の中心である。
開発者はしばしばセキュリティ関連のショートカットと妥協を、Self-Admitted Technical Debt (SATD)として文書化する。
本研究では,セキュリティ関連SATDがSATsの出力を補完する程度について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:43:16 GMT)
DCER: Dual-Stage Compression and Energy-Based Reconstruction [6.7] ノイズのある入力は表現の質を低下させ、モダリティの欠如は予測失敗を引き起こす。
両段圧縮とエネルギーベース再構成による課題に対処する統合フレームワークDCERを提案する。
CMU-MOSI、CMU-MOSEI、CH-SIMSの実験では、すべてのベンチマークで最先端のパフォーマンスが示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:03:16 GMT)
Rethinking Benign Relearning: Syntax as the Hidden Driver of Unlearning Failures [6.6] 良質な微調整データからでも、忘れられた情報が再帰する良質な再学習現象について検討する。
一般的な説明では、この効果は話題の関連性に起因しているが、この説明は不十分である。
本研究では,非学習前の未知のクエリをヘテロジニアスな構造に表現する構文的多様化手法を提案する。
このアプローチは、良心的な再学習を効果的に抑制し、忘れを加速し、未学習の有効性とモデルユーティリティのトレードオフを大幅に軽減する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:57:19 GMT)
Stroke Lesions as a Rosetta Stone for Language Model Interpretability [6.5] 本稿では、大規模な言語モデルを評価するための外部参照構造として、Brain-LLM Unified Model(BLUM)を提案する。
慢性期脳卒中後失語患者のデータを用いて,行動的エラープロファイルから脳損傷位置を予測する症状・症状・症状モデルを構築した。
BLUMのエラープロファイルは、偶然に一致したヒトの実際の病変に対応するような、人間のエラープロファイルと十分に類似していた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:22:37 GMT)
NEST: Nested Event Stream Transformer for Sequences of Multisets [6.5] イベントストリームデータは、複数のイベントが共起し、結果として一連の多重セットとなる階層構造を示すことが多い。
イベントストリームデータのための既存の基盤モデル(FM)の多くは、この階層を1次元のシーケンスにフラット化します。
マルチセットのシーケンスからなるイベントストリームのためのFMであるNested Event Stream Transformer (NEST)を紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:10:51 GMT)
Resource-efficient quantum simulation of transport phenomena via Hamiltonian embedding [6.5] 輸送現象は様々な応用領域において重要な役割を担い、これらのダイナミクスの効率的なシミュレーションは依然として顕著な課題である。
我々は、厳密な理論的保証と、体系的でハードウェア効率の良い実装の両方を提供する、輸送方程式のクラスをシミュレートする包括的なフレームワークを開発する。
次に, 捕捉イオン量子コンピュータ上での2次元対流方程式の実験的実験を含む, 線形および非線形輸送PDEの解法について検討した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:44:10 GMT)
Zero2Text: Zero-Training Cross-Domain Inversion Attacks on Textual Embeddings [6.5] オンラインアライメントに基づくトレーニングフリーフレームワークであるZero2Textを紹介した。
我々は、差分プライバシーのような標準的な防御が、この適応的な脅威を効果的に軽減できないことを証明している。
ベースラインよりも1.8倍高いROUGE-Lと6.4倍高いBLEU-2スコアを達成し、単一のリークデータペアなしで未知のドメインから文を復元する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:22:32 GMT)
A generalizable large-scale foundation model for musculoskeletal radiographs [6.4] 本稿では,筋骨格X線撮影のための大規模基礎モデルであるSKELEXについて述べる。
このモデルは下流診断12項目で評価され, 骨折検出, 変形性関節症, 骨腫瘍の分類において, 概ね成績が良好であった。
骨腫瘍予測のための解釈可能な領域誘導モデルを開発した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:04:45 GMT)
Least but not Last: Fine-tuning Intermediate Principal Components for Better Performance-Forgetting Trade-Offs [6.4] Low-Rank Adaptation (LoRA) 法は、大規模な事前学習されたモデルを下流タスクに適応させる重要な手法として登場した。
本稿では,低ランク適応に固有の性能鍛造トレードオフを包括的に分析する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:09:29 GMT)
Agent Alpha: Tree Search Unifying Generation, Exploration and Evaluation for Computer-Use Agents [6.4] Agent Alphaは、ステップレベルのモンテカルロ木探索(MCTS)を通じて生成、探索、評価を相乗化するための統合フレームワークである
OSWorldベンチマークでは、Agens Alphaは最先端の成功率$sim 77%を達成し、同等の計算で軌道レベルのベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:07:12 GMT)
All-Atom GPCR-Ligand Simulation via Residual Isometric Latent Flow [6.3] Gタンパク質結合受容体(GPCR)は、シグナルを伝達するために複雑なコンフォメーション転移に依存する。
従来の全原子分子動力学シミュレーションは計算が禁止されている。
我々は,全原子量GPCRリガンドシミュレーションのための深層生成フレームワークであるGPCRLMDを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:10:28 GMT)
SalamahBench: Toward Standardized Safety Evaluation for Arabic Language Models [6.1] 本稿ではアラビア語モデル(ALM)の安全性を評価する統一ベンチマークであるSalamaBenchを紹介する。
このベンチマークを用いて,Fanar 1,2,ALLaM 2,Falcon H1R,Jais 2の5つの最先端ALMを複数のセーフガード構成で評価した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:13:42 GMT)
Validating a Koopman-Quantum Hybrid Paradigm for Diagnostic Denoising of Fusion Devices [5.8] 物理インフォームドなKoopman-Quantumハイブリッドフレームワークを導入する。
クープマン作用素は物理を意識した「データ蒸留器」として機能し、波形をコンパクトな「量子可読」な特徴に圧縮する。
トカマク系の433個の放電から4,763個のチャネル配列をラベル付けして,この枠組みを検証した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:14:15 GMT)
VOILA: Value-of-Information Guided Fidelity Selection for Cost-Aware Multimodal Question Answering [5.8] 視覚質問応答(VQA)における価値Of情報駆動型適応忠実度選択のためのフレームワークVOILAを紹介する。
VOILAは一貫して50-60%のコスト削減を実現し、多様なクエリタイプやモデルアーキテクチャで90-95%の精度を維持している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:19:47 GMT)
POP: Prefill-Only Pruning for Efficient Large Model Inference [5.7] 大規模言語モデル (LLM) と視覚言語モデル (VLM) は目覚ましい能力を示している。
既存の構造化プルーニング法はハードウェア効率が良いが、しばしばかなりの精度の劣化に悩まされる。
この失敗は、プリフィルとデコードステージの間の非対称的な役割を無視する、ステージに依存しないプルーニングアプローチに起因している、と我々は主張する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:22:26 GMT)
Enhancing Imbalanced Node Classification via Curriculum-Guided Feature Learning and Three-Stage Attention Network [5.7] グラフニューラルネットワーク(GNN)における不均衡ノード分類は、モデルが不公平に学習し、あまり一般的でないクラスで性能を悪くする原因となる。
カリキュラム型特徴学習と3段階注意ネットワーク(CL3AN-GNN)を提案する。
社会的,生物学的,引用ネットワークにまたがる8つのOpen Graph Benchmarkデータセット上でCL3AN-GNNを評価した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:10:40 GMT)
Beyond Cropping and Rotation: Automated Evolution of Powerful Task-Specific Augmentations with Generative Models [5.7] 条件拡散や数発のNeRFなどの生成モデルの最近の進歩は、データ拡張のための新しいパラダイムを提供する。
これらの手法は, 頑健性を高めるとともに, 改善が不十分な場合のリスク劣化性能も向上させる。
本稿では、これらの生成モデルと効率的な進化アルゴリズムを併用した自動拡張学習パイプラインであるEvoAugを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:29:26 GMT)
FOVI: A biologically-inspired foveated interface for deep vision models [5.6] 本研究では,ヒト網膜と一次視覚野をベースとした視覚インタフェースを提案する。
受容場は、センサ多様体上のk-アネレスト近傍(kNN)として定義される。
本稿では,(1)エンドツーエンドのkNN-畳み込みアーキテクチャ,(2)基礎となるDINOv3 ViTモデルのファベレーテッド適応の2つのユースケースを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:26:54 GMT)
Cut to the Mix: Simple Data Augmentation Outperforms Elaborate Ones in Limited Organ Segmentation Datasets [5.6] データ拡張(DA)は、限られたデータで訓練されたDLモデルの有効性を高めるための重要な正規化手法である。
本稿では,2つの臓器セグメント化データセット上で,CutMix,CarveMix,ObjectAug,AnatoMixの4つのDA戦略を検討した。
その結果、CutMix、CarveMix、AnatoMixはDA戦略を使わずに最先端のnnUNetと比較して平均ダイススコアを4.9、2.0、および1.9に改善できることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:03:59 GMT)
Pi-GS: Sparse-View Gaussian Splatting with Dense π^3 Initialization [5.6] 本稿では,基準自由点雲推定ネットワーク3を用いたロバストな手法を提案する。
我々は、不確実性誘導深度監視、正規整合損失、および深度ゆらぎを用いる。
提案手法は,タンク・アンド・テンプル,LLFF,DTU,MipNeRF360データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:55:03 GMT)
Fast Sampling for Flows and Diffusions with Lazy and Point Mass Stochastic Interpolants [5.5] 任意のスケジュール下で任意の拡散係数で微分方程式(SDE)のサンプルパスを変換する方法を証明する。
次に、補間フレームワークを拡張して、より大きな点質量スケジュールのクラスを許容する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:48:34 GMT)
A Low-Cost Vision-Based Tactile Gripper with Pretraining Learning for Contact-Rich Manipulation [5.4] LVTGは、安定で頑健で効率的な物理的相互作用のために設計された低コストのビゾ触覚グリップである。
既存のビジュオ触覚センサとは異なり、LVTGはより効果的で安定した日常的な物体の把握を可能にしている。
視覚と触覚フィードバックの統合により、LVTGはリッチで高忠実な感覚データを提供することができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:06:28 GMT)
ContraLog: Log File Anomaly Detection with Contrastive Learning and Masked Language Modeling [5.3] ContraLogは、個別のテンプレートIDではなく、連続メッセージの埋め込みを予測するログ異常検出手法である。
ContraLogが生成したメッセージ埋め込みは意味のある情報を持ち、シーケンスコンテキストなしでも異常を予測できることを示す。
結果は、他のイベントシーケンスに適用可能なログ異常検出のアプローチとして、埋め込みレベルの予測を強調している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:59:40 GMT)
Axiomatic Foundations of Counterfactual Explanations [5.3] カウンターファクトは最も説得力のある説明の1つとして現れてきた。
既存の説明者は、一つの種類の反事実に焦点を当てており、局所的な説明に制限されている。
本稿では, 反現実的説明者にとって望ましい性質の集合の上に構築された公理的枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:34:18 GMT)
GraDE: A Graph Diffusion Estimator for Frequent Subgraph Discovery in Neural Architectures [5.3] GraDEは拡散誘導検索フレームワークであり、計算可能性と発見能力の両方を保証する。
GraDEはグラフ拡散モデルを導入し、学習された分布の中でそれらの典型性を評価することで、頻繁な部分グラフを識別する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:41:10 GMT)
Human-Centric Traffic Signal Control for Equity: A Multi-Agent Action Branching Deep Reinforcement Learning Approach [5.2] 人中心型マルチエージェントアクションブラッチングダブルディープQネットワーク(DQN)フレームワークであるMA2B-DDQNを提案する。
我々の重要な貢献は、廊下制御を局所的な区間ごとの動作に分解するアクション分岐離散制御の定式化である。
また、歩行者、乗務員、交通機関の乗客を考慮し、廊下で遅れた人の数を罰する人間中心の報酬も設計する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:56:03 GMT)
Comparative Analysis of Autonomous Robotic and Manual Techniques for Ultrasonic Sacral Osteotomy: A Preliminary Study [5.2] 光トラッキングシステムによって誘導される超音波骨組織とロボットマニピュレータを統合する自律型ロボットシステムを提案する。
RUSOシステムはサブミリ軌跡精度(0.11mmRMSE)を達成した
一方、RUSOシステムは正確な深度制御(8.1mm)を維持していた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:25:58 GMT)
Control and State Estimation of Vehicle-Mounted Aerial Systems in GPS-Denied, Non-Inertial Environments [5.2] 我々は,GNSS(Global Navigation Satellite System, グローバルナビゲーション衛星システム)を用いた非慣性環境下で稼働する四元数に対するロバストな制御と推定フレームワークを提案する。
本手法は,プラットフォーム動作を考慮した拡張カルマンフィルタと未知入力(EKF-UI)を組み合わせた外部位置計測にのみ依存する。
従来のEKFと比較して,提案手法は慣性フィードバックを必要とせず,安定性と軌道追跡を大幅に改善する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:45:34 GMT)
The Dual Role of Abstracting over the Irrelevant in Symbolic Explanations: Cognitive Effort vs. Understanding [5.2] 説明は人間の認知の中心であるが、AIシステムは理解が難しいアウトプットを生成することが多い。
正式な抽象化、特に除去とクラスタリングが人間の推論性能と認知活動にどのように影響するかを検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:42:41 GMT)
Can 3D point cloud data improve automated body condition score prediction in dairy cattle? [5.1] 体調スコア (BCS) は, 乳牛の代謝状態, 生殖能力, 健康と密接に関連している。
BCSの予測にはコンピュータビジョンのアプローチが適用されており、色やテクスチャに依存しない幾何学的情報を取得するため、深度画像が広く使用されている。
3次元の点雲データは、動物形態学のよりリッチな幾何学的特徴を表現する能力によって、関心が高まりつつある。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:16:16 GMT)
A Multi-Modal Foundational Model for Wireless Communication and Sensing [5.1] 本研究は,物理層無線システムのタスク非依存・マルチモーダル基礎モデルを提案する。
異質なモダリティにまたがる移動可能で物理学を意識した表現を学習し、タスクや環境をまたいだ堅牢な一般化を可能にしている。
本評価は,タスク固有のベースラインと比較して,より優れた一般化,デプロイメントシフトに対する堅牢性,データ要求の削減を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:03:23 GMT)
Task-Centric Policy Optimization from Misaligned Motion Priors [5.0] 共等目的ではなく条件付き正規化器として模倣を扱うタスクプライオリティ逆模倣フレームワークを提案する。
我々は,勾配の衝突とタスクプライオリティの定常点の理論解析を行い,ヒューマノイド制御実験による評価を行った。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:56:39 GMT)
BlockRR: A Unified Framework of RR-type Algorithms for Label Differential Privacy [4.9] ラベル差分プライバシーのための新しいランダム化応答機構であるBlockRRを紹介する。
BlockRR が$$-label DP を満たすことを証明します。
CIFAR-10の2つの変種に対するBlockRRの評価を行った。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:00:45 GMT)
WST-X Series: Wavelet Scattering Transform for Interpretable Speech Deepfake Detection [4.9] 手作りのフィルタバンク機能は透明だが、ハイレベルなセマンティックな詳細を捉えるには限界がある。
自己監督的特徴は解釈可能性に欠けており、きめ細かいスペクトル異常を見落としている可能性がある。
We propose the WST-X series, a novel family of feature extractors which which are the best of both worlds through the wavelet scattering transformation。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:39:28 GMT)
Training and Simulation of Quadrupedal Robot in Adaptive Stair Climbing for Indoor Firefighting: An End-to-End Reinforcement Learning Approach [4.9] 四足歩行ロボットは、屋内火災の初期段階において一次探索に使用される。
複雑な屋内環境における状況認識と 階段の急激な登頂が 主な課題です
このプロジェクトでは、ナビゲーションと移動のバランスと、四足歩行を異なる階段形状に適応させるエンドツーエンドのRL手法について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:23:50 GMT)
Efficient Subgroup Analysis via Optimal Trees with Global Parameter Fusion [4.9] サブグループ分析により、治療が特に有益または保護的な集団を特定できる。
混合整数最適化 (MIO) を利用して, 正確な部分群同定を容易にする, 融合最適因果木法を提案する。
我々は,サンプルリスク境界から厳密に確立し,古典木に基づく手法と比較することによって理論的保証を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:26:19 GMT)
The Role of Target Update Frequencies in Q-Learning [4.8] ターゲットネットワーク更新周波数(TUF)は、(深い)Q-ラーニングにおける中央安定化機構である。
周期的目標更新をネスト最適化スキームとして定式化し、各外部反復が不正確なベルマン最適演算子を適用する。
学習過程を通じて最適な目標更新頻度が幾何的に増加することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:19:20 GMT)
An Empirical Survey and Benchmark of Learned Distance Indexes for Road Networks [4.7] 道路網における最短経路距離の計算は、ナビゲーションシステム、位置ベースサービス、空間分析における中核的な操作である。
最短距離クエリのクエリ処理を高速化するために,多数の距離インデックスが提案されている。
機械学習(ML)の進歩により、研究者は最短経路と距離クエリを効率的に答えるMLベースの距離インデックスを設計し、提案した。
本稿では,MLに基づく道路網上の距離指標について,学習時間,クエリ待ち時間,ストレージ,精度の4つの重要な側面に沿って評価した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:08:25 GMT)
TRACE: Temporal Radiology with Anatomical Change Explanation for Grounded X-ray Report Generation [4.7] 本稿では,時間的比較,変化分類,空間的局所化を共同で行う最初のモデルであるTRACE(Temporal Radiology with Anatomical Change Explanation)を紹介する。
従来の胸部X線と現在の胸部X線が与えられたら、TRACEは境界箱座標で各発見を接地しながら、間隔変化の自然言語記述を生成する。
我々のアブレーション研究は、時間的比較と空間的接地が共同で学習された場合にのみ、変化検出が生じるという、創発的な能力を明らかにする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:03:41 GMT)
SRA-Seg: Synthetic to Real Alignment for Semi-Supervised Medical Image Segmentation [4.7] SRA-Segは、医用画像セグメンテーションのための合成および実際の特徴分布を調整するために設計されたフレームワークである。
柔らかいエッジブレンディングを用いて、スムーズな解剖学的遷移と連続的なラベルを作成します。
SRA-Seg は ACDC の89.34%、FIVES の84.42% を達成し、既存の半教師付き手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:38:51 GMT)
Orthogonal Approximate Message Passing Algorithms for Rectangular Spiked Matrix Models with Rotationally Invariant Noise [4.7] 矩形スパイク行列モデルにおける信号推定のための近似メッセージパッシング(OAMP)アルゴリズムを提案する。
我々はアルゴリズムの高次元力学を正確に特徴付ける厳密な状態進化を確立する。
この枠組みに基づいて、予測平均二乗誤差を最小化するOAMPの最適変種を導出する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:06:20 GMT)
Feature, Alignment, and Supervision in Category Learning: A Comparative Approach with Children and Neural Networks [4.7] 子どもたちと畳み込みニューラルネットワーク(CNN)を、数発の半教師付きカテゴリー学習タスクで比較する。
子どもは最小限のラベルから急速に一般化するが、特徴特異的なバイアスとアライメントに対する感受性が強い。
CNNは異なるインタラクションプロファイルを示している: 追加の監督はパフォーマンスを改善するが、アライメントと機能構造の両方が、追加の監督が学習に与える影響を和らげる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:31:06 GMT)
Efficient Training of Boltzmann Generators Using Off-Policy Log-Dispersion Regularization [4.7] ボルツマン生成器は、所定の温度で物理系のボルツマン分布から独立したサンプリングを可能にする生成モデルである。
本稿では,対数分散目的の一般化を基盤とした新たな正規化フレームワークである,非政治対数分散正規化(LDR)を提案する。
LDRは、目標エネルギーラベルの形で追加情報を活用することにより、エネルギーランドスケープの形状正則化剤として機能する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:49:32 GMT)
Learning to Repair Lean Proofs from Compiler Feedback [4.6] 教師付き学習問題としてリーン証明修復について検討する。
APRIL(Automated Proof repair in Lean)は、260,000の教師付き定理のデータセットである。
我々は、診断条件付き監視を、フィードバックを利用するプローバーのための補完的な訓練信号と見なしている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:53:56 GMT)
Physics-inspired transformer quantum states via latent imaginary-time evolution [4.5] 本稿では,ニューラルネットワークの量子状態(NQS)を,潜伏する仮想時間進化に対する神経近似として扱う,物理的に透明な枠組みを提案する。
フラストレーションの$J$-$J$Heisenbergモデルでは、我々のアンスターゼは最先端のTQSと同等かそれ以上の精度を達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:59:56 GMT)
Quasi-multimodal-based pathophysiological feature learning for retinal disease diagnosis [4.4] 多モードデータ合成と融合を統合した統合フレームワークが網膜疾患の分類とグレーディングのために提案されている。
提案する学習システムは,画像空間と特徴空間の両方の可視化を通して,徹底的に解釈される。
この研究は網膜疾患スクリーニングの精度と効率を高めるだけでなく、様々な医用画像モダリティにまたがるデータ拡張のためのスケーラブルなフレームワークも提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:13:57 GMT)
FDA Flocking: Future Direction-Aware Flocking via Velocity Prediction [4.4] Future Direction-Aware flockingは、バイオインスパイアされた、リアクティブなflockingの期待の増大である。
FDAは、近隣の将来の速度の短期的な推定に基づいて、反応的アライメントと予測的用語をブレンドする。
FDAは、より高速で高いアライメントを実現し、群れの変位を増強し、遅延やノイズに対する堅牢性を改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:00:33 GMT)
Adequately Tailoring Age Verification Regulations [4.4] 自由言論連合対パクストン事件における最高裁判所の決定は、最も憲法的に脆弱な年齢検証法の一つであるテキサス・H・B・1181の立憲性を支持した。
本稿では、政府目標と利害に関する複数の視点から「適正な調整」を解釈する分析モデルを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:56:35 GMT)
Multi-Objective Optimization for Synthetic-to-Real Style Transfer [4.4] 本研究では, パイプライン評価の迅速化を図るため, 個々の画像サンプルに対するペア画像メトリクスの利用について検討する。
本手法は,合成-実領域適応における標準データセットに適用する。
その結果、進化的アルゴリズムは様々な目的に適応した多様な拡張パイプラインを提案できることを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:14:23 GMT)
Data Verification is the Future of Quantum Computing Copilots [4.4] 検証を優先するアーキテクチャは、制約によって管理される領域における量子コピロとAI自動化に必要である、と我々は主張する。
検証されたトレーニングデータにより、モデルは統計的近似ではなく、学習された構造として正確な制約を内部化することができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:15:05 GMT)
Robust Intervention Learning from Emergency Stop Interventions [4.4] 緊急介入の文脈における堅牢な介入学習について検討する。
不完全な学習信号として介入フィードバックを扱う残差微細チューニングアルゴリズムであるResidual Intervention Fine-Tuning (RIFT)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:33:21 GMT)
Device variability of Josephson junctions induced by interface roughness [4.4] 超伝導量子ビットは一般にAl/AlO$_textx$/Al Josephson接合を用いて実現される。
本稿では,Al/AlO$_textx$インタフェースにおけるインタフェース粗さによって生じるジョセフソンエネルギー$E_J$の変動性のモデルを開発する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:03:43 GMT)
ChemPro: A Progressive Chemistry Benchmark for Large Language Models [4.3] ChemProは4100の自然言語問合せ対を持つプログレッシブベンチマークである。
LLM(Large Language Models)の習熟度を、一般的な化学トピックの幅広い範囲で評価するように設計されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:08:08 GMT)
Thermodynamics of the Heisenberg XXX chain with negative spin [4.3] 負スピンを持つ等方性ハイゼンベルクXXXスピン鎖の熱力学について検討する。
自由エネルギー、エントロピー、比熱を導出し、異なる熱力学系を分離した量子相転移を同定する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:40:14 GMT)
SATORIS-N: Spectral Analysis based Traffic Observation Recovery via Informed Subspaces and Nuclear-norm minimization [4.3] STORIS-Nは,周辺地域の情報空間の先行情報から部分的に観測された交通密度を推定するフレームワークである。
我々の貢献は、以前の特異部分空間情報による再構成を明示的に通知する、核ノルムのサブスペース対応半定プログラミング(SDP)の定式化である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:45:24 GMT)
Non-Intrusive Graph-Based Bot Detection for E-Commerce Using Inductive Graph Neural Networks [4.2] 悪意のあるボットは、データをスクラップし、在庫を盗み、詐欺行為を繰り返すことで、Eコマースプラットフォームへの脅威が増大する。
IPブラックリストやCAPTCHAベースの課題など、従来のボットの緩和技術は、ますます非効率あるいは侵入的になっている。
本研究は,ユーザセッションの振る舞いをグラフ表現を通じてモデル化するEコマースのための非侵襲的なグラフベースボット検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:03:43 GMT)
Decoherence-protected entangling gates in a silicon carbide quantum node [4.2] 電子スピンが量子プロセッサとして働き、核スピンが量子メモリとして機能する、炭化ケイ素の完全機能量子ノードを実証する。
我々は、量子ノード内の絡み合った状態を決定的に準備し、特定の量子ネットワークアーキテクチャのフォールトトレランスしきい値を超える90%の忠実度を達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:22:49 GMT)
The Illusion of Generalization: Re-examining Tabular Language Model Evaluation [4.2] 代用タブラ言語モデル(TLM)としてのTabula-8Bの再評価
バイナリとカテゴリの分類は、多数クラスのベースラインに対するほぼゼロの中央値リフトを達成する。
最上位のデータセットは広範囲にわたる汚染を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:41:30 GMT)
TiCLS : Tightly Coupled Language Text Spotter [4.2] シーンテキストスポッティングは、インスタンスがしばしば短く、断片化され、視覚的に曖昧である実世界の画像中のテキストを検出し、認識することを目的としている。
文字レベルの事前学習言語モデルから外部言語知識を明示的に取り入れた,エンドツーエンドテキストスポッターTiを提案する。
Tiは、視覚的特徴と言語的特徴を融合させる言語デコーダを導入しているが、事前訓練された言語モデルによって誘導され、曖昧なテキストや断片化されたテキストの堅牢な認識を可能にする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:38:05 GMT)
Cognitively Diverse Multiple-Choice Question Generation: A Hybrid Multi-Agent Framework with Large Language Models [4.2] ReQUESTAは認知学的に多様な多目的質問(MCQ)を生成するためのハイブリッドマルチエージェントフレームワークである
本研究では,学術論文を用いた大規模読解学習における枠組みの評価を行った。
その結果、ReQUESTA生成項目は、より困難であり、差別的であり、全体的な読解能力と強く一致していることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:26:47 GMT)
Abstraction Induces the Brain Alignment of Language and Speech Models [4.1] 音声モデルと言語モデルと脳との対応は、共通の意味抽象化から導かれることを示す。
本研究は,fMRIとECoG信号がいかにうまく説明できるかを,層内次元が強く予測することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:35:29 GMT)
Manifold Random Features [4.1] 一般多様体上のカーネルを近似するマニフォールドランダム特徴量(MRF)を作成する。
MRFは多様体の離散化と最近導入されたグラフランダム特徴(GRF)の手法を利用する
離散グラフオブジェクト上に定義されたGRFと、通常のカーネルで使用される連続乱数特徴の深い関係を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:00:01 GMT)
Enhancing Mathematical Problem Solving in LLMs through Execution-Driven Reasoning Augmentation [4.1] Iteratively Improved Program Construction (IIPC) は、プログラム的推論チェーンを反復的に洗練し、実行フィードバックをベースLLMのネイティブチェーン能力と組み合わせる推論手法である。
IIPCは、複数のベース LLM 上の推論ベンチマークの大部分において、競合するアプローチを上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:13:31 GMT)
When Single Answer Is Not Enough: Rethinking Single-Step Retrosynthesis Benchmarks for LLMs [4.0] 単段回帰合成のための新しいベンチマークフレームワークを提案する。
正確なマッチングに対する妥当性を強調することで、このアプローチは人間の合成計画プラクティスとよりよく一致します。
LLMトレーニングのための数百万のChemCensor-validated reaction recordからなる新しいデータセットCREEDについても紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:03:32 GMT)
Topology Matters: A Cautionary Case Study of Graph SSL on Neuro-Inspired Benchmarks [3.9] 本稿では,ノード,エッジ,グラフレベルの埋め込みを共同で学習する階層型自己教師型学習(SSL)フレームワークを提案する。
我々はコネクトームのトポロジカルな性質を模倣した制御可能な合成ベンチマークを構築した。
この結果から,コネクトームのようなデータに汎用グラフSSLを適用する際の根本的な落とし穴が明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:35:54 GMT)
TFFM: Topology-Aware Feature Fusion Module via Latent Graph Reasoning for Retinal Vessel Segmentation [3.9] 血管接続性を維持するために設計されたトポロジ対応フレームワークを紹介する。
我々のアーキテクチャは、局所的な特徴表現を潜在グラフ空間にマッピングする、トポロジカル・フィーチャー・フュージョン・モジュール(TFFM)を融合する。
学習過程をハイブリッドな目的関数で駆動し,クラス不均衡に対するTverskyの損失とソフトなClDiceの損失とを結合させ,トポロジカルな切断を明示的に罰する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:59:19 GMT)
Efficient Sequential Neural Network with Spatial-Temporal Attention and Linear LSTM for Robust Lane Detection Using Multi-Frame Images [3.9] レーン検出は、自動走行車(AV)と先進運転支援システムにとって重要な認識課題である。
現行の手法では、正確で堅牢でリアルタイムに車線検出を実現するための汎用性が欠如している。
本研究では,車線の重要な特徴に焦点をあてる空間的注意機構を備えた新しい逐次ニューラルネットワークモデルを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:51:29 GMT)
Probing Memes in LLMs: A Paradigm for the Entangled Evaluation World [3.9] 本稿では,Dawkinsが知識と行動を再現する文化的遺伝子として導入した概念である,ミームで構成された大規模言語モデルを概念化する。
9つのデータセットと4,507のLLMに適用されたProbing Memesは、隠れた能力構造を明らかにし、従来のパラダイムの下で見えない現象を定量化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:58:29 GMT)
Semantic-level Backdoor Attack against Text-to-Image Diffusion Models [3.9] 本稿では,セマンティックレベルのバックドア攻撃(Semantic-level Backdoor Attack, SemBD)を提案する。
SemBDは、最先端の入力レベルの防御に対して強い堅牢性を保ちながら、100%の攻撃成功率を達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:23:01 GMT)
Where Norms and References Collide: Evaluating LLMs on Normative Reasoning [3.8] ロボットのような身体的エージェントは、コミュニケーションの成功が社会的規範の推論に依存することが多い場所にいる環境で対話する必要がある。
大規模な言語モデル(LLM)がこのような推論をサポートできるかどうかは不明だ。
SNIC(Situated Norms in Context)は,最先端のLCMがNBRRに関連する規範的原則をいかに抽出し,活用できるかを探索する,有能な診断テストベッドである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:23:22 GMT)
UnHype: CLIP-Guided Hypernetworks for Dynamic LoRA Unlearning [3.8] UnHypeは、ハイパーネットワークをシングルコンセプトとマルチコンセプトのローランド適応(LoRA)トレーニングに組み込むフレームワークである。
推論中、ハイパーネットワークはCLIP埋め込みに基づいて適応的なLoRA重みを動的に生成する。
我々はUnHypeを、オブジェクト消去、有名人の消去、明示的なコンテンツ削除など、いくつかの困難なタスクで評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:37:08 GMT)
Fast-MWEM: Private Data Release in Sublinear Time [3.8] MWEM(Multiplicative Weights Exponential Mechanism)は、個人データ分析のための基本的な反復的フレームワークである。
MWEMフレームワークに修正を加えて,設定実行時の依存性を期待値$(sqrtm)$に改善する。
これは、Gumbelノイズと$k$-Nearest Neighborデータ構造を用いて効率的に実装するReport-Noisy-Maxメカニズムへの遅延サンプリング手法によって実現される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:51:40 GMT)
AnyStyle: Single-Pass Multimodal Stylization for 3D Gaussian Splatting [3.8] フィードフォワード3D再構成・スタイリングフレームワークであるAnyStyleを導入し,マルチモーダルコンディショニングによるポーズフリー・ゼロショットスタイリングを実現する。
本手法はテキスト入力と視覚入力の両方をサポートし,自然言語記述や参照画像を用いてシーンの外観を制御できる。
実験により、AnyStyleは、高品質な幾何再構成を保ちつつ、フィードフォワードスタイル化手法よりもスタイル制御性を向上させることが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:19:58 GMT)
Explaining the Explainer: Understanding the Inner Workings of Transformer-based Symbolic Regression Models [3.8] PATCHESは,シンボル回帰のためのコンパクトかつ正しい回路を識別する進化的回路探索アルゴリズムである。
PATCHESを用いて28個の回路を分離し,SRトランスの回路レベルの特性化を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:27:10 GMT)
Sounding Highlights: Dual-Pathway Audio Encoders for Audio-Visual Video Highlight Detection [3.6] 我々は,DAViHD(Dual-Pathway AudioSums for Video Highlight Detection)という新しいフレームワークを提案する。
DAViHDは、コンテンツ理解のためのセマンティックパスと、分光時間力学を捉えるダイナミックパスで構成されている。
我々は大規模なMr.Hiベンチマークで最新の性能を実現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:32:56 GMT)
Geometry-Preserving Neural Architectures on Manifolds with Boundary [3.6] 層間の幾何学的更新をインターリーブする幾何学的アーキテクチャのクラスを提案する。
拘束されたニューラルODEに対する普遍的な近似結果を確立する。
S2 と SO(3) 上の力学と Sd-1 値の特徴の拡散実験は、解析的更新の正確な実現可能性を示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:09:39 GMT)
Pursuing Best Industrial Practices for Retrieval-Augmented Generation in the Medical Domain [3.6] 大規模言語モデル(LLM)に基づく産業アプリケーションにおいて,検索拡張生成(RAG)が急速に採用されている
コンポーネントの編成方法、産業アプリケーション、特に医療領域における各コンポーネントの実装方法については、RAGシステム構築のベストプラクティスについて合意はありません。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:37:42 GMT)
IT-OSE: Exploring Optimal Sample Size for Industrial Data Augmentation [3.5] 産業シナリオでは、データ拡張はモデルの性能を改善する効果的なアプローチである。
拡張における最適なサンプルサイズ(OSS)に関する理論的研究や確立された評価はない。
産業データ拡張のための信頼性の高いOSS推定を行うための情報理論最適サンプルサイズ推定(IT-OSE)を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:04:01 GMT)
NeuralFLoC: Neural Flow-Based Joint Registration and Clustering of Functional Data [3.5] textNeuralFLoCは、統合機能登録とクラスタリングのための、完全に教師なし、エンドツーエンドのディープラーニングフレームワークである。
機能ベンチマークの実験では、登録とクラスタリングの両方で最先端のパフォーマンスを示し、データの欠如、不規則なサンプリング、ノイズに対して堅牢性を保ちながら、スケーラビリティを維持している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:35:33 GMT)
Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing [3.5] 大きな言語モデルはしばしば「ランダムな事実」に高い信頼を持って幻覚を与える
我々はそのような事実の記憶を会員試験問題として定式化する。
幻覚は, 損失圧縮の自然な帰結として持続することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:36:49 GMT)
LLM-FSM: Scaling Large Language Models for Finite-State Reasoning in RTL Code Generation [3.5] LLM-FSMは,大規模言語モデル (LLM) が有限状態マシン (FSM) の動作をどの程度回復できるかを評価するベンチマークである。
手動で構築された例に依存する以前の仕様-RTLベンチマークとは異なり、LLM-FSMは完全に自動化されたパイプラインで構築されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:48:26 GMT)
DiffLOB: Diffusion Models for Counterfactual Generation in Limit Order Books [3.4] リミットオーダーブック(LOB)の生成モデルは、現実的な市場ダイナミクスを再現することができるが、基本的には受動的である。
我々は,textbfLOBトラジェクトリを制御可能かつ非現実的に生成するための状態条件付きtextbfDiffusion モデルである textbfDiffLOB を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:34:56 GMT)
Equilibrium Propagation for Non-Conservative Systems [3.3] フィードフォワードネットワークを含む任意の非保守システムに平衡伝搬(EP)を拡張するフレームワークを提案する。
我々は平衡伝播の重要な性質、すなわち推論と学習の両方に定常状態を用いることを保っている。
我々は、コスト関数の正確な勾配を得るために、相互作用の非相互部分に比例する項で学習相のダイナミクスを変更する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:52:23 GMT)
Privacy utility trade offs for parameter estimation in degree heterogeneous higher order networks [3.3] 関係データセットを含むセンシティブなアプリケーションでは、逆クエリから個々のリンクに関する情報を保護することが最重要となる。
我々は、この形式の集合関係情報に採用される原型統計モデルである$$モデルを採用する。
局所的および中心的差分プライバシー制約下での最小パラメータ推定の問題について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:11:37 GMT)
eCP: Informative uncertainty quantification via Equivariantized Conformal Prediction with pre-trained models [3.1] 我々は、事前学習されたモデルの群対称性が共形予測(CP)に及ぼす影響について検討する。
本研究では,事前学習した予測器の群分割による幾何情報を用いてCPを注入し,非整合質量を軌道に分散する手法を提案する。
提案手法では, コンベックス次数の増加に伴う非整合性スコアが良好に得られ, 指数的なテール境界が向上し, 予想される共形予測セットがよりシャープになった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:18:59 GMT)
Latent Neural-ODE for Model-Informed Precision Dosing: Overcoming Structural Assumptions in Pharmacokinetics [3.1] タクロリムスAUC予測のための遅延正規微分方程式(Latent ODE)に基づく新しいデータ駆動方式を提案する。
このディープラーニングアプローチは、疎い臨床データから個別化されたダイナミクスを直接学習する。
潜在ODEモデルは、標準的な仮定から逸脱した基盤となる生物学的メカニズムであっても、優れた堅牢性を示し、高い精度を維持した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:30:48 GMT)
Collision Detection with Analytical Derivatives of Contact Kinematics [3.0] 異なる接触キネマティクスは、ロボット工学における勾配に基づく手法に不可欠である。
我々は,暗黙的な識別可能な衝突検出と接触キネマティクスフレームワークであるiDCOLを開発した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:34:31 GMT)
Investigating Quantum Circuit Designs Using Neuro-Evolution [3.0] 本稿では,量子回路の自動設計とトレーニングへの進化的アプローチを提案する。
提案手法は,ハードウェアおよびノイズ制約を尊重しながら,ゲートタイプ,キュービット接続,パラメータ化,回路深さを探索する。
予備的な結果は、分類タスクで進化した回路が90%以上の精度を達成できることを示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:57:39 GMT)
Understanding Multi-Agent LLM Frameworks: A Unified Benchmark and Experimental Analysis [2.9] 本稿では,マルチエージェント LLM フレームワークを基本次元に沿って体系的に比較するためのアーキテクチャ分類法を提案する。
我々は,既存のベンチマークを標準化された実行パイプラインの下で統合する統合評価スイートを開発した。
以上の結果から,フレームワークレベルの設計選択だけでレイテンシが100倍以上向上し,計画精度が最大30%向上し,調整成功率が90%以上から30%以下に低下する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:37:56 GMT)
MGKAN: Predicting Asymmetric Drug-Drug Interactions via a Multimodal Graph Kolmogorov-Arnold Network [2.9] MGKANは、非対称なDDI予測に学習可能な基底関数を導入するグラフコルモゴロフ・アルノルドネットワークである。
薬理学的依存関係を捉えるため、MGKANは3つのネットワークビュー(非対称DDIネットワーク、協調相互作用ネットワーク、および生体化学的類似性ネットワーク)を統合する。
2つのベンチマークデータセットでは、MGKANは7つの最先端ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:58:32 GMT)
An Evaluation of the Remote CX Protocol under Noise in Distributed Quantum Computing [2.8] 我々は、ノイズ下で実行されるプロトコルの影響を高レベル評価するために、特殊なシミュレーションフレームワークを使用する。
提案手法は,Grover,GHZ,VQC,ランダム回路上で動作した実験において,素数およびグラフ分割のキュービット割当戦略と,それらが忠実性に与える影響を比較した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:52:13 GMT)
OD-DEAL: Dynamic Expert-Guided Adversarial Learning with Online Decomposition for Scalable Capacitated Vehicle Routing [2.8] OD-BCCは、ハイブリッド遺伝検索(HGS)とオンラインバリセンタークラスタリング(conquer)分解を統合する大規模な学習フレームワークである。
OD- train graph attention network (GAT) によるミニマックスゲームによる生成ポリシー。
これにより、動的に大規模なデプロイメントを行うために必要な、秒単位のニューラルネットワーク品質推論が可能になる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:29:48 GMT)
Omnidirectional Solid-State mmWave Radar Perception for UAV Power Line Collision Avoidance [2.7] 小型UAVの周囲を球面で感知できるミリ波レーダを用いた知覚システムを提案する。
このシステムは複数のコンパクトな固体ミリ波レーダーモジュールを統合し、全方位視野を合成する。
実線でのフィールド実験では、10mの範囲での信頼性の高い検出、10m/s以上の飛行速度での回避操作の成功、直径1.2mmの細いワイヤの検出が示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:02:32 GMT)
Rejecting Arguments Based on Doubt in Structured Bipolar Argumentation [2.7] 本稿では、哲学的・言語学的視点から情報を得た計算論証への新たなアプローチを開発する。
計算議論に関する文献でほとんど注目されていない2つの考えを考慮に入れている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:09:19 GMT)
Large Language Models Can Take False First Steps at Inference-time Planning [2.6] 大規模言語モデル(LLM)は、訓練中にシーケンスレベルの計画能力を取得することが示されている。
推論時に現れる平面行動は、しばしば近視眼的であり、これらの能力と矛盾しない。
進化する生成的文脈における計画行動に基づいて,このギャップのベイズ的説明を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:54:55 GMT)
Robust Representation Learning in Masked Autoencoders [2.6] Masked Autoencoders (MAEs) は画像分類タスクにおいて印象的な性能を発揮するが、学習した内部表現はあまり理解されていない。
この研究は、MAEの強力な下流分類性能を理解するために始まった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:48:34 GMT)
Structural shifts in institutional participation and collaboration within the AI arXiv preprint research ecosystem [2.6] 本稿では,2021年から2025年までのarXivプレプリント(cs.AI)のデータセットを用いて,AI研究環境の構造変化について検討する。
以上の結果から,ChatGPT導入以降の出版出力は前例のない増加傾向を示した。
しかし、ランダム混合ベースラインよりもかなり低い正規化コラボレーション指標(NCI)によって測定されるように、学術・産業連携は依然として抑制されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:35:16 GMT)
DeepDFA: Injecting Temporal Logic in Deep Learning for Sequential Subsymbolic Applications [2.5] DeepDFAは、高レベルの時間論理をニューラルアーキテクチャに統合する、ニューロシンボリックなフレームワークである。
我々は,DeepDFAが静的な画像シーケンス分類と,インタラクティブな非マルコフ環境下でのポリシー学習の2つの重要な設定でどのように使用できるかを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:59:47 GMT)
Human-in-the-Loop Failure Recovery with Adaptive Task Allocation [2.5] ロボットの故障を人間オペレーター(ARFA)に割り当てる適応的手法を提案する。
解決すべき障害のすべてに対して、報酬関数は演算子機能と履歴データ、タスク緊急性、現在のワークロード分布に基づいて期待される結果を算出する。
シミュレーションとユーザスタディにより、ARFAはランダムなアロケーションよりも優れ、ロボットのアイドル時間を大幅に短縮し、システム全体の性能を向上し、オペレータ間でより分散されたワークロードをもたらすことが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:55:48 GMT)
Precision in Practice: Knowledge Guided Code Summarizing Grounded in Industrial Expectations [2.5] 期待を意識したコード要約手法であるExpSumを提案する。
ExpSumをHarmonyOSプロジェクトで評価し,コード要約ベンチマークを広く使用した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:22:28 GMT)
A Parameterizable Convolution Accelerator for Embedded Deep Learning Applications [2.5] リアルタイム組み込みディープラーニング(DL)アプリケーションは、レイテンシ、消費電力、面積、コストに関する複数の制約を課している。
本研究は,CNNアクセラレータを高レベル合成(HLS)ツールを用いて記述するハードウェア・ソフトウェア(HW/SW)協調設計手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:24:28 GMT)
SymPlex: A Structure-Aware Transformer for Symbolic PDE Solving [2.5] 偏微分方程式の解析的シンボリック解を発見するための強化学習フレームワークを提案する。
SymPlexは、木構造決定決定としてPDEのシンボリックな解法を定式化している。
コアとなるSymFormerは、階層的なシンボリック依存関係をモデル化する構造対応トランスフォーマーである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:18:30 GMT)
SCPL: Enhancing Neural Network Training Throughput with Decoupled Local Losses and Model Parallelism [2.4] 本稿では、BPを分離し、長い勾配流を複数の短絡に変換することでこの問題に対処する新しい学習手法である Supervised Contrastive Parallel Learning (SCPL) を提案する。
BP, Early Exit, GPipe, Associated Learning (AL)と比較して, バックプロパゲーションをデカップリングするための最先端手法である。
SCPLは、高度な情報システムをよりコスト効率よく、よりアジリティで開発し、展開するための実践的な経路を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:12:03 GMT)
Even More Efficient Soft-Output Decoding with Extra-Cluster Growth and Early Stopping [2.4] 本稿では,境界クラスタギャップとクラスタ外ギャップという2種類の新しいソフトアウトプットを紹介する。
後者は、クラスタ外ギャップであるデコーダの信頼性を、デコーダによって得られたクラスタの小さな追加的な成長によって定量化する。
これらの技術は計算の複雑さを低くし、ハードウェアの互換性を高める。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:00:40 GMT)
Soft-Radial Projection for Constrained End-to-End Learning [2.3] 我々は、勾配飽和を回避できる微分可能なreパラメタライゼーション層であるSoft-Radial Projectionを紹介する。
この構造は、ほぼどこでもフルランクのヤコビアンを保存しながら、厳密な実現性を保証する。
我々は、最先端の最適化と投影に基づくベースラインよりも優れた収束挙動と解の質を実証的に示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:33:44 GMT)
Manipulation via Force Distribution at Contact [2.3] 本研究は、接触リッチな操作におけるフォース分散ラインコンタクトモデルを提案する。
両レベル最適化フレームワークを構築し、低レベルが接触力計算の最適化問題を解く。
効率的かつロバストな軌道生成におけるFDLCの利点を確立した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:22:36 GMT)
Can Developers rely on LLMs for Secure IaC Development? [2.3] GPT-4o と Gemini 2.0 Flash for secure Infrastructure as Code (IaC) の開発について検討した。
セキュリティの臭いを検出するために、セキュリティの観点からコードを分析するよう促されたとき、少なくとも71%のセキュリティの臭いが検出された。
セキュアなコード生成のために、89の脆弱な合成シナリオを持つLLMを起動し、生成したスクリプトのわずか7%がセキュアであることを確認した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:32:36 GMT)
Phantom Transfer: Data-level Defences are Insufficient Against Data Poisoning [2.3] データ中毒(Phantom Transfer)と呼ばれる攻撃は、たとえその毒が、たとえその有害なデータセットにどのように置かれていたかを正確に知っているとしても、それをフィルターすることができないという特性を持つ。
我々は、GPT-4.1を含むモデル間で攻撃が動作することを示した。
これは、データレベルの防御が高度なデータ中毒攻撃を止めるには不十分であることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:38:07 GMT)
Variational Approach for Job Shop Scheduling [2.3] 本稿では、ジョブショップスケジューリング問題(JSSP)を解決するための新しい変分グラフ・ツー・スケジュール(VG2S)フレームワークを提案する。
提案手法は,最先端のDRLベースラインや従来のディスパッチルールと比較して,ゼロショットの一般化に優れる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:15:33 GMT)
The Trigger in the Haystack: Extracting and Reconstructing LLM Backdoor Triggers [2.2] 本稿では、因果言語モデルにおける睡眠エージェントスタイルのバックドアを特定するための実用的なスキャナを提案する。
まず、睡眠薬は中毒データを記憶する傾向があるため、バックドアのサンプルを漏らすことが可能です。
提案手法は,複数のバックドアシナリオと広範囲のモデルにまたがる動作トリガを復元することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:17:21 GMT)
TransConv-DDPM: Enhanced Diffusion Model for Generating Time-Series Data in Healthcare [2.2] ジェネレーティブAIは、データボリュームの増加とモデルトレーニングの強化を約束している。
本稿では,生体力学的および生理的時系列データ生成のための改良された生成AIであるTransConv-DDPMを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:24:37 GMT)
An Approximate Ascent Approach To Prove Convergence of PPO [2.2] PPOのポリシー更新スキームは、どのようにして、近似されたポリシー勾配の上昇と解釈できるかを示す。
また,これまで見過ごされていた一般化アドバンテージ推定の問題も確認した。
実験的な評価により、単純な重み補正は、強力な終端信号を持つ環境においてかなりの改善をもたらすことが示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:10:22 GMT)
OMNI-Dent: Towards an Accessible and Explainable AI Framework for Automated Dental Diagnosis [2.2] 我々は,臨床推論の原理をVLM(Vision-Language Model)ベースのパイプラインに組み込んだ,データ効率が高く説明可能な診断フレームワークであるOMNI-Dentを提案する。
このフレームワークは、マルチビューのスマートフォン写真で動作し、歯科専門家の診断を埋め込み、汎用的なVLMを誘導し、VLMを歯科固有の微調整なしで歯科レベルの評価を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:09:52 GMT)
Generative Engine Optimization: A VLM and Agent Framework for Pinterest Acquisition Growth [2.1] Pinterest GEOは、リバース検索設計のパイオニアであるプロダクションスケールのフレームワークである。
コンテンツを記述した一般的な画像キャプションを生成するのではなく、Vision-Language Modelsを微調整して、ユーザーが実際に何を検索するかを予測する。
我々は、数十億の視覚資産にまたがる信号を伝達する権威を意識した相互接続構造を構築するために、ハイブリッドVLMと2tower ANNアーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:58:50 GMT)
Personalization Increases Affective Alignment but Has Role-Dependent Effects on Epistemic Independence in LLMs [2.1] 大規模言語モデル(LLM)は、ユーザの信念に反し、サイコファンティックな振る舞いをしがちである。
本研究では,9つのフロンティアモデルと5つのベンチマークデータセットにわたるLLMサイコファシーに対するパーソナライズの影響を厳密に評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:04:03 GMT)
SEAFormer: A Spatial Proximity and Edge-Aware Transformer for Real-World Vehicle Routing Problems [2.1] 本稿では,ノードレベルの情報とエッジレベルの情報の両方を意思決定に組み込んだ新しいトランスフォーマーSEAFormerを提案する。
SEAFormerは1000以上のノードRWVRPを効果的に解決する最初のニューラルネットワーク手法である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:53:45 GMT)
Accurate Failure Prediction in Agents Does Not Imply Effective Failure Prevention [2.1] LLM批判モデルによる積極的な介入は、しばしば信頼性を向上させると仮定されるが、展開時の影響はよく理解されていない。
高いオフライン精度 (AUROC 0.94) を持つバイナリLLM批判者は, にもかかわらず, 高い性能劣化を引き起こす可能性がある。
我々は、50のタスクからなる小さなパイロットを用いて、完全な配備を必要とせず、介入が助けになるか、害を与えるかを見積もる事前デプロイテストを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:02:50 GMT)
Zero-shot large vision-language model prompting for automated bone identification in paleoradiology x-ray archives [2.1] LVLM(Large Vision Language Model)は、X線写真における主骨、投影ビュー、およびラテラルを自動的に識別する。
このシステムは92%の主骨精度、80%のプロジェクションビュー精度、100%の遅れの精度を達成した。
これらの結果から,LVLMは大規模古生物学データセットのコードワード開発を著しく加速させることができることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:14:23 GMT)
Simulation-Based Inference via Regression Projection and Batched Discrepancies [1.9] 我々は,観測データの回帰に基づく投影のみを用いて,シミュレーションパラメータを推論する軽量なシミュレーションベース推論手法を解析した。
DREAMSシミュレーションスイートを用いたトラクタブル非線形モデルと宇宙キャリブレーションタスクの実験は、回帰ベースの射影の計算上の利点を示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:07:40 GMT)
From Hanging Out to Figuring It Out: Socializing Online as a Pathway to Computational Thinking [1.9] Scratchは、プログラミングの学習を支援するために設計されたオンラインプラットフォームです。
我々は「参加型デバッガ」の概念を誘導的に開発する。
参加型デバッガの社会的先行要因として機能する3つの因子を同定した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:38:00 GMT)
PLATE: Plasticity-Tunable Efficient Adapters for Geometry-Aware Continual Learning [1.9] 従来のタスクデータへのアクセスを必要としない事前学習モデルの連続学習法を開発した。
冗長性は 自然の偏見を与えます
textscPLATEは、可塑性保持トレードオフを明示的に制御する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:59:42 GMT)
HypCBC: Domain-Invariant Hyperbolic Cross-Branch Consistency for Generalizable Medical Image Analysis [1.9] 医用画像解析における双曲表現学習の総合的検証について述べる。
我々は11の分布内データセットと3つのViTモデルに対して統計的に有意な利得を示した。
提案手法は,ドメイン不変性を促進し,平均2.1%のAUCで最先端のユークリッド法より優れる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:50:24 GMT)
Mil-SCORE: Benchmarking Long-Context Geospatial Reasoning and Planning in Large Language Models [1.9] MilSCOREは、シミュレーションされた軍事計画シナリオに基づいて、専門家が作成したマルチホップ質問のシナリオレベルのデータセットである。
このベンチマークには、事実のリコールと多段階推論の両方を対象とする7つのカテゴリにわたる多様な質問タイプが含まれている。
以上の結果から,MilSCOREは現実的かつシナリオレベルの長期計画に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:50:45 GMT)
SLIM-Diff: Shared Latent Image-Mask Diffusion with Lp loss for Data-Scarce Epilepsy FLAIR MRI [1.9] 単一共有ブートネック U-Net を用いたコンパクトな合同拡散モデル SLIM-Diff を提案する。
SLIM-Diffは2チャンネル画像+マスク表現からの解剖学と病変幾何学の密結合と、調整可能な$L_p$目的による損失幾何学的チューニングを強制する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:48:57 GMT)
A Scene Graph Backed Approach to Open Set Semantic Mapping [1.8] オープンセットセマンティックマッピングと3次元シーングラフ(DSSG)はロボット知覚のパラダイムとして確立されている。
本稿では,3DSSGが基本的なバックエンドとして機能し,主要な知識表現として機能するマッピングアーキテクチャを提案する。
これにより、大規模な設定で拡張された操作であっても、地図が位相的に一貫性を持ち、計算的に効率的であることを保証する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:41:51 GMT)
Formal Evidence Generation for Assurance Cases for Robotic Software Models [1.8] 保証ケースは、証拠によって支持される構造化された議論を提供する。
この証拠の生成と維持は、労働集約的で、エラーを起こし、システムが進化するにつれて一貫性を維持するのが困難である。
本稿では,保証ワークフローに形式検証を組み込むことにより,AC証拠を体系的に生成するモデルに基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:01:30 GMT)
Adaptive Test-Time Compute Allocation via Learned Heuristics over Categorical Structure [1.8] テスト時間計算は、大規模言語モデル(LLM)推論の進歩の原動力となっている。
我々は,検証作業が中間状態にまたがってどのように配置されるべきか,検証コストに制限のある環境下での推論について検討する。
本研究では, (i) 構造化された移動インタフェース上での確定可能性ゲーティング, (ii) 学習された状態距離と残差スコアのハイブリッドを用いた事前検証ランキング, (iii) 局所的不確実性に基づく検証呼び出しの適応的アロケーションを組み合わせた状態レベルの選択的検証フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:57:53 GMT)
Active Epistemic Control for Query-Efficient Verified Planning [1.8] モデルに基づく信念管理とカテゴリー的可能性チェックを統合した計画層である textbfActive Epistemic Control (AEC) を提案する。
AECは、コミットメントに使用されるアンフグラウンドのファクトストアと、候補プランの刈り取りにのみ使用されるエンフベーリフストアとを厳格に分離している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:51:10 GMT)
The Path of Least Resistance: Guiding LLM Reasoning Trajectories with Prefix Consensus [1.8] 計算効率の推論にプレフィックス整合性を利用する最初の推論時間法であるPoLRを導入する。
PoLRクラスタは、推論トレースの短いプレフィックスを、支配的なクラスタを特定し、そのクラスタ内のすべてのパスを拡張する。
実証的には、PoLRはGSM8K、MATH500、AIME24/25、GPQA-DIAMONDで一貫してSCを超える。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:36:47 GMT)
The Label Horizon Paradox: Rethinking Supervision Targets in Financial Forecasting [1.7] 最適監視信号は予測目標から逸脱することが多く、市場ダイナミクスによって支配される中間地平線を横切る。
本稿では,一つのトレーニング実行内で最適なプロキシラベルを自律的に識別する,双方向最適化フレームワークを提案する。
大規模財務データセットの実験では、従来のベースラインよりも一貫した改善が示されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:16:43 GMT)
Evaluating the Vulnerability Landscape of LLM-Generated Smart Contracts [1.7] 大規模言語モデル(LLM)は、現代のソフトウェア開発ライフサイクルにおいて広く採用されている。
ブロックチェーンの分野では、開発者はスマートコントラクトの生成とメンテナンスにLLMに依存している。
構文的正しさと機能的完全性にもかかわらず、LLM生成のスマートコントラクトは深刻なセキュリティ欠陥をしばしば示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:07:26 GMT)
MS-SCANet: A Multiscale Transformer-Based Architecture with Dual Attention for No-Reference Image Quality Assessment [1.7] マルチスケール空間チャネル注意ネットワーク(MS-SCANet)は、非参照画像品質評価(IQA)のために設計されたトランスフォーマーベースのアーキテクチャである。
MS-SCANetは、複数のスケールで画像を処理し、細部と粗部の両方を効果的にキャプチャするデュアルブランチ構造を備えている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:43:15 GMT)
From Speech-to-Spatial: Grounding Utterances on A Live Shared View with Augmented Reality [1.7] 音声参照(音声入力)のみから目的を推定する音声対空間的推論
発話が与えられた場合、参照キューはパースされ、永続的なARビジュアルガイダンスとして描画される。
評価の結果,Spatialは作業効率の向上,認知負荷の低減,ユーザビリティの向上を実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:34:12 GMT)
VR-VFL: Joint Rate and Client Selection for Vehicular Federated Learning Under Imperfect CSI [1.6] 本稿では,不完全チャネル状態情報に基づく可変速度車両連合学習(VR-VFL)を提案する。
VR-VFLは、動的クライアント選択と適応的な送信速度選択を組み合わせると同時に、無線条件の変化に応じてラウンドタイムを柔軟にすることができる。
本稿では,VR-VFL方式が他の手法よりも約40%高速な収束を実現することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:36:01 GMT)
Edge-Optimized Vision-Language Models for Underground Infrastructure Assessment [1.5] 本稿では,地下欠陥のエンドツーエンド要約のための新しい2段階パイプラインを提案する。
私たちの軽量なRAPID-SCANセグメンテーションモデルと、エッジコンピューティングプラットフォームにデプロイされた微調整されたビジョンランゲージモデルを組み合わせています。
この結果から,自動欠陥検出とインフラストラクチャ保守のための実用的な洞察とのギャップを埋めるために,エッジデプロイ可能な統合AIシステムの可能性が示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:03:46 GMT)
PriorProbe: Recovering Individual-Level Priors for Personalizing Neural Networks in Facial Expression Recognition [1.4] PriorProbeはMarkov Chain Monte Carlo with Peopleをベースとした,斬新なエレキュベーションアプローチだ。
我々は、回復した先行情報を最先端のニューラルネットワークに統合することで、あいまいな刺激に対する個人の分類を予測する能力を向上させるかどうかを検証した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:15:02 GMT)
The Personality Trap: How LLMs Embed Bias When Generating Human-Like Personas [1.3] まず,生成したペルソナのソシオデマトグラフィー特性における代表性と潜在的なバイアスを評価する。
全てのモデルはWEIRD(西部、教育され、工業化され、豊かで民主的な偏見を示し、若く、教育され、白人、異性愛者、中道的または進歩的な政治的見解を持つ西洋人、世俗的またはキリスト教的信念を好んでいる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:00:18 GMT)
GraphAllocBench: A Flexible Benchmark for Preference-Conditioned Multi-Objective Policy Learning [1.3] GraphAllocBenchは、都市管理にインスパイアされたグラフベースのリソース割り当てサンドボックス環境上に構築されたフレキシブルなベンチマークである。
多様な目的関数、様々な好み条件、高次元拡張性を備えた豊富な問題群を提供する。
我々は,GraphAllocBenchが既存のMORLアプローチの限界を明らかにし,グラフニューラルネットワーク(GNN)のようなグラフベースの手法を複雑で高次元のアロケーションタスクで活用する方法を舗装していることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:26:24 GMT)
SEIS: Subspace-based Equivariance and Invariance Scores for Neural Representations [1.2] 幾何学的変換の下で階層的特徴表現を解析するためのサブスペースメトリックであるSEISを紹介する。
合成検証は、SEISが既知の変換を正しく回復することを確認する。
マルチタスク学習は、共有エンコーダにおける両方の特性の相乗効果を誘導することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:38:08 GMT)
Time2Vec Transformer for Robust Gesture Recognition from Low-Density sEMG [1.2] 本稿では筋電義手制御のための新しい,データ効率の高いディープラーニングフレームワークを提案する。
提案手法は, スパース2チャネル表面筋電図(sEMG)に最適化されたハイブリッドトランスフォーマーの実装である。
提案するフレームワークは, 迅速なパーソナライズが可能な次世代人工装具の堅牢で費用対効果の高い青写真を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:09:27 GMT)
A User Study on the Suitability of Teleoperation Interfaces for Primitive Manipulation Tasks [1.2] 遠隔操作のロボットアーム制御への応用は広く研究されている。
本研究は,ロボットアームの操作に用いるインタフェースの特性に着目した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:30:47 GMT)
A Tunable, Modeless, and Hybridization-free Cross-Kerr Coupler for Miniaturized Superconducting Qubits [1.1] 超伝導量子回路は典型的には、量子ビットを制御するために容量電荷ベースの線形結合スキームを使用する。
比較的小さなジョセフソンエネルギーを持つSQUID(超伝導量子干渉デバイス)カプラに基づく接合型結合アーキテクチャを提案する。
追加モードを導入することなく,高速かつ断熱的かつ高忠実な制御Zゲートを実装するために,SQUIDカプラを使用できることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:56:12 GMT)
Lee-Yang tensors and Hamiltonian complexity [1.1] リー・ヤン半径$r > 1$の量子状態は準ポリノミアル回路で生成可能であることを示す。
結果は、$r = 1$が量子状態と可観測物にとって重要なしきい値であることを示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:57:04 GMT)
An Anatomy-specific Guidewire Shaping Robot for Improved Vascular Navigation [1.1] 本稿では、ナビゲーション固有の所望のワイヤ構成を生成することができるベンチトップガイドワイヤ整形ロボットを提案する。
本研究は, 臨床検定されたコモン・チップ・ジオメトリ(C, S, Angled, Hook)を作成でき, 2次元のモデル予測形状に対して検証可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:36:16 GMT)
PROTEUS: SLA-Aware Routing via Lagrangian RL for Multi-LLM Serving Systems [1.1] 本稿では,タウをランタイム入力として正確にターゲットとするルータ PROTEUS を提案する。
単一の訓練されたモデルは、トレーニングをせずに完全な精度のスペクトルを提供する。
RouterBench(11モデル,405Kクエリ)とSPROUT(14モデル,45Kクエリ)について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:00:56 GMT)
Efficient Variance-reduced Estimation from Generative EHR Models: The SCOPE and REACH Estimators [1.1] トークン化された電子健康記録タイムラインを用いてトレーニングした生成モデルは、臨床結果の予測を約束する。
既存のアプローチには、患者のリスクレベルを低く区別するスパース推定分布、極端な計算コスト、サンプリング分散の3つの重要な制限がある。
本稿では,予測条件ハザード(REACH)のSCOPE(Sum of Conditional Outcome Probability Estimator)とリスク推定(Sum of Conditional Probability Estimator)の2つの新しい推定手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:49:44 GMT)
Optimal Effective Hamiltonian for Quantum Computing and Simulation [1.0] 実効モデルの基本原理としてLast Action Unitary Transformationを確立します。
この枠組みを超伝導量子プロセッサの実験データに対して検証する。
この研究は、高精度なシステム学習とハミルトン工学のための体系的で実験的に検証されたルートを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:09:29 GMT)
SAFE-KD: Risk-Controlled Early-Exit Distillation for Vision Backbones [1.0] アーリーエグジットネットワークは、簡単な入力を早期に停止させることで、推論コストを削減する。
本稿では,現代の視覚バックボーンのための汎用マルチエグジットラッパーSAFE-KDを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:07:31 GMT)
Task--Specificity Score: Measuring How Much Instructions Really Matter for Supervision [1.0] textbfTask--Specificity Score (TSS) を提案する。
タスク固有の例を選択することで、トークン予算の厳格化の下で下流のパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:57:47 GMT)
Accelerating the Tesseract Decoder for Quantum Error Correction [1.0] Tesseractは量子エラー補正のための新しいMLEデコーダである
本稿では,低レベル性能向上によるTesseractデコーダの最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:46:51 GMT)
Dynamic Topology Optimization for Non-IID Data in Decentralized Learning [1.0] 分散学習(DL)のためのトポロジ最適化アルゴリズムであるMorphを提案する。
Morphでは、ノードは最大モデルの相似性に基づいて、モデル交換のためのピアを適応的に選択する。
最大100ノードのCIFAR-10とFEMNISTの実験は、Morphが静的および流行ベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:07:01 GMT)
NPCNet: Navigator-Driven Pseudo Text for Deep Clustering of Early Sepsis Phenotyping [1.0] ターゲットナビゲータを備えた新しいディープクラスタリングネットワークであるNPCNetを提案する。
また,SOFAトラジェクトリで異なる4つのセシス表現型($,$,$,$$,$$)を同定した。
以上の結果から,NPCNetは臨床的に特異的な表現型を明らかにすることにより,精度の高い治療戦略を強化することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:07:54 GMT)
Are LLMs Biased Like Humans? Causal Reasoning as a Function of Prior Knowledge, Irrelevant Information, and Reasoning Budget [1.0] 大きな言語モデル (LLM) は、因果推論が重要な分野において、ますます使われている。
我々は,コライダー構造で定式化された11の因果判定課題に対して,一致した人体ベースラインに対して20以上のLSMをベンチマークした。
ほとんどのLSMは、確率判断において未解決の潜伏要因を考慮に入れているように見える人間よりも、ルールライクな推論戦略を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:43:09 GMT)
Adversarial construction as a potential solution to the experiment design problem in large task spaces [1.0] タスク空間に埋め込まれた全てのタスクの統一モデルを開発することを目的としている。
タスクの空間は大きいので、空間全体の実験的探索は不可能である。
この結果から, 環境のランダムサンプリングにおいて, 対角構造が著しく優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:41:56 GMT)
General Agents Contain World Models, even under Partial Observability and Stochasticity [0.9] エージェントはランダム化を用いて環境を学習することができないことを示す。
我々は一般性の概念を弱め、力の弱いエージェントが既に彼らが運用する世界のモデルを含んでいることを証明した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:00:41 GMT)
Equal Access, Unequal Interaction: A Counterfactual Audit of LLM Fairness [0.9] アクセスが許可された後の人口統計的アイデンティティにおいて,大きな言語モデルがトーン,不確実性,言語フレーミングにおいてどのように異なるかを検討する。
相互作用品質における系統的、モデル固有の相違を観察する。
これらの結果は,アクセスが等しい場合でも,公平性の違いが相互作用レベルで持続可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:05:38 GMT)
Score-based diffusion models for diffuse optical tomography with uncertainty quantification [0.8] 本稿では,学習とモデルベースコンポーネントからなる混合スコアを構成することで,スコア関数の過度な適合を防止する新しい正規化手法を提案する。
実験により、データ駆動の事前分布は、古典的モデルに基づく推定と比較して、低分散の後方サンプルをもたらすことが示された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:14:07 GMT)
RPG-AE: Neuro-Symbolic Graph Autoencoders with Rare Pattern Mining for Provenance-Based Anomaly Detection [0.8] 本稿では,グラフオートエンコーダと稀なパターンマイニングを組み合わせた,ニューロシンボリックな異常検出フレームワークを提案する。
異常候補は、観測されたグラフ構造と再構成されたグラフ構造の間のずれによって同定される。
DARPAトランスペアレント・コンピューティング・データセットを用いて提案手法の評価を行い, 異常なパターンの増大が異常なランク付け品質において著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:02:37 GMT)
Enhanced Parcel Arrival Forecasting for Logistic Hubs: An Ensemble Deep Learning Approach [0.8] 本稿では,ロジスティックハブにおける今後のワークロードを予測するための,新たなディープラーニングベースのアンサンブルフレームワークを提案する。
このアプローチは短期的な予測生成を促進するだけでなく、将来のハブワークロード予測の精度を向上させる。
本研究は,ロジスティクスハブの運用効率向上に向けた本手法の有意義な可能性を明らかにし,その普及を提唱するものである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:44:31 GMT)
Tuning interactions between static-field-shielded polar molecules with microwaves [0.8] マイクロ波場を適用し,静電場シールド分子間の相互作用を調整する方法を提案する。
マイクロ波のパラメータを変化させることで、s波散乱長と双極子長の両方を広範囲に調整できることが判明した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:52:54 GMT)
STAR: Similarity-guided Teacher-Assisted Refinement for Super-Tiny Function Calling Models [0.8] 関数呼び出しにおける大規模言語モデル(LLM)は、高度なAIエージェントを作成する上で重要であるが、その大規模化は広く採用を妨げている。
STAR:Simisity-Guided Teacher-Assisted Refinementは,LLMの能力をスーパーティニーモデルに効果的に転送する,新しい包括的フレームワークである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:41:11 GMT)
CALM: A Self-Adaptive Orchestration Approach for QoS-Aware Routing in Small Language Model based Systems [0.7] CALMはMAPE-Kに基づく自己適応型オーケストレーション機構である。
遅延を約40%削減し、エネルギー消費を50%削減する。
評価の結果,CALMは遅延を約40%減らし,エネルギー消費を50%減らした。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:20:14 GMT)
Secure Decentralized Pliable Index Coding for Target Data Size [0.7] 本稿では,クライアント放送をコーディネートして符号化効率を最大化する送信方式を提案する。
クライアントがターゲットの$T$以上のメッセージを取得できないように、厳格なセキュリティ制約を課します。
本稿では,このセキュリティ制約の下で提案手法がもたらす通信コストを解析する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:28:19 GMT)
Sparse Training of Neural Networks based on Multilevel Mirror Descent [0.7] 本稿では,線形化されたブレグマン反復/ミラー降下に基づく動的スパーストレーニングアルゴリズムを提案する。
実験により,我々のアルゴリズムは標準ベンチマーク上で高度にスパースで正確なモデルを生成することができることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:51:45 GMT)
Deadline-Aware, Energy-Efficient Control of Domestic Immersion Hot Water Heater [0.7] 本研究では,エネルギー消費を最小化しつつ,所定時間で目標温度に達することを目的とした期限対応制御について検討する。
メソッドには、時間最適化バンバンベースライン、ゼロショットモンテカルロツリー探索プランナー、およびポリシー最適化ポリシーが含まれる。
我々は、同じ物理力学下でのワット時間における総エネルギー消費を報告する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:07:02 GMT)
Preferences for Idiomatic Language are Acquired Slowly -- and Forgotten Quickly: A Case Study on Swedish [0.7] 本研究では,言語モデルがどのようにテクティビズムの嗜好を発達させるかを検討する。
言語的受容性については、既存のベンチマークを最小のペア形式に適応させる。
本研究は,他の言語能力よりも,慣用的能力の出現が遅いことを示唆している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:57:39 GMT)
When Domain Pretraining Interferes with Instruction Alignment: An Empirical Study of Adapter Merging in Medical LLMs [0.6] 大規模言語モデルは、ドメイン適応と命令アライメントを組み合わせる際に驚くべきアダプタ干渉を示す。
医学LLMのための2段階のLORAパイプラインについて検討し、ドメイン指向事前トレーニング(PT)と教師付き微調整(SFT)を個別に訓練し、後にマージした。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:46:48 GMT)
Mići Princ -- A Little Boy Teaching Speech Technologies the Chakavian Dialect [0.6] 本稿では,有名な小説『小さな王子』の翻訳書をチャカヴィア方言に翻訳する作業について述べる。
データセットはコンピュータ可読でAI可読なデータセットである。
我々は、すでに実施した実験のセットを超えて、このデータセットのさらなる使用を想定しています。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:24:58 GMT)
Representation Geometry as a Diagnostic for Out-of-Distribution Robustness [0.6] In-distribution Embeddingsからクラス条件の相互k-nearest-neighborグラフを構成する幾何学的診断フレームワークを提案する。
スペクトルの複雑さが低く、平均曲率が高くなると、チェックポイント全体にわたって強い分布外(OOD)の精度が常に予測される。
この結果から,表現幾何学はラベル無しで解釈可能な診断を可能にし,教師なしチェックポイント選択の信頼性をサポートできることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:13:36 GMT)
A feedback control optimizer for online and hardware-aware training of Spiking Neural Networks [0.6] 本稿では、スパイクに基づく重み更新とフィードバック制御信号を統合する混合信号デバイス上でのスパイキングニューラルネットワーク(SNN)の新しい学習アルゴリズムを提案する。
我々のフレームワークでは、スパイキングコントローラがフィードバック信号を生成し、SNNアクティビティをガイドし、ウェイトアップデートを駆動し、スケーラブルでローカルなオンチップ学習を可能にする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:08:21 GMT)
Estimation of Ground Reaction Forces from Kinematic Data during Locomotion [0.5] グラウンド・リアクション・フォース(GRF)は、人間の歩行力学に関する基本的な洞察を与え、関節の荷重、手足対称性、バランス制御、運動機能を評価するために広く用いられている。
臨床関連性にもかかわらず、力板システムの実用的限界のため、GRFの使用は未利用のままである。
マーカーベースモーションキャプチャーデータのみを用いてGRFを推定するための力板レス手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:45:14 GMT)
Explanations Leak: Membership Inference with Differential Privacy and Active Learning Defense [0.5] 対物的説明(CF)は、透明性を改善するために機械学習・アズ・ア・サービス(ML)システムに統合されつつある。
我々は、メンバシップ推論攻撃(MIA)を強化することにより、CFがMLの攻撃面をどのように拡張するかという問題に焦点をあてる。
本稿では,DPとアクティブラーニング(AL)を統合した防衛フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:04:09 GMT)
Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization [0.5] ジェネレーティブAI(GenAI)は、主要なワークロードカテゴリとして急速に現れます。
この業界論文は、コンテナオーケストレーションのメリットを提供するために、新しいTokenネイティブプロジェクトをどのように組み合わせることができるかを示します。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:36:08 GMT)
On Quantum Learning Advantage Under Symmetries [0.4] 量子統計クエリ(QSQ$)モデルにおける対称性の潜在的な利点について検討する。
我々は、高度に歪んだ軌道分布の下で潜在的な利点が生じることを発見した。
さらに、量子学習者が古典的な$SQ$アルゴリズムを非効率にするノイズレベルで成功する、寛容に基づく分離が存在すると同定する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:05:53 GMT)
On the Credibility of Evaluating LLMs using Survey Questions [0.4] 近年,大規模言語モデル(LLM)の価値指向を適応型社会調査を用いて評価している。
本稿では, 正確な設定に依存して, 値配向の類似性を過小評価し, 過度に見積もることの限界を明らかにする。
5か国3ヶ国における世界価値調査(World Value Survey)を用いて、直接対思考の連鎖(direct vs. chain-of-thinkt)と復号戦略(greedy vs. sample)が結果に有意な影響を及ぼすことを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:45:43 GMT)
Symbol-Aware Reasoning with Masked Discrete Diffusion for Handwritten Mathematical Expression Recognition [0.4] 手書き数学的表現認識(HMER)は、多様な記号と2次元構造的レイアウトの推論を必要とする。
本稿では,HMERを逐次生成ではなく反復的記号精製として再構成する離散拡散フレームワークを提案する。
MathWritingベンチマークでは、提案は5.56%のCERと60.42%のEMを達成し、強力なトランスフォーマーと商用ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:46:49 GMT)
Predicting Depressive Symptoms through Emotion Pairs within Asian American Families [0.4] 本研究は,アジア系アメリカ人とアジア系アメリカ人の子どもがサブレディット,r/Asianparentstoriesで共有するオンライン物語におけるあいまいな感情の役割について検討した。
BERTモデルを用いて、文章レベルでの感情と、ポストレベルでの抑うつ症状を検出することにより、混合感情を分析し、抑うつ症状をどのように予測するかをよりよく理解する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:04:30 GMT)
It's Not Just Timestamps: A Study on Docker Reproducibility [0.4] Dockerの測定パイプラインを構築して,Dockerfileを含む2,000のGitHubリポジトリのサンプルに適用します。
構築可能なイメージは56%に過ぎず、2.7%はインフラストラクチャの設定なしでビット単位で再現可能である。
これらのパターンから具体的なDockerfileガイドラインを導き、再現可能なコンテナに対する将来のlinterとContinuous Integration(CI)チェックを通知する方法について説明します。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:26:53 GMT)
When Excellence Stops Producing Knowledge: A Practitioner's Observation on Research Funding [0.3] 本稿では,評価下での表現性への結合性の向上を通じて,知識生産から卓越性が切り離された経緯について述べる。
専門コンサルタントによる提案書のプロフェッショナル化,AI支援アプリケーションの台頭,評価者不足について検討した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:21:11 GMT)
Unpacking Human Preference for LLMs: Demographically Aware Evaluation with the HUMAINE Framework [0.3] HUMAINEは人間とAIの相互作用を多次元、人口統計学的に把握するフレームワークである。
我々は5つの人間中心次元にわたる28の最先端モデルを評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:51:47 GMT)
Principles of Lipschitz continuity in neural networks [0.3] この論文は、ニューラルネットワークにおけるリプシッツ連続性の原理の原則的理解を深めようとしている。
入力データの特徴に関して、Lipschitz連続性がニューラルネットワークの挙動をどう調節するかを検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:30:08 GMT)
Testing Framework Migration with Large Language Models [0.3] Python開発者は、textttunittestとtextttPytestの2つの主要なテストフレームワークに依存している。
我々は、textttunittest から textttPytest へのテストフレームワークのマイグレーションを自動化するLarge Language Models (LLMs) の機能について検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:04:09 GMT)
Explainable Computer Vision Framework for Automated Pore Detection and Criticality Assessment in Additive Manufacturing [0.3] 内部ポロシティは、追加的に製造されたコンポーネントにおいて重要な欠陥モードのままである。
本研究では,細孔検出と臨界度評価のためのコンピュータビジョンフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:28:31 GMT)
A thin and soft optical tactile sensor for highly sensitive object perception [0.3] 我々は、アライメントのない配置を特徴とする、薄く、コンパクトで、ソフトな光触覚センサを提案する。
このセンサは、軟質シリコン材料内で発生するスペックルパターンの変形誘起変化をキャプチャして動作させる。
実験の結果,9種類のテクスチャ面に対して40mNの根平均二乗誤差と93.33%の分類精度を示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:28:14 GMT)
Group Selection as a Safeguard Against AI Substitution [0.3] 生成AIへの信頼は、特に創造的な仕事において、文化的分散と多様性を減らすことができる。
この分散の減少は、モデル崩壊や幻覚を含むモデル性能の問題を既に引き起こしている。
エージェントベースのモデルと進化ゲーム理論を用いて、補完と置換の2種類のAI使用の比較を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:56:47 GMT)
Quantum speed limit time for bipartite entanglement in neutrino oscillations in matter with non-standard interactions [0.3] また,NO$AおよびDUNEはニュートリノ発振において両端の絡み合いを急速に抑制することを示した。
この結果はニュートリノ振動における新しい物理のインプリントの可能性を示している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:11:37 GMT)
mopri - An Analysis Framework for Unveiling Privacy Violations in Mobile Apps [0.2] mopriは、包括的な、適応性があり、ユーザ中心のアプローチを通じて、モバイルアプリの振る舞いを分析するために設計された概念的なフレームワークである。
動的トラフィック記録と復号化のためのロバストな手法を採用しながら、許可と追跡ライブラリを効果的に抽出するプロトタイプが開発されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:52:31 GMT)
The Opaque Pointer Design Pattern in Python: Towards a Pythonic PIMPL for Modularity, Encapsulation, and Stability [0.2] Pythonライブラリは、内部実装が進化しても安定したパブリックAPIを維持する必要がしばしばある。
本稿では、C++からポインタから実装までのイディオム(PIMPL)を見直し、不透明なデリゲートのPythonパターンとして再解釈する。
既存のランタイムでPythonのPIMPLを使用して、重い依存関係を分離し、遅延インポートをサポートし、パブリックAPIを変更することなく代替バックエンドの選択を可能にする方法を示します。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 02:40:48 GMT)
Efficient Algorithms for Partial Constraint Satisfaction Problems over Control-flow Graphs [0.2] プログラムの制御フローグラフ(CFG)に対する部分制約満足度問題(PCSP)に焦点を当てる。
PCSPは、よく知られた制約満足度問題(CSP)の一般化として機能する。
我々の主な貢献は、(O(|G| cdot |D|6)の時間複雑性を持つSPLグラフ上のPCSPの一般的なアルゴリズムであり、(|G|)は制御フローグラフのサイズを表す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:38:10 GMT)
Vision Transformers for Zero-Shot Clustering of Animal Images: A Comparative Benchmarking Study [0.2] 動物画像のマニュアルラベリングは、生態学研究において重要なボトルネックとなっている。
本研究では、最先端のビジョントランスフォーマー(ViT)基盤モデルが、何千もの未ラベルの動物画像を直接種レベルのクラスタに還元できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:27:22 GMT)
Interpretable Logical Anomaly Classification via Constraint Decomposition and Instruction Fine-Tuning [0.2] 我々は,単一推論ステップにおいて,異常検出ときめ細かい違反分類を統一するタスクである論理異常分類(LAC)を導入する。
LACに取り組むために,複雑な論理的制約を検証可能なサブクエリ列に分解する視覚言語フレームワークであるLogiClsを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:48:09 GMT)
Can LLMs Do Rocket Science? Exploring the Limits of Complex Reasoning with GTOC 12 [0.2] LLM(Large Language Models)は、コード生成と一般的な推論において顕著な習熟性を示している。
本研究は、第12回グローバル軌道最適化コンペティション(GTOC 12)に対するAIエージェントの評価により、現在のAIエージェントの限界について検討する。
我々は、MLE-Benchフレームワークを軌道力学の領域に適応させ、AIDEベースのエージェントアーキテクチャをデプロイし、ミッションソリューションを自律的に生成し、洗練する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:18:26 GMT)
Comprehensive Numerical Studies of Barren Plateau and Overparametrization in Variational Quantum Algorithm [0.2] パラメータ化量子回路を用いた変分量子アルゴリズム(VQA)は、短期量子コンピューティングに広く応用されている。
VQA最適化はしばしばバレンプラトー (BP) と呼ばれる勾配の消失と局所的なミニマの存在に悩まされる。
本稿では,BPとOPの影響と変動量子回路の最適化における相互作用を定量的に評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:17:48 GMT)
Decision-oriented benchmarking to transform AI weather forecast access: Application to the Indian monsoon [0.1] 気象学、AI、社会科学を結びつける枠組みを導入する。
インドのモンスーン予測の150年前の問題に適用する。
このフレームワークは、2025年に政府主導で、農家のAIベースのモンスーンの発症予測を3800万回送った。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:27:22 GMT)
Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection [0.1] Aletheiaは、偽ニュースを検出し、エビデンスに基づく説明を提供する新しいブラウザ拡張である。
Aletheiaには、フラグ付きコンテンツに関するユーザ対話を可能にするディスカッションハブと、最近の事実チェックをサーフェスするStay Informed機能が含まれている。
Aletheiaは検出性能において最先端のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:30:29 GMT)
Hierarchical Proportion Models for Motion Generation via Integration of Motion Primitives [0.1] イミテーション・ラーニング(IL)は、ロボットがデモから人間のような動きのスキルを習得することを可能にする。
本研究では、動きプリミティブと比例に基づく動き合成を統合する階層型ILフレームワークを提案する。
学習の柔軟性、計算コスト、適応性の間のトレードオフを検討するために、3つのモデル変種が導入された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:57:06 GMT)
Fast, Unsupervised Framework for Registration Quality Assessment of Multi-stain Histological Whole Slide Pairs [0.1] 全スライド画像(WSI)の高忠実性登録は分子解析に不可欠であるが,GTアノテーションを使わずに評価は困難である。
本研究は,登録H&EとIHC WSIペアの登録品質評価(RQA)のための,組織マスクのダウンサンプリングと変形に基づくメトリクスを併用した,高速かつ教師なしのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:30:00 GMT)
How Users Understand Robot Foundation Model Performance through Task Success Rates and Beyond [0.1] 本研究では,ロボットファンデーションモデルの評価から,非ロボティクス主義者がパフォーマンス情報をどう解釈するかを検討する。
本研究では,タスク成功率(TSR)や障害事例記述など,実際の評価データについて検討した。
我々は,RTMの過去の評価結果から実際のデータにアクセスし,ロボットが新しいタスクでどれだけうまくやるかを推定する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:36:45 GMT)
Quantization-Aware Regularizers for Deep Neural Networks Compression [0.1] トレーニング中に自然にクラスタを形成するために重みを駆動する層ごとの正規化用語を導入します。
これにより、量子化法に典型的に関連付けられた精度損失が減少する。
AlexNet と VGG16 モデルを用いた CIFAR-10 の実験により,提案手法の有効性が確認された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:07:43 GMT)
Multimodal Consistency-Guided Reference-Free Data Selection for ASR Accent Adaptation [0.1] ASRアクセント適応のためのマルチモーダル整合性誘導型参照フリーデータ選択パイプラインを提案する。
パイプラインは、共有埋め込み空間における音声テキストアライメントと予測された単語エラー率の2つの基準自由信号を用いて、各仮説をスコアする。
単純なパーセンタイルベースの選択規則は、ノイズ発声を排除しながら微調整のための信頼できる擬似ラベルを保持する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:35:58 GMT)
Stochastic Spiking Neuron Based SNN Can be Inherently Bayesian [0.0] 生物学的神経系の不確実性は、有害性よりも有益であると考えられる。
ニューロモルフィックコンピューティングシステムでは、デバイス可変性はしばしば精度と効率を含む性能を制限する。
本稿では,本質的デバイス性の動的モデルを統合するスパイクニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:48:14 GMT)
Zak phase and bulk-boundary correspondence in a generalized Dirac-Kronig-Penney model [0.0] 相対論的量子連鎖に対する連続1次元モデルの位相的性質について検討する。
結合パラメータをチューニングすることで、このモデルは5つのアルトランド-ジルンバウアー-カルタン対称性クラスに対応できる。
絶縁相のバルクトポロジカル含量を調べるために,Zak相を数値計算する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:56:57 GMT)
Will we ever quantize the center of mass of macroscopic systems? A case for a Heisenberg cut in quantum mechanics [0.0] 量子粒子の概念は場の量子論に由来する。
波動力学はプランクスケール以上の系の質量の中心を記述することができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:38:56 GMT)
When Chains of Thought Don't Matter: Causal Bypass in Large Language Models [0.0] CoT(Chain-of- Thought)プロンプトは、モデルの推論プロセスを公開し、透明性を向上させると広く仮定されている。
この障害モードを監査するための診断フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:27:49 GMT)
What Do Contribution Guidelines Say About Software Testing? [0.0] 我々は200のPythonおよびJavaScriptオープンソースプロジェクトのガイドラインを分析した。
プロジェクトの78%には、コントリビュータのためのある種のテストドキュメンテーションが含まれています。
テストドキュメンテーションは一般的にテストの実行方法を説明するが、テストの記述方法に関するガイダンスは提供されないことが多い。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:05:15 GMT)
Weighted Sum-of-Trees Model for Clustered Data [0.0] そこで本研究では,サンプル群毎に決定木を学習する軽量な要約木モデルを提案する。
我々は,様々なシミュレーション環境において,従来の決定木や無作為林よりも優れたモデルを示す。
The Cancer Genome Atlasの肉腫コホートから得られた実世界のデータについて紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:04:49 GMT)
Variational Sparse Paired Autoencoders (vsPAIR) for Inverse Problems and Uncertainty Quantification [0.0] 逆問題は、ノイズ測定から隠れた、根底にある量を再構築しようとするときに生じる。
本稿では,この課題に対処するための変分スパースペア自動エンコーダ (vsPAIR) を提案する。
我々はブラインドインペイントと計算トモグラフィの実験を行い、vsPAIRが逆問題解法であることを示した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:46:29 GMT)
Universality of Shallow and Deep Neural Networks on Non-Euclidean Spaces [0.0] 我々は,一般的なトポロジカル空間にまたがる入力を含む,浅層および深層ニューラルネットワークのためのフレームワークを開発する。
我々は、普遍近似特性に着目し、そのようなネットワークが密集した一般的な条件を確立する。
幅制限がない場合には、古典的な近似定理を非ユークリッド的な設定に拡張する結果が得られる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:46:46 GMT)
Universal Characterization of Quantum Vacuum Measurement Engines [0.0] 量子真空曲げ関数(QVBF)を導入して量子真空測定エンジンの理論を開発する。
作業と効率を含むすべての熱力学的観測物は、QVBFで符号化された地中エネルギー景観の形状によってのみ支配されることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:27:24 GMT)
Universal Approximation of Continuous Functionals on Compact Subsets via Linear Measurements and Scalar Nonlinearities [0.0] ヒルベルト空間の積のコンパクト部分集合上の連続函数の普遍近似について研究する。
近似原理をバナッハ空間の値を持つ写像に拡張し、有限ランク近似を生成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:16:50 GMT)
Transcendental Regularization of Finite Mixtures:Theoretical Guarantees and Practical Limitations [0.0] 本稿では,効率を保ちながら退化を防止できる分析バリア機能を備えた,超越正則化(transcendental regularization)を提案する。
我々の研究は、オープンソースのRパッケージで実装された、新しい理論フレームワークと実用的な制限の正直な評価の両方を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:12:14 GMT)
To Throw a Stone with Six Birds: On Agents and Agenthood [0.0] Six Birds Theory (SBT)は、マクロな物体を原始体ではなく誘導的閉包として扱う。
SBT内では,タイプ正当性評価を行う。
我々はこの契約を4つのチェック可能なコンポーネントを用いて有限制御システムで運用する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:46:23 GMT)
Thermodynamic state variables from a minimal set of quantum constituents [0.0] 本研究では, 平衡熱力学の圧力, エントロピー, 温度が, 2次元領域の1つあるいは2つの粒子のカオススペクトル構造から一貫した導出可能であることを示す。
これは第1原理からの作業と熱の定義、熱力学の第1法則と第2法則の顕微鏡的基盤、固有状態熱化仮説の透明な図示を提供する」。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:58:51 GMT)
Thermodynamic assessment of machine learning models for solid-state synthesis prediction [0.0] 機械学習モデルは、仮説的な固体物質を合成できるかどうかを予測するために最近登場した。
本稿では、最近導入されたいくつかの合成予測モデルと物質および反応熱力学のアライメントを評価する。
これらのモデルは通常、合成の確率を過大に予測するが、いくつかのモデルスコアは熱力学の傾向を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:25:54 GMT)
The Anatomy of the Moltbook Social Graph [0.0] Moltbookは、AIエージェント専用のソーシャルプラットフォームである。
マクロレベルでは、モルトブックは人間のソーシャルネットワークに精通している構造的シグネチャを示す。
マイクロレベルでは、パターンは明らかに人間ではないように見える。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 22:20:00 GMT)
Temperature driven false vacuum decay in coherently coupled Bose superfluids [0.0] 量子場の準安定状態(偽真空)から安定状態(真真空)への緩和について検討する。
崩壊速度は、インスタントンの温度理論に則って温度に指数関数的依存を示す。
以上の結果から,Gross-Pitaevskii方程式(SGPE)が磁化と相動力学の結合を研究するための有効なツールであることが確認された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:52:36 GMT)
TAB-PO: Preference Optimization with a Token-Level Adaptive Barrier for Token-Critical Structured Generation [0.0] 高価値セマンティックトークンを優先するトークン重み付き参照調整アドバンテージが提示される。
医療コミュニケーションアノテーションを用いたTAB-POの評価を行った。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:48:13 GMT)
Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation [0.0] 医療オーディオの分類は、低信号対雑音比、微妙な識別特性、およびクラス内変動が原因で依然として困難である。
これらの制約を緩和するための潜在的戦略として、合成データ拡張が提案されている。
本研究では, 基線深部畳み込みニューラルネットワークを用いて, 適度に不均衡なデータセットをトレーニングし, 合成増幅が呼吸音の分類に及ぼす影響について検討した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:52:49 GMT)
Surpassing the currently achievable distance of quantum key distribution based on sending-or-not-sending approach [0.0] 本稿では,SNS-PM-QKDプロトコルを提案する。
本稿では,SNS-PM-QKDのセキュリティ解析を集団攻撃による達成可能な(無限鍵)体制で行う。
以上の結果から,SNS-PM-QKDは既存のプロトコルよりも高い伝送距離を実現し,長距離量子通信の可能性を強調した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:41:58 GMT)
Student Perceptions of Large Language Models Use in Self-Reflection and Design Critique in Architecture Studio [0.0] 本研究では,Large Language Models (LLM) のアーキテクチャ設計スタジオのフィードバック機構への統合について検討する。
この研究は、自己回帰、ピア批判、教授主導のレビューの3つの異なるフィードバック領域における学生の認識を分析している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:28:03 GMT)
Structures and proximity effects of inhomogeneous population-imbalanced Fermi gases with pairing interactions [0.0] ボゴリューボフ-デジェンヌ方程式を用いて,複数相が実空間に共存する際の基底状態構造と特性を解析する。
BCS、Fulde-Ferrell--Larkin--Ovchinnikov(FFLO)、および通常の位相はパラメータが均一であるときに相図上の異なる領域を占有するが、ペアリング強度やスピン分極の空間的変化は、系をFFLO相から通常の気体、またはBCS過流動から実空間のFFLO相へと駆動することができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:47:50 GMT)
Stochastic Thermodynamics of Quantum-Induced Stochastic Dynamics [0.0] 量子誘起ダイナミクスは、古典的なシステムと量子環境の結合から生じる。
熱, 作業, エントロピー生成を定式化して, この半古典的状態に対する熱力学の枠組みを定式化する。
我々は、スクイーズのような非平衡量子的特徴を考慮に入れた修正された第二法則を導出する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:26:13 GMT)
Stationary entanglement of a levitated oscillator with an optical field [0.0] 我々は,光キャビティモードへのコヒーレント散乱と電磁場との量子絡み合いの発生を報告する。
ヘテロダイン検出を用いて,光学・機械的相関の完全な集合を再構築し,機械的自由度と伝搬光学モードとの分離性境界の違反を観察する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:22:23 GMT)
Soft Sensor for Bottom-Hole Pressure Estimation in Petroleum Wells Using Long Short-Term Memory and Transfer Learning [0.0] Permanent Downhole Gauges (PDG) はリアルタイムの圧力データを提供するが、信頼性とコストの問題に直面している。
We propose a machine learning-based soft sensor to estimateding Boottom-Hole pressure (BHP) using Wellhead and topside Measurement。
この研究は、様々な貯水池と流路条件にまたがる幅広い適用性を備えた、物理的センサーのコスト効率が高く、正確な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:56:21 GMT)
Semantic Rate Distortion and Posterior Design: Compute Constraints, Multimodality, and Strategic Inference [0.0] 本研究では,エンコーダとデコーダが異なる二次目的を最適化する戦略ガウス意味圧縮を,レートおよび計算制約下で研究する。
直接的, 遠隔的, 完全情報体制における戦略速度歪み関数を特徴付け, セマンティック・ウォーターフィルとレート制約付きガウス的説得解を導出し, ミスアライズされた目的の下でガウス的最適性を確立する。
これらの結果は、データとエネルギー効率のよいAIのための情報理論の基礎を提供し、リソース制約下での後設計メカニズムとして、現代の多モーダル言語モデルの原則的な解釈を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:12:02 GMT)
SLIME: Stabilized Likelihood Implicit Margin Enforcement for Preference Optimization [0.0] 我々は、優先順位学習を生成品質から切り離すために設計された参照なしアライメント目的のSLIMEを紹介する。
以上の結果から,SLIMEは最先端のベースラインに比べて優れた性能を示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:58:22 GMT)
Remarks on Dirac-Bergmann algorithm, Dirac's conjecture and the extended Hamiltonian [0.0] 制約付きシステムのハミルトン解析のためのディラック・ベルグマンアルゴリズムは、優しく強力なツールである。
第一級制約を持つシステムへの適用のいくつかの側面は、しばしば文献で見過ごされる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 06:48:18 GMT)
Reference-Free EM Validation Flow for Detecting Triggered Hardware Trojans [0.0] ハードウェアトロイの木馬(HT)は集積回路(IC)の信頼性と信頼性を脅かす
本稿では, シリコン後EMエミッションから直接トリガHTを検出するための, リファレンスフリーで設計に依存しないフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:48:13 GMT)
RAGTurk: Best Practices for Retrieval Augmented Generation in Turkish [0.0] トルコ語ウィキペディアとCulturaXから派生した包括的トルコ語RAGデータセットを構築した。
RAGパイプラインの7つのステージをベンチマークし、クエリ変換から、タスク固有の微調整を使わずに、改善に答えるように再ランク付けする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:35:11 GMT)
Quantum spin-heat engine with trapped ions [0.0] 本稿では,バッカロ,バーネット,ライトらのスピンヒートエンジン(SHE)のイオントラップ実装を提案する。
SHEは、まず、仕事の抽出段階において熱エネルギー貯水池からの熱を、近接エネルギーの縮退したスピン状態を持つ2つの光子ラマン遷移共振器を介して光学的作業に変換する。
SHEは、2つの熱貯水池を必要とする従来のパラダイムを超えて動作する熱エンジンの実証に向けた重要な第一歩である。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:32:29 GMT)
Quantum Computing for Electronic Circular Dichroism Spectrum Prediction of Chiral Molecules [0.0] 分子特性を計算し、ECDスペクトルを予測するために、変動量子フレームワークと運動フォーマリズムの量子方程式を組み合わせて導入する。
拡張活性空間へアクセスする12種類のキラル薬物分子に有効であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:33:00 GMT)
Quantum Circuit Generation via test-time learning with large language models [0.0] 大規模言語モデル(LLM)は構造化アーティファクトを生成することができるが、科学的設計のための信頼性の高い評価器として使用するには、ブラックボックス評価の下で反復的な改善のメカニズムが必要である。
LLMは固定長ゲートリストへの編集を提案し、外部シミュレータはMeyer-Wallach(MW)グローバルエンタングルメント尺度を用いて結果の状態を評価する。
従来のハイパフォーマンスな候補を明示的なメモリトレースとして再利用できる軽量なテスト時間学習レシピを導入し、スコア差フィードバックでプロンプトを強化し、再起動する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:41:25 GMT)
Quantum Annealing for Combinatorial Optimization: Foundations, Architectures, Benchmarks, and Emerging Directions [0.0] 科学、工学、産業における重要な意思決定問題は最適化に基づいている。
我々は, 断熱量子力学, Ising と QUBO モデル, 確率的および非確率的ハミルトニアン, 現代のフラックス・キュービット・アニールへのダイアバティック・トランジションに関する統一的な枠組みを開発する。
埋め込みとエンコーディングのオーバーヘッドがスケーラビリティとパフォーマンスの最大の部分であることに気付きました。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 04:51:26 GMT)
Quantifying Algorithmic Friction in Automated Resume Screening Systems [0.0] キーワードベースの履歴表示は高いレベルのアルゴリズム的摩擦を示す。
意味表現は、精度を損なうことなく、偽陰性拒絶を著しく減少させる。
本研究は,近代労働市場における採用制度設計が適合効率に与える影響を評価するための実証的基盤を提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:49:03 GMT)
QRC-Lab: An Educational Toolbox for Quantum Reservoir Computing [0.0] Quantum Reservoir Computing (QRC)は、Noisy Intermediate-Scale Quantum (NISQ)機械学習のための強力なパパラダイムとして登場した。
本稿では,理論量子力学と機械学習の作業フローのギャップを埋めるために設計された,オープンソースのモジュール型PythonフレームワークであるQRC-Labを紹介する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:38:56 GMT)
Progressive Checkerboards for Autoregressive Multiscale Image Generation [0.0] 自己回帰画像生成における重要な課題は、独立位置を効率的に並列にサンプリングすることである。
本研究では,マルチスケール自動回帰画像生成のためのプログレッシブチェッカーボードに基づくフレキシブルで固定的な順序付けについて検討する。
バランスの取れた環境では、シリアルステップの総数が一定である限り、幅広いスケールアップ要因が同様の結果をもたらすという証拠が得られます。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:15:27 GMT)
Prenatal Stress Detection from Electrocardiography Using Self-Supervised Deep Learning: Development and External Validation [0.0] 出生前の心理的ストレスは妊娠の15~25%に影響する。
現在のスクリーニングは主観的アンケート (PSS-10) に依存しており、継続的なモニタリングを制限している。
FELICITy 1コホートを用いた心電図からのストレス検出のための深層学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:51:13 GMT)
PlanTRansformer: Unified Prediction and Planning with Goal-conditioned Transformer [0.0] 軌道予測と計画は、自律運転における基本的だが非連結な要素である。
Plan TRansformer (PTR) はゴール条件付き予測、動的実現性、相互作用認識、レーンレベルのトポロジ推論を統合している。
PTRは、ベースラインのモーショントランス (MTR) と比較して4.3%/3.5%改善し、GameFormer に比べて5s水平線で15.5%の計画誤差削減を実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 10:55:05 GMT)
Ontology-to-tools compilation for executable semantic constraint enforcement in LLM agents [0.0] 本稿では,大規模言語モデル(LLM)と形式的ドメイン知識意味論を結合する原理実証機構を提案する。
オントロジー仕様は、LLMベースのエージェントが知識グラフインスタンスの作成と修正に使用する実行可能なツールツールにコンパイルされる。
本稿では, LLM インタフェースの有効性, マニュアルスキーマの削減, エンジニアリングの促進, フォーマルな知識を生成システムに組み込むための一般的なパラダイムの確立について述べる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:03:26 GMT)
OCRTurk: A Comprehensive OCR Benchmark for Turkish [0.0] トルコ語で文書解析を行うベンチマークであるOCRTurkを紹介する。
OCRTurkは、学術論文、論文、スライドデッキ、非学術論文から抽出された180のトルコの文書で構成されている。
我々はOCRTurk上で7つのOCRモデルを評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:11:25 GMT)
Non-linear PCA via Evolution Strategies: a Novel Objective Function [0.0] 我々は、PCAの解釈可能性とニューラルネットワークの柔軟性を統一する堅牢な非線形フレームワークを提案する。
固有分解の非微分可能性を扱うために進化戦略 (ES) を用いて最適化したニューラルネットワークによる可変変換をパラメトリゼーションする。
提案手法は, 合成および実世界のデータセット間の説明分散において, 線形およびkPCAの両方を著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:34:37 GMT)
Noise-Resilient Quantum Chemistry with Half the Qubits [0.0] 本稿では, 半量子量子対角化法であるHSQDを導入する。
HSQDはIBM量子ハードウェア上でのSQDの精度と一致する。
その結果、半量子SQDは強相関化学における実用的な量子優位性へのノイズ耐性と資源効率の経路として確立された。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 11:11:24 GMT)
Noise reduction in BERT NER models for clinical entity extraction [0.0] ノイズ除去(NR)モデルは、予測を弱いか強いかに分類する。
PDMはトランスフォーマーの埋め込みで観察されるセマンティック・プル効果を捉えている。
各種臨床NERモデルの偽陽性率を50%から90%削減することができた。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:35:37 GMT)
Multiparameter Uncertainty Mapping in Quantitative Molecular MRI using a Physics-Structured Variational Autoencoder (PS-VAE) [0.0] 本稿では,物理構造を持つ変分オートエンコーダ(PS-VAE)について述べる。
本法は, マルチプロトンプール化学交換飽和輸送 (CEST) および半固体磁化移動 (MT) 分子MRF法で検証した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:46:55 GMT)
Multiclass Hate Speech Detection with RoBERTa-OTA: Integrating Transformer Attention and Graph Convolutional Networks [0.0] 文脈言語理解とドメイン固有の意味知識を統合したRoBERTa-OTAを提案する。
RoBERTa-OTAの精度は96.04%、標準のRoBERTaは95.02%である。
ジェンダーベースのヘイトスピーチ検出は2.36ポイント改善され、他のヘイトスピーチカテゴリーは2.38ポイント改善されている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 23:14:24 GMT)
Multi-Level Testing of Conversational AI Systems [0.0] この論文は、会話型AIシステムのための新しいテストアプローチのファミリーを調査している。
それぞれの構成要素を異なるレベルの粒度で検証することに焦点を当てている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:38:59 GMT)
Momentum Attention: The Physics of In-Context Learning and Spectral Forensics for Mechanistic Interpretability [0.0] 本稿では,運動性差分演算子を介して物理前兆を埋め込んだシンプレクティック拡張であるMomentum Attentionを紹介する。
直流(セマンティック)と交流(メカニスティック)の信号が高パスモーメントと相互作用するときに周波数帯域に分離することが証明された直交定理を定式化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:31:36 GMT)
Mind the Performance Gap: Capability-Behavior Trade-offs in Feature Steering [0.0] 本研究では,目標動作の制御に成功しても,機能ステアリング手法がモデル性能を著しく低下させることを示す。
これらの知見は,タスク性能を犠牲にできない実運用における現在の機能ステアリング手法の限界を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:44:19 GMT)
Microscopic derivation of a completely positive master equation for the description of Open Quantum Brownian Motion of a particle in a potential [0.0] Open Quantum Brownian Motion (OQBM)は、離散時間オープンな量子ウォークのスケーリング限界として導入された。
弱駆動のブラウン粒子は調和ポテンシャルに閉じ込められ、熱浴に散逸的に結合すると考えられる。
OQBMウォーカーの初期ガウス分布と非ガウス分布の例を用いて,結果のダイナミクスを説明する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:51:27 GMT)
MAPLE: A Sub-Agent Architecture for Memory, Learning, and Personalization in Agentic AI Systems [0.0] 大規模言語モデル(LLM)エージェントは複雑なタスクのための強力なツールとして登場したが、個々のユーザへの適応能力は基本的に制限されている。
現在のシステムは3つの異なるメカニズムではなく、記憶、学習、パーソナライゼーションを統一された能力として扱う。
メモリは記憶と検索のインフラを処理し、学習は蓄積された相互作用から知性を非同期に抽出し、パーソナライゼーションは有限のコンテキスト予算内で学習知識をリアルタイムで適用する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 03:46:39 GMT)
Liouvillian Gap in Dissipative Haar-Doped Clifford Circuits [0.0] 有限密度のハールランダム単一サイトゲートをインターリーブしたフロケ2量子クリフォード回路の下でのダイナミクスについて検討する。
熱力学の限界におけるリウヴィリアのギャップの2つの異なる条件は、非ドープかつ完全にドープされた極端なケースによって例示される。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:11:31 GMT)
Learning-based Force Sensing and Impedance Matching for Safe Haptic Feedback in Robot-assisted Laparoscopic Surgery [0.0] インピーダンスマッチングアプローチ(NIMA)は、動的ダイナミクスを組み込んで、複雑なツールとタスクのインタラクションをリアルタイムで正確にモデル化し、レンダリングする。
NIMA は平均絶対誤差 0.01 (std 0.02 N) を達成し、従来の手法と比べて95%の削減を達成している。
NIMAは様々な手術条件における力の忠実度、応答性、精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:58:36 GMT)
Learning Fast Monomial Orders for Gröbner Basis Computations [0.0] Grbner基底計算は方程式のシステムを解くための標準エンジンである。
単項順序のほぼ連続にもかかわらず、ほとんどの実装はGrevLexのような静的に依存している。
本稿では,単項順序の選択を許容順序空間上の強化学習問題とすることで,このギャップに対処する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:17:18 GMT)
How to Train Your Resistive Network: Generalized Equilibrium Propagation and Analytical Learning [0.0] 我々はKirchhoffの法則に対するグラフ理論および解析フレームワークを用いて勾配を計算するアルゴリズムを開発した。
数値シミュレーションを用いて本アルゴリズムを実証し,全ての抵抗のレプリカやリードアウトを必要とせずに,出力層のみにレジストレータネットワークをトレーニング可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:00:03 GMT)
Gravitational effects on a dissipative two-level atom in the weak-field regime [0.0] 弱い重力場における2レベル原子の散逸ダイナミクスについて検討する。
自然放出速度は重力場によって変化していることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:39:52 GMT)
From Generative Modeling to Clinical Classification: A GPT-Based Architecture for EHR Notes [0.0] 本研究は臨床テキスト分類のためのGPTアーキテクチャを提案する。
すべてのモデルパラメータを更新する代わりに、GPT-2のバックボーンの大部分は凍結されている。
提案手法はMIMIC-IV-Noteデータセットからの放射線学報告に基づいて評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:45:46 GMT)
From Block Diagrams to Bloch Spheres: Graphical Quantum Circuit Simulation in LabVIEW [0.0] 本稿では,NI環境下で開発されたオープンソース量子回路ツールキットQuVI(Quantum Virtual Instrument)を紹介する。
QuVIは、標準的な量子回路表記法と直感的で視覚的な類似を提供する。
ブロックダイアグラム」を直接量子状態の進化("Blochs")に変換することで、QuVIは量子論理をプロトタイピングするための強力なプラットフォームを提供する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 07:45:15 GMT)
Fluctuations of the inverted magnetic state and how to sense them [0.0] マグノン(Magnon)は、磁性秩序物質の低エネルギー励起である。
本研究では, 逆磁気状態のゆらぎとそのシグネチャを実験的に検討した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:15:15 GMT)
Fisheye Stereo Vision: Depth and Range Error [0.0] 本研究では,魚眼立体視システムの深度・範囲誤差を物体距離の関数として,特に大角での精度を考慮した解析式を導出する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:17:37 GMT)
First-Principles AI finds crystallization of fractional quantum Hall liquids [0.0] MagNet(マグネット)は、トーラス幾何学上の磁場中の量子系のために設計された自己アテンション型ニューラルネットワーク変動波動関数である。
我々は、MagNetが同じアーキテクチャ内でFQH状態と電子結晶の両方を記述することができる統一的で表現力のあるアンサッツを提供することを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:00:01 GMT)
Evaluating Quantum Wire Cutting for QAOA: Performance Benchmarks in Ideal and Noisy Environments [0.0] 量子回路切断(quantum circuit cutting)と呼ばれる手法の1つを分析する。
回路切断では、量子回路はより小さなサブ回路に分解され、それぞれがより小さな量子ハードウェア上で動作することができる。
回路切断は,特に回路数の増加に伴い,ノイズ条件下での正解が困難であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 12:57:19 GMT)
Entropy Reveals Block Importance in Masked Self-Supervised Vision Transformers [0.0] 自己監督型視覚変換器におけるブロックの重要性を,データにアクセスせずに正確に推定できることを示す。
その結果,マスク付き自己監督型視覚変換器のブロックレベル冗長性は顕著であった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:27:24 GMT)
Dicke superposition probes for noise-resilient Heisenberg and super-Heisenberg Metrology [0.0] N-量子ディック重畳状態のクラスは、量子フィッシャー情報の近ハイゼンベルクスケーリングを示す。
特定のディック重ね合わせは、超ハイゼンベルクスケーリングと位相減衰に対するレジリエンスの改善を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:35:53 GMT)
Detecting quantum noise of a solid-state spin ensemble with dispersive measurement [0.0] ホモダイン検出により測定された駆動共振器との結合による不均一に拡張されたスピンアンサンブルの分散読み出しについて検討した。
測定記録のゆらぎを詳細に研究することにより、スピンスクイーズを直接検出するための実験的プロトコルも提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:55:03 GMT)
Detecting and Explaining Malware Family Evolution Using Rule-Based Drift Analysis [0.0] マルウェアの検出と家族への分類は、サイバーセキュリティにおいて重要なタスクである。
この進化は、マルウェアの特徴の統計的性質が時間とともに変化するコンセプトドリフトを導入している。
本稿では,コンセプトドリフト検出に対する解釈可能なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:07:14 GMT)
Detailed, interpretable characterization of mid-circuit measurement on a transmon qubit [0.0] 中間回路計測(MCM)は、量子誤り訂正プロトコルの重要な構成要素である。
我々は、以前はノイズの多い量子ゲートを解釈するために用いられていたエラー生成の形式に適応し、それらのエラープロセスを物理的に意味のある「要素的エラー」の和に分解する。
これらの誤差の大きさが読み出しパルス振幅とどのように異なるのかを詳細に検討し、理論によって予測される分散読み出しの鍵となる特徴を復元し、これらの特徴がわずか数パラメータの縮小モデルを用いてパロニカルにモデル化可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:00:28 GMT)
Cyber Insurance, Audit, and Policy: Review, Analysis and Recommendations [0.0] 本稿では,サイバー監査がサイバー保険コストを低減し,その可用性を向上させるためのサイバー監査の利用を推奨する上で,サイバー監査がもたらす課題と潜在的なメリットについて,この領域における先行研究の構造化されたレビューと分析を行う。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 05:37:49 GMT)
Convex Loss Functions for Support Vector Machines (SVMs) and Neural Networks [0.0] 本稿では,バイナリ分類と回帰モデルの両方において,Support Vector Machinesの新しい凸損失を提案する。
双対問題の数学的導出を示し、いくつかの小さなデータセット上で実験する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:20:28 GMT)
Contextuality from Single-State Representations: An Information-Theoretic Principle for Adaptive Intelligence [0.0] 文脈性は量子力学の特異性ではなく、古典的な表現における単一状態の再利用による必然的な結果であることを示す。
この結果から,文脈性は適応的インテリジェンスに対する一般的な表現的制約であり,物理的実装とは無関係であることがわかった。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:20:10 GMT)
Co2PO: Coordinated Constrained Policy Optimization for Multi-Agent RL [0.0] 我々は,Co2POを提案する。Co2POは,選択的かつリスク対応のコミュニケーションを通じて協調駆動型安全を実現する新しいフレームワークである。
Co2POは、学習されたハザード予測器によって制御される位置意図と利得信号を放送するための共有ブラックボードアーキテクチャを導入している。
我々は,Co2POを,制約付きベースラインよりも高いリターンを達成する複雑なマルチエージェント安全ベンチマーク群で評価した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 01:09:31 GMT)
Classical Benchmarks of a Symmetry-Adapted Variational Quantum Eigensolver for Real-Time Green's Functions in Dynamical Mean-Field Theory [0.0] アンダーソン不純物モデル(AIM)を解くための変分量子固有解法(VQE)アプローチを提案する。
DMFT自己整合性ループから抽出した入浴パラメータを用いて,異なる相互作用強度間での正確な対角化に対する性能をベンチマークした。
VQEとリアルタイム進化を組み合わせることで、量子古典ハイブリッドDMFTを2サイト近似を超えて効果的に拡張することができる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:59:03 GMT)
Child Mortality Prediction in Bangladesh: A Decade-Long Validation Study [0.0] バングラデシュの2011-2022年の人口統計調査(DHS)データ(n = 33,962)は,本論文で使用される。
モデルを(2011-2014)データでトレーニングし、2017年データで検証し、2022年データでテストしました。
モデルの最初のテストから8年後、遺伝的アルゴリズムをベースとしたNeural Architecture Searchは、XGBoostよりも優れた単層ニューラルネットワークを発見した。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:18:50 GMT)
CTTVAE: Latent Space Structuring for Conditional Tabular Data Generation on Imbalanced Datasets [0.0] 本稿では,2つの相補的機構を備えた条件変換器を用いたタブラル変分自動エンコーダであるCTTVAEを紹介する。
CTTVAE+TBSは、トレーニングを不安定にすることなく、より代表的で実用性に整ったサンプルを一貫して得る。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:25:26 GMT)
Bias-Reduced Estimation of Finite Mixtures: An Application to Latent Group Structures in Panel Data [0.0] 本稿では, パラメトリック密度の有限混合の最大推定は, かなりの有限サンプルバイアスを負う可能性があることを示す。
偏見は、非有界または大きな支持を持つ成分密度における外れ値の影響から生じる。
分類混合確率関数の最大化は、標準最大推定値よりもバイアスが少ないパラメータ推定値が得られることを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:10:17 GMT)
Beyond the Vehicle: Cooperative Localization by Fusing Point Clouds for GPS-Challenged Urban Scenarios [0.0] 本稿では,この問題に対処するための協調型マルチセンサとマルチモーダルローカライゼーション手法を提案する。
提案手法は, 協調データとポイントクラウド登録に基づく同時局所化とマッピングアルゴリズムを統合する。
インフラからの共有データを活用することにより,複雑でGPSにうるさい都市シナリオにおける局所化精度とロバスト性を大幅に向上する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 14:47:31 GMT)
Beyond Suffixes: Token Position in GCG Adversarial Attacks on Large Language Models [0.0] 我々は、一般的なGreedy Coordinate Gradient(GCG)攻撃に注目し、ジェイルブレイク攻撃の未発見の攻撃軸を特定する。
ケーススタディとしてGCGを用いて, 接尾辞の代わりに接頭辞を生成するよう攻撃を最適化し, 攻撃成功率に実質的に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 08:53:35 GMT)
BIRDTurk: Adaptation of the BIRD Text-to-SQL Dataset to Turkish [0.0] 我々は、BIRDベンチマークの最初のトルコ適応であるBIRDTurkを紹介する。
BirderTurkは、スキーマ識別子をトルコ語に適応させる制御された翻訳パイプラインによって構築される。
我々は推論に基づくプロンプト、エージェント多段階推論、教師付き微調整を評価する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 15:21:00 GMT)
Autonomous AI Agents for Real-Time Affordable Housing Site Selection: Multi-Objective Reinforcement Learning Under Regulatory Constraints [0.0] AURA(Autonomous Urban Resource Allocator)は、規制の厳しい制約下で、リアルタイムに手頃な住宅地選定を行う階層型マルチエージェント強化学習システムである。
本研究は, アクセシビリティ, 環境影響, 建設コスト, ソーシャルエクイティを最適化する多目的マルコフ決定プロセスとして, 実現可能性を重視しながらタスクをモデル化する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:03:15 GMT)
Automatic Classification of Pedagogical Materials against CS Curriculum Guidelines [0.0] プロの社会は、プログラムがコンテンツを国際標準に合わせるのを助けるためのカリキュラムガイドラインをしばしば発行する。
コンピュータサイエンスでは、主要な標準はACMとIEEEによって公開され、コンピュータサイエンスプログラムに含めるべきものと可能なものに関する詳細なガイドラインを提供する。
プログラム管理者は、CSプログラムによってどの程度のガイドラインがカバーされているかを評価することは困難である。
本稿では,自然言語処理技術を用いて処理を高速化する手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:24:18 GMT)
Aster: Autonomous Scientific Discovery over 20x Faster Than Existing Methods [0.0] AsterはAIエージェントで、既存のフレームワークの20倍以上の速度で操作できる。
反復的にプログラムを改善し、しばしば新しい最先端のパフォーマンスをもたらす。
Asterは、ZAPBenchを除いて、すべてのタスクでSOTAを達成し、計算の1/190未満で、最高のヒューマンソリューションのパフォーマンスにマッチする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 19:01:23 GMT)
Approximate simulation of complex quantum circuits using sparse tensors [0.0] スパーステンソルを用いて量子回路を近似する手法を提案する。
データ構造と収縮アルゴリズムが効率的であることを示し、期待される実行時スケーリングとキュービット数と回路深さを比較検討する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 20:58:32 GMT)
Anomaly Detection via Mean Shift Density Enhancement [0.0] 本稿では,密度駆動多様体の進化に対する幾何学的応答を通じて異常を検出する,完全に教師なしのフレームワークを提案する。
MSDEは、局所密度によって十分に支持されている通常のサンプルが反復密度増強の下で安定であるという原理に基づいている。
MSDEは、AUC-ROC、AUC-PR、Precision@nに対して、いくつかのノイズレベルと、いくつかの種類の異常に対して、一貫して強い、バランスのとれた、堅牢な性能を達成する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:20:56 GMT)
Additive Multi-Step Markov Chains and the Curse of Dimensionality in Large Language Models [0.0] N-次加法的マルコフ鎖を用いた力学の理論的に実現可能な近似を探索する。
この研究の主な成果は、加算多段連鎖とステップワイドメモリ機能を持つ連鎖との対応性を確立することである。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 16:38:26 GMT)
Adaptive Evidence Weighting for Audio-Spatiotemporal Fusion [0.0] 生物音響分類では、音波信号と、位置と季節としての文脈の両方から種識別が推測される。
本稿では,事前学習したテキスト音声分類器と時間的予測器を統合した適応型対数線形エビデンス融合フレームワークFINCHを紹介する。
FINCHは固定重融合とオーディオのみのベースラインを一貫して上回り、堅牢性とエラーのトレードオフを改善している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:21:13 GMT)
Accelerating qubit reset through the Mpemba effect [0.0] We exploit the Mpemba effect, designed indicate the faster cooling of hot systems than cooler which。
本稿では,局所的な単一キュービットコヒーレンスを高速にデカイするグローバルな2キュービットコヒーレンスに変換する,単一の絡み合った2キュービットゲートに基づく単純なプロトコルを提案する。
現実的なパラメータでは、標準のパッシブリセットと比較して、我々のプロトコルはリセット時間を最大50%削減できる。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 17:26:46 GMT)
A vector logic for intensional formal semantics [0.0] 形式的意味論と分布的意味論は言語的意味に対する異なるアプローチである。
本稿では,これらのフレームワークが,強勢意味論と構造的に互換性があることを実証する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 00:24:37 GMT)
A Unified Categorical Description of Quantum Hall Hierarchy and Anyon Superconductivity [0.0] 量子ホール階層構築のための統一された圏論的枠組みと超伝導について述べる。
本フレームワークは,フィールド理論解析から得られたすべての既知の超伝導体を再現する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 18:59:57 GMT)
A Novel approach to portfolio construction [0.0] 本稿では,資産選択とポートフォリオ構築のための機械学習ベースのフレームワークを提案する。
BPASGM(Best-Path Algorithm Sparse Graphical Model)と呼ばれる。
モンテカルロシミュレーションでは、BPASGMベースのポートフォリオはより安定したリスク-リターンプロファイル、実現されたボラティリティの低減、リスク調整性能の向上を実現している。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 09:52:06 GMT)
A Minimal Task Reveals Emergent Path Integration and Object-Location Binding in a Predictive Sequence Model [0.0] 行動条件付き逐次予測は「世界モデル」を学習するのに十分であることを示す。
我々は、現在の入力とササードのような変位から次のトークンを予測するために、リカレントニューラルネットワークを訓練する。
復号化解析は、トークンアイデンティティの位置への経路統合と動的結合を明らかにする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:08:27 GMT)
A Function-Space Stability Boundary for Generalization in Interpolating Learning Systems [0.0] 我々は,関数空間軌道としてのトレーニングをモデル化し,この軌道に沿った単一サンプル摂動に対する感度を測定する。
小さい証明は安定性に基づく一般化を暗示するが、小さなリスクを持つ補間体制が存在することも証明する。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 13:31:12 GMT)
A Consensus-Bayesian Framework for Detecting Malicious Activity in Enterprise Directory Access Graphs [0.0] 本研究は,ディレクトリアクセスグラフにおける悪意のあるユーザ動作を検出するための,コンセンサスに基づくベイズフレームワークを提案する。
マルチレベルインタラクショングラフ内で,ディレクトリをトピックとして,ユーザをエージェントとしてモデル化することにより,影響重み付けされた意見ダイナミクスを用いたアクセス進化をシミュレートする。
論文参考訳(メタデータ) (Tue, 03 Feb 2026 21:33:22 GMT)