Reasoning-Based Personalized Generation for Users with Sparse Data [120.9] スパースコンテキスト下でパーソナライズされたテキスト生成を強化する新しいフレームワークであるGraSPerを紹介する。
GraSPerは、ユーザが将来的に対話する可能性のあるアイテムを予測することで、ユーザコンテキストを初めて強化する。
推論アライメントによって、これらのインタラクションのためのテキストを生成して、拡張されたコンテキストを豊かにする。
最終的に、実際の履歴と合成履歴の両方に基づいて、パーソナライズされた出力を生成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:54:23 GMT)
CoEditor++: Instruction-based Visual Editing via Cognitive Reasoning [99.0] CoEditor++は、編集を"編集する方法"と"編集方法"に分解する、トレーニング不要のフレームワークである。
我々は,CoEditor++が編集タスクと編集タスクの両方において,最先端のパフォーマンスを実現することを示す。
以上の結果から,認知中心型画像編集の可能性が示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:20:46 GMT)
Adaptive Ability Decomposing for Unlocking Large Reasoning Model Effective Reinforcement Learning [82.9] A$2$Dは、検証可能な報酬による強化学習の有効性を高めるための適応能力分解手法である。
まず、蒸留なしでRLVRを介して分解器を訓練し、複雑な質問を単純なサブクエストの集合に分解する。
次に、このデコンパイラを使用して、トレーニングデータセットの各質問に対するサブクエストをアノテートし、サブクエストガイダンスを用いてRLVR下での推論をトレーニングする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:48:23 GMT)
RGBX-R1: Visual Modality Chain-of-Thought Guided Reinforcement Learning for Multimodal Grounding [70.0] MLLM(Multimodal Large Language Models)は主にRGBモダリティに基づいて事前訓練されている。
RGBX-R1はMLLMの知覚と推論能力を高めるためのフレームワークである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:13:57 GMT)
Dual Latent Memory for Visual Multi-agent System [69.3] Visual Multi-Agent Systems (VMAS)は、エージェント間のコラボレーションを通じて包括的な能力を強化することを約束する。
増量剤は、指数関数的にトークンコストを膨らませながら、しばしば性能を低下させる。
L$2$-VMASは,2つの潜在記憶を用いたエージェント間コラボレーションを実現する新しいモデルに依存しないフレームワークである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:49:10 GMT)
Direct Preference Optimization with Rating Information: Practical Algorithms and Provable Gains [67.7] 評価ギャップの形で追加情報を活用するアルゴリズムを設計する方法について検討する。
精度の高いレーティングギャップ情報が存在する場合,DPOよりも高速な統計的レートを実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:38:21 GMT)
DuoGen: Towards General Purpose Interleaved Multimodal Generation [65.1] DuoGenは汎用的なインターリーブ生成フレームワークで、データキュレーション、アーキテクチャ設計、評価に対処する。
我々は、キュレートされた生のWebサイトから書き直されたマルチモーダルな会話を組み合わせることで、大規模で高品質な命令チューニングデータセットを構築する。
2段階の切り離し戦略はまずMLLMをインストラクションチューニングし、次にインターリーブされた画像テキストシーケンスを使用してDiTをアライメントする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:35:15 GMT)
Replacing Parameters with Preferences: Federated Alignment of Heterogeneous Vision-Language Models [63.7] パラメータを好みに置き換えることは、よりスケーラブルでプライバシに保護される未来を表している、と私たちは主張する。
ヘテロジニアスVLMのためのGRPOとMixture-of-Rewardsを用いた協調アライメントフレームワークであるMoRを提案する。
MoRは、一般化、堅牢性、およびクロスクライアント適応性において、連邦化されたアライメントベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:11:51 GMT)
UniMorphGrasp: Diffusion Model with Morphology-Awareness for Cross-Embodiment Dexterous Grasp Generation [63.1] クロス・エボディメント・グルーピングは、異種キネマティック構造を持つロボットハンドに対して、安定かつ多様なグルーピングを生成することを目的としている。
ハンドモーフィック情報をグリップ生成プロセスに組み込んだ拡散型フレームワークである textbfUniMorphGrasp を提案する。
UniMorphGraspは、既存のデクスタラスグリップベンチマークで最先端のパフォーマンスを達成し、以前は目に見えない手の構造に対して強力なゼロショットの一般化を示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:56:16 GMT)
APR: Penalizing Structural Redundancy in Large Reasoning Models via Anchor-based Process Rewards [61.5] テスト時間スケーリング(TTS)は、Large Reasoning Models(LRM)の機能を大幅に強化した。
我々は, LRM が推論過程において最終回答を得た後も, 再検討なしに反復的自己検証を頻繁に行うことを観察した。
本稿では,Anchor-based Process Reward (APR)を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:53:20 GMT)
CURP: Codebook-based Continuous User Representation for Personalized Generation with LLMs [60.9] 双方向ユーザエンコーダと離散プロトタイプコードブックを用いて,多次元ユーザ特性を抽出する新しいフレームワークCURPを提案する。
この設計により、少数のトレーニング可能なパラメータでプラグアンドプレイのパーソナライズが可能となる。
CURPは,強いベースラインに比べて優れた性能と一般化を実現していることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:13:06 GMT)
Data Distribution as a Lever for Guiding Optimizers Toward Superior Generalization in LLMs [60.7] はじめに、単純さのバイアスが小さくなれば、より良い一般化がもたらされることを示す。
この知見に触発されて、訓練後のサンプルのアップサンプリングや強化によるトレーニングデータ分布がSBを減少させ、一般化の改善につながることを示す。
我々はPhi2-2.7B, Llama3.2-1B, Gemma3-1B-PT, Qwen3-0.6B-Base など複数の言語モデルの性能向上を図る。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:40:36 GMT)
UniMotion: A Unified Motion Framework for Simulation, Prediction and Planning [60.6] 動作タスク間の共有構造をキャプチャする統合モーションフレームワークUniMotionを提案する。
UniMotionは、これらの動作タスクを同時にサポートするために、専用のインタラクションモードと調整されたトレーニング戦略を採用している。
さらなる微調整により、UniMotionはさまざまな動作タスクにおける最先端のパフォーマンスを達成し、自動運転のための汎用的でスケーラブルなソリューションとして確立する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:12:26 GMT)
Towards Interpretable Hallucination Analysis and Mitigation in LVLMs via Contrastive Neuron Steering [60.2] 既存の緩和法は主に出力レベルの調整に重点を置いており、幻覚を引き起こす内部メカニズムはほとんど探索されていない。
クリーン入力とノイズ入力のコントラスト解析により画像特異的ニューロンを識別するコントラスト性ニューロンステアリング(CNS)を提案する。
CNSは摂動によって引き起こされる活性化を抑えつつ情報伝達ニューロンを選択的に増幅し、より堅牢でセマンティックな視覚表現を生み出す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:21:04 GMT)
Spectral Imbalance Causes Forgetting in Low-Rank Continual Adaptation [58.4] 継続的な学習は、事前訓練されたモデルを、以前取得した知識を忘れずにシーケンシャルなタスクに適応することを目的としている。
既存のほとんどのアプローチは、現在のタスク固有の更新が以前取得した知識を自然に保存するプロパティを考慮せずに、継続的な学習を過去の更新への干渉を避けるものとして扱う。
本稿では,視覚言語モデルで使用される標準深度ドットと互換性のある一階述語法を用いてこの問題に対処する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:27:02 GMT)
Any3D-VLA: Enhancing VLA Robustness via Diverse Point Clouds [57.0] 我々は、異なる観測空間と視覚的表現をまたいだパイロット研究を行う。
その結果、視覚的入力を点雲に明示的に持ち上げることで、対応する2次元表現をより補完する表現が得られることがわかった。
本稿では,(1)3次元データの不足,(2)環境横断差と奥行き偏差による領域ギャップの解消という課題に対処するAny3D-VLAを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:34:52 GMT)
Towards Sample-Efficient and Stable Reinforcement Learning for LLM-based Recommendation [56.9] Long Chain-of-Thought (Long CoT)推論は、Large Language Models (LLMs)において有望であることを示している。
我々はLong CoTが本質的にシーケンシャルなレコメンデーションドメインに不適合であると主張している。
提案するRISER(Reinforced Item Space Exploration framework for Recommendation)を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:02:43 GMT)
Deep Time-series Forecasting Needs Kernelized Moment Balancing [56.6] 深層時系列予測は、予測と地上の真実の分布を整合させることを目的とした分布バランス問題として定式化することができる。
我々は、カーネル化されたモーメントバランス(KMB-DF)による直接予測を提案する。
複数のモデルとデータセットにわたる実験により、KMB-DFは予測精度を一貫して改善し、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:20:18 GMT)
VTC-R1: Vision-Text Compression for Efficient Long-Context Reasoning [55.2] 長いコンテキスト推論は、複雑なタスクに対処するために大きな言語モデル(LLM)を著しく強化した。
本稿では,視覚テキスト圧縮を推論プロセスに統合した新しい効率的な推論パラダイムであるVTC-R1を提案する。
このアプローチは推論効率を大幅に改善し、エンドツーエンドのレイテンシで2.7倍の高速化を実現します。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:47:11 GMT)
Self-Guard: Defending Large Reasoning Models via enhanced self-reflection [54.8] Self-Guardは、大規模推論モデルのための軽量な安全防御フレームワークである。
これは認識とコンプライアンスのギャップを埋め、モデルユーティリティを損なうことなく堅牢な安全性能を達成する。
セルフガードは、さまざまな未知のリスクとさまざまなモデルスケールにまたがる強力な一般化を示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:06:11 GMT)
Learning Abstractions for Hierarchical Planning in Program-Synthesis Agents [54.7] 人間は抽象化を学び、それらを効率的に計画し、タスクをまたいで迅速に一般化する。
我々は,再利用可能な抽象化を積極的に学習する新しい大規模言語モデル (LLM) エージェントである TheoryCoder-2 を紹介する。
我々は,BabyAI,Minihack,SokobanのようなVGDLゲームなど,さまざまな環境で実験を行っている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 23:01:51 GMT)
DVLA-RL: Dual-Level Vision-Language Alignment with Reinforcement Learning Gating for Few-Shot Learning [53.4] 少数のサンプルしか持たない新しいカテゴリーに一般化することを目的としている。
最近のアプローチでは、クラス名から派生したセマンティックな埋め込みで視覚表現を豊かにするために、大きな言語モデルが組み込まれている。
強化学習ゲーティング(DVLA-RL)を用いたデュアルレベル視覚言語アライメントを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:09:37 GMT)
How Far Are LLMs from Professional Poker Players? Revisiting Game-Theoretic Reasoning with Agentic Tool Use [52.4] 大規模言語モデル(LLMs)は、ハイテイクなドメインにますます適用されています。
LLMは従来のアルゴリズムと競合しない。
ツール統合推論フレームワークであるToolPokerを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:45:25 GMT)
Riemannian Flow Matching for Disentangled Graph Domain Adaptation [52.0] グラフドメイン適応(GDA)は典型的には、ユークリッド空間におけるグラフ埋め込みの整列に逆学習を使用する。
DisRFMは、埋め込みとフローベースのトランスポートを統一する幾何学的なGDAフレームワークである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:05:35 GMT)
AIRE-Prune: Asymptotic Impulse-Response Energy for State Pruning in State Space Models [51.9] AIRE-Pruneは、状態空間モデル(SSM)の訓練後プルーニング手法である
長期出力エネルギー歪みを直接最小化することで、各層の状態次元を小さくする。
様々なベンチマークで、AIRE-Prune は SISO と SSM にかなりの冗長性を示し、平均プルーニングは60.8%、平均精度は0.29%低下するが、再トレーニングは行わない。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:03:43 GMT)
LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [51.3] 我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:18:32 GMT)
Language-based Trial and Error Falls Behind in the Era of Experience [50.5] 大きな言語モデル(LLM)は、言語ベースのエージェントタスクでは優れているが、見つからない非言語環境への適用性は依然として限られている。
本研究では,探索の禁止コストが主なボトルネックであることを示す。
セマンティック・エクスプロイトから探索を分離する新しいフレームワークであるSCOUTを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:31:41 GMT)
Reasoning as State Transition: A Representational Analysis of Reasoning Evolution in Large Language Models [50.4] モデルの内部状態の力学を研究するために,表現的視点を導入する。
トレーニング後、静的な初期表現品質が限られた改善しか得られないことが判明した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:23:33 GMT)
Improving Minimax Estimation Rates for Contaminated Mixture of Multinomial Logistic Experts via Expert Heterogeneity [49.8] 凍結したエキスパートとして機能する事前訓練されたモデルを、新しいタスクを学ぶためにトレーニング可能なエキスパートとして機能するアダプタモデルに統合するトランスファー学習手法によって、汚染された専門家の混合(MoE)が動機付けられる。
本研究は, 地絡パラメータがサンプルサイズによって異なる困難な条件下で, パラメータを推定するための一様収束率を特徴付ける。
また、対応するミニマックス下限を定め、これらのレートがミニマックス最適であることを保証する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 23:45:50 GMT)
Harmful Overfitting in Sobolev Spaces [49.5] ソボレフ空間$Wk, p(mathbbRd)$における関数の一般化挙動を、ノイズの多いトレーニングデータセットに完全に適合するものとして研究する。
約ノルム最小化補間器は、滑らかさバイアスによって選択される正準解であり、有害なオーバーフィッティングを示す。
我々の証明では,ソボレフの不等式を用いたトレーニングデータの有害な近傍を同定する幾何学的議論を用いている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:40:56 GMT)
EchoReview: Learning Peer Review from the Echoes of Scientific Citations [48.9] EchoReviewは引用コンテキスト駆動のデータ合成フレームワークである。
科学界の長期的な判断を構造化されたレビュースタイルのデータに変換する。
これは、エビデンスのサポートや包括的なレビューのような中核的なレビューの側面において、大きく安定した改善を達成できます。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:55:38 GMT)
CE-RM: A Pointwise Generative Reward Model Optimized via Two-Stage Rollout and Unified Criteria [48.7] 専用の2段階ロールアウト法を用いて学習したポイントワイズ生成報酬モデルCE-RM-4Bを提案する。
オープンソースの選好データセットから算出した約5.7Kの高品質データを用いて、CE-RM-4Bは様々な報奨モデルベンチマークにおいて優れた性能を実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:28:48 GMT)
GLAD: Generative Language-Assisted Visual Tracking for Low-Semantic Templates [48.7] 視覚言語追跡は多くのシナリオで注目を集めている。
現在の視覚言語トラッカーは通常、テンプレート、検索、テキスト機能のインタラクティブな統合にTransformerアーキテクチャを使用する。
本稿では,テキスト記述とテンプレート画像の多モード融合のための拡散モデルを用いたジェネレーティブ言語・アシステD追跡モデルGLADを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:24:56 GMT)
JTok: On Token Embedding as another Axis of Scaling Law via Joint Token Self-modulation [46.6] 補助埋め込みテーブルから得られる変調ベクトルを用いてトランスフォーマー層を拡大するジョイント・トケン(JTok)とジョイント・トケン(JTok-M)の混合を導入する。
これらのベクトルは、軽量な要素演算によってバックボーンを変調し、無視可能なFLOPのオーバーヘッドを発生させる。
我々のアプローチは、検証損失を継続的に減らし、ダウンストリームタスクのパフォーマンスを大幅に改善します。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:15:18 GMT)
Physics-informed Diffusion Generation for Geomagnetic Map Interpolation [46.2] 不完全な地磁気マップを補間する物理インフォームド拡散生成フレームワークを提案する。
まず,局所受容場に基づく拡散生成過程を導出する物理インフォームドマスク戦略を設計する。
第2に、地磁気マップのクリグ原理に従って、拡散生成結果に物理インフォームド制約を課す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:10:47 GMT)
S$^3$POT: Contrast-Driven Face Occlusion Segmentation via Self-Supervised Prompt Learning [46.1] S$3$POTは、自己教師付き空間的プロンプトによる顔生成を相乗化するためのコントラスト駆動型フレームワークである。
特に、S$3$POTは、参照生成、機能拡張、Prompt Selectionの3つのモジュールで構成されている。
専用のデータセットの実験では、S$3$POTの優れたパフォーマンスと各モジュールの有効性が示されている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:05:13 GMT)
Cross-Modal Memory Compression for Efficient Multi-Agent Debate [46.0] マルチエージェントの議論は推論の質を改善し、幻覚を減少させるが、議論のラウンドやエージェント数の増加とともに急速に増大する。
DebateOCRは、長いテキストの議論トレースをコンパクトな画像表現に置き換えるクロスモーダル圧縮フレームワークである。
この設計では、一般に数万から数十万のトークンにまたがる履歴を圧縮し、入力トークンを92%以上削減し、計算コストを大幅に削減し、推論を高速化する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:02:26 GMT)
Deterministic Zeroth-Order Mirror Descent via Vector Fields with A Posteriori Certification [45.9] 我々は、勾配を一般的なベクトル場に置き換えることで、決定論的ゼロ階ミラー降下フレームワークを開発する。
我々の分析は、最終段階の不等式評価のための評価テンプレートを提供する。
これらの結果は、ブレグマンのアイデンティティ、決定論的証明、およびゼロ階ミラー降下におけるロバストな円錐幾何学を隠蔽した幾何学的リンクを明らかにする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:05:05 GMT)
LocalV: Exploiting Information Locality for IP-level Verilog Generation [45.8] レジスター・トランスファー・レベル(RTL)コードの生成は、デジタルハードウェア設計において不可欠だが労働集約的なステップである。
既存のアプローチには、細調整されたドメイン固有モデルと高度なエージェントベースのシステムストラグルが含まれ、産業用IPレベルの設計タスクにスケールする。
モジュールハードウェア設計における情報局所性を活用するマルチエージェントフレームワークであるLocalVを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:01:16 GMT)
Text is All You Need for Vision-Language Model Jailbreaking [45.5] 我々は,新しい脱獄攻撃であるText-DJを導入し,モデルの安全保護を回避した。
画像グリッドとしてLVLMにサブクエリとトラクションクエリを同時に提示する。
本手法は, 最先端のLVLMの安全アライメントを回避できることを実証する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:17:56 GMT)
When Agents "Misremember" Collectively: Exploring the Mandela Effect in LLM-based Multi-Agent Systems [45.3] マンデラ効果(英: Mandela effect)は、社会的影響と内在的な誤情報によって強化された虚偽の詳細の結果、集団的に過去の出来事を誤記憶する現象である。
この脆弱性は、マルチエージェントシステムにおけるメモリバイアスの理解を制限し、誤情報の潜在的な拡散に関する倫理的懸念を提起する。
我々は,この効果を緩和する戦略を提案し,即時防御とモデルレベルのアライメントに基づく防御を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:47:46 GMT)
MAGNET: Towards Adaptive GUI Agents with Memory-Driven Knowledge Evolution [44.9] 大きなファンデーションモデルを利用したモバイルエージェントは、自律的なタスク実行を可能にするが、頻繁な更新によって、過去のデータでトレーニングされたエージェントが失敗する。
本稿では、メモリ駆動型適応エージェントフレームワークであるMAGNETを紹介する。
オンラインベンチマーク AndroidWorldの評価では、ベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:17:38 GMT)
Learning to Decode Against Compositional Hallucination in Video Multimodal Large Language Models [44.8] ビデオマルチモーダル大言語モデル(VLLM)における孤立幻覚と構成幻覚の両方を評価するためのベンチマークであるOmniVCHallを紹介する。
3方向キャリブレーション機構を備えたコントラストデコーディングフレームワークであるTriCDを提案する。
実験の結果,TriCDは2つの代表的なバックボーンで連続的に性能を向上し,平均精度が10%以上向上した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:50:43 GMT)
TraceRouter: Robust Safety for Large Foundation Models via Path-Level Intervention [44.6] 有害なセマンティクスは分散層間回路として機能し、局所的な介入が不安定で実用性に有害である。
我々は,不特定意味論の因果伝播回路をトレースし,切断するパスレベルフレームワークである textbfTrace を提案する。
トレースは最先端のベースラインを著しく上回り、敵の堅牢性と汎用性とのトレードオフが優れている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:26:24 GMT)
Exploring Information Seeking Agent Consolidation [44.5] 既存の情報検索エージェントは一般にオープンウェブ、文書、あるいはローカルな知識ベースに特化している。
本研究では,異種情報探索エージェントを単一の基礎エージェントモデルに統合する方法について検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:59:31 GMT)
Factuality on Demand: Controlling the Factuality-Informativeness Trade-off in Text Generation [44.5] 提案するFactality-Controlled Generation (FCG) は,ユーザがクエリと並行してファクトリティ制約を指定できるフレームワークである。
また,本研究の総合学習は,実感要求を尊重し,生産物の情報性を維持することによって,モデルの能力を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:22:24 GMT)
HSI-VAR: Rethinking Hyperspectral Restoration through Spatial-Spectral Visual Autoregression [43.9] ハイパースペクトル画像(HSI)は、よりリッチな空間スペクトル情報をRGBを超えてキャプチャする。
現実のHSIは、ノイズ、ブラー、バンドの欠如など、複合的な劣化に悩まされることが多い。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:30:05 GMT)
Unifying Adversarial Robustness and Training Across Text Scoring Models [43.7] 言語モデルにおける敵対的堅牢性の研究は、現在、アプリケーションとアタックの間で断片化されている。
本稿では,高密度検索器,リランカ,報酬モデルにまたがるテキストスコアリングモデルにおいて,対向的堅牢性の研究を統合することを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:41:04 GMT)
Physiology as Language: Translating Respiration to Sleep EEG [43.0] 本稿では,呼吸信号から睡眠脳波(EEG)を合成するクロス生理学的翻訳タスクを紹介する。
離散トークン化により脳波の標的空間を制約しながら、微細な呼吸動態を保ちながら波形条件生成フレームワークを提案する。
脳波スペクトログラム再構成では,28,000人以上の被験者を対象に,平均絶対誤差を7%以上達成している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:44:45 GMT)
Towards a Cognitive-Support Tool for Threat Hunters [43.0] サイバーセキュリティは、敵の行動を積極的に特定するために脅威ハンターに依存している。
脅威狩りの根底にある認知的作業は、既存のツールによって過小評価され、あるいは不十分に支持されている。
本稿では、脅威ハンターが推論を外部化できるようにすることにより、設計提案を運用するプロトタイプツールを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:02:58 GMT)
Towards Building Non-Fine-Tunable Foundation Models [41.9] オープンソース基盤モデル(FM)は、幅広い再利用を可能にすると同時に、モデルトレーナーを経済的・安全リスクに晒す。
PMP(Private Mask Pre-Training)は,表現学習をスパースサブネットワークに集約する事前学習フレームワークである。
これにより、マスクにアクセスせずに未許可の微調整を行い、事前訓練されたサブスペースとミスマッチしたパラメータを更新する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:40:37 GMT)
Strong Linear Baselines Strike Back: Closed-Form Linear Models as Gaussian Process Conditional Density Estimators for TSAD [41.1] 本研究は,OLS回帰法により得られる閉形式解を用いた単純な線形自己回帰異常スコアが,最先端の深部検出器と一貫して一致し,より優れることを示す。
理論的な観点から、線形モデルは、有限歴史ガウス過程条件密度を推定し、幅広い種類の異常型を捉えていることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:35:51 GMT)
A General Model for Retinal Segmentation and Quantification [41.0] 眼底イメージングのための一般的な網膜分画および定量化フレームワークであるRetSAMについて述べる。
堅牢なマルチターゲットセグメンテーションと標準化されたバイオマーカー抽出を提供し、下流眼科研究と眼科相関分析を支援している。
その結果得られたバイオマーカーは、糖尿病網膜症、加齢に伴う黄斑変性、緑内障、近視など、主要な眼科疾患の体系的な相関解析を可能にする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:24:02 GMT)
Relaxed Triangle Inequality for Kullback-Leibler Divergence Between Multivariate Gaussian Distributions [40.9] Kullback-Leibler (KL) の発散は適切な計量ではなく、三角形の不等式を満たすものではない。
KL(mathcalN1), MathcalN_3)$の上限と、上限が達成可能な条件を与える。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:28:44 GMT)
LatentLens: Revealing Highly Interpretable Visual Tokens in LLMs [40.1] 自然言語による記述に潜在表現をマッピングするための新しいアプローチであるLatentLensを紹介する。
本手法を10種類の視覚言語モデル(VLM)で評価する。
本研究では,LatentLensが生成した記述が意味論的に意味を持ち,人間に対してより微細な解釈を提供することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:33:07 GMT)
Segment-Level Attribution for Selective Learning of Long Reasoning Traces [39.9] 本稿では,高い帰属力を持つが適度な一貫性を持つ重要なセグメントを特定するためのセグメントレベル選択学習フレームワークを提案する。
提案手法は精度と出力効率を向上し、長い推論トレースからより効果的な学習を可能にする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:29:24 GMT)
Parallel Stochastic Gradient-Based Planning for World Models [39.7] 本稿では,学習した世界モデルの識別性を有効に活用する,堅牢で並列性の高いプランナを提案する。
本手法は,ソフトダイナミックス制約による最適化変数(仮想状態)として状態を扱い,並列かつ容易な最適化を実現する。
我々のプランナーはGRASP(GradAxed Planner)と呼ばれ、非凝縮またはコロケーションベースの最適コントローラの有効なバージョンと見なすことができる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:57:47 GMT)
IceBench-S2S: A Benchmark of Deep Learning for Challenging Subseasonal-to-Seasonal Daily Arctic Sea Ice Forecasting in Deep Latent Space [39.5] 人工知能の最近の進歩は、データ駆動型パン・アーキティック海氷予測システムの開発を促進する。
我々は,180日間連続して北極海氷濃度を予測することの難しさを緩和するために,DLアプローチを評価するための最初の総合的なベンチマークであるIceBench-S2Sを紹介する。
IceBench-S2Sは、異なるバックボーンのための統一的なトレーニングと評価パイプラインを提供し、極地環境監視タスクにおけるモデル選択の実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:40:16 GMT)
From Pixels to Facts (Pix2Fact): Benchmarking Multi-Hop Reasoning for Fine-Grained Visual Fact Checking [39.5] Pix2Factには、毎日8つのシナリオと状況にまたがる1,000の高解像度(4K+)イメージが含まれている。
各質問には、詳細なビジュアルグラウンド、マルチホップ推論、そして答える外部知識の統合が必要である。
最も高度なモデルは平均24.0%の精度しか達成していないが、人間のパフォーマンスは56%とは対照的である。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:18:34 GMT)
Alignment of Diffusion Model and Flow Matching for Text-to-Image Generation [39.5] 拡散モデルとフローマッチングは、テキスト・画像生成において顕著な成功を収めた。
本稿では,アライメント問題の根底にある性質を活用することで,新しいアライメントフレームワークを提案する。
計算コストを60%以上削減した1ステップ生成のファインタニングモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:06:55 GMT)
Learning Modal-Mixed Chain-of-Thought Reasoning with Latent Embeddings [39.5] 我々は、多モーダル推論をよりうまく扱うために、言語を超えてチェーン・オブ・シント(CoT)を拡張する方法について研究する。
テキストトークンをラテント埋め込みとして表現したコンパクトなビジュアルスケッチでインターリーブするモードミックスCoTを提案する。
我々の手法は言語のみの手法や他のCoT手法よりも優れた性能が得られる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:36:38 GMT)
ExperienceWeaver: Optimizing Small-sample Experience Learning for LLM-based Clinical Text Improvement [39.2] ExperienceWeaverは、データ検索から経験学習へと焦点を移す階層的なフレームワークである。
ノイズの多い多次元フィードバックを構造化された実行可能な知識に蒸留する。
パフォーマンスを継続的に改善し、Gemini-3 Proのような最先端のモデルを小さなサンプル設定で上回っている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:12:05 GMT)
DECEIVE-AFC: Adversarial Claim Attacks against Search-Enabled LLM-based Fact-Checking Systems [38.7] 本研究では,現実的な入力のみの脅威モデルの下で,検索可能なファクトチェックシステムに対する敵対的クレーム攻撃について検討する。
本稿では,新たなクレームレベルのアタック戦略と,敵クレームのアタック評価原則を統合するエージェントベースのアタックフレームワークであるDECEIVE-AFCを提案する。
我々の攻撃は、検証性能を著しく低下させ、精度を78.7%から53.7%に下げ、既存のクレームベースの攻撃ベースラインを強力なクロスシステム転送性で大幅に上回った。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:49:23 GMT)
OpenDDI: A Comprehensive Benchmark for DDI Prediction [38.2] 薬物と薬物の相互作用(DDI)は治療効果と患者の安全性に大きな影響を及ぼす。
ほとんどの研究は、小規模のDDIデータセットと単一モーダルな薬物表現に依存している。
DDI予測のための総合的なベンチマークであるOpenDDIを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:09:52 GMT)
Factored Reasoning with Inner Speech and Persistent Memory for Evidence-Grounded Human-Robot Interaction [38.1] 本稿では,対話を部分的に観察可能なマルコフ決定プロセスとしてモデル化する支援ロボットの認知アーキテクチャであるJANUSを紹介する。
Janusは、全体的な振る舞いを、スコープ検出、意図認識、メモリ、内的音声、クエリ生成、外的音声に関連する特別なモジュールに分解する。
我々は、知識グラフに基づく食事補助ドメインにおけるモジュールレベルのユニットテストを通じてJANUSを評価し、キュレートされた参照と実際の遅延プロファイルとの高い一致を報告した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:42:33 GMT)
Learning More from Less: Unlocking Internal Representations for Benchmark Compression [37.7] 異種隠蔽状態を統一潜在空間に整列させて代表コアセットを構成するREPCOREを導入する。
5つのベンチマークと200以上のモデルの実験は、ランキングの相関と推定精度において、出力ベースラインよりも一貫した利得を示している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:11:39 GMT)
Environment-Aware Adaptive Pruning with Interleaved Inference Orchestration for Vision-Language-Action Models [37.5] 本研究では,ビジョン・ランゲージ・アクション(VLA)ロボットのためのトレーニングフリーでプラグアンドプレイ適応型プルーニングフレームワークであるEcoVLAを提案する。
EcoVLAには、EAP(Environment-Aware Adaptive Pruning)とInterleaved Inference Orchestration(I2O$)の2つのコンポーネントがある。
EAPは、物理的環境の時間的一貫性を組み込んだ軽量な適応チャネルプルーニング手法であり、空間パターンを更新する。
I2O$は、VLA推論に固有のFLOPバブルを活用して、プルーニングメソッドを並列にスケジュールし、レイテンシに無視できない影響を確実にする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:44:07 GMT)
Do Latent-CoT Models Think Step-by-Step? A Mechanistic Study on Sequential Reasoning Tasks [37.2] Latent Chain-of-Thought (Latent-CoT) は、長い論理を出力することなくステップバイステップの計算を可能にすることを目的としている。
本研究では, 連続的思考型教師学生蒸留モデルであるCODIについて, 厳密なシーケンシャル・イット・タスクについて検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:48:23 GMT)
Higher-order transformations of bidirectional quantum processes [37.1] 双方向デバイスは、入出力ポートの役割を交換できるデバイスである。
近年、量子デバイスは、原理的には、一定の入力出力方向と互換性のない方法で使用できることが示されている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:39:36 GMT)
PS$^2$: Parameterized Control for Fine-Grained Student Proficiency Simulation [37.1] 学生シミュレーション (PS$2$) は、教師なしおよびパラメータ化されたモデルレベルのフレームワークであり、異なる習熟度を持つ生徒をシミュレートする。
PS$2$は、既存のベースラインに比べて細粒度で一貫した習熟度シミュレーションを実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:27:56 GMT)
Augmenting Clinical Decision-Making with an Interactive and Interpretable AI Copilot: A Real-World User Study with Clinicians in Nephrology and Obstetrics [37.0] 共同臨床意思決定のための対話型・解釈可能なAIコラボロであるAICareについて紹介する。
縦断的な電子健康記録を解析することにより、AICareは動的リスク予測を精査可能な可視化に基礎を置いている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:41:32 GMT)
Can Vision-Language Models Handle Long-Context Code? An Empirical Study on Visual Compression [36.8] LongCodeOCRは視覚言語モデル(VLM)のためのビジュアル圧縮フレームワークである
グローバルビューを保存することで、このアプローチはフィルタリングに固有の依存性の破損を避けることができる。
この結果から,視覚的なコード圧縮が,世界的理解を必要とするタスクの代替手段として有効であることが示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:23:51 GMT)
Beyond Output Critique: Self-Correction via Task Distillation [36.4] 本稿では,ソリューションの洗練に先立ってタスク抽象化の中間段階を導入するフレームワークを提案する。
入力と初期応答が与えられた後、モデルはまず、主要な変数、制約、問題構造をキャプチャする構造化テンプレートにタスクを蒸留する。
この抽象化により、解のインスタンス化が導かれ、タスクのより明確な理解において、その後の応答がグラウンド化される。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:15:41 GMT)
QuantLRM: Quantization of Large Reasoning Models via Fine-Tuning Signals [36.2] 推論インセンティブ付き微調整における重み更新の規模は,大規模推論モデルの定量化に有用な信号となるかを検討する。
我々は、微調整信号によるLRMの重み量子化のためのQuantLRMを紹介する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:19:20 GMT)
Audio-to-Image Bird Species Retrieval without Audio-Image Pairs via Text Distillation [34.7] 本稿では,音声画像の監視を伴わない音声画像検索を実現するための,シンプルでデータ効率のよい手法を提案する。
我々は,事前学習された画像テキストモデルのテキスト埋め込み空間を,その音声エンコーダを対照的な目的で微調整することにより,事前学習されたオーディオテキストモデル(BioLingual)に蒸留する。
複数のバイオアコースティック・ベンチマークで結果のモデルを評価する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:55:54 GMT)
Vectra: A New Metric, Dataset, and Model for Visual Quality Assessment in E-Commerce In-Image Machine Translation [34.4] In-Image Machine Translation (IIMT) は、国境を越えたeコマース商品の一覧を提供する。
現在の参照ベースの手法(例えば、SSIM、FID)は、コンテキスト依存の製品イメージに直面する際の説明責任を欠いている。
Vectraは、MLLMによる視覚的品質評価フレームワークとしては初めての、参照なしのビジュアル品質評価フレームワークです。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:33:08 GMT)
Rethinking Zero-Shot Time Series Classification: From Task-specific Classifiers to In-Context Inference [34.2] 我々は、ラベル付きトレーニングセットをコンテキストとして扱い、単一のフォワードパスで全てのテストインスタンスのラベルを予測する、コンテキスト内学習フレームワークTIC-FMを提案する。
TIC-FMは、時系列エンコーダとスプリットメイク潜在メモリ変換器を備えた軽量プロジェクションアダプタをペアリングする。
128のUCRデータセットに対する実験は、極低ラベルの状況で一貫した利得で、強い精度を示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:17:45 GMT)
Reward Shaping for Inference-Time Alignment: A Stackelberg Game Perspective [33.4] 簡単な報酬形成手法が最適報酬モデルに効果的に近似できることを示す。
提案手法は平均報酬を継続的に改善し,評価設定の平均値に対して66%以上の利得率を達成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:45:51 GMT)
TransNormal: Dense Visual Semantics for Diffusion-based Transparent Object Normal Estimation [33.2] 単段階の正規回帰に事前学習した拡散前処理を適応させるフレームワークであるTransNormalを提案する。
透明な表面におけるテクスチャの欠如に対処するため、TransNormalはDINOv3から密集した視覚的セマンティクスを統合する。
本稿では,トランスノーマル・シンセティック(TransNormal-Synthetic)について紹介する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:11:07 GMT)
Inject Once Survive Later: Backdooring Vision-Language-Action Models to Persist Through Downstream Fine-tuning [31.7] VLA(Vision-Language-Action)モデルは、現代のAIシステムの基礎となっている。
近年,VLAモデルにバックドアを注入する手法が提案されている。
VLAベースモデルのための最初のバックドアアタックフレームワークであるINFUSEを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:59:07 GMT)
MAU-GPT: Enhancing Multi-type Industrial Anomaly Understanding via Anomaly-aware and Generalist Experts Adaptation [31.6] マルチタイプ産業異常理解のための包括的データセットであるMAU-Setを紹介する。
そこで我々は,産業的異常理解に特化したドメイン適応型マルチモーダル大規模モデルMAU-GPTを提案する。
AMoE-LoRAメカニズムは、異常認識とジェネラリストの専門家の適応を統一し、多様な欠陥クラスに対する理解と推論の両方を強化する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:36:49 GMT)
OpenGuanDan: A Large-Scale Imperfect Information Game Benchmark [31.6] OpenGuanDanは、GuanDanの効率的なシミュレーションと、学習ベースのAIエージェントとルールベースのAIエージェントの包括的な評価を可能にする、新しいベンチマークである。
OpenGuanDanは、不完全な情報、大規模な情報セットとアクションスペース、協力と競争を含む混合学習目標、長期的な意思決定、可変アクションスペース、動的チーム構成など、多くの非自明な課題を提起している。
我々は,(1)グアンダンのAIエージェント間のペアワイズ競争,(2)人間とAIのマッチングの2種類の評価を行う。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:46:29 GMT)
Beyond What Seems Necessary: Hidden Gains from Scaling Training-Time Reasoning Length under Outcome Supervision [30.8] LLMの思考と推論の訓練は、最先端のモデルを構築する上で重要な要素となっている。
近年の取り組みは、長いCoTを誘発するRL微調整や、アーキテクチャの反復による遅延推論のスケーリングなど、さまざまな方法でこれを追求している。
結果のみの監督の下では、トレーニング時間推論の長さが増加するにつれて、アウト・オブ・ディストリビューション(OOD)のパフォーマンスが向上し続ける。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 22:54:45 GMT)
AREAL-DTA: Dynamic Tree Attention for Efficient Reinforcement Learning of Large Language Models [30.4] 強化学習(RL)トレーニングにおいて,プレフィックス共有を効率的に活用するために,AREAL-DTAを導入する。
AREAL-DTAは、deep-first-search(DFS)ベースの実行戦略を採用し、前方および後方の両方でロールアウトツリーを動的に横切る。
AREAL-DTAは最大831Times$2$-benchのトレーニングスループットを実現している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:05:34 GMT)
PHAT: Modeling Period Heterogeneity for Multivariate Time Series Forecasting [30.3] 実世界のデータの周期性をモデル化するためのPHAT(Period Heterogeneity-Aware Transformer)を提案する。
バケット内の相互作用を制限し、クロスバケット接続をマスキングすることにより、PHATは一貫性のない期間からの干渉を効果的に回避する。
実世界の14のデータセットのPHATを18のベースラインに対して評価し,既存の手法よりも有意に優れていることを示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:58:09 GMT)
A Causal Perspective for Enhancing Jailbreak Attack and Defense [29.7] 大規模言語モデルとデータ駆動因果探索を融合したフレームワークを提案する。
7つの言語モデルにまたがる35kのジェイルブレイク試行からなる包括的データセットを導入する。
分析の結果、"Positive Character"や"Number of Task Steps"といった特定の特徴が、jailbreakの直接的な因果的ドライバとして機能していることが判明した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:20:13 GMT)
Depth, Not Data: An Analysis of Hessian Spectral Bifurcation [29.4] ヘッセン行列の固有値分布は、ディープニューラルネットワークの風景を理解する上で重要な役割を果たす。
このようなスペクトル分岐は、データ不均衡とは無関係に、純粋にネットワークアーキテクチャから生じうることを実証する。
この結果から,深層ネットワークの最適化アルゴリズムを設計する際には,モデルアーキテクチャとデータ特性の両方を考慮すべきであることが示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:17:00 GMT)
Equity vs. Equality: Optimizing Ranking Fairness for Tailored Provider Needs [29.3] 露出や販売といった主要な成果に対して、各プロバイダの嗜好を明示的にモデル化する、株式指向の公正性フレームワークを導入します。
EquityRankは、ユーザ側の有効性とプロバイダ側株式を協調的に最適化する勾配に基づくアルゴリズムである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:44:31 GMT)
Beyond Basic Specifications? A Systematic Study of Logical Constructs in LLM-based Specification Generation [29.2] プログラム仕様の自動生成のための大規模言語モデル(LLM)は、検証効率を向上させるための有望な道として登場した。
既存の LLM 仕様生成フレームワークに論理構造を組み込むことを提案する。
我々は,様々な種類の構文構造が仕様生成フレームワークに与える影響について,実証的研究を行った。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:19:40 GMT)
DockSmith: Scaling Reliable Coding Environments via an Agentic Docker Builder [29.0] DockSmithは、この課題に対処するために設計された特殊なエージェントDockerビルダーである。
DockSmithは環境構築を前処理のステップとして扱う。
長期ツールの使用、依存関係の推論、障害復旧などを実行する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:16:40 GMT)
EPSVec: Efficient and Private Synthetic Data Generation via Dataset Vectors [28.3] 既存のプライベートテキスト生成手法の軽量な代替手段であるEPSVecを紹介する。
EPSVec は、プライベートデータと公開前の分散ギャップをキャプチャするアクティベーション空間における *dataset vectors*-direction を使用して、EPSVec のステアリングを行う。
実験の結果,EPSVecは分布アライメントおよび下流ユーティリティにおいて,既存のベースラインよりも優れていた。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:04:08 GMT)
Federated Learning at the Forefront of Fairness: A Multifaceted Perspective [28.0] フェデレートラーニング(FL)の公正さは、不均一なクライアントの制約と、さまざまなシナリオにおけるバランスの取れたモデルパフォーマンスによって引き起こされる重要な要因として現れています。
我々は、様々な公正に関する懸念と関連する技術的な側面を分類し、対処するためのフレームワークを提供する。
公正度を定量的に測定するために利用したいくつかの重要な評価指標について検討した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:20:55 GMT)
ConLA: Contrastive Latent Action Learning from Human Videos for Robotic Manipulation [27.5] 人間のビデオからロボットポリシーを学習するための教師なし事前学習フレームワークであるConLAを提案する。
人間のビデオのみに事前学習を行うことで、実際のロボット軌道事前学習で得られた性能を初めて上回ります。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:40:57 GMT)
Provably Protecting Fine-Tuned LLMs from Training Data Extraction [27.2] センシティブデータセット上の微調整された大きな言語モデル(LLM)は、プライバシの懸念を提起する。
SCP-$_r$は,相対確率に基づくNAF(Near Access Freeness)に基づくアルゴリズムである。
SCP-$_r$は、既存のNAF法よりも理論境界のオーダーオブマグニチュードを達成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:18:36 GMT)
A Diffusive Classification Loss for Learning Energy-based Generative Models [27.1] DiffCLF(Diffusive Classification, DiffCLF)は, 計算効率を保ちながら視力の低下を回避する簡易な手法である。
解析的ガウス混合の場合, 推定エネルギーを地中真理と比較することにより, DiffCLFの有効性を検証した。
以上の結果から,DiffCLFは既存手法よりも忠実度が高く,適用性も広いEMMを実現することが示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:29:42 GMT)
NegaBent, No Regrets: Evolving Spectrally Flat Boolean Functions [26.9] 負のブール関数は、ネガ・ハダマール変換の下で平坦な等級スペクトルを持つ。
ネガベント関数の進化に進化的アルゴリズムを用いる方法を示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:13:03 GMT)
Steering to Say No: Configurable Refusal via Activation Steering in Vision Language Models [26.6] 我々はtextbfCR-VLM における textbfConfigurable textbfRefusal を開発する。
CR-VLMは,(1)教師の力を借りてリファクトベクターを抽出してリファクト信号を増幅し,(2)スコープ内クエリの受け入れを保ち,過剰リファクトを緩和するゲーティング機構を導入する,(3)視覚表現とリファクト要求を整列するデファクト視覚拡張モジュールを設計する,という3つの統合コンポーネントから構成される。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:54:33 GMT)
APEX: A Decoupled Memory-based Explorer for Asynchronous Aerial Object Goal Navigation [26.5] Embodied AIの挑戦的なフロンティアであるAerial Object Goal Navigationでは、無人航空機(UAV)エージェントが視覚的知覚と言語記述のみを使用して、特定のターゲットを自律的に探索、推論、識別する必要がある。
既存の手法は、大気環境における複雑な空間表現の記憶、信頼性と解釈可能な行動決定、非効率な探索と情報収集に苦慮している。
我々は,複雑な空中環境下での効率的な探索と目標獲得を目的とした,新しい階層型エージェントであるtextAPEXを紹介した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:27:57 GMT)
Toward Autonomous Laboratory Safety Monitoring with Vision Language Models: Learning to See Hazards Through Scene Structure [26.4] 実験室は軽微な不安全行為によって重傷を負う傾向がある。
継続的な安全監視は 人間の可用性によって制限されます
ビジョン言語モデル(VLM)は、自律的な実験室の安全監視を約束する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:08:41 GMT)
Sparse Shortcuts: Facilitating Efficient Fusion in Multimodal Large Language Models [26.3] マルチモーダル大言語モデル(MLLM)は、複数のモーダルにまたがるデータ処理能力において急速に進歩している。
視覚言語モデルでは、高レベルな視覚的特徴のみを用いたモダリティの整列は、中レベルと低レベルの特徴に存在するリッチな意味情報を捨てることが多い。
SparseCut は MLLM のための汎用のクロスモーダル融合アーキテクチャである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:15:42 GMT)
Position: Human-Centric AI Requires a Minimum Viable Level of Human Understanding [26.1] 本稿では、透明性、ユーザコントロール、リテラシー、ガバナンスに対する一般的なアプローチは、人間が持続的なAIデリゲートの下で監視し続けなければならないという基本的な理解を定義していない、と論じる。
これを形式化するために、認知統合閾値(CIT)を、AI支援下での監視、自律性、説明責任な参加を維持するために必要な最小限の理解として定義する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:37:33 GMT)
CADGrasp: Learning Contact and Collision Aware General Dexterous Grasping in Cluttered Scenes [25.8] 乱雑な環境における有害な把握は、器用な手の自由度が高いため、重大な課題を呈している。
そこで本研究では,一視点クラウド入力を用いた汎用デクスタラスグルーピングのための2段階アルゴリズムCADGraspを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:42:38 GMT)
IDEM Enough? Evolving Highly Nonlinear Idempotent Boolean Functions [25.8] Idempotent Boolean関数は暗号設計の候補として魅力的である。
軌道上の真理表を符号化することで、イデオポテンスを強制できることが示される。
次に、軌道上の真理表を符号化することで、イデオポテンスを強制できることを示し、異なる赤道軌道の数に匹敵する大きさのコンパクトなゲノムを生成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:06:38 GMT)
Equilibrium of Feasible Zone and Uncertain Model in Safe Exploration [25.7] 本稿では,安全な探査の目的が,実現可能なゾーンと環境モデルとの均衡を見出すことであることを明らかにした。
より大きな実現可能なゾーンはより正確な環境モデルをもたらし、より正確なモデルにより、より大きなゾーンを探索することができる。
本稿では,最大許容域の探索と不確実なモデルとの交互に行う安全平衡探索(SEE)と呼ばれる,最初の平衡指向型安全な探査フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:07:14 GMT)
Learning in Bayesian Stackelberg Games With Unknown Follower's Types [25.4] We study online learning in Bayesian Stackelberg games。
我々は、フォロワーのタイプが明らかにされる、より簡単な型フィードバックモデルに焦点を当てます。
このような設定で、他のパラメータへの依存を無視した場合に、$widetildeO(sqrtT)$を後悔することのないアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:24:34 GMT)
Learning to Accelerate Vision-Language-Action Models through Adaptive Visual Token Caching [25.3] 我々は、学習可能なポリシー最適化問題として推論加速度を再構成する。
本稿では,タスク認識による意思決定プロセスを直接Vision-Language-Actionモデルに統合する新しいフレームワークを提案する。
提案手法は, 平均成功率を同時に向上させながら, 1.76倍のウォールクロック推定速度向上を実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:12:51 GMT)
V2X-DSC: Multi-Agent Collaborative Perception with Distributed Source Coding Guided Communication [25.1] 協調知覚は、マルチエージェント観察を融合させて3次元理解を改善するが、中間機能共有は厳しい帯域幅制約に直面している。
本稿では,帯域幅制限型核融合のための条件付きコーデック(DCC)フレームワークであるV2X-DSCを提案する。
DAIR-V2X、OPV2V、V2X-Realの実験では、KBレベルの通信下での最先端の精度帯域幅トレードオフが示されている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:16:58 GMT)
SADER: Structure-Aware Diffusion Framework with DEterministic Resampling for Multi-Temporal Remote Sensing Cloud Removal [24.8] 拡散モデルがリモートセンシングクラウド除去の主要なパラダイムとして浮上している。
マルチ時間リモートセンシングクラウド除去のための構造対応拡散フレームワークSADERを提案する。
複数のマルチ時間データセットの実験により、SADERは最先端のクラウド除去方法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:06:18 GMT)
Optimizing Agentic Reasoning with Retrieval via Synthetic Semantic Information Gain Reward [24.7] 本稿では, セマンティック情報獲得報酬による効果的な情報探索を動機付ける統合フレームワークを提案する。
7つの質問回答ベンチマークでの実験では、InfoReasonerは強力な検索強化ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:15:50 GMT)
Trajectory Consistency for One-Step Generation on Euler Mean Flows [24.0] 本研究では,フローベース生成フレームワークであるemphEuler Mean Flows (EMF)を提案する。
EMFは最小サンプリングコストで長距離軌道の整合性を実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:32:32 GMT)
HyperOffload: Graph-Driven Hierarchical Memory Management for Large Language Models on SuperNode Architectures [24.0] SuperNodeは、コンパイラ内のキャッシュ演算子を使用したデータ移動を表す。
私たちは、本番のディープラーニングフレームワークMindSporeにSuperNodeを実装しています。
SuperNodeは、エンドツーエンドのパフォーマンスを維持しながら、推論のピークデバイスメモリ使用量を最大26%削減することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:29:13 GMT)
ProphetKV: User-Query-Driven Selective Recomputation for Efficient KV Cache Reuse in Retrieval-Augmented Generation [23.9] 本稿では,RAGシナリオに対するユーザクエリ駆動型KVキャッシュ再利用手法であるProphet KVを提案する。
Prophet KVは、ユーザクエリに対するセマンティックな関連性に基づいてトークンを優先順位付けする。
以上の結果から, Prophet KVの完全補充精度は96%-101%であり,再計算率は20%に過ぎなかった。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:53:31 GMT)
WordCraft: Scaffolding the Keyword Method for L2 Vocabulary Learning with Multimodal LLMs [23.9] MLLM(Multimodal Large Language Models)を利用した学習者中心の対話型ツールであるWordCraftを紹介する。
WordCraftは、キーワード選択、関連構築、画像形成を通じて学習者を導くことで、キーワードメソッドを足場とする。
2つのユーザスタディは、WordCraftが生成効果を保存するだけでなく、高いレベルの有効性とユーザビリティを達成することを実証している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:59:43 GMT)
SRBench: A Comprehensive Benchmark for Sequential Recommendation with Large Language Models [23.8] SRBenchは3つのコア設計を持つ総合的なSRベンチマークである。
正確性、公正性、安定性、効率性をカバーし、実際的な要求に沿う。
SRBenchを使って13の主流モデルを評価し、いくつかの意味のある洞察を発見しました。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:22:58 GMT)
RecGOAT: Graph Optimal Adaptive Transport for LLM-Enhanced Multimodal Recommendation with Dual Semantic Alignment [23.7] マルチモーダルなレコメンデーションのための新しい2つのセマンティックアライメントフレームワークRecGOATを提案する。
RecGOATは、我々の理論的洞察を実証的に検証し、最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:58:38 GMT)
Sporadic Gradient Tracking over Directed Graphs: A Theoretical Perspective on Decentralized Federated Learning [23.7] Decentralized Federated Learning (DFL)は、ローカルデータを持つクライアントがピアツーピアでコラボレーションして、一般化されたモデルをトレーニングすることを可能にする。
本稿では、DFLにおける重要な課題を個別に解決した2つの作業分野を統一する: (i) データの不均一性を緩和するための勾配追跡技術と (ii) クライアント間でのリソースの多様な利用を考慮に入れた。
我々は、クライアント固有の勾配計算周波数を許容し、これらの因子を汎用グラフ上に組み込んだ最初のDFLアルゴリズムである$textitSporadic Gradient Tracking$(texttSpod-GT$)を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:58:36 GMT)
Rethinking Hallucinations: Correctness, Consistency, and Prompt Multiplicity [23.7] 大規模言語モデル(LLM)は、誤りや誤解を招くアウトプットを生成することで「幻滅する」ことが知られている。
LLM評価における一貫性の定量化のためのフレームワークであるProperced multiplicityを導入する。
幻覚の検出と緩和における一貫性の役割について検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:29:03 GMT)
Persuasion Propagation in LLM Agents [23.6] 教義レベルの介入が下流の作業行動にどのように影響するかを考察する。
ウェブ調査やコーディングタスクを通じて、オンザフライの説得は弱く一貫性のない行動効果をもたらすことが判明した。
信念状態がタスク時に明示的に指定されると、信念に満たされたエージェントは、平均26.9%の検索率で行動し、16.9%のユニークソースを中立に満たされたエージェントより訪問する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:33:14 GMT)
Omni-RRM: Advancing Omni Reward Modeling via Automatic Rubric-Grounded Preference Synthesis [22.6] 重要なボトルネックは、効果的な報酬モデル(RM)の欠如である。
我々は,最初のオープンソースルーリックグラウンド報酬モデルである textbf Omni-RRM を紹介する。
テキスト、画像、ビデオ、オーディオにまたがって、次元的に正当化された構造化された多次元の選好判断を生成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:20:45 GMT)
Dynamic Expert Sharing: Decoupling Memory from Parallelism in Mixture-of-Experts Diffusion LLMs [22.4] Dynamic Expert Sharing (DES) は、MoE最適化をトークン中心のプルーニングからシーケンシャルレベルのコアセット選択に移行する新しいテクニックである。
DESは、独自の専門家アクティベーションを55%以上削減し、レイテンシを最大38%削減し、バニラ精度の99%を維持している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:01:47 GMT)
Latent Shadows: The Gaussian-Discrete Duality in Masked Diffusion [22.0] マスク付き離散拡散は、トークンをマスク状態に反復的に劣化させる高品質言語モデリングにおいて支配的なパラダイムである。
拡散双対性は一様模型に対する決定論的蒸留を可能にするが、これらのアプローチは一般にマスク付き模型を過小評価し、複素積分作用素に依存する。
我々は、この双対性を利用する原理的フレームワークであるMasked Consistency Distillation (MCD)を導入し、数値ODEソルバをバイパスする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:00:46 GMT)
Supervised makeup transfer with a curated dataset: Decoupling identity and makeup features for enhanced transformation [21.7] 拡散モデルは、生成タスクにおいて大きな進歩を示しており、化粧転移のためのGANベースのアプローチのより安定した代替手段を提供する。
既存の手法では、データセットの制限、アイデンティティとメイクの特徴の不整合、制御性の弱さに悩まされることが多い。
我々は, 合成, 現実的, フィルタされたサンプルを組み合わせて, 多様性と忠実性を向上する列車生成・フィルタ・リトラクション戦略を用いて, 高品質なモデルを構築した。
第3に,ユーザが目や唇,顔の化粧を自然言語のプロンプトで修正できる,きめ細かな領域特異的制御を実現するためのテキスト誘導機構を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:46:38 GMT)
MissMAC-Bench: Building Solid Benchmark for Missing Modality Issue in Robust Multimodal Affective Computing [21.7] MissMAC-Benchは、公正で統一された評価基準を確立するために設計された総合的なベンチマークである。
2つの原則が提案されており、トレーニング中に欠席することはない。
我々のベンチマークでは、データセットとインスタンスのレベルで、固定されたパターンとランダムなパターンの両方を評価プロトコルに統合しています。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:39:34 GMT)
Generating a Paracosm for Training-Free Zero-Shot Composed Image Retrieval [21.2] Composed Image Retrieval (CIR)は、マルチモーダルクエリを使用してデータベースからターゲットイメージを取得するタスクである。
CIRの課題は、このメンタルイメージ'は物理的に利用できておらず、クエリによって暗黙的にのみ定義されていることだ。
対照的に、より正確なマッチングのために「心像」を直接生成することで、第一原理からCIRに対処する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:42:55 GMT)
EffGen: Enabling Small Language Models as Capable Autonomous Agents [21.2] effGenは、小さな言語モデル(SLM)に最適化されたエージェントフレームワークである
1) コンテクストを70~80%圧縮するプロンプト最適化によるツールコールの強化,(2) 依存関係に基づいて複雑なクエリを並列あるいはシーケンシャルなサブタスクに分解するインテリジェントタスク分解,(3) 短期,長期,ベクトルベースのストレージを組み合わせた統一メモリシステム。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:24:56 GMT)
From Associations to Activations: Comparing Behavioral and Hidden-State Semantic Geometry in LLMs [21.2] 5000ワードの語彙を共有して、類似性に基づく強制選択と自由結合という2つの実験パラダイムを実行します。
我々は,行動幾何学を階層的に隠蔽状態の類似性と比較し,FastText,BERT,およびクロスモデルコンセンサスに対するベンチマークを行う。
強制選択行動は、自由結合よりも隠れ状態幾何学とほぼ一致していることがわかった。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:50:55 GMT)
Resource-Efficient Reinforcement for Reasoning Large Language Models via Dynamic One-Shot Policy Refinement [21.1] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な性能を示した。
検証可能な報酬(RLVR)の下での強化学習は、モデル行動と推論連鎖を整合させるための原則的な枠組みとして現れつつある。
その約束にもかかわらず、RLVRは厳しい資源集約であり、広範な報奨信号を必要とし、訓練中にかなりのロールアウトコストを発生させる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:51:50 GMT)
Recent Advances of End-to-End Video Coding Technologies for AVS Standard Development [20.8] ビデオ圧縮効率の向上を追求するため、AVSビデオ符号化ワーキンググループは、エンドツーエンドのインテリジェントなビデオコーディングの標準化調査を開始した。
AVS-EEMの中核となる設計原則は、本質的に低い計算複雑性を特徴とする実用的展開に焦点を当てている。
本稿では、AVS-EEMの開発経緯を詳述し、その主要な技術フレームワークについて体系的な紹介を行う。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:07:55 GMT)
Unmasking Reasoning Processes: A Process-aware Benchmark for Evaluating Structural Mathematical Reasoning in LLMs [20.8] 最近の大規模言語モデル (LLM) は、多くの確立された数学的推論ベンチマークにおいて、ほぼ飽和の精度を達成している。
この飽和はテンプレートベースの計算と浅い算術分解の優位性に起因している。
本稿ではReasoningMath-Plusについて紹介する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:09:17 GMT)
OCTOPUS: Enhancing the Spatial-Awareness of Vision SSMs with Multi-Dimensional Scans and Traversal Selection [20.7] 我々は,大域的コンテキストと画像内の局所空間構造の両方を保存する新しいアーキテクチャであるOCTOPUSを紹介する。
OCTOPUSは8つの主方向に沿って個別に再起し、水平方向、垂直方向、対角方向を前方または後方に進む。
分類とセグメンテーションのベンチマークでは、OCTOPUSは境界保存と領域の整合性において顕著な改善を示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:12:59 GMT)
Sparsity-Aware Unlearning for Large Language Models [20.7] 大きな言語モデル(LLM)は、トレーニング中に機密情報を必然的に記憶し、重大なプライバシーリスクを生じさせる。
マシンアンラーニングは、完全なリトレーニングをせずに、そのような情報を選択的に除去する、有望なソリューションとして登場した。
未学習の有効性はスパースモデルで著しく低下する。
本研究では,スパシフィケーション目標から勾配マスキングを通じてアンラーニングを分離する,スパシティ・アウェア・アンラーニング(SAU)を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:45:30 GMT)
Quality-Diversity Optimization as Multi-Objective Optimization [20.5] QD(Quality-Diversity)最適化は、多様な振る舞いを同時に示すハイパフォーマンスなソリューションの集合を見つけることを目的としている。
本研究は,多目的最適化問題としてQD最適化をキャストすることで,新たな再構成を導入する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:01:13 GMT)
Forget by Uncertainty: Orthogonal Entropy Unlearning for Quantized Neural Networks [20.4] 我々は,機械学習のための新しい直交エントロピー・アンラーニング(OEU)フレームワークを提案する。
OEUは、忘れたデータに対する予測の不確実性を最大化し、自信のある誤った予測よりも、本当の忘れることを達成する。
大規模な実験により、OEUは有効性を忘れ、正確性を保ちながら既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:18:55 GMT)
Judging the Judges: Human Validation of Multi-LLM Evaluation for High-Quality K--12 Science Instructional Materials [19.8] 本研究の目的は,GenAIをベースとした教材デザインエージェントの設計原則に関する専門家の洞察を翻訳することである。
我々は意図的に、生命科学、物理科学、地球科学の12の高品質のカリキュラムを選定した。
評価項目9項目のEQuIPルーブリックを用いて,GPT-4o,Claude,Geminiに数値評価と各単位の有理書作成を促した。
2人の理科教育専門家が独立にすべてのアウトプットをレビューし、スコアと合理性の両方について合意(1)または不一致(0)をマークし、AI推論に関する質的な考察を提供した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:50:22 GMT)
Weighted Graph Clustering via Scale Contraction and Graph Structure Learning [19.4] グラフクラスタリングタスクにおけるエッジウェイトの活用は、2つの重要な課題に直面します。
エッジウェイトの導入は、ストレージスペースとトレーニング時間を大幅に増加させる可能性がある。
エッジウェイト情報は本質的に、クラスタリング結果に悪影響を及ぼすノイズを含む可能性がある。
本稿では,エッジウェイト対応グラフクラスタリングネットワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:51:01 GMT)
Computing Maximal Per-Record Leakage and Leakage-Distortion Functions for Privacy Mechanisms under Entropy-Constrained Adversaries [19.2] 本稿では,最大1レコードリーク,一次リーク・歪みトレードオフ,二重歪み最小化の3つの問題について検討する。
我々は凸性-凸性双対性を利用する効率的な交互最適化アルゴリズムを開発した。
この研究は、プライバシのリスクを監査し、認定されたメカニズムを設計するための計算フレームワークを提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:23:24 GMT)
Invariance on Manifolds: Understanding Robust Visual Representations for Place Recognition [19.2] 本稿では,2次幾何統計フレームワークを提案する。
提案手法では、固定されたトレーニング済みのバックボーン上に構築されたトレーニング不要のフレームワークを導入し、パラメータ更新なしで強力なゼロショット一般化を実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:12:29 GMT)
MAUGen: A Unified Diffusion Approach for Multi-Identity Facial Expression and AU Label Generation [19.0] 拡散に基づくマルチモーダル・フレームワークであるMAUGenを提案する。
本フレームワークでは、包括的AUアノテーションとアイデンティティのバリエーションを備えた大規模マルチモーダル合成データセットであるMIFA(Multi-Identity Facial Action)を導入する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:56:22 GMT)
JoyAvatar: Unlocking Highly Expressive Avatars via Harmonized Text-Audio Conditioning [18.7] JoyAvatarは長時間のアバタービデオを生成することができるフレームワークである。
そこで本研究では,モデルに固有のテキスト制御性を持たせるための,ツイン教師強化トレーニングアルゴリズムを提案する。
トレーニング中、マルチモーダル条件の強度を動的に調整する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:00:57 GMT)
Investigating the Robustness of Subtask Distillation under Spurious Correlation [18.7] サブタスク蒸留は、大規模で汎用的な「基礎モデル」からコンパクトで特殊なモデルを抽出する新興パラダイムである。
蒸留は教師モデルを用いるが、サイズが制限されることが多く、代表性を欠いたり、素早い相関関係を示すようなデータセットに依存している。
蒸留に急激な相関関係を持つデータを用いた場合, 確立された蒸留法および最近のサブ蒸留法の評価を行った。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:33:29 GMT)
SPARK: Stochastic Propagation via Affinity-guided Random walK for training-free unsupervised segmentation [18.6] 訓練のないセグメンテーション法は、セグメンテーションが拡散に由来する親和性に対するスペクトルグラフ分割問題であるという暗黙的で限定的な仮定に依存している。
適応ラベルプルーニング戦略を用いてランダムウォークに基づく拡散を行うマルコフ伝搬方式を提案する。
提案手法は, 従来のスペクトルクラスタリング手法と比較して, よりシャープな境界, よりコヒーレントな領域, より安定したマスクを生成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:12:17 GMT)
Bridging Degradation Discrimination and Generation for Universal Image Restoration [18.1] 本稿では,Bdging Degradation discrimination and Generation (BDG) という新しい手法を提案する。
マルチアングルおよびマルチスケールグレーレベル共起行列(MAS-GLCM)を提案する。
本研究の目的は,MAS-GLCMからの識別情報を復元プロセスに統合しながら,豊かなテクスチャを復元する拡散モデルの能力を維持することである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:46:28 GMT)
PSGS: Text-driven Panorama Sliding Scene Generation via Gaussian Splatting [18.0] 高忠実パノラマシーン生成のためのフレームワークPSGSを提案する。
まず、新しい2層最適化アーキテクチャが意味的にコヒーレントなパノラマを生成する。
第2に、我々のパノラマスライディング機構は、グローバルに一貫した3次元ガウススプラッティング点雲を初期化する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:34:46 GMT)
Scalable Generative Game Engine: Breaking the Resolution Wall via Hardware-Algorithm Co-Design [17.9] 我々は、スケーラブルなTextitHardware-Algorithm共設計フレームワークを導入することにより、生成モデルと高分解能ニューラルネットワークのギャップを埋める。
このシステムは, それぞれ26.4 FPSと48.3 FPSの流体を供給し, 有効遅延は2.7msである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:52:51 GMT)
Structured Self-Consistency:A Multi-Task Evaluation of LLMs on VirtualHome [17.9] エージェントは目標を理解し、アクションを計画し、シミュレーション環境でタスクを実行する必要がある。
本稿では,Embodied Agent Interface (EAI) フレームワークを用いたVirtualHomeベンチマークにおいて,Large Language Models (LLM) の総合評価を行う。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:56:43 GMT)
Tune-Your-Style: Intensity-tunable 3D Style Transfer with Gaussian Splatting [17.9] 3Dスタイル転送は、参照スタイル画像に基づく3Dアセットの芸術的なスタイル化を指す。
そこで我々は,textbfTune-Your-Styleと呼ばれる,創造性のある3Dスタイル転送パラダイムを導入し,ユーザがシーンに注入されるスタイルの強度を柔軟に調整できるようにする。
提案手法は,視覚的に魅力的な結果を提供するだけでなく,3Dスタイルの転送に対して柔軟なカスタマイズ性を示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:17:26 GMT)
Surrogate Ensemble in Expensive Multi-Objective Optimization via Deep Q-Learning [17.8] サロゲート支援進化アルゴリズム(SAEA)は、高価な最適化問題を解く上で有望な堅牢性を示している。
SAEAsの有効性に影響を与える重要な側面は、モデル選択の代理である。
一つの最適化プロセス内で異なる代理モデルをスケジューリングできるSEEMOOと呼ばれる強化学習支援アンサンブルフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:14:27 GMT)
Pareto-Conditioned Diffusion Models for Offline Multi-Objective Optimization [17.7] 条件付きサンプリング問題としてオフラインMOOを定式化する新しいフレームワークを提案する。
所望のトレードオフを直接条件付けすることで、PCDは明示的なサロゲートモデルの必要性を避けることができる。
標準オフラインMOOベンチマークの実験では、PCDは高い競争性能を達成している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:05:05 GMT)
Kanade: A Simple Disentangled Tokenizer for Spoken Language Modeling [17.6] トークン化は言語情報と非言語情報を混在させる連続的な信号を処理しなければならない音声モデリングにおいて重要である。
In this present Kanade, a single-layer disentangled speech tokenizer。
実験により,カナデは高い復元品質を維持しつつ,最先端の話者のゆがみと語彙の可利用性を達成できることが示された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:20:39 GMT)
Beyond Static Instruction: A Multi-agent AI Framework for Adaptive Augmented Reality Robot Training [17.4] Augmented Reality(AR)は、産業用ロボットのトレーニングに強力な視覚化機能を提供する。
現在のインターフェイスは、主に静的であり、学習者の多様な認知プロファイルを説明できない。
本稿では,静的な可視化と教育的インテリジェンスとのギャップを埋める,将来的な統合のためのマルチエージェントAIフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:33:52 GMT)
Provable Model Provenance Set for Large Language Models [17.3] 非許可モデルの使用頻度と誤帰は、信頼性のあるモデル解析の必要性を高めている。
既存の方法は、証明可能なエラー制御がなく、しばしば複数のソースの存在を見落としている指紋マッチング規則に大きく依存している。
まず、証明可能な保証でモデル証明問題を定式化し、所定の信頼度レベルで全ての真の証明を厳格に網羅する必要がある。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:27:14 GMT)
When Classes Evolve: A Benchmark and Framework for Stage-Aware Class-Incremental Learning [17.1] CIL(Class-Incremental Learning)は、それまでの学習知識の破滅的な忘れを軽減しつつ、新しいクラスを逐次学習することを目的としている。
本稿では,各クラスを異なる形態的段階から段階的に学習するパラダイムであるStage-Aware CILを提案する。
また,固定サイズのメモリプール内で抽象的かつ伝達可能な進化パターンを明示的に学習する新しい方法STAGEを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:32:52 GMT)
Lookahead-then-Verify: Reliable Constrained Decoding for Diffusion LLMs under Context-Free Grammars [17.1] 本稿では,dLLMに特化して設計された制約付き復号法であるLAVEを提案する。
提案手法は,dLLMの鍵となる特性,すなわち前方通過時の全位置のトークン分布を予測する能力を利用する。
広く使用されている4つのdLLMと3つの代表的なベンチマークによる大規模な実験は、LAVEが既存のベースラインを一貫して上回り、構文的正確性を大幅に改善し、無視可能なランタイムオーバーヘッドを発生させることを示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:58:15 GMT)
Sampling from multi-modal distributions on Riemannian manifolds with training-free stochastic interpolants [17.1] 本研究では,非平衡決定論的力学のシミュレーションに基づくサンプリングアルゴリズムを提案する。
機械学習に依存する関連する生成的モデリング手法とは対照的に,本手法は完全にトレーニング不要である。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:17:44 GMT)
Federated-inspired Single-cell Batch Integration in Latent Space [16.8] セルレベルの埋め込みを精錬するためのフェデレーション学習原理にインスパイアされた,ポストホックな最適化手法である scBatchProx を紹介する。
scBatchProxは、埋め込み品質全体の約3.8%の相対的なゲインを得る。
本研究は,動的単一セルデータシステムにおける学習表現の実践的洗練に向けたステップとして,本研究を期待する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:21:35 GMT)
MRAD: Zero-Shot Anomaly Detection with Memory-Driven Retrieval [16.7] MRAD(Memory-Retrieval Anomaly Detection)は、パラメトリックフィッティングを直接メモリ検索に置き換える統合フレームワークである。
16の産業用および医療用データセットに対して、MRADフレームワークは、常に優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:30:57 GMT)
The Persuasion Paradox: When LLM Explanations Fail to Improve Human-AI Team Performance [16.6] 流動的な説明は、確実に改善することなく、AIへのユーザの信頼と信頼を体系的に向上させ、場合によってはタスク精度を損なう。
以上の結果から,信頼,信頼,明快さなどの主観的指標が,人間-AIチームパフォーマンスの予測に乏しいことが示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:23:37 GMT)
FedMOA: Federated GRPO for Personalized Reasoning LLMs under Heterogeneous Rewards [16.5] GRPOの批判のないアーキテクチャは、デバイス上で実行可能なトレーニングを可能にするが、フェデレートされた設定に移行することで、体系的な課題がもたらされる。
我々は,多目的アライメントのためのフェデレートGRPOフレームワークであるFedMOAを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:00:17 GMT)
Decouple Searching from Training: Scaling Data Mixing via Model Merging for Large Language Model Pre-training [16.0] 本稿では,モデルマージを利用して最適なデータ比を推定する新しいフレームワークであるDeouple Searching from Training Mix (DeMix)を提案する。
DeMixは,検索効率,精度,効率のトレードオフを破り,検索コストの低いベンチマーク性能と最適混合が得られることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:27:46 GMT)
SAGE: Accelerating Vision-Language Models via Entropy-Guided Adaptive Speculative Decoding [15.7] 投機的復号化は、視覚言語モデルにおける推論を加速するための有望なアプローチとして現れている。
既存のメソッドはデコードプロセスを通して固定されている静的ツリー構造に依存している。
実時間予測の不確実性に基づいて投機木構造を動的に調整する新しいフレームワークであるSAGEを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:35:40 GMT)
SanD-Planner: Sample-Efficient Diffusion Planner in B-Spline Space for Robust Local Navigation [15.6] SanD-Plannerはサンプル効率のよい拡散型ローカルプランナーで、B-スプライン空間内で深度画像に基づく模倣学習を行う。
評価されたオープンベンチマークで最先端のパフォーマンスを達成し、シミュレーションされた乱雑な環境では90.1%ドル、屋内シミュレーションでは72.0%ドルの成功率を達成した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 22:37:27 GMT)
Copula-Based Aggregation and Context-Aware Conformal Prediction for Reliable Renewable Energy Forecasting [15.6] 本稿では,現場レベルの確率予測を信頼性の高い艦隊レベルの予測に変換する確率集約フレームワークを提案する。
このフレームワークは、コプラに基づく依存モデルを統合し、コンテキスト・アウェア・コンフォーマル予測(CACP)とクロスサイト相関をキャプチャし、集約されたレベルでの誤校正を補正する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:51:01 GMT)
LLMs as High-Dimensional Nonlinear Autoregressive Models with Attention: Training, Alignment and Inference [15.5] トランスフォーマーアーキテクチャに基づく大規模言語モデル(LLM)は通常、アーキテクチャコンポーネントやトレーニング手順のコレクションを通して記述される。
注意に基づく高次元非線形自己回帰モデルとしてLSMを定式化する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:37:53 GMT)
Words that make SENSE: Sensorimotor Norms in Learned Lexical Token Representations [15.2] 私たちは$textSENSE$ $(textbfStextensorimotor $ $textbfEtextmbedding $ $textbfNtextorm $ $textbfStextcoring $ $ $textbfEtextngine)$という学習プロジェクションモデルを提示します。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:48:00 GMT)
Don't Forget Its Variance! The Minimum Path Variance Principle for Accurate and Stable Score-Based Density Ratio Estimation [15.1] 抽出可能なトレーニング対象は,時間スコアの経路分散という,決定的かつ見過ごされた用語によって,理想的,根本的目標と異なることを示す。
我々は,経路分散を最小化するための基本性能を導入するMinPV(textbfMinimum textbfPath textbfVariance)原理を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:57:53 GMT)
Controlling Repetition in Protein Language Models [15.1] タンパク質言語モデル(PLM)における反復に関する最初の体系的研究について述べる。
制約付きデータセットでタンパク質生成を制御できるUCCS(Utility-Controlled Contrastive Steering)を提案する。
以上の結果から, PLMの課題として反復制御が確立され, 信頼性タンパク生成の原則的アプローチとしてデータセット誘導ステアリングが強調された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:47:57 GMT)
Evolution of Benchmark: Black-Box Optimization Benchmark Design through Large Language Model [15.0] 初期のベンチマークは主に人間によるものであり、専門家の偏見と多様性の制約を導入している。
大規模言語モデル(LLLL)によって強化された自動BBOベンチマークデザイナであるEoB(Evolution of Benchmark)を提案する。
このパラダイムの下で、EoBはLLLLを反復的にベンチマークプログラムの個体群を進化させ、ランドスケープとそれに対応するプログラムを共進化させるためにリフレクションベースのスキームを使用する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:35:14 GMT)
Continuous-Utility Direct Preference Optimization [14.9] 私たちは、モデルと迅速な認知戦略のポートフォリオを整合させるフレームワークである、継続的ユーティリティ直接選択最適化(CU-DPO)を紹介します。
K 戦略による学習は、二進選好よりもサンプルの複雑さが Theta(K log K) の改善をもたらすことを証明している。
CU-DPOは7つのベースモデルに対して,戦略選択の精度を35-46パーセントから68-78パーセントに向上することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 23:15:32 GMT)
Safe Stochastic Explorer: Enabling Safe Goal Driven Exploration in Stochastic Environments and Safe Interaction with Unknown Objects [14.7] Hamilton-Jacobi Reachability や Control Barrier Functions のような安全な制御の現在の方法は、既知のシステム力学を仮定する。
既存の安全な探査技術は、未知の現実世界で運用する場合に固有の不可避性を説明できないことが多い。
安全エクスプローラー(S.S.Explorer, S.S.Explorer, S.S.Explorer, S.S.Explorer)を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:07:10 GMT)
Inference-Only Prompt Projection for Safe Text-to-Image Generation with TV Guarantees [14.6] テキスト・トゥ・イメージ(T2I)拡散モデルは高品質なオープン・エンド・シンセサイザーを可能にするが、実際の展開では、良質な即時アライメントを低下させることなく、安全でない世代を抑えるセーフガードが必要である。
基準条件分布が固定されると、安全でない世代における非自明な減少は、基準からテレビの偏差を必然的に引き起こす。
本稿では,高リスクプロンプトに選択的に介入する推論専用プロンプトプロジェクションフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:09:48 GMT)
Memento: Towards Proactive Visualization of Everyday Memories with Personal Wearable AR Assistant [14.5] 我々は,会話型ARアシスタントであるMementoを紹介した。
記憶: Mementoは、ユーザの繰り返し関心とそれらを引き起こすコンテキストとの間の関係を発見する。
我々は,没入型アプリにおける多様な専門知識の参加者を対象に,ユーザからのフィードバックを通じて事前評価を行う。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:46:44 GMT)
From Prompt to Graph: Comparing LLM-Based Information Extraction Strategies in Domain-Specific Ontology Development [14.5] オントロジはドメイン知識の構築、アクセシビリティの向上、共有、再利用に不可欠です。
従来のオントロジーは手動のアノテーションと従来の自然言語処理(NLP)技術に依存している。
LLM(Large Language Models)の台頭は、知識抽出を自動化する新しい可能性を提供する。
本研究では,LLMによる事前学習法,ICL(In-context Learning)法,ドメイン固有テキストから用語と関係を抽出するファインチューニング法など,LLMに基づく3つのアプローチについて検討した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:50:23 GMT)
Reinforcement Learning-assisted Constraint Relaxation for Constrained Expensive Optimization [14.1] 本稿では,強化学習による学習効率,適応性,一般化可能な制約処理ポリシーを提案する。
具体的には、最適化されたマルコフ決定プロセスが最初に定式化され、最適化の動的特徴が与えられた場合、深いQネットワークベースのポリシーが制約緩和レベルを制御する。
このような適応的制約処理は、客観的なエクスプロイトと実現可能な地域指向の探索の間の柔軟なトレードオフを提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:52:36 GMT)
Latent Context Compilation: Distilling Long Context into Compact Portable Memory [13.8] 本稿では,コンテキスト処理を適応からコンパイルへシフトするフレームワークであるLatent Context Compilationを提案する。
使い捨てのLoRAモジュールをコンパイラとして利用することにより、長いコンテキストをコンパクトなバッファトークンに抽出する。
Llama-3.1-8Bによる実験では、遅延コンテキストコンパイルは詳細な詳細と推論能力を保持する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:38:07 GMT)
Model Optimization for Multi-Camera 3D Detection and Tracking [13.8] 室内環境におけるマルチカメラの外部認識の重要性はますます高まっている。
クエリベースの3D検出・追跡フレームワークであるSparse4Dを評価した。
我々は,入力フレームレートの低減,学習後の量子化,WILDTRACKベンチマークへの転送,およびトランスフォーマーエンジンの混合精度の微調整について検討した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:51:30 GMT)
Sublinear Time Quantum Algorithm for Attention Approximation [13.7] 本稿では,$mathrmAtt(Q, K, V)$の任意の行を,Q, K, V$への行クエリのみを用いて近似する量子データ構造を提案する。
我々のアルゴリズムはこれらの行列を$widetildeOleft( -1 n0.5 left( s_2.5 + s_1.5 d + 0.5 d right)$ timeで前処理する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:33:52 GMT)
Multi-Objective Multi-Fidelity Bayesian Optimization with Causal Priors [13.6] 本稿では,因果計算を取り入れた多目的MFBO手法であるRESCUEを提案する。
ロボット工学、機械学習(AutoML)、医療における合成および実世界の問題に対する最先端のMF最適化手法よりも、RESCUEはサンプル効率を向上することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:53:22 GMT)
Score-based Metropolis-Hastings for Fractional Langevin Algorithms [13.6] 本稿では,MHにインスパイアされた完全スコアに基づく補正機構であるMetropolis-Adjusted Fractional Langevin Algorithm (MAFLA)を紹介する。
我々は,MAFLAが未調整のLangevinダイナミクスに対して,有限時間サンプリング精度を著しく向上させることを示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:59:22 GMT)
Zero-Shot Stance Detection in the Wild: Dynamic Target Generation and Multi-Target Adaptation [13.4] 我々は,動的ターゲット生成とマルチターゲット適応による野生でのゼロショット姿勢検出という新しい課題を提案する。
我々は,中国のソーシャルメディアスタンス検出データセットを構築し,多次元評価指標を設計する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:51:50 GMT)
MoDEx: Mixture of Depth-specific Experts for Multivariate Long-term Time Series Forecasting [13.4] グラッドCAMと有効受容場理論にインスパイアされた勾配に基づく計量である層感度を導入する。
このメトリクスを3層バックボーンに適用すると、時間力学のモデリングにおける深度固有の専門知識が明らかになる。
MoDExは7つの実世界のベンチマークで精度を達成し、78%のケースでランクインしている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:37:03 GMT)
Less is More: Clustered Cross-Covariance Control for Offline RL [13.2] オフライン強化学習における基本的な課題は、分散シフトである。
ローカルなリプレイパーティションへの更新を制限する分割バッファサンプリングを提案する。
また,各更新における共分散誘発バイアスを解消する,明確な勾配に基づく補正ペナルティも導入する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:04:07 GMT)
Diff-PC: Identity-preserving and 3D-aware Controllable Diffusion for Zero-shot Portrait Customization [13.1] Diff-PCはゼロショットポートレートカスタマイズ(PC)のための拡散ベースのフレームワークである
写実的なポートレートを生成し、IDの忠実度が高く、顔の特徴が特定され、背景も様々である。
本手法では, 3次元顔予測器を用いて, 3次元顔の事前認識を再構築する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:15:41 GMT)
RMFlow: Refined Mean Flow by a Noise-Injection Step for Multimodal Generation [13.0] 平均フロー (MeanFlow) は効率よく高忠実な画像を生成することができるが、その単一関数評価 (1-NFE) 生成は説得力のある結果を得ることができないことが多い。
我々は、粗い1-NFE MeanFlowトランスポートと調整されたノイズ注入改善ステップを統合した、効率的なマルチモーダル生成モデルRMFlowを紹介する。
RMFlowは、1-NFEのみを使用してテキスト・トゥ・イメージ、コンテキスト・トゥ・分子、時系列生成に関する最先端の成果を、ベースラインのMeanFlowsに匹敵する計算コストで達成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:27:05 GMT)
Communications-Incentivized Collaborative Reasoning in NetGPT through Agentic Reinforcement Learning [12.9] 本稿では,AIネイティブなxGネットワークのための統合エージェントNetGPTフレームワークを提案する。
NetGPTコアは、自律的な推論を行うか、エージェント通信を介してドメイン特化エージェントにサブタスクを委譲することができる。
このフレームワークは、ネットワーク全体でスケーラブルで分散インテリジェンスを可能にする、明確な責任と相互運用性を確立する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:07:11 GMT)
CoRe-Fed: Bridging Collaborative and Representation Fairness via Federated Embedding Distillation [12.7] フェデレーテッド・ラーニング(FL)は、分散モデルトレーニングを通じて協調的なインテリジェンスを実現するための重要なアプローチとして登場した。
協調性と表現の公平性を橋渡しする統一最適化フレームワークであるCoRe-Fedを提案する。
我々はCoRe-Fedが最先端のベースラインアルゴリズムよりも公平性とモデル性能を向上させることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:41:00 GMT)
Exact Instance Compression for Convex Empirical Risk Minimization via Color Refinement [12.7] 実証的な二次リスク ERM (ERM) は計算に高価である。
カラーリファインメントに基づく凸最小化のための新しい圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:17:08 GMT)
One Loss to Rule Them All: Marked Time-to-Event for Structured EHR Foundation Models [12.6] 我々はイベントのタイミングと関連する測定値を共同でモデル化する時間とイベントの事前学習対象であるORAを提案する。
EHR構造を考慮した事前学習は、下流の能力と一般化可能性の拡大に不可欠である。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:15:46 GMT)
Test-time Generalization for Physics through Neural Operator Splitting [12.6] トレーニングオペレータの合成を探索し、未知のダイナミクスを近似する神経オペレータ分割戦略を導入する。
提案手法は,基礎となるPDEパラメータを復元しながら,最先端のゼロショット一般化結果を実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:08:57 GMT)
Hermes the Polyglot: A Unified Framework to Enhance Expressiveness for Multimodal Interlingual Subtitling [12.5] 言語間置換は、視覚メディアの字幕を対象言語に変換する。
Hermesは大規模言語モデルに基づく自動置換フレームワークである。
Hermesは最先端のダイアリゼーション性能を達成し、表現的かつ文脈的に一貫性のある翻訳を生成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:23:21 GMT)
Non-Contrastive Vision-Language Learning with Predictive Embedding Alignment [12.3] 分布正規化を伴う共同埋め込み予測に基づくNOn-contrastive Vision-Language AlignmentフレームワークであるNOVAを紹介する。
テキストエンコーダとしてCeriorBERTとMIMIC-CXRでスクラッチからトレーニングしたビジョントランスフォーマーを用いて,ゼロショット胸部X線分類におけるNOVAの評価を行った。
本研究は,非コントラスト的視覚言語事前学習が,コントラスト的手法よりもシンプルで,より安定的で,より効果的な代替手段を提供することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:57:46 GMT)
Deep networks learn to parse uniform-depth context-free languages from local statistics [12.2] 文だけで言語の構造がどのように学習できるかを理解することは、認知科学と機械学習の両方において中心的な問題である。
我々は,文脈自由文法(PCFG)のクラスを導入し,あいまいさの度合いとスケール間の相関構造を制御できる。
異なるスケールの相関関係が局所的曖昧性を持ち、データの階層的表現の出現を可能にする統一フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:35:06 GMT)
HumanStudy-Bench: Towards AI Agent Design for Participant Simulation [11.9] 大規模言語モデル (LLMs) は、社会科学実験のシミュレーション参加者としてますます使われている。
HUMANSTUDY-BENCHは、LLMベースのエージェントを編成し、人体実験を再構築するベンチマークおよび実行エンジンである。
科学的推論のレベルでの忠実度を評価するために,人間とエージェントの行動がどの程度一致しているかを定量化するための新しい指標を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:07:42 GMT)
Liouvillian gap closing--bound states in the continuum connection and diverse dynamics in a giant-atom waveguide QED setup [11.9] オープン量子系において、還元力学は一般にマスター方程式によって記述され、リウヴィリアンギャップ閉包(LGC)は一般に非コヒーレンスな部分空間の出現を示唆する。
対照的に、完全な系環境化合物の力学は、連続体(BIC)のバウンド状態が長寿命の量子資源を保護できるハミルトンスペクトルによって支配される。
ここでは、このギャップをパラダイム的巨大原子導波路プラットフォームにブリッジし、LGCの発生が必ずしもハミルトンの完全な記述におけるBICの存在をベンチマークしていることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:43:44 GMT)
Emergence of Distortions in High-Dimensional Guided Diffusion Models [11.8] CFG誘導サンプリングと真の条件分布のミスマッチとして定義される生成歪みの現象を定式化する。
標準CFGスケジュールはばらつきの縮小を防ぐことができないことを示す。
本稿では,クラス分離性を維持しながら多様性の喪失を緩和する負の誘導窓を特徴とする理論的動機付け型指導スケジュールを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:19:45 GMT)
Learning Heat-based Equations in Self-similar variables [11.4] 自己相似変数(SSV)における熱に基づく方程式の解学習について検討する。
我々は,標準的なニューラル・オペレーティング・トレーニングと互換性のあるSSVトレーニング・フレームワークを開発した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:16:32 GMT)
Small Shifts, Large Gains: Unlocking Traditional TSP Heuristic Guided-Sampling via Unsupervised Neural Instance Modification [11.2] トラベリングセールスマン問題(TSP)は、ルート計画において最も代表的なNPハード問題の一つである。
伝統的なツアーコンストラクタは計算的に効率的であり、非常に実用的であるが、その決定論的行動は探索を制限し、しばしば局所最適化につながる。
我々は,従来の決定論的ツアーコンストラクタにガイドサンプリング機能を持たせる新しいインスタンス修正フレームワークであるTSP-MDFを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:47:48 GMT)
Learning When to Jump for Off-road Navigation [11.0] 本研究では,実際のロボットの動きに条件付き地形コストを明示的にモデル化するための移動認識トラバーサビリティ表現を提案する。
MATを統合し,アジャイルのオフロードナビゲーションを可能にするシステムを開発した。
その結果、MATはリアルタイムの効率を向上し、オフロードナビゲーションの性能を向上させることがわかった。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:41:09 GMT)
Robustness of AutoML on Dirty Categorical Data [10.8] 自動機械学習(AutoML)の目標は、機械学習(ML)を行う際の試行錯誤を減らすことである。
近年の研究では、MLモデルが汚い分類データに対する形態的エンコーダの恩恵を受け、予測性能が向上することが示されている。
本稿では,分類データを数値データに変換するパイプラインを提案し,より高度な符号化方式によって変換された分類データをAutoMLで処理できるようにする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:05:59 GMT)
Optimizing Retrieval Components for a Shared Backbone via Component-Wise Multi-Stage Training [10.8] 本稿では,生産法定検索システムにおいて,共有バックボーンとしてデプロイされた検索コンポーネントを最適化するシステムレベルのソリューションを提案する。
我々は、高密度検索と再ランカのための多段階最適化フレームワークを採用し、異なる検索コンポーネントがステージ依存のトレードオフを示すことを示す。
得られたバックボーンはエンドツーエンドの評価を通じて検証され、複数の産業アプリケーションをサポートする共有検索サービスとしてデプロイされる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:29:32 GMT)
Safe Langevin Soft Actor Critic [10.7] 拘束強化学習における報酬と安全性のバランスをとるために,安全ランゲヴィン・ソフト・アクター・クリティカル(SL-SAC)を導入した。
SL-SACは10タスク中7タスクで最低コストを達成し,競争的リターンを維持していることを示す。
Safety-Gymnasiumでは、SL-SACは最先端のベースラインと比較して、速度タスクの19-63%のコスト削減を実現している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:06:35 GMT)
Physics-informed Diffusion Mamba Transformer for Real-world Driving [10.6] 本研究では,拡散過程にマンバと注意を埋め込む拡散マンバ変換器アーキテクチャを提案する。
また、エネルギーベースの物理的制約を拡散モデルにシームレスに統合するポート・ハミルトンニューラルネットワークモジュールを設計する。
我々のフレームワークは、予測精度、物理的妥当性、堅牢性において最先端のベースラインを著しく上回る。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:35:54 GMT)
FaceSnap: Enhanced ID-fidelity Network for Tuning-free Portrait Customization [10.5] FaceSnapは、単一の推論段階で一貫性のある結果を生成するために、単一の参照イメージのみを必要とする新しい方法である。
新しい顔属性ミキサーは、低レベル特定特徴と高レベル抽象特徴の両方から包括的融合情報を抽出することができる。
ランドマーク予測器は、異なるポーズのランドマークをまたいだ参照IDを保持し、多様な空間制御条件を提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:48:48 GMT)
Towards Multiscale Graph-based Protein Learning with Geometric Secondary Structural Motifs [10.4] タンパク質構造を学習するための強力なツールとして、グラフニューラルネットワーク(GNN)が登場した。
本稿では,タンパク質に合わせたマルチスケールグラフベースの効率的な学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:50:24 GMT)
Code Quality Analysis of Translations from C to Rust [10.4] C/C++は一般的なプログラミング言語である。しかしながら、メモリとスレッドセーフティの問題に悩まされている。
最近の研究で、Rustのようなより安全な言語へのC/C++の自動翻訳が検討されている。
本研究では、C2Rust(トランスパイラ)、C2SaferRust(LSM誘導トランスパイラ)、TranslationGymの3つのC-to-Rustトランスパイラの強度と弱点について検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:12:03 GMT)
SpyDir: Spy Device Localization Through Accurate Direction Finding [10.1] SpyDirは、電磁エマレーションを自動で無意識に放出することで、隠されたスパイIoTデバイスを正確にローカライズするシステムだ。
本システムの設計は, 可搬型スイッチングアンテナアレイと非コヒーレント平均化によるエマネーション向上アルゴリズムと, 新規な最適化に基づくスパルスAoAの導出により, 相対チャネルを活用可能なマルチパス分解アルゴリズムとを主成分とする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:01:48 GMT)
Improving Flow Matching by Aligning Flow Divergence [10.1] 条件付きフローマッチング(CFM)は、フローベース生成モデルをトレーニングする上で、効率的でシミュレーションのないアプローチである。
学習された確率経路と正確な確率経路の誤差に対する新しい偏微分方程式を解とともに導入する。
CFM損失と関連する発散損失の組合せにより, 2つの確率経路間の全変動ギャップが上界していることが示される。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:07:54 GMT)
A New Workflow for Materials Discovery Bridging the Gap Between Experimental Databases and Graph Neural Networks [10.1] 無機結晶構造データベース(ICSD)を用いた実験データベースと結晶情報ファイル(CIF)のアライメントプロセスを提案する。
本手法は,材料特性予測に最先端のモデルアーキテクチャを活用可能なデータベースの構築を可能にする。
平均絶対誤差 (MAE) とCCR (Correct Classification Rate) の両方において, 磁性材料の秩序温度と磁気接地状態の予測において有意な改善が認められた。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:44:02 GMT)
GTATrack: Winner Solution to SoccerTrack 2025 with Deep-EIoU and Global Tracklet Association [9.9] GTATrackは2025年のサッカートラックチャレンジで優勝した階層的な追跡フレームワークです。
提案手法は, 勝利率0.60, 偽陽性率982に有意に低下し, 魚眼サッカー追跡における最先端の精度を示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:08:48 GMT)
What Matters to an LLM? Behavioral and Computational Evidences from Summarization [9.6] 大規模言語モデル(LLM)は現在、要約の最先端にあるが、情報選択を駆動する重要な概念は依然として隠されている。
本稿では,行動解析と計算解析を組み合わせることで,この問題を考察する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:23:30 GMT)
SEER: Transformer-based Robust Time Series Forecasting via Automated Patch Enhancement and Replacement [9.5] 本研究では,SEERと呼ばれる時系列予測フレームワークを提案する。
実世界の時系列では、値の欠如、分散シフト、異常、ホワイトノイズなど、データ収集中にしばしば低品質の問題が発生する。
本稿では,2段階のプロセスを通じて,ロバスト性やモデルの精度を予測できるLearningable Patch Replacement Moduleを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:12:24 GMT)
Fast Non-Episodic Finite-Horizon RL with K-Step Lookahead Thresholding [9.4] 計画を次のKステップに切り換える K-step lookahead Q-function を導入する。
我々は報酬の最大化を目的としたアルゴリズムの性能を数値的に評価する。
実験により, 合成MDPおよびRL環境における最先端RL法よりも優れた累積報酬が得られた。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:44:12 GMT)
DIAMOND: Directed Inference for Artifact Mitigation in Flow Matching Models [9.3] DIAMONDは、推論中のアーティファクトを緩和するために軌道修正を適用する訓練不要の手法である。
生成軌道のすべてのステップでクリーンサンプルの見積を再構築することにより、DIAMONDは、人工物につながる潜在状態から生成プロセスを積極的に引き離す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:08:46 GMT)
Temporal Leakage in Search-Engine Date-Filtered Web Retrieval: A Case Study from Retrospective Forecasting [8.7] サーチエンジンの日付フィルタは、探索強化予測器の振り返り評価において、カットオフ前の検索を強制するために広く使用されている。
フィルターでGoogle検索を監査し、質問の71%は、強いカットオフ後のリークを含む少なくとも1ページを返却し、41%は、少なくとも1ページは、その答えを直接明らかにする。
我々は,更新記事,関連モジュール,信頼できないメタデータ/タイムスタンプ,不在信号などの共通リーク機構を特徴付け,時間的評価には日付制限探索が不十分であると主張する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:47:01 GMT)
Action-Free Offline-to-Online RL via Discretised State Policies [8.7] エージェントは$(s,r,s'$s)$sのみからなるデータセットから学ぶ必要がある。
我々は,行動よりも望ましい次の状態遷移を推奨する学習国家政策を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:53:04 GMT)
Over-Alignment vs Over-Fitting: The Role of Feature Learning Strength in Generalization [8.6] 本研究では,ロジスティック損失を学習した2層ReLUネットにおける勾配流れの動的解析法を開発した。
過度に大きいFLSは、一般化を低下させる$textitover-alignment$現象を誘導する一方、過度に小さなFLSは$textitover-fitting$を誘導する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:43:02 GMT)
Combinatorial Bandit Bayesian Optimization for Tensor Outputs [8.3] ブラックボックス関数を最適化する新しいテンソル出力BO法を提案する。
我々は、問合せ点を選択するための上限値(UCB)関数を開発する。
次に、クエリされた点と最適出力サブセットの両方を選択するために、新しいマルチアームバンディットUCB2基準を設計する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:16:44 GMT)
ILSIC: Corpora for Identifying Indian Legal Statutes from Queries by Laypeople [8.0] ある状況に対する法定法定識別(LSI)は、法定NLPにおける最も基本的なタスクの1つである。
In this work, we create ILSIC, a corpus of lay People query cover 500+statutes from Indian law。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:05:48 GMT)
MCERF: Advancing Multimodal LLM Evaluation of Engineering Documentation with Enhanced Retrieval [8.0] エンジニアリングルールブックと技術標準は、密集したテキスト、テーブル、イラストのようなマルチモーダル情報を含んでいる。
この研究は、大規模言語モデル推論とマルチモーダルレトリバーを結合するシステムである、マルチモーダルColPali Enhanced Retrieval and Reasoning Framework (RFMCE)を確立する。
これは、視覚言語検索、モジュール推論、適応的ルーティングが、エンジニアリングユースケースにおけるスケーラブルなドキュメント理解を可能にする方法を示している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:09:47 GMT)
A novel VAE-DML fusion framework for casual analysis of greenwashing in the mining industry [7.9] 鉱業チェーン企業は資源消費と環境への影響という点で重要な存在である。
発見は、まず、株式残高と企業グリーンウォッシングの間に有意な負の因果関係があることを示し、その実質的なガバナンス効果を確認した。
メカニズム分析は、エクイティバランスが、グリーンウォッシングを抑制するための3つの異なるチャンネルを通して運営されていることを明らかにしている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:32:14 GMT)
Bridging Time and Frequency: A Joint Modeling Framework for Irregular Multivariate Time Series Forecasting [7.7] IMTS予測のための統合時間周波数モデリングフレームワークであるTFMixerを提案する。
具体的には、TFMixerは、学習可能な非均一離散フーリエ変換(NUDFT)を用いて不規則なタイムスタンプからスペクトル表現を直接抽出するグローバル周波数モジュールを組み込んでいる。
並行して、Local Time Moduleは、情報的時間的パッチを適応的に集約し、情報密度の不均衡を軽減する、クエリベースのパッチミキシングメカニズムを導入している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:49:44 GMT)
Efficient Deep Learning for Medical Imaging: Bridging the Gap Between High-Performance AI and Clinical Deployment [7.6] このレビューは、医療領域に特化された効率的で軽量なディープラーニングアーキテクチャを包括的に合成する。
我々は、現代の効率的なモデルの展望を、畳み込みニューラルネットワーク(CNN)、軽量トランスフォーマー、新しい線形複雑度モデルという3つの主要なストリームに分類する。
現在の制限を特定し、デバイス上のインテリジェンスへの移行について議論することにより、このレビューは、高性能AIとリソース制約のある臨床環境の間のギャップを埋めることを目的とした、研究者や実践者のロードマップとなる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:42:36 GMT)
Mitigating Task-Order Sensitivity and Forgetting via Hierarchical Second-Order Consolidation [7.5] ランダムなタスク順序付けによって導入された高分散に対処するために、$textbfHierarchical Taylor Series-based Continual Learning (HTCL)$を導入する。
HTCLはグループ内で最高のタスクシーケンスを特定し、Hessian-regularized Taylor拡張を通じて結果のローカル更新を統合する。
HTCLはパフォーマンスを継続的に向上し、平均精度は7%$から25%$に向上し、最終的な精度の標準偏差はランダムなタスク置換で最大68%$に減少する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:50:59 GMT)
Convergent World Representations and Divergent Tasks [7.4] 我々は、基礎となる世界、データ生成プロセス、そして結果のモデル表現を明確に分離するフレームワークを開発する。
我々は、異なるタスクが質的に、定量的に異なる世界表現ジオメトリを生み出すことを発見した。
適応性を研究するために、全てのタスクでモデルを事前訓練し、新しい実体(都市)を表現空間に一貫して組み込むことができるかどうかをテストする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:59:15 GMT)
zkCraft: Prompt-Guided LLM as a Zero-Shot Mutation Pattern Oracle for TCCT-Powered ZK Fuzzing [7.3] zkCraftは決定論的、R1CS対応のローカライゼーションと証明付き検索を組み合わせて意味的不整合を検出するフレームワークである。
証明付きローカライゼーションは, 偽陽性が低い多彩な下限および過制約の断層を検出し, コストのかかるソルバ相互作用を低減できることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:31:00 GMT)
Improving Neuropathological Reconstruction Fidelity via AI Slice Imputation [7.2] 解剖画像の異方性3次元再構成からスライスをインプットして等方性ボリュームを生成する,計算効率の良い超解像ステップを導入する。
インプットボリュームは自動セグメンテーションを改善し、特に皮質および白質領域において高Diceスコアを達成した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:34:01 GMT)
Refining Strokes by Learning Offset Attributes between Strokes for Flexible Sketch Edit at Stroke-Level [7.2] ストロークレベルでのスケッチ編集は、ストローク拡張または置換によってソースストロークをターゲットスケッチに移植することを目的としている。
我々は、ターゲットスケッチのパターンと整合するように、変換によってソースストロークを洗練させるSketchModを提案する。
実験結果から,SketchModはストロークレベルのスケッチ編集において,正確かつ柔軟なパフォーマンスを実現することが示された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:19:47 GMT)
World Models as an Intermediary between Agents and the Real World [7.0] 本稿では,エージェントと現実世界の仲介者として,世界モデルを用いるべきだと論じる。
我々は、世界モデルが極端に非政治的な学習のような高コストな行動の基本的な障壁を克服する方法について論じる。
我々は、世界モデルが幅広い領域にまたがるエージェントに対して、批判的で豊かな学習信号を提供する方法を実証する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:52:00 GMT)
Test-Time Adaptation for Tactile-Vision-Language Models [6.9] 触覚ビジョン言語(TVL)モデルは、現実のロボットやマルチモーダルな知覚タスクにますます多くデプロイされている。
既存のテスト時間適応法は、一様条件下でのフィルタリングを提供するが、モーダルシフトの下でのモダリティの信頼性の明示的な扱いは欠如している。
本稿では,予測の不確実性と摂動に基づく応答からモダリティ毎の信頼性を推定する信頼性認識フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:26:01 GMT)
Diagnosing the Reliability of LLM-as-a-Judge via Item Response Theory [6.9] 項目応答理論(IRT)に基づくLCM-as-a-Judgeの信頼性評価のための2段階診断フレームワークを提案する。
本フレームワークはIRTのグレード・レスポンシブ・モデル(GRM)を採用し,(1)素早い変動下での計測行動の安定性として定義された本質的な一貫性,(2)人間のアライメント,人間の品質評価との対応,という2つの相補的な次元に沿って信頼性を定式化する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:24:08 GMT)
Context-Sensitive Pointer Analysis for ArkTS [6.6] ArkTSの既存の静的解析ツールは、効果的なトラッキングとオブジェクト参照関係の正確な推論を達成するのに苦労している。
本稿では,ArkTS用に設計された最初のコンテキスト依存型ポインタ解析フレームワークであるArkAnalyzer Pointer Analysis Kit (APAK)を提案する。
APAKは、ユニークなArkTSヒープオブジェクトモデルと高プラグインアーキテクチャを通じて、これらの課題に対処する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:12:30 GMT)
Towards Trustworthy Multimodal Recommendation [6.6] 現実のデプロイメントはますます重要になってきていますが、未調査の問題、すなわち信頼性を高めます。
現代のeコマースプラットフォームでは、マルチモーダルコンテンツは誤解を招くか、信頼できない。
本稿では,不確実なモダリティ特徴を緩和するモジュール・アンド・プレイのモダリティレベル補正コンポーネントを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:47:25 GMT)
NEST: Nested Event Stream Transformer for Sequences of Multisets [6.5] イベントストリームデータは、複数のイベントが共起し、結果として一連の多重セットとなる階層構造を示すことが多い。
イベントストリームデータのための既存の基盤モデル(FM)の多くは、この階層を1次元のシーケンスにフラット化します。
マルチセットのシーケンスからなるイベントストリームのためのFMであるNested Event Stream Transformer (NEST)を紹介する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:21:27 GMT)
SpeechLess: Micro-utterance with Personalized Spatial Memory-aware Assistant in Everyday Augmented Reality [6.5] SpeechLessは、パーソナライズされた空間記憶を基盤とした音声ベースの意図制御パラダイムを導入するウェアラブルARアシスタントである。
以上の結果から,SpeechLessは日常的な情報アクセスの向上,調音努力の削減,社会的に許容できる使用支援を,多様な日常生活環境において知覚されたユーザビリティや意図決定の精度を著しく低下させることなく実現できることが示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:01:32 GMT)
BLOCK-EM: Preventing Emergent Misalignment by Blocking Causal Features [6.5] 言語モデルが狭い範囲の教師対象に対して微調整されたときに、創発的なミスアライメントが発生する可能性がある。
本研究では,不整合動作を確実に制御する内部特徴の小さなセットを同定することにより,突発的不整合を防止するための機械的アプローチについて検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:11:05 GMT)
Reliability-Aware Determinantal Point Processes for Robust Informative Data Selection in Large Language Models [6.5] 本稿では,確率的データアクセスを考慮した信頼性を考慮したk-DPPの実装であるProbDPPを紹介する。
我々は、この信頼性を考慮した多様性を半帯域問題とみなし、オンライン上で未知の信頼性を効率的に学習するためのUPBスタイルのアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:14:33 GMT)
Bypassing Prompt Injection Detectors through Evasive Injections [5.9] 大規模言語モデル (LLM) は、対話型および検索拡張システムでますます使われているが、タスクドリフトに弱いままである。
近年の研究では、LLMの隠れ層の活性化デルタに基づいて訓練された線形プローブが、そのようなドリフトを効果的に検出できることが示されている。
我々は,これらの検出器の逆最適化接尾辞に対する堅牢性を評価する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:32:21 GMT)
Non-Clashing Teaching in Graphs: Algorithms, Complexity, and Bounds [5.7] グラフ内の閉近傍に対する(正の)非クラッシング教育を考える。
我々は、より一般的なパラメータのクラスのためのFPTアルゴリズムを含む改良されたアルゴリズム結果を提供する。
より広いグラフのクラスに対してより強い上限を得る。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:07:30 GMT)
Contrastive Learning for Privacy Enhancements in Industrial Internet of Things [5.7] 産業用IoT(Industrial Internet of Things)は、インテリジェントなセンシング、通信、分析を産業環境に統合する。
IIoTは、運用データの機密性のために、重要なプライバシと機密性リスクを導入している。
コントラスト学習は、ラベル付きデータと生のデータ共有への依存を減らすことによって、プライバシー保護分析のための有望なアプローチとして登場した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:11:57 GMT)
MCP-Atlas: A Large-Scale Benchmark for Tool-Use Competency with Real MCP Servers [5.5] ツール使用能力評価のための大規模ベンチマークであるMPP-Atlasを紹介する。
これには、現実的で多段階のオーケストレーションにおいて、ツール使用能力を評価するために設計された1000のタスクが含まれている。
モデルの最終回答で満たされた事実に基づく部分的信用を付与するクレームベースのルーブリックを使用してタスクをスコアする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 23:19:39 GMT)
Jailbreaking LLMs via Calibration [5.4] 本稿では,次点予測に対する安全アライメントの効果を,事前配向分布の系統的歪みとしてモデル化する枠組みを提案する。
クロスエントロピー損失下において,ロジット・アセスメティック・ジェイルブレーキング法が特別な場合であることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:17:36 GMT)
Search Inspired Exploration in Reinforcement Learning [5.4] 本稿では,エージェントの学習の進捗状況に基づいて,サブゴールを設定して探索を積極的に指導する手法を提案する。
検索にインスパイアされたサブゴールは、コスト・ツー・カムとコスト・ツー・ゴーの推定に基づいてフロンティアから優先順位付けされる。
挑戦的なスパース・リワード環境の実験では、SIERLは主要なタスク目標を達成することと、環境内の任意の状態に到達するための一般化の両方において、支配的なベースラインを上回ります。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:24:22 GMT)
ZS-TreeSeg: A Zero-Shot Framework for Tree Crown Instance Segmentation [5.4] 樹冠分割はバイオマス推定と生態モニタリングのためのリモートセンシングにおいて重要な課題である。
2つの成熟したタスクから適応するフレームワークであるZSegを提案する。
われわれのフレームワークはセンサタイプとキャノピーにまたがって堅牢に一般化されている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:48:17 GMT)
PolarMem: A Training-Free Polarized Latent Graph Memory for Verifiable Multimodal Agents [5.4] マルチモーダルエージェントは受動的観察者から長距離意思決定者へと進化する。
現在のメモリシステムは負の制約を符号化することができない。
トレーニング不要な偏極グラフメモリであるPolarMemを紹介する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:13:56 GMT)
FloydNet: A Learning Paradigm for Global Relational Reasoning [5.3] グラフニューラルネットワーク(GNN)は、メッセージパッシング機構によって根本的に制約されている。
この原則を具現化した新しいアーキテクチャであるFloydNetを紹介します。
FloydNetはグローバルな全対関係テンソルを維持し、一般化されたDP演算子を学び、それを徐々に洗練する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:59:59 GMT)
Video Understanding: Through A Temporal Lens [5.2] この論文は、映像要素間の時間的関係を利用して映像理解を促進する方法について、中心的な疑問を提起する。
本研究は,(1)大規模視覚言語モデルを用いた自動アノテーションフレームワークと,(2)低データ状態における時間的ダイナミクスを捉えるためのパラメータ効率のよい微調整戦略,(3)高効率な長期ビデオモデリングのためのステートスペースレイヤの統合,(4)動きと映像の微妙な関係を明示的にモデル化する新しいコントラスト学習フレームワークを提示する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:01:09 GMT)
High-resolution wide-field magnetic imaging with sparse sampling using nitrogen-vacancy centers [5.1] ダイヤモンド中の窒素空孔(NV)中心は定量的な磁気イメージングを可能にする。
少数の測定値から高解像度広視野画像を再構成するためのスパースサンプリング手法を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:54:19 GMT)
PCBSchemaGen: Constraint-Guided Schematic Design via LLM for Printed Circuit Boards (PCB) [5.0] プリント回路基板(PCB)のアーキテクチャ設計は、電子産業のあらゆる分野において重要な役割を担っている。
LLMエージェントと制約合成を組み合わせたPCBスキーマ設計のための最初のトレーニングフリーフレームワークであるPCBGenを紹介する。
その結果,PCBGenは設計精度と計算効率を大幅に向上することがわかった。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:39:43 GMT)
RoDiF: Robust Direct Fine-Tuning of Diffusion Policies with Corrupted Human Feedback [4.9] 拡散縮退鎖と環境力学を協調的に統合する統一マルコフ決定過程(MDP)の定式化を導入する。
本稿では,腐敗した人間の嗜好に明示的に対処するRoDiF(Robust Direct Fine-Tuning)を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:17:15 GMT)
Supervised sparse auto-encoders as unconstrained feature models for semantic composition [4.8] スパースオートエンコーダ (SAE) は機械的解釈可能性の顕著な方法として再登場している。
本稿では,制約のない特徴モデルを適応させることにより,これらの制約に対処する。
我々は、(デコーダのみ)SAEを監督し、スパースの概念埋め込みとデコーダ重みを共同で学習することで特徴ベクトルを再構築する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 22:47:54 GMT)
Quantum Phase Recognition via Quantum Attention Mechanism [4.5] 量子状態内の相関関係を抽出するハイブリッド量子古典的注意モデルを提案する。
モデルは100以上のトレーニングデータで高い分類精度を達成する。
複雑な多体システムにおいて、量子位相認識のためのスケーラブルでデータ効率のよいアプローチを提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:56:04 GMT)
Nationwide Hourly Population Estimating at the Neighborhood Scale in the United States Using Stable-Attendance Anchor Calibration [4.2] 現在の人口データセットは、主に静的であり、日々の移動によって引き起こされる人間の存在の強い時間的ダイナミクスを捉えることができない。
最近のスマートフォンベースのモビリティデータは、前例のない浸透範囲を提供しているが、これらの機会論的観察を正確な人口推定に翻訳することは依然として困難である。
そこで本稿では,アメリカ全土のブロック群における時給集団の存在感を再構築するための,SAAC (Stable-Attendance Anchor) フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:51:53 GMT)
Topology and Geometry of the Learning Space of ReLU Networks: Connectivity and Singularities [4.1] 本研究では,DAGとその誘起サブネットワークのトポロジーと特異点が複雑に結びついていることを示す。
これらの特異点の到達可能性について議論し、微分可能なプルーニングとの原理的な接続を確立する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:30:31 GMT)
Bridging Forecast Accuracy and Inventory KPIs: A Simulation-Based Software Framework [4.1] 本稿では,現実的な在庫管理環境における予測モデルの体系的評価を可能にする意思決定中心のシミュレーションフレームワークを提案する。
精度指標の改善が必ずしも改善につながるとは限らないことを示し、類似のエラープロファイルを持つモデルが異なるコストサービストレードオフを誘発できることを示した。
全体として、このフレームワークは需要予測と在庫管理をリンクし、予測精度から運用関連性へと評価をシフトさせる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:21:26 GMT)
Forecasting Energy Availability in Local Energy Communities via LSTM Federated Learning [4.1] 地域エネルギーコミュニティは、持続可能な発展のランドスケープにおいて重要な役割を担っている。
この課題に対処するためには、正確な予測を提供する予測モデルの開発と実装が不可欠である。
予測ソリューションの適用は、しばしばプライバシーの制約や規制によって妨げられる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:41:28 GMT)
CLAMP: Contrastive Learning for 3D Multi-View Action-Conditioned Robotic Manipulation Pretraining [4.0] 3次元多視点動作記述型ロボットマニピュレーション事前学習(CLAMP)のコントラスト学習について紹介する。
RGB-D画像とカメラ外部画像から計算した統合点雲から、深度と3次元座標によるマルチビュー4チャンネル画像観察を再レンダリングした。
事前訓練されたエンコーダは、オブジェクトの幾何学的および位置的情報とロボットのアクションパターンを関連付けることを学習する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 23:32:54 GMT)
Cross-Modal Binary Attention: An Energy-Efficient Fusion Framework for Audio-Visual Learning [4.0] CMQKAは、効率的なバイナリ演算によって線形O(N)複雑性を実現する新しいメカニズムである。
階層構造を持つエネルギー効率の良いマルチモーダル融合フレームワークであるSNNergyを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:55:06 GMT)
GraphNNK -- Graph Classification and Interpretability [4.0] グラフニューラルネットワーク(GNN)は,グラフ構造化データから学習するための標準的なアプローチとなっている。
非負のカーネル回帰(NNK)に関する最近の研究は、予測が類似のトレーニング例の凸結合として表現できることを実証している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:34:29 GMT)
Uncertainty and Fairness Awareness in LLM-Based Recommendation Systems [3.9] 本稿では,不確実性と公平性の評価が大規模言語モデル(LLM)の精度,一貫性,信頼性に与える影響について検討する。
我々は(エントロピーを通じて)予測の不確実性を定量化し、Google DeepMindのGemini 1.5 Flashが特定の機密属性に対して体系的に不確実性を示すことを示した。
本稿では,RecLLMに対する新たな不確実性評価手法を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:18:13 GMT)
ScratchEval : A Multimodal Evaluation Framework for LLMs in Block-Based Programming [3.9] スクラッチプログラムは、深くネストした非線形構造、イベント駆動のスプライト、およびコードとマルチメディアアセット間の密結合を示す。
ScratchEvalは、ScratchプログラムのLLMベースの修復を評価するために設計された最初の実行可能ベンチマークである。
このベンチマークは、自動プロジェクトマイニングとトリガーアウトカムセマンティクスのエキスパートバリデーションを組み合わせた、ヒューマン・イン・ザ・ループパイプラインを通じて構築されている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:44:22 GMT)
GAPNet: Plug-in Jointly Learning Task-Specific Graph for Dynamic Stock Relation [3.8] 本稿では,タスク固有のトポロジと表現をエンドツーエンドで共同で学習するグラフ適応プラグインネットワークであるGAPNetを提案する。
2つの実世界のストックデータセットを通して、GAPNetは、最先端のモデルとの比較において、収益性と安定性を継続的に向上することが示されている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:25:25 GMT)
DISK: Dynamic Inference SKipping for World Models [3.7] DISKは、自己回帰的世界モデルのためのトレーニング不要適応推論手法である。
我々は,高次遅延差分スキップ試験を自己回帰チェーン・オブ・フォワード体制にまで拡張する。
DISKは、L2計画誤差を維持しながら、軌道拡散の2倍のスピードアップとビデオ拡散の1.6倍のスピードアップを達成する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:28:27 GMT)
Test Behaviors, Not Methods! Detecting Tests Obsessed by Methods [3.6] 複数の振る舞いを検証するテストは理解が難しく、フォーカスが欠如し、本番コードとより結びついています。
本稿では, 単一生産方式の複数経路をカバーするテスト手法であるemphTest Obsessed by Methodを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:58:39 GMT)
Contrastive Domain Generalization for Cross-Instrument Molecular Identification in Mass Spectrometry [3.6] 本稿では,物質スペクトルを化学的に有意な分子構造埋め込み空間にマッピングするクロスモーダルアライメントフレームワークを提案する。
本モデルでは,固定256方向ゼロショット検索においてトップ1の精度42.2%を達成し,グローバル検索条件下での強い一般化を示す。
これらの結果は,MSデータから分子同定における一般化ボトルネックを解決するために,物理スペクトル分解能と分子構造埋め込みを明示的に統合することが重要であることを示唆している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:18:47 GMT)
BLADE: Better Language Answers through Dialogue and Explanations [3.5] 本稿では,会話アシスタントBLADE(Better Language Answers through Dialogue and Explanations)を紹介する。
BLADEは、コースコンテンツに対する検索拡張生成(RAG)フレームワークを使用している。
BLADEは最終的な回答を提供する代わりに、概念的理解をサポートするためにソースと直接の関わりを促す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:13:37 GMT)
Hallucination is a Consequence of Space-Optimality: A Rate-Distortion Theorem for Membership Testing [3.5] 大きな言語モデルはしばしば「ランダムな事実」に高い信頼を持って幻覚を与える
我々はそのような事実の記憶を会員試験問題として定式化する。
幻覚は, 損失圧縮の自然な帰結として持続することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:18:28 GMT)
Exploring Structural Complexity in Normative RAG with Graph-based approaches: A case study on the ETSI Standards [3.5] 本稿では,標準文書,標準文書,規制文書に対する高性能RAGソリューション構築のためのグラフRAGアーキテクチャの有効性について検討する。
この知識ギャップを解決するために,標準文書と規制文書のユニークな構造と語彙的特徴に合わせた特殊なRAG手法を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:00:43 GMT)
Exploration of Unary Arithmetic-Based Matrix Multiply Units for Low Precision DL Accelerators [3.1] 汎用行列乗算(GEMM)はディープラーニング(DL)の基本演算である
最近の研究は、従来のバイナリGEMMハードウェアに代わる新しい一元的GEMM設計を提案している。
我々は、将来のエッジAIアクセラレーターにおいて、一元的GEMMがエネルギー効率の高い計算に効果的に利用できるかを実証する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:10:55 GMT)
Schrödinger-Inspired Time-Evolution for 4D Deformation Forecasting [3.1] 本研究では、4次元予測のための深い畳み込みフレームワーク内に明示的な時間進化演算子を組み込む物理誘導型ニューラルネットワークを提案する。
我々は, 合成ベンチマークを用いて, 強度変形や磁場を含む将来の4次元状態の高精度かつ安定した予測を行う。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:17:04 GMT)
First-Principles Optical Descriptors and Hybrid Classical-Quantum Classification of Er-Doped CaF$_2$ [3.0] 本稿では、第一原理光ディスクリプタを用いて、ErドープCaF$からプリスタンスCaF$を識別するための古典量子機械学習フレームワークを提案する。
1系あたりのエネルギー分解点1,589点から、遷移エネルギー$E$、絶滅係数$$、吸収係数$$を含む物理的に解釈可能な記述子を抽出した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:43:59 GMT)
Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? When Hard Gating Hurts [3.0] 我々は、シュワルツ高次(HO)カテゴリが計算フルーガル予算(8GBGPU)下で有用な構造を提供するかどうかを検討する。
直接教師付きトランスフォーマー, (ii) ハードマスクで階層を強制するHO$rightarrow$valuesパイプライン, (iii) Presence$rightarrow$HO$rightarrow$values カスケード, 低コストアドオン (lexica, short context, topic) を比較した。
全体的にはHO構造は記述的に有用であるが、ハードゲートで強制することで文レベルの値検出が難しくなり、校正と軽量アンサンブルによる堅牢な改善がもたらされる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:50:35 GMT)
KAPSO: A Knowledge-grounded framework for Autonomous Program Synthesis and Optimization [3.0] KAPSOは、自律的なプログラム合成と最適化のためのモジュラーフレームワークである。
反復的にアイデア、コード合成、編集、実行、評価、学習を行い、実行可能なアーティファクトを改善する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:40:35 GMT)
Actor-Dual-Critic Dynamics for Zero-sum and Identical-Interest Stochastic Games [3.0] 本稿では,モデルフリー,ゲーム非依存,グラデーションフリーのゲームに対して,新たな独立かつペイオフベースの学習フレームワークを提案する。
無限地平線上の二エージェントゼロサムおよび多エージェント同一関心ゲームにおける(近似)リビリアへの収束を確立する。
これにより、両方の設定で理論的に保証された最初のペイオフベースで完全に分散化された学習アルゴリズムの1つが提供される。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:48:09 GMT)
OD-DEAL: Dynamic Expert-Guided Adversarial Learning with Online Decomposition for Scalable Capacitated Vehicle Routing [2.8] OD-BCCは、ハイブリッド遺伝検索(HGS)とオンラインバリセンタークラスタリング(conquer)分解を統合する大規模な学習フレームワークである。
OD- train graph attention network (GAT) によるミニマックスゲームによる生成ポリシー。
これにより、動的に大規模なデプロイメントを行うために必要な、秒単位のニューラルネットワーク品質推論が可能になる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:16:54 GMT)
Formal Semantic Control over Language Models [2.8] この論文は意味表現学習を進め、言語表現をより意味的に、幾何学的に解釈できるものにする。
VAEフレームワーク内でこの目標を追求し、2つの補完的な研究方向を探索する。
包括的な目的は、内部の意味表現を体系的に解釈できる言語モデルに移行することである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:12:53 GMT)
Predictive Maintenance for Ultrafiltration Membranes Using Explainable Similarity-Based Prognostics [2.8] 逆浸透脱塩では、ウルトラ濾過(UF)膜はファウリングにより劣化し、性能が低下し、コストダウンする。
本研究では, ファジィ類似性推論を用いたUF膜残留寿命推定法を提案する。
工業規模のUFシステムから12,528の運用サイクルでテストされたこのフレームワークは、専門家の理解と整合した解釈可能なルールベースを生成しながら、平均的な4.50サイクルの絶対誤差を達成した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:12:35 GMT)
Beyond the Node: Clade-level Selection for Efficient MCTS in Automatic Heuristic Design [2.8] Clade-AHD はノードレベルの点推定を clade-level Bayesian の信念に置き換える効率的なフレームワークである。
我々は,Clade-AHDが計算コストを大幅に削減しつつ,最先端の手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:26:23 GMT)
Minerva: Reinforcement Learning with Verifiable Rewards for Cyber Threat Intelligence LLMs [2.7] 大規模言語モデル(LLM)は、ノイズの多い非構造化されたセキュリティアーティファクトを自動化可能な表現に変換することを約束している。
CTI標準とコミュニティが保持するリソースは、モデル出力の決定論的検証を可能にする標準識別子とスキーマを定義する。
そこで本研究では,追加の検証トラジェクトリを生成し,それをモデルに戻す軽量な自己学習機構を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 05:01:01 GMT)
Stable Time Series Prediction of Enterprise Carbon Emissions Based on Causal Inference [2.7] 本研究では,分散シフト環境に適した時間的安定予測機構を提案する。
このメカニズムには、企業レベルのエネルギーインプット、資本投資、労働展開、炭素価格、政府の介入、政策実施の強化が含まれる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:32:21 GMT)
Distill3R: A Pipeline for Democratizing 3D Foundation Models on Commodity Hardware [2.7] Distill3Rは、3D基礎モデルの幾何学的推論を1台のワークステーションで完全に訓練可能なコンパクトな学生に蒸留するために設計されたフレームワークである。
提案手法は,(1)教師の重度推論を訓練ループから圧縮した監視信号で分離するオフラインキャッシュパイプライン,(2)教師の不確実性を活用して,コモディティハードウェア上でのトレーニングを可能にする信頼度の高い蒸留損失の2つの主要なイノベーションに焦点を当てた。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:56:45 GMT)
Culturally-Grounded Governance for Multilingual Language Models: Rights, Data Boundaries, and Accountable AI Design [2.5] 本稿では,多言語モデル行動,データ対称性,社会工学的害に関する既存の証拠を合成する。
学習データと評価実践における文化的・言語的不平等,グローバル展開と地域的標準,価値観,権力構造との相違,疎外化言語コミュニティが経験した害に対処するための限定的な説明責任機構の3つを識別する。
我々は、多言語モデルが、スケールと中立という概念の下で、既存のグローバルな不平等を再現しないことを保証するためには、文化的に根ざしたガバナンスが不可欠であると主張する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:47:30 GMT)
Reasoning by Commented Code for Table Question Answering [2.5] Table Question Answering (TableQA)は、大きな言語モデルにとって大きな課題となる。
既存手法は、エンドツーエンドの応答生成や一行のプログラムクエリに依存するが、数値的精度が限られており、解釈可能性も低下している。
この記事では、Pythonプログラム生成プロセスに明示的な推論を組み込んだ、コメント付き、ステップバイステップのコード生成フレームワークを紹介します。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:16:35 GMT)
From Detection to Prevention: Explaining Security-Critical Code to Avoid Vulnerabilities [2.5] この研究は、セキュリティクリティカルな機能を実装するコード領域を強調することによって、脆弱性を防止するための積極的な戦略を探求する。
コードレベルのソフトウェアメトリクスを使用してセキュリティクリティカルなメソッドを識別するIntelliJ IDEAプラグインのプロトタイプを提示する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:16:01 GMT)
Not All Students Engage Alike: Multi-Institution Patterns in GenAI Tutor Use [2.4] 生成的人工知能(GenAI)は、教室で個別の学習支援を提供するという前例のない機会を生み出している。
学生はこれらのツールを学習支援に役立たずに活用できるのではないかという懸念が高まっている。
本研究では,既存のGenAI Tutorの学生間相互作用ログと,それを組み込んだ学習管理システムを利用する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:43:29 GMT)
Multivariate Time Series Data Imputation via Distributionally Robust Regularization [2.3] 観測されたデータ分布と真のデータ分布の ミスマッチによる計算
分布ロバストな正規化インプタオブジェクト(DRIO)を提案する。
実験の結果、DRIOは不完全な非ランダム設定と不完全な非ランダム設定の両方で、一貫してインキュベーションを改善している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:15:03 GMT)
Robust and Real-Time Bangladeshi Currency Recognition: A Dual-Stream MobileNet and EfficientNet Approach [2.3] バングラデシュの新しい紙幣データセットを構築し、制御されたシナリオと実際のシナリオの両方を含む。
我々は、様々な複雑さをカバーし、モデルの一般化を改善するために、公開ベンチマークを含む4つの追加データセットを組み込んだ。
提案したモデルは、制御されたデータセットで97.95%の精度、複雑なバックグラウンドで92.84%、すべてのデータセットを組み合わせれば94.98%の精度が得られる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:37:16 GMT)
Eliciting Trustworthiness Priors of Large Language Models via Economic Games [2.3] そこで本研究では,テキスト内学習を反復的に学習する手法を提案する。
GPT-4.1の信頼性は、ヒトで観察されたものをよく追跡している。
提案手法は, ステレオタイプモデルを用いて, 信頼性の変動を適切に予測できることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:23:03 GMT)
Safety-Efficacy Trade Off: Robustness against Data-Poisoning [2.3] バックドアとデータ中毒攻撃は、既存のスペクトルと最適化ベースの防御を回避しながら、高い攻撃成功を達成することができる。
この挙動は偶発的ではなく、入力空間における基本的な幾何学的メカニズムから生じることを示す。
本研究は,バックドアが本質的に見えない状態にあることを証明し,入力空間曲率による毒性,検出性,防御の第一端の特徴付けを行う。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:22:00 GMT)
From Junior to Senior: Allocating Agency and Navigating Professional Growth in Agentic AI-Mediated Software Engineering [2.1] ソフトウェアエンジニアリングのエージェンシーは、個人の好みよりも組織的な方針に制約されている。
私たちは、コーディング、学習、メンターシップのためのソフトウェアエンジニアリングのエージェンシーを保存することに焦点を当てた3つのプラクティスを提案します。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:46:20 GMT)
Defusing Logic Bombs in Symbolic Execution with LLM-Generated Ghost Code [2.1] Gordianはハイブリッドなシンボリック実行フレームワークである。
軽量なゴーストコードを生成し、SMTソルバがソルバ-ホストコードのフラグメントを処理するのに役立つ。
従来のシンボリックな実行ベースラインよりも平均52~84%のカバレッジ向上を実現している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:14:57 GMT)
Hessian Spectral Analysis at Foundation Model Scale [1.9] 我々は、真のヘッセンの忠実スペクトル解析がフロンティアスケールで抽出可能であることを示す。
我々は、サブ10B体制を超えて、最初の大規模スペクトル密度推定を行う。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:57:06 GMT)
VIZOR: Viewpoint-Invariant Zero-Shot Scene Graph Generation for 3D Scene Reasoning [1.9] 3次元シーン推論(VIZOR)のための視点不変ゼロショットシーングラフ生成を提案する。
VIZORは、生の3Dシーンから直接、密集した視点不変の3Dシーングラフを構築する、トレーニングフリーでエンドツーエンドのフレームワークである。
注釈付きトレーニングデータを必要とすることなく、シーンオブジェクト間の空間的および近接的な関係を記述するオープン語彙関係を推論する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:11:27 GMT)
From Knowledge to Inference: Scaling Laws of Specialized Reasoning on GlobalHealthAtlas [1.9] textbfGlobalHealthAtlasは15の公衆衛生ドメインと17の言語にまたがる280,210のインスタンスからなる大規模多言語データセットである。
本稿では,大規模言語モデル (LLM) による検索,複製,エビデンスグラウンドチェック,ラベル検証を併用して構築・品質制御パイプラインを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:29:30 GMT)
Music Plagiarism Detection: Problem Formulation and a Segment-based Solution [1.7] 本稿では,音楽プラジャリズム検出が他のMIRタスクとどのように異なるかを定義する。
新たに定義されたタスクをサポートするために、Simisal Music Pairデータセットを導入します。
さらに,課題を解決する一つの方法としてセグメント転写に基づく手法を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:11:09 GMT)
PAIR-Former: Budgeted Relational MIL for miRNA Target Prediction [1.7] BR-MILパイプラインは、安価なフルプールスキャンを行い、CPU上で最大$K$の多様なCTSを選択し、選択したトークンに置換不変のSet Transformerを適用する。
miRAWでは、PAIR-Formerは実用的な運用予算で強力なプールベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:39:23 GMT)
DINO-AD: Unsupervised Anomaly Detection with Frozen DINO-V3 Features [1.6] 医用画像における非教師付き異常検出(AD)は,画素レベルのアノテーションに頼ることなく異常領域を識別することを目的としている。
DINO-V3表現に基づく新しい異常検出フレームワークDINO-ADを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:35:49 GMT)
NPNet: A Non-Parametric Network with Adaptive Gaussian-Fourier Positional Encoding for 3D Classification and Segmentation [1.5] NPNetは3Dポイントクラウド分類と部分分割のための非パラメトリックアプローチである。
最遠点サンプリング、k-アネレスト隣人、プールなどの決定論的演算子を使って、ポイント機能を構築する。
従来の非パラメトリックな手法と比較して、メモリ使用時間と推論時間が好ましい。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:16:19 GMT)
Open Materials Generation with Inference-Time Reinforcement Learning [1.4] 推論時間強化学習を用いたオープンマテリアル生成(OMatG-IRL)を紹介する。
OMatG-IRLは学習した速度場を直接操作し、スコアの明示的な計算を不要にする。
我々は,OMatG-IRLが時間依存性の速度アニールスケジュールを学習し,正確な結晶構造予測を可能にすることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:22:52 GMT)
Topological Residual Asymmetry for Bivariate Causal Direction [1.3] トポロジカル残留非対称性(英: Topological Residual Asymmetric)は、加法ノイズモデルに対する幾何学的基準である。
0D持続ホモロジー関数を用いてバルクチューブコントラストの定量化を行う。
多くの挑戦的な合成および実データシナリオに対する実験は、メソッドの優越性を実証している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:38:53 GMT)
Stealthy Coverage Control for Human-enabled Real-Time 3D Reconstruction [1.2] 本研究では,人間の3次元構造再構築のためのステルスリー・カバレッジ・コントロールと呼ばれる,新たな半自律画像サンプリング手法を提案する。
人間のフレキシブルな推論と状況認識機能を活用することでこの問題に対処する。
我々は,人間によるナビゲーションから効率的な画像サンプリングを行うために,ドローンの動きを分離するステルスリーカバレッジ制御を開発した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:41:13 GMT)
Product Interaction: An Algebraic Formalism for Deep Learning Architectures [1.2] 積の相互作用は、適切な代数上で定義された乗算作用素の合成からニューラルネットワーク層を構築する形式である。
我々の中心的な観察は、現代のニューラルネットワークにおける代数的表現は、線形、二次、高次の積の相互作用という観点で統一的な構成を持つことである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 07:14:01 GMT)
Foundation CAN LM: A Pretrained Language Model For Automotive CAN Data [1.1] Controller Area Network (CAN) バスは、自動車および自動車保険分野における応用のための車両信号の豊富な供給源を提供する。
既存のパイプラインは、主に、生のCANデータに基づいて、独立したタスク固有のモデルをトレーニングする。
本稿では,CANモデルの基本パラダイム,大規模事前学習,タスク固有の適応について紹介する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:00:48 GMT)
PyGALAX: An Open-Source Python Toolkit for Advanced Explainable Geospatial Machine Learning [1.1] PyGALAXは地理空間解析のためのPythonパッケージである。
自動機械学習(AutoML)と説明可能な人工知能(XAI)技術を統合する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:26:24 GMT)
Benchmarking Agents in Insurance Underwriting Environments [1.0] 既存のベンチマークは、コードのようなオープンドメインを過度に強調し、狭い精度のメトリクスを使い、真の複雑さを欠いている。
我々は、ドメインエキスパートとの密接なコラボレーションのために設計された、専門家優先のマルチターン保険書記ベンチマークUNDERWRITEを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:12:11 GMT)
Noise Resilient 1SDIQKD for Practical Quantum Networks [1.0] 片側デバイス非依存量子鍵分布(1-QKD)は、完全なデバイス非依存プロトコルと標準QKDとの間の実践的な中間層を提供する。
1-QKDフレームワークを拡張して、振幅減衰、デフォーカス、ノイズの脱分極を行い、キーレートと効率要求に対する影響を定量化する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:59:39 GMT)
On the Convergence of Jacobian-Free Backpropagation for Optimal Control Problems with Implicit Hamiltonians [0.8] 暗黙的なハミルトニアンによる最適フィードバック制御は、学習に基づく値関数法に根本的な課題をもたらす。
最近のWorkcitegelphman2025endでは、Jacobian-Free Backpropagation (JFB)を使って暗黙のディープラーニングアプローチを導入している。
我々は、JFBの収束保証をミニバッチ設定で確立し、その結果の更新が期待される最適制御目標の定常点に収束することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 22:25:46 GMT)
Responsible AI in Business [0.8] 責任あるAIを、法的に準拠し、理解可能で、持続可能で、データ支配的な方法で、AIシステムを導入し、運用する中心となる4つの領域に沿って構築する。
まず、EU AI Actを、プロバイダとデプロイロールの区別を含むリスクベースの規制フレームワークとして論じる。
第二に、説明可能なAIを透明性と信頼の基礎として扱い、透明性、解釈可能性、説明可能性といった重要な概念を明確にする。
第3に、Green AIをカバーし、AIシステムはパフォーマンスだけでなく、エネルギーとリソース消費によって評価されるべきである、と強調している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:24:20 GMT)
Shuffle and Joint Differential Privacy for Generalized Linear Contextual Bandits [0.8] シャッフル差分プライバシーと連立差分プライバシーに基づく一般化線形文脈帯域のアルゴリズムを提案する。
逆の文脈では、$tildeO(dsqrtT/sqrtvarepsilon)$ regret というジョイントDPアルゴリズムを提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:15:20 GMT)
Minimal Footprint Grasping Inspired by Ants [0.8] アリは、乱雑な物体をつかむ能力が高く、最近、前肢の相当な利用が観察された。
ここでは、ビンピッキング用途に適した、新しい低コストグリップパー設計のための機能的優位性をテストする。
本実装では, グリップ脚は長く細く, 高い摩擦グリップパッド, 低摩擦ヘア, 単節タルサスのような構造で, 昆虫のセタールパッド, 毛髪, タルシの対話的コンプライアンスを模倣する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 23:24:54 GMT)
SEISMO: Increasing Sample Efficiency in Molecular Optimization with a Trajectory-Aware LLM Agent [0.7] オンライン推論時間分子最適化エージェントSEISMOを紹介する。
集団ベースの学習やバッチ学習を必要とせずに、すべてのオラクルコール後に更新される。
従来の方法よりも曲線の2~3倍高い面積を達成し、50オラクルコール以内のタスクスコアに到達することが多い。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:23:48 GMT)
Partition of Unity Neural Networks for Interpretable Classification with Explicit Class Regions [0.7] 本稿では,学習したユニティの分割からクラス確率を直接発生させるアーキテクチャであるPUNN(Partition of Unity Neural Networks)を紹介する。
実験により、ガウスゲートを用いたPUNNは標準多層パーセプトロンの0.3-0.6%以内の精度を達成することが示された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:40:11 GMT)
Intention-Adaptive LLM Fine-Tuning for Text Revision Generation [0.7] 大規模言語モデル(LLM)は、コンテキストベースのテキスト生成タスクにおいて印象的な機能を達成した。
Intention-Tuning - 意図適応型レイヤワイドLLM微調整フレームワークを提案する。
Intention-Tuningは小さなリビジョンコーパスに対して効果的かつ効果的であることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:01:09 GMT)
Three-Way Emotion Classification of EEG-based Signals using Machine Learning [0.7] 本稿では,機械学習モデルが脳波信号の限られたデータセットを3つのクラスに分類する方法について述べる。
データ前処理やMLモデルの比較など、完全なワークフローも提示されている。
その結果,MLモデルは脳波信号の3方向感情分類に有効であることが示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:34:31 GMT)
Multimodal Machine Learning for Integrating Heterogeneous Analytical Systems [0.7] エンド・ツー・エンドのキャラクタリゼーションのための異種解析システムを統合する機械学習フレームワークを提案する。
本稿では,SEM画像から形態記述子を抽出し,得られた曲率,向き,交叉密度,空隙形状について述べる。
レーダプロットとUMAPによる可視化により、結晶性や絡み合いに応じてCNTフィルムの鮮明なクラスタリングが明らかになった。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:12:43 GMT)
Field evaluation and optimization of a lightweight autonomous lidar-based UAV system based on a rigorous experimental setup in boreal forest environments [0.5] 本研究では,自律型アンダーキャノピーUAVシステム評価のための標準化された実験装置を提案する。
提案手法は,最先端のオープンソースアルゴリズムを用いた軽量ライダーベースクオータを用いて実証された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:25:25 GMT)
A Hybrid Mamba-SAM Architecture for Efficient 3D Medical Image Segmentation [0.4] Mamba-SAMは、凍ったSAMエンコーダと、Mamba-based State Space Models (SSM)の線形時間効率と長距離モデリング機能を組み合わせた、新しくて効率的なハイブリッドアーキテクチャである。
本稿では,MFGC(Multi-Frequency Gated Convolution)を導入し,空間領域情報と周波数領域情報を3次元離散コサイン変換と適応ゲーティングにより共同解析することにより特徴表現を向上させる。
Dual-branch Mamba-SAM-Baseモデルでは、平均Diceスコアが0.906となり、UNet++ (0.907)に匹敵する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:51:17 GMT)
Analysis of Hessian Scaling for Local and Global Costs in Variational Quantum Algorithm [0.4] 変分量子アルゴリズムにおけるヘッセンのエントリーワイズ解の定量化を行う。
ショットノイズに対してヘッセン成分を解くのに必要なサンプルの複雑さを規定する2つの異なるスケーリング機構を示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:49:23 GMT)
Practical Quantum Reservoir Computing in Rydberg Atom Arrays [0.4] 量子貯水池コンピューティング(QRC)は、短期的な量子プラットフォームのための有望な量子機械学習フレームワークである。
本稿では,Rydberg 原子配列上に実装されたシングルステップQRC (SS-QRC) とマルチステップQRC (MS-QRC) アーキテクチャの比較数値解析を行った。
我々は,MS-QRCの性能が物質と脱コヒーレンスの基礎となる動的位相に非常に敏感であるのに対し,SS-QRCはより堅牢であることを示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:56:31 GMT)
Electro-optic conversion of itinerant Fock states [0.4] 超伝導量子ビットは、ユーティリティスケール量子コンピューティングの主要な候補である。
超伝導量子ビットから8.9GHzの波長で、単電子マイクロ波光子のオンデマンド発生とトモグラフィー再構成を実証した。
スループットとノイズのトレードオフを特徴とし,有意な絡み合い分布とゲートテレポーテーションを実現する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 22:57:06 GMT)
A Qualitative Study of IT Students' Skill Development: Comparing Online and Face- to-Face Learning Environments [0.3] この研究は、特に、オンラインおよび対面学習環境におけるIT学生の経験と認識されたスキル開発について、より深く理解しようと試みている。
データは、学生に焦点をあて、オンラインおよび対面学習環境を通じて、スキル開発に関する個人的な経験を求めることによって、半構造化されたインタビューを通じて収集された。
その結果、対面学習は、同期的な相互作用を経験しながら、より良いコミュニケーションと協調的なスキルをより効果的に発展させる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:12:22 GMT)
Mobile Exergames: Activity Recognition Based on Smartphone Sensors [0.3] 本研究では,Duck Catch & Fitと呼ばれる概念実証2Dエンドレスゲームを提案する。
スマートフォンの加速度計、ジャイロスコープ、磁気センサを使って、詳細なアクティビティ認識システムを実装している。
その結果,機械学習技術を用いて高い認識レベルの人間の活動を認識することが可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 16:36:33 GMT)
Ermakov-Lewis Invariants in Stationary Bohm-Madelung Quantum Mechanics [0.2] エルマコフ・ピニー方程式とその関連する不変性は、定常量子力学において自然に現れることを示す。
量子ポテンシャルは、追加の動的項として現れるのではなく、自己随伴作用素の曲率寄与として符号化されることを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:34:43 GMT)
Engineering AI Agents for Clinical Workflows: A Case Study in Architecture,MLOps, and Governance [0.2] 我々は、ヒューマン・イン・ザ・ループ(Human-in-the-Loop)ガバナンスモデルが、単に安全チェックとしてだけでなく、継続的な改善のための重要なイベント駆動データソースとして技術的に統合されていることを示す。
我々は、このプラットフォームをリファレンスアーキテクチャとして提示し、メンテナンス可能でスケーラブルで説明可能なAI対応システムを高レベルなドメインで構築するエンジニアに実践的な教訓を提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:33:57 GMT)
Early Classification of Time Series in Non-Stationary Cost Regimes [0.1] 時系列の早期分類(ECTS)は、できるだけ早く予測をしなければならない意思決定の問題に対処する。
既存の手法の多くは、学習目的を規定する時間依存意思決定コストは、既知の、固定された、そして正しく指定されていると仮定している。
本研究では,非定常性(非定常性)の実践的形態として,誤分類と意思決定遅延コストのバランスの漂流と,名目的訓練時間モデルから逸脱した意思決定コストの実現の2つについて検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 22:09:56 GMT)
Universal Quantum Birthmark: Ghost of the quantum past [0.0] 量子力学は初期状態の恒久的かつ普遍的な記憶を保持する。
この効果は量子誕生マーク(quantum birthmark)と呼ばれ、非定常状態の長時間の戻り確率の増大として現れる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:36:22 GMT)
Transformer-Based Model for Multilingual Hope Speech Detection [0.0] RoBERTaは英語で実装され、XLM-RoBERTaは英語とドイツ語の両方で実装されている。
RoBERTaを用いたシステムでは、重み付きf1スコアは0.818、精度は81.8%と報告されている。
一方、XLM-RoBERTaは重み付きf1スコア0.786、精度78.5%を達成した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:06:01 GMT)
The augmented NLP bound for maximum-entropy remote sampling [0.0] 最大エントロピーリモートサンプリング問題(MERSP)は、n個の確率変数の集合からs確率変数のサブセットを選択することである。
本稿では,パラメータの正のベクトルを用いて,MERSPのための新しい,非常に効果的な対角スケーリング手法を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:08:14 GMT)
The French Drama Revolution: Political Economy and Literary Production, 1700-1900 [0.0] ブルジョワのテーマは18世紀後半から最も一般的な話題の一つとなった。
以上の結果から、フランス革命後のフランス演劇の地域分布は著しく変化したことが示唆される。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:10:01 GMT)
Spin interferometry in a beam of ultracold molecules [0.0] YbF分子は光学モラセで冷却され、単一の内部量子状態で合成される。
ラマン転移は、平行磁場と電場で進化するスピン重ね合わせを作成する。
第2のラマン転移は、位相を2つの超微細状態の集団にマッピングする。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:18:25 GMT)
Single-site dissipation stabilizes a superconducting nonequilibrium steady state in a strongly correlated lattice [0.0] 超伝導秩序が強相関格子における開系力学の強誘引子となることを実証する。
リンドブラッドの進化は、真空から非平衡定常状態(NESS)に、マクロな$$$-pairオフ対角長距離秩序(ODLRO)で自律的にシステムをポンプすることを示した。
本研究は, 局所量子ジャンプ制御の最小化により, 非熱的誘引器として超伝導秩序を安定化するための耐障害性経路を確立した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:59:32 GMT)
Revising Bloom's Taxonomy for Dual-Mode Cognition in Human-AI Systems: The Augmented Cognition Framework [0.0] 認知行動は、個々に、生物学的リソースのみを使用して、または人間-AIシステムに分散する2つの異なるモードでますます発生します。
ブルームの分類学の既存の改訂では、AIは、この二重モード構造のドライバとしてではなく、人間の認知に対してマップされる外部能力として扱われている。
本稿では,3つの原則に基づいて構築された分類体系であるAugmented Cognition Framework (ACF)を提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:45:43 GMT)
RAG-GNN: Integrating Retrieved Knowledge with Graph Neural Networks for Precision Medicine [0.0] ネットワークトポロジは構造予測に優れるが、生体医学文献にエンコードされた機能的意味論を捉えることができない。
本稿では,グラフニューラルネットワーク表現を動的に検索した文献由来の知識と統合した検索拡張生成(RAG)組込みフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:05:02 GMT)
Quantum Geometry and Nonlinear Responses in Magnetic and Topological Quantum Materials [0.0] 論文は、量子幾何学、障害、磁気学、および量子材料におけるトポロジーの間の豊富な相互作用から生じる様々な非線形反応を探求する。
量子力学理論、久保公式、半古典的ボルツマン輸送理論の非線形応答系への一般化に加えて、新しい輸送効果の予測と、出現する物理的洞察について議論する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:05:12 GMT)
Pauli Cloners for Pauli Channels [0.0] 我々は、$N$-qubitレジスタの1対2のクローニングのための量子回路アーキテクチャを提案する。
ニウ・グリーフフィスアーキテクチャをマルチキュービットシステムに拡張することで、パウリクローンの幅広いクラスを実装している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:35:24 GMT)
Ocean Current-Harnessing Stage-Gated MPC: Monotone Cost Shaping and Speed-to-Fly for Energy-Efficient AUV Navigation [0.0] Current-Harnessing Stage-Gated MPCは、海流の「ヘルプフルネス」を示すステージごとのスカラーを通して海流を利用する。
提案手法は従来の予測制御よりもエネルギー消費を著しく低減する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 17:26:08 GMT)
Neuro-symbolic AI for Predictive Maintenance (PdM) -- review and recommendations [0.0] 我々は過去5年間に予測保守(PdM)の現状を体系的に検討してきた。
ディープラーニングに基づくデータ駆動手法は、従来の知識ベースシステムよりも高精度である。
我々は、より正確で説明可能な、解釈可能な、堅牢なシステムを構築するために、ハイブリッドアプローチをさらに推進し、ディープラーニングを記号論理(Neuro-symbolic AI)と統合することを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 13:47:27 GMT)
Near-losslesss method for generating thermal photon-bunched light [0.0] 光子束を呈する熱光源は、センシング用途に提案されている。
そこで本研究では,光子束生成における変換効率が,他の多くの光子束生成プロセスよりも約9桁高い光子束生成法を示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:02:52 GMT)
Multi-Head Attention Is a Multi-Player Game [0.0] クロスエントロピートレーニングは、頭の中で暗黙の潜在的なゲームを引き起こす。
勾配降下は、潜在的に非有界な非効率でナッシュ平衡に収束する。
我々はこれを GAME-LoRA として、Barlow Twins decorrelation と対数行列座標圧を組み合わせる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 18:49:49 GMT)
LatentTrack: Sequential Weight Generation via Latent Filtering [0.0] LatentTrack(LT)は、非定常力学の下でのオンライン確率予測のためのシーケンシャルニューラルネットワークである。
LTは低次元潜在空間で因果ベイズフィルタを行い、軽量なハイパーネットワークを用いて各時間ステップで予測モデルパラメータを生成する。
LTは、ステートフルなシーケンシャルおよび静的不確実性認識ベースラインよりも低い負の対数や平均二乗誤差を一貫して校正した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:22:59 GMT)
L-entropy: A new genuine multipartite entanglement measure [0.0] 我々は、純粋な状態における真のマルチパーティの絡み合いを特徴付ける新しい尺度として、潜伏エントロピー(L-エントロピー)を前進させる。
ランダム状態が2$一様状態に近似し,最大多部絡み合いを示すことを示す。
熱純量子状態の一般化であるMTPQ(Multipartite Thermal Pure Quantum)を多部系に導入する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 09:10:13 GMT)
GitEvo: Code Evolution Analysis for Git Repositories [0.0] ソフトウェアシステムのコード進化を分析することは、実践者、研究者、教育者にとって重要である。
Gitリポジトリのコード進化を分析するツールであるGitEvoを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 00:01:30 GMT)
Geometric Optimization for Tight Entropic Uncertainty Relations [0.0] エントロピック不確実性関係は量子情報理論において基本的な役割を果たす。
我々は、このタスクを量子確率空間上の幾何最適化問題として再考する。
この手順は、あらかじめ割り振られた数値精度を持つ有限次元量子系における一般的な測定のための効果的な外近似をもたらす。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 08:21:17 GMT)
Gaussian-Constrained LeJEPA Representations for Unsupervised Scene Discovery and Pose Consistency [0.0] 本稿では,これらの課題に対処するために,LeJEPA(Joint Embedding Predictive Architecture)にヒントを得たガウス制約表現の適用について検討する。
学習画像の埋め込みに等方的ガウス的制約を課すLeJEPAにインスパイアされたアプローチで, 段階的に改良されたパイプラインを3つ提示する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:52:54 GMT)
GRACE: an Agentic AI for Particle Physics Experiment Design and Simulation [0.0] GRACEは、高エネルギー・核物理学における自律的な実験設計のためのシミュレーションネイティブエージェントである。
第一原理モンテカルロ法による設計変更を自律的に探索する。
それは、繰り返しシミュレーション、物理動機付きユーティリティ機能、予算対応エスカレーションを通じて、候補設計を評価する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 01:12:55 GMT)
From Block Diagrams to Bloch Spheres: Graphical Quantum Circuit Simulation in LabVIEW [0.0] 本稿では,NI環境下で開発されたオープンソースの量子回路ツールキットQuVIを紹介する。
QuVIは、標準的な量子回路表記法と直感的で視覚的な類似を提供する。
このツールキットの能力は、基本量子アルゴリズムの構築と視覚化を通じて実証される。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 10:26:35 GMT)
Field-Theoretic Memory for AI Agents: Continuous Dynamics for Context Preservation [0.0] 本稿では、記憶された情報を偏微分方程式によって制御された連続フィールドとして扱うAIエージェントのメモリシステムを提案する。
確立された2つの長文ベンチマークにおいて,本システムの評価を行った。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 04:33:28 GMT)
Fidelity and quantum geometry approach to Dirac exceptional points in diamond nitrogen-vacancy centers [0.0] ディラック例外点 (EPs) は非エルミート特異点の新しいクラスを表す。
ダイヤモンド中の窒素空孔中心で実現されたディラックEPの量子幾何学を理論的に検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:30:58 GMT)
FISC: A Fluid-Inspired Framework for Decentralized and Scalable Swarm Control [0.0] 大規模マルチエージェントシステムの外部ループ制御のための分散化手法を提案し,評価を行った。
基礎流体要素特性と個別のロボットエージェント状態の関係を論じる。
流体のような性質をエージェントのサブセットに割り当てることで、Swarmは望ましい構造とコヒーレンスを維持しながら集合的に進化する。
その結果, 第一原理から導かれるマクロ構造を保持する連続系として, 大型ロボット群を扱える可能性が示された。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 03:04:38 GMT)
Evolving Interpretable Constitutions for Multi-Agent Simulation [0.0] 我々は,多エージェントLLMシステムにおける行動規範を自動的に発見するフレームワークであるコンスティチューショナル・エボリューショナル・エボリューションを提案する。
生存圧力を伴うグリッドワールドシミュレーションを用いて,個人と集団福祉の緊張関係について検討する。
我々の解釈可能な規則は、規定されるよりもむしろ協調規範を発見できることを示している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:41:43 GMT)
Evaluating Deep Learning-Based Nerve Segmentation in Brachial Plexus Ultrasound Under Realistic Data Constraints [0.0] 腕神経叢の超音波画像における深層学習に基づく神経セグメント化について検討した。
複数の超音波装置から合成したデータによるトレーニングは,低性能な取得源に正規化の利点をもたらすことが判明した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:02:05 GMT)
Entanglement-Dependent Error Bounds for Hamiltonian Simulation [0.0] 1階目のTrotterエラーは、最悪の$mathcalO(t2 n/r)$ではなく、$mathcalO(t2 S_textmax operatornamenamepolylog(n)/r)$としてスケールすることを示す。
これらの結果は、量子化学、凝縮物質シミュレーション、フォールトトレラント量子コンピューティングの資源推定に即座に応用できる。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:34:37 GMT)
Enhanced Phase Estimation via Photon-Added Two-Mode Squeezed States and Kerr Nonlinearity [0.0] 本稿では,Kerr非線形位相シフト器を内蔵したマッハ・ツェンダー干渉計について検討する。
提案手法は光子損失に対する強い堅牢性を示し、高精度な量子メトロジー応用に期待できるアプローチを提供する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 12:52:26 GMT)
Energy Absorption Interferometry [0.0] エネルギー吸収干渉法(EAI)は、個々の自由度の応答性と複素値空間偏光度を計測する手法である。
EAIは様々な理論的、実験的な方法で適用されてきた。
実用性にも拘わらず、電磁EAIの概要は網羅していない。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:21:06 GMT)
Domain-Adaptive and Scalable Dense Retrieval for Content-Based Recommendation [0.0] 本稿では,Amazon Reviews 2023 (Fashion) サブセットを微調整した2-towerバイエンコーダをベースとした,スケーラブルな高密度検索システムを提案する。
我々は、レビューテキスト(クエリプロキシとして)とアイテムメタデータ(ポジティブドキュメントとして)からトレーニングペアを構築し、500トークンの最大シーケンス長で50,000のサンプルインタラクションを微調整する。
826,402のカタログ項目に対するレビュー・ツー・タイトルのベンチマークでは、Recall@10が0.26(BM25)から0.66に改善されました。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:58:23 GMT)
Diffusion-Driven Inter-Outer Surface Separation for Point Clouds with Open Boundaries [0.0] そこで本研究では,二層化点雲から層間および層間を分離する拡散型アルゴリズムを提案する。
このソリューションは、屋内シーンモデリングや医用画像などの正確な表面表現を必要とするアプリケーションに特に有効である。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:11:28 GMT)
Constitutional Spec-Driven Development: Enforcing Security by Construction in AI-Assisted Code Generation [0.0] AIによる"バイブコーディング"は、迅速なソフトウェア開発を可能にするが、重大なセキュリティリスクをもたらす。
憲法仕様駆動開発(Constitutional Spec-Driven Development)は、非交渉可能なセキュリティ原則を仕様に組み込む方法論である。
憲法上の制約は、制約のないAI生成と比較してセキュリティ上の欠陥を73%削減することを示す。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 19:08:16 GMT)
Can Small Language Models Handle Context-Summarized Multi-Turn Customer-Service QA? A Synthetic Data-Driven Comparative Evaluation [0.0] 小言語モデル(SLM)は、より効率的な大言語モデル(LLM)の代替を提供する。
本研究では、コンテキスト対応マルチターン顧客サービスQAのための命令調整型SLMについて検討する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 11:27:25 GMT)
Benchmarking Automatic Speech Recognition for Indian Languages in Agricultural Contexts [0.0] インドにおける農業諮問サービスのデジタル化には、堅牢な自動音声認識システムが必要である。
本稿では,ヒンディー語,テルグ語,オディア語にまたがる農業環境におけるASR性能を評価するためのベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 15:04:21 GMT)
Asymmetry and dynamical criticality [0.0] 我々は多体モデルの対称性特性と量子非対称性の測度の間に直接接続を確立する。
興味深いことに、平均的な非対称性は力学臨界点の明確な符号を示す。
非対称性の生成と熱力学的不可逆性の間に定量的な関係が発見され、非対称性のピークは最大エントロピーの生成と一致することを示した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:06:24 GMT)
Agentic Observability: Automated Alert Triage for Adobe E-Commerce [0.0] 本稿では,Adobeのeコマースインフラ内に展開されるエージェント可観測性フレームワークについて述べる。
このフレームワークは、ReActパラダイムを使用して、自動で警告トリアージを実行する。
以上の結果から,エージェントAIは三重化遅延のオーダー・オブ・マグニチュード低減と,分解能のステップ・チェンジを可能にした。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 20:20:02 GMT)
A costing framework for fusion power plants [0.0] 本稿は,2017年から2024年までのARPA-E支援で実施した核融合発電プラントコスト作業の要約と集約である。
それは、関連する分析フレームワークの進化を、初期の資本コストに焦点を当てた研究から、標準に準拠した監査可能なコスト処理能力まで、文書化している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:59:10 GMT)
A Hierarchical and Attentional Analysis of Argument Structure Constructions in BERT Using Naturalistic Corpora [0.0] 本研究では,トランスフォーマーモデルからの双方向表現が4つの基本配置構造をどのように処理するかを検討する。
我々は,MDS,t-SNEを次元還元として,一般識別値(GDV)をクラスタ分離指標として,FDR(Fisher Discriminant Ratio)を線形診断探索として,アテンションメカニズム解析として,多次元分析フレームワークを採用している。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 06:31:18 GMT)
A Gradient Boosted Mixed-Model Machine Learning Framework for Vessel Speed in the U.S. Arctic [0.0] 我々は2010-2019年における自動識別システム(AIS)データを解析し,地上における船体速度(SOG)について検討した。
我々は2段階の機械学習フレームワークを適用し、まず0以上のSOGの確率をモデル化し、次に正のSOG条件をモデル化した。
結果: 船舶群, 船舶群, 航行状態の変化が二次変動を導入したのに対し, 沿岸域と潜水深度との距離は, 船舶速度の確率と大きさの双方において支配的要因であった。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 14:53:28 GMT)
A Baseline Multimodal Approach to Emotion Recognition in Conversations [0.0] 本研究では,Sitecom Friends から構築したSemEval-2024 Task 3 データセットを用いて,会話における感情認識のための軽量なマルチモーダルベースラインを提案する。
本報告の目的は,新しい最先端手法を提案するのではなく,アクセス可能な参照実装を文書化することである。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 21:54:18 GMT)
A 30-item Test for Assessing Chinese Character Amnesia in Child Handwriters [0.0] デジタル時代には、手書きはタイピングによって大きく置き換えられ、手書きの習熟度は低下した。
文字が正しく書けることの難しさは、文字が認識できるにもかかわらず、文字が正しく書けることの難しさである。
幼児の漢字の健常度を評価するための評価法を開発した。
論文参考訳(メタデータ) (Sat, 31 Jan 2026 02:35:25 GMT)