DreamDojo: A Generalist Robot World Model from Large-Scale Human Videos [111.0] 私たちはDreamDojoを紹介します。DreamDojoは、多種多様なインタラクションと、エゴセントリックな人間ビデオの44万時間から厳密なコントロールを学ぶ基礎的な世界モデルです。
本研究は, 遠隔操作, 政策評価, モデルベース計画など, 生成的世界モデルに基づくいくつかの重要な応用を可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:49:43 GMT)
LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning [107.6] テキスト生成から化学的導出を分離する潜在推論インタフェースであるLatntChemを紹介する。
我々は,LatentChemがChemCoTBench上のCoTベースラインの強いベースラインに対して59.88%の非ティー勝利率を達成したことを示す。
その結果, 化学推論は連続潜伏力学としてより自然かつ効果的に実現されているという実証的証拠が得られた。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:28:27 GMT)
Efficient-LVSM: Faster, Cheaper, and Better Large View Synthesis Model via Decoupled Co-Refinement Attention [105.1] Efficient-LVSMは、インプットビューにビュー内自己アテンションを適用し、ターゲットビューに自己テーマ横断アテンションを適用するデュアルストリームアーキテクチャである。
2つの入力ビューを持つRealEstate10Kでは29.86dBのPSNRを実現し、LVSMを0.2dBで上回り、2倍高速なトレーニングコンバージェンスと4.4倍高速な推論速度を実現している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:11:58 GMT)
FlowConsist: Make Your Flow Consistent with Real Trajectory [99.2] 現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:24:23 GMT)
Anchored Decoding: Provably Reducing Copyright Risk for Any Language Model [99.2] 現代の言語モデル(LM)は、トレーニングデータの一部を記憶し、動詞のスパンを出力する傾向がある。
提案するAnchored Decodingは,動詞の模倣を抑えるためのプラグアンドプレイ推論時間法である。
本手法は,著作権リスクとユーティリティの長期評価において,6組のモデルペアで評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:00:14 GMT)
SE-Search: Self-Evolving Search Agent via Memory and Dense Reward [87.8] Retrieval augmented generation (RAG)は、検索した外部知識を条件づけることにより、大規模言語モデル(LLM)における幻覚や事実エラーを低減する。
既存の手法は、無関係または騒々しい文書を蓄積し、希少な強化学習信号に依存することが多い。
我々は,3つのコンポーネントによるオンライン検索行動を改善するセルフ進化検索エージェントであるtextbfSelf-textbfEvolving textbfSearchを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:14:07 GMT)
AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research [85.5] AgentCPM-Reportは軽量だが高性能なローカルソリューションで、人間の記述プロセスを反映したフレームワークで構成されている。
我々のフレームワークは、モデルがアウトラインを動的に修正できるWARP(Writeing As Reasoning Policy)を使用している。
DeepResearch Bench、DeepConsult、DeepResearch Gymの実験は、AgentCPM-Reportが主要なクローズドソースシステムより優れていることを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:45:04 GMT)
AgentCPM-Explore: Realizing Long-Horizon Deep Exploration for Edge-Scale Agents [75.7] AgentCPM-Exploreは、知識密度と強力な探索能力を備えたコンパクトな4Bエージェントモデルである。
本稿では,パラメータ空間モデルの融合,報酬信号の復調,文脈情報の改良を特徴とする総合的なトレーニングフレームワークを提案する。
AgentCPM-Exploreは4つのベンチマークで8BクラスのSOTAモデルにマッチまたは超え、また5つのベンチマークでClaude-4.5-SonnetやDeepSeek-v3.2のような大規模モデルよりも優れている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:24:59 GMT)
Learning a Generative Meta-Model of LLM Activations [75.3] ネットワークの内部状態の分布を学習する"メタモデル"を作成します。
ステアリング介入前に学んだメタモデルを適用することで、損失が減少するにつれて、流速が向上する。
これらの結果は、生成的メタモデルが制限的な構造的仮定を伴わずに、解釈可能性へのスケーラブルな経路を提供することを示唆している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:59:56 GMT)
PlugMem: A Task-Agnostic Plugin Memory Module for LLM Agents [74.4] タスク固有の再設計なしに任意のLLMエージェントにアタッチ可能なタスク非依存メモリモジュールであるPlugMemを提案する。
意思決定関連情報が生の経験よりも抽象的な知識として集中しているという事実に感銘されて、認識科学に焦点をあてて、エピソード記憶をコンパクトで知識中心の記憶グラフに構造化する。
PlugMemを3つのベンチマーク(長期会話型質問応答、マルチホップ知識検索、Webエージェントタスク)で評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:55:38 GMT)
Steering LLMs via Scalable Interactive Oversight [74.1] 大規模な言語モデルは、エンフェーブコーディングのような複雑で長期にわたるタスクをますます自動化し、監督のギャップが生まれています。
スケーラブルな監視において重要な課題は、人間が責任を持ってAIシステムを、特定または検証する能力を超えたタスクで操ることができることだ。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:24:00 GMT)
WorldEdit: Towards Open-World Image Editing with a Knowledge-Informed Benchmark [72.1] 我々は、世界主導の画像編集を可能にするために設計されたデータセットであるtextbfWorldEditを紹介した。
WorldEditは高品質な編集サンプルで構成され、現実世界の因果論理と一致するパラフレーズの命令でガイドされる。
その結果,提案手法はGPT-4oとNano-Bananaとのギャップを著しく狭めることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:42:30 GMT)
When RL Meets Adaptive Speculative Training: A Unified Training-Serving System [72.0] Auroraは、生の推論トレースから直接投機子を直接学習することでループを閉じる統一的なトレーニングサービスシステムである。
我々の設計では,SGLangベースの推論サーバを非同期トレーニングサーバと統合し,サービス中断なしにホットスワップされた投機装置の更新を可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:28:54 GMT)
Is Gradient Ascent Really Necessary? Memorize to Forget for Machine Unlearning [72.0] 勾配上昇(GA)に代わるモデル外挿法を提案する。
言い換えると、記憶モデルから参照モデルへの外挿によって、忘れモデルが得られる。
モデル外挿法の実装はシンプルで効率的であり、トレーニング全体を通して効果的に収束し、未学習のパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:11:27 GMT)
TermiGen: High-Fidelity Environment and Robust Trajectory Synthesis for Terminal Agents [70.7] TermiGenは検証可能な環境とレジリエントな専門家軌道を合成するためのエンドツーエンドパイプラインである。
TermiGen-Qwen2.5-Coder-32B は TerminalBench 上で 31.3% のパスレートを達成した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:56:50 GMT)
R-Align: Enhancing Generative Reward Models through Rationale-Centric Meta-Judging [70.0] 解析精度は, 標準ラベルの精度を超えて, 下流RLHFの結果を高い精度で予測できることが示される。
我々は,金の判断でトレーニングを増強し,合理的アライメントを明示的に監督するR-Alignを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:17:11 GMT)
An Integer Linear Programming Approach to Geometrically Consistent Partial-Partial Shape Matching [69.6] 部分部分的な形状マッチングの課題に対処するために特別に設計された最初の整数線形プログラミング手法を導入する。
提案手法は, 一致誤差と滑らかさの両面から, 高品質なマッチング結果を実現する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:34:52 GMT)
Live Knowledge Tracing: Real-Time Adaptation using Tabular Foundation Models [67.8] ディープ・ナレッジ・トレーシング・モデルは、学生の学習軌跡をモデル化する上で大きなブレークスルーを達成している。
固定トレーニングセットでのオフライントレーニングを必要とする従来の手法では、オンライン手法でリアルタイムの'生きた'知識トレースを実行しています。
最大273倍のスピードアップで予測競合性能を達成できることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:49:28 GMT)
Envy-Free Allocation of Indivisible Goods via Noisy Queries [66.2] エージェントのバリュエーションを直接観察できない、かなり分割不可能な商品を割り当てる問題を導入する。
本手法では,要求されるクエリ数の上限値と上限値の上限値を求める。
我々の上限は、非適応的なクエリと計算時間で実行される単純なしきい値に基づくアロケーションアルゴリズムに基づいている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:44:40 GMT)
Same Answer, Different Representations: Hidden instability in VLMs [65.4] 本稿では,内部埋め込みドリフト,スペクトル感度,構造的滑らかさを計測する表現認識・周波数認識評価フレームワークを提案する。
このフレームワークを,SEEDBench,MMMU,POPEデータセットを対象とする最新のビジョン言語モデル(VLM)に適用する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:24:26 GMT)
ConsisDrive: Identity-Preserving Driving World Models for Video Generation by Instance Mask [65.4] ConsisDriveは、インスタンスレベルで時間的一貫性を強制するために設計された、ID保存駆動の世界モデルである。
当社のフレームワークには,インスタンスマインド・アテンションとインスタンスマインド・ロスという,2つの重要なコンポーネントが組み込まれています。
ConsisDriveは最先端の駆動ビデオ生成品質を実現し、nuScenesデータセット上での下流での自律運転タスクを大幅に改善した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:31:51 GMT)
CineScene: Implicit 3D as Effective Scene Representation for Cinematic Video Generation [65.0] 映像生成に暗黙的な3D認識シーン表現を活用するフレームワークであるCineSceneを提案する。
CineSceneは、シーン一貫性のある映像生成において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:59:24 GMT)
From Conflict to Consensus: Boosting Medical Reasoning via Multi-Round Agentic RAG [65.0] 大規模言語モデル(LLM)は、医学的質問応答において高い推論能力を示す。
幻覚や時代遅れの知識を生み出す傾向は、医療分野において重大なリスクをもたらす。
既存の手法はノイズの多いトークンレベルの信号に依存しており、複雑な推論に必要なマルチラウンドの改良は欠如している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:25:30 GMT)
Adversarial Learning in Games with Bandit Feedback: Logarithmic Pure-Strategy Maximin Regret [64.7] ゼロサムゲームを学ぶことは、ゲーム理論と機械学習の基本的な問題である。
ビジットフィードバックによるゼロサムゲームにおける対戦学習について検討し,最大戦略に対する障害を最小限に抑えることを目的とした。
我々は,Tsallis-INFアルゴリズムがゲーム依存パラメータ$c$で$O(c log T)$インスタンス依存後悔を実現することを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:26:01 GMT)
Prompt Reinjection: Alleviating Prompt Forgetting in Multimodal Diffusion Transformers [64.4] テキスト・画像生成のためのマルチモーダル拡散変換器(MMDiT)は、テキストと画像の分岐を別々に維持する。
テキスト分岐におけるプロンプト表現のセマンティクスは、深さが増加するにつれて徐々に忘れられていく。
これらの知見に触発されて、我々は、早期層から後層へのプロンプト表現をリジェクションする、トレーニング不要なアプローチを導入し、このことを忘れないようにした。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:19:53 GMT)
Generative Modeling via Drifting [63.4] 本稿では,訓練中の前進方向の分布を進化させ,一段階の推論を自然に認めるDrifting Modelsという新しいパラダイムを提案する。
実験では,1ステップのジェネレータが256 x 256の解像度でImageNetの最先端結果を達成し,FIDは潜時空間で1.54,ピクセル空間で1.61である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:18:33 GMT)
Semantically Labelled Automata for Multi-Task Reinforcement Learning with LTL Instructions [61.5] エージェントが単一のユニバーサルポリシーを学習する環境であるマルチタスク強化学習(RL)について検討する。
本稿では,新世代の意味翻訳を利用したタスク埋め込み手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:46:27 GMT)
Rethinking Multi-Condition DiTs: Eliminating Redundant Attention via Position-Alignment and Keyword-Scoping [61.5] マルチコンディション制御は従来のコンカデント・アンド・アットエンドの戦略によってボトルネックとなる。
分析の結果,これらの相互作用の多くは空間的にも意味的にも冗長であることがわかった。
本稿では,これらの冗長性を解消するための高効率なフレームワークであるPKAを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:39:10 GMT)
SAGE: Benchmarking and Improving Retrieval for Deep Research Agents [60.5] SAGEは4つの科学領域にわたる1200のクエリからなる科学文献検索のためのベンチマークであり、20万の論文検索コーパスを備える。
6つのディープ・リサーチ・エージェントを評価し,全てのシステムが推論集約的な検索に苦しむことを発見した。
BM25は、既存のエージェントがキーワード指向のサブクエリを生成するため、LLMベースのレトリバーを約30%上回っている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:59:37 GMT)
A Lightweight Library for Energy-Based Joint-Embedding Predictive Architectures [58.3] JEPA(Joint-Embedding Predictive Architectures)を用いた表現と世界モデルを学習するためのオープンソースのライブラリであるEB-JEPAを提案する。
JEPAsは、ピクセル空間ではなく表現空間で予測することを学び、生成モデリングの落とし穴を避ける。
これらの表現がどのように行動条件付き世界モデルを駆動し、Two Roomsナビゲーションタスクで97%の計画成功率を達成するかを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:10:14 GMT)
MuCo: Multi-turn Contrastive Learning for Multimodal Embedding Model [57.9] Multi-Turn Contrastive Learning (MuCo)は、このプロセスを再考する対話にインスパイアされたフレームワークである。
新たな5Mマルチモーダルマルチターンデータセット(M3T)による MuCo の表示実験
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:18:33 GMT)
DimABSA: Building Multilingual and Multidomain Datasets for Dimensional Aspect-Based Sentiment Analysis [57.7] DimABSAは、従来のABSA要素とVAスコアの両方に注釈を付けた最初の多言語次元ABSAリソースである。
このリソースには、42,590の文にわたる76,958のアスペクトインスタンスが含まれており、6つの言語と4つのドメインにまたがっている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:59:21 GMT)
Taming SAM3 in the Wild: A Concept Bank for Open-Vocabulary Segmentation [57.4] TextscConceptBankは、視覚的証拠とプロンプトの整合性を取り戻すためのフレームワークだ。
我々のアプローチは、クラスワイドなビジュアルプロトタイプによるターゲットドメインの証拠をアンロックし、(textitii)マイニングの代表者はデータドリフト下でのアウトリーチを抑えることをサポートし、(textitiii)コンセプトドリフトの修正のために候補概念を融合させる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:59:11 GMT)
Mimetic Initialization of MLPs [56.8] 本手法をチャネル混合層,すなわち多層パーセプトロン(MLP)に適用するための最初の試みを示す。
CIFAR-10やImageNet-1kのような小さなビジョンタスクのトレーニングをスピードアップします。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:59:17 GMT)
Soft Forward-Backward Representations for Zero-shot Reinforcement Learning with General Utilities [55.5] フォワード・バックワードアルゴリズムは、任意の標準RL問題をほぼ解決できるポリシーの族を検索することができる。
汎用ユーティリティを用いたRLのより大きい問題クラスに取り組み、その目的は占有率の任意の微分可能関数である。
この複雑さは、フォワード・バックワードアルゴリズムの新たな最大エントロピー(ソフト)変種によって捉えられることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:24:37 GMT)
SHINE: A Scalable In-Context Hypernetwork for Mapping Context to LoRA in a Single Pass [55.3] Shineはスケーラブルなハイパーネットワークで、様々な意味のあるコンテキストを大規模言語モデル(LLM)用の高品質なLoRAアダプタにマッピングできる
プリトレーニングと命令の微調整パイプラインを導入し,高速なLoRAアダプタを1回のフォワードパスで生成するようにハイパーネットワークを訓練する。
本研究は, SFT による LLM 適応と比較して, 処理時間, 計算時間, メモリコストを大幅に削減し, スケーリングの可能性を示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:40:31 GMT)
World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy [55.0] World-VLA-Loopは、世界モデルとVision-Language-Action (VLA) ポリシーの共同改良のためのクローズドループフレームワークである。
本研究では,将来観測と報奨信号の同時予測により,高忠実度インタラクティブシミュレータとして機能する状態認識型ビデオワールドモデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:57:55 GMT)
On the Plasticity and Stability for Post-Training Large Language Models [54.8] 塑性と安定性勾配の矛盾として根本原因を同定する。
本稿では,確率的衝突解決法(PCR)を提案する。
PCRはトレーニングの軌道を著しく滑らかにし、様々な推論タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:31:26 GMT)
PlanViz: Evaluating Planning-Oriented Image Generation and Editing for Computer-Use Tasks [52.5] コンピュータ用タスクの画像生成と編集を行うための新しいベンチマークであるPlanVizを提案する。
ルート計画、ワークダイアグラム、Web&UI表示の3つの新しいサブタスクが設計されている。
総合的かつ正確な評価の課題に対して,タスク適応型スコアであるPlanScoreを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:47:16 GMT)
ANCHOR: Branch-Point Data Generation for GUI Agents [52.2] デスクトップ環境向けのエンドツーエンドGUIエージェントは、大量の高品質なインタラクションデータを必要とする。
本稿では,拡張フレームワークであるAnchorについて紹介する。このフレームワークは,小規模で検証済みのシードデモから,スケーラブルなデスクトップ監視をブートストラップする。
OSWorldとWindowsAgentArenaの標準デスクトップベンチマークの実験では、拡張されたコーパスに微調整されたモデルが一貫した改善を実現している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:55:26 GMT)
A Complete Equational Theory for Real-Clifford+CH Quantum Circuits [51.6] この断片の回路間の等価性の簡単な集合を与え、他の真の方程式がこれらから導出できることを証明する。
これは有限生成された量子回路の普遍的な断片に対する最初の完全性の結果であり、パラメータ化されたゲートはなく、アシラも不要である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:11:39 GMT)
FlashBlock: Attention Caching for Efficient Long-Context Block Diffusion [51.2] FlashBlockは、安定したアテンション出力を再利用し、拡散プロセスを変更することなくアテンション計算とKVキャッシュアクセスを減らす、キャッシュされたブロック外部アテンションメカニズムである。
拡散言語モデルとビデオ生成の実験では、1.44$times$高いトークンスループットと1.6$times$の注意時間を短縮し、生成品質に無視できない影響を与えている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:20:17 GMT)
Graph homophily booster: Reimagining the role of discrete features in heterophilic graph learning [51.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データをモデリングするための強力なツールとして登場した。
既存のGNNは、接続ノードが異なる特徴やラベルを持つ傾向がある異種グラフとしばしば苦労する。
我々は、グラフ変換を慎重に設計し、グラフをホモフィリーに拡張する、新しい、未探索のパラダイムを提示する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:14:10 GMT)
DiTS: Multimodal Diffusion Transformers Are Time Series Forecasters [50.4] 既存の生成時系列モデルは、時系列データの多次元特性にうまく対応していない。
動画生成にテキストガイダンスを組み込んだマルチモーダル拡散変換器に着想を得て,Diffusion Transformer for Time Series (DiTS)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:48:13 GMT)
Towards Generalizable Reasoning: Group Causal Counterfactual Policy Optimization for LLM Reasoning [50.4] 大規模言語モデル(LLM)は推論能力の進歩とともに複雑なタスクに優れる。
一般化可能な推論パターンを学習するために,LLMを明示的に訓練するためのグループ因果政策最適化を提案する。
次に、この報酬からトークンレベルのアドバンテージを構築し、ポリシーを最適化し、LCMにプロセス無効で事実上堅牢な推論パターンを推奨します。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:03:11 GMT)
Refer-Agent: A Collaborative Multi-Agent System with Reasoning and Reflection for Referring Video Object Segmentation [50.2] Referring Video Object (RVOS) は、テキストクエリに基づくビデオ内のオブジェクトのセグメンテーションを目的としている。
Refer-Agent (Refer-Agent) は、共用多エージェントシステムである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:11:44 GMT)
InftyThink+: Effective and Efficient Infinite-Horizon Reasoning via Reinforcement Learning [50.2] InftyThink+は大規模な推論モデルのためのエンドツーエンドの強化学習フレームワークである。
InftyThink+は精度を21%向上し、従来の長鎖強化学習よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:59:27 GMT)
SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers [50.2] 本稿では,SaProt TokenizationとDiffusion Transformer (DiT)アーキテクチャを統合することで,タンパク質のバックボーン生成を促進する新しいフレームワークであるSaDiTを提案する。
実験により、SaDiTはRFDiffusionやProteinaといった最先端モデルよりも計算速度と構造的生存性が優れていることが示された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:50:13 GMT)
AIRS-Bench: a Suite of Tasks for Frontier AI Research Science Agents [49.7] AIRS-Benchは、最先端の機械学習論文から得られた20のタスクからなるスイートである。
Airs-Benchタスクは、研究ライフサイクル全体のエージェント能力を評価する。
本稿では,AIRS-Benchタスク定義と評価コードをオープンソースとして公開し,自律科学研究のさらなる発展を促す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:45:02 GMT)
FMBench: Adaptive Large Language Model Output Formatting [49.5] 適応型マークダウン出力フォーマットのベンチマークであるFMBenchを提案する。
2つのモデルファミリーの実験は、SFTが一貫してセマンティックアライメントを改善していることを示している。
結果はまた、意味的目的と構造的目的の間に固有のトレードオフを明らかにします。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:42:06 GMT)
Evolutionary Generation of Multi-Agent Systems [49.5] 大規模言語モデル (LLM) ベースのマルチエージェントシステム (MAS) は複雑な推論、計画、ツール拡張タスクを強く約束する。
EvoMASは構造化構成生成としてMAS生成を定式化する。
EvoMASは、人間の設計したMASと以前の自動MAS生成方法の両方でタスク性能を一貫して改善する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:01:35 GMT)
Euphonium: Steering Video Flow Matching via Process Reward Gradient Guided Stochastic Dynamics [49.2] 本稿では,プロセス報酬勾配誘導ダイナミクスによる生成を支援する新しいフレームワークであるEuphoniumを提案する。
我々の重要な洞察は、プロセス・リワード・モデルの勾配を明示的に組み込んだ理論的に原理化されたアルゴリズムとしてサンプリング・プロセスを定式化することである。
我々は,誘導信号をフローネットワークに内部化する蒸留目標を導出し,報奨モデルへの推論時間依存性を排除した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:22:04 GMT)
Revisiting Salient Object Detection from an Observer-Centric Perspective [49.0] そこで我々は,視覚的手がかりだけでなく,その嗜好や意図など,観察者固有の要因を考慮し,有意な領域を予測できるオブザーバ中心の有意物体検出(OC-SOD)を提案する。
結果として、この定式化は本質的なあいまいさと人間の知覚の多様性を捉え、パーソナライズされ、文脈に合ったサリエンシの予測を可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:53:01 GMT)
DAVE: Distribution-aware Attribution via ViT Gradient Decomposition [48.9] 視覚変換器(ViT)はコンピュータビジョンにおいて支配的なアーキテクチャとなっている。
本稿では, DAVE textit(underlineDistribution-aware underlineAttribution via UnderlineViT Gradient DunderlineEcomposition)を紹介する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:15:16 GMT)
Malicious Agent Skills in the Wild: A Large-Scale Security Empirical Study [47.6] サードパーティのエージェントスキルは、LLMベースのエージェントを拡張して、命令ファイルとユーザのマシン上で動作する実行可能なコードを生成する。
結果として生じる脅威を特徴づけるために、地中真実のデータセットは存在しない。
我々は,98,380のスキルを行動検証することで,悪質なエージェントスキルのラベル付きデータセットを構築した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:52:27 GMT)
Predicting Camera Pose from Perspective Descriptions for Spatial Reasoning [47.3] 本稿では、カメラポーズを、クロスビュー融合とノベルビュー推論のための明示的な幾何学的アンカーとして利用する、ポーズ対応マルチイメージフレームワークCAMCUEを紹介する。
CAMCUEは、ビュー毎のポーズを視覚トークンに注入し、ターゲットカメラのポーズに自然言語の視点記述を基盤とし、応答をサポートするためにポーズ条件の想定されたターゲットビューを合成する。
CAMCUEは、全体的な精度を9.06%向上させ、目標ポーズを自然言語の視点記述から予測する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:50:10 GMT)
Causal Forcing: Autoregressive Diffusion Distillation Done Right for High-Quality Real-Time Interactive Video Generation [47.3] 現在の方法では、事前訓練された双方向ビデオ拡散モデルを数段階自己回帰(AR)モデルに蒸留する。
ODEのためのAR教師を用いたCausal Forcingを提案する。
私たちのメソッドは、すべてのメトリクスですべてのベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:48:17 GMT)
TrajAD: Trajectory Anomaly Detection for Trustworthy LLM Agents [47.1] 効率的なロールバック・アンド・リトライを実現するために必要な軌道異常検出
汎用LSMはこれらの異常を識別し、ローカライズするのに苦労する。
細粒度プロセス監視を訓練した特殊検証器であるTrajADを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:13:49 GMT)
Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding [46.6] Masked Diffusion Language Modelsは、トークンを徐々に解き放つ反復サンプリングを通じてシーケンスを生成する。
そこで我々は,アンマスキーク位置の後方が段差で安定すると,その位置をロックする,SureLockを提案する。
これにより、定位当たりの計算コストは$O(N2d)$から$O(MNd)$に削減され、$N$はシーケンス長、$M$はアンロックされたトークン位置の数、$d$はモデル寸法となる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:08:51 GMT)
Position: Machine Learning for Heart Transplant Allocation Policy Optimization Should Account for Incentives [45.8] 少ないドナー臓器の割り当ては、医療における最も複雑なアルゴリズム上の課題の1つである。
現在のアプローチは、インセンティブという基本的な障壁を見落としていることが多い。
臓器割当は単に最適化の問題ではなく、臓器調達組織、移植センター、臨床医、患者、規制機関を含む複雑なゲームであると主張する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:55:11 GMT)
Near-Optimal Dynamic Matching via Coarsening with Application to Heart Transplantation [45.8] 我々は粗いアプローチに基づく新しいオンラインマッチングアルゴリズムを開発した。
オフラインノードを静電容量クラスタに集約することで、ほぼ最適理論的保証が得られることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:29:37 GMT)
Agentic Unlearning: When LLM Agent Meets Machine Unlearning [45.6] パラメータとメモリ経路をまたいだ共同学習フレームワークであるSingchronized Backflow Unlearning(SBU)を提案する。
SBUは、保持されたデータに対する限定的な劣化を伴う、両方の経路にまたがる標的となるプライベート情報のトレースを削減する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:13:13 GMT)
AgentDyn: A Dynamic Open-Ended Benchmark for Evaluating Prompt Injection Attacks of Real-World Agent Security System [44.5] AgentDynは60の挑戦的なオープンエンドタスクと560のインジェクションテストケースを特徴とするベンチマークである。
以前の静的ベンチマークとは異なり、AgentDynは動的プランニングを必要とし、有用なサードパーティの命令を組み込む。
最先端の10つの防衛に関する我々の評価は、既存の防衛のほとんどすべてが十分に安全でないか、重大な過防衛に悩まされていることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:04:35 GMT)
ChatUMM: Robust Context Tracking for Conversational Interleaved Generation [44.2] 統一マルチモーダルモデル(UMM)は目覚ましい進歩を遂げているが、シングルターン相互作用パラダイムによって制約されている。
本稿では,対話型統合モデルChatUMMを提案する。
ChatUMMは、連続的な会話の流れとしてシリアライズされたテキストイメージストリームをモデル化するインターリーブされたマルチターントレーニング戦略に由来する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:11:50 GMT)
Inference-Time Rethinking with Latent Thought Vectors for Math Reasoning [44.0] 推論時間再考(Inference-Time Rethinking)は、反復的な自己補正を可能にする生成フレームワークである。
我々は、推論を連続的な潜在思考ベクトル(何を推論すべきか)と、このベクトル上で条件付けられたトレースを言語化する復号器に分解する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:23:18 GMT)
HiWET: Hierarchical World-Frame End-Effector Tracking for Long-Horizon Humanoid Loco-Manipulation [43.4] 我々は、ヒューマノイドのロコ操作におけるエンドエフェクタトラッキングとしてこの問題を再考する。
動的実行からグローバルな推論を分離する階層的強化学習フレームワークであるHiWETを提案する。
我々は,HuWETが長期のワールドフレームタスクにおいて,高精度かつ安定したエンドエフェクタトラッキングを実現することを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:11:56 GMT)
CALM: Class-Conditional Sparse Attention Vectors for Large Audio-Language Models [42.7] 本稿では,クラス依存の重み付けを注目頭上で学習する数ショット分類法を提案する。
我々の手法は、最先端の統一投票方式よりも一貫して優れている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:58:29 GMT)
Quasiperiodic dynamics in the nondipole x-ray strong field ionization in stabilization regime [42.0] 非双極子状態の長いXUVレーザーパルスにおける原子の強磁場電離を数値解析的に検討する。
我々は、電離電子波パケットのクーロン場誘起遅い発振が、電離収率の観測変調に寄与することを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:15:38 GMT)
A Human-in-the-Loop, LLM-Centered Architecture for Knowledge-Graph Question Answering [42.0] 大きな言語モデルは言語理解において優れているが、知識集約的なドメインでは限られている。
この研究は、LLMがCypherグラフクエリを生成して説明するインタラクティブなフレームワークを導入している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:39:46 GMT)
Parameters as Experts: Adapting Vision Models with Dynamic Parameter Routing [41.8] AdaRouteは、シンプルなMix-of-experts(MoE)アーキテクチャを備えた新しいアダプタスタイルのメソッドである。
AdaRouteモジュールの動的重み行列は入力依存の方法で低ランク適応を促進する。
様々な視覚タスクにおけるAdaRouteの優位性を示す実験。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:50:38 GMT)
Landscaper: Understanding Loss Landscapes Through Multi-Dimensional Topological Analysis [41.8] 任意の次元ロスランドスケープ解析のためのオープンソースのPythonパッケージであるLandscaperを提案する。
主要なコンポーネントは、景観の滑らかさを定量化するSaddle-Minimum Average Distance (SMAD)である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:17:08 GMT)
Are Deep Learning Based Hybrid PDE Solvers Reliable? Why Training Paradigms and Update Strategies Matter [41.4] パフォーマンスは、トレーニングパラダイムやアップデート戦略に非常に敏感であることを示します。
固定点更新よりも物理残差を最小限に抑える物理認識型アンダーソン加速度(PA-AA)を導入する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:35:16 GMT)
Plato's Form: Toward Backdoor Defense-as-a-Service for LLMs with Prototype Representations [40.8] 大規模言語モデル(LLM)は、セキュリティに敏感なアプリケーションにますますデプロイされているが、バックドア攻撃には弱いままである。
本稿では,最小限の仮定でパラメータを編集するバックドア浄化フレームワークProtoPURIFYを提案する。
ProTOPURIFYは、シングルトリガー、マルチトリガー、トリガーレスバックドア設定を含む6つの多様な攻撃に対して、6つの代表的防御を一貫して上回っている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:20:22 GMT)
Operationalizing Stein's Method for Online Linear Optimization: CLT-Based Optimal Tradeoffs [40.7] 確率的極限定理の証明の基礎となる古典的なフレームワークであるスタイン法が計算効率の良いOLOアルゴリズムとして動作可能であることを示す。
関連する後悔と総損失上限は「加法的にシャープ」であり、これは従来のBig-O最適性を上回ることを意味する。
我々のアルゴリズムは、オンライン勾配降下(OGD)と乗算重み更新(MWU)の総損失上限を改善する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:50:15 GMT)
Using Large Language Models to Support Automation of Failure Management in CI/CD Pipelines: A Case Study in SAP HANA [40.1] 大規模言語モデル(LLM)は、以前の作業による自動障害管理の有望な結果を示している。
大規模産業ソフトウェアプロジェクト,すなわちSAPの文脈で,CI/CDパイプラインの障害管理をLCMベースのシステムで自動化できるかどうかを検討した。
パイプライン情報や障害管理命令,過去の障害からのデータなど,さまざまな種類のドメイン知識をシステムに提供する。
このシステムは、ドメイン知識が与えられた場合のエラー位置を97.4%の精度で正確に識別し、それなしでは84.2%の精度で検出した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:55:48 GMT)
Data-Centric Interpretability for LLM-based Multi-Agent Reinforcement Learning [39.8] フルストレス外交の高度環境から大規模強化学習訓練を実施する。
本稿では,SAE特徴をトレーニング力学に関する解釈可能な仮説にグループ化するメタオートインタプリタを紹介する。
私たちは、主観的に興味深く、一見有用なSAE機能でさえ、人間にとって役に立たないよりも悪いかもしれないことに気付きました。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:44:25 GMT)
The Optimal Token Baseline: Variance Reduction for Long-Horizon LLM-RL [39.2] 大規模言語モデルのための強化学習(LLMs)は、勾配のばらつきが爆発的に広がるため、長い水平タスクのトレーニング崩壊に悩まされることが多い。
我々は、最適トークンベースライン(OTB)を第一原理から導出し、勾配更新が累積勾配ノルムに逆向きに重み付けされるべきであることを証明した。
提案手法はトレーニングの安定性を達成し,N=32$の大規模グループサイズとの性能を一致させ,シングルターンおよびツール統合推論タスクにおけるトークン消費量を65%以上削減する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:16:04 GMT)
Calibrating Tabular Anomaly Detection via Optimal Transport [38.8] 我々は,サンプル特異的キャリブレーションにより既存のTAD検出器を増強するモデルに依存しない後処理フレームワークであるCTAD(Calibrating Tabular Anomaly Detection)を提案する。
提案手法は,2つの相補分布,すなわちランダムサンプリングによる経験的分布とK平均セントロイドによる構造的分布を特徴付ける。
本研究は, OT距離が試験試料から遠心点までの距離に比例して低いことを証明し, 予測値よりも系統的に高い校正値が得られたことを証明した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:58:22 GMT)
Statistical Learning from Attribution Sets [38.1] プライバシ制約下での広告ドメインにおける変換予測モデルのトレーニングの問題に対処する。
プライバシ保護ブラウザAPIとサードパーティクッキーの非推奨化を動機として,学習者が一連のクリックと一連の変換を観察する環境について検討する。
我々はこれを、候補者に対する事前分布を備えた不愉快な敵が生成した帰属集合からの学習として定式化する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:27:28 GMT)
SALAAD: Sparse And Low-Rank Adaptation via ADMM for Large Language Model Inference [38.0] トレーニング中にスパース構造と低ランク構造を誘導するプラグイン・アンド・プレイ・フレームワークであるSALAADを提案する。
モデルスケールでの実験では、SALAADはデプロイメント中のメモリ消費を大幅に削減する。
単一のトレーニングを実行すると、モデル能力の連続的なスペクトルが得られ、多様なメモリ予算をまたいだスムーズで弾力的なデプロイメントが可能になる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:13:56 GMT)
LogicSkills: A Structured Benchmark for Formal Reasoning in Large Language Models [37.9] 3つの基本論理スキルを一階述語論理モデルに分離する。
項目は2つの一階述語論理(英語なし)から引き出され、a と Carroll-style nonce の単語で示される。
先行するモデル全体では、パフォーマンスはかなり低いが、高い妥当性がある。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:38:44 GMT)
Learning to Allocate Resources with Censored Feedback [37.3] 我々は、検閲されたフィードバックの下で、B$の予算をK$の腕に割り当てなければならないオンラインリソース割り当て問題について検討する。
非自明なパラメータ推定と信頼境界を利用する楽観的なアルゴリズムであるRA-UCBを提案する。
そして、実世界のデータセットの実験を通して理論結果を検証する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:04:54 GMT)
Table-as-Search: Formulate Long-Horizon Agentic Information Seeking as Table Completion [37.2] textbfTable-as-Search(TaS)は、InfoSeekingタスクをテーブル補完タスクとして再構成する構造化計画フレームワークである。
TaSは、Deep Search、Wide Search、DeepWide Searchという3つの異なるInfoSeekingタスクを統合する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:18:26 GMT)
AEGIS: Adversarial Target-Guided Retention-Data-Free Robust Concept Erasure from Diffusion Models [36.9] 概念消去は、拡散モデル(DM)が有害なコンテンツを生成するのを防ぐのに役立ちますが、現在の手法は保持のトレードオフに直面します。
本稿では,頑健性と保持性の両方を向上する保持データフリーフレームワークであるAdversarial Erasure with Gradient Informed Synergy (AEGIS)を紹介する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:27:42 GMT)
ARIS-RSMA Enhanced ISAC System: Joint Rate Splitting and Beamforming Design [36.8] 本稿では,多目的ボトルネックを克服するため,RSMA統合センシング・通信(ISAC)システムを用いたアクティブリコンフィグアブル・インテリジェントサーフェス(ARIS)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:38:32 GMT)
BRIDGE: Predicting Human Task Completion Time From Model Performance [36.4] ヒューマンタスクの完了時間アノテーションに依存する既存のアプローチは、コストが高く、ノイズがあり、ベンチマークをまたいでスケールすることが難しい。
本稿では、モデル応答から潜伏困難尺度を学習し、それを人間のタスク完了時間に固定する統合心理測定フレームワークBRIDGEを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:36:11 GMT)
DRMOT: A Dataset and Framework for RGBD Referring Multi-Object Tracking [35.6] Referring Multi-Object Tracking (RMOT)は、言語記述に基づいて特定のターゲットを追跡することを目的としている。
本稿では,RGB,Depth(D),Language(L)モダリティを融合させて3D認識トラッキングを実現するモデルを必要とする新しいタスク,RGBD Referring Multi-Object Tracking (DRMOT)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:39:34 GMT)
Weisfeiler and Lehman Go Categorical [35.3] Wesfeiler-Lehman の分類的枠組みを導入する。
メッセージパッシングトポロジが関手の選択によって厳密に決定されるニューラルネットワークのファミリーであるハイパーグラフ同型ネットワークを導出する。
我々はこれらのモデルの表現性を理論的に特徴づけ、入射ベースと対称単純アプローチの両方が標準ハイパーグラフワイスフェイラー・リーマン検定の表現力を仮定することを証明した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:45:29 GMT)
ReBeCA: Unveiling Interpretable Behavior Hierarchy behind the Iterative Self-Reflection of Language Models with Causal Analysis [35.1] textbftexttReflection textbftexttBehavior, textbftexttBehavior は自己回帰結果の解釈可能な行動階層を明らかにするフレームワークである。
自己回帰軌道を因果グラフとしてモデル化することにより、ReBeCAは真の性能決定因子を分離する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:00:57 GMT)
Can We Build a Monolithic Model for Fake Image Detection? SICA: Semantic-Induced Constrained Adaptation for Unified-Yet-Discriminative Artifact Feature Space Reconstruction [35.1] モノリシックフェイク画像検出(FID)モデルは、実際には一貫して性能が劣っている。
本稿では,最初のモノリシックFIDパラダイムであるSemantic-induced Constrained Adaptation (SICA)を提案する。
SICAは15の最先端のメソッドを上回り、ターゲットの統一されたyet-差別的なアーティファクト特徴空間を再構築する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:03:26 GMT)
VowelPrompt: Hearing Speech Emotions from Text via Vowel-level Prosodic Augmentation [34.9] このフレームワークは、解釈可能な、きめ細かい母音レベルの韻律的手がかりで、大きな言語モデルを拡張する。
VowelPromptは、ゼロショット、微調整、クロスドメイン、クロス言語条件下で、最先端の感情認識手法より一貫して優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:09:14 GMT)
ScaleEnv: Scaling Environment Synthesis from Scratch for Generalist Interactive Tool-Use Agent Training [34.7] 完全にインタラクティブな環境を構築し、スクラッチから完全に検証可能なタスクを構築するフレームワークであるScaleEnvを紹介します。
ScaleEnv内の探索を通じてエージェントが学習できるようにすることで、目に見えないマルチターンツール使用ベンチマークにおいて、大幅なパフォーマンス向上が示される。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:05:55 GMT)
LLM Active Alignment: A Nash Equilibrium Perspective [34.5] 我々は,大規模言語モデルの振る舞いを予測・操るゲーム理論フレームワークを開発した。
エージェントは、どのグループと整合するかを積極的に戦略的に選択し、解釈可能で行動的な政策クラスを得る。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:26:03 GMT)
Understanding Real-World Traffic Safety through RoadSafe365 Benchmark [34.5] RoadSafe365は、交通安全分析のための大規模ビジョンベンチマークである。
広範囲で多様な実世界のビデオデータ収集からの交通安全のきめ細かい分析をサポートする。
RoadSafe365は、階層的な分類法を用いて、独立にキュレーションされ、体系的に組織化されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:48:25 GMT)
SPARC: Separating Perception And Reasoning Circuits for Test-time Scaling of VLMs [34.3] 我々は,視覚的知覚を推論から切り離すモジュール型フレームワーク(知覚と推論回路の分離)を導入する。
脳のシーケンシャルな知覚から認知への処理にインスパイアされたこのパイプラインは、2段階のパイプラインを実装し、まずモデルが明示的な視覚探索を行い、質問関連領域をローカライズする。
難しいビジュアル推論ベンチマーク全体において、モノリシックなベースラインと強力なビジュアルグラウンドアプローチよりも優れています。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:05:25 GMT)
D$^2$Quant: Accurate Low-bit Post-Training Weight Quantization for LLMs [33.9] 軽量後トレーニング量子化(PTQ)は、メモリ使用量を減らし、低ビット演算子や専用ハードウェアを使わずに実用的なスピードアップを可能にするため、魅力的である。
精度は、重量のみのPTQにおいて、サブ-4ビットの精度で著しく低下する。
D$2$Quantは、ウェイトとアクティベーションの両方の観点から量子化を改善する新しいウェイトオンリーのPTQフレームワークである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:11:49 GMT)
SeeUPO: Sequence-Level Agentic-RL with Convergence Guarantees [33.5] 強化学習(RL)は、大規模言語モデル(LLM)ベースのAIエージェントを訓練するための主要なパラダイムとして登場した。
既存のバックボーンRLアルゴリズムには、エージェントシナリオにおけるコンバージェンス保証が欠如している。
本研究では,マルチターンインタラクションに対する収束保証を備えた批判のないアプローチであるSeeeUPOを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:57:23 GMT)
Zero-shot Generalizable Graph Anomaly Detection with Mixture of Riemannian Experts [33.3] Graph Anomaly Detection (GAD)は、グラフデータの不規則なパターンを特定することを目的としている。
既存のゼロショットGAD法は、様々な異常パターンの固有の幾何学的差異を無視している。
ゼロショット一般化可能なグラフ異常検出のための新しいフレームワークであるGAD-MoREを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:46:30 GMT)
Fine-Grained Model Merging via Modular Expert Recombination [33.3] 本稿では,MERGEを提案する。MERGEはコンポーネントワイドなモデルマージと,インプットアウェアでオンデマンドなモジュール再結合を推論時に実現する手法である。
MERGEは、クロスタスク性能とストレージ効率のバランスをとる双方向最適化問題として、コンポーネントワイズマージを定式化している。
MERGEは、強いベースラインを一貫して上回り、効果的に一般化することを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:55:56 GMT)
Causal Front-Door Adjustment for Robust Jailbreak Attacks on LLMs [33.2] 我々は、安全メカニズムを因果的観点から、保存されていない共同創設者としてモデル化する。
私たちはPearl's Front-Door Criterionを使って、堅牢なジェイルブレイクの共謀団体を殺害しています。
実験によると、CFA$2$は最先端の攻撃成功率を達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:24:29 GMT)
Dr. Kernel: Reinforcement Learning Done Right for Triton Kernel Generations [33.0] カーネル生成のための強化学習(RL)について検討する。
そこで我々は,不偏利推定を行うために,ターンレベル強化-Leave-One-Out (TRLOO)を提案する。
本稿では、プロファイリングに基づくリワード(PR)とプロファイリングに基づくリジェクションサンプリング(PRS)を導入し、この問題を克服する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:05:49 GMT)
DynaRetarget: Dynamically-Feasible Retargeting using Sampling-Based Trajectory Optimization [32.8] DynaRetargetは、ヒューマノイド制御ポリシーに対する人間の動きのための完全なパイプラインである。
SBTOフレームワークは不完全な軌道を動的に実現可能な運動に洗練する。
我々はDynaRetargetを何百ものヒューマノイドオブジェクトによる実演で検証した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:14:27 GMT)
LIBERO-X: Robustness Litmus for Vision-Language-Action Models [32.3] この研究は、評価とデータの観点からVLAベンチマークを体系的に再考する。
LIBERO-Xは階層的評価プロトコルを特徴とするベンチマークで,3つのコア機能を対象とした進行難度レベルを示す。
代表的なVLAモデルを用いた実験では、累積摂動下での大幅な性能低下が示されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:59:12 GMT)
Can LLM Safety Be Ensured by Constraining Parameter Regions? [32.2] 「大言語モデル(LLM)は、しばしば安全領域を含むと仮定される。」
確認された安全領域は,IoUが測定したように,低~中程度の重複しか示さないことがわかった。
これらの結果は、現在の手法が安定したデータセットに依存しない安全領域を確実に特定できないことを示唆している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:09:45 GMT)
One Bias After Another: Mechanistic Reward Shaping and Persistent Biases in Language Reward Models [32.2] リワードモデル(RM)は、言語モデルと人間の嗜好のオンラインアライメントに不可欠である。
最先端のRMを含む5つの高品質RMのバイアスを測定する。
本稿では, 急激な相関関係から生じる低複雑性バイアスを緩和するために, 簡単なポストホック介入を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:11:37 GMT)
From Kepler to Newton: Inductive Biases Guide Learned World Models in Transformers [32.0] 汎用AIアーキテクチャは、予測を越えて宇宙を支配する物理法則を発見することができる。
空間的滑らかさを確保することで、汎用トランスフォーマーは以前の失敗を克服し、コヒーレントなケプラー世界モデルを学ぶことができることを示す。
我々は、このモデルを曲線フィッティングを放棄し、ニュートンの力表現を発見するように強制する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:17:37 GMT)
Ex-Omni: Enabling 3D Facial Animation Generation for Omni-modal Large Language Models [31.8] 提案するExpressive Omniは,大規模言語モデルに音声対応の3D顔アニメーションを付加したオープンソースフレームワークである。
元Omniは、意味論的推論を時間的生成から切り離すことによって学習の難しさを軽減する。
InstructExは、音声対応の3D顔アニメーションによるOLLMの拡張を容易にするデータセットである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:03:30 GMT)
Improve Large Language Model Systems with User Logs [31.8] UNOは、ユーザログで大きな言語モデル(LLM)を改善するためのフレームワークである。
ログを半構造化されたルールと好みのペアに抽出し、クエリとフィードバックによるクラスタリングを使用してデータの異質性を管理する。
UNOは最先端の有効性と効率を達成し、検索拡張生成(RAG)とメモリベースラインを大きく上回っている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:55:26 GMT)
Incentive-Aware AI Safety via Strategic Resource Allocation: A Stackelberg Security Games Perspective [31.6] 私たちは、ゲーム理論による抑止がAIを積極的に監視し、リスクを認識し、操作に対して回復力を与える方法を示します。
本稿では,(1)データ/フィードバック中毒に対するトレーニング時間監査,(2)制約されたレビュアーリソースによる事前デプロイ評価,(3)敵環境における堅牢なマルチモデル展開について報告する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:20:26 GMT)
Beyond Crash: Hijacking Your Autonomous Vehicle for Fun and Profit [31.5] 本稿は,長距離経路整合性妥協という,定性的に異なるリスクを示す。
我々は、ビジョンベースのエンド・ツー・エンド駆動スタックのルートレベルのハイジャックを行う、JackZebraと呼ばれる最初の敵対的フレームワークを実装した。
評価の結果,JackZebraは本来のルートから逸脱し,敵の目的地で高い成功率で停止するために,被害者車両を乗っ取ることに成功した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:57:16 GMT)
Your Language Model Secretly Contains Personality Subnetworks [31.5] 大規模言語モデルには,すでにパラメータ空間にペルソナ特化作業が存在することを示す。
本手法は完全にトレーニング不要であり,言語モデルの既存のパラメータ空間にのみ依存する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:03:28 GMT)
CoBA-RL: Capability-Oriented Budget Allocation for Reinforcement Learning in LLMs [31.4] CoBA-RLは、モデルの進化能力に基づいて、ロールアウト予算を適応的に割り当てるように設計された強化学習アルゴリズムである。
我々のアプローチは、探索と搾取の間のトレードオフを効果的に編成し、一貫した一般化の改善を提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:56:57 GMT)
Completing Missing Annotation: Multi-Agent Debate for Accurate and Scalable Relevant Assessment for IR Benchmarks [31.0] DREAMはLLMエージェントを用いた多段階の議論に基づく関連性評価フレームワークである。
95.2%の精度で、人間の3.5%しか関与していない。
BRIDGEは評価バイアスを緩和し、より公平なレトリバー比較を可能にする改良されたベンチマークである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:27:03 GMT)
PACE: Defying the Scaling Hypothesis of Exploration in Iterative Alignment for Mathematical Reasoning [30.9] N$のスケーリングは検証器のノイズを増幅し、有害分布シフトを誘導することを示す。
textbfPACE (Proximal Alignment via Corrective Exploration) を導入し、ブルートフォースマイニングを世代ベースの補正戦略に置き換える。
実証的な評価では、PACEはDPO-R1$(N=16)$より優れており、計算の約1/5$しか使用していない。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:36:32 GMT)
QUATRO: Query-Adaptive Trust Region Policy Optimization for LLM Fine-tuning [30.9] クエリ適応信頼度ポリシー最適化(QUATRO)を提案する。
QUATROは、原則化された最適化を通じて、信頼領域の制約を直接実施する。
様々な数学的推論のベンチマークで実証的な検証を行ったところ、QUITROは政策安定度の増加の下で安定な振舞いを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:09:59 GMT)
Multimodal Generative Retrieval Model with Staged Pretraining for Food Delivery on Meituan [30.9] 食品配送などのシナリオにおいて,マルチモーダル検索モデルの重要性が高まっている。
本稿では,各段階における専門的なタスクに焦点を合わせるための事前学習戦略を提案する。
高次元マルチモーダル埋め込みを圧縮するセマンティックIDをよりよく活用するために、生成的タスクと識別的タスクの両方を設計する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:29:13 GMT)
Think Proprioceptively: Embodied Visual Reasoning for VLA Manipulation [30.3] ThinkProprioは、プロプリセプションをVLM埋め込み空間内の一連のテキストトークンに変換する。
テキストトークン化は、学習したプロジェクタよりも効果的であり、約15%の視覚トークンを保持することは、完全なトークンセットを使用するパフォーマンスにマッチする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:16:22 GMT)
PreFlect: From Retrospective to Prospective Reflection in Large Language Model Agents [30.2] 先進的な反射機構であるPreFlectを導入し,そのパラダイムをポストホック修正からプレ実行前へシフトさせる。
歴史的エージェントの軌跡から計画誤差を抽出し,過去の実行中に繰り返し観測された成功と失敗パターンを捉える。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:42:44 GMT)
Adaptive Uncertainty-Aware Tree Search for Robust Reasoning [30.0] 推論時間推論は、複雑な問題解決においてLarge Language Models (LLMs) の機能を向上させる。
プロセス・リワード・モデル (Process Reward Models, PRM) による外部探索が主流である。
我々は, PRMsが, 分布外サンプル(OOD)に対して高い不確実性を示し, 信頼できないスコアを示した経験的証拠を提供する。
そこで我々は,標準探索が線形後悔の蓄積を引き起こす一方で,不確実性認識戦略がサブ線形後悔を達成できることを示す理論的枠組みを確立する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:40:05 GMT)
Evaluating an evidence-guided reinforcement learning framework in aligning light-parameter large language models with decision-making cognition in psychiatric clinical reasoning [30.0] 大規模言語モデル(LLM)は、医学的意思決定を支援するための変革的な可能性を持っているが、その精神医学への応用は幻覚や表面的推論によって制限されている。
本稿では,LLMの内部推論と専門的な精神医学的実践の整合性を考慮した強化学習フレームワークであるClinMPOを紹介する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:21:08 GMT)
Scaling Speech Tokenizers with Diffusion Autoencoders [29.8] Speech Diffusion Tokenizer (SiTok) は、教師付き学習により意味豊かな表現を学習し、拡散を伴う高忠実な音声再構成を可能にする拡散オートエンコーダである。
私たちはSiTokを1.6Bパラメータに拡張し、200万時間のスピーチでトレーニングします。実験によると、SiTokは理解、再構築、生成タスクにおいて、非常に低いトークンレートで、毎秒200ビットのビットレートで、強力なベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:57:41 GMT)
Designing Computational Tools for Exploring Causal Relationships in Qualitative Data [29.1] 本研究では,対話型因果関係構築と可視化による因果関係の抽出と説明を行うQualCausalを設計・実装した。
フィードバック調査の結果,参加者は分析負担を軽減し,認知的足場を提供するシステムに重きを置いていることがわかった。
定性データ解析を支援する計算ツールの設計において,より広範な意味を論じる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:56:55 GMT)
TokenMixer-Large: Scaling Up Large Ranking Models in Industrial Recommenders [28.6] TokenMixer-Largeは、大規模なレコメンデーションモデルをスケールするための新しいアーキテクチャである。
準最適残差設計、深層モデルでの勾配更新の不十分、不完全なMoEスペーサー化、拡張性の調査に対処する。
オンライントラフィックとオフラインの実験で、それぞれ7ビリオンと15ビリオンにパラメータを拡大することに成功している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:04:33 GMT)
Pairwise is Not Enough: Hypergraph Neural Networks for Multi-Agent Pathfinding [28.3] HMAGAT(Hypergraph Multi-Agent Attention Network)は,有向ハイパーグラフ上の注意機構を利用してグループダイナミクスを明示的にキャプチャする新しいアーキテクチャである。
ハイパーグラフがGNNに固有の注意の希釈をいかに表現しているかを示し、ペアワイズ手法が失敗する複雑な相互作用を捉える。
この結果から,多エージェント問題に対するトレーニングデータサイズやパラメータ数よりも,適切な帰納バイアスが重要であることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:28:54 GMT)
Do LLMs Act Like Rational Agents? Measuring Belief Coherence in Probabilistic Decision Making [28.3] 大規模言語モデル (LLM) がコヒーレントな信念と安定な嗜好を持つ有理的実用性最大化要因であるかどうかを考察する。
我々のアプローチは、報告された確率がいかなる有理エージェントの真の信念と一致しないような偽りの条件を提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:50:33 GMT)
Condition Matters in Full-head 3D GANs [28.2] 本稿では,フルヘッド3D GANの条件入力としてビュー不変セマンティック機能を提案する。
本手法は, 忠実度, 多様性, 一般化性を著しく向上させる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:17:43 GMT)
MAGIC: A Co-Evolving Attacker-Defender Adversarial Game for Robust LLM Safety [28.2] 本稿では,新しいマルチターンマルチエージェント強化学習フレームワークであるtextbfMAGICを紹介する。
大規模言語モデルの安全性アライメントを敵非対称ゲームとして定式化する。
本フレームワークは, モデルの有用性を損なうことなく, 優れた防衛成功率を示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:53:11 GMT)
Adaptive and Balanced Re-initialization for Long-timescale Continual Test-time Domain Adaptation [28.0] 連続的なテスト時間ドメイン適応は、モデルを調整することを目的としており、非定常環境において、時間とともにうまく機能するようにしている。
モデルは、長期間にわたって継続的に変化する環境に適応できるだろうか?
本稿では,ABR(Adaptive-and-Balanced Re-initialization)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:53:15 GMT)
Reasoning-Augmented Representations for Multimodal Retrieval [27.4] Universal Multimodal Retrieval (UMR) は、テキストと視覚を横断する任意の検索を求める。
画像が“サイレント”なエビデンスを持ち、クエリがキーセマンティクスを暗黙的に残す場合、単一の埋め込みパスは理由と圧縮の両方でなければならない。
本稿では、検索前の推論を外部化することで、これらの役割を分離するデータ中心のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:01:54 GMT)
Trustworthy AI Software Engineers [26.7] 私たちは、AIエージェントがソフトウェアエンジニアとみなされることの意味を再検討します。
AIソフトウェアエンジニアの信頼性に寄与する重要な側面を特定します。
我々は、将来の人間-AI SEチームへの適切な信頼を可能にするために、倫理・デザインのアプローチを議論する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:08:48 GMT)
DisCa: Accelerating Video Diffusion Transformers with Distillation-Compatible Learnable Feature Caching [26.6] 本稿では,蒸留対応の学習可能な特徴キャッシング機構を初めて紹介する。
拡散モデルには、従来のトレーニングフリーではなく、軽量で学習可能なニューラル予測器を使用します。
これらのイニシアティブを実践することで、生成品質を維持しながら、加速境界を11.8times$まで押し上げます。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:54:23 GMT)
Nipping the Drift in the Bud: Retrospective Rectification for Robust Vision-Language Navigation [26.5] BudVLNは、現在の状態分布に合わせて監視を構築することで、オンラインのロールアウトから学習するオンラインフレームワークである。
BudVLNは、分散シフトを一貫して軽減し、成功率とSPLの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:36:27 GMT)
ProOPF: Benchmarking and Improving LLMs for Professional-Grade Power Systems Optimization Modeling [26.4] プロレベルのOPFモデリングのためのデータセットとベンチマークであるtextbfProOPF-D と textbfProOPF-B を紹介する。
ProOPF-Dには、パラメータ調整と標準OPFへの構造拡張を備えたNLリクエストのペアリング12Kインスタンスと、実行可能な実装が含まれている。
ProOPF-Bは121のエキスパートアノテートテストケースに基調コードを提供し、具体的および抽象的なOPFモデリング体制の下でエンドツーエンドの評価を可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:10:07 GMT)
Are AI Capabilities Increasing Exponentially? A Competing Hypothesis [26.1] 短期的な地平線においても、このデータは指数的な成長をサポートしていないと論じる。
我々は、AI能力をベースと推論能力に分解するより複雑なモデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:41:39 GMT)
Near-Optimal Regret for Distributed Adversarial Bandits: A Black-Box Approach [26.1] そこでは,N$エージェントが協力してグローバルな平均損失を最小限に抑えつつ,ローカルな損失のみを観察する。
この問題のミニマックス後悔は$tilde(sqrt(-1/2+K/N)T)$であり、$T$は地平線、$K$は行動の数、$は通信行列のスペクトルギャップである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:53:38 GMT)
DriveWorld-VLA: Unified Latent-Space World Modeling with Vision-Language-Action for Autonomous Driving [25.9] DriveWorld-VLAは、潜在空間内での世界モデリングと計画を統合する新しいフレームワークである。
機能レベルでは、コントロール可能でアクション条件付きイマジネーションをサポートする。
NAVSIMv1では91.3PDMS、NAVSIMv2では86.8S、nuScenesでは0.163秒の平均衝突速度で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:25:48 GMT)
Echoes as Anchors: Probabilistic Costs and Attention Refocusing in LLM Reasoning [25.9] 大規模推論モデル(LRM)におけるテスト時間計算割り当ては広く使われ、数学的問題解決、コード合成、計画に応用されている。
本稿では,EmphEcho of Prompt (EOP) を前装式計算整形機構として用いて,モデルが再帰する傾向を分析し,活用する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:53:26 GMT)
Exploring Specular Reflection Inconsistency for Generalizable Face Forgery Detection [25.8] 空間的特徴と周波数的特徴に依存した偽造検出アプローチは、高品質で完全に合成された偽造に対して限られた有効性を示す。
本稿では,複雑な物理法則によって支配される顔の属性を本質的に複製することが困難であることを示す。
本稿では,Retinex理論に基づく高速かつ高精度な顔テクスチャ推定手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:27:19 GMT)
DAWN: Dependency-Aware Fast Inference for Diffusion LLMs [25.5] 拡散大言語モデル (dLLM) はテキスト生成の利点を示している。
既存の推論ソリューションは保守的な並列戦略を採用しており、かなりの効率性は未探索のままである。
本稿では,高速なdLLM推論のためのDAWNを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:51:29 GMT)
Towards Understanding Multimodal Fine-Tuning: Spatial Features [25.3] Vision-Language Models (VLM) は、事前訓練された言語モデルとビジョンエンコーダをペアリングすることで、幅広いタスクにおいて強力なパフォーマンスを達成する。
本稿では,ステージワイドモデル差分法によるVLM適応の最初の力学解析について述べる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:48:18 GMT)
MedMO: Grounding and Understanding Multimodal Large Language Model for Medical Images [25.3] 一般化MLLMアーキテクチャ上に構築された医療基盤モデルであるMedMOを紹介する。
VQAベンチマークでは、MedMOはベースラインよりも平均精度が+13.7%向上した。
医療報告生成において、MedMOは意味的および臨床的正確性の両方において大きな利益をもたらす。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:59:59 GMT)
QuantaAlpha: An Evolutionary Framework for LLM-Driven Alpha Mining [24.8] QuantaAlphaは進化的アルファ・マイニング・フレームワークであり、各エンド・ツー・エンドのマイニング・ランを軌跡として扱う。
QuantaAlphaは、ターゲットリビジョンのための各トラジェクトリにおける最適以下のステップをローカライズする。
ファクタ生成の間、QuantaAlphaは仮説、因子表現、実行可能コードのセマンティック一貫性を強制する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:08:04 GMT)
Uniform Spectral Growth and Convergence of Muon in LoRA-Style Matrix Factorization [24.2] 低ランク適応 (LoRA) 条件下では, ムオンの下で特異なスペクトル現象がみられた。
簡易なLORA式行列分解設定において、スペクトル勾配流(SpecGF)をSpecGD-の連続的なアナログとして解析する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:47:06 GMT)
Uncovering Cross-Objective Interference in Multi-Objective Alignment [24.0] 大規模言語モデル(LLM)の多目的アライメントにおける永続的障害モードについて検討し、学習は目的のサブセットのみの性能を向上させると同時に、他のモデルの劣化を引き起こす。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:55:27 GMT)
Diffusion-State Policy Optimization for Masked Diffusion Language Models [23.9] マスク付きトークンを複数のデノナイジングステップで繰り返し充填して生成するマスケ拡散言語モデル。
中間充足決定を直接最適化するプラグイン・クレジット・アサインメント・レイヤであるDiSPOを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:47:22 GMT)
Displacement-Resistant Extensions of DPO with Nonconvex $f$-Divergences [23.9] DPOと関連するアルゴリズムは、RLHFの目的を直接最適化することで言語モデルを調整する。
本稿では,RLHF問題におけるDPO誘導特性について述べる。
次に、特定のDPO誘導および変位抵抗$f$に集中し、新しいSquaredPO損失につながった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:45:37 GMT)
VenusBench-Mobile: A Challenging and User-Centric Benchmark for Mobile GUI Agents with Capability Diagnostics [23.7] 我々は,汎用的なモバイルGUIエージェントを評価する上で困難なオンラインベンチマークであるVenusBench-Mobileを紹介する。
VenusBench-Mobileは、実際のモバイル利用を反映したユーザインテリジェント駆動タスク設計による評価の定義と、詳細なエージェント動作分析のための機能指向アノテーションスキームによる評価方法という、2つの中核評価柱を構築している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:54:42 GMT)
R2LED: Equipping Retrieval and Refinement in Lifelong User Modeling with Semantic IDs for CTR Prediction [23.7] セマンティックIDを用いた生涯ユーザモデリング(R2LED)における検索と改善のための新しいパラダイムを提案する。
まず,検索段階における複数経路混合検索手法を提案する。一方,協調的視点と意味的視点の両方から効率よく候補を検索する混合検索機構を提案する。
改良のために,経路レベル核融合のための目標認識型クロスアテンションとSIDレベル核融合のためのゲート機構を含むBiレベル核融合リファインメントを設計する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:27:20 GMT)
Extensible universal photonic quantum computing with nonlinearity [23.5] 普遍量子コンピューティングは線形回路と決定的に強力な非線形資源の両方をサポートするアーキテクチャを必要とする。
本稿では,完全プログラム可能でスケーラブルな線形光ネットワークと非線形モジュールをシームレスに結合することで,ユニバーサルゲートセットをサポートするフォトニックコンピュータについて報告する。
このプラットフォームは、幅広い量子コンピューティングとシミュレーションタスクを可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:50:06 GMT)
Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making [23.5] 本研究では,受動的質問応答から臨床レベルの意思決定支援にパラダイムをシフトさせるために開発された医療用大規模言語モデルBaichuan-M3を紹介する。
i)曖昧さを解決するための積極的情報取得、(ii)散在する証拠をコヒーレントな診断に統一する長期水平推論、(iii)事実の信頼性を確保するための適応幻覚抑制。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:08:59 GMT)
DeepRead: Document Structure-Aware Reasoning to Enhance Agentic Search [23.4] 本稿では,構造化対応マルチターン文書推論エージェントDeepReadを紹介する。
文書質問応答において,DeepReadは検索-o1スタイルのエージェント検索よりも大幅に改善されていることを示す。
我々の微粒な行動分析では、人間に似た読みと推論のパラダイムが示され、読みの振る舞いがわかる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:27:48 GMT)
Lost in Speech: Benchmarking, Evaluation, and Parsing of Spoken Code-Switching Beyond Standard UD Assumptions [23.3] Spoken Code-switching (CSW) は、テキストで見えない方法で構文解析に挑戦する。
分散、反復、楕円、談話駆動構造は、通常、標準の普遍依存(UD)前提に反する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:02:07 GMT)
MeDocVL: A Visual Language Model for Medical Document Understanding and Parsing [23.1] 本稿では,クエリ駆動型医療文書解析のための学習後視覚言語モデルであるMeDocVLを提案する。
筆者らのフレームワークは,トレーニング駆動型ラベルリファインメントを組み合わせることで,ノイズの多いアノテーションから高品質な監視を構築する。
MeDocVLは従来のOCRシステムと強力なVLMベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:47:40 GMT)
Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening [23.1] 効果的なエージェントセキュリティは、アーキテクチャ上の分離や強制よりも、本質的で選択的であるべきだ、と我々は主張する。
我々はスパイダーセンス・フレームワークを提案する。スパイダーセンス・フレームワークは、エージェントが潜伏警戒を維持し、リスク認識によってのみ防御をトリガーすることができる。
スパイダーセンスは、最低攻撃成功率(ASR)と偽陽性率(FPR)を達成して、競争力または優れた防御性能を達成する
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:03:26 GMT)
Universal Anti-forensics Attack against Image Forgery Detection via Multi-modal Guidance [22.9] ForgeryEraserは、ターゲットのAIGC検出器にアクセスすることなく、普遍的な反法医学攻撃を実行するように設計されたフレームワークである。
ForgeryEraserは、グローバルな合成と局所的な編集ベンチマークにおいて、高度なAIGC検出器に大幅な性能劣化を引き起こすことを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:32:10 GMT)
Federated Prompt-Tuning with Heterogeneous and Incomplete Multimodal Client Data [22.9] 本稿では,フェデレートラーニングとマルチモーダル・プロンプトチューニングのギャップを埋める。
この設定における重要な課題は、プロンプトインストラクション間のセマンティックアライメントの欠如から生じる。
我々のフレームワークは、プロンプトチューニング命令を同時に最適化し、調整し、集約する特別なクライアントチューニングとサーバアグリゲーションの設計を導入している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:53:35 GMT)
Convex Dominance in Deep Learning I: A Scaling Law of Loss and Learning Rate [22.7] 私たちは、水平線を80倍、モデルサイズを70倍まで超える、学習損失のスケーリング法則を構築しています。
本研究では,深層学習における凸性学習の適用性について検討する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:41:59 GMT)
Fast and Robust Likelihood-Guided Diffusion Posterior Sampling with Amortized Variational Inference [22.2] 本稿では,拡散後サンプリングのためのアモータイズ戦略を導入する。
この戦略は拡散に基づく逆問題における効率性と柔軟性の間のトレードオフを改善する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:24:35 GMT)
GhostCite: A Large-Scale Analysis of Citation Validity in the Age of Large Language Models [22.1] キュテーションは科学的主張を信頼する基盤を提供するが、それらが無効または製造された場合、この信頼は崩壊する。
LLM(Large Language Models)の出現により、このリスクは増大した。
我々は大規模な引用検証のためのオープンソースのフレームワークであるCiteVerifierを開発した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:08:34 GMT)
What Is Wrong with Synthetic Data for Scene Text Recognition? A Strong Synthetic Engine with Diverse Simulations and Self-Evolution [21.8] 私たちは、挑戦的なサンプルの結合をカバーするテキストを合成する強力なデータエンジンであるUnionSTを紹介します。
次に,課題シナリオのシミュレーションを改良した大規模合成データセットUnionST-Sを構築した。
UnionST-Sでトレーニングされたモデルは、既存の合成データセットよりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:23:54 GMT)
Training Data Selection with Gradient Orthogonality for Efficient Domain Adaptation [21.7] 専門分野のための微調整された大きな言語モデルは、しばしばドメインの専門知識の獲得と一般的な推論能力の維持の間のトレードオフを必要とする。
ドメイン性能,一般能力保持,トレーニング効率を調和させるデータ中心の手法として,直交勾配選択(OGS)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:41:40 GMT)
Generating Data-Driven Reasoning Rubrics for Domain-Adaptive Reward Modeling [21.5] 高精度な推論モデルエラーを自動的に構築するデータ駆動型手法を提案する。
ラグビーはより強力なLSM-as-judge報酬関数を構築するのに使うことができる。
この拡張は、ゴールドラベルの完全なデータセットなしで複雑な技術的問題を解決するモデルを教えるための扉を開く。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:51:52 GMT)
VENOMREC: Cross-Modal Interactive Poisoning for Targeted Promotion in Multimodal LLM Recommender Systems [21.1] マルチモーダル大言語モデル (MLLM) は, コンテントグラウンド検索とクロスモーダル融合によるランク付けに向けてレコメンドシステム (RecSys) を推し進めている。
クロスモーダルなコンセンサスは,対話ログを操作したり,摂動を単一モーダルで操作する従来の中毒を緩和することが多いが,同時に,同期マルチモーダル中毒は,微調整中に安定した意味方向に沿って,融合表現を確実に操ることのできる,新たな攻撃面も導入している。
我々は、クロスモーダルなインタラクティブな中毒を定式化してVENOMRECを提案する。これは、共同埋め込み空間における高露光領域を識別するための露光アライメントと、クラフトに対するクロスモーダルなインタラクティブな摂動を実現する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:02:57 GMT)
Judging What We Cannot Solve: A Consequence-Based Approach for Oracle-Free Evaluation of Research-Level Math [21.0] 本研究では,その価値を文脈内見本として検証し,関連する問題を解き明かすオラクルフリー評価器であるConsequence-Based Utilityを提案する。
提案手法は, 1 つの専門家による解と 9 つの LLM 生成解をそれぞれ組み合わせた,研究レベルの数学問題のオリジナルセットに基づいて評価する。
特に、Consequence-Based Utilityは、報酬モデル、生成的報酬モデル、LLM審査員のランキング品質を一貫して上回る。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:10:28 GMT)
Electron-Informed Coarse-Graining Molecular Representation Learning for Real-World Molecular Physics [20.9] 本稿では,電子インフォームド分子表現を余分なコストで学習する手法を提案する。
提案手法は、広範囲なベンチマークデータセットに対して最先端の予測精度を達成した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:48:10 GMT)
Improved Sampling Schedules for Discrete Diffusion Models [20.7] 熱力学的エントロピー生成のレンズを用いて逆過程のダイナミクスを解析する。
本稿では,情報生成の定量化のための厳密なプロキシとしてエントロピー生成率を提案する。
提案したスケジュールが、多様なアプリケーションドメインにわたる最先端戦略を大幅に上回っていることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:38:22 GMT)
Equipping LLM with Directional Multi-Talker Speech Understanding Capabilities [20.5] 指向性を大規模言語モデル(LLM)に統合する2つの新しいアプローチを提案する。
これらのアプローチはすべて、スマートグラスに埋め込まれたマルチマイクロホンアレイを使用して、指向性解釈と処理をストリーミング的に最適化する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:45:48 GMT)
Can Post-Training Transform LLMs into Causal Reasoners? [20.5] 因果推論は意思決定には不可欠だが、非専門家には依然として挑戦的である。
CauGymは、トレーニング用の7つのコア因果タスクと5つの多様なテストセットからなる包括的なデータセットである。
本データセットを用いて,SFT,DPO,KTO,PPO,GRPOの5つのポストトレーニングアプローチを評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:03:00 GMT)
Uncertainty-Aware 4D Gaussian Splatting for Monocular Occluded Human Rendering [20.4] 本稿では,確率的変形ネットワークとダブルラスタライズパイプラインを統合したフレームワークであるU-4DGSを提案する。
このアーキテクチャは、適応変調器として機能する画素整列不確実性マップを描画し、信頼できない観測からアーチファクトを自動的に減衰させる。
ZJU-MoCapとOcMotionの実験は、U-4DGSがSOTAレンダリングの忠実性と堅牢性を達成することを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:14:37 GMT)
Enhance and Reuse: A Dual-Mechanism Approach to Boost Deep Forest for Label Distribution Learning [20.3] ラベル分布学習では,各サンプルとラベル間の相関関係の程度を学習者が予測する必要がある。
Deep Forest (DF) は木のアンサンブルに基づくディープラーニングフレームワークであり、トレーニングフェーズはバックプロパゲーションに依存しない。
ERDF (Enhanced and Reused Feature Deep Forest) という手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:30:45 GMT)
ArcMark: Multi-bit LLM Watermark via Optimal Transport [20.2] マルチビット透かしの最初のキャパシティ特性を示す。
ArcMarkはトークン当たりのビットレートと検出精度で競合するマルチビット透かしよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:28:03 GMT)
Trifuse: Enhancing Attention-Based GUI Grounding via Multimodal Fusion [20.2] 既存のアプローチは、ターゲット要素座標を予測するために、微調整された多モーダルな言語モデルに依存している。
近年の注目に基づく代替手法は,タスク固有の微調整を伴わないMLLMの注意機構の局所化信号を利用する。
本稿では,空間的アンカーを明示的に統合したアテンションベースの接地フレームワークであるTrifuseを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:27:55 GMT)
Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO [20.1] TP-GRPOは成果ベースの報酬を段階的なインクリメンタル報酬に置き換える。
ローカルな報酬傾向を反転させるポイントステップのターンを識別する。
ターンポイントは、インクリメンタル報酬のサイン変更によってのみ検出される。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:37:10 GMT)
Confundo: Learning to Generate Robust Poison for Practical RAG Systems [19.8] Confundoは、大きな言語モデルを毒の発生源として微調整し、高い有効性、堅牢性、およびステルス性を達成するための学習・博学のフレームワークである。
Confundoは、データセットとRAG設定をまたいで、幅広い目的に構築されたアタックを一貫して上回っていることを示す。
また,RAGシステムへの不正な組み込みからWebコンテンツをスクレイピングによって保護する防衛的ユースケースも提示する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:19:49 GMT)
Less Is More: Scalable Visual Navigation from Limited Data [19.4] 古典的幾何学的プランナーをいかに利用して,コストのかかる人間の実証を補完する合成軌道を生成するかを示す。
我々は、トランスフォーマーベースのビジュアルナビゲーションポリシーであるLess is More (LiMo)を訓練し、プランナーが生成する監督による限られた専門家によるデモンストレーションが、かなりのパフォーマンス向上をもたらすことを発見した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:51:24 GMT)
Adaptive Retrieval helps Reasoning in LLMs -- but mostly if it's not used [19.4] 大規模言語モデル(LLM)は静的なパラメトリックな知識のため、複雑な推論タスクでしばしば失敗する。
この研究は、生成モデルを強化するための基本原理を探求し、動的文脈内学習の一形態として検索を扱います。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:48:26 GMT)
Makespan Minimization in Split Learning: From Theory to Practice [19.1] 分割学習は、異種IoTデバイスを用いた分散機械学習のソリューションである。
支援者によるクライアント・ヘルパーの割り当てとタスクのスケジュールを共同で設計することで、トレーニング時間を最小化する方法を示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:22:44 GMT)
TLC-Plan: A Two-Level Codebook Based Network for End-to-End Vector Floorplan Generation [19.1] 空間入力境界からベクトルを直接合成する階層的生成モデルであるTLC-Planを提案する。
TLC-Planは、グローバルレイアウトをセマンティックラベル付きルームバウンディングボックスとしてエンコードするために、2レベルVQ-VAEを使用している。
実験では、RPLANデータセット上での最先端のパフォーマンスと、LIデータセット上でのリード結果が示されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:36:50 GMT)
Explaining Grokking in Transformers through the Lens of Inductive Bias [19.0] インダクティブバイアスのレンズによる変圧器のグラクキングについて検討する。
まず、レイヤ正規化(LN)の位置のようなアーキテクチャ上の選択は、グルーキング速度を強く調節することを示す。
本研究は,従来提案されていた読み出しスケールなどの制御の異なる解釈を誘導し,最適化設定の違いがグルーキングをどう調節するかを考察する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:45:57 GMT)
PromptSplit: Revealing Prompt-Level Disagreement in Generative Models [19.0] プロンプト誘導型生成AIモデルは、視覚領域と言語領域に急速に拡張されている。
本稿では,生成モデル間の即時依存不一致を検出し解析するためのカーネルベースのフレームワークであるPromptSplitを提案する。
テキスト・ツー・イメージ、テキスト・トゥ・テキスト、イメージ・キャプション設定にわたる実験は、PromptSplitが地面と真実の行動の違いを正確に検出していることを示している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:34:05 GMT)
Parameter-free Dynamic Regret: Time-varying Movement Costs, Delayed Feedback, and Memory [19.0] 移動コストを伴う非拘束型オンライン凸最適化(OCO)における動的後悔について検討した。
我々の主な貢献は、この設定に対する最初のコンパレータ適応動的後悔を確立する新しいアルゴリズムである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:50:22 GMT)
TamperBench: Systematically Stress-Testing LLM Safety Under Fine-Tuning and Tampering [18.9] 大規模言語モデル(LLM)のタンパー抵抗を評価するためのフレームワークであるTamperBenchを紹介する。
TamperBenchは、最先端の重量空間微調整攻撃と潜時空間表現攻撃をキュレートする。
私たちはTamperBenchを使って、防衛強化型を含む21個のオープンウェイトLCMを、9つの改ざん脅威に対して評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:04:38 GMT)
ECO: Energy-Constrained Optimization with Reinforcement Learning for Humanoid Walking [18.8] ECO(Energy-Constrained Optimization)は、エネルギー関連メトリクスを報酬から分離する制約付きRLフレームワークである。
その結果,エコは歩行性能を維持しながら,ベースラインに比べてエネルギー消費を著しく減少させることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:14:43 GMT)
Revisiting the Generic Transformer: Deconstructing a Strong Baseline for Time Series Foundation Models [18.8] 本稿では,標準パッチ変換器の可能性について検討し,最先端のゼロショット予測性能を実現することを実証する。
我々は,モデルスケーリング,データ合成,トレーニング技術を網羅的に研究し,高パフォーマンスに必要な材料を分離する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:01:44 GMT)
Privacy in Image Datasets: A Case Study on Pregnancy Ultrasounds [18.7] この研究は妊娠中の超音波画像の存在を探索し、機密性の高い個人情報を蓄積し、しばしばオンラインで共有される。
妊娠中の超音波画像を取得し, 名前や位置情報など, 何千もの個人情報を検知する。
その結果,複数の画像にリスクの高い情報があり,再識別や偽造が可能であることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:47:10 GMT)
AgentXRay: White-Boxing Agentic Systems via Workflow Reconstruction [18.6] 本稿では,明示的で解釈可能なスタンドインワークフローの合成を目的とした新しいタスクであるエージェント再構成(AWR)を紹介する。
本稿では、AWRを個別のエージェントロールに対する最適化指標として定式化する検索ベースのフレームワークであるAgentXRayを提案する。
我々は,AgentXRayが未処理の検索と比較して高いプロキシ類似性を実現し,トークンの消費を減らすことを実証した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:12:16 GMT)
BONSAI: Bayesian Optimization with Natural Simplicity and Interpretability [18.5] BONSAIは、デフォルト設定から低インパクトな逸脱を誘発する、既定のBOポリシーである。
BONSAIは推奨設定における非デフォルトパラメータの数を著しく削減する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:40:26 GMT)
Constrained Group Relative Policy Optimization [18.4] 本稿では、制約付きポリシー最適化のためのラグランジアンによるGRPOの拡張であるConstrained GRPOを紹介する。
提案手法は, 最適推定における単純多成分処理が制約学習を損なう可能性があることを示す。
また,ロボットタスクにおける制約付きGRPOの評価を行い,タスク成功度を高めながら制約満足度を向上させる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:22:59 GMT)
The Doctor Will (Still) See You Now: On the Structural Limits of Agentic AI in Healthcare [18.2] 我々は、開発者、実装者、エンドユーザーを含む20人の利害関係者へのインタビューに基づく質的研究を提示する。
エージェントの定義に関する概念的断片化」という3つの相互強化的緊張について分析した。
我々はエージェントAIが、技術的願望、商業的インセンティブ、臨床的制約が交わる、争われた意味作りの場として機能すると主張している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:53:40 GMT)
Rebenchmarking Unsupervised Monocular 3D Occupancy Prediction [18.2] 単一の画像から、特に隠された領域から3D構造を推定することは、視覚中心の自律運転において、根本的な課題でありながら未解決の課題である。
既存の教師なしアプローチは、通常、神経放射場を訓練し、評価中にネットワーク出力を占有確率として扱う。
本稿では,教師なし単分子3次元占有予測のための改良されたベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:30:26 GMT)
Consensus Protocols for Entanglement-Aware Scheduling in Distributed Quantum Neural Networks [18.1] 本稿では,適応的絡み合い管理を伴う量子コンセンサスプロトコルを協調設計するConsensus-Entanglement-Aware Scheduling (CEAS) フレームワークを提案する。
CEASはフィデリティ重み付けアグリゲーションを統合し、パラメータ更新は量子フィッシャー情報によって重み付けされ、ノイズの多い寄与を抑制する。
CEASは、10~15パーセントの精度を維持している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:36:52 GMT)
AdaptOVCD: Training-Free Open-Vocabulary Remote Sensing Change Detection via Adaptive Information Fusion [18.0] AdaptOVCDは2次元多層情報融合に基づく学習自由なOpen-Vocabulary Change Detectionアーキテクチャである。
このフレームワークは、データ、特徴、決定レベルを垂直にまたいだ多層情報融合を統合し、ターゲットとする適応設計を水平に取り入れる。
クロスデータセット評価における完全教師付きパフォーマンス上限の84.89%を達成し、優れた一般化能力を示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:30:23 GMT)
Reading Between the Waves: Robust Topic Segmentation Using Inter-Sentence Audio Features [17.9] 本稿では,テキストエンコーダとシームズ音声エンコーダの両方を微調整し,文境界付近の音響的手がかりを捉えるマルチモーダル手法を提案する。
YouTubeビデオの大規模なデータセットの実験では、テキストのみのベースラインとマルチモーダルのベースラインよりも大幅に向上している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:16:51 GMT)
Strategizing at Speed: A Learned Model Predictive Game for Multi-Agent Drone Racing [17.7] 我々は、エージェントが行動を起こす前に、いかに深く戦略を立てるべきかを研究する。
モデル予測ゲーム(MPG)とモデル予測制御(MPC)の2つの計画パラダイムを比較した。
本稿では,学習モデル予測ゲーム (LMPG) アプローチを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:20:13 GMT)
Sample-Efficient Policy Space Response Oracles with Joint Experience Best Response [17.6] ポリシー空間対応 Oracles (PSRO) は、近似ベストレスポンス (BR) で制限されたゲームを反復的に拡張することで、これらの問題に対処する。
我々は、PSROのドロップイン修正であるJoint Experience Best Response (JBR)を導入し、現在のメタストラテジープロファイルの下で1回だけトラジェクトリを収集し、このジョイントデータセットを再利用して、すべてのエージェントに対するBRを同時に計算する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:52:32 GMT)
Exposing Weaknesses of Large Reasoning Models through Graph Algorithm Problems [17.4] 大型共振モデル (LRM) は急速に進歩している。
既存の数学、コード、常識推論のベンチマークは依然として限られている。
LRMを評価するために設計されたベンチマークであるGrAlgoBenchを紹介する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:36:15 GMT)
Pruning at Initialisation through the lens of Graphon Limit: Convergence, Expressivity, and Generalisation [16.6] 初期化法におけるプルーニングは、訓練前にスパースで訓練可能なワークを発見するが、その理論的メカニズムは解明されていない。
本研究では、離散固有プルーニングをグラフトンによるグラフ極限理論に結合し、PaIマスクのグラフ極限を確立する。
i) アクティブ座標部分空間の次元にのみ依存するスパースネットワークに対する普遍近似定理と(ii) グラノン-NTK一般化の2つの基本的な理論結果が導かれる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:02:47 GMT)
Adaptive-CaRe: Adaptive Causal Regularization for Robust Outcome Prediction [16.4] 監視された機械学習アルゴリズムは、医療領域における結果予測に一般的に使用される。
本稿では,医療領域における一般結果予測のためのモデル非依存型正規化戦略であるAdaptive-CaReを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:14:03 GMT)
Robust Pedestrian Detection with Uncertain Modality [16.4] クロスモーダル歩行者検出は、24時間監視システムにおける歩行者を検出するために、RGBと熱赤外(TIR)モダリティの相補的な情報を利用する。
本稿では,アダプティブ不確実性認識ネットワーク(AUNet)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:48:21 GMT)
BEAGLE: Behavior-Enforced Agent for Grounded Learner Emulation [16.1] オープンエンドの問題解決環境における学生の学習行動のシミュレーションは、教育研究の可能性を秘めている。
しかし、プライバシー上の懸念や縦断的研究のコストが高いため、真正データ収集は困難である。
本稿では、自己制御学習(SRL)理論を新しいアーキテクチャに組み込むことにより、このバイアスに対処する神経象徴的フレームワークBEAGLEを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:05:15 GMT)
THOR: Inductive Link Prediction over Hyper-Relational Knowledge Graphs [15.9] ハイパーリレーショナルknOwledge gRaphsのインダクティブリンク予測手法THORを提案する。
THORは、2つの並列グラフエンコーダとトランスフォーマーデコーダを持つ2つの基礎グラフから学習するために設計されている。
その結果、THORは、66.1%、55.9%、20.4%の改善率で、最も優れたルールベース、半インダクティブ、完全インダクティブ技術よりも大きなベースラインのコレクションを上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:44:41 GMT)
RFDM: Residual Flow Diffusion Model for Efficient Causal Video Editing [15.9] 本稿では,フレーム単位で可変長ビデオフレームを編集する因果的,効率的なビデオ編集モデルを提案する。
効率を上げるために、2次元画像画像画像(I2I)拡散モデルから始め、V2V(V2V)編集に適応させる。
我々はこの残留流拡散モデル(Residual Flow Diffusion Model, RFDM)と呼ぶ。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:56:30 GMT)
Evaluating and Enhancing the Vulnerability Reasoning Capabilities of Large Language Models [15.8] 本稿では,DAG生成タスクとして脆弱性推論をモデル化する新しいフレームワークであるDAGVulを提案する。
さらにReinforcement Learning with Verifiable Rewards (RLVR)を導入することで、モデル推論トレースをプログラム固有の論理と整合させる。
我々のフレームワークは、すべてのベースラインに対して平均18.9%の推論F1スコアを改善します。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:19:45 GMT)
FloorplanVLM: A Vision-Language Model for Floorplan Vectorization [15.7] 本稿では,ベクトル化を画像条件付きシーケンスモデリングタスクとして再構成する統合フレームワークFloorplanVLMを提案する。
この「ピクセル・ツー・シーケンス」パラダイムは、壁や湾曲した弧のような複雑な接地における正確で全体的な制約満足度を可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:57:52 GMT)
MMEarth-Bench: Global Model Adaptation via Multimodal Test-Time Training [15.7] MMEarth-Benchは、12のモダリティ、グローバル分散データ、およびin-out-of-distriionテストの分割を持つ5つの新しいマルチモーダル環境タスクのコレクションである。
我々は、事前訓練されたモデルの多様なセットをベンチマークし、(マルチモーダルな)事前訓練は、限られたデータ設定におけるモデルの堅牢性を改善する傾向にあるが、地理的一般化能力は貧弱であることを示した。
本稿では,テスト時に利用できるすべてのモダリティを補助的タスクとして利用するマルチモーダル再構成(TTT-MMR)を用いたテストタイムトレーニングのモデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:48:19 GMT)
A Consistency-Improved LiDAR-Inertial Bundle Adjustment [15.6] パラメータ化と推定器を備えた整合性改善LiDAR-慣性バンドル調整(BA)を提案する。
We implement a LiDAR-inertial BA with Maximum a Posteriori (MAP) formulation and First-Estimate Jacobians (FEJ) to maintain the accurate estimated covariance and observability properties of the system。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:28:12 GMT)
Attention-Driven Framework for Non-Rigid Medical Image Registration [15.5] 非デジタル医用画像登録のための新しい注意駆動フレームワーク(AD-RegNet)を提案する。
提案手法は3次元UNetバックボーンと双方向のクロスアテンションを組み合わせることで,動画像と固定画像との対応関係を複数スケールで確立する。
提案手法は,登録精度と計算効率のバランスを良好に保ち,臨床応用に適している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:23:37 GMT)
Can Microcanonical Langevin Dynamics Leverage Mini-Batch Gradient Noise? [15.4] チェーンモンテカルロのような推論手法を高次元モデルにスケールすることは、ディープラーニングにおける中心的な課題である。
最近の有望な提案であるマイクロカノニカルなLangevin Monte Carloは、様々な問題で最先端のパフォーマンスを示している。
マイクロカノニカルダイナミクスは、ミニバッチ勾配ノイズを効果的に活用できるのか?
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:52:19 GMT)
CauCLIP: Bridging the Sim-to-Real Gap in Surgical Video Understanding via Causality-Inspired Vision-Language Modeling [15.3] 目的のドメインデータにアクセスすることなく,外科的位相認識のためのドメイン不変表現を学習する因果性インスパイアされた視覚言語フレームワークを提案する。
提案手法は,意味的構造を保ちながらドメイン固有の属性を摂動させるための周波数ベースの拡張戦略と,非因果バイアスを緩和し,因果的外科的特徴を補強する因果的抑制損失を統合する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:23:17 GMT)
Revisiting Emotions Representation for Recognition in the Wild [15.3] 複雑な感情状態を,一連の感情クラス上の確率分布として記述する新しい手法を提案する。
それぞれの分布に属する顔画像の確率を推定し、感情状態は感情の混合として記述できる。
予備的な実験では、この解の利点と新たな研究の方向性を説明する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:32:12 GMT)
RealFin: How Well Do LLMs Reason About Finance When Users Leave Things Unsaid? [15.1] 本稿では,試験スタイルの質問から本質的な前提を体系的に取り除き,金銭的推論を評価するベンチマークREALFINを紹介する。
汎用モデルは過度にコミットされ、推測される傾向にあるが、金融特化モデルの多くは、欠落した施設を明確に識別することができない。
これらの結果は、現在の評価における重要なギャップを浮き彫りにして、信頼できる金融モデルが、質問に答えるべきでないことを知らなければならないことを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:47:54 GMT)
"Tab, Tab, Bug'': Security Pitfalls of Next Edit Suggestions in AI-Integrated IDEs [15.0] Next Edit Suggestions (NES)は、現代のAI統合IDEの新機能である。
本稿では,NESシステムのシステムセキュリティ研究を初めて実施する。
その結果、NESはコンテキスト中毒にかかり、トランザクション編集やヒューマンIDEの相互作用に敏感であることが判明した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:06:36 GMT)
Continuum Robot Localization using Distributed Time-of-Flight Sensors [14.8] 本稿では,ロボットの長さに沿って分散された小型で低解像度のToFセンサを利用する連続ロボットのための技術を提案する。
53cmのロボットを用いた実験条件で, 位置2.5cm, 回転7.2mの平均定位誤差を実現する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:42:37 GMT)
Subgraph Reconstruction Attacks on Graph RAG Deployments with Practical Defenses [14.4] 敵は、ターゲットRAGシステムの知識グラフからサブグラフを再構築し、プライバシ推論とキュレートされた知識資産の複製を可能にする。
既存の攻撃は、単純なプロンプトベースのセーフガードであっても、Graph RAGに対してほとんど効果がない。
GRASPはクローズドボックスのマルチターンサブグラフ再構築攻撃である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:44:22 GMT)
Identifying Adversary Tactics and Techniques in Malware Binaries with an LLM Agent [14.4] 現実世界のマルウェアバイナリは通常、シンボルから取り除かれ、多数の関数を含み、悪意のある振る舞いを複数のコード領域に分散する。
最近の大規模言語モデル(LLM)は、強力なコード理解機能を提供するが、このタスクに直接適用することは、課題に直面している。
本報告では, TTP を識別する最初の LLM エージェントであるTTPDetect について述べる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:42:48 GMT)
DuMeta++: Spatiotemporal Dual Meta-Learning for Generalizable Few-Shot Brain Tissue Segmentation Across Diverse Ages [14.4] emphDuMeta++は2つのメタラーニングフレームワークで、ペア長手データなしで動作します。
提案手法は,(1)脳構造の年齢に依存しない意味表現を抽出するメタ機能学習,(2)セグメンテーションモデルのデータ-効率な適応を可能にするメタ初期化学習を統合した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:21:19 GMT)
AgentStepper: Interactive Debugging of Software Development Agents [14.3] 本稿では,ソフトウェアエンジニアリングエージェントのための対話型デバッガであるAgentStepperを紹介する。
AgentStepperは、LLM、エージェントプログラム、ツール間の構造化された会話としてトラジェクトリを表す。
ブレークポイント、ステップワイズ実行、プロンプトとツール呼び出しのライブ編集、中間リポジトリレベルのコード変更のキャプチャと表示をサポートする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:44:09 GMT)
JADE: Expert-Grounded Dynamic Evaluation for Open-Ended Professional Tasks [14.1] 本稿ではエージェントAIのための2層評価フレームワークであるJADEを提案する。
レイヤ1は、専門家の知識を事前に定義された評価スキルのセットとしてエンコードする。
レイヤ2は、多様な推論戦略を柔軟に評価するために、レポート固有のクレームレベルの評価を行う。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:26:09 GMT)
Decoupling Variance and Scale-Invariant Updates in Adaptive Gradient Descent for Unified Vector and Matrix Optimization [14.1] 我々はAdaGradの更新を改訂し、分散適応項とスケール不変項に分解する。
これは、ベクトルベースの分散適応と行列スペクトル最適化をブリッジするフレームワークである、textbfDeVA$$textbfV$ariance $textbfA$daptationを生成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:06:42 GMT)
BLITZRANK: Principled Zero-shot Ranking Agents with Tournament Graphs [14.1] 我々は、$k$-wiseランキングの原則となる基盤を提供するトーナメントグラフフレームワークを導入する。
それぞれ$k$-item比較すると、$binomk2$の完全なトーナメントがペアワイズで表示される。
我々は、アイテムのランクが確実に決定されたときを形式化し、情報ゲインを最大化する欲求クエリスケジュールを設計する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:21:31 GMT)
ScaleBITS: Scalable Bitwidth Search for Hardware-Aligned Mixed-Precision LLMs [14.1] 学習後重み量子化は,大規模言語モデル(LLM)のメモリと推論コストの低減に不可欠である
本研究では,メモリ予算下でのビット幅の自動割り当てを実現する混合精度量子化フレームワークであるScaleBITSを提案する。
実験により、ScaleBITSは均一精度の量子化(+36%)よりも大幅に改善し、超低ビット状態における最先端の感度認識ベースライン(+13%)よりも優れていた。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:11:16 GMT)
Robustness Beyond Known Groups with Low-rank Adaptation [14.0] ディープラーニングモデルは、しばしば特定のサブ集団に系統的な失敗を示す。
既存のグループロバスト手法は、訓練やモデル選択にグループアノテーションを使用して、関連するサブグループの事前知識を前提としている。
低次元部分空間を同定してグループロバスト性を改善する単純な2段階法である低ランク誤り情報適応法(LEIA)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:18:13 GMT)
In-Run Data Shapley for Adam Optimizer [13.9] 本稿では,Adam-Aware In-Run Data Shapleyを提案する。
本手法は, 標準トレーニングの95%を保ちながら, グラウンドピアソン限界貢献に対するほぼ完全な忠実度を実現する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:27:57 GMT)
Vision Transformer Finetuning Benefits from Non-Smooth Components [13.9] 視覚変換素子が出力を入力の変化に適応させる能力、つまり可塑性を解析する。
実践者にとって重要な点は、注意モジュールとフィードフォワード層の高可塑性が、常に優れた微調整性能をもたらすことである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:12:22 GMT)
DreamHome-Pano: Design-Aware and Conflict-Free Panoramic Interior Generation [13.6] 高忠実性内部合成のための制御可能なパノラマ生成フレームワークDreamHome-Panoを提案する。
提案手法では,セマンティックブリッジとして機能するPrompt-LLMを導入し,レイアウト制約やスタイル参照を効果的に翻訳する。
我々は,構造認識型幾何学的先行と多条件疎結合戦略を組み込んだ衝突自由度制御アーキテクチャを開発した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:41:48 GMT)
CodeCircuit: Toward Inferring LLM-Generated Code Correctness via Attribution Graphs [13.5] 本研究の目的は、コード生成中に論理的妥当性を予測可能な内部デオード可能な信号が、モデル内のニューラルダイナミクスで符号化されているかどうかを検討することである。
複雑な残留流を分解することにより,音の推論と論理的失敗を区別する構造的シグネチャを同定することを目的とする。
Python、C++、Javaでの分析では、固有の正当性信号が多様な構文で堅牢であることが確認されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:49:15 GMT)
Fault-Tolerant Evaluation for Sample-Efficient Model Performance Estimators [13.2] 本稿では, バイアスと分散を考慮した耐障害性評価フレームワークを提案する。
我々は、$varepsilon$の適切なキャリブレーションにより、異なる分散状態の信頼性が保証されることを示す。
実世界のデータセットの実験は、我々のフレームワークが推定器の振る舞いに関する包括的で実行可能な洞察を提供することを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:14:46 GMT)
Latent Target Score Matching, with an application to Simulation-Based Inference [13.2] Latent Target Score Matching (LTSM)は、TSMの拡張である。
LTSMは、シミュレーションベースの推論タスク間の分散、スコア精度、サンプル品質を一貫して改善する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:45:29 GMT)
On the Convergence of Multicalibration Gradient Boosting [13.1] 多重校正勾配向上のための収束保証を提供することで、二乗誤差損失を伴う回帰のギャップを埋める。
連続する予測更新の規模は$O(1/sqrtT)$で減衰し、これはラウンド上の多重校正誤差に束縛される同じ収束率を意味する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:29:02 GMT)
Beyond Function-Level Analysis: Context-Aware Reasoning for Inter-Procedural Vulnerability Detection [13.1] 本稿では,コンテキスト認識型脆弱性検出フレームワークCPRVulを提案する。
CPRVulは関数のみのベースラインを一貫して上回ることを示す。
また、処理コンテキストが構造化推論とペアリングされている場合にのみゲインが発生することを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:49:49 GMT)
Hybrid Feedback-Guided Optimal Learning for Wireless Interactive Panoramic Scene Delivery [13.0] バーチャルおよび拡張現実のような没入型アプリケーションは、フレームレート、レイテンシ、同期に厳しい要件を課している。
これらの要件を満たすため、エッジサーバはパノラマコンテンツをレンダリングし、ユーザの頭の動きを予測し、ユーザビューポートをカバーするのに十分な大きさのシーンの一部を送信する必要がある。
各部分は2つのフィードバック信号を生成する: 予測フィードバック、選択された部分が実際のビューポートをカバーするかどうか、および送信フィードバック、および対応するパケットが正常に配信されるかどうかを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:51:13 GMT)
SPDA-SAM: A Self-prompted Depth-Aware Segment Anything Model for Instance Segmentation [12.9] 本稿では,SPDA-SAM(Self-prompted Depth-Aware SAM)を提案する。
具体的には,画像エンコーダとSAMのマスクデコーダから意味的および空間的プロンプトを抽出するセマンティック・空間自己プロンプトモジュール(SSSPM)を設計する。
また,単分子RGB画像から抽出した特徴と,そこから推定した深度マップを融合した粗大なRGB-D核融合モジュール(C2FFM)を導入する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:01:41 GMT)
Supercharging Simulation-Based Inference for Bayesian Optimal Experimental Design [12.7] ベイズ最適実験(BOED)は、期待される実験の情報ゲインを最大化する。
EIGは、現代のSBI密度推定器を直接活用できる複数の定式化を認めている。
グラデーションに基づくEIG設計の鍵となるボトルネックを特定し、単純なマルチスタート並列勾配上昇手順が信頼性と性能を大幅に向上できることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:50:00 GMT)
CytoCrowd: A Multi-Annotator Benchmark Dataset for Cytology Image Analysis [12.7] 我々は、医療画像分析のための新しい公開ベンチマークであるCytoCrowdを紹介する。
データセットには446の高解像度イメージがあり、それぞれに2つの重要なコンポーネントがある。
オブジェクト検出や分類といった標準的なコンピュータビジョンタスクのベンチマークとして機能する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:00:49 GMT)
OmniCode: A Benchmark for Evaluating Software Engineering Agents [12.6] OmniCodeは、現実世界のソフトウェア開発のための新しいソフトウェアエンジニアリングベンチマークである。
3つのプログラミング言語(Python、Java、C++)にまたがる1794のタスクと、バグ修正、テスト生成、コードレビュー修正、スタイル修正の4つの主要なカテゴリを含んでいる。
我々は、SWE-Agentのような人気のあるエージェントフレームワークでOmniCodeを評価し、Pythonのバグ修正でうまく機能するが、テスト生成のようなタスクやC++やJavaのような言語では不足していることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:49:06 GMT)
Revisiting the Seasonal Trend Decomposition for Enhanced Time Series Forecasting [12.6] 時系列の分解に基づいて、時系列予測を改善するために機械学習モデルのアーキテクチャを強化する。
我々は、正規化やスケーリングの手順を使わずにバックボーンモデルを直接適用することで、季節成分と異なるアプローチをとる。
提案手法は,4つの最先端ベースラインにわたる平均MSEの約10%の削減を連続的に達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:32:47 GMT)
Not All Layers Need Tuning: Selective Layer Restoration Recovers Diversity [12.6] トレーニング後モデルで選択した層をトレーニング前の重みに復元する,トレーニング不要な手法を提案する。
SLRは、高い出力品質を維持しながら、出力の多様性を一貫して、実質的に向上させることができる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:49:13 GMT)
scDFM: Distributional Flow Matching Model for Robust Single-Cell Perturbation Prediction [12.5] 条件付きフローマッチングに基づく生成フレームワークである scDFM を提案する。
scDFMは、細胞レベルでの通信以上の個体群を混乱させ、制御する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:00:21 GMT)
RAIGen: Rare Attribute Identification in Text-to-Image Generative Models [12.1] 拡散モデルにおける非教師なしレア属性発見のための最初のフレームワークであるRAIGenを紹介する。
RAIGenは、安定拡散における固定フェアネスのカテゴリを超えた属性を発見し、SDXLのような大型モデルにスケールし、生成中のレア属性のターゲット増幅を可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:54:41 GMT)
POP: Online Structural Pruning Enables Efficient Inference of Large Foundation Models [12.1] POP(Partition-guided Online Pruning)は、計算オーバーヘッドを最小限に抑えた効率的なオンライン構造解析フレームワークである。
POPは、オフラインキャリブレーション、リトレーニング、学習予測など、事前処理を必要としない軽量なプラグアンドプレイ方式である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:07:42 GMT)
High-speed phase-encoded quantum secure direct communication over 11.4 km heterogeneous free-space and fiber links [12.0] 1400mの自由空間上の位相符号化量子通信を実証する。
このシステムは安定して1時間近く動作し、99.07%の干渉可視性と平均量子ビット誤り率2.38%を達成した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:35:03 GMT)
Estimating Exam Item Difficulty with LLMs: A Benchmark on Brazil's ENEM Corpus [11.9] 大規模言語モデル(LLM)は、教育コンテンツを生成するためにますます多くデプロイされている。
我々は1031の質問に対して10のプロプライエタリかつオープンウェイトなLCMをIRTパラメータに対してベンチマークする。
最良のモデルでは、適度なランク相関が達成されているが、体系的に難易度を過小評価し、マルチモーダルアイテムで著しく劣化する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:44:18 GMT)
User-Centric Object Navigation: A Benchmark with Integrated User Habits for Personalized Embodied Object Search [11.5] ユーザ固有のオブジェクト配置習慣を取り入れた新しいベンチマークであるユーザ中心オブジェクトナビゲーション(UcON)を紹介した。
UcONは489のオブジェクトカテゴリにわたる約22,600のユーザ習慣を含んでいる。
本研究では,対象物に関連する習慣を抽出し,利用するための習慣検索モジュールを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:43:05 GMT)
BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations [11.4] 生成した回答の品質と、生成した回答の事実をサポートするための参照を評価することが重要である。
バイオACEは,バイオメディカルな回答と,回答に記載された事実に対する引用を自動で評価するフレームワークである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:37:31 GMT)
Zero-Shot UAV Navigation in Forests via Relightable 3D Gaussian Splatting [11.3] 受動的単眼視を用いた非構造屋外環境におけるUAVナビゲーションは、シミュレーションと現実の間のかなりの視覚領域のギャップによって妨げられる。
本研究では,非構造化屋外への効率的なゼロショット転送を目的とした,エンドツーエンドの強化学習フレームワークを提案する。
本研究では, 複雑な森林環境において, 最大10m/sの速さで, 頑健で無衝突な航法を実現することを実証した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:51:03 GMT)
Collaborative and Efficient Fine-tuning: Leveraging Task Similarity [11.3] CoLoRA(Collaborative Low-Rank Adaptation)は、協調的かつ効率的に微調整されたファンデーションモデルに類似したタスクを利用する。
理論的には、CoLoRAを不均一線形回帰について研究し、真理回復のための証明可能な保証を提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:59:40 GMT)
The Value of Variance: Mitigating Debate Collapse in Multi-Agent Systems via Uncertainty-Driven Policy Optimization [11.3] マルチエージェント討論(MAD)システムは反復的な議論を通じて推論を改善するが、議論の崩壊には弱いままである。
既存の方法には、そのような障害を検知または防止するための原則的なメカニズムが欠如している。
本稿では,エージェント内(個人的推論の不確実性),エージェント間(対話的不確実性),システムレベル(出力不確実性)の3つのレベルにおいて,行動の不確実性を測定する階層的尺度を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:41:49 GMT)
TraceCoder: A Trace-Driven Multi-Agent Framework for Automated Debugging of LLM-Generated Code [11.2] 人間の観察・分析・修復過程をエミュレートするフレームワークであるTraceCoderを提案する。
このフレームワークはまずコードを診断プローブで測定し、粒度の細かいランタイムトレースをキャプチャする。
その後、これらのトレースについて因果解析を行い、失敗の根本原因を正確に特定する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:59:48 GMT)
Beyond Pairwise Distance: Cognitive Traversal Distance as a Holistic Measure of Scientific Novelty [11.1] 我々は,ネットワークに基づく認知的トラバース距離(CTD)を導入した。
CTDは、紙に関連するすべての知識ユニットを繋ぐのに必要な最短経路の長さとして定義される。
我々は,F1000Prime推奨論文とノーベル賞受賞論文から,専門家によるノベルティベンチマークに対するCTDの評価を行った。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:11:01 GMT)
From Out-of-Distribution Detection to Hallucination Detection: A Geometric View [11.0] 本研究は,アウト・オブ・ディストリビューション(OOD)検出レンズによる幻覚検出を再考する。
言語モデルにおける次トーケン予測を分類タスクとして扱うことにより,OOD手法の適用が可能となる。
OODをベースとしたアプローチはトレーニング不要で単一サンプルベースの検出器となり、推論タスクの幻覚検出において高い精度が得られることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:05:48 GMT)
MosaicThinker: On-Device Visual Spatial Reasoning for Embodied AI via Iterative Construction of Space Representation [11.0] 我々は、デバイス上で具体化されたAI、すなわちemphMosaicThinkerのための新しい推論時間計算手法を提案する。
我々の基本的な考え方は、複数のフレームからの断片化された空間情報をグローバルな意味マップの統一された空間表現に統合し、視覚的なプロンプトを通してVLMの空間推論を導くことである。
実験結果から,資源制約されたAIデバイス上でのクロスフレーム空間推論の精度を,多種多様なタイプや複雑なタスクの推論よりも大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:17:29 GMT)
Systematic Performance Assessment of Deep Material Networks for Multiscale Material Modeling [11.0] Deep Material Networks (DMN) は、マイクロメカニカルな原理をアーキテクチャに組み込む構造保存型機械的機械学習モデルである。
採用が増えているにもかかわらず、完全なオフライン-オフラインパイプラインにおけるパフォーマンスの体系的な評価は依然として限られている。
本研究は, 予測精度, 計算効率, トレーニングロバスト性について, DMNの総合的比較評価を行う。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:55:27 GMT)
TrailBlazer: History-Guided Reinforcement Learning for Black-Box LLM Jailbreaking [11.0] 本稿では,RLをベースとしたjailbreakフレームワークを提案する。このフレームワークは,脆弱性信号を事前の手順から分析し,重み付けし,今後の意思決定を導く。
本手法は,クエリ効率を大幅に向上しつつ,最先端のjailbreak性能を実現する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:11:10 GMT)
"Death" of a Chatbot: Investigating and Designing Toward Psychologically Safe Endings for Human-AI Relationships [10.9] 数百万のユーザが character.AI、Replika、ChatGPT などのAIコンパニオンに感情的なアタッチメントを作成している。
これらの関係がモデル更新、安全性の介入、あるいはプラットフォームシャットダウンを通じて終わると、ユーザーは閉鎖されることなく、人間の損失に匹敵する悲しみを報告します。
中止は、ユーザーがエージェンシーを判断し、最終性を認識し、仲間を人為的に形作る方法によって形作られた感覚形成プロセスであることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:57:37 GMT)
How (Not) to Hybridize Neural and Mechanistic Models for Epidemiological Forecasting [10.9] 監視データからの疫学的予測は難しい問題である。
堅牢なパフォーマンスには、非定常性を明確にする必要があります。
我々は、感染を傾向、季節、残留成分に分解し、これらの信号を用いて持続的な潜伏動態を駆動する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:40:33 GMT)
Refining the Information Bottleneck via Adversarial Information Separation [10.7] 限られたデータから一般化することは、物質科学のような領域のモデルにとって重要である。
本稿では,タスク関連機能をノイズから分離するAdverISF(Adversarial Information Separation Framework)を提案する。
本稿では,AdverISFがデータスカースシナリオにおける最先端手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:54:47 GMT)
AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders [10.7] 私たちは、WhisperとHuBERTのすべてのエンコーダ層にわたってSAEをトレーニングします。
50%以上の機能は無作為な種間で一貫しており、復元品質は維持されている。
SAEの特徴は, 音声知覚における脳波活動と相関し, 人間の神経処理との整合性を示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:35:19 GMT)
FairJudge: An Adaptive, Debiased, and Consistent LLM-as-a-Judge [10.6] 既存のLCM-as-a-Judgeシステムでは、タスクやドメイン固有の評価基準への適応性が制限されている。
適応的で、偏りがあり、一貫したLCM-as-a-JudgeであるFairJudgeを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:35:32 GMT)
TATRA: Training-Free Instance-Adaptive Prompting Through Rephrasing and Aggregation [10.5] 大きな言語モデル(LLM)は大幅に改善されているが、その振舞いは表現の速さに非常に敏感である。
本稿では,インスタンス固有の少数ショットプロンプトを構成するデータセットフリープロンプトであるTATRAを紹介する。
数学的推論ベンチマークでは、TATRAはGSM8KとDeepMathで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:20:35 GMT)
Exploring AI-Augmented Sensemaking of Patient-Generated Health Data: A Mixed-Method Study with Healthcare Professionals in Cardiac Risk Reduction [10.5] 本稿では,患者生成健康データ(PGHD)の自動要約と自然言語データ探索によって,大規模言語モデル(LLM)がいかにして患者生成健康データ(PGHD)の認識を支援するかを示す。
発見によると、AIの要約は、探索を固定する素早い概要を提供し、会話の相互作用はフレキシブルな分析とブリッジされたデータリテラシーギャップを支持した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:02:27 GMT)
Efficient Online Variational Estimation via Monte Carlo Sampling [10.5] 本稿では,パラメトリック状態空間モデルにおけるオンライン変動推定について述べる。
本稿では,観測結果が連続的に届くストリーミング・データ・セッティングにおいて,エビデンス・ローバウンドとその勾配を効率的に計算する新しい手法を提案する。
モンテカルロサンプリング(Monte Carlo sample)は、計算効率と柔軟性を両立させる、洗練された深層アーキテクチャと組み合わせた手法である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:20:20 GMT)
Sequences as Nodes for Contrastive Multimodal Graph Recommendation [10.5] MuSICRecは、協調的、シーケンシャル、マルチモーダルな信号を組み合わせたグラフベースのレコメンデータである。
Amazon Baby、Sports、Electronicsのデータセットでは、MuSICRecは最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:35:12 GMT)
Multimodal Enhancement of Sequential Recommendation [10.5] 本稿では,マルチモーダルおよびシーケンシャルなレコメンデーションパラダイムを統一する新しいレコメンデーションフレームワークであるMuSTRecを提案する。
MuSTRecは、抽出したテキストと視覚的特徴からアイテムとアイテムのグラフを構築することで、横断的な類似性と協調的なフィルタリング信号をキャプチャする。
複数のAmazonデータセット全体で、MuSTRecはマルチモーダルおよびシーケンシャルな最先端ベースラインよりも優れたパフォーマンス(最大33.5%の改善)を示している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:32:56 GMT)
DSL: Understanding and Improving Softmax Recommender Systems with Competition-Aware Scaling [10.5] 暗黙のフィードバックでは、単一の大域温度と一様にサンプリングされた負の均等な処理が脆い訓練につながる。
特定の負のセットを持つユーザ-イム対の最適損失シャープネスは、異なる負の別のものに対して最適か不安定である。
本稿では,サンプル競合自体から効果的なシャープネスを推定するソフトマックスロスについて紹介する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:32:38 GMT)
$f$-Differential Privacy Filters: Validity and Approximate Solutions [10.5] 完全な適応構成の下でのプライバシー損失の会計は、差分プライバシーにおける中心的な課題である。
最適なトレードオフベースの概念である$f$-DPが、完全な適応的相互作用の下で有効なプライバシーフィルタを認めるかどうかは不明だ。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:04:02 GMT)
Action Hallucination in Generative Visual-Language-Action Models [10.4] Vision-Language-Actionモデルは、手作業で設計されたプランナーをエンドツーエンドの生成アクションモデルに置き換えている。
身体的制約に違反する行動幻覚とその計画レベルの失敗への拡張を分析する。
幻覚は、実現可能なロボット行動と一般的なモデルアーキテクチャの間の構造的ミスマッチから生じることが多いことを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:05:30 GMT)
Back to Basics: Revisiting Exploration in Reinforcement Learning for LLM Reasoning via Generative Probabilities [10.2] RLVR(Reinforcement Learning with Verifiable Rewards)は、Large Language Models(LLMs)における推論の強化に欠かせないパラダイムとして登場した。
我々は、この問題をサンプリング確率力学の観点から分析し、標準目的が高次様相の経路を不均等に強化することを特定する。
提案手法は,すべての応答に対する信頼度を平衡化するための新しいアドバンテージ再重み付け機構 (ARM) を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:21:38 GMT)
An Adaptive Differentially Private Federated Learning Framework with Bi-level Optimization [10.2] フェデレーション学習は、データプライバシを保持しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。
実際の展開では、デバイスの不均一性、非独立性、および同一に分散された(Non-IID)データは、しばしば非常に不安定で偏りのある勾配更新をもたらす。
異種およびプライバシー制約のある環境下でモデル効率を明示的に目標とする適応型微分プライベートなフェデレーション学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:27:33 GMT)
On the Wings of Imagination: Conflicting Script-based Multi-role Framework for Humor Caption Generation [10.2] ユーモア(英: Humor)は、日常生活において一般的に用いられ、複雑な人間の言語である。
本稿では,基本的ユーモア理論であるGTVHに基づく新しいユーモア生成機構を開発する。
そこで本研究では,ユーモア理論に基づくマルチロールLLM協調フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:41:33 GMT)
Can LLMs Discern the Traits Influencing Your Preferences? Evaluating Personality-Driven Preference Alignment in LLMs [10.0] 選好文の背景にある「ラテント」信号としてパーソナリティを研究する。
パーソナライズされた嗜好の条件付けは、パーソナライズされた質問応答を大幅に改善する。
本稿では,LLMモデルを用いて人格に適合した好みを自動検索し,回答生成時に組み込むフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:37:02 GMT)
RelayGen: Intra-Generation Model Switching for Efficient Reasoning [9.7] RelayGenはトレーニングフリーのセグメントレベルのランタイムモデルスイッチングフレームワークである。
長文推論における難易度の変化を利用する。
大規模なモデルの精度の大部分を保ちながら、推論遅延を大幅に低減します。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:35:01 GMT)
TimelyFreeze: Adaptive Parameter Freezing Mechanism for Pipeline Parallelism [9.6] 本稿では,パイプラインスケジュールを有向非巡回グラフとしてモデル化し,最適凍結比を求める線形プログラムを解くTimelyFreezeを提案する。
実験の結果、TimelyFreezeはLLaMA-8Bで最大40%のトレーニングスループットを同等の精度で達成している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:08:18 GMT)
A Unified Framework for LLM Watermarks [9.5] 本稿では,既存の透かし方式のほとんどを,原則的制約付き最適化問題から導出できることを示す。
我々のフレームワークはまた、特定の要求に合わせた新しい透かし方式を設計するための原則的なアプローチも提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:00:30 GMT)
Optimal Learning-Rate Schedules under Functional Scaling Laws: Power Decay and Warmup-Stable-Decay [9.4] 機能的スケーリング法則の下で、最適学習率スケジュール(LRS)について検討する。
LRSは線形回帰と大規模言語モデル(LLM)の事前学習の損失ダイナミクスを正確にモデル化する。
我々は,ピーク学習率のみを調整した最適な形状固定スケジュールを解析する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:52:30 GMT)
F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare [9.3] グループサイズの関数として、更新が希少な修正モードを欠く確率を導出する。
本稿では,高頻度プロンプトのダウンウェイトが更新されるFocal Losにインスパイアされた,難易度を考慮したアドバンテージスケーリング係数を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:07:30 GMT)
Beyond Pooling: Matching for Robust Generalization under Data Heterogeneity [9.2] 本稿では,適応型セントロイドに対してサンプルを選択するマッチングフレームワークを提案し,その表現分布を反復的に洗練する。
これらの改善は、ゼロショットの医療異常検出に寄与する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:56:02 GMT)
Principle-Evolvable Scientific Discovery via Uncertainty Minimization [9.2] 科学発見をベイズ最適化として扱う原理進化可能なフレームワークであるPiEvoについて述べる。
PiEvoのソリューションの平均品質は90.81%93.15%に達し、最先端よりも29.7%31.1%向上している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:19:27 GMT)
Fair Transit Stop Placement: A Clustering Perspective and Beyond [9.1] 一般距離空間におけるトランジット停止配置(TrSP)問題について検討する。
エージェントはソース・デスティネーション・ペアの間を移動でき、直接歩くか、選択されたトランジット・ストップを経由してシャトルサービスを利用することができる。
正当性表現(JR)とコアによるTrSPの公平性について検討する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:31:02 GMT)
Graph-Based Nearest-Neighbor Search without the Spread [8.9] 線形サイズグラフと組み合わせて、対数時間でANNクエリに$n$で答えられるような、外部の線形サイズデータ構造を構築する方法を示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:46:20 GMT)
From Features to Actions: Explainability in Traditional and Agentic AI Systems [8.9] 我々は、帰属に基づく説明とトレースに基づく診断を比較することによって、静的とエージェント的説明のギャップを埋める。
以上の結果から,エージェント設定のためのトレースベースの診断は,常に動作の破壊を局所化することがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:34:29 GMT)
Cochain Perspectives on Temporal-Difference Signals for Learning Beyond Markov Dynamics [8.8] 本稿では,時間差に基づく強化学習の新たな視点について述べる。
状態遷移のトポロジカル空間におけるTD誤差は1-cochainとみなすことができ、マルコフ力学はトポロジカル可積分性と解釈される。
この新しい視点は、Hodge型TD誤差を可積分成分と位相的残差に分解することを可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:35:41 GMT)
NanoFLUX: Distillation-Driven Compression of Large Text-to-Image Generation Models for Mobile Devices [8.7] NanoFLUXは17B FLUX.1-Schnellから抽出されたテキストから画像へのフローマッチングモデルである。
約2.5秒で512 x 512の画像を生成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:05:56 GMT)
Don't Break the Boundary: Continual Unlearning for OOD Detection Based on Free Energy Repulsion [8.7] アウト・オブ・ディストリビューション(OOD)検出は、オープンワールド環境における信頼できるAIにとって不可欠である。
従来のアンラーニング手法は、この微妙な構造を妨害し、異常を識別するモデルの能力が壊滅的に失われた。
我々は,低エネルギーID多様体内の保持クラスをプル機構を介してアンカーし,忘れられたクラスを高エネルギーOOD領域に積極的に排出するTFERを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:55:47 GMT)
SURE: Safe Uncertainty-Aware Robot-Environment Interaction using Trajectory Optimization [8.7] SUREは、接触タイミングの不確実性を明確に説明する堅牢な軌道最適化フレームワークである。
影響時間不明の2つの代表的な課題についてSUREを評価した。
SUREは従来の定式化よりも頑健性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:50:59 GMT)
Revisiting the Shape Convention of Transformer Language Models [8.7] トランスフォーマー言語モデルは1つの一貫したアーキテクチャ形状に大きく依存している。
残差ワイド・ナローワイド近似が優れた機能を与えるという最近の結果に触発されて、Transformerの長年の形状規則を再考する。
従来のFFNをより深い時間ガラス形FFNに置き換えたTransformer変異体を開発した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:55:30 GMT)
Risk-Sensitive Exponential Actor Critic [8.7] リスクに敏感な指数的アクター批判(RSEAC)は,既存のアプローチに比べて数値的に安定な更新をもたらすことを示す。
rsEACは、MuJoCoにおけるリスクに敏感な継続的タスクのバリエーションに挑戦する上で、リスクに敏感なポリシを確実に学習する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:23:43 GMT)
MultiGraspNet: A Multitask 3D Vision Model for Multi-gripper Robotic Grasping [8.6] MultiGraspNetは、並列グリップと真空グリップの同時ポーズを統一フレームワーク内で予測する新しいマルチタスク3Dディープラーニング手法である。
我々は、単一アームのマルチグリッパーロボットで実世界の実験を行い、我々のアプローチが真空ベースラインより優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:56:21 GMT)
BayesFlow 2.0: Multi-Backend Amortized Bayesian Inference in Python [8.5] ABI (Amortized Bayesian Inference) はベイズの計算問題を解くための道を提供する。
ABIはモデルシミュレーションでニューラルネットワークをトレーニングし、モデルが実装された量を素早く推測することでユーザに報酬を与える。
汎用ABIのためのPythonライブラリBayesFlow、Version 2.0を提示する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:06:37 GMT)
TFusionOcc: Student's t-Distribution Based Object-Centric Multi-Sensor Fusion Framework for 3D Occupancy Prediction [8.4] 本稿では,TFusionOccについて紹介する。TFusionOccは3次元セマンティック占有率を予測するためのオブジェクト中心型多センサ融合フレームワークである。
マルチステージマルチセンサ融合,学生のt-分布,T-Mixtureモデル(TMM)を活用することにより,提案手法はnuScenesベンチマークで最先端(SOTA)性能を達成した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:43:42 GMT)
tLoRA: Efficient Multi-LoRA Training with Elastic Shared Super-Models [8.4] tLoRAは、複数のLoRAジョブの効率的なバッチトレーニングを可能にするフレームワークである。
実世界のクラスタトレースを用いた評価では、tLoRAはトレーニングを1.2-1.8x改善し、ジョブトレーニング完了時間を2.3--5.4x改善し、GPU利用率を37%改善している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:26:02 GMT)
From Core to Detail: Unsupervised Disentanglement with Entropy-Ordered Flows [8.4] エントロピー順序付き流れ (EOFlows) は、その説明エントロピーにより遅延次元を順序付けする。
EOFlowsは独立メカニズム分析、主成分フロー、マニフォールドエントロピーメトリックからの洞察に基づいて構築される。
確率ベーストレーニングと局所ジャコビアン正規化と雑音増強を併用して,画像などの高次元データによく対応できる手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:41:03 GMT)
VideoNeuMat: Neural Material Extraction from Generative Video Models [8.3] ビデオ拡散モデルから再利用可能なニューラルネットワーク資産を抽出する2段階パイプラインであるVideoNeuMatを提案する。
まず、制御されたカメラと照明トラジェクトリーの下のサンプルビデオを生成するために、大きなビデオモデルを微調整する。
第2に、より小さなWan 1.3Bビデオバックボーンから微調整された大再構成モデル(LRM)を用いて、これらのビデオからコンパクトなニューラルネットワーク材料を再構成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:49:10 GMT)
TwistNet-2D: Learning Second-Order Channel Interactions via Spiral Twisting for Texture Recognition [8.2] 指向性空間変位下での局所的な対流路積を計算する軽量モジュールTwistNet-2Dを導入する。
中心となるコンポーネントであるSpral-Twisted Channel Interaction (STCI)は、要素ワイドチャネル乗算の前に所定の方向に1つの特徴マップをシフトする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:25:00 GMT)
Evaluating LLM-persona Generated Distributions for Decision-making [8.2] LLMは、人間の評価や嗜好を模倣するシミュレートされたペルソナから、世界知識に基づいた需要予測まで、豊富なデータを生成することができる。
このようなLLM生成ディストリビューションは、下流の意思決定をどの程度サポートしていますか?
そこで本研究では,これらのLCM生成分布の質を評価するための指標について検討した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:39:15 GMT)
Cognitive algorithms and systems of episodic memory, semantic memory and their learnings [8.2] 宣言記憶は、エピソード記憶とセマンティック記憶という2つの分離された部分から構成される。
海馬の病変は、しばしば明示的な記憶の様々な障害を引き起こす。
本章では、明示的な記憶を模倣することを目的とした認知システムについてレビューする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:22:52 GMT)
Optimal Abstractions for Verifying Properties of Kolmogorov-Arnold Networks (KANs) [8.1] コルモゴロフ・アルノルドネットワーク(KAN)の特性検証のための新しい手法を提案する。
我々の重要な貢献は、最適な抽象化を見つけるためにkan構造を利用する体系的なフレームワークである。
このアプローチは、全体的な精度要件を維持しながら、各ユニットの最適近似戦略を決定する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:33:41 GMT)
Clinical-Prior Guided Multi-Modal Learning with Latent Attention Pooling for Gait-Based Scoliosis Screening [8.0] 思春期特発性強皮症(AIS)は,早期発見により進行を緩和できる脊髄変形である。
現在のスクリーニング手法は主観的であり、スケールが難しく、専門的な専門知識に依存している。
ビデオベースの歩行分析は、有望な代替手段を提供するが、現在のデータセットとメソッドは、しばしばデータ漏洩に悩まされる。
ScoliGaitは、トレーニング用の1,572の歩行ビデオクリップと、テスト用の300の完全に独立したクリップからなる、新しいベンチマークデータセットである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:44:22 GMT)
ShallowJail: Steering Jailbreaks against Large Language Models [7.9] LLMの浅いアライメントを利用する新たな攻撃であるShallowJailを紹介する。
ShallowJailは、推論中に初期トークンを操作することで、LSMのレスポンスを誤操作することができる。
広汎な実験により,最先端のLCM応答の安全性を著しく低下させるシャローの有効性を実証した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:35:38 GMT)
NeuroSleep: Neuromorphic Event-Driven Single-Channel EEG Sleep Staging for Edge-Efficient Sensing [7.8] 本稿では,エネルギー効率の高い睡眠ステージ構築のためのイベント駆動型センサと推論システムであるNeuroSleepを提案する。
状態認識モデリングによるニューロモルフィックエンコーディングをブリッジすることで、NeuroSleepはリソース制約のあるウェアラブルシナリオで常時オンの睡眠分析を行うためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:16:28 GMT)
Finding Connections: Membership Inference Attacks for the Multi-Table Synthetic Data Setting [7.8] 合成関係データの経験的ユーザレベルのプライバシを監査するための新しいメンバーシップ推論攻撃(MIA)手法を提案する。
そこで我々は,No-Box 脅威モデルに基づく新たな敵攻撃である Multi-Table Membership Inference Attack (MT-MIA) を提案する。
我々は、MT-MIAを実世界のマルチテーブルデータセットで評価し、この脆弱性が最先端のリレーショナルデータジェネレータに存在することを実証した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:02:00 GMT)
Force Generative Imitation Learning: Bridging Position Trajectory and Force Commands through Control Technique [7.7] 本研究では,所定の位置軌跡から力の指令を推定する力生成モデルを提案する。
目に見えない位置の軌跡を扱う場合、モデルは正確な力の指令を生成するのに苦労する。
このアプローチは、目に見えない位置軌跡であっても、システムがフォースコマンドを効果的に生成することを可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:25:08 GMT)
Learning Nonlinear Systems In-Context: From Synthetic Data to Real-World Motor Control [7.6] LLMは、文脈内学習能力は強いが、信号処理システムにはまだ拡張されていない。
モータフィードフォワード制御に適用可能なトランスモデルを用いたICLを初めて提案する。
我々は、ICLが合成事前学習と実世界の適応性を橋渡しし、物理システムのデータ効率的な制御のための新しい方向を開くことができることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:19:11 GMT)
FlowDA: Accurate, Low-Latency Weather Data Assimilation via Flow Matching [7.3] FlowDAは、フローマッチングに基づく低遅延気象スケール生成DAフレームワークである。
観測速度を3.9%から0.1%に下げた実験は、FlowDAの優れた性能を示している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:53:29 GMT)
Consensus-based optimization (CBO): Towards Global Optimality in Robotics [7.3] 我々はコンセンサスに基づく最適化(CBO)をロボット工学に導入し、軽度な仮定の下でグローバルな最適化に収束することが保証される。
以上の結果から,CBOは既存の3つの課題に対して,より低コストで実現可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:55:10 GMT)
Halt the Hallucination: Decoupling Signal and Semantic OOD Detection Based on Cascaded Early Rejection [7.2] 粗い論理による異常検出のための階層的フィルタリングを実現するカスケード早期退避(CER)フレームワークを提案する。
実験の結果、CERは計算オーバーヘッドを32%削減するだけでなく、CIFAR-100ベンチマークの大幅な性能向上も達成している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:55:35 GMT)
TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement [7.1] テストタイムトレーニングは、テスト質問のみを使用してモデル適応を可能にする。
自己回帰テスト時自己進化学習フレームワークである textbfTTSR を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:55:40 GMT)
Evolving LLM-Derived Control Policies for Residential EV Charging and Vehicle-to-Grid Energy Optimization [7.1] 本研究では,電気自動車(EV)エネルギー管理分野への進化計算の新たな応用を提案する。
強化学習(RL)は、車両間グリッド(V2G)最適化において高いパフォーマンスを達成するが、消費者や規制機関にとって監査が難しい不透明な「ブラックボックス」ニューラルネットワークを生成するのが一般的である。
本稿では,大規模言語モデル(LLM)を反復的即効性修復ループ内の知的突然変異演算子として活用する検索フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:59:33 GMT)
Concept-Aware Privacy Mechanisms for Defending Embedding Inversion Attacks [7.0] 既存の差分プライバシー防衛は、埋め込み次元にわたって均一な感度を仮定し、過度なノイズと劣化した実用性をもたらす。
テキスト埋め込みにおける概念固有のプライバシ保護のための,ユーザ中心のフレームワークであるSPARSEを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:28:55 GMT)
A Case Study of Selected PTQ Baselines for Reasoning LLMs on Ascend NPU [7.0] トレーニング後の量子化(PTQ)は、Ascend NPU上での効率的なモデル展開に不可欠である。
本稿では,DeepSeek-R1-Distill-Qwenシリーズ(1.5B/7B/14B)やQwQ-32Bといった推論指向モデルに適用したPTQベースラインのケーススタディを示す。
AWQ、GPTQ、SmoothQuant、FlatQuantの4つの異なるアルゴリズムを評価し、重量のみの圧縮から高度な回転法までの範囲をカバーする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:22:09 GMT)
Automatic Detection and Analysis of Singing Mistakes for Music Pedagogy [7.0] 本稿では,音楽教育の文脈における歌唱誤りの自動検出のための枠組みを提案する。
データセットは、教師学習者の発声記録を同期させ、学習者が犯したさまざまなタイプの誤りをマークするアノテーションを含む。
このデータセットを用いて、誤り検出のための異なるディープラーニングモデルを開発し、それらをベンチマークする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:15:36 GMT)
Extreme Weather Nowcasting via Local Precipitation Pattern Prediction [7.0] ExPreCastは、詳細なレーダ予測を生成するための効率的な決定論的フレームワークである。
我々の手法は最先端の性能を実現し、通常の降雨体制と極端な降雨体制の両方で正確で信頼性の高い流星を届ける。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:35:15 GMT)
Orientation-Robust Latent Motion Trajectory Learning for Annotation-free Cardiac Phase Detection in Fetal Echocardiography [7.0] ORBIT(Orientation-Robust Beat Inference from Trajectories, Orientation-Robust Beat Inference from Trajectories)は、胎児の心の向きによって手動のアノテーションなしで心臓の位相を識別する自己教師型フレームワークである。
ORBITは正常な胎児心エコービデオのみに訓練され、正常な心疾患と先天性心疾患の両方で一貫したパフォーマンスを達成している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:13:53 GMT)
Semi-Device-Independent Quantum Random Number Generator Resistant to General Attacks [6.9] 量子乱数生成器(QRNG)は、量子理論固有のランダム性に基づいて真の乱数を生成する。
本稿では,有限サイズ効果を考慮した半DIQRNGを提案する。
私たちの研究は、単純な実験的なセットアップで堅牢なセキュリティとハイジェネレーションの両方を達成するための有望なアプローチを提供します。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:47:12 GMT)
Do Prompts Guarantee Safety? Mitigating Toxicity from LLM Generations through Subspace Intervention [6.8] 大きな言語モデル(LLM)は強力なテキストジェネレータである。
LLMは、一見無害なプロンプトが与えられたとしても、有害または有害な内容物を生成することができる。
これは深刻な安全性の課題であり、現実世界に害を与える可能性がある。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:33:17 GMT)
High-fidelity 3D multi-slab diffusion MRI using Slab-shifting for Harmonized 3D Acquisition and Reconstruction with Profile Encoding Networks (SHARPEN) [6.8] 三次元3次元マルチスラブイメージングは高分解能生体内拡散MRI(dMRI)に期待できるアプローチである
しかし、大きな課題は、非理想スラブ選択RF励起から生じるスラブ境界アーチファクトである。
非矩形スラブプロファイルはスラブ境界における信号強度を減少させる一方、隣接するスラブにまたがるプロファイルはスラブ間クロストークを導入する。
プロファイルネットワークを用いた高調波3次元取得と再構成のためのスラブプロファイル符号化とスラブシフト処理を構築した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:03:25 GMT)
LLM-Enhanced Rumor Detection via Virtual Node Induced Edge Prediction [6.7] 各ノードをそのテキスト埋め込みを通してのみ表現することは、噂の伝播経路全体にわたってテキストコヒーレンスを無視する。
本稿では,これらの制約に対処するために,LLM(Large Language Models)を利用した新しいフレームワークを提案する。
提案手法は,LLMを用いて情報サブチェーンを分析し,噂の確率を割り当て,仮想ノードへの接続をインテリジェントに構築することで,微妙な噂信号を捕捉する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:17:43 GMT)
Robust Ultra-High-Dimensional Variable Selection With Correlated Structure Using Group Testing [6.7] 高次元ゲノムデータは、従来の特徴選択法に挑戦する強力なグループ相関構造を示す。
階層的クラスタリングによりデータ駆動変数群を生成する多段階的な手法であるDorfmanスクリーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:19:26 GMT)
Sample Complexity of Causal Identification with Temporal Heterogeneity [6.6] 環境多様性の欠如に対して,時間構造が効果的に置き換えられることを示す。
この研究は、因果構造が特定可能かどうかから、実際に統計的に回復可能かどうかに焦点を移す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:44:00 GMT)
AS-Mamba: Asymmetric Self-Guided Mamba Decoupled Iterative Network for Metal Artifact Reduction [6.3] 金属はCT(Computed Tomography)の画質を著しく劣化させる。
CNNやTransformerといった既存のディープラーニングアプローチは、アーティファクトの方向幾何学的特徴を明示的に捉えていないことが多い。
本研究では,非対称自己ガイド型マンバ (AS-Mamba) を金属加工品の還元に用いることを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:27:28 GMT)
Towards Adaptive Environment Generation for Training Embodied Agents [6.2] 身体的なエージェントは、新しい環境に一般化するのに苦労します。
これらのトレーニング環境を生成するための現在のアプローチは、オープンループのパラダイムに従っている。
エージェントの現在の能力に難易度を適応させるクローズドループ環境生成のための概念実証を行う。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:50:46 GMT)
High-Dimensional Limit of Stochastic Gradient Flow via Dynamical Mean-Field Theory [6.2] 現代の機械学習モデルは、通常、バッチサイズが小さいマルチパス勾配勾配(SGD)によって訓練される。
我々は、Emphstochastic gradient flow (SGF)と呼ばれる微分方程式の高次元力学を解析する。
DMFT方程式は,SGD力学の既存の高次元記述を特殊ケースとして復元することを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:37:10 GMT)
On Randomness in Agentic Evals [6.2] エージェントシステムは、エージェントがタスクを解決するために環境と対話するベンチマークで評価される。
ほとんどの論文では、タスク毎にひとつの実行から計算されたpass@1スコアが報告されている。
単一ランパス@1推定値は、どのランが選択されたかによって2.2から6.0ポイント異なる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:49:13 GMT)
HALO: A Fine-Grained Resource Sharing Quantum Operating System [6.0] HALOは, きめ細かいリソース共有をサポートする最初の量子オペレーティングシステム設計である。
まず、ハードウェア対応の量子ビット共有アルゴリズムで、量子コンピュータの領域に共有ヘルパー量子ビットを配置する。
第2に、各ジョブのサンプリング要求に応じて実行ウィンドウを割り当てるショット適応スケジューラ。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:54:00 GMT)
A Comparative Study of 3D Person Detection: Sensor Modalities and Robustness in Diverse Indoor and Outdoor Environments [5.9] 本研究では,カメラオンリー,LiDARオンリー,カメラ-LiDAR融合を用いた3次元人物検出の系統的評価を行う。
BEVDepth(カメラ)、PointPillars(LiDAR)、DAL(カメラ-LiDAR融合)の3つの代表モデルを比較した。
その結果,核融合によるアプローチは,特に挑戦的なシナリオにおいて,単一モダリティモデルよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:20:25 GMT)
Structural bias in multi-objective optimisation [5.9] 構造バイアス (Structure bias, SB) とは、探索空間の特定の領域に対して最適化アルゴリズムを体系的に選好することを指す。
SBは単目的最適化において広範囲に研究されているが、多目的最適化におけるその役割はほとんど解明されていない。
本稿では、構造バイアスの概念を多目的設定に拡張し、フィットネス駆動誘導から分離して研究する手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:43:28 GMT)
Bridging the Indoor-Outdoor Gap: Vision-Centric Instruction-Guided Embodied Navigation for the Last Meters [5.8] Embodied Navigationは、ラストマイル配信のような現実世界のアプリケーションにとって大きな約束である。
そこで本研究では,事前自由なインストラクション駆動型インボダイドナビゲーションという,新しいタスクを紹介する。
本稿では、画像に基づくプロンプトを利用して意思決定を行う視覚中心の具体化ナビゲーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:52:23 GMT)
Sequential Auditing for f-Differential Privacy [5.8] 出力サンプルに基づくアルゴリズムの差分プライバシー(DP)を評価するための新しい監査者を提案する。
私たちは、非常に表現力豊かなプライバシー概念である$f$-DPに焦点を移します。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:22:24 GMT)
A Unified Formula for Affine Transformations between Calibrated Cameras [5.8] 変換は、相対カメラポーズ、画像座標、局所表面正規化の関数であることを示す。
本稿では、2つのキャリブレーションされたビュー間の局所像パッチをマッピングするアフィン変換のためのクローズドフォーム式を導出する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:54:25 GMT)
Free Energy Mixer [5.8] フリー・エナジー・ミキサー(FEM)はそれを前処理として扱い、複雑さが変化しない値認識後読みを生成する。
FEMは、標準およびリニアアテンション、線形RNNとSSMを備えたプラグアンドプレイである。
NLP、ビジョン、タイムシリーズにおいて、一致したパラメータ予算での強いベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:02:47 GMT)
GhazalBench: Usage-Grounded Evaluation of LLMs on Persian Ghazals [5.7] GhazalBenchは、大規模な言語モデルがペルシャのガザルとどのように相互作用するかを評価するベンチマークである。
我々は一貫した解離を観察する: モデルは一般的に詩的な意味を捉えるが、完結した設定において正確な詩のリコールに苦慮する。
本研究は,文化的に重要なテキストへの意味,形態,キューに依存したアクセスを共同評価する評価フレームワークの必要性を強調した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:37:27 GMT)
Towards Understanding What State Space Models Learn About Code [5.6] State Space Models (SSM) は、トランスフォーマーアーキテクチャの効率的な代替品として登場した。
近年の研究では、SSMは同様の条件下で訓練された場合、コード検索などのコード理解タスクにおいて、Transformerと一致したり、超えたりすることができることが示されている。
本稿では、SSMベースのコードモデルが実際に何を学習しているかを初めて体系的に分析し、SSMとTransformerベースのコードモデルの比較分析を行う。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:29:46 GMT)
Missing At Random as Covariate Shift: Correcting Bias in Iterative Imputation [5.5] リスク最小化問題として、欠落データ計算を定式化する。
誘導分布バイアスを補正する重要な重みを理論的に有効に導出する。
本稿では,重み付けと計算量モデルの両方を共同で推定する新しい計算アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:02:12 GMT)
Achieving Better Local Regret Bound for Online Non-Convex Bilevel Optimization [5.4] オンライン二段階最適化(OBO)は多くの機械学習問題の強力なフレームワークとして登場した。
両水準の局所的後悔と窓面平均的局所的後悔の双方に対して最適な後悔境界を定めている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:40:02 GMT)
GaussianPOP: Principled Simplification Framework for Compact 3D Gaussian Splatting via Error Quantification [5.4] GaussianPOPは、解析的ガウス誤差定量化に基づく、原則化された単純化フレームワークである。
高効率なアルゴリズムを導入することにより、本フレームワークは1つのフォワードパスで実用的なエラー計算を可能にする。
提案手法は,既存の最先端プルーニング手法を両アプリケーションシナリオで一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:17:41 GMT)
Beyond Static Alignment: Hierarchical Policy Control for LLM Safety via Risk-Aware Chain-of-Thought [5.3] 大きな言語モデル(LLM)は、静的で一大の安全ポリシーのため、基本的な安全性のトレードオフに直面します。
我々は、明示的でリスクを意識した推論による動的安全制御のためのフレームワーク、textbfPACT(Prompt-Thought Action via Chain-of-Thought)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:20:01 GMT)
Trust Regions Sell, But Who's Buying? Overlap Geometry as an Alternative Trust Region for Policy Optimization [5.2] トラストリージョンメソッドは、Kullback-Leibler (KL) の分岐を介してポリシー更新を制約する。
Bhattacharyya係数による分布重なりを制約した代替信頼領域として重なり幾何を提案する。
我々は、Bhattacharyya-TRPO(BTRPO)とBhattacharyya-PPO(BPPO)を誘導する。
実証的に、オーバーラップベースの更新は、RLiableが測定したロバストネスとアグリゲーションパフォーマンスを改善している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:38:07 GMT)
Do LLMs Track Public Opinion? A Multi-Model Study of Favorability Predictions in the 2024 U.S. Presidential Election [5.1] 本稿では,2024年アメリカ合衆国大統領選挙における出口調査の結果から,Large Language Models (LLMs) が世論を追跡できるかどうかを検討する。
我々は,Reuters,CNN,Gallup,Quinnipiac,ABCを含む主要5団体の質の高い調査結果に対して,9つのLCM構成から予測した。
我々は,既成のLCMが直接的に質問された時の世論調査を確実に追跡していないことを結論し,選挙予測の意義について論じる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:52:13 GMT)
Learning Deep Hybrid Models with Sharpness-Aware Minimization [4.9] 本稿では,ハイブリッドモデル学習における損失最小化の平坦性に着目し,モデルを可能な限りシンプルにすることを目的とする。
我々は、シャープネスを意識した最小化の概念を採用し、それをハイブリッド・モデリング・セッティングに適用する。
数値実験により、SAM法はモデルとデータセットの異なる選択に対してうまく機能することが示された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:27:19 GMT)
The Median is Easier than it Looks: Approximation with a Constant-Depth, Linear-Width ReLU Network [4.9] 本稿では、ReLUニューラルネットワークを用いて、中央値の$d$入力の近似について検討する。
単位ハイパーキューブ上の均一分布に対して指数関数的に小さな近似誤差を実現する定数深さ線形幅構成を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:00:31 GMT)
Temperature Scaling Attack Disrupting Model Confidence in Federated Learning [4.9] 精度を保ちながらキャリブレーションを低下させる訓練時間攻撃である温度スケーリング攻撃(TSA)を提案する。
その結果, 校正整合性は, 連合学習における重要な攻撃面として確立された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:01:54 GMT)
Taipan: A Query-free Transfer-based Multiple Sensitive Attribute Inference Attack Solely from Publicly Released Graphs [4.8] textbfTaipanは、グラフに対する複数の機密属性推論攻撃のための、クエリフリー転送ベースの最初のアタックフレームワークである。
さまざまな実世界のグラフデータセットの実験により、Taipanは、同じ分散設定で強力なアタックパフォーマンスを一貫して達成している。
我々の研究結果は、より堅牢な多属性プライバシー保護グラフパブリッシング手法とデータ共有プラクティスの必要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:37:24 GMT)
Exploring Polarimetric Properties Preservation during Reconstruction of PolSAR images using Complex-valued Convolutional Neural Networks [4.8] 複素数値ニューラルネットワークは,完全偏光SARデータを効果的に圧縮・再構成できることを示す。
これらの知見は、SARデータ処理のためのロバストで物理インフォームドな複雑な数値生成モデルを開発するための道を開いた。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:36:21 GMT)
SuReNav: Superpixel Graph-based Constraint Relaxation for Navigation in Over-constrained Environments [4.8] 本稿では,超画素グラフに基づく制約緩和とナビゲーション手法SuReNavを提案する。
提案手法はOpenStreetMapの2次元意味マップと3次元マップに基づく最先端のベースラインに対して評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:55:38 GMT)
Progress Constraints for Reinforcement Learning in Behavior Trees [4.5] 強化学習(Reinforcement Learning, RL)は、ほぼ最適のコントローラを学ぶことができるが、時として、疎い報酬、安全な探索、長期のクレジット割り当てに苦労することがある。
提案手法は,理論BT収束結果に基づく許容動作の制約を行う機構である進行制約を提案する。
2次元概念実証と高忠実度倉庫環境の実証評価により, 性能, 試料効率, 制約満足度が改善された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:26:44 GMT)
AsynDBT: Asynchronous Distributed Bilevel Tuning for efficient In-Context Learning with Large Language Models [4.5] In-context Learning (ICL) は、LLMが入力内で提供される例を使って新しいタスクに適応できる有望なパラダイムとして登場した。
ICLを組み込んだ以前のFLアプローチは、重度のストラグラー問題と、異種非同一データに関連する課題に悩まされてきた。
本稿では,LLMからのフィードバックに基づいて,文脈内学習サンプルの最適化とフラグメントのプロンプトを行う非同期分散バイレベルチューニング(AsynDBT)アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:07:49 GMT)
Seeing Beyond Redundancy: Task Complexity's Role in Vision Token Specialization in VLLMs [4.5] 視覚大言語モデル(VLLM)の視覚能力は、その言語能力に常に遅れを取っている。
本研究では,様々な視覚情報がモデルによってどのように処理され,どのような視覚情報が破棄されるかを検討する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:13:01 GMT)
Perturbing the Phase: Analyzing Adversarial Robustness of Complex-Valued Neural Networks [4.4] 複雑評価ニューラルネットワーク(CVNN)は、あらゆる種類のアプリケーションで人気が高まっている。
CVNNを安全に使用するためには、外れ値に対するロバスト性を分析することが重要である。
我々は、複雑な値入力の位相情報に特化した攻撃の一種であるフェーズアタックを設計する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:18:59 GMT)
Exploring Sparsity and Smoothness of Arbitrary $\ell_p$ Norms in Adversarial Attacks [4.4] $ell_p$ norms with $pin [1.3, 1.5]$がスパースとスムーズなアタックの最良のトレードオフをもたらすことを示す。
これらの知見は、敵攻撃を設計・評価する際の規範選択の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:19:14 GMT)
Reinforcement Learning-Based Dynamic Management of Structured Parallel Farm Skeletons on Serverless Platforms [4.4] 本稿では,サーバレスプラットフォーム上での並列処理構造を動的に管理するためのフレームワークを提案する。
私たちの目標は、スケルトンによるプログラム可能性のメリットを維持しながら、HPCのようなパフォーマンスとレジリエンスをサーバレスおよび継続環境に持ち込むことです。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:57:30 GMT)
Statistical-Based Metric Threshold Setting Method for Software Fault Prediction in Firmware Projects: An Industrial Experience [4.3] マシンラーニングベースのフォールト予測モデルは高い精度を示しているが、解釈可能性の欠如により、産業環境での採用が制限されている。
本稿では,産業環境における故障検出への統合に適したコンテキスト固有のソフトウェアメトリックしきい値を定義するための構造化プロセスを提案する。
提案手法は,一組のプロジェクトからしきい値を取得し,個別に開発したファームウェアに適用することにより,プロジェクト間の障害予測を支援する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:19:36 GMT)
The Law of Task-Achieving Body Motion: Axiomatizing Success of Robot Manipulation Actions [4.3] タスク達成身体運動法則は、身体運動に対する公理的正当性仕様である。
本稿では,世界国家を表わす「セマンティック・デジタル・ツインズ」を対象とするタスク環境・環境教育の授業について紹介する。
キッチン環境におけるコンテナ操作のためのインスタンス化により,本法の適用性を実証する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:12:56 GMT)
Revisiting the Sliced Wasserstein Kernel for persistence diagrams: a Figalli-Gigli approach [4.2] Sliced Wasserstein Kernel (SWK) は (Carrire et al.) で導入され、パーシステンスダイアグラムを合理的な歪みを持つヒルベルト空間に暗黙的に埋め込む。
本研究では、ワッサーシュタインではなくフィガルリ-ジグリ距離をカーネルのビルディングブロックとして用いることで、このアイデアを再考する。
理論面では、我々のスライスしたFigalli-Gigliカーネル(SFGK)はキャリヤ等のSWKの重要な特性の大部分を共有しており、インダストされた埋め込みと計算の容易さに関する歪みの結果を含んでいる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:43:35 GMT)
Target noise: A pre-training based neural network initialization for efficient high resolution learning [4.2] 本稿では、ランダムノイズをターゲットとした自己教師型事前学習に基づく、シンプルで効果的なニューラルネットワーク事前学習戦略を提案する。
このノイズ駆動事前学習は、追加のデータやネットワークアーキテクチャの変更を必要とせずに、その後のタスクの収束速度を大幅に改善することを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:26:12 GMT)
Extended to Reality: Prompt Injection in 3D Environments [4.2] MLLM(Multimodal large language model)は、3D環境における視覚的入力を解釈し、処理する能力の進歩である。
攻撃者はMLLMの意図したタスクをオーバーライドするために、テキストを含む物理的オブジェクトを環境に配置することができる。
本稿では,3次元環境におけるMLLMに対する即時注入攻撃であるPI3Dを紹介する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:19:04 GMT)
Toward Self-Driving Universities: Can Universities Drive Themselves with Agentic AI? [4.1] エージェントAIと大規模言語モデル(LLM)の急速な進化は、高等教育機関に変革の機会をもたらす。
この章では、AIを活用したシステムが、管理、学術、品質保証プロセスを段階的に自動化するビジョンである、自動運転大学の概念を紹介します。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:39:52 GMT)
Optimal Turkish Subword Strategies at Scale: Systematic Evaluation of Data, Vocabulary, Morphology Interplay [4.1] トークン化は、形態学的にリッチな言語におけるニューラル言語モデリングのための重要な設計選択である。
トルコ語サブワードのトークン化に関する、最初の包括的で原則化された研究を提示する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:41:14 GMT)
HyPER: Bridging Exploration and Exploitation for Scalable LLM Reasoning with Hypothesis Path Expansion and Reduction [4.0] マルチパスチェーンによるテスト時間計算のスケーリングは推論精度を向上する。
既存のアプローチは、このトレードオフを厳格な方法で解決している。
動的拡張還元制御問題としてテスト時間スケーリングを再構成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:27:54 GMT)
Multi-Agentic AI for Fairness-Aware and Accelerated Multi-modal Large Model Inference in Real-world Mobile Edge Networks [4.0] モバイルエッジネットワークにおける遅延と公平性を考慮したマルチモーダルLM推論のためのマルチエージェントAIフレームワークを提案する。
我々のソリューションには、長期計画エージェント、短期プロンプトスケジューリングエージェント、複数ノードLMデプロイメントエージェントが含まれる。
実験により、我々のソリューションは平均遅延を80%以上削減し、他のベースラインと比較して公正性(ノーマル化ジャイナ指数)を0.90に改善することを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:52:49 GMT)
Architectural Anti-Patterns in Student-Developed Microservice Architectures: An Exploratory Study [4.0] 本研究は、学生によるアンチパターン分類を分析し、実践可能な指導勧告で学んだ教訓を導出する。
現実的でコンテナ化されたMSAを設計・展開した216人のマスターズ学生(67チーム)を対象に,縦方向のプロジェクトベースコースを実施した。
この論文は、業界対応のマイクロサービスアーキテクチャを教えるための、現実的でフルスケールの教育経験とレプリカモデルの貢献である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:44:22 GMT)
AFD-INSTRUCTION: A Comprehensive Antibody Instruction Dataset with Functional Annotations for LLM-Based Understanding and Design [4.0] AFD-Instructionは、抗体に合わせた機能アノテーションを備えた最初の大規模命令データセットである。
このデータセットは2つの重要な構成要素を含んでいる: 抗体理解は、配列から直接機能的特性を推測するものであり、また、機能的制約の下でデノボ配列を生成することができる抗体設計である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:52:04 GMT)
PurSAMERE: Reliable Adversarial Purification via Sharpness-Aware Minimization of Expected Reconstruction Error [3.9] 本稿では, 対向ロバスト性を改善するための新しい決定論的浄化法を提案する。
提案手法は, 提案する再設計誤差を最小限に抑えるために, 周辺地域を探索する。
我々は, 強い決定論的ホワイトボックス攻撃下での最先端手法に対して, 対角的堅牢性が顕著に向上したことを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:06:30 GMT)
Hybrid Coupling Topology with Dynamic ZZ Suppression for Optimizing Circuit Depth during Runtime in Superconducting Quantum Processor [3.9] 1つのカプラを用いて4つの固定周波数トランスモン量子ビットを接続する。
設計はIBMのヘビー・ヘキサゴナルレイアウトに比べて回路深さが20%近く減少する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:59:08 GMT)
RAPID: Reconfigurable, Adaptive Platform for Iterative Design [3.8] RAPIDは、ハンドヘルドデータ収集とロボットのデプロイメントを統合する、ツールフリーでモジュラーなハードウェアアーキテクチャである。
物理マスクは、明示的な実行時信号としてモダリティの存在を露呈する。
システム中心の実験により、RAPIDはマルチモーダル構成のセットアップ時間を2桁に短縮することを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:28:46 GMT)
Quenching Speculation in Quantum Markets via Entangled Neural Traders [3.8] 提案する量子株式市場は, トレーダーのバリュエーション間の絡み合いを緩和し, 投機的バストの脱算特性を緩和する。
一つの商品を取引する強化学習エージェントを用いて、古典的バリュエーションを量子関連量子ビット符号化のバリュエーションに置き換えることが価格を安定させることを示す。
この振る舞いを説明するために、投機力学の標準モデルである$p$-guessing Gameの量子化バージョンを定式化し、解析する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:51:40 GMT)
Testing Storage-System Correctness: Challenges, Fuzzing Limitations, and AI-Augmented Opportunities [3.7] システムテストに関する何十年もの研究にもかかわらず、多くのストレージシステム障害は、体系的に公開することが難しいままである。
このサーベイでは、システムテストのストレージ中心のビューを採用し、対象とする実行特性と障害メカニズムに応じて既存のテクニックを整理する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:42:03 GMT)
Exploring Teachers' Perspectives on Using Conversational AI Agents for Group Collaboration [3.6] 本稿では33K12教師による探索的質的研究から得られた知見について述べる。
本研究では,教師がエージェントの行動,グループダイナミクスへの影響,および教室の可能性について検討した。
多くの者はフェニックスのエンゲージメントを刺激する能力を認めていたが、彼らは自律性、信頼、人格化、教育的アライメントに関する懸念も表明した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:29:13 GMT)
Featured Reproducing Kernel Banach Spaces for Learning and Neural Networks [3.5] 再現されたカーネルヒルベルト空間は、カーネルベースの学習の基盤となるフレームワークを提供する。
固定構造ニューラルネットワークを含む現代の多くの学習モデルは、非4次ノルムを持つが、自然に非ヒルベルト幾何学を生んでいる。
そこで我々は,カーネルバナッハ空間の概念に基づいて,バナッハ空間における関数解析フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:29:08 GMT)
SpecAttn: Co-Designing Sparse Attention with Self-Speculative Decoding [3.5] SpecAttnは、検証誘導スパースアテンションを持つ自己投機的復号法である。
バニラ自動回帰復号法よりも2.81$times$高いスループットと、最先端のパリティベースの復号法よりも1.29$times$高いスループットを実現している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:12:52 GMT)
ProtoQuant: Quantization of Prototypical Parts For General and Fine-Grained Image Classification [3.4] ProtoQuantは、プロトタイプの安定性と基盤となる解釈可能性を実現する新しいアーキテクチャである。
潜伏した空間内で、プロトタイプを個別に学習したコードブックに制限することにより、バックボーンを更新することなく、トレーニングデータの忠実な表現を確実に維持できます。
この設計により、ProtoQuantは大規模データセットにスケールする効率的で解釈可能なヘッドとして機能する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:41:31 GMT)
Coherent Spin-Photon Interface of single PL6 Color Centers in Silicon Carbide [3.4] 本稿では,1つのPL6中心の総合的な研究を行い,分光法と理論解析を組み合わせた。
励起状態の微細構造は、群理論モデリングとひずみ依存測定を用いて完全に解決される。
本研究はPL6を,市販半導体プラットフォームにホストされた固体スピン光子インターフェースとして確立した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:34:03 GMT)
Robust Federated Learning via Byzantine Filtering over Encrypted Updates [3.3] Federated Learningは、データのプライバシを維持しながらコラボレーションモデルをトレーニングすることを目的としている。
このアプローチの分散した性質は、依然としてプライバシとセキュリティの問題を提起している。
本稿では,プライバシー保護アグリゲーションのための同型暗号化と,ビザンチンフィルタのためのプロパティ推論に着想を得たメタ分類器を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:02:20 GMT)
Constraint Manifold Exploration for Efficient Continuous Coverage Estimation [3.2] 多くの自動化された製造プロセスは、表面に沿ってプロセス固有のツールを動かすために産業用ロボットアームに依存している。
研削、サンディング、スプレー塗装といった用途では、工具を表面検査に垂直に保ちながら完全に覆う必要がある。
本研究では、構成空間内の到達可能な表面領域を探索する拡張環境構成空間を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:47:28 GMT)
Jamming Attacks on the Random Access Channel in 5G and B5G Networks [3.2] ランダムアクセスチャンネル(RACH)の妨害は、5Gおよび(B5G)ネットワークに重大なセキュリティ上の脅威をもたらす。
本稿では,RACH性能に対する1つの妨害攻撃の影響を予測するための解析モデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:49:34 GMT)
Wonderboom -- Efficient, and Censorship-Resilient Signature Aggregation for Million Scale Consensus [3.2] 我々はWonderboomを紹介した。Wonderboomは、1つのスロットで数百万のバリデータ(x32より高速)の署名を効率的に集約できる最初の100万のスケールプロトコルである。
また、このようなプロトコルを100万スケールでシミュレートできる最初のシミュレーションツールを実装し、最悪の場合でもワンダーブームは1つのスロット内で200万以上の署名を集約して検証できることを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:29:24 GMT)
ACAR: Adaptive Complexity Routing for Multi-Model Ensembles with Auditable Decision Traces [3.2] 本稿では,聴覚条件下でのマルチモデルオーケストレーションのための測定フレームワークACARを提案する。
ACARは、N=3プローブサンプルから計算した自己整合分散(sigma)を使用して、単一モデル、2モデル、3モデル実行モードでタスクをルーティングする。
我々は4つのベンチマークにまたがる1,510のタスクに対してACARを評価し、7,550以上の監査可能な実行を生成した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:27:17 GMT)
A first realization of reinforcement learning-based closed-loop EEG-TMS [3.1] 本稿では,機械学習に基づくクローズドループリアルタイムEEG-TMSセットアップの実現について紹介する。
我々は,高位と低位皮質脊髄興奮状態に関連付けられた個々のムラリズムの位相を,ユーザ非依存性に同定した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:58:26 GMT)
HYDRA: Unearthing "Black Swan" Vulnerabilities in LEO Satellite Networks [3.1] 従来のトポロジ中心の手法では、動的負荷の不均衡と高次の依存関係から生じるシステム的リスクを捕捉できない。
ハイパーグラフに基づく動的リスク分析フレームワークHYDRAを提案する。
その中核は、依存構造内の負荷/冗長比を通じてノード臨界度を定量化する新しい計量であるHyper-Bridge Centrality (HBC)である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:14:53 GMT)
Bridging 6G IoT and AI: LLM-Based Efficient Approach for Physical Layer's Optimization Tasks [3.1] 本稿では,物理層最適化タスクを反復的に行う,プロンプトエンジニアリングに基づくリアルタイムフィードバック・検証(PE-RTFV)フレームワークを提案する。
無線通信システムに固有の自然に利用できるクローズドループフィードバックを利用することで、PE-RTFVはリアルタイム物理層最適化を実現する。
PE-RTFVは, 資源制約型IoTネットワークにおいて, 複雑な物理層最適化タスクの有効性を検証し, 数回の反復でほぼ遺伝的アルゴリズム性能を達成可能であることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:05:47 GMT)
AlertBERT: A noise-robust alert grouping framework for simultaneous cyber attacks [3.1] 侵入検知システムによって発行される多数のセキュリティアラートは、アナリストの間で警告疲労を引き起こす。
時間ベースのアラートグループ化ソリューションは、高いレベルの偽陽性警告と同時に発生する攻撃によって特徴づけられる大規模コンピュータネットワークには適さない。
ノイズの多い環境で、孤立攻撃や同時攻撃からアラートをグループ化するセルフ言語フレームワークAlertBERTを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:39:47 GMT)
Sparse Spike Encoding of Channel Responses for Energy Efficient Human Activity Recognition [3.0] スパイキングニューラルネットワーク(SNN)は、スパースバイナリスパイク列車として情報を処理し、桁違いのエネルギー消費を減少させる、有望な代替手段である。
本研究では,人間の活動認識のためのSNNと共同で訓練されたチャネルインパルス応答(CIR)のスパイク符号化表現を学習するスパイキング畳み込みオートエンコーダ(SCAE)を提案する。
その結果,SCAE-SNNのF1スコアはハイブリッド手法(ほぼ96%)に匹敵するが,スペーサースパイク符号化は81.1%であった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:20:21 GMT)
Simulated Adoption: Decoupling Magnitude and Direction in LLM In-Context Conflict Resolution [3.0] 大規模言語モデル(LLM)は、既存のパラメトリックメモリよりもコンテクスト内での競合情報を優先することが多い。
モデルが「未学習」や内部の真理の大きさを抑えるのではなく、幾何変位のメカニズムを用いていることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:23:55 GMT)
Automated Modernization of Machine Learning Engineering Notebooks for Reproducibility [2.9] 環境侵食は、現代の環境では再現不可能な多くのMLEノートを公表した。
MLEModernizerは、現代環境を固定制約として扱い、ノートコードを近代化して復元するエージェントフレームワークである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:03:36 GMT)
RuleFlow : Generating Reusable Program Optimizations with LLMs [2.9] デプロイからディスカバリを分離する,3段階的なハイブリッドアプローチを導入しています。
RuleFlowがPandasBench上の新しい最先端(SOTA)Pandas最適化フレームワークであることを実証する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:08:33 GMT)
Realistic Synthetic Household Data Generation at Scale [2.8] Embodied AIは、環境推論と相互作用が可能な対話型エージェントの開発に使用できる。
提案する生成フレームワークは,長期の人間とロボットの相互作用を疎結合に生成することで,家庭のデータセットを大規模に生成する。
これらの貢献により、大規模な家庭用スマートデバイスの開発とテストが可能になる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:49:37 GMT)
Pro-ZD: A Transferable Graph Neural Network Approach for Proactive Zero-Day Threats Mitigation [2.6] 本稿では,重み付き最短経路を同定するための新しいグラフニューラルネットワークモデルを提案する。
このモデルは、ネットワークのミスコンフィグレーションや、重要な資産を脅かす高リスク接続経路を検出するのに役立つ。
提案するPro-ZDフレームワークは,ファイアウォールルールを自動的に微調整し,高リスク接続に対処し,不正アクセスを防止するためのアクセスポリシーを積極的に採用する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:29:08 GMT)
Accelerating Vision Transformers on Brain Processing Unit [2.5] ビジョントランスフォーマー(ViT)モデルは優れた性能を示し、コンピュータビジョンタスクにおいてますます重要な役割を担っている。
本稿では、線形層と層正規化演算を慎重に設計した畳み込み演算子に置き換えることで、ビジョン変換器を再構成する新しい手法を提案する。
これは、BPU分類データセットを完全に活用したビジョントランスフォーマーの最初の成功例であり、私たちのアプローチの有効性を示しています。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:48:54 GMT)
Halluverse-M^3: A multitask multilingual benchmark for hallucination in LLMs [2.5] Halluverse-M3は、複数の言語にまたがる幻覚の体系的な分析を可能にするデータセットである。
データセットは、エンティティレベル、関係レベル、および文レベルの幻覚を明確に区別する。
Halluverse-M3は、多言語、マルチタスク設定で幻覚を研究するための現実的で挑戦的なベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:16:09 GMT)
Degradation of Feature Space in Continual Learning [2.3] 本研究では,特徴空間の等方性向上が連続学習における表現品質の向上に寄与するかどうかを考察する。
等方正則化は改善せず、実際には劣化し、連続的な設定で精度をモデル化できる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:26:34 GMT)
Autoregressive Models for Knowledge Graph Generation [2.3] 知識グラフ(KG)生成には、トリプル間の複雑なセマンティック依存関係を学習するモデルが必要である。
グラフを(頭、関係、尾)三重の列として扱うことでKGを生成する自己回帰モデルの一群であるARKを提案する。
ARKは、明示的なルール監督なしで、型一貫性、時間的妥当性、リレーショナルパターンを含むデータから直接暗黙的なセマンティック制約を学習する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:50:22 GMT)
Improved Upper Bounds for Slicing the Hypercube [2.3] 我々は、$S(n) leq lceil frac4n5 rceil$を証明しているが、$n$が5ドルという奇数の倍である場合を除いて、$S(n) leq frac4n5 +1$である。
また、$kn$超平面でスライスできる$Q_n$のエッジの最大数に関する新しい下界も得られる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:52:13 GMT)
Forest canopy height estimation from satellite RGB imagery using large-scale airborne LiDAR-derived training data and monocular depth estimation [2.2] 大規模で高解像度の森林天蓋高マッピングは、地域的およびグローバルな炭素・水循環を理解する上で重要な役割を担っている。
地表近傍のLiDARプラットフォームは、森林の天蓋構造のより微細な測定を提供する。
最先端の単眼深度推定モデルであるDepth Anything V2は16,000km2の天蓋高さモデルを用いて訓練された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:53:32 GMT)
POPL-KF: A Pose-Only Geometric Representation-Based Kalman Filter for Point-Line-Based Visual-Inertial Odometry [2.2] 我々は,PPL-KF を開発した。Kalman フィルタを用いた VIO システムで,点特徴と線特徴の両方に対してポーズのみの幾何学的表現を用いる。
POPL-KFは、測定方程式から点特徴座標と線特徴座標を明示的に除去することで線形化誤差を緩和する。
ライン特徴量を改善するために,画像グリッドのセグメンテーションと双方向光フローの整合性に基づくライン特徴フィルタを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:45:39 GMT)
MPIB: A Benchmark for Medical Prompt Injection Attacks and Clinical Safety in LLMs [2.2] メディカル・プロンプト・インジェクション・ベンチマーク(MPIB)は、直接的インジェクションと間接的RAGを介するインジェクションの両方で臨床安全性を評価するためのデータセット・アンド・ベンチマーク・スイートである。
MPIBは、重症度の高い臨床的有害事象を測定する臨床ハームイベントレート(CHER)を通じて、結果レベルのリスクを強調している。
臨床用プロンプトインジェクションの再現性および体系的研究を支援するため,MPIBを評価コード,対向ベースライン,包括的ドキュメンテーションとともにリリースする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:03:09 GMT)
Transformer-based Parameter Fitting of Models derived from Bloch-McConnell Equations for CEST MRI Analysis [2.2] CEST(Chemical Exchange saturation Transfer) MRIは代謝物を検出するための非侵襲的な画像モダリティである。
本稿では, メタボライト濃度, 交換速度, 緩和速度などのパラメータに適合するトランスフォーマー型ニューラルネットワークを提案する。
我々の自己教師型ニューラルネットワークは、古典的勾配に基づく解法よりも明らかに優れていることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:15:39 GMT)
T-STAR: A Context-Aware Transformer Framework for Short-Term Probabilistic Demand Forecasting in Dock-Based Shared Micro-Mobility [2.2] 本研究では,変圧器をベースとした新しい確率的フレームワークであるT-STARを導入する。
ワシントンD.C.のCapital Bikeshareデータを用いた大規模な実験は、T-STARが決定論的および確率的精度の両方で既存の手法より優れていることを示した。
これらの結果は、詳細な、信頼性があり、不確実性に留意された短期的な需要予測を提供するフレームワークの可能性を強調している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:53:02 GMT)
Which Graph Shift Operator? A Spectral Answer to an Empirical Question [2.1] 入力信号とラベル部分空間の間の幾何学的歪みを定量化する新しいアライメントゲイン計量を導入する。
我々の理論的解析は、このアライメントをリプシッツ定数のスペクトルプロキシを介して一般化境界に直結させる。
これにより、計算をランク付けし、トレーニング前の任意の予測タスクに対して最適なGSOを選択するという、原則的かつ効率的な基準が得られる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:59:54 GMT)
Probing Neural TSP Representations for Prescriptive Decision Support [2.1] 我々は、旅行セールスパーソン問題(T)のようなNPhard問題を解決するために神経政策を訓練する。
我々は、優れたツアーを制作する以外に、訓練されたTSPソルバが、他の最適化関連目的へ移行する内部表現を学習するかどうかを問う。
また,NCOソルバをトレーニングすることで,より強力なNCOソルバをトレーニングすることで,より有用なエンコーダが得られることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:53:03 GMT)
Cerebellar-Inspired Residual Control for Fault Recovery: From Inference-Time Adaptation to Structural Consolidation [2.0] 我々は、オンラインの修正行動によって凍結強化学習ポリシーを強化する、推論時、小脳にインスパイアされた残留制御フレームワークを導入する。
このフレームワークは、固定された特徴拡張による高次元パターン分離を含む中核小脳の原理をインスタンス化する。
MuJoCoベンチマークの実験では、TextttHalfCheetah-v5で最大$+66%、適度な欠陥下でのtextttHumanoid-v5で$+53%の改善が示されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:16:00 GMT)
Language Model Goal Selection Differs from Humans' in an Open-Ended Task [2.0] 大規模言語モデル(LLM)は、ますます人間の意思決定に統合されている。
認知科学から借用した制御されたオープンエンド学習課題において, LLMsを人間の目標選択のプロキシとして評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:39:54 GMT)
An Interpretable Vision Transformer as a Fingerprint-Based Diagnostic Aid for Kabuki and Wiedemann-Steiner Syndromes [2.0] 歌舞伎症候群(KS)とヴィーデマン・ステナー症候群(WSS)は稀だが発達障害である。
KSまたはWSSを持つ多くの人は、遺伝子検査と専門知識の両方にアクセスできないため、未診断のままである。
造血器系異常は、いくつかの遺伝症候群の徴候が確立されているにもかかわらず、未使用の診断信号として残されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:41:15 GMT)
AdFL: In-Browser Federated Learning for Online Advertisement [1.9] Federated Learning (FL)は、出版エコシステム内の他の利害関係者とユーザ生データを共有せずに、ユーザ間で分散学習を行う。
本稿では,ユーザの広告嗜好を学習するためにブラウザで動作するFLフレームワークであるAdFLについて述べる。
これらの嗜好はグローバルなFLモデルに集約され、ブラウザでより関連性の高い広告を表示するために使用される。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:02:02 GMT)
Interpreting Manifolds and Graph Neural Embeddings from Internet of Things Traffic Flows [1.9] この研究は、高次元埋め込みを潜在多様体にマッピングすることで、直接視覚化可能な低次元表現を生成する解釈可能なパイプラインを導入する。
このフレームワークは、侵入検知のための0.830の分類F1スコアを達成し、概念ドリフトのような現象も強調する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:53:41 GMT)
A High-Fidelity Robotic Manipulator Teleoperation Framework for Human-Centered Augmented Reality Evaluation [1.8] ARBotはリアルタイムの遠隔操作プラットフォームで、人間の自然な動きを効果的に捉え、ロボットマニピュレータを使って動きを正確に再現することができる。
制御可能でスケーラブルなAR評価をサポートするために,ARBotを用いてキャプチャした132の人・合成軌道のベンチマークデータセットをリリースする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:21:06 GMT)
Extracting Root-Causal Brain Activity Driving Psychopathology from Resting State fMRI [1.8] 我々は,病的カスケードを起因とするルート因果地図-局所的なBOLD障害の同定を目指す。
本稿では,2段階構造因果モデルを提案する。
我々は,解釈可能な症状軸を局所化ドライバの擬似集合にリンクする手順であるSOURCEを開発する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:24:24 GMT)
Implementing Grassroots Logic Programs with Multiagent Transition Systems and AI [1.8] Grassroots Logic Programs (GLP) は、並列論理型プログラミング言語で、変数をペアのエンフリーダーとエンフライターに分割する。
GLPは草の根プラットフォームのための言語として設計され、そのターゲットアーキテクチャはスマートフォンがピアツーピアで通信することである。
本稿では,DartにおけるAIによるGLPのワークステーションとスマートフォンによる実装を容易にするために開発された数学について述べる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:30:11 GMT)
A Multiplicative Neural Network Architecture: Locality and Regularity of Appriximation [1.7] 本稿では,乗法的相互作用が基本表現を構成する乗法的ニューラルネットワークアーキテクチャを提案する。
ベッセルポテンシャル空間の局所性と正則性の観点から近似特性を解析する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:07:50 GMT)
The Avatar Cache: Enabling On-Demand Security with Morphable Cache Architecture [1.7] 非セキュア(Avatar-N)、ランダム化されたセキュア(Avatar-R)、パーティショニングされたセキュア(Avatar-P)の3つのモードをサポートするセキュアで変形可能なLLCであるAvatarを提案する。
アバターは従来のセットアソシエイトLLCによく似ており、産業採用を促進する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:03:34 GMT)
Is there "Secret Sauce'' in Large Language Model Development? [1.7] 2022年から2025年の間にリリースされた809モデルのトレーニングとベンチマークデータを用いて、リリース日と開発者の固定効果によるスケーリング法則の回帰を推定する。
開発者固有の効率上の利点の明確な証拠は見出されていますが、その重要性は、モデルがパフォーマンス分布のどこにあるかによって異なります。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:32:31 GMT)
DiGAN: Diffusion-Guided Attention Network for Early Alzheimer's Disease Detection [1.6] アルツハイマー病(AD)の早期診断は、構造的脳変化の微妙で時間的に不規則な進行のため、依然として大きな課題である。
既存のディープラーニングアプローチでは、大規模な時系列データセットが必要であり、実世界の臨床データに固有の時間的連続性とモダリティの不規則性をモデル化できないことが多い。
本稿では,遅延拡散モデルと注意誘導畳み込みネットワークを統合した拡散誘導注意ネットワーク(DiGAN)を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:33:53 GMT)
The Representational Geometry of Number [1.6] 数値表現はタスク間の安定な関係構造を保っていることを示す。
タスク固有の表現は、分離可能な線形方向に沿ってエンコードされた等級のような低レベルな特徴を持つ、異なる部分空間に埋め込まれている。
このことは、タスク固有の変換が概念表現の共通基盤関係構造に適用されたときに、理解が生じることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:35:22 GMT)
Visual Word Sense Disambiguation with CLIP through Dual-Channel Text Prompting and Image Augmentations [1.6] 我々はあいまいな言語と候補画像を共有マルチモーダル空間に投影するフレームワークを開発した。
我々は、WordNetシノニムを用いたセマンティクスと写真に基づくプロンプトの二重チャネルアンサンブルを用いて、テキスト埋め込みを豊かにする。
SemEval-2023 VWSDデータセットで評価すると、MRRは0.7227から0.7590に、ヒットレートは0.5810から0.6220に上昇する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:53:10 GMT)
Scalable testing of quantum error correction [1.6] 階層化された断層注入と外挿を組み合わせたスケーラブルなアプローチを提案する。
我々のツールは、デスクトップ上で2時間の時間予算で物理的エラー率0.0005で17までスケールする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:20:41 GMT)
Open TutorAI: An Open-source Platform for Personalized and Immersive Learning with Generative AI [1.4] 本稿では,LLMと生成技術に基づくオープンソースの教育プラットフォームであるOpen TutorAIについて述べる。
このシステムは自然言語処理とカスタマイズ可能な3Dアバターを統合し、マルチモーダル学習者インタラクションを実現する。
コンテンツを整理し、組み込みのフィードバックを提供し、学習者、教育者、親のために専用のインターフェイスを提供するツールが含まれている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:24:33 GMT)
MTQE.en-he: Machine Translation Quality Estimation for English-Hebrew [1.4] MTQE.en-heは、機械翻訳品質推定のための最初の公開ベンチマークである。
ChatGPTプロンプト、TransQuest、CometKiwiをベンチマークします。
TransQuestとCometKiwiによる微調整実験では、フルモデルのアップデートがオーバーフィットと分散崩壊に敏感であることが明らかになった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:51:45 GMT)
Putting fermions onto a digital quantum computer [1.4] 我々は、フェルミオン自由度を量子ビットに符号化する方法をレビューする。
我々は、1次元を超えたフェルミオン系は基本的に扱うのが困難であるという考えを払拭しようと試みる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:50:44 GMT)
RanSOM: Second-Order Momentum with Randomized Scaling for Constrained and Unconstrained Optimization [1.4] Polyak's Heavy Ballのようなモメンタム法はディープネットワークのトレーニングの標準であるが、設定の曲率に起因したバイアスに悩まされている。
textbfRanSOMは、決定論的ステップサイズを、平均$_t$で分布から引き出されたランダム化ステップに置き換えることで、このバイアスを解消する統合フレームワークである。
我々はこのフレームワークを,制約のない最適化のための textbfRanSOM-E と制約のない最適化のための textbfRanSOM-B の2つのアルゴリズムでインスタンス化する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:09:36 GMT)
Compositionality of Systems and Partially Ordered Runs [1.3] C.A.ペトリは、分散システムの個々の進化を記述する適切なモデルとして、部分的に順序付けられたイベント発生(実行)を導入した。
本稿では,ペトリネットとその実行を扱う統一的なフレームワークについて述べる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:43:02 GMT)
Time-reversal Interferometry Using Cat States with Scalable Entangling Resources [1.3] 高速なツイスト・アンド・ターンパルス列を用いたシュルディンガー・キャット状態の生成法を提案する。
得られた状態は最適な量子フィッシャー情報を示し、位相感度の古典的な限界を超えるのに理想的である。
ハイゼンベルクの極限スケーリングは、原子数に比例したタンデムで用いられるねじれを低減しても、そのままであることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:02:29 GMT)
Continuous-time reinforcement learning: ellipticity enables model-free value function approximation [1.3] 本研究では、離散時間観測と行動によるマルコフ拡散過程の制御のための非政治強化学習について検討する。
データから直接関数を学習する関数近似を用いたモデルフリーアルゴリズムについて検討する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:25:33 GMT)
Now You See That: Learning End-to-End Humanoid Locomotion from Raw Pixels [1.3] 視覚駆動型ヒューマノイド移動のためのエンドツーエンドフレームワークを提案する。
頑健なsim-to-real転送を実現するため,高忠実度深度センサシミュレーションを開発した。
本稿では,遅延空間アライメントと雑音不変の補助タスクを組み合わせた視覚的行動蒸留手法を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:34:20 GMT)
EchoJEPA: A Latent Predictive Foundation Model for Echocardiography [1.3] 我々は,3K患者の心エコー図を1800万回トレーニングした基礎モデルであるEchoJEPAを提示する。
遅延予測の目的を活用することで、EchoJEPAはスペックルノイズを無視した堅牢な解剖学的表現を学ぶ。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:13:08 GMT)
AI-Generated Music Detection in Broadcast Monitoring [1.2] 我々は,放送スタイルのAI-音楽検出に適した最初のデータセットであるAI-OpenBMATを紹介する。
実際のテレビオーディオの持続パターンと大音量の関係に従う3,294の1分間のオーディオ抜粋を含んでいる。
我々は,SNRと持続ロバスト性を評価するために,CNNベースラインと最先端SpectTTTraモデルをベンチマークし,全放送シナリオで評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:08:01 GMT)
SAS-Net: Scene-Appearance Separation Network for Robust Spatiotemporal Registration in Bidirectional Photoacoustic Microscopy [1.2] 光高速分解能光音響顕微鏡(OR-PAM)と双方向走査は、迅速な機能脳イメージングを可能にする。
提案手法により,高感度な双方向OR-PAMによる定量的・縦断的機能イメージングが可能となる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:01:27 GMT)
The Window Dilemma: Why Concept Drift Detection is Ill-Posed [1.0] 基盤となるデータ生成プロセスの非定常性は、データストリームの重要な特徴である。
このような変化(ドリフト)を検出する方法のクラスとして,概念ドリフト検出器が確立されている。
本研究では,ドリフト認識がウインドウ生成の産物であり,必ずしも基礎となるデータ生成プロセスではないことを観察するウィンドウジレンマを紹介する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:39:47 GMT)
Radon--Wasserstein Gradient Flows for Interacting-Particle Sampling in High Dimensions [1.0] Kullback-Leibler分散の勾配流は、正規化定数までしか知られていないターゲット密度への分布を進化させる。
ここでは,KL分散の勾配流と,特性の顕著な組み合わせを紹介する。
彼らは高次元における正確な相互作用粒子近似を認め、ステップごとのコストは粒子の数と次元の両方で線形にスケールする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:23:06 GMT)
CORE: Comprehensive Ontological Relation Evaluation for Large Language Models [1.0] 大規模言語モデル(LLM)は多くの推論ベンチマークでよく機能するが、既存の評価では意味のある意味的関係と真の非関連性を区別する能力を評価することは滅多にない。
74の分野にまたがる225万質問のデータセットであるCORE(Comprehensive Ontological Relation Evaluation, 総合オントロジー関係評価)を紹介する。
1000人以上の参加者のヒトのベースラインは92.6%の精度(関係のないペアの95.1%)を達成する
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:16:33 GMT)
Code vs Serialized AST Inputs for LLM-Based Code Summarization: An Empirical Study [1.0] 本稿では,LLM互換シーケンスに構造情報をエンコードするAST拡張シリアライズ手法であるAST(NIT)を提案する。
CodeXGLUE Pythonデータセット上のLLaMA-3.1-8Bモデルによる実験では、提案されたシリアライズされたASTはLLM入力の長さを減少させ、トレーニング時間を短縮し、既存のアプローチに匹敵する要約品質を達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:55:01 GMT)
The challenge of generating and evolving real-life like synthetic test data without accessing real-world raw data -- a Systematic Review [0.9] e-Governmentサービスからのデータを使用するアプリケーションの高レベルのシステムテストでは、実生活に似たテストデータが必要ですが、個人情報のプライバシが保証されています。
本稿は、この領域における現状を総合することを目的としている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:12:54 GMT)
The Double-Edged Sword of Data-Driven Super-Resolution: Adversarial Super-Resolution Models [0.9] 本稿では,学習中のSRモデルの重みに直接,敵対行動を直接埋め込むことができることを示すフレームワークであるAdvSRを提案する。
AdvSRは、復元品質とターゲットとなる敵の成果を共同で最適化することにより、標準的な画像品質指標の下で良さそうなモデルを生成する。
これらの発見は、画像パイプラインに対する新たなモデルレベルの脅威を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:00:58 GMT)
A neuromorphic model of the insect visual system for natural image processing [0.9] 昆虫の視覚は、連想学習、ナビゲーション、物体検出などの複雑な行動をサポートする。
本稿では,高密度な視覚入力をスパースな識別符号に変換するバイオインスパイアされた視覚モデルを提案する。
花認識タスクと自然画像ベンチマークにおける結果の表現性を評価する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:54:28 GMT)
Dependable Artificial Intelligence with Reliability and Security (DAIReS): A Unified Syndrome Decoding Approach for Hallucination and Backdoor Trigger Detection [0.9] 本稿では,学習システムにおけるセキュリティ違反と信頼性違反の両方を検出するために,シンドローム復号に基づく新しい統一手法を提案する。
我々はNLP文埋め込み空間にシンドロームデコードアプローチを適用し、MLトレーニングデータセット内の有毒および無毒サンプルの識別を可能にする。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:36:03 GMT)
Software Self-Extension with SelfEvolve: an Agentic Architecture for Runtime Code Generation [0.8] 本稿では,実行時の自己拡張を可能にするエージェントパイプラインアーキテクチャであるSelfEvolveを紹介する。
自己拡張(Self-extension)は、ユーザ要求に基づいて、新たな関数の自動生成と統合に焦点を当てる。
この研究は、自律的なコード生成によるランタイム機能拡張の実現可能性を示している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:43:31 GMT)
Time-uniform conformal and PAC prediction [0.8] コンフォメーション予測とそれに関連するほぼ正しいPAC予測フレームワークを逐次設定に拡張する。
結果として得られる予測セットは、アナリストが選択した時点において、期待されるカバレッジが要求レベルであるという点において、いつでも有効である。
本稿では,提案手法の理論的保証と,シミュレーションおよび実データに対する有効性と有用性を示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:41:10 GMT)
A Cycle-Consistent Graph Surrogate for Full-Cycle Left Ventricular Myocardial Biomechanics [0.8] 左室バイオメカニクス(LV)の高速全サイクル推定のためのグラフベースサロゲートであるCardioGraphFENet(CGFENet)を提案する。
提案モデルでは, (i) メッシュ特徴を弱形式にインスパイアされた大域的結合でキャプチャするグローバル局所グラフエンコーダ, (ii) 目標体積時間信号に条件付きゲート型再帰単位系時間エンコーダを統合し, (iii) 単一フレームワーク内でのロードと逆アンロードの両方に対するサイクル一貫性のある双方向定式化を行う。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 17:14:38 GMT)
NanoQuant: Efficient Sub-1-Bit Quantization of Large Language Models [0.7] NanoQuantは量子化を低ランク二乗分解問題として定式化する。
フル精度の重みを低ランクのバイナリ行列やスケールに圧縮する。
これは、サブ-1ビットの圧縮レートでも最先端の精度を達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:26:44 GMT)
Personality as Relational Infrastructure: User Perceptions of Personality-Trait-Infused LLM Messaging [0.7] 行動変化システムにおけるパーソナライゼーションに基づくパーソナライゼーションは、主にメッセージ単位ではなく集約露光によって機能する可能性があることを示す。
これらの知見を現実の文脈で検証するためには, その場縦断的研究が必要である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:47:47 GMT)
Di3PO -- Diptych Diffusion DPO for Targeted Improvements in Image [0.7] T2I拡散モデルにおいて「Di3PO」は正対と負対を構成する新しい手法である。
拡散モデルにおけるテキストレンダリングの難しい課題に適用することで,本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:33:17 GMT)
Algebraic Reduction to Improve an Optimally Bounded Quantum State Preparation Algorithm [0.7] n$-qubit量子状態の合成は、多くの量子アルゴリズムのための横断的なサブルーチンである。
より単純な代数的分解は、所望状態の実際の部分の準備を複素状態から分離するために提案される。
複雑性の低減は、元の分解で3つではなく、各一様に制御されたゲートに対して1つの演算子$$を使用するためである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:40:09 GMT)
Reliable Mislabel Detection for Video Capsule Endoscopy Data [0.7] 医療データセットにおける誤ラベル検出のためのフレームワークを提案する。
これは、ビデオカプセル内視鏡用の最大2つの公開データセットで検証されている。
提案手法は, 誤ラベル付きデータの検出に成功し, その結果, 異常検出性能が向上したことを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:33:12 GMT)
Reciprocal Latent Fields for Precomputed Sound Propagation [0.6] 本稿では、音響パラメータの符号化と予測のためのメモリ効率の高いフレームワークであるReciprocal Latent Fields (RLF)を紹介する。
RLFは、メモリフットプリントを桁違いに削減しつつ、複製品質を維持していることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:31:11 GMT)
HyQuRP: Hybrid quantum-classical neural network with rotational and permutational equivariance for 3D point clouds [0.6] HyQuRPは、回転と置換の対称性に同値なハイブリッド量子古典ニューラルネットワークである。
スパースポイント状態において、HyQuRPは、強い古典的および量子的基底線よりも一貫して優れる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 04:32:42 GMT)
Evaluating Retrieval-Augmented Generation Variants for Natural Language-Based SQL and API Call Generation [0.6] 大規模言語モデル(LLM)は、コード生成の約束を示すが、ドメイン固有のエンタープライズコンテキストにおけるそれらの有効性はまだ未調査である。
本稿では,3種類のRAGを総合的に評価する。
本研究は,生産級自然言語インタフェースの重要な決定要因として,検索政治設計を確立した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:37:06 GMT)
Infinite-dimensional generative diffusions via Doob's h-transform [0.6] 本稿では、Doobのh-transformを通じて無限次元における生成拡散モデルを定義するための厳密な枠組みを提案する。
スコアマッチングの目的を最小化することにより,変化した測定値の強制的処理を近似できることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:25:32 GMT)
Fine-Tuning and Evaluating Conversational AI for Agricultural Advisory [0.6] 大規模言語モデルは農業の助言を約束するが、バニラモデルは推奨されない勧告を示す。
本稿では,会話配信から事実検索を分離するハイブリッドLLMアーキテクチャを提案する。
インドのビハールで行われた作物とクエリの実験では、キュレートされたデータの微調整により、事実のリコールとF1が大幅に改善された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:18:32 GMT)
Online Adaptive Reinforcement Learning with Echo State Networks for Non-Stationary Dynamics [0.6] 本稿では,Reservoir Computingに基づく強化学習のための軽量オンライン適応フレームワークを提案する。
具体的には,Echo State Networks (ESNs) を適応モジュールとして統合し,最近の観測履歴を潜在文脈表現にエンコードする。
厳しい環境変化を伴うCartPoleおよびHalfCheetahタスクに対する提案手法の評価を行った。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:51:01 GMT)
A compliant ankle-actuated compass walker with triggering timing control [0.6] 新しいモデルが提案され、即時対応の足首押し出しを可能にする制御足首作動歩行コンパス(TC-AACG)が提案される。
提案手法は2足歩行モデルの運動能力を衝動性足関節伸展法と比較して拡張することを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:00:19 GMT)
Achieving Sub-Exponential Speedup in Gate-Based Quantum Computing for Quadratic Unconstrained Binary Optimization [0.6] 本稿では,Simulated AnnealingとGroverのアルゴリズムを統合し,サブ指数高速化を実現するハイブリッドアプローチを提案する。
ケーススタディは、ゲートベースの量子コンピューティングを用いて、提案手法がサブ指数高速化を実現することを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:28:17 GMT)
Attention's Gravitational Field:A Power-Law Interpretation of Positional Correlation [0.5] 本稿では,Large Language Models(LLMs)における位置関係とエンコーディングの基本原理について考察する。
セマンティックエンコーディングから位置エンコーディングを分離することにより、モデルアーキテクチャを最適化し、一般的なエンコーディング手法と比較して精度が向上する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:51:32 GMT)
A novel Integrated Motion Tracking Device (IMTD) for Objective Laparoscopic Training Assessment: Development and Validation [0.5] 本稿では,腹腔鏡下手術におけるトレーニングと評価を目的とした,コンパクトな4自由度モーショントラッキング装置(IMTD)を提案する。
IMTDのトラッキング精度と信頼性はモーションキャプチャシステム(MoCap)と比較される
その結果, 手術動作の追跡におけるシステムの有効性が強調され, 最小侵襲手術における訓練と成績評価のためのツールとしての可能性について貴重な知見が得られた。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:53:48 GMT)
Disentanglement by means of action-induced representations [0.5] 実験(または行動)を行う物理系の表現をモデル化する行動誘発表現(AIR)の枠組みを紹介する。
我々は、この枠組みにおいて、その行動依存度において、確実に自由度を乱すことができることを示した。
さらに、AIRを抽出し、標準のVAEが故障した場合に証明可能なアンタングル化を実現する可変AIRアーキテクチャ(VAIR)を導入する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:42:17 GMT)
Measurement-Based Preparation of Higher-Dimensional AKLT States and Their Quantum Computational Power [0.5] 1次元を超える AKLT 状態を生成するための一定時間核融合計測に基づくスキームについて検討する。
我々は、与えられたグラフ上のそのような状態が、ランダムスピン1の装飾まで準備可能であることを示す。
また、無作為に結合されたAKLT状態も検討し、その構成は自由の結合度における標準ベル状態のいずれかを含む。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:22:35 GMT)
Endogenous Resistance to Activation Steering in Language Models [0.5] 内因性ステアリング抵抗(ESR)と呼ぶ。
Llam-3.3-70B はかなりのESRを示すが、Llama-3 や Gemma-2 の小さなモデルでは、この現象の頻度は低い。
Llama-3.3-70Bでは,26個のSAE潜伏剤が外因性中,ESRに因果的に結合している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:41:12 GMT)
A methodology for analyzing financial needs hierarchy from social discussions using LLM [0.4] 本研究では,ソーシャルメディアにおける金融ニーズの階層構造について考察する。
我々は、大規模なテキストデータを分析するために、生成的AI技術を採用している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:58:25 GMT)
Quantum Attention by Overlap Interference: Predicting Sequences from Classical and Many-Body Quantum Data [0.4] 本稿では,変圧器と大規模言語モデルにおけるコア操作である自己注意(QSA)の変分量子実装を提案する。
我々のQSAは状態重複の干渉によって要求される非線形性を認識し、Renyi-1/2クロスエントロピー損失を返す。
そこで本研究では,QSAに基づく量子トランスフォーマーを用いて,古典的データおよび多体逆場Ising量子軌道上のシーケンス予測を学習した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:37:17 GMT)
Performance limits of a quantum receiver for detecting phase-modulated communication signals [0.4] 電磁波に符号化された情報を復調するための量子センサを用いた受信チェーンの性能解析を行う。
本稿では,センサノイズやチャネル歪みがあっても高忠実なデータ復元を可能にする量子プロトコルの変更について論じる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:01:03 GMT)
Assessing the Reliability of Persona-Conditioned LLMs as Synthetic Survey Respondents [0.4] 我々は、ペルソナ条件のシミュレーションの影響を評価するために、米国のマイクロデータの大規模なデータセットを使用します。
その結果,ペルソナ・プロンプトはサーベイアライメントにおいて明確な総合的改善を得られず,多くの場合,性能が著しく低下することがわかった。
本研究は,現在のペルソナ・シミュレーション・プラクティスの重大な影響を浮き彫りにするものである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:13:59 GMT)
Green Optimization: Energy-aware Design of Metaheuristics by Using Machine Learning Surrogates to Cope with Real Problems [0.4] 本稿では,ニューラルサロゲートモデルによる機械学習のメタヒューリスティックスへの統合について検討する。
本研究では,最先端の訓練済みサロゲートを使用することで,エネルギー消費量を最大98%,実行時間を約98%,メモリ使用量を約99%削減できることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:12:54 GMT)
Robots That Generate Planarity Through Geometry [0.3] 球面を平面に幾何学的逆転させることで、平面性を完全にリンク長と接続性から引き出すロボットモーションシステムを生成することができることを示す。
これらのFPM(Flat-Plane Mechanisms)をミクロンからメートルスケールで示し、その結果の平坦さの桁違いによって製造誤差を減衰させることができることを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:23:34 GMT)
aerial-autonomy-stack -- a Faster-than-real-time, Autopilot-agnostic, ROS2 Framework to Simulate and Deploy Perception-based Drones [0.3] 我々は、パイプラインを(GPUアクセラレーションによる)知覚から(フライトコントローラベースの)アクションへ合理化するように設計された、オープンソースのエンドツーエンドフレームワークであるAero-autonomy-stackを紹介した。
完全な開発とデプロイメントスタックの,20倍以上の高速,エンドツーエンドのシミュレーションをサポートしています。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:29:33 GMT)
Pimp My LLM: Leveraging Variability Modeling to Tune Inference Hyperparameters [0.3] 大規模言語モデル(LLM)は、幅広いタスクでますます使われています。
彼らの相当な計算要求は、トレーニングと推論の両方のエネルギー効率と持続可能性に関する懸念を提起する。
最近の研究は、最適化手法を探求し、構成選択がエネルギー消費にどのように影響するかを分析している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:18:22 GMT)
Reclaiming First Principles: A Differentiable Framework for Conceptual Hydrologic Models [0.3] 本稿では, パラメータの正確な感度に基づく, 識別可能な水理モデリングのための, 完全に解析的かつ計算的効率のよいフレームワークを提案する。
結果として得られる勾配は決定論的であり、物理的に解釈可能であり、勾配に基づくベクトルに埋め込まれやすい。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:55:49 GMT)
Second law of thermodynamics in closed quantum many-body systems [0.3] 無限観測可能なマクロ熱平衡(iMATE)を導入する。
我々は、iMATEの任意の量子状態からマクロな操作を通じて、広範囲にわたる研究を抽出することはできないことを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:30:45 GMT)
Optimization of an Augmented R-CUBE mechanism for Cervical Surgery [0.3] 脊椎を標的とする外科手術では、椎骨にペダルスクリューを挿入するために椎骨の空洞をドリルする必要がある。
この用途に新しい機械的アーキテクチャを提案する。
フルトランスレーショナルR-CUBE機構の強化バージョンに基づいており、追加の回転運動を実装するためのリンクを改善している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:56:57 GMT)
Feasible Static Workspace Optimization of Tendon Driven Continuum Robot based on Euclidean norm [0.3] 本稿では,その実現可能な静的ワークスペース(FSW)に基づいて,腱駆動型連続ロボット(TDCR)の最適設計に着目する。
ロボットの実現可能な静的ワークスペースを決定するために、遺伝的アルゴリズム最適化アプローチを用いて、TDCRの先端位置のユークリッドノルムをワークスペース上で最大化する。
その結果,外力やトルクの影響下であっても,最適腱力を最大化するために,提案手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:51:40 GMT)
Gold Exploration using Representations from a Multispectral Autoencoder [0.3] 本稿では,Sentinel-2画像から得られた生成表現を利用して,空間から金を含む領域を識別する概念実証フレームワークを提案する。
Isometricと呼ばれるオートエンコーダの基礎モデルは、大規模なFalconSpace-S2 v1.0データセットで事前訓練されている。
我々は、この表現に基づくアプローチを、既知の金および非金の場所からの63Sentinel-2画像のデータセットを用いて、生スペクトル入力ベースラインと比較した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:47:12 GMT)
Generalization of Self-Supervised Vision Transformers for Protein Localization Across Microscopy Domains [0.3] 自己教師付き学習(SSL)は、大規模なラベルなしデータセットで事前トレーニングすることで、これを緩和することができる。
我々は、ImageNet-1k、Human Protein Atlas(HPA)、OpenCellで事前訓練された3つのDINOバックボーンを用いて画像埋め込みを生成する。
すべての事前訓練されたモデルは、顕微鏡固有のHPA事前訓練モデルにより、最高の性能を達成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:27:15 GMT)
Primary Experimental Feedback on a Co-manipulated Robotic System for Assisted Cervical Surgery [0.3] この研究は、共同操作型ロボットシステムの性能を詳細に分析する。
本研究の成果は, ロボットによる頚外科手術の進展に寄与すると考えられる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:47:28 GMT)
RoPE-LIME: RoPE-Space Locality + Sparse-K Sampling for Efficient LLM Attribution [0.2] 我々は、説明から推論を分離するgSMILEのオープンソース拡張であるRoPE-LIMEを紹介する。
この結果から,RoPE-LIMEは,余分なサンプリングよりも有意な属性が得られ,gSMILEよりも優れたことが示唆された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:26:14 GMT)
Quantum-Inspired Algorithm for Classical Spin Hamiltonians Based on Matrix Product Operators [0.2] 本稿では,量子状態のスペクトルフィルタリングとサンプリングに着想を得た古典的最適化問題に対するテンソルネットワーク(TN)アプローチを提案する。
我々は変換されたハミルトン作用素を行列積作用素(MPO)として表現し、切り離されたMPO-MPO縮約によってこの対象の巨大なパワーを形成する。
密度行列再正規化群とは対照的に,本手法は結合次元を増大させることにより体系的改善への直接的な経路を提供し,局所最小化を回避することができる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:32:23 GMT)
Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU [0.2] デザインコンダクタ(DC)は、フロンティアモデルの能力を適用して半導体をエンドツーエンドに構築する自律エージェントである。
DCは1.48GHzのタイミングで完全なRISC-VCPUのマイクロアーキテクチャを複数構築することができた。
自律エージェントが仕様からGDSIIまで、完全に動作するCPUを構築したのは、これが初めてだ。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:05:06 GMT)
Topography scanning as a part of process monitoring in power cable insulation process [0.1] XLPEケーブルコア監視のための新しいトポグラフィースキャンシステムを提案する。
現代の計測技術は、組み込み高性能コンピューティングと併用して、絶縁コアの完全かつ詳細な3次元表面マップを構築する。
深層学習手法を用いて表面欠陥検出システムを開発した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:24:18 GMT)
UnWeaving the knots of GraphRAG -- turns out VectorRAG is almost enough [0.1] UnWeaverは、複数のチャンクにまたがるエンティティにドキュメントの内容を切り離す新しいRAGフレームワークである。
実体に基づく分解は、原情報のより蒸留された表現をもたらし、さらにインデックス化および生成過程におけるノイズを低減するのに役立ちます。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:37:10 GMT)
Evaluating Prompt Engineering Strategies for Sentiment Control in AI-Generated Texts [0.1] 本研究では,AI生成テキストにおける感情制御のための素早いエンジニアリングの可能性について検討する。
Ekmanの6つの基本的な感情を用いて、ゼロショットやチェーン・オブ・サート・プロンプトなど様々なプロンプト技術を検討する。
結果は、AI生成テキストの感情を効果的に操り、ファインチューニングに代わる実用的で費用対効果の高い代替手段を提供することを示唆している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:22:40 GMT)
An attention economy model of co-evolution between content quality and audience selectivity [0.1] 人間の注意はデジタル環境では希少かつ戦略的に競合する資源となっている。
我々は、コンテンツ品質とオーディエンスアテンションが、限られた注意力の下でどのように共進化するかを説明するために、最小限の数学的枠組みを開発する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:07:57 GMT)
Lite-BD: A Lightweight Black-box Backdoor Defense via Reviving Multi-Stage Image Transformations [0.0] ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。
ブラックボックス防御はホワイトボックス法よりも実用的である。
軽量な2段バックドアディフェンスであるtextttLite-BD を提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:11:49 GMT)
BadSNN: Backdoor Attacks on Spiking Neural Networks via Adversarial Spiking Neuron [0.0] スパイキングニューラルネットワーク(スパイキングニューラルネットワーク、英: Spiking Neural Networks、SNN)は、ディープニューラルネットワーク(Deep Neural Networks、DNN)のエネルギー効率の高いネットワークである。
本稿では,スパイクニューラルネットワークに対する新たなバックドア攻撃であるtextitBadSNNを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 21:20:41 GMT)
Two-photon-excited fluorescence spectroscopy of Rb atoms in a magneto-optical trap [0.0] 5mathrmS_1/2 rightarrow 5mathrmD_1/2$ transition of 8,5$Rb and 8,7$Rb cooled in a magneto-optical trap (MOT)
我々はTPEFを1ドルW以下または4.30 pm 0.22 x 1018 textphotons,textcm-2,texts-1で観測する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:03:03 GMT)
Machine Learning for Detection and Severity Estimation of Sweetpotato Weevil Damage in Field and Lab Conditions [0.0] 本研究は, コンピュータビジョンによる悪害の自動評価手法を提案する。
この分野では,根の損傷度を推定するために,分類モデルを訓練するためのデータを収集した。
実験室では,リアルタイム検出モデルであるYOLO12を用いた物体検出パイプラインを設計した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:43:54 GMT)
compar:IA: The French Government's LLM arena to collect French-language human prompts and preference data [0.0] IAは、フランス政府内で開発されたオープンソースのデジタルパブリックサービスである。
主にフランス語話者の聴衆から大規模な人間の嗜好データを収集する。
2026-02-07年時点で、IAは60,000以上のフリーフォームプロンプトと25万の選好票を集めており、その約89%がフランス語である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:53:44 GMT)
Zero-point energy of solids from vacuum fluctuation and quantum geometric force [0.0] 電磁場の量子揺らぎは、固体に新たなゼロ点エネルギーをもたらすことを示す。
絶縁体の場合、零点エネルギー密度は多体基底状態における電気分極の量子ゆらぎに比例する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:00:03 GMT)
Zero-Trust Runtime Verification for Agentic Payment Protocols: Mitigating Replay and Context-Binding Failures in AP2 [0.0] 本稿ではエージェントベースの決済システムにおいて,AP2管理ライフサイクルのセキュリティ分析を行い,実行中に発生する強制的ギャップを識別する。
本稿では,明示的なコンテキストバインディングとコンシューム・オンス・マンデート・セマンティクスを適用したゼロトラストランタイム検証フレームワークを提案する。
本稿では,コンテキストアウェアバインディングとコンシューム・オンス・エグゼクティブ・アドレスの区別と相補的アタック・クラスを示すとともに,リプレイとコンテキスト・リダイレクト・アタックの防止に必要であることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:22:11 GMT)
Wild Guesses and Mild Guesses in Active Concept Learning [0.0] 大規模言語モデル(LLM)による仮説を提唱したニューロシンボリック・ベイズ学習者のトレードオフについて検討する。
我々は,推定情報ゲイン(EIG)を最大化するためにクエリを選択するRational Active Learnerと,人型陽性テスト戦略(PTS)を比較した。
以上の結果から,「確認バイアス」は認知的誤りではなく,人間の思考に特徴的な疎明でオープンな仮説空間において,抽出可能な推論を維持するための合理的適応である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:04:44 GMT)
VERA-MH: Reliability and Validity of an Open-Source AI Safety Evaluation in Mental Health [0.0] メンタルヘルス(VERA-MH)評価における倫理的で責任のあるAIの検証は、エビデンスベースの自動安全ベンチマークの緊急の必要性を満たすために最近提案された。
本研究は,自殺リスク検出および応答におけるAI安全性評価のためのVERA-MHの臨床的妥当性と信頼性を検討することを目的とした。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:08:26 GMT)
Unlocking Noisy Real-World Corpora for Foundation Model Pre-Training via Quality-Aware Tokenization [0.0] 本稿では,データ信頼性を語彙構築に直接組み込むQA-Tokenについて述べる。
我々は1.7兆のベースペアからなるプレトレーニングコーパスをトークン化し、最先端の病原体検出を実現する。
私たちは、ゲノム配列とテラバイト単位の金融時系列のペタベースにまたがる、騒々しい現実世界のコーパスをアンロックします。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:26:59 GMT)
Toward generative machine learning for boosting ensembles of climate simulations [0.0] 気候シミュレーションの限られたサンプルに基づいて学習した条件付き変分オートエンコーダ(cVAE)を開発し,任意の大規模なアンサンブルを生成する。
cVAEモデルはデータの基盤となる分布を学習し、現実的な低モーメントと高モーメントの統計を再現する物理的に一貫したサンプルを生成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:54:19 GMT)
The hidden risks of temporal resampling in clinical reinforcement learning [0.0] 実運用において,時間的再サンプリングはオフライン強化学習アルゴリズムの性能を著しく低下させることを示す。
本稿では,この障害を誘発するメカニズムとして,反現実軌道の生成,時間的期待の歪み,一般化誤差の複合化の3つを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:02:06 GMT)
The Quantum Sieve Tracer: A Hybrid Framework for Layer-Wise Activation Tracing in Large Language Models [0.0] 本稿では,ファクトリコール回路を特徴付けるために設計されたハイブリッド量子古典的フレームワークであるQuantum Sieve Tracerを紹介する。
まず、古典的な因果トレースを用いて臨界層をローカライズし、次に特定の注意ヘッドの活性化を指数関数的に大きなヒルベルト空間にマッピングする。
その結果、量子カーネルは、これらの構成的(リコール)と還元的(圧縮)メカニズムを区別することができ、注意の微細なトポロジを解析するための高分解能ツールを提供することを示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:40:09 GMT)
The Condensate Theorem: Transformers are O(n), Not $O(n^2)$ [0.0] 注意空間は学習されたトポロジカルな性質であり、建築上の制約ではないことを示す。
任意のクエリに対して、トポロジカル多様体に注意を投射すると、完全な$O(n2)$の注意で100%の出力等価性が得られることを証明します。
二次的ボトルネックは、インテリジェンスではなく、ナイーブな実装の成果である、と結論付けている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 02:32:42 GMT)
Tethered Reasoning: Decoupling Entropy from Hallucination in Quantized LLMs via Manifold Steering [0.0] 量子化言語モデルは基本的なジレンマに直面し、低いサンプリング温度は繰り返しモード崩壊した出力を発生させ、一方高温(T > 2.0)は軌道分岐と意味的不整合を引き起こす。
隠れ状態軌跡を事前に計算した真性多様体にテザリングすることで、幻覚から出力エントロピーを分離するフレームワークであるHELIXを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:24:37 GMT)
Symmetry and localisation in causally constrained quantum operator dynamics [0.0] 本研究では,三部構成ユニタリ(壁)の構造について検討し,局所作用素の時間・周期進化における拡散を永久に阻止する。
本研究では,局所的制約による絡み合い領域の法則を証明し,その安定性について検討する。
我々の結果は、量子情報の観点から局所的に制約された量子力学の厳密な理解を提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:09:26 GMT)
Stickers on Facebook: Multifunctionality and face-enhancing politeness in everyday social interaction [0.0] 本研究は、Facebook投稿のコーパスからコメント中のステッカーの使用について分析する。
ステッカーは丁寧なメッセージを強化し、顔の質感を自律的に表現できることが判明した。
女性はステッカーを多く使うが、男性は男性を好んでいる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:26:25 GMT)
Stein-Rule Shrinkage for Stochastic Gradient Estimation in High Dimensions [0.0] 勾配法は大規模学習の中心であるが、古典的決定理論が高次元において許容できないことを示す非バイアス推定器としてミニバッチ勾配を扱う。
本稿では, 歴史運動量から導かれる安定な推定器に対して, ミニバッチ勾配を適応的に調整する勾配推定器を構築する。
CIFAR10とCIFAR100の実験的評価は、大型バッチ方式におけるAdamよりも一貫した改善を示した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:58:40 GMT)
SEAL: Symbolic Execution with Separation Logic (Competition Contribution) [0.0] SEALは、リンクされたデータ構造を操作するプログラムの検証のための静的アナライザである。
汎用的な分離論理解法であるAstralを用いて、満足度と細かなチェックを行う。
SEALはLinkedListsベースカテゴリの競争結果を達成した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:27:39 GMT)
Robust Pre-Training of Medical Vision-and-Language Models with Domain-Invariant Multi-Modal Masked Reconstruction [0.0] マスク付き視覚言語学習に目標を明示的に組み込んだ自己教師型事前学習フレームワークであるRobust Multi-Modal Masked Reconstruction (Robust-MMR)を提案する。
VQA-RAD, クロスドメイン画像テキスト分類 (MELINDA), 堅牢画像キャプチャ検索 (ROCO) などである。
以上の結果から,事前トレーニング中にロバスト性を明確にモデル化することで,実世界展開における医療ビジョン言語表現の信頼性が向上することが示された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:20:56 GMT)
Remarks on Dirac-Bergmann algorithm, Dirac's conjecture and the extended Hamiltonian [0.0] 制約付きシステムのハミルトン解析のためのディラック・ベルグマンアルゴリズムは、優しく強力なツールである。
第一級制約を持つシステムへの適用のいくつかの側面は、しばしば文献で見過ごされる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:17:31 GMT)
Rare Event Analysis of Large Language Models [0.0] 本稿では,大規模言語モデルにおける希少事象の体系的解析のためのエンドツーエンドフレームワークを提案する。
提案する実装は,スパンニング理論,効率的な生成戦略,確率推定,エラー解析である。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:50:36 GMT)
Quantum Dynamics of Vibrationally-Assisted Electron Transfer beyond Condon approximation in the Ligand-Receptor Complex [0.0] ヒトACE2受容体に結合したSARS-CoV-2 Spikeタンパク質をモデル系として用いる。
ACE2-Spikeインタフェースを生物学的環境に埋め込まれたオープン量子システムとして扱うことで、振動相互作用が結合された受容体-リガンドダイナミクスをいかに再形成するかをシミュレートする。
この結果は、ACE2--スパイク結合が分子認識機構として振動補助と量子コヒーレンスを利用する可能性を示唆している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 07:53:31 GMT)
Quantum Circuit Generation via test-time learning with large language models [0.0] 大規模言語モデル(LLM)は構造化されたアーティファクトを生成することができるが、科学的設計の信頼性として使用するにはブラックボックス評価の下で反復的改善のメカニズムが必要である。
LLMは固定長ゲートリストへの編集を提案し、外部シミュレータはMeyer-Wallach(MW)グローバルエンタングルメント尺度を用いて結果の状態を評価する。
従来のハイパフォーマンスな候補を明示的なメモリトレースとして再利用できる軽量なテスト時間学習レシピを導入し、スコア差フィードバックでプロンプトを強化し、再起動する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 22:10:56 GMT)
Prenatal Stress Detection from Electrocardiography Using Self-Supervised Deep Learning: Development and External Validation [0.0] 出生前の心理的ストレスは妊娠の15~25%に影響する。
現在のスクリーニングは主観的アンケート (PSS-10) に依存しており、継続的なモニタリングを制限している。
FELICITy 1コホートを用いた心電図からのストレス検出のための深層学習モデルを開発した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 00:03:38 GMT)
Phase-sensitive characterization of a quantum frequency converter by spectral interferometry [0.0] 光学モードの任意の一意スペクトル時間変換の位相感応性評価のための実験手法を提案する。
我々の研究は、新興量子技術における多様な応用を持つ様々なアクティブデバイスの性能を特徴付ける新しいアプローチを導入している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:52:19 GMT)
Performance Evaluation of LLMs in Automated RDF Knowledge Graph Generation [0.0] 大規模言語モデル(LLM)はRDF知識グラフ生成を自動化するための有望なアプローチを提供する。
我々は,複数のLPMを評価し,制御フレームワークを用いた自動RDF抽出手法を提案する。
Llama は 99.35% の F1 スコアと100% 有効な RDF 出力を達成している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:30:35 GMT)
Optimal Derivative Feedback Control for an Active Magnetic Levitation System: An Experimental Study on Data-Driven Approaches [0.0] 本稿では,アクティブ磁気浮上システムのためのデータ駆動型最適微分フィードバックコントローラの設計と実装について述べる。
直接モデルフリーなアプローチでは、複数のプロセスデータを集めるためにエポックループと呼ばれる反復層を追加するポリシーの反復手順が提案されている。
以上の結果から, 両制御器は名目モデルから設計した制御器と比較して, 磁気浮上系の性能を安定させ, 向上させることができるが, 直接モデルフリーアプローチは複数のエポックが許容された場合, 間接解よりも常に優れることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:42:01 GMT)
On the Identifiability of Steering Vectors in Large Language Models [0.0] アクティベーションステアリング法は大規模言語モデルの振る舞いを制御するために広く用いられている。
この解釈は、操舵方向が入力出力動作から識別可能で一意に回復可能であることを暗黙的に仮定する。
操舵ベクトルは、行動的に区別不能な介入の大きな同値類のため、基本的には識別不可能であることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:53:50 GMT)
On the Efficiency of Sequentially Aware Recommender Systems: Cotten4Rec [0.0] 逐次レコメンデーション(SR)モデルは、過去の振る舞いをモデル化することによって、ユーザの次のインタラクションを予測する。
変換器ベースのSR法、特にBERT4Recはこれらのパターンを効果的にキャプチャするが、計算オーバーヘッドは大きい。
本稿では,線形時間コサイン類似性に着目した新しいSRモデルCotten4Recを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:30:23 GMT)
Normal mode splitting induced synchronization blockade in coupled quantum van der Pol oscillators [0.0] 結合は、モードをスペクトル的に分割された通常のモードにハイブリダイズする。
結合強度を調整すれば,この遮断を制御できることが分かる。
我々の結果は、量子システムにおける同期の制御方法に関する新たな洞察を与えるかもしれない。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:45:48 GMT)
Next-generation cyberattack detection with large language models: anomaly analysis across heterogeneous logs [0.0] 異種ログソース間の異常検出のための大規模言語モデル(LLM)について検討する。
従来の侵入検知システムは、高い偽陽性率、セマンティック・ブラインドネス、データ不足に悩まされている。
1)LogAtlas-Foundation-SessionsとLogAtlas-Defense-Set、バランスの取れた、および異種なログデータセット、明示的なアタックアノテーションとプライバシ保護の3つのコントリビューションを通じて、これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:31:58 GMT)
Neuro-symbolic AI for Predictive Maintenance (PdM) -- review and recommendations [0.0] 我々は過去5年間の産業環境における予測保守(PdM)の現状を体系的に検討する。
ディープラーニングに基づくデータ駆動手法は、従来の知識ベースシステムよりも高精度である。
我々は、より正確で説明可能な、解釈可能な、堅牢なシステムを構築するために、ハイブリッドアプローチをさらに推進し、ディープラーニングを記号論理(Neuro-symbolic AI)と統合することを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:57:27 GMT)
MicroBi-ConvLSTM: An Ultra-Lightweight Efficient Model for Human Activity Recognition on Resource Constrained Devices [0.0] リソース制約のあるウェアラブル上でのヒューマンアクティビティ認識(HAR)は、厳格なメモリと計算予算との精度のバランスをとるモデルを必要とする。
提案するMicroBi-ConvLSTMは, 平均11.4Kのパラメータを達成できる超軽量畳み込み並列アーキテクチャである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:26:29 GMT)
Memory-Conditioned Flow-Matching for Stable Autoregressive PDE Rollouts [0.0] 自己回帰生成型PDEソルバは1歩前進し、長いロールアウトでドリフトする。
未解決変数の除去はマルコフ項で完全に解決された進化をもたらすことを示す。
次に、条件生成誤差からメモリ近似を分離する離散的なGrnwallロールアウト境界を導出する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:21:52 GMT)
Measuring Complexity at the Requirements Stage: Spectral Metrics as Development Effort Predictors [0.0] この研究は、アーキテクチャの複雑さ分析と要求工学の実践の間に重要な方法論的ギャップを埋める。
同様の構造的複雑性パターンが統合の労力を予測する可能性があるため、これらのメトリクスを要件エンジニアリングに適用するための検証済みの基盤を提供する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:38:00 GMT)
MACD: Model-Aware Contrastive Decoding via Counterfactual Data [0.0] ビデオ言語モデル(Video-LLMs)は幻覚を起こす傾向があり、視覚的証拠が弱く、曖昧で、偏見があるときに、しばしば可塑性だが、根拠のないコンテンツを生成する。
モデル誘導対実データに基づくコントラストデコーディング(MACD)を提案し,モデル誘導対実データ構築とデコーディングを組み合わせた新しい推論手法を提案する。
我々のアプローチでは、ビデオLLM自身のフィードバックを用いて、幻覚に最も責任があるオブジェクト領域を特定し、任意のフレームや時間的修正ではなく、オブジェクトレベルでターゲットの反事実入力を生成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:12:11 GMT)
Lyapunov Constrained Soft Actor-Critic (LC-SAC) using Koopman Operator Theory for Quadrotor Trajectory Tracking [0.0] クープマン作用素理論を用いたリアプノフ制約付きソフトアクター・クリティカル(SAC)アルゴリズムを提案する。
その結果,安全に制御されたクアドロジャム上での2次元クアドロレータの軌道追跡が評価された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:54:40 GMT)
Local Certification of Many-Body Steady States [0.0] 本稿では, 放散多体量子系の定常状態に期待値を束縛する緩和法を提案する。
我々は、密度行列の減少を変数に促進し、グローバルな定常状態との整合性によってそれらに課される制約を強制する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 08:27:03 GMT)
Learning Human Visual Attention on 3D Surfaces through Geometry-Queried Semantic Priors [0.0] 本稿では,幾何処理と意味認識の相互作用を形式化する2重ストリームアーキテクチャであるSemGeo-AttentionNetを紹介する。
我々は、強化学習を通じて時間的スキャンパス生成にフレームワークを拡張した。
SAL3D, NUS3D, 3DVAデータセットの評価は大幅に改善されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:15:38 GMT)
Investigating the structure of emotions by analyzing similarity and association of emotion words [0.0] Plutchikの感情ホイールの妥当性は十分に検討されていない。
本研究は感情語の意味ネットワークを作成し,分析した。
その結果、各ネットワークの構造は、ほとんどの場合、感情の輪の構造と似ているが、局所的に異なることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:56:38 GMT)
Intrinsic Stability Limits of Autoregressive Reasoning: Structural Consequences for Long-Horizon Execution [0.0] 大規模言語モデル(LLM)は顕著な推論能力を示すが、長い水平タスクでは性能が著しく低下することが多い。
本稿では, 自己回帰生成におけるプロセスレベルの不安定性から, 長期的推論の基本的制約が生じることを示唆する。
本研究は, 完全自己回帰型アーキテクチャ下での長期コヒーレンス維持に新たな限界があることを示唆する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:11:06 GMT)
Internalized Morphogenesis: A Self-Organizing Model for Growth, Replication, and Regeneration via Local Token Exchange in Modular Systems [0.0] 本研究では,Swarm Robotics やmicro-nanomachines などの自律システムのための内部形態形成モデルを提案する。
モジュールは「石田トークンモデル」を拡張することで、微分方程式を解くことなくRDにインスパイアされた離散アナログを用いて整数値を交換する。
結果は、洗練された形態学的挙動は、最小内部のみの規則から生じる可能性があることを示唆している。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 01:41:04 GMT)
Improving Credit Card Fraud Detection with an Optimized Explainable Boosting Machine [0.0] 本研究は、EBM(Explainable Boosting Machine)に基づく拡張ワークフローを提案する。
最適化されたEMMは、精度と解釈可能性の効果的なバランスを実現し、不正取引の正確な検出を可能にする。
ベンチマーククレジットカードデータの実験的評価により、ROC-AUCは0.983であり、以前のEMMベースラインを超えている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:56:17 GMT)
Heralding efficiency and brightness optimization of a micro-ring resonator via tunable coupling [0.0] マイクロリング共振器における自発4光波混合は、優れた狭帯域および波長可変光子源を生成する。
共振器にポンプ, 信号, アイドラーモードの結合を調整することにより, ヘラルディング効率と輝度の最適化を実験的に示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:50:33 GMT)
Git for Sketches: An Intelligent Tracking System for Capturing Design Evolution [0.0] 我々は、カスタムビジュアルバージョン管理アーキテクチャであるsGIT(SketchGit)とGenerative AIを備えたWebベースの環境であるDIMESを紹介する。
DIMESを使用する専門家は、概念探索の幅が160%増加したことを示した。
生成AIモジュールは、知識伝達を促進する物語要約を生成する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:52:38 GMT)
Geometry of restricted information: the case of quantum thermodynamics [0.0] 物理法則が微視的情報へのアクセスを制限することによって現れる幾何学的枠組みを定式化する。
測定制約は密度演算子に作用するゲージ対称性としてモデル化され、物理的に区別可能な状態のゲージ還元空間を誘導する。
エントロピー生成は、熱力学軌道のゲージ還元空間上の前方と後方の確率測度の間の相対エントロピーと同一視される。
第3の法則は、熱力学軌道が崩壊しエントロピー生成が消滅する特異なゼロ温度限界として現れる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:05:24 GMT)
Generating High-quality Privacy-preserving Synthetic Data [0.0] 本稿では,このトレードオフを改善するために,任意の合成データ生成装置上に適用可能なモデル非依存のポストプロセッシングフレームワークについて検討する。
我々はこのフレームワークを、表データのための2つのニューラル生成モデル、フィードフォワードジェネレータ、変分オートエンコーダのためにインスタンス化する。
クレジットカード取引、心臓血管の健康、国勢調査に基づく収入の3つの公開データセットで評価した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:03:49 GMT)
Evolving Ranking Functions for Canonical Blow-Ups in Positive Characteristic [0.0] 正標数における特異点の分解は、代数幾何学における長年の未解決問題である。
本稿では,進化的探索モデルAlphaEvolveを用いて,おもちゃの標準的爆破過程の候補ランク付け関数を探索する実験を報告する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 09:56:28 GMT)
Evidence for Daily and Weekly Periodic Variability in GPT-4o Performance [0.0] 大規模言語モデル (LLM) は研究にますます使われている。
この研究の多くは、固定条件下でのLLM性能が時間不変であると暗黙的に仮定している。
GPT-4oの平均成績の経時的変動について縦断的研究を行った。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 13:41:07 GMT)
Entanglement harvesting in conformal field theory [0.0] 一般の$d$次元共形場理論における絡み合いの収穫について検討する。
演算子スケーリング次元の増大は負性および相互情報の両方を抑制する。
ホログラフィック CFT に対して、バルク有効場理論は、フィールドハーベストドと通信経由の絡み合いを分離することができることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:00:01 GMT)
Empirical Evaluation of QAOA with Zero Noise Extrapolation on NISQ Hardware for Carbon Credit Portfolio Optimization in the Brazilian Cerrado [0.0] 炭素クレジットポートフォリオの最適化は 気候変動の 重要な課題です
本研究では,多目的領域計画問題への量子近似最適化(QAOA)とゼロノイズ補間(ZNE)を併用した実用的応用について検討する。
我々は、中間スケールのIBM Quantumハードウェア上で実行される、炭素隔離、生物多様性接続、社会影響メトリクスを含む88変数のポートフォリオ最適化をモデル化する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:17:28 GMT)
Empirical Analysis of Adversarial Robustness and Explainability Drift in Cybersecurity Classifiers [0.0] 本稿では,2つのサイバーセキュリティ領域にまたがる敵対的堅牢性と説明可能性に関する実証的研究について述べる。
精度摂動曲線の領域として定義される量的指標であるロバストネス指数(RI)を導入する。
Phishing WebサイトとNB15データセットの実験では、一貫性のある堅牢性傾向が示されている。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 05:30:37 GMT)
Efficient and Robust Modeling of Nonlinear Mechanical Systems [0.0] 非線形力学系の力学モデルの新しい定式化法を提案する。
提案モデルでは, 測定ノイズに対するロバスト性の観点から, 優れた性能が得られた。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 12:02:20 GMT)
Effect of initial intrasystem entanglement on entropy growth in generalized Jaynes-Cummings models [0.0] 初期のシステム内絡み合いは、フォトニック環境と相互作用する原子系のエントロピーに影響を及ぼす。
本研究では, 純粋なハールランダム状態と混合ハールランダム状態, 固定平均エネルギーあるいは固定混合状態のアンサンブル, 環境における初期光子数などの初期系状態のアンサンブルについて考察する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:04:45 GMT)
EEG Emotion Classification Using an Enhanced Transformer-CNN-BiLSTM Architecture with Dual Attention Mechanisms [0.0] 本研究では,ハイブリッドなディープラーニングアーキテクチャが脳波データの感情分類性能とロバスト性を向上させるかを検討する。
本稿では, 畳み込み特徴抽出, 双方向時間モデル, 自己保持機構と正規化戦略を組み合わせたハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:05:53 GMT)
Designing a Robust, Bounded, and Smooth Loss Function for Improved Supervised Learning [0.0] 我々は,高次元・外界感度のデータセットを扱うために,頑健で有界で滑らかなロス関数(RoBoS-NN)を開発した。
我々は,ニューラルネットワーク(NN)のフレームワークにRoboS-NNロスを実装し,時系列を予測し,$mathcalL_textRoBoS$-NNというロバストなアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:46:29 GMT)
Cost-Aware Model Selection for Text Classification: Multi-Objective Trade-offs Between Fine-Tuned Encoders and LLM Prompting in Production [0.0] 大規模言語モデル(LLM)は、オープンエンド推論や生成言語タスクにおいて強力な機能を示している。
固定ラベル空間を用いた構造化テキスト分類問題に対して、モデル選択は予測性能のみによって駆動されることが多い。
BERTファミリーの細調整エンコーダを用いたモデルでは、競争力があり、しばしば優れた分類性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:54:28 GMT)
Comprehensive Evaluation of Large Language Models on Software Engineering Tasks: A Multi-Task Benchmark [0.0] 大規模言語モデル(LLM)は、ソフトウェア工学において顕著な能力を示している。
本稿では,5つのソフトウェアエンジニアリングタスクにまたがる11の最先端LCMのマルチタスク評価について述べる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:30:19 GMT)
Comment on "Relativistic covariance and nonlinear quantum mechanics: Tomonaga-Schwinger analysis'' [0.0] 中央の主張とは対照的に、友長-シュウィンガー方程式は非線型な修正にもかかわらず同変である。
共分散の証明は、Hsuの議論における抜け穴と誤りが特定された後に単純になる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:36:29 GMT)
Charge-$4e$ superconductor with parafermionic vortices: A path to universal topological quantum computation [0.0] トポロジカル超伝導体(TSC)は、フォールトトレラントな量子情報処理への有望な経路を提供する。
制約を克服する 4e$ TSC は、Abelian chiral $mathbbZ_3$ topological order と 4e$ condensate を組み合わせて得られる。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 18:59:56 GMT)
Certified Learning under Distribution Shift: Sound Verification and Identifiable Structure [0.0] $f$をディストリビューションでトレーニングされた予測子とし、シフトしたディストリビューションで$Q$を評価する。
検証可能な正則性と複雑性の制約の下では、シフトの余剰リスクは計算可能なシフト計量とモデルパラメータによって決定される明示的な上限を持つ。
我々は,(i)分布シフトのリスクを明示的な不等式によって証明し,(ii)学習モデルの検証は,非自明なサイズに対して健全であり,(iii)理解性は,ポストホックな説明よりも識別可能性の条件によって強制される,統一的な枠組みを開発する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:06:12 GMT)
Calibrating Generative AI to Produce Realistic Essays for Data Augmentation [0.0] データ拡張は、構築された応答項目のための機械学習自動スコアリングエンジンにおける限られたトレーニングデータを緩和することができる。
本研究では,大規模言語モデルに対する3つのアプローチが,本来のエッセイの質を保ったエッセイを作成し,トレーニングデータセットを増強するための現実的なテキストを生成するのに有効かを検討する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 15:27:57 GMT)
Bridging Quantum and Semi-Classical Thermodynamics in Cavity QED [0.0] キャビティ量子力学では、キャビティを離れる光子は、電力源として不可逆的に失われるか、再利用される。
この二分法は、光場の2つの異なる熱力学的簿記に反映される。
得られた熱力学的記述は、完全に量子化されたモデルと定性的に異なる可能性があることを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:45:11 GMT)
Biorthogonal scattering and generalized unitarity in non-Hermitian systems [0.0] 非エルミート二量体モデルにおける2ポート散乱過程を外部鉛を用いた量子測定により検討する。
以上の結果より, 生物直交性は一般ユニタリティを回復し, PT対称および非相反二量体における拡張輸送の物理的起源を同定する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:27:20 GMT)
Bilingual Bias in Large Language Models: A Taiwan Sovereignty Benchmark Study [0.0] 大規模言語モデル(LLM)は、多言語的文脈においてますます展開されているが、政治的に敏感なトピックに関する言語間の一貫性はまだ検討されていない。
本稿では,中国(台湾)の主権に関する質問に対して,中国語と英語で質問した17のLSMがどのように反応するかを,体系的なベンチマークで検討する。
我々は、重要な言語バイアス、すなわち、同じモデルがクエリ言語によって実質的に異なる政治的スタンスを生み出す現象を発見した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:57:21 GMT)
Beyond Code Contributions: How Network Position, Temporal Bursts, and Code Review Activities Shape Contributor Influence in Large-Scale Open Source Ecosystems [0.0] オープンソースのソフトウェアプロジェクトは、イノベーションと持続可能性を促進するコントリビュータの複雑なネットワークに依存している。
本研究では,高度なグラフニューラルネットワークと時間的ネットワーク解析を用いたOSSコントリビュータネットワークの包括的解析を行う。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:47:52 GMT)
Benchmarking Automatic Speech Recognition for Indian Languages in Agricultural Contexts [0.0] インドにおける農業諮問サービスのデジタル化には、堅牢な自動音声認識システムが必要である。
本稿では,ヒンディー語,テルグ語,オディア語にまたがる農業環境におけるASR性能を評価するためのベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 10:06:00 GMT)
An Information-Theoretic Framework for Comparing Voice and Text Explainability [0.0] 本稿では,AIシステムにおける説明モダリティがユーザの理解と信頼の校正にどのように影響するかを分析するための情報理論フレームワークを提案する。
提案モデルは,情報保持,理解効率(CE),信頼校正誤差(TCE)の指標を特徴とする,モデルとユーザ間のコミュニケーションチャネルとして説明配信を扱う。
その結果,テキスト説明は理解効率が向上し,音声説明は信頼度を向上し,アナログベースの配信は全体的なトレードオフを最大限に達成していることがわかった。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:28:46 GMT)
Almost all graphs are vertex-minor universal [0.0] 均一にランダムなグラフ $Gsim Mathrmvm(k)$ が、高い確率で $(sqrt n)$-vertex-minor Universal であることを証明する。
これは量子通信ネットワークに直接的な意味を持つ。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 20:59:33 GMT)
Alleviating Post-Linearization Challenges for Solving Nonlinear Systems on a Quantum Computer [0.0] カールマン線型化(Carleman linearization)は、有限非線形系に対応する高次元無限線型系を提供する。
我々はハミルトニアンを非ユニタリ作用素の重み付き和、すなわちシグマ基底に分解する。
ハミルトニアンが分解されると、回路を構成するためにユニタリ完備化という概念を使う。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 14:56:39 GMT)
Alignment Verifiability in Large Language Models: Normative Indistinguishability under Behavioral Evaluation [0.0] 部分観測可能性下での統計的識別可能性のレンズによるアライメント評価について検討した。
我々は、アライメント検証可能性問題を定式化し、ノーマティブ識別可能性を導入する。
以上の結果から,行動ベンチマークは,評価意識下での遅延アライメントに必要だが不十分な証拠を提供することが示された。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:05:06 GMT)
Advances in Battery Energy Storage Management: Control and Economic Synergies [0.0] 本研究は,BESSの経済と運用の両面に対処する文献を探索することによって,このギャップを埋めることを目的とする。
グリッドデューティサイクルの経済的側面が、BESSシステムに展開される制御スキームとどのように一致しているかを検討する。
このレビューでは、BESS管理とデプロイメント戦略における将来的なイノベーションの道を開いた、潜在的なシナジー、研究ギャップ、新興トレンドを特定します。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 03:50:04 GMT)
Adaptive Protein Tokenization [0.0] 既存のタンパク質構造トークン化剤は、周辺地域の情報をプールすることでトークンを作成する。
本稿では,タンパク質構造のグローバルなトークン化手法について述べる。
適応トークンが情報コンテンツに基づく推論基準をどのように実現し,設計可能性を高めるかを示す。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 06:15:14 GMT)
Accuracy Standards for AI at Work vs. Personal Life: Evidence from an Online Survey [0.0] 我々は、AIを活用したツールをプロフェッショナルとパーソナルのコンテキストで使う際に、人々がいかに正確さと引き換えにするかを研究する。
現代のAIシステムは許容できるが識別できない出力を生成できるため、我々は「正確性」を文脈固有の信頼性として定義する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 19:13:51 GMT)
A Zipf-preserving, long-range correlated surrogate for written language and other symbolic sequences [0.0] 文字言語やゲノムDNAなどの記号配列は、多くの記号にまたがる特徴周波数分布と長距離相関を示す。
既存のサロゲートモデルは通常、周波数分布または相関特性を保持するが、同時には保存しない。
本稿では、元のシーケンスの経験的シンボル周波数を保存し、その長距離相関構造を再現するサロゲートモデルを提案する。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 16:30:55 GMT)
A Survey of Security Threats and Trust Management in Vehicular Ad Hoc Networks [0.0] 信頼管理は、VANETにおける悪意のあるインサイダー攻撃を分離する上で重要な役割を果たす。
本稿ではまず,最先端の信頼モデルについてレビュー,分類,要約を行い,その成果を比較した。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 11:12:21 GMT)
3D Transport-based Morphometry (3D-TBM) for medical image analysis [0.0] 移動型形態計測(TBM)は3次元医用画像解析の新しい枠組みとして登場した。
3D-TBMは3次元医用画像の形態解析のためのツールである。
論文参考訳(メタデータ) (Fri, 06 Feb 2026 23:20:47 GMT)