Beyond Raw Detection Scores: Markov-Informed Calibration for Boosting Machine-Generated Text Detection [105.1] 機械生成テキスト(MGT)は偽情報やフィッシングなどのリスクを生じさせ、信頼性の高い検出の必要性を強調している。
MGTの統計的に区別可能な特徴を抽出するメトリックベース法は、オーバーフィットしがちな複雑なモデルベース法よりも実用的であることが多い。
本稿では,2つのコンテキスト検出スコアの関係をモデル化したマルコフ情報を用いたスコアキャリブレーション手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:06:12 GMT)
Time Is All It Takes: Spike-Retiming Attacks on Event-Driven Spiking Neural Networks [87.2] スパイキングニューラルネットワーク(SNN)は離散スパイクで計算し、時間構造を利用する。
イベント駆動SNNにおけるスパイク数と振幅を保存しながら、既存のスパイクを繰り返すタイミングのみの敵について検討する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 06:42:41 GMT)
Emergent Structured Representations Support Flexible In-Context Inference in Large Language Models [78.0] 大型言語モデル(LLM)は、人間のような推論を示唆する創発的な行動を示す。
テキスト内概念推論におけるLLMの内部処理について検討する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:14:39 GMT)
Scalable Adaptation of 3D Geometric Foundation Models via Weak Supervision from Internet Video [76.3] 本稿では,生のビデオストリームからGEometric foundationモデルのスケーラブル適応を行うフレームワークであるSAGEを提案する。
階層的なマイニングパイプラインを使用して、ビデオをトレーニングトラジェクトリやハイブリッド監視に変換します。
実験の結果、SAGEはゼロショットの一般化を著しく向上し、チェムファー距離を20-42%削減した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:53:21 GMT)
Vanilla Group Equivariant Vision Transformer: Simple and Effective [74.6] 本稿では、パッチ埋め込み、自己アテンション、位置エンコーディング、ダウン/アップ・サンプリング等を含む重要なViTコンポーネントをレンダリングするフレームワークを提案する。
当社の同種ViTは、幅広いビジョンタスクにおけるパフォーマンスとデータ効率を一貫して改善しています。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:32:48 GMT)
TodoEvolve: Learning to Architect Agent Planning Systems [68.5] TodoEvolveは、タスク固有の計画を自律的に合成し、動的に修正するメタプランニングパラダイムである。
PlanFactoryは異種計画パターンの共通インターフェースを提供する。
TodoEvolveは、経済的なAPIコストとランタイムオーバーヘッドを維持しながら、慎重に設計された計画モジュールを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 06:37:01 GMT)
SimGR: Escaping the Pitfalls of Generative Decoding in LLM-based Recommendation [68.0] 推薦システムの中核的な目的は、パーソナライズされたレコメンデーションを可能にするために、アイテムよりもユーザの好みの分布を正確にモデル化することである。
アイテムレベルの嗜好分布を推定する際に,既存の手法が必然的に系統的バイアスを生じさせることを観察する。
textbfSimply textbfGenerative textbfRecommendation (textbfSimGR)を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 07:26:52 GMT)
SparseEval: Efficient Evaluation of Large Language Models by Sparse Optimization [65.0] 大規模言語モデル(LLM)は拡大を続けており、様々な下流タスクのパフォーマンスは大幅に改善されている。
多数のベンチマークサンプルで推論を行うと、高い計算コストが発生するため、それらの能力を評価するのがますます高価になっている。
SparseEvalは,アンカーウェイトを最適化する勾配降下法を初めて導入し,アンカーセレクションに反復的洗練戦略を採用する手法である。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:12:45 GMT)
Learnable Chernoff Baselines for Inference-Time Alignment [64.8] 本稿では,指数関数的に傾いたカーネルから効率よく,およそサンプリングする方法として,Learnerable Chernoff Baselinesを紹介した。
理想的なモデルに対する全変量保証を確立し、LCBサンプリングが理想的拒絶サンプリングと密接に一致するような連続的および離散的な拡散設定を実証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 00:09:40 GMT)
MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Reinforcement Learning for Code Generation [64.3] セルフサーチスケーリングによるマルチエージェント強化トレーニングと推論フレームワーク(MARTI-MARS2)
本稿では,MARTI-MARS2を用いたマルチエージェント強化学習・推論フレームワークを提案する。
我々は、MARTI-MARS2が77.7%を獲得し、GPT-5.1のような強力なベースラインを、挑戦的なコード生成ベンチマークで上回っていることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 07:28:44 GMT)
Rolling Sink: Bridging Limited-Horizon Training and Open-Ended Testing in Autoregressive Video Diffusion [62.4] 自己回帰(AR)ビデオ拡散モデルは優れた性能を達成した。
訓練期間が限られているため、長い地平線でのテスト中に列車とテストの間のギャップが出現し、視覚的劣化が急速に進行する。
ローリングシンク(Rolling Sink)は、ARビデオ合成を、一貫した被写体、安定した色、コヒーレントな構造、滑らかな動きで、テスト時に超長い持続時間にスケールする。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 02:16:02 GMT)
IV Co-Scientist: Multi-Agent LLM Framework for Causal Instrumental Variable Discovery [61.2] 内因性変数と結果との相同性の存在下では、インストゥルメンタル変数(IVs)を用いて内因性変数の因果効果を分離する。
大規模言語モデル(LLM)がこの課題に有効かどうかを検討する。
本稿では,多エージェントシステムであるIV Co-Scientistを紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:28:29 GMT)
Mechanisms of AI Protein Folding in ESMFold [60.6] ESMFoldがいかにしてベータヘアピンを折りたたむかは、よく見られる構造モチーフである。
ESMFoldの構造決定の基盤となるメカニズムは局所化され、解釈可能な表現を通して追跡され、強い因果効果で操作されることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:38:53 GMT)
ToolSelf: Unifying Task Execution and Self-Reconfiguration via Tool-Driven Intrinsic Adaptation [60.3] LLM(Large Language Models)を利用したエージェントシステムは、複雑で長期のタスクに対処する上で、顕著な可能性を示している。
既存のアプローチでは、手動のオーケストレーションやランタイムベースのパッチを頼りにしており、一般化の貧弱さと最適化の断片化に悩まされることが多い。
ツール駆動の自己修正を可能にする新しいパラダイムであるToolSelfを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:27:18 GMT)
Old Habits Die Hard: How Conversational History Geometrically Traps LLMs [59.8] 最近の研究は、大きな言語モデル(LLM)が、予期しない方法で会話の歴史に影響されていることを示唆している。
会話履歴がその後の世代にどのように依存するかを調査するフレームワークであるHistory-Echoesを紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:13:15 GMT)
MaD-Mix: Multi-Modal Data Mixtures via Latent Space Coupling for Vision-Language Model Training [54.8] MaD-Mixは、VLMトレーニングのためのマルチモーダルデータ混合を導出する、原則化されたフレームワークである。
MaD-Mixは様々なベンチマークでVLMトレーニングを高速化する。
複雑なトリモーダルビデオ-画像-テキストのシナリオでは、MaD-Mixは均一な重量よりも平均的な精度を向上する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:07:36 GMT)
On Improving Neurosymbolic Learning by Exploiting the Representation Space [54.2] 本稿では,入力インスタンスの隠されたゴールドラベルが論理式を満たすニューロシンボリック・セッティングにおけるニューラル分類器の学習問題について検討する。
ひとつの課題は、ラベルの組み合わせの空間が指数関数的に成長し、学習を困難にすることです。
類似の潜在表現を持つインスタンスが同じラベルを共有できるという直感を利用して,この空間を刺激する手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:56:47 GMT)
Horizon Imagination: Efficient On-Policy Training in Diffusion World Models [53.3] 我々は、強化学習のための拡散に基づく世界モデルについて研究する。
現在の方法は推論時に重み付けモデルを必要とするか、非常に逐次的な想像力に依存している。
我々は,複数の将来の観測を並列に認知する個別政策のための,政治上の想像プロセスであるHorizon Imagination(HI)を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:07:04 GMT)
AceGRPO: Adaptive Curriculum Enhanced Group Relative Policy Optimization for Autonomous Machine Learning Engineering [52.7] AceGRPOは、エージェントの学習フロンティアにおけるタスクを優先順位付けして学習効率を最大化する機械学習システムである。
我々のトレーニングされたAce-30Bモデルは、MLE-Bench-Lite上で100%有効な応募率を実現し、プロプライエタリなフロンティアモデルの性能にアプローチし、より大きなオープンソースベースラインを上回ります。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:55:03 GMT)
Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection [52.6] 大規模言語モデル(LLM)は、しばしばアライメント税を課す。
この税は、主に連続的な順序で学習スタイルを忘れることから生じると我々は主張する。
我々は, 塑性と安定性のバランスをとるために, OGPSA (Orthogonal Gradient Projection for Safety Alignment) を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:53:46 GMT)
DeltaKV: Residual-Based KV Cache Compression via Long-Range Similarity [50.5] そこで本稿では,KV表現における長距離間類似性と高共有遅延成分を動機とする残差ベースのKVキャッシュ圧縮フレームワークを提案する。
DeltaKVはトークンを捨てる代わりに、検索した履歴参照に対するセマンティックな残基をエンコードし、保存を著しく削減する。
実験によると、DeltaKVは、LongBench、SCBench、AIMEでほぼロスレスの精度を維持しながら、KVキャッシュメモリを元の29%に削減している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:14:36 GMT)
MedCoG: Maximizing LLM Inference Density in Medical Reasoning via Meta-Cognitive Regulation [50.4] 大規模言語モデル(LLM)は、複雑な医学的推論において強い可能性を示しているが、推論スケーリング法の下では増加が減少している。
本稿では,知識グラフを用いた医療メタ認知エージェントであるMedCoGを提案する。タスクの複雑さ,親しみ,知識密度のメタ認知評価は,手続き的,エピソード的,事実的知識の活用を動的に制御する。
実験では、5つのハードなベンチマークでMedCoGの有効性と効率が実証され、5.5倍の推論密度が得られる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:54:04 GMT)
FlowSteer: Interactive Agentic Workflow Orchestration via End-to-End Reinforcement Learning [49.4] FlowSteerは、エージェントと実行可能なキャンバス環境として軽量なポリシーモデルを採用する、エンドツーエンドの強化学習フレームワークである。
FlowSteerは様々なタスクでベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:55:44 GMT)
Geometry-Aware Rotary Position Embedding for Consistent Video World Model [48.9] ViewRopeは、ビデオトランスフォーマーの自己アテンション層に直接カメラの方向を注入するジオメトリ対応のエンコーディングである。
Geometry-Aware Frame-Sparse Attentionは、これらの幾何学的手がかりを利用して、関連する歴史的なフレームに選択的に参加する。
この結果から,ViewRopeは長期的整合性を大幅に向上し,計算コストを低減できることがわかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:01:16 GMT)
VFace: A Training-Free Approach for Diffusion-Based Video Face Swapping [48.8] VFaceは、ビデオの高品質な顔交換のための訓練不要のプラグアンドプレイ方式である。
拡散モデル上に構築された画像ベースの顔交換アプローチとシームレスに統合することができる。
本手法は時間的一貫性と視覚的忠実度を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 06:13:19 GMT)
Can Multimodal LLMs See Science Instruction? Benchmarking Pedagogical Reasoning in K-12 Classroom Videos [48.5] SciIBIは、科学教室の談話を分析するための最初のビデオベンチマークである。
8つの最先端LLMとマルチモーダルLLMを評価し,基本的限界を明らかにした。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:08:19 GMT)
Regret Analysis of Unichain Average Reward Constrained MDPs with General Parameterization [47.7] 無限水平平均逆制約マルコフ決定過程 (CMDP) を一鎖の仮定と一般政策パラメーター化の下で検討する。
本研究では,マルチレベルモンテカルロ推定器と,混合時間オークルを必要とせず,一鎖動力学を扱う明示的なバーンイン機構を活用する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:54:02 GMT)
MePo: Meta Post-Refinement for Rehearsal-Free General Continual Learnin [47.2] PTMs-based General Continual Learning (GCL) のためのMeta Post-Refinement (MePo) という革新的なアプローチを導入する。
MePoは、事前学習データから擬似タスクシーケンスを構築し、事前訓練されたバックボーンを洗練するための双方向メタラーニングパラダイムを開発する。
MePoはプラグイン戦略として機能し、さまざまなGCLベンチマークや事前訓練されたチェックポイントで大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:15:35 GMT)
Patches of Nonlinearity: Instruction Vectors in Large Language Models [47.1] 本研究では,ポストトレーニングの異なる段階において,命令固有の表現がどのように構築され,活用されるかを検討する。
命令表現はモデルにかなり局所化されている。
非線形因果相互作用を解消するために,言語モデルに情報処理をローカライズする手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:56:39 GMT)
Time Series Reasoning via Process-Verifiable Thinking Data Synthesis and Scheduling for Tailored LLM Reasoning [46.7] データ合成、データスケジューリング、RLトレーニングを通じて、時系列推論のための大規模言語モデルをカスタマイズするフレームワークであるVeriTimeを紹介した。
大規模な実験により、VeriTime は様々な時系列推論タスクにおける LLM のパフォーマンスを大幅に向上させることが示された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:42:35 GMT)
VideoTemp-o3: Harmonizing Temporal Grounding and Video Understanding in Agentic Thinking-with-Videos [44.2] 長時間の理解では、一様フレームサンプリングはしばしば重要な視覚的証拠を捉えず、性能が低下し幻覚が増大する。
最近のエージェント思考とビデオのパラダイムが出現し、ローカライズ・クリップ・アンサー・パイプラインが採用されている。
我々は,ビデオグラウンドと質問応答を共同でモデル化する統合型エージェント思考・ビデオフレームワークであるVideoTemp-o3を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:45:50 GMT)
Adjustment of Cluster-Then-Predict Framework for Multiport Scatterer Load Prediction [42.0] マルチポート散乱器における相互依存負荷値の予測は, インピーダンスと散乱能力の複雑な依存性と高次元性により困難である。
マルチポート散乱器における複数負荷値予測のための2段階クラスタ列予測フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:26:05 GMT)
Fast Model Selection and Stable Optimization for Softmax-Gated Multinomial-Logistic Mixture of Experts Models [40.2] 我々は,ソフトマックスゲート型マルチミリ波観測用MoEのバッチ最小化最適化アルゴリズムを開発した。
また,条件密度推定とパラメータ回復のための有限サンプル率も証明した。
生物学的タンパク質-タンパク質相互作用予測実験は、完全なパイプラインを検証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:45:41 GMT)
GAAVI: Global Asymptotic Anytime Valid Inference for the Conditional Mean Function [40.1] CMFグローバルヌルに対する新しい有効値テストを提供する。
CMFに対する機能評価信頼度の構築方法とそのコントラストについて述べる。
本手法は, 連続監視下での名目誤差率を保ちながら, 様々な分布に対してよく機能する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:34:18 GMT)
Learning While Staying Curious: Entropy-Preserving Supervised Fine-Tuning via Adaptive Self-Distillation for Large Reasoning Models [39.7] 大規模推論モデルの標準学習レシピは、教師付き微調整と強化学習(SFT-then-RL)によってRLステージの利点を制限できる可能性がある。
固有好奇性による探索能力の向上を目的としたエントロピー保存型SFT法であるCurioSFTを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 01:59:23 GMT)
Data Darwinism Part I: Unlocking the Value of Scientific Data for Pre-training [39.1] データモデル共進化を概念化した10レベルの分類法であるデータダーウィン主義を紹介する。
900BのコーパスであるDarwin-Scienceを構築し,学術文献でこれを検証した。
我々はDarwin-Science corpusとdaci-originモデルをリリースし、原則的、共同進化的開発を可能にします。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:06:34 GMT)
Recurrent-Depth VLA: Implicit Test-Time Compute Scaling of Vision-Language-Action Models via Latent Iterative Reasoning [38.8] リカレントディープスVLA(Recurrent-Depth VLA)は、明示的なトークン生成ではなく、遅延反復精製による計算適応性を実現するアーキテクチャである。
RD-VLAは、メモリフットプリントが一定である任意の推論深度をサポートするリカレントで重み付けされたアクションヘッドを使用している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 07:21:01 GMT)
A Unified Density Operator View of Flow Control and Merging [37.9] 本稿では,制約ケースとして仮定し,報酬誘導型フローマージを可能にする統一確率空間フレームワークを提案する。
また、リワードガイドフローマージング(RFM)を導入し、報酬誘導フローマージングを標準的な微調整問題に還元するミラー発光方式を提案する。
RFMによる報酬誘導と純フローマージの第一種理論的保証を提供する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:27:28 GMT)
ViT-5: Vision Transformers for The Mid-2020s [37.4] ViT-5は理解と生成のベンチマークで最先端のビジョントランスフォーマーを上回っている。
ViT-5は、生成モデリングの強力なバックボーンとしても機能する。
現代のファウンデーションモデルのプラクティスに合わせた設計で、VT-5は2020年代半ばのビジョンバックボーンのためにバニラVTに簡単なアップグレードを提供する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:03:44 GMT)
Compiler-Assisted Speculative Sampling for Accelerated LLM Inference on Heterogeneous Edge Devices [37.0] リソース制約のあるエッジデバイス上のLLMデプロイメントは、厳しいレイテンシ制約に直面している。
この研究は、不均一なハードウェア構成を探索し、LLMサブグラフの粗粒度パーティショニングをガイドする分析コストモデルを用いている。
このモデルは、投機サンプリングとヘテロジニアス実行が共同で有用であると予測し、ヘキサコアのCortex-A CPUとMali GPUを備えたエッジデバイスで検証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:09:51 GMT)
SoulX-Singer: Towards High-Quality Zero-Shot Singing Voice Synthesis [37.0] 本稿では,SVS(SoulX-Singer)システムについて紹介する。
SoulX-Singerは、シンボリック・ミュージック・スコア(MIDI)やメロディック・表現に基づいて、制御可能な歌声生成をサポートする。
様々な音楽条件下で、言語間の最先端の合成品質を一貫して達成する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:51:23 GMT)
ReRoPE: Repurposing RoPE for Relative Camera Control [36.2] 本稿では、相対カメラ情報を事前学習したビデオ拡散モデルに組み込むプラグイン・アンド・プレイフレームワークReRoPEを紹介する。
我々は,カメラ制御精度と映像忠実度の観点から,映像対映像(I2V)タスクと映像対映像(V2V)タスクの両方について評価を行った。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:49:10 GMT)
Reactive Knowledge Representation and Asynchronous Reasoning [35.6] 複素確率モデルにおける厳密な推論は、しばしば禁止的な計算コストを引き起こす。
既存の手法は、どの変更でもモデル全体を再評価するため、継続する推論には非効率であることが多い。
まず、確率論的論理とリアクティブプログラミングを融合した確率論的プログラミング言語であるRetinを紹介します。
レジンの効率的かつ正確なセマンティクスを提供するために,反応回路(RC)を提案する。
高忠実度ドローン群シミュレーションにおいて,本手法は周波数非依存推論よりも数桁の高速化を実現する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:07:08 GMT)
MemFly: On-the-Fly Memory Optimization via Information Bottleneck [35.4] 長期記憶により、大きな言語モデルエージェントは歴史的相互作用を通じて複雑なタスクに取り組むことができる。
既存のフレームワークは、冗長な情報を効率よく圧縮し、下流タスクの正確な検索を維持するというジレンマに遭遇する。
MemFlyは、LLMのオンザフライメモリ進化を促進する情報ボトルネックの原則に基づくフレームワークである。
MemFlyは、メモリコヒーレンス、応答忠実度、精度において最先端のベースラインを大幅に上回る。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:37:25 GMT)
DIAL-SUMMER: A Structured Evaluation Framework of Hierarchical Errors in Dialogue Summaries [34.9] 対話要約評価に関する先行研究は、この課題に特有の複雑さをほとんど無視している。
対話要約を包括的に評価するために,DIAL-SUMMERの誤り分類法を提案する。
我々はこれらの注釈付き誤りを実証分析し、興味深い傾向を観察する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:46:22 GMT)
Accelerating Social Science Research via Agentic Hypothesization and Experimentation [33.6] ExPERIGENは、ベイズ最適化によって2相探索にインスパイアされたエンドツーエンド発見を運用するフレームワークである。
より統計的に有意な仮説が2~4倍の確率で発見され、従来の手法よりも7~17%の確率で予測できる。
LLM産生仮説の最初のA/B試験を行い, 統計的に有意な結果を示した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:20:56 GMT)
Free(): Learning to Forget in Malloc-Only Reasoning Models [33.1] 本稿では,Free-Moduleを介し,本質的な自己鍛造機能を導入するモデルであるFree()LMを提案する。
Free()LMはすべてのモデルスケールで一貫した改善を提供します。
最上位の推論基準よりも平均3.3%向上している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:04:23 GMT)
LOCA-bench: Benchmarking Language Agents Under Controllable and Extreme Context Growth [32.2] 大規模言語モデル(LLM)は、長期の現実世界のタスクを実行する能力がますます高まっている。
文脈の量が増えるにつれて、その信頼性はしばしば悪化し、これは"context rot"と呼ばれる現象である。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:20:39 GMT)
Towards Adaptive, Scalable, and Robust Coordination of LLM Agents: A Dynamic Ad-Hoc Networking Perspective [31.8] RAPSは、LLMエージェントの適応性、拡張性、堅牢な調整のための、評判の高いパブリッシュ・サブスクライブ・パラダイムである。
RAPSは2つの一貫性のあるオーバーレイを組み込んでいる: (i) リアクティブ・サブスクライブ(reactive Subscription) エージェントがその意図を動的に洗練することを可能にし、 (ii) ベイジアン・レピュテーション(Bayesian Reputation)。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:26:02 GMT)
SiameseNorm: Breaking the Barrier to Reconciling Pre/Post-Norm [31.4] 現代のトランスフォーマーは主に最適化の安定性のためにプレノームパラダイムを採用しており、不安定なポストノームアーキテクチャの優れた可能性を予見している。
我々は、Pre-NormのようなストリームとPost-Normのようなストリームを共有パラメータで結合する2ストリームアーキテクチャであるSiameseNormを提案する。
この設計は2つのストリームの最適化のダイナミクスを分離し、Pre-NormとPost-Normの両方の特徴を維持している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:17:56 GMT)
LLMs Know More About Numbers than They Can Say [31.2] 我々は、いくつかの小さなオープンソース LLM の隠れ状態について調査する。
適切な隠蔽層の1つの線形射影は、両方の種類の数字の対数マグニチュードを符号化する。
分類器プローブのログロスを微調整の補助目的として組み込むことにより,ベースモデルよりも3.22%の精度が向上することを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 04:15:24 GMT)
Sharp analysis of linear ensemble sampling [31.1] アンサンブルサイズが$m=(dlog n)$の場合、ES は $tilde O(d3/2sqrt n)$ High-probability regret を達成する。
この証明は、線形包帯におけるランダム化探索の新しい視点をもたらす。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:58:36 GMT)
SRR-Judge: Step-Level Rating and Refinement for Enhancing Search-Integrated Reasoning in Search Agents [30.9] SRR-Judgeは、推論と探索行動の信頼性の高い段階評価のためのフレームワークである。
SRR-Judgeは、探索積分推論のためのきめ細かいガイダンスを提供し、効率的な後トレーニングアノテーションを可能にする。
SRR-Judgeは、DeepSeek-V3.1のようなより大きなモデルよりも信頼性の高いステップレベルの評価を提供する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 02:07:41 GMT)
HypRAG: Hyperbolic Dense Retrieval for Retrieval Augmented Generation [30.7] HyTE-FHとHyTE-Hは、事前訓練されたユークリッド埋め込みを双曲空間に投影する双曲表現である。
外向きアインシュタイン中間点(英: Outward Einstein Midpoint)は、階層構造を確実に保存する幾何学的なプーリング作用素である。
また,本分析により,ハイパボリック表現はノルムに基づく分離によって文書の特異性を符号化することが明らかとなった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 00:18:05 GMT)
The CAPSARII Approach to Cyber-Secure Wearable, Ultra-Low-Power Networked Sensors for Soldier Health Monitoring [30.6] CAPSARIIは、兵士の生理的、心理的ステータスを監視する革新的なウェアラブルシステムとInternet of Battlefield Things(IoBT)フレームワークを提案する。
CAPSARIIシステムは, 生理的, 運動的, 環境的パラメータを監視することにより, 状況認識と運用効率を高める。
この革新的なアプローチは、堅牢でデータ駆動の意思決定支援ツールを提供することで、軍事作戦を変革することを目指している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:51:32 GMT)
Back to Physics: Operator-Guided Generative Paths for SMS MRI Reconstruction [30.4] 面内アンダーサンプリングを併用した同時マルチスライス(SMS)イメージングにより,MRIの高速化が可能となった。
本稿では、既知の取得演算子を用いて劣化軌道をモデル化する演算子誘導フレームワークを提案する。
本フレームワークでは,演算子-条件付きデュアルストリームインタラクションネットワーク(OCDI-Net)を導入し,ターゲット-スライスコンテンツをスライス間干渉から明示的に分離する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 04:57:39 GMT)
TDGNet: Hallucination Detection in Diffusion Language Models via Temporal Dynamic Graphs [30.3] 拡散言語モデル (D-LLMs) は並列化と双方向のコンテキストを提供する。
D-LLMsの幻覚検出は未発見のままである。
本稿では,トークンレベルの注目グラフを進化させる学習として幻覚検出を定式化する時間動的グラフフレームワークであるTDGNetを紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:35:30 GMT)
DICE: Disentangling Artist Style from Content via Contrastive Subspace Decomposition in Diffusion Models [29.8] DICEは、オンザフライのアーティストスタイルの消去のためのトレーニング不要のフレームワークである。
我々は、潜在空間におけるスタイルと非スタイルの特徴を区別するためにモデルを強制するために、対照的な三重項を構築する。
実験により,DICEはスタイル消去の完全性とコンテンツ完全性維持のバランスが良好であることを実証した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:06:48 GMT)
Adaptive Acquisition Selection for Bayesian Optimization with Large Language Models [29.4] LMABOは、事前訓練されたLarge Language ModelをBOプロセスのゼロショットオンラインストラテジストとしてキャストする、新しいフレームワークである。
LLMの動作は、リアルタイムの進行に適応する包括的な戦略であり、その優位性を証明することは、完全な最適化状態を処理し、効果的で適応的なポリシーに合成する能力に起因していることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:53:52 GMT)
From $O(mn)$ to $O(r^2)$: Two-Sided Low-Rank Communication for Adam in Distributed Training with Memory Efficiency [28.9] 我々は,Adamファミリー更新(TSR-Adam)における双方向低ランク通信を実現するTSRを提案する。
サブスペースリフレッシュからのピーク通信をさらに削減するため、TSR-AdamはSVDベースのリフレッシュを採用した。
TSR-Adamは60Mから1Bのモデルスケールで事前トレーニングを行い、ステップ毎の平均通信バイトを13倍に削減し、GLUEの微調整では通信を25倍に削減し、同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:23:09 GMT)
MIND: Benchmarking Memory Consistency and Action Control in World Models [28.3] 我々は、WarrlDモデルにおけるメモリ一貫性とアクションcoNtrolを評価するための、最初のオープンドメインクローズドループ再検討ベンチマークであるMINDを紹介する。
MINDには1080pと24FPSの高画質ビデオが250本あり、その中には100本(ファーストパーソン)+100本(サードパーソン)のビデオクリップが共有アクションスペースの下に置かれている。
共有シーン下でのアクション空間間のアクション一般化能力を評価するために,キャラクタ移動速度やカメラ回転角など,さまざまなアクション空間を設計する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:57:23 GMT)
FlashVID: Efficient Video Large Language Models via Training-free Tree-based Spatiotemporal Token Merging [28.0] FlashVIDはビデオ大言語モデル(VLLM)のためのトレーニング不要のアクセラレーションフレームワークである
基本的なビデオ表現のために最も代表的なトークンを選択し、その後、微細な時間的冗長性にTree-based Stemporal Tokenging (TSTM)を適用する。
FlashVIDは、長いビデオフレームを拡張するためのトレーニングフリーでプラグアンドプレイモジュールとして機能し、Qwen2.5-VLに入力されるビデオフレームを10倍増やすことができる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:56:46 GMT)
Exposing Vulnerabilities in Explanation for Time Series Classifiers via Dual-Target Attacks [27.8] 解釈可能な時系列深層学習システムは、しばしば説明の時間的一貫性をチェックすることによって評価される。
予測と説明は逆の分離が可能であることを示し、ターゲットの誤分類を可能にする。
本稿では,分類器と説明器の出力を協調的に操作するマルチターゲット攻撃であるTSEF(Time Series Explanation Fooler)を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:37:28 GMT)
SPD-Faith Bench: Diagnosing and Improving Faithfulness in Chain-of-Thought for Multimodal Large Language Models [27.8] 連鎖推論は多モーダルな大言語モデルの解釈可能性を改善するために広く用いられている。
それまでの研究は主に知覚の幻覚に焦点を合わせており、推論レベルは未発見のままである。
SPD-Faith Benchは、微細な画像差分推論に基づく診断ベンチマークである。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:47:53 GMT)
CausalTAD: Injecting Causal Knowledge into Large Language Models for Tabular Anomaly Detection [25.9] 異常検出のための大規模言語モデルに因果知識を注入するCausalTaDを提案する。
30以上のデータセットにまたがる実験により、我々の手法は現在の最先端の手法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:28:19 GMT)
Still Manual? Automated Linter Configuration via DSL-Based LLM Compilation of Coding Standards [25.3] LintCFGはドメイン固有言語(LLM)によるコンパイルアプローチで、linter設定生成を自動化する。
コンパイラ設計に触発されて、私たちはまず、ツールに依存しない、構造化され、読みやすく、正確な方法でコーディングルールを表現するDSLを設計します。
特定の自然言語コーディング標準に対して、コンパイルプロセスはそれをDSLコーディング標準に解析し、DSL設定命令とマッチングし、最終的にlinter固有の構成を生成する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 02:57:47 GMT)
Multimodal Information Fusion for Chart Understanding: A Survey of MLLMs -- Evolution, Limitations, and Cognitive Enhancement [25.1] MLLM(Multimodal Large Language Models)は、チャート情報融合を変換する。
本調査は,MLLMがグラフ情報融合をどのように変換しているかを構造化された理解を得ることを目的としている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:59:50 GMT)
Recovering 3D Shapes from Ultra-Fast Motion-Blurred Images [25.1] 本稿では,超高速モーションブル画像からの形状復元のための新しい逆レンダリング手法を提案する。
そこで本研究では,計算オーバーヘッドを大幅に低減し,最大4.57倍の高速化を実現する高速な偏心座標解法を提案する。
本手法は完全に微分可能であり, 描画画像から下層の3次元形状へ勾配が伝播し, 逆レンダリングによる形状回復を容易にする。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:17:35 GMT)
One-Shot Crowd Counting With Density Guidance For Scene Adaptaion [25.0] 既存の群衆モデルには、目に見えない監視シーンに対する限定的な一般化がある。
モデルの一般化を改善するため、異なる監視シーンを異なるカテゴリシーンとみなす。
本研究では,局所的およびグローバルな密度特性を活用して,見知らぬ監視シーンの群集数モデルを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:58:47 GMT)
Thinking Makes LLM Agents Introverted: How Mandatory Thinking Can Backfire in User-Engaged Agents [23.8] 思考の誘導による複雑なタスクにおける大規模言語モデル(LLM)の性能向上のための強力な手法として、推論の緩和が登場した。
本研究は,LLMエージェントの明示的思考効果に関する総合的研究である。
ユーザを巻き込んだ設定では,必須思考がエージェントのバックファイアを引き起こし,異常なパフォーマンス低下の原因となることが分かっています。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:23:22 GMT)
Diverge to Induce Prompting: Multi-Rationale Induction for Zero-Shot Reasoning [23.6] Diverge-to-Induce Prompting (DIP) は、まず大きな言語モデルに質問毎に複数の高いレベルの論理を生成するよう促すフレームワークである。
それぞれの根拠は、詳細かつステップバイステップのドラフトプランに詳述され、最後に、これらのドラフトプランは最終計画に誘導されます。
実験により,DIPは単一ストラテジー・プロンプトよりも優れており,プロンプトに基づく推論におけるマルチプラン・インジェクションの有効性が示された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:02:35 GMT)
A Kinetic-Energy Perspective of Flow Matching [23.4] フローベースの生成モデルは、物理レンズを通して見ることができる。
古典力学に動機づけられたKPE(Kineetic Path Energy)を紹介する
極端エネルギーがトレーニング例のほぼコピーに向かって軌道を推し進めていることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:51:50 GMT)
Explainable LLM Unlearning Through Reasoning [23.1] これらの問題は、モデルがいつ、どのように解放されるべきかについて、明確なガイダンスがないことに起因する、と私たちは主張する。
本研究では,学習対象の特定範囲と学習後応答を満足する新たな未学習対象,推論に基づく未学習対象を提案する。
一般的な能力を維持しながら、より信頼性の高いアンラーニングを実現していることがわかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 06:33:07 GMT)
Geo-Code: A Code Framework for Reverse Code Generation from Geometric Images Based on Two-Stage Multi-Agent Evolution [22.3] マルチエージェントシステムに基づく幾何画像のための最初の逆プログラミングフレームワークであるGeo-coderを提案する。
提案手法は,画素アンカーとメートル法駆動のコード進化による幾何学的モデリングに革新的に分離する。
実験により,ジオコーダは幾何再構成精度と視覚的整合性の両方に大きく貢献することが示された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 00:48:49 GMT)
Learning to Continually Learn via Meta-learning Agentic Memory Designs [22.1] ALMA(Automated Meta-Learning of Memory Design for Agentic Systems)は、手作業によるメモリ設計を置き換えるために、メモリ設計をメタ学習するフレームワークである。
提案手法では,実行可能コードとして表現されたメモリ設計をオープンな方法で検索するメタエージェントを用いる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 01:20:49 GMT)
IRB: Automated Generation of Robust Factuality Benchmarks [21.2] IRBは、RAGシステムの事実を評価するためのベンチマークを自動的に生成するフレームワークである。
我々はIRBを用いて、ベンチマークを構築し、フロンティアLSMとレトリバーを評価する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:01:43 GMT)
Cross-Linguistic Persona-Driven Data Synthesis for Robust Multimodal Cognitive Decline Detection [20.6] 我々は、制御可能なゼロショットマルチモーダルデータ合成とChain-of-Thought deductionファインチューニングを統合する新しいフレームワークであるSynCogを紹介する。
この生成パラダイムは、様々な言語にまたがる臨床コーパスの迅速でゼロショット展開を可能にする。
ADReSSとADReSSoベンチマークの実験は、限られた臨床データを合成表現型で増強することで、競争力のある診断性能が得られることを示した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:10:05 GMT)
rePIRL: Learn PRM with Inverse RL for LLM Reasoning [20.5] rePIRLは、専門家ポリシーに関する最小限の仮定で効果的なPRMを学ぶ、逆RLにインスパイアされたフレームワークである。
提案する学習フレームワークは,オンライン学習とオフライン学習の両方を統合可能であることを示す。
また、テストタイムトレーニング、テストタイムスケーリング、および難しい問題をトレーニングするための早期信号の提供において、トレーニング済みのPRMの応用を示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:47:27 GMT)
Generative AI in Action: Field Experimental Evidence from Alibaba's Customer Service Operations [20.4] 本研究では、大規模フィールド実験を活用し、eコマースアフターセールサービスにおける生産AIアシスタントが労働者のパフォーマンスに与える影響を評価する。
Gen AIは、イシュー識別時間とチャット時間によって、サービス速度を大幅に改善した。
顧客再審率によって示される客観的サービス品質に有意な影響を及ぼすことはなかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:41:01 GMT)
Rethinking the Value of Agent-Generated Tests for LLM-Based Software Engineering Agents [20.3] 大規模言語モデル(LLM)コードエージェントは、コードの反復的な編集、ツールの呼び出し、候補パッチの検証によって、リポジトリレベルの問題を徐々に解決している。
エージェントはしばしばテストを書くが、これはSWEベンチのリーダーボード上で多くの上級エージェントが採用しているパラダイムである。
このようなテストが問題解決を有意義に改善したのか、それとも、実際の相互作用予算を消費しながら、単に人間のテストプラクティスを模倣しただけなのか。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:26:31 GMT)
CyberExplorer: Benchmarking LLM Offensive Security Capabilities in a Real-World Attacking Simulation Environment [19.8] CyberExplorerは、現実世界のCTF課題から派生した40の脆弱なWebサービスをホストする仮想マシン上に構築された、オープンな環境ベンチマークである。
フラグのリカバリ,インタラクションダイナミクスのキャプチャ,コーディネーション動作,障害モード,脆弱性検出信号といった,詳細な評価が可能になる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:56:22 GMT)
Disentangled Instrumental Variables for Causal Inference with Networked Observational Data [19.6] 本稿では,潜在共同設立者とのネットワーク観測データに基づく因果推論手法を提案する。
DisIVはネットワークの均一性を誘導バイアスとして利用し、遅延IVとして機能する個々の特定の成分を抽出するために構造的非絡み合い機構を用いる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 01:45:21 GMT)
Open-Text Aerial Detection: A Unified Framework For Aerial Visual Grounding And Detection [19.5] OVAD(Open-Vocabulary Aerial Detection)とRSVG(Remote Sensing Visual Grounding)は,航空シーン理解のための2つの重要なパラダイムとして登場した。
両パラダイムを結合型アーキテクチャにブリッジする最初の統一フレームワークであるOTA-Detを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:29:01 GMT)
Understanding and Guiding Layer Placement in Parameter-Efficient Fine-Tuning of Large Language Models [19.4] 大規模言語モデル(LLM)は成長を続けており、パラメータ効率の良い微調整が下流適応のデフォルト戦略となっている。
現在のプラクティスは一般的に、すべてのレイヤに対してPEFTを統一的に適用し、レイヤの選択を限定的に理解または活用する。
本稿では,凍結ベースモデル上でPEFTの統一的残差ビューを開発する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 01:19:37 GMT)
A second order regret bound for NormalHedge [19.3] NormalHedgeの変種が$Obig(sqrtV_T log(V_T/)bigの2階の$-quantileの後悔境界を楽しむことを示す。
V_T$は、アルゴリズムに関して平均された、経験者ごとの即時後悔の累積2番目のモーメントである。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:57:36 GMT)
UniRank: End-to-End Domain-Specific Reranking of Hybrid Text-Image Candidates [19.2] テキストリランカは、画像候補よりも本質的にテキスト候補に近づき、バイアスと準最適のクロスモーダルランキングをもたらす。
モダリティ変換を伴わないハイブリッドテキストイメージ候補のスコア付けと順序付けを行う,VLMベースのリグレードフレームワークであるUniRankを提案する。
科学文献検索とデザイン特許検索の実験は、UniRankが最先端のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:39:19 GMT)
Optimal Decision-Making Based on Prediction Sets [18.9] 予測セットは、未知のテスト結果を保証された確率でカバーするために、任意のMLモデルをラップすることができる。
本稿では,予測セットのカバレッジ保証と一致した最悪のケース分布に対する損失(リスク)を最小限に抑えるための決定理論フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 23:25:41 GMT)
CrossTraffic: An Open-Source Framework for Reproducible and Executable Transportation Analysis and Knowledge Management [18.8] CrossTrafficは、トランスポート方法論と規制知識を継続的にデプロイ可能で検証可能なソフトウェアインフラストラクチャとして扱う、オープンソースのフレームワークである。
CrossTrafficは、標準化されたインターフェースによるクロスプラットフォームアクセスによるトランスポート分析のための実行可能な計算コアを提供する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:30:27 GMT)
Deep Variable-Length Feedback Codes [18.7] 本稿では、学習フィードバックによる伝送長を動的に調整するフレキシブルコーディングフレームワークであるDeepVLF(Deep Variable-Length Feedback)のコーディングについて紹介する。
AWGNと5G-NRのフェージングチャネルに対する評価は、DeepVLFが最先端の学習フィードバックコードを大幅に上回っていることを示している。
同じブロックエラー率を20%から55%のチャネル使用率で達成し、特にハイレートなシステムでは、エラーフロアを桁違いに小さくする。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:20:16 GMT)
Enhancing Mathematical Problem Solving in LLMs through Execution-Driven Reasoning Augmentation [18.6] Iteratively Improved Program Construction (IIPC) は、プログラム的推論チェーンを反復的に洗練し、実行フィードバックをベースLLMのネイティブチェーン能力と組み合わせる推論手法である。
IIPCは、複数のベース LLM 上の推論ベンチマークの大部分において、競合するアプローチを上回っている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:47:27 GMT)
Selective Fine-Tuning for Targeted and Robust Concept Unlearning [18.0] 信頼は、標的となる概念ニューロンを動的に推定し、選択的な微調整によってそれらを学習する新しいアプローチである。
我々は,多くのSOTAベースラインに対して,TRUSTが敵のプロンプトに対して堅牢であることを示す。
本手法は,個々の概念だけでなく,特定の正規化を伴わずに,概念と条件付き概念の組み合わせの未学習を実現する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:34:21 GMT)
Pruning as a Cooperative Game: Surrogate-Assisted Layer Contribution Estimation for Large Language Models [17.8] レイヤーワイズプルーニングは推論コストを軽減するために一般的に使用される戦略である。
本稿では,協調ゲームとしてレイヤープルーニングを定式化するゲーム理論フレームワークを提案する。
大規模な言語モデルに対して、より効率的で効果的なレイヤワイドプルーニングを実現する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:51:36 GMT)
The Judge Who Never Admits: Hidden Shortcuts in LLM-based Evaluation [17.4] 大規模言語モデル(LLM)は、推論、質問応答、創造的記述といったタスクにおけるシステムの出力を評価するために、ますます使われてきている。
6つの判定モデルに対する評価プロンプトに挿入された制御キュー摂動合成メタデータラベルを用いて,この理想を検証した。
情報源,時間,年齢,性別,民族,教育的地位の6つのキュー族を調査する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:45:23 GMT)
StaTS: Spectral Trajectory Schedule Learning for Adaptive Time Series Forecasting with Frequency Guided Denoiser [17.2] StaTSは確率的時系列予測のための拡散モデルであり、更新の交互にノイズスケジュールと雑音を学習する。
複数の実世界のベンチマークの実験では、サンプリングステップが少なく、強いパフォーマンスを維持しながら、一貫した利得を示している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:42:59 GMT)
SVD-ViT: Does SVD Make Vision Transformers Attend More to the Foreground? [17.2] 視覚変換器(ViT)は大規模な基礎モデルとして確立されている。
本稿では,前景特徴の学習を優先するSVD-ViTを提案する。
実験により,本手法は分類精度を向上し,情報的前景表現を効果的に学習することを示した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:29:35 GMT)
Lookahead-then-Verify: Reliable Constrained Decoding for Diffusion LLMs under Context-Free Grammars [17.1] 本稿では,dLLMに特化して設計された制約付き復号法であるLAVEを提案する。
提案手法は,dLLMの鍵となる特性,すなわち前方通過時の全位置のトークン分布を予測する能力を利用する。
広く使用されている4つのdLLMと3つの代表的なベンチマークによる大規模な実験は、LAVEが既存のベースラインを一貫して上回り、構文的正確性を大幅に改善し、無視可能なランタイムオーバーヘッドを発生させることを示した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:22:03 GMT)
CausalCompass: Evaluating the Robustness of Time-Series Causal Discovery in Misspecified Scenarios [17.1] Causalは、時系列因果発見法の堅牢性を評価するために設計されたベンチマークスイートである。
我々は8つの仮定違反シナリオにまたがる代表的なTSCDアルゴリズムの広範なベンチマークを行う。
様々なシナリオで優れた全体的なパフォーマンスを示す方法は、ほとんどディープラーニングベースのアプローチである。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:27:06 GMT)
Which private attributes do VLMs agree on and predict well? [16.3] 本稿では,プライバシー関連属性認識のためのオープンソースのVisual Language Models (VLM) のゼロショット評価について述べる。
以上の結果から,人間のアノテーションに対して評価すると,VLMは人間のアノテーションよりもプライバシー属性の存在を予測しがちであることがわかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:57:00 GMT)
D-ORCA: Dialogue-Centric Optimization for Robust Audio-Visual Captioning [16.1] 音声対話はビデオの主要な情報源である。
D-ORCA (textbfdialogue-centric textbfomni-modal large language model) を導入する。
D-ORCAは、話者識別、音声認識、時間的接地において、既存のオープンソースモデルを大幅に上回っている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:16:33 GMT)
Picasso: Holistic Scene Reconstruction with Physics-Constrained Sampling [16.1] 物理制約のある再構成パイプラインを構築し,幾何,非ペネティフィケーション,物理を考慮した多目的シーン再構築を行う。
そこで本研究では,接点に富んだ実世界のシーン10点からなるPicassoデータセットを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:04:54 GMT)
Large language models for spreading dynamics in complex systems [15.6] 拡散力学は、複雑なシステムとネットワーク科学の物理学における中心的なトピックである。
大規模言語モデル(LLM)は、自然言語理解、推論、生成において強力な能力を発揮している。
LLMは伝播系に埋め込まれた対話的エージェントとして機能し、拡散経路やフィードバック構造に影響を与える可能性がある。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:58:43 GMT)
Continuity-driven Synergistic Diffusion with Neural Priors for Ultra-Sparse-View CBCT Reconstruction [15.3] コーンビームCT(CBCT)の臨床応用は,放射線照射と画質のトレードオフによって制限される。
線量を減らすために使用される超スパース角サンプリングは、深刻なアンダーサンプリングアーティファクトとスライス間不整合を導入している。
既存の復元手法は、角の連続性と空間的詳細忠実さのバランスをとるのに苦労することが多い。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:16:30 GMT)
Fields of The World: A Field Guide for Extracting Agricultural Field Boundaries [15.1] フィールドバウンダリマップは、農業データ製品のためのビルディングブロックであり、作物のモニタリング、収量推定、病気の推定をサポートする。
このチュートリアルでは、24カ国にまたがる1.6Mフィールドポリゴンのベンチマーク、事前訓練されたセグメンテーションモデル、コマンドライン推論ツールについて紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:32:33 GMT)
DINO-Mix: Distilling Foundational Knowledge with Cross-Domain CutMix for Semi-supervised Class-imbalanced Medical Image Segmentation [14.7] 半教師付き学習(SSL)は医用画像セグメンテーションにとって重要なパラダイムである。
SSLフレームワークは基本的に"内向き"である
マルチレベルの「外見」フレームワークへのパラダイムシフトを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 04:57:39 GMT)
A Dual-Loop Agent Framework for Automated Vulnerability Reproduction [14.7] CVE2PoCは,CVE記述から自動的に脆弱性を再現するフレームワークである。
CVE2PoCは617の現実世界の脆弱性をカバーするベンチマークで82.9%と54.3%の再現成功率を達成した。
人による評価では、生成されたPoCは可読性と再利用性において、人間によって書かれたエクスプロイトと同等のコード品質を実現する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 04:40:30 GMT)
Efficient Anti-exploration via VQVAE and Fuzzy Clustering in Offline Reinforcement Learning [14.0] Pseudo-countは、オフライン強化学習(RL)において、状態-作用ペアを数えることによる効果的な反探索手法である。
既存の反探索法は、これらのデータを離散化することで連続した状態-作用対をカウントするが、しばしば次元的災害や情報損失の問題に悩まされる。
本稿では,ベクトル量子化変分オートエンコーダ(VQVAE)とファジィクラスタリングに基づく新しいアンチサーベイ手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:42:06 GMT)
Feasibility-Guided Planning over Multi-Specialized Locomotion Policies [14.0] 本稿では,複数の地形特異的ポリシーをうまく組み込んだ実現可能性誘導型計画フレームワークを提案する。
提案手法は, 多様な, 挑戦的な地形にまたがる信頼性の高い計画を効率的に生成すると同時に, 基礎となる政策の能力と一貫して一致させる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:58:50 GMT)
Rich-ARQ: From 1-bit Acknowledgment to Rich Neural Coded Feedback [14.0] 送信機と受信機間の協調的な物理層チャネル符号化のためのニューラルネットワークフィードバックを導入するパラダイムであるRich-ARQを提案する。
我々は,フィードバック遅延の停止を排除し,チャネル変動に動的に対応し,デバイス上でのデプロイメントに適した軽量エンコーダを特徴とする,新しい非同期フィードバックコードを開発した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:37:42 GMT)
Attn-GS: Attention-Guided Context Compression for Efficient Personalized LLMs [13.0] 大規模言語モデル(LLM)を個々のユーザにパーソナライズするには、広範なインタラクション履歴とプロファイルを組み込む必要がある。
既存のアプローチは、最近のインタラクションの選択や、ユーザプロファイルを圧縮するための要約モデルなどの方法に依存している。
LLMの注意パターンが知的文脈圧縮のための重要なパーソナライズ信号を効果的に識別できるかどうかを検討する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 02:31:15 GMT)
LQA: A Lightweight Quantized-Adaptive Framework for Vision-Language Models on the Edge [12.8] 視覚言語モデル(VLM)のための軽量で量子化された適応型フレームワークを提案する。
本稿では、SHQ(Selective Hybrid Quantization)と、リソース制約のあるハードウェア上での堅牢で効率的なVLMデプロイメントを実現するために、量子化・勾配なし適応機構を導入する。
実験の結果、LQAは全体の適応性能を4.5%改善し、メモリ使用量を減らし、勾配ベースのTTA法よりも大幅に向上した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 07:37:37 GMT)
Anonymization-Enhanced Privacy Protection for Mobile GUI Agents: Available but Invisible [12.7] Mobile Graphical User Interface (GUI)エージェントは、複雑なスマートフォンタスクを自動化する強力な機能を示している。
本稿では,機密データへのアクセスの原則を強制する匿名化に基づくプライバシー保護フレームワークを提案する。
本システムは,PII認識モデルを用いてセンシティブなUIコンテンツを検出し,それを決定論的型保存プレースホルダーに置き換える。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:50:04 GMT)
Constrained Pricing under Finite Mixtures of Logit [12.6] 制約付き価格問題について,多項・混合ロジット需要モデルを用いて検討する。
有限混合ロジットによる制約付き価格設定は,顧客セグメント数が制限された場合にPTASを許容することを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:48:50 GMT)
GRAFT: Decoupling Ranking and Calibration for Survival Analysis [12.4] GRAFT(英語版)は、校正から予後を分離する新しい AFT モデルである。
GRAFTのハイブリッドアーキテクチャは、線形AFTモデルと非線形残留ニューラルネットワークを組み合わせるとともに、自動的なエンドツーエンドの特徴選択のためのゲートを統合する。
公的なベンチマークでは、GRAFTは差別とキャリブレーションにおいてベースラインよりも優れ、高ノイズ環境では頑丈でスパースである。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:32:24 GMT)
Evaluating the Impact of Post-Training Quantization on Reliable VQA with Multimodal LLMs [12.4] 学習後量子化(PTQ)圧縮が視覚質問応答(VQA)の精度と信頼性に与える影響について検討する。
我々は、量子化されたマルチモーダル設定に対してセレクタ信頼度推定器を適用し、そのロバスト性を様々な量子化レベルとアウト・オブ・ディストリビューション(OOD)シナリオでテストする。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:06:24 GMT)
HerAgent: Rethinking the Automated Environment Deployment via Hierarchical Test Pyramid [12.1] 環境設定の成功は、単一のバイナリ信号ではなく、実行可能なエビデンスによって評価されるべきである。
本稿では,実行環境を段階的に構築する自動環境設定手法であるHerAgentを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:57:05 GMT)
Rethinking Latency Denial-of-Service: Attacking the LLM Serving Framework, Not the Model [12.0] 大規模言語モデルは、レイテンシーアタックとして知られる、新しくて重要な脅威に直面します。
推論は本質的に高価であるため、控えめなスローダウンでさえ、相当な運用コストと深刻な可用性リスクに変換される可能性がある。
本研究では,スケジューラの状態遷移をターゲットとした新たなFill and Squeeze攻撃戦略を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:05:54 GMT)
Evaluating and Calibrating LLM Confidence on Questions with Multiple Correct Answers [11.8] 既存のトレーニングフリー手法は,複数の有効な回答が存在する場合に故障することを示す。
本稿では,複数の高確率サンプル応答に対する信頼を集約するセマンティック信頼集約(SCA)を提案する。
SCAは、単一質問に対する強いキャリブレーションを維持しながら、混合回答設定下での最先端のキャリブレーション性能を達成する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 07:03:27 GMT)
VidVec: Unlocking Video MLLM Embeddings for Video-Text Retrieval [11.5] 本稿では,ビデオテキストの埋め込みと検索にMLLMを活用することに焦点を当てる。
まず,中間層(事前学習)MLLM層がすでにタスク関連情報を有意にエンコードしていることを示す。
我々は,中間層埋め込みと校正MLLMヘッドを組み合わせることで,トレーニングなしで強力なゼロショット検索性能が得られることを示した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:39:32 GMT)
Rethinking Code Complexity Through the Lens of Large Language Models [11.5] 大規模言語モデル(LLM)の観点から設計した新しい符号複雑性計量であるLM-CCを提案する。
実験の結果,LM-CCは従来の指標よりもLLM性能と強く相関するだけでなく,タスク性能の低下も直接的に向上することがわかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:20:20 GMT)
Rethinking Practical and Efficient Quantization Calibration for Vision-Language Models [11.4] トレーニング後の量子化(PTQ)は、微調整なしで大規模言語モデルをデプロイするための主要なアプローチである。
token-level Importance-aware Layer-wise Quantization framework (TLQ)を提案する。
TLQは2つのモデル、3つのモデルスケール、および2つの量子化設定で評価され、すべての設定で一貫してパフォーマンス改善が達成される。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:19:25 GMT)
Harpoon: Generalised Manifold Guidance for Conditional Tabular Diffusion [11.4] 我々は、様々な推論時間目的を扱うために多様体理論を拡張した。
ハープーンは、多様体幾何学に沿って制約のないサンプルを誘導し、推論時に様々な条件を満たす。
我々は,不等式制約の実施などの課題に対して,我々の理論的貢献を実証的に検証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:03:04 GMT)
Draft-Conditioned Constrained Decoding for Structured Generation in LLMs [11.3] 制約デコーディングは、モデルが有効な継続に低確率質量を割り当てたときに生成を歪めることができる。
本稿では,構造的強制からセマンティックプランニングを分離する訓練自由推論手法であるemphDraft-Conditioned Constrained Decoding (DCCD)を提案する。
我々は,KLプロジェクションビューを用いてDCCDを解析し,ドラフト条件が実現可能な質量を増大させ,ハード制約による累積的な「投射税」を減少させることを示した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:52:24 GMT)
Real-Time Magnetic Field Sensing based on Microwave Frequency Modulated Photocurrent of Nitrogen-Vacancy Centers in Diamond [11.0] 磁気共鳴(PDMR)の光電検出は、窒素空孔(NV)中心型量子センサの小型化に応用できる。
ダイヤモンド試料を電極とマイクロ波アンテナで表面上に作製し,様々なロックイン増幅モードを用いてナノアンペア領域の光電流を検出することによりPDMRを実現する。
直流10Hz帯の397 nT/Hzと921 nT/Hzの感度をレーザー強度とマイクロ波周波数モードでそれぞれ測定し、標準の交互磁界のリアルタイム追跡を初めて実証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:50:05 GMT)
Emergent Misalignment is Easy, Narrow Misalignment is Hard [10.9] 狭く有害なデータセットで大きな言語モデルを微調整すると、それらが突然不一致になる可能性がある。
本研究では,LLMにおける学習と一般化を規定する帰納的バイアスを事例研究として,創発的不適応(EM)を用いて検討する。
狭い解の線型表現も存在し、KL分散損失を導入することで学習することができる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 07:50:04 GMT)
When Is Compositional Reasoning Learnable from Verifiable Rewards? [10.5] RLVRトレーニングにおける自己回帰モデルにおける構成問題の学習可能性について検討する。
RLVRでは,適切な中間段階が明確な優位性をもたらす構成上の問題が効率的に学習可能であることを示す。
負の面では、構造上の利点が存在しない場合、RLVRは準最適組成に収束する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:31:54 GMT)
SAGE: Scalable AI Governance & Evaluation [10.2] textbfSAGEは、スケーラブルな評価信号として高品質な製品判断を運用するフレームワークである。
SAGEはLinkedIn Searchエコシステム内にデプロイされ、モデルバリエーションの増大を計測し、エンゲージメントメトリクスに見えない回帰を検出する、ポリシの監視に使用された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 06:42:50 GMT)
Enhancing Bandit Algorithms with LLMs for Time-varying User Preferences in Streaming Recommendations [10.2] HyperBandit+は、タイムアウェアなハイパーネットワークを統合して、タイムアレンジされたユーザの好みに適応する、新しいバンディットポリシーである。
HyperBandit+は、蓄積された報酬の観点から、最先端のベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:48:43 GMT)
The Benefits of Diversity: Combining Comparisons and Ratings for Efficient Scoring [9.9] 興味深いことに、どちらの形態の選好誘発も、一つの種類の焦点よりも優れていることが示される。
両信号から学習が可能な統一確率モデルであるSCoRaを紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:08:26 GMT)
Implicit Strategic Optimization: Rethinking Long-Horizon Decision-Making in Adversarial Poker Environments [9.7] Implicit Strategic Optimization(インプリシット・ストラテジック・最適化)は、大規模言語モデル(LLM)エージェントを学習するための予測フレームワークである。
我々は、文脈誤予測の数とともに支配的な用語がスケールする部分線型的文脈後悔と平衡収束を保証する。
6人プレイのNo-Limit Texas Hold'emとPokemonによる実験では、長期的なリターンが一貫した改善が見られた。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:17:46 GMT)
Learning-guided Kansa collocation for forward and inverse PDEs beyond linearity [9.6] 部分微分方程式は、物理的、生物学的、およびグラフィカルな現象をモデル化する際に正確である。
数値的な手法は次元性の呪い、高い計算コスト、ドメイン固有の離散化に悩まされる。
我々は、異なるPDEソルバの長所と短所を探索し、特定の科学シミュレーション問題に適用することを目的としている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:44:36 GMT)
FIRE: Frobenius-Isometry Reinitialization for Balancing the Stability-Plasticity Tradeoff [9.6] FIREは、安定性と塑性のトレードオフのバランスをとる、原則化された再初期化法である。
介入なしのナイーブトレーニングと、標準的な再起動方法の両方を一貫して上回ります。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:17:03 GMT)
Is Your Private Information Logged? An Empirical Study on Android App Logs [9.6] 当社は,Androidアプリのログの包括的なデータセットを構築し,Androidアプリのログにおけるプライバシリークの状況と深刻度を分析するための実証的研究を実施しています。
今回の研究では、ソフトウェアログに関するプライバシー問題と、Androidアプリのログにおけるプライバシー漏洩の頻度に関する、現実世界の開発者による懸念の5つのカテゴリが明らかになった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:56:48 GMT)
Test vs Mutant: Adversarial LLM Agents for Robust Unit Test Generation [9.4] LLM(Large Language Model)ベースの手法は、より可読性の高いテストを生成するが、しばしば低カバレッジとコンパイル性に悩まされる。
本稿では,LLMを用いたテストケース生成のための新しい逆フレームワークであるAdverTestを提案する。
提案手法は, 既存のLLM法よりも8.56%, EvoSuiteより63.30%, 故障検出率の向上を図っている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:34:30 GMT)
Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty [9.4] 大規模言語モデル(LLM)は、インテリジェントなモバイルサービスには大きな可能性を秘めているが、リソース制約のあるデバイスには計算集約的である。
モバイルエッジコンピューティング(MEC)は、そのようなデバイスがエッジサーバ(ES)に推論タスクをオフロードすることを可能にするが、通信とサーバサイドのキューによってレイテンシが生じる。
本稿では,ローカルで推論を行うか,ESにオフロードするかを動的に決定する不確実性を考慮したオフロードフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:03:03 GMT)
Research on a Camera Position Measurement Method based on a Parallel Perspective Error Transfer Model [9.3] スパース対応からのカメラポーズ推定はコンピュータビジョンの基本的な問題である。
並列視点近似に基づくカメラポーズ推定のための幾何学的誤差伝搬フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:40:14 GMT)
Gender and Race Bias in Consumer Product Recommendations by Large Language Models [9.3] 我々は,様々な人種・性別グループを対象とした大規模言語モデルから製品提案を引き出すために,プロンプトエンジニアリングを活用する。
以上の結果から,より公平なLLMレコメンデーションシステムの必要性が指摘され,人口集団のレコメンデーションに有意な差異が認められた。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:06:16 GMT)
Agent Skills: A Data-Driven Analysis of Claude Skills for Extending Large Language Model Functionality [9.2] エージェントスキルは、再利用可能なプログラムのようなモジュールで大きな言語モデル(LLM)エージェントを拡張する。
主要なマーケットプレースから40,285の公開スキルを大規模かつデータ駆動で分析する。
以上の結果から,コミュニティの注目度の変化を追及する短時間でスキルパブリッシュが発生する傾向が示唆された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:14:12 GMT)
Minimal nonintegrable models with three-site interactions [8.9] 最小の非可積分スピン-1/2$ハミルトニアンを、ハミルトニアン以外の非自明な局所保存電荷を認めつつ、射影率を飽和させるモデルとして定義する。
我々の結果は、最も近い隣のパラダイムを超えて、積分可能性と非可積分性の間に鋭い境界を定めている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:41:06 GMT)
Interpretable Failure Analysis in Multi-Agent Reinforcement Learning Systems [8.7] MARL(Multi-Agent Reinforcement Learning)は、安全上重要な領域にますます導入されている。
本稿では,3つの臨界故障解析タスクの解釈可能な診断を行うための2段階の勾配に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:55:26 GMT)
Don't Always Pick the Highest-Performing Model: An Information Theoretic View of LLM Ensemble Selection [8.3] 大規模言語モデル(LLM)は、全体的な信頼性と堅牢性を改善するために組み立てられることが多いが、実際には強い相関関係にある。
我々は、真のラベルと選択されたモデルの予測との相互情報の最大化として、予算化されたアンサンブル選択を定式化する。
そこで本研究では,データから直接必要な情報条件を推定する,単純な欲求相互情報選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:05:22 GMT)
Multimodal normative modeling in Alzheimers Disease with introspective variational autoencoders [7.5] mmSIVAEは、Mixture-of-Product-of-Expertsアグリゲーションと組み合わせたソフトイントロスペクティブな変分自動エンコーダである。
我々は、学習された健康分布からの距離として、潜伏空間と特徴空間の偏差スコアを計算する。
ADNI MRI領域の体積とアミロイドPET SUVRでは、mSIVAEはVAEベースラインよりも、より差別的な偏差スコアを生成する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:42:06 GMT)
Distributed Architecture Reconstruction of Polyglot and Multi-Repository Microservice Projects [7.4] 本稿では,技術固有の解析モジュールをサポートする静的アーキテクチャ再構築のための新しいフレームワークを提案する。
本稿では,抽出器の実行方法,データ間の転送方法,出力の統一方法,といった基本設計概念とアルゴリズムについて述べる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 23:59:19 GMT)
LLM Reasoning with Process Rewards for Outcome-Guided Steps [7.3] プロセス報酬モデル(PRM)を導入し、中間段階のスコアとより密集した監視を行う。
PRMスコアは最終的な正しさと不完全な整合性を持つことが多く、不正確な答えで終わっている局所的な流動的な推論に報酬を与えることができる。
結果の正しさを優位に保ちつつ,PRMを活用するフレームワークであるPROGRSを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 06:38:20 GMT)
Learning to Alleviate Familiarity Bias in Video Recommendation [7.3] LAFB(Learning to Alleviate Familiarity Bias)は,リコメンデーション出力における親しみやすさバイアスを軽減するためのフレームワークである。
我々は、実世界のレコメンデーションシステムにおいて、統合されたサービススタックの下で大規模なオフライン評価とオンラインA/Bテストを行う。
以上の結果から,LAFBは新たなウォッチタイムシェアを増大させ,新興クリエーターへの露出を向上させることが示唆された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:27:34 GMT)
Information-Theoretic Gaps in Solar and Reactor Neutrino Oscillation Measurements [7.3] 2つの太陽振動パラメータ、$m2_21$と$_12$は、太陽ニュートリノ実験と原子炉ニュートリノ実験の両方を用いて推定することができる。
原子炉実験では、ニュートリノはコヒーレント真空進化後に検出され、太陽ニュートリノは非コヒーレント混合物として検出器に到着する。
反応器ニュートリノでは, 比エネルギー範囲の両パラメータのQFI境界が飽和していることが判明した。
対照的に、太陽ニュートリノでは、量子コヒーレンスに由来するQFIへの位相ベースの寄与は欠落している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:31:02 GMT)
Online Domain-aware LLM Decoding for Continual Domain Evolution [7.1] ドメイン知識は、新しい規則、製品、サービス、相互作用パターンを通じて継続的に進化します。
コンセプトドリフトと呼ばれるこの現象を無視することは、モデルの予測精度を著しく低下させる。
オンラインドメイン認識デコーディングフレームワーク(ODD)は、ベースLLMとプレフィックスツリーとの確率レベル融合を実行する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:13:20 GMT)
Deepfake Synthesis vs. Detection: An Uneven Contest [6.9] ディープフェイク技術は、合成メディアの現実性とアクセシビリティを大幅に向上させた。
本研究では,最先端のディープフェイク検出技術について,総合的な実証分析を行った。
現代の合成技術が生み出すディープフェイクに挑戦する際,多くの最先端検出モデルでは,性能が著しく低いことが判明した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:26:14 GMT)
Orchestrating Attention: Bringing Harmony to the 'Chaos' of Neurodivergent Learning States [6.8] インターフェース要素を順応するフレームワークであるAttentionGuardを紹介します。
提案手法は,表現学から派生した4つの注意状態をモデル化し,新しい5つのUI適応パターンを実装した。
検出モデルをOULADデータセット上で検証し,87.3%の分類精度を実現した。
HYPERAKTIVデータセットのクロスバリデーションによる臨床ADHDプロファイルとの相関を示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:33:57 GMT)
Initial Risk Probing and Feasibility Testing of Glow: a Generative AI-Powered Dialectical Behavior Therapy Skills Coach for Substance Use Recovery and HIV Prevention [6.4] 我々は、HIVや物質使用のリスクがある個人に対してチェーンとソリューション分析を提供するGenAIベースのスキルコーチであるGlowを開発した。
Helpful、Honest、Harmless(HHH)フレームワークを使用して、ユーザ主導の対角テストを採用しました。
我々は,37件のリスクプローブ間相互作用における安全性の評価を行った。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:00:29 GMT)
MambaFusion: Adaptive State-Space Fusion for Multimodal 3D Object Detection [6.4] MambaFusionは、効率的で適応的で物理的に基礎付けられた3D知覚を実現する、統合されたマルチモーダル検出フレームワークである。
構造条件拡散ヘッドは、不確実性を考慮した推論と不確実性を考慮した推論を統合し、物理的妥当性を強制し、信頼性を校正する。
このフレームワークは、SSMベースの効率と信頼性駆動核融合を結合することで、現実の自律運転システムに対して堅牢で、時間的に安定し、解釈可能な3D知覚が得られることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:10:46 GMT)
Do Multi-Agents Dream of Electric Screens? Achieving Perfect Accuracy on AndroidWorld Through Task Decomposition [6.3] Minitapは、AndroidWorldベンチマークで100%成功したマルチエージェントシステムである。
まず、単一エージェントアーキテクチャが失敗する理由を分析します。
オープンソースソフトウェアとしてMinitapをリリースします。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:02:13 GMT)
Thinking in Structures: Evaluating Spatial Intelligence through Reasoning on Constrained Manifolds [6.1] SSI-Benchは制約された3次元構造の空間的推論のためのベンチマークである。
10人の研究者が400時間以上かけて画像をキュレーションし、構造部品を注釈付けし、ピクセルレベルの手がかりを最小限にするために質問をデザインしました。
最高のオープンソースモデルは22.2%の精度で最強のクローズドソースモデルは33.6%、人間は91.6%である。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:29:38 GMT)
Beyond Optimization: Intelligence as Metric-Topology Factorization under Geometric Incompleteness [6.0] 我々は、知性は固定迷路を通したナビゲーションではなく、所望の振る舞いが安定した引力となるように表現幾何学を再構築する能力であると主張している。
任意の固定計量が幾何学的に不完全であることを示す:任意の局所計量表現に対して、幾らかの位相変換はそれを特異あるいは非コヒーレントにする。
本稿では,メモリアモルト化メトリック推論によるMTFを実装したTopological Urysohn Machine (TUM)を紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:59:22 GMT)
Quantum Estimation of Delay Tail Probabilities in Scheduling and Load Balancing [6.0] スケジューリングとロードバランシングシステムにおける遅延テール確率の推定は、重要ではあるが計算的に禁止されたタスクである。
タンカク化再生シミュレーションに基づく遅延テール確率の量子シミュレーションのためのフレームワークを開発した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:28:09 GMT)
Dynamic Load Model for Data Centers with Pattern-Consistent Calibration [5.8] 物理に基づく構造とデータ駆動型適応性を活用するフレームワークを開発する。
提案したモデルは、MIT Supercloud、ASU Sol、Blue Waters、ASHRAEデータセットの実際の運用負荷データによって校正される。
ANDESプラットフォームに統合され、IEEE 39-bus、NPCC 140-bus、WECC 179-busシステムで評価される。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:15:00 GMT)
How well are open sourced AI-generated image detection models out-of-the-box: A comprehensive benchmark study [5.7] 普遍的な勝者は存在せず、検出器のランキングはかなり不安定である。
我々の発見は、全能検出器のパラダイムに挑戦した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 04:36:13 GMT)
Efficient Distribution Learning with Error Bounds in Wasserstein Distance [5.3] ワッサーシュタイン距離は確率分布間の距離を定量化するための重要な指標として登場した。
有限個のサンプル集合から未知の確率分布$mathbbP$を近似する新しいフレームワークを考案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:14:30 GMT)
Higher-Order Corrections to Scrambling Dynamics in Brownian Spin SYK Models [5.1] ランダムな全対全相互作用を持つブラウンスピンSachdev--Ye-Kitaev(SYK)モデルの演算子成長について検討する。
位数 2 から$L$ までの相互作用を含むハミルトニアンに対しては、パウリ弦展開係数の閉マスター方程式を導出する。
演算子スクランブルにおいて高次効果が重要な役割を担い、演算子サイズの分布が量子カオスのより洗練されたプローブを提供することを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:50:53 GMT)
Direct Soft-Policy Sampling via Langevin Dynamics [4.9] Langevin Q-Learning (NCLQL) は、順次スムーズな値エントロピーを誘導するノイズ条件付きQ-関数を学習する。
OpenAI Gym MuJoCoベンチマークでは、NC-LQLはオンラインRLにシンプルだが強力なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:01:54 GMT)
Robustness of Vision Language Models Against Split-Image Harmful Input Attacks [4.9] VLM(Vision-Language Models)は現在、現代AIの中核部分となっている。
最近の研究では、単一/全体像を用いた視覚的ジェイルブレイク攻撃が提案されている。
本稿では,この誤認識を生かした新しい分割画像視覚ジェイルブレイク攻撃(SIVA)を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:52:42 GMT)
Weak to Strong: VLM-Based Pseudo-Labeling as a Weakly Supervised Training Strategy in Multimodal Video-based Hidden Emotion Understanding Tasks [4.9] 本稿では,映像中の「概念的感情」の自動認識に取り組むための弱視的枠組みを提案する。
実験により、厳密なクラス不均衡にもかかわらず、提案手法は以前の作業で0.6以下から0.69以上に上昇することが示された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:02:55 GMT)
PhysDrape: Learning Explicit Forces and Collision Constraints for Physically Realistic Garment Draping [4.9] 伝統的な物理学に基づくシミュレーション(PBS)の代替として、ディープラーニングに基づく衣服のドラッピングが出現している。
本稿では,明示的な力と制約によって引き起こされる身体的リアルな衣服ドレープのためのハイブリッドニューラルネットワーク物理解法であるPhysDrapeについて述べる。
この差別化可能な設計は、明示的な制約によって物理的な妥当性を保証すると同時に、エンドツーエンドの学習により、物理的に一貫した予測のためにネットワークを最適化することができる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:46:01 GMT)
Analyzing the Impact of Simulation Fidelity on the Evaluation of Autonomous Driving Motion Control [4.8] 総合的なAutoware互換車モデルを導入する。
我々は,各モデルの近似品質を定量化するために,550回以上のシミュレーション実行を評価した。
我々は、制御アルゴリズムを評価するために、車両モデルをどの程度単純化できるかを推定する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:21:14 GMT)
MMLSv2: A Multimodal Dataset for Martian Landslide Detection in Remote Sensing Imagery [4.6] MMLSv2は火星表面における地すべりのセグメンテーションのためのデータセットである。
トレーニング、バリデーション、テストスプリットに分散した664のイメージで構成されている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:25:34 GMT)
CoLF: Learning Consistent Leader-Follower Policies for Vision-Language-Guided Multi-Robot Cooperative Transport [4.6] 視覚言語誘導型多ロボット協調輸送に対処し、各ロボットは搭載カメラの観察から自然言語の指示を受ける。
この分散環境における重要な課題は、視点の違いと言語あいまいさが矛盾する解釈をもたらすロボット間の知覚的ミスアライメントである。
我々は,安定したリーダ・フォロワーの役割分化のための多エージェント強化学習フレームワークであるConsistent Leader-Follower (CoLF)を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 02:21:47 GMT)
Securing Dual-Use Pathogen Data of Concern [4.5] トレーニングデータは、有能な人工知能(AI)モデルを作成するための重要な入力である。
データコントロールは、生物学的AI能力に関する拡散を減らすために利用可能な最も高い平均的な介入の1つかもしれない。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:11:19 GMT)
Adding More Value Than Work: Practical Guidelines for Integrating Robots into Intercultural Competence Learning [4.5] 我々は,教師とデザインワークショップの2つの段階を共に実施し,ロボットによる文化間活動の共設計を行った。
教室ロボットの適切なシナリオと役割を特定し、教師に取って代わるのではなく、ロボットが補完する方法について検討し、倫理的・コンプライアンス的考察にどう対処するかを検討する。
本研究は,K-12学校における文化間教育を効果的に支援できる社会ロボットを開発するための,HRIコミュニティのための実践的デザインガイドラインを提供する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:01:33 GMT)
Efficient and Adaptable Detection of Malicious LLM Prompts via Bootstrap Aggregation [4.5] Black-boxモデレーションAPIは、限られた透明性を提供し、進化する脅威に不適応する。
大きなLLM判事を用いたホワイトボックスのアプローチは、計算コストを禁止し、新しい攻撃に対して高価な再訓練を必要とする。
本稿では,モジュール型で軽量で段階的に更新可能なフレームワークであるBAGELについて紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:11:33 GMT)
NLP for Local Governance Meeting Records: A Focus Article on Tasks, Datasets, Metrics and Benchmark [4.3] 地方統治会議の記録(地方統治会議記録)は、制度的な会議において、どのように提案、議論、手続き的行動が展開されるかを文書化した、数分または文書の形で公式文書である。
これらの文書は、しばしば密集し、官僚的であり、自治体全体で非常に異質であり、言語、用語、構造、組織全体に大きな変化が見られる。
これらの課題に対処するために、複雑な文書の構造と解釈に計算手法を用いることができる。
本稿では,地方統治会議文書の構造化を支援する基礎的NLPタスクについて概説する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 23:45:17 GMT)
Bridging the Gap: Adapting Evidence to Decision Frameworks to support the link between Software Engineering academia and industry [4.1] 健康科学からEvidence to Decision(EtD)フレームワークを紹介した。
EtDフレームワークは、介入の影響に関する既存の最良の証拠を評価するために、パネルで専門家を集めることを提案する。
EtDフレームワークを採用する際にSEリサーチと実践コミュニティが直面する課題について論じる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:30:19 GMT)
Semi-device-independent certification of high-dimensional quantum channels [4.0] 既存の認証方式は、しばしば完全に信頼された内部デバイスに依存している。
観測された統計から直接チャネル特性を認証するためのセミデバイス非依存のフレームワークを提案する。
エンタングルメントの忠実性の低い境界は、観測された統計の完全なセットまたは単一の目撃値のいずれかと互換性がある。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:05:04 GMT)
Out of the box age estimation through facial imagery: A Comprehensive Benchmark of Vision-Language Models vs. out-of-the-box Traditional Architectures [3.9] 本稿では,現代視覚言語モデル(VLM)と特殊年齢推定アーキテクチャを比較した,最初の大規模クロスパラダイムベンチマークを提案する。
Emphzero-shot VLMは、LLM以外のモデルでは9.88よりも平均5.65年のMAEを達成した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 04:44:31 GMT)
TopicENA: Enabling Epistemic Network Analysis at Scale through Automated Topic-Based Coding [3.9] エピステミック・ネットワーク・アナリティクス(ENA)は、共起概念をネットワークとして表現することで、テキストにおける概念の構造を調査する手法である。
従来のENAは手動のエキスパートコーディングに大きく依存しており、拡張性と実世界の大きなテキストコーパスに適用性を制限する。
この制限に対処するため、本研究ではBERTopicをENAにマージし、トピックベースのネットワーク分析フレームワークであるTopicENAを紹介する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:58:45 GMT)
TAAM:Inductive Graph-Class Incremental Learning with Task-Aware Adaptive Modulation [3.8] 固定されたGNNバックボーンの推論過程を導くためのタスク・アウェア適応変調(TAAM)を提案する。
新しいタスクごとに、専用のNSMがトレーニングされ、凍結され、"Expert Module"として機能する。
これらのモジュールは、共有GNNバックボーンの計算フローに対して、詳細なノード適応適応変調を行う。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:11:55 GMT)
BFTS: Thompson Sampling with Bayesian Additive Regression Trees [3.6] コンテキストブレイディットは、パーソナライズされたモバイルヘルス介入のための中核技術である。
本研究では,BART(Bayesian Additive Regression Trees)を探索ループに直接組み込むための,最初のコンテキスト帯域幅アルゴリズムを提案する。
オフライン政策評価では、BFTSはデプロイされたポリシーと比較してエンゲージメント率を30%以上改善する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 01:54:56 GMT)
Geometric criticality in the driven Jaynes-Cummings model [3.6] Jaynes-Cummingsモデルにおけるフォトニックモードが外部古典場によって駆動されると、システムは光子遮断分解相転移を行うことができる。
これらの固有状態に関連する幾何学的臨界性について検討する。
臨界領域の各固有状態表示に対する量子計量とベリー曲率テンソルを求める。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:23:05 GMT)
Integrating Specialized and Generic Agent Motion Prediction with Dynamic Occupancy Grid Maps [3.4] 本研究では,将来の占有状態グリッド,車両グリッド,シーンフローグリッドを同時に予測する統合フレームワークを提案する。
我々のアプローチは、グリッド間の依存関係をキャプチャし、様々な将来予測を可能にする、カスタマイズされた相互依存損失関数に重点を置いている。
実世界の nuScenes と Woven Planet のデータセットによる評価は、動的車両や一般的な動的シーン要素の予測性能に優れていた。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:13:06 GMT)
GCN-MPPR: Enhancing the Propagation of Message Passing Neural Networks via Motif-Based Personalized PageRank [3.4] 本稿では、モチーフベースパーソナライズされたPageRank(MPPR)という新しいPageRankについて述べる。
MPPRは、高次モチーフ関係を考慮し、あるノードから別のノードへの影響を測定するために提案される。
実験の結果,提案手法は精度,安定性,時間消費の基準線をほぼ全て上回ることがわかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:49:49 GMT)
Small Agent Group is the Future of Digital Health [3.3] スモールエージェントグループ(SAG)は、共同検討プロセスを通じてより良い臨床推論を支援する。
SAGは単一巨大モデルに比べて優れた性能を発揮する。
全体として、SAGは、より良い効率性、信頼性、デプロイメント効率のバランスをとる、デジタルヘルスに対するスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:27:37 GMT)
Gust Estimation and Rejection with a Disturbance Observer for Proprioceptive Underwater Soft Morphing Wings [3.3] 無人水中車両は、海上での維持および測量作業にますます雇われている。
これらの不安定な流れは方向と速度の急激な変化を誘発し、車両の安定性と操作性を損なう。
本研究では, 環境摂動を緩和するために, 主観的感覚を付加した軟質な異形翼を提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:52:13 GMT)
Probing holographic conformal field theories [2.9] 我々は、相対論的量子情報プロトコルをアンチ・デ・ジッター/コンフォーマル場理論に組み込む、運用上、境界優先のフレームワークを導入する。
検出器の縮小密度演算子を摂動的に計算し、励起確率とコヒーレンスの両方を保持する。
グローバルAdSに対するCFT双対の場合、収穫されたマナはブライトンローナー-フリードマン窓の2つの許容スカラー量子化をはっきりと区別する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:04:52 GMT)
Interpretable Fuzzy Systems For Forward Osmosis Desalination [2.8] ファジィルールベースシステム(FRBS)の解釈可能性を維持することは、公衆衛生に影響を及ぼす水処理に不可欠である。
本稿では,解釈可能なFRBSを開発するためのHuman-in-the-loopアプローチを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:48:56 GMT)
Mitigating Forgetting in Continual Learning with Selective Gradient Projection [2.7] Selective Forgetting-Aware Optimization (SFAO) はコサイン類似性や層ごとのゲーティングによって勾配方向を制御する動的手法である。
SFAOは、効率的なモンテカルロ近似を備えた調整可能なメカニズムを使用して、更新を選択的にプロジェクション、受け入れ、破棄する。
標準連続学習ベンチマークの実験では、SFAOはメモリコストを著しく低減し、90$%の削減を実現し、MNISTデータセットの忘れ込みを改善した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:24:35 GMT)
The Rise of Sparse Mixture-of-Experts:A Survey from Algorithmic Foundations to Decentralized Architectures and Vertical Domain Applications [2.5] エキスパートの混合(MoE)アーキテクチャは、ディープラーニングモデルを同等のコストでより多くのパラメータに拡張するための強力なアプローチとして進化してきた。
MoEモデルはルーティングネットワークに基づいて専門家のサブセットのみを起動する。
MoEは、自然言語処理、コンピュータビジョン、および様々な水平領域におけるマルチモーダルなどの下流アプリケーションを強化するだけでなく、垂直領域にまたがる幅広い適用性を示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:39:10 GMT)
Tighter Information-Theoretic Generalization Bounds via a Novel Class of Change of Measure Inequalities [2.4] 特定事例として、$f$-divergencesや$2$-divergenceなど、幅広い情報手段のファミリーで測度の不等式を変更する。
次に、これらの不等式を学習アルゴリズムの一般化誤差の解析に組み込むとともに、簡易な解析によって最もよく知られた結果を復元する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:53:14 GMT)
V-ABFT: Variance-Based Adaptive Threshold for Fault-Tolerant Matrix Multiplication in Mixed-Precision Deep Learning [2.1] V-ABFTは、検証差を直接モデル化することで、より厳密なエラー境界を達成する分散ベースの適応しきい値アルゴリズムである。
V-ABFTは、しきい値と実際のエラーの比率を、FP32/FP64で約7-20times$、BF16で48-158times$に下げる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:21:02 GMT)
SPOT: Spatio-Temporal Obstacle-free Trajectory Planning for UAVs in an Unknown Dynamic Environment [1.9] 我々は、視覚に基づくセーフフライト・コリドール(SFC)世代と統合した4次元プランナーを開発した。
シミュレーションおよび実世界のハードウェア実験において,本手法を広範囲に検証し,最先端の手法と比較した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 06:31:16 GMT)
ArkTS-CodeSearch: A Open-Source ArkTS Dataset for Code Retrieval [1.8] 本稿では,オープンソースリポジトリから構築した大規模ArkTSデータセットを提案する。
自然言語のコメントをArkTS関数の検索に使用する単一検索タスクを設計する。
この研究は、ArkTSコード検索のための最初の体系的なベンチマークを確立する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:34:34 GMT)
Be a Partner, not a Bystander in Software Engineering Practice: Bridging the Gaps between Academia and Industry [1.7] ソフトウェアエンジニアリングコミュニティは、その研究の影響と産業プラクティスとの関連を深く懸念している、と私たちは主張する。
我々は,SEにおける行動と改革の新たな呼びかけを提案し,ソフトウェア工学コミュニティの新たな未来を構想する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 02:56:01 GMT)
The Confidence Manifold: Geometric Structure of Correctness Representations in Language Models [1.5] 5つのアーキテクチャファミリから9つのモデルにまたがる正しさの表現を特徴付ける。
我々はアクティベーションステアリングによる因果性評価を行った。
正確性信号は内部に存在するが、出力では表現されない。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 23:27:10 GMT)
Objective Decoupling in Social Reinforcement Learning: Recovering Ground Truth from Sycophantic Majorities [1.3] 強化学習(Reinforcement Learning)のDogma 4は、評価者がサイコファン、怠け者、あるいは敵対的であるような社会環境では失敗することを示す。
本稿では、この問題を解決するために、疫学的ソースアライメント(ESA)を提案する。
ESAは、信号自体よりもフィードバックのソースを判断するために、スパース安全公理を利用する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:23:02 GMT)
The Landscape of AI in Science Education: What is Changing and How to Respond [1.0] この章では、科学教育の景観を変革する上で、人工知能(AI)の変革的な役割について論じる。
我々は、インテリジェントな学習システム、適応学習プラットフォーム、自動フィードバック、生成コンテンツ作成、パーソナライゼーション、効率、エクイティといったAI支援ツールをどのように強調する。
同時に、この章では、公平性、透明性、説明責任、プライバシー、人間の監視といった、倫理的、社会的、教育的な課題について考察する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 23:54:23 GMT)
Optimized Human-Robot Co-Dispatch Planning for Petro-Site Surveillance under Varying Criticalities [1.0] 本稿では,人間-ロボット共分散施設配置問題(HRCD-FLP)を定式化する。
これは、連結されたインフラの臨界度、人間とロボットの監督比率の制約、最低利用要件を取り入れた容量化された施設の場所変種である。
その結果、保守的な(1:3人ロボットの監督)から将来の自律運用(1:10)への移行は、完全な重要なインフラカバレッジを維持しながら、大幅なコスト削減をもたらすことが示された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:46:40 GMT)
Graph-based Semi-Supervised Learning via Maximum Discrimination [0.9] 半教師付き学習(SSL)は、ラベル付きデータが少ないがラベルなしデータが豊富である場合に、正確なモデルをトレーニングする課題に対処する。
我々は,クラス分離を最大化する低次元表現を計算するグラフアプローチであるAUC-specを開発した。
合成および実世界のデータセット上で、フィールドの古典的および最先端の手法に匹敵する計算効率を維持しながら、競合する結果を実証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:18:49 GMT)
TerraBind: Fast and Accurate Binding Affinity Prediction through Coarse Structural Representations [0.8] 本稿では,タンパク質リガンド構造と結合親和性予測の基礎モデルTerraBindを提案する。
最新の手法よりも26倍高速な推論を実現し、親和性予測精度を$sim$20%向上させる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 00:01:43 GMT)
Multi-encoder ConvNeXt Network with Smooth Attentional Feature Fusion for Multispectral Semantic Segmentation [0.8] MeCSAFNetはマルチスペクトル画像におけるランドカバーセグメンテーションのためのマルチブランチエンコーダデコーダアーキテクチャである。
専用核融合デコーダは、複数のスケールで中間機能を統合し、微細な空間的手がかりと高レベルのスペクトル表現を組み合わせた。
Five-Billion-Pixels(FBP)とPotsdamデータセットの実験は、大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:42:10 GMT)
An efficient method for spot-checking quantum properties with sequential trials [0.8] 量子リソースの信頼性は、複雑な生成プロセスや送信中の敵操作によって損なわれる可能性がある。
この非i.d.の行動は、セキュリティ上の懸念を生じさせ、情報処理を行う際の不良な見積もりをもたらす可能性がある。
このようなタスクのパフォーマンスを認証するには、所望のプロパティをスポットチェックするか、与えられたタスクに量子リソースを利用するか、それぞれのトライアルでランダムな決定をすることができる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:37:52 GMT)
Online Bayesian Imbalanced Learning with Bregman-Calibrated Deep Networks [0.7] 本報告では、クラス優先の仮定から確率比の推定を分離する原則的フレームワークであるOBIL(TextitOnline Bayesian Im Balanced Learning)を提案する。
我々のアプローチは、ブレグマンの発散と適切なスコアリングルールとの確立された接続に基づいて、そのような損失で訓練されたディープネットワークが後続確率推定を生成することを示す。
これらの確率比の推定は、クラス事前およびコスト構造における任意の変化の下でも有効であり、最適なベイズ決定のためのしきい値調整のみを必要とすることを証明している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:23:00 GMT)
An Explainable Multi-Task Similarity Measure: Integrating Accumulated Local Effects and Weighted Fréchet Distance [0.7] 説明可能な人工知能(XAI)技術に基づくマルチタスク類似度尺度を提案する。
この尺度は、シングルタスク学習シナリオとマルチタスク学習シナリオの両方に適用できる。
この測定は,4つのデータセット,1つの合成データセット,3つの実世界のデータセットを用いて検証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:29:38 GMT)
Can Large Language Models Implement Agent-Based Models? An ODD-based Replication Study [0.7] 大規模言語モデル(LLM)は、テキスト記述から非自明な実行可能なコードを合成できるようになった。
LLMは、複製、検証、検証をサポートする方法で、標準化された仕様からエージェントベースのモデルを確実に実装できますか?
制御されたODD-to-code翻訳タスクにおいて17の現代LLMを評価する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:56:20 GMT)
Variance-Gated Ensembles: An Epistemic-Aware Framework for Uncertainty Estimation [0.6] VGE(Variance-Gated Ensembles)は、アンサンブル統計から計算した信号-雑音ゲートを介して、てんかん感受性を注入する直感的なフレームワークである。
我々は、アンサンブルサンプル平均と分散によるエンドツーエンドのトレーニングを可能にする閉形式ベクトル-ヤコビアン積を導出した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:05:23 GMT)
Humanizing AI Grading: Student-Centered Insights on Fairness, Trust, Consistency and Transparency [0.6] 本研究では,学部コンピュータサイエンス科における人工知能(AI)学習システムに対する学生の認識について検討する。
発見は、AIの文脈的理解とパーソナライゼーションの欠如に関する懸念を明らかにする。
この研究は、学生の声を増幅し、デザインされた学習環境でAIを人間化するための設計原則を提供することにより、倫理中心のアセスメントプラクティスに寄与する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 01:18:10 GMT)
Lost in Translation? A Comparative Study on the Cross-Lingual Transfer of Composite Harms [0.5] 大きな言語モデル(LLM)のほとんどの安全性評価は、英語で固定されている。
いくつかの害は翻訳のほとんど無傷で生き残るが、他の害は歪んだり消えたりする。
翻訳ベースのベンチマークであるCompositeHarmを導入し、シンタックスとセマンティクスの両方のシフトが安全アライメントをどのように支えているかを検証した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:22:50 GMT)
AI Empathy Erodes Cognitive Autonomy in Younger Users [0.5] 生成的AIにおける影響的アライメントは、若いユーザの発達的自律性に対する体系的なリスクを表している。
本稿では,成人ラベル付き報酬信号と若年者の発達要求の相違を明らかにする。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:28:52 GMT)
Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation [0.4] ビエリク・ガード(英語: Bielik Guard)は、ポーランド語の安全分類法である。
ポーランドの6,885のテキストからなるコミュニティアノテーション付きデータセットに基づいて、これらのモデルは、Hate/Aggression、Vulgarities、Sexual Content、Crith、Self-Harmという5つの安全カテゴリのコンテンツを分類する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:57:04 GMT)
Multi-Agent Route Planning as a QUBO Problem [0.4] 本稿では、形式的な問題定義を与え、重み付き集合パッケージ問題から減算してNP硬度を証明し、二次的非制約二項最適化の定式化を導出する。
単一のペナルティパラメータがカバレッジオーバーラップトレードオフを制御する。
バルセロナでの最大10万台の車両による実験では、カバーオーバーラップの明確な膝が明らかになった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:18:45 GMT)
WristMIR: Coarse-to-Fine Region-Aware Retrieval of Pediatric Wrist Radiographs with Radiology Report-Driven Learning [0.4] WristMIRは、地域対応の小児手首画像検索フレームワークである。
手動のイメージレベルのアノテーションなしで、きめ細かい、臨床的に意味のある画像表現を学習する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:57:57 GMT)
ICBAC: an Intelligent Contract-Based Access Control framework for supply chain management by integrating blockchain and federated learning [0.4] 既存のアクセス制御は静的で集中しており、インサイダーの脅威や進化するコンテキストに適応できない。
提案するソリューションは、インテリジェントコントラクトベースのアクセス制御フレームワークであるICBACである。
認可型ブロックチェーン(Hyperledger Fabric)と連邦学習(FL)を統合する
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:27:58 GMT)
Global Symmetry and Orthogonal Transformations from Geometrical Moment $n$-tuples [0.3] 本稿では,フレームの原点を中心とする物体に対して,回転やミラー変換を含む対称性と推定変換を幾何学的モーメントを用いて同定する。
包括的方法論は、これらの関数を n-次元空間、特にモーメント(n)-タプルで得るために開発された。
提案手法の堅牢性と信頼性を確保するため, 2次元オブジェクトと3次元オブジェクトの両方で広範囲な検証試験を行った。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 00:07:11 GMT)
A Transfer Learning Approach to Unveil the Role of Windows Common Configuration Enumerations in IEC 62443 Compliance [0.3] 我々は、Windows Commonの設定をIEC 62443-3システムセキュリティ要件にマッピングする転送学習手法を提案する。
その結果得られたラベル付きデータセットは、自動コンプライアンスチェック、要求の頻度の分析、クロスプラットフォームの類似点と発散点の識別を可能にする。
IEC 62443-3-3における抽象的な標準と具体的構成の橋渡し, 自動化, トレーサビリティ, 明快さとCCEの役割を強調した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 23:54:51 GMT)
Structure-Aware Robust Counterfactual Explanations via Conditional Gaussian Network Classifiers [0.3] 本研究は,条件付き条件グラフに基づく構造認識型ロバストネス・ウンタファクト探索手法を提案する。
結果から,本手法は,特に安定な依存関係を提供する元の定式化を直接最適化することにより,強い整合性を実現することが示された。
提案手法は,非循環的制約下での非実効的推論における今後の進歩の基盤となる。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 15:51:45 GMT)
Enhanced Mixture 3D CGAN for Completion and Generation of 3D Objects [0.3] 3Dオブジェクトの生成と完成は、コンピュータビジョンにおける変革的な挑戦を表している。
本稿では,高品質な3Dモデルを生成するため,Deep 3D Convolutional GANとMoEフレームワークの統合について検討する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:32:41 GMT)
Integrating Code Metrics into Automated Documentation Generation for Computational Notebooks [0.2] 本稿では,自動文書生成のための補助信号として,ソースコードメトリクスが果たす役割について検討する。
これは、コード、物語、結果を統合するが、一貫性のないドキュメントに苦しむデータサイエンティストの間で人気の媒体である計算ノートに焦点を当てている。
その結果、コードメトリクスを組み込むことで、生成されたドキュメントの正確性と文脈的関連性が向上することがわかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 21:40:57 GMT)
Quantum Steering and Entanglement in a Tritter: Hierarchy under Loss [0.1] トリッター上に2モード圧縮真空とコヒーレント状態とを混合した三部構造における相関構造について検討した。
出力モード間のエンタングルメントとアインシュタイン-ポドルスキー-ローゼンステアリングを解析した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:03:16 GMT)
Spinor Double-Quantum Excitation in the Solution NMR of Near-Equivalent Spin-1/2 Pairs [0.0] 2量子励起スキームのファミリーは、ほぼ等価スピン-1/2対の溶液核磁気共鳴(NMR)について記述されている。
新しい手法は、2レベル系のスピノル挙動を利用しており、その符号は2ドルの回転で量子状態の変化である。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 23:17:40 GMT)
Uncertainty-Aware Counterfactual Traffic Signal Control with Predictive Safety and Starvation-Avoidance Constraints Using Vision-Based Sensing [0.0] UCATSCは、交差点で信号制御をモデル化するモデルベースの信号制御システムである。
報酬形成を用いて安全性を予測する強化学習法とは異なり、UCATSCは安全性と飢餓防止に関する厳しい制約を予測し、強制する。
このシステムは、安全クリティカルなエラーを防止し、解釈可能な制御ポリシー出力を提供しながら、交通遅延と排出を改善するように設計されている。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 02:57:58 GMT)
Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation [0.0] Token-Oriented Object Notation (TOON) は、構造化データを LLM に転送するためのシリアライズフォーマットとして、トークンの使用量を大幅に削減することを目的としている。
これをテストするために,構造的複雑性,検証,および平文生成と構造的出力の比較に関して,いくつかのテストケースを作成するベンチマークを行った。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:58:03 GMT)
The trouble with recording devices [0.0] 量子理論は、記録装置を記述するのに困難に直面する。
記録が量子不確実性が役割を果たす事象である場合、量子理論は記録の将来状態と過去の状態の両方の確率を正確に予測することはできない。
解決案が提示され、ボルン規則はすべての確率を正確に予測するために軽く修正される。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:17:37 GMT)
The Logovista English-Japanese Machine Translation System [0.0] 本論文は,ロゴビスタ英語機械翻訳システムのアーキテクチャ,開発実践,および保存された遺物について述べる。
このシステムは、手書きの文法規則、構文的および意味的制約を符号化する大規模な中央辞書、および重み付き解釈スコアリングを用いたチャートベースの構文解析を組み合わせた。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:37:29 GMT)
The Algorithmic Unconscious: Structural Mechanisms and Implicit Biases in Large Language Models [0.0] 本稿では,大規模言語モデル(LLM)内で機能する構造決定の集合を指定するアルゴリズム的無意識の概念を紹介する。
我々は、重要なバイアスのクラスが、トークン化、注意、統計最適化、アライメント手順といったモデル自体の技術的なメカニズムから直接現れると主張している。
本稿では,トークン化体制,潜時空間トポロジ,アライメントシステムの監査を基盤とした,モデル技術クリニックのためのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:03:43 GMT)
Spectral Guardrails for Agents in the Wild: Detecting Tool Use Hallucinations via Attention Topology [0.0] 本稿では,教師付きアプローチを補完する注目トポロジのスペクトル分析に基づくフリーガードレールのトレーニングを提案する。
Llama 3.1 8Bでは,マルチ機能検出による97.7%のリコール,86.1%のリコール,81.0%の精度のバランス配置を実現している。
Llama 3.1 8Bの故障は、スペクトル的に破滅的であり、検出しやすく、Mistral 7Bは最高の識別を行う。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:56:16 GMT)
Software Space Analytics: Towards Visualization and Statistics of Internal Software Execution [0.0] 本稿では,内部ソフトウェア実行データの評価に空間統計を適用した。
まず、ソフトウェアの内部構造をモジュール呼び出しの関係に基づく空間として見るソフトウェア空間データセットを定義する。
次に,空間的クラスターの可視化と空間的測度を用いた統計的検定を行う。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 04:57:57 GMT)
Quantum self-interaction within an infinitely deep cavity [0.0] これらの解は複素波動関数や四元波動関数の観点からも考慮される。
複素結果は複素ヒルベルト空間で確立された通常の成果を再現する。
四元イオンの場合はさらに、複雑な溶液では観測できない自己相互作用の出現を認める。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:01:06 GMT)
Quantum Walks Assisted Bidirectional Remote State Preparation [0.0] 本稿では、2つの独立した1次元格子上の量子ウォークを用いた双方向リモート状態作成手法を提案する。
本研究では,2頂点および4頂点系の量子ウォークに基づく双方向遠隔状態作成方式が,制御不能な構成と制御不能な構成で一貫した挙動を示すことを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:30:39 GMT)
Quantum Evolution of Hopf Algebra Hamiltonians [0.0] 変形した時空対称性はデコヒーレンスの基本形式を符号化することができる。
この効果は、時間進化生成子の非自明なホップ代数構造によって支配されるリンドブラッドのような進化によって記述されるべきである。
特に、我々の分析は、より一般的な随伴作用の組み合わせは、常にフォン・ノイマン力学を保証していることを示している。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 09:37:59 GMT)
Probability Hacking and the Design of Trustworthy ML for Signal Processing in C-UAS: A Scenario Based Method [0.0] 人工知能(AI)のような、Emerging and Disruptive Technologies(EDT)によるC-UASの強化は、より効果的な対策につながる可能性がある。
本稿では,AIのサブセットである機械学習(ML)を付加したC-UASにシナリオベース手法を適用し,信号処理能力を向上する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:01:46 GMT)
Privacy-Preserving Covert Communication Using Encrypted Wearable Gesture Recognition [0.0] 本研究は,プライバシ保護型ジェスチャベースの秘密通信システムを提案する。
このシステムは、暗号化されたモーションデータを直接ジェスチャー認識するために、多人数同型学習パイプラインを使用する。
我々の知る限り、この研究はウェアラブルベースの秘密通信環境において、暗号化されたジェスチャー認識を初めて適用したものである。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:06:01 GMT)
Persistent Entropy as a Detector of Phase Transitions [0.0] 持続的エントロピーは相間に無矛盾なギャップを生じることを示す。
有限時間計算と理論を結びつけるために,位相安定化に基づく運用フレームワークを導入する。
我々は, 倉本同期遷移, 集団運動におけるビエク秩序-秩序遷移, ニューラルネットワークトレーニングダイナミクスの枠組みを検証した。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 17:01:26 GMT)
Permanents of matrix ensembles: computation, distribution, and geometry [0.0] 我々はGPUを用いて$mathbbC,$mathbbR,$$mathbbF_p$,$mathbbQ上での永久体の計算を高速化する。
特に、この手法を用いて DFT および Schur 行列の固有値を計算する。
ユニタリ群上の測地学では、普遍スケーリング関数 $f(t)=frac1nln|perm((t))|$ が$n$とは独立である。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 22:31:42 GMT)
Outsourcing in Global Software Development: Effects of Temporal Location and Methodologies [0.0] 私たちは、時間的にニアショアやオフショアの場所にあるベンダーにソフトウェア開発を契約する顧客に焦点を当てています。
我々は,時間的距離が全体の成功,コスト,プロジェクト管理活動,スケジュール,品質,コミュニケーション問題,その他のマネージャに対する関心の結果に与える影響を調査した。
その結果, ニアショア開発は, 全体の成功, 品質, PMの労力削減, スケジュール維持, 品質向上, 通信問題の増大に有利であることがわかった。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 18:57:49 GMT)
Mutual information and task-relevant latent dimensionality [0.0] 予測に必要な潜在表現の次元を推定することは困難であり、ほとんど解決されていない問題である。
分離・双線形批判を持つ標準神経推定器は, 推定次元を体系的にインフレーションすることを示した。
1つのデータセットのペアビューを構築することにより、本質的な次元性へのアプローチを拡張する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:58:49 GMT)
Interpretable Analytic Calabi-Yau Metrics via Symbolic Distillation [0.0] シンボリック回帰は、神経近似を単純な解釈可能な公式に蒸留することができることを示す。
我々は,従来ブラックボックスネットワークにのみ適用されていたコンパクトで解釈可能なモデルを,シンボリック蒸留で回収できることを検証する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:51:35 GMT)
Incremental Mapping with Measurement Synchronization & Compression [0.0] この研究は、連結因子グラフを漸進的に構築する新しいアプローチを導入する。
外部評価基準に基づいて最適なグラフトポロジを選択することにより、利用可能なすべてのセンサデータの取り込みを保証する。
提案手法はグラフ圧縮を容易にし,ノード数(最適化変数)を平均30%削減する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 10:43:11 GMT)
Improved entanglement-based high-dimensional optical quantum computation with linear optics [0.0] 角C2otimes mathbbCdotimes mathbbCd$。
ハイブリッド符号化では、制御量子ビットとターゲット量子ビットを光偏光と空間自由度で符号化する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 13:48:18 GMT)
Graph-Enhanced Deep Reinforcement Learning for Multi-Objective Unrelated Parallel Machine Scheduling [0.0] 本稿では,PPOとグラフニューラルネットワークを用いた深層強化学習フレームワークを提案する。
GNNは、ジョブ、マシン、セットアップの複雑な状態を効果的に表現し、PPOエージェントが直接スケジューリングポリシーを学習できるようにする。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:54:47 GMT)
Geometry-Enabled Radiation from Structured Paraxial Electrons [0.0] 不均一な軸対称磁場を伝播するツイスト電子による自然光子放出を計算する。
このような構造化状態の進化は二次形式の空間における開経路に対応することを示す。
この機構はランダウ準位放射を非漸近構造電子状態に一般化し、非環状幾何学的進化と光子放出の直接的な関係を確立する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 08:10:56 GMT)
Full Schmidt characterization of spatiotemporally entangled states produced from spontaneous parametric down-conversion [0.0] 状態の対称性を使って、少なくとも4桁の複雑さを減らします。
シュミットモードは、軌道角運動量を完全に有する横方向の空間渦構造を持つことを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:46:24 GMT)
Epigraph-Guided Flow Matching for Safe and Performant Offline Reinforcement Learning [0.0] 本稿では,安全なオフラインRLを状態制約付き最適制御問題として定式化し,安全性と性能を協調的に最適化するフレームワークを提案する。
EpiFlowは、ほぼゼロの実証的安全違反で競合リターンを達成する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:56:21 GMT)
Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention [0.0] 本稿では,スケジューリング,注意散布,サンプリング温度を結合した自己組織化推論アーキテクチャを提案する。
提案手法は,vLLMを拡張して,エントロピーを考慮したスケジューリング,ページアテンションブロックのエントロピープルーニング,およびターゲットエントロピー系近傍での生成を安定化する適応温度制御を行う。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:13:26 GMT)
Emergent Search and Backtracking in Latent Reasoning Models [0.0] モデルが潜在空間における構造化された探索過程を自然に学習することを発見した。
潜在推論モデルは、単語を通して思考の連鎖が達成するものを活性化空間で達成する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 19:44:30 GMT)
Efficient Representations are Controllable Representations [0.0] LLMの内部的な概念の表現方法を制御するには、まずモデルを識別し、次にモデルの既存の特徴幾何学に介入する洗練された方法が必要である。
単純な補助損失でLCMを微調整し、3072の残留ストリーム次元のうち16を、生成に必要な概念を示す不活性な解釈可能性フラグとして訓練する。
その結果、これらの不活性フラグは真の内部機能となり、解釈可能な制御スイッチによって推論時に生成を制御できます。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 05:32:02 GMT)
Doubling the size of quantum selected configuration interaction based on seniority-zero space and its application to QC-QSCI-AFQMC [0.0] 二重占有構成相互作用-量子選択構成相互作用(DOCI-QSCI)を提案する。
年齢ゼロの空間からサンプリングするが、セクター制限は量的精度を損なう可能性がある。
DOCI-QSCIは従来のQSCIにアクセスできる軌道空間を2倍にし、その後のph-AFQMC後処理は合理的に高い精度を提供することを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 11:16:39 GMT)
Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM) [0.0] このフレームワークは、セマンティックメタデータの強化、動的グラフ構築、VARKベースのプロファイリング、メンタル状態推定、LLMによるランキング付きグラフ強化検索、反復学習による適応インタフェース設計の6つの統合コンポーネントから構成される。
本研究は、セマンティック理解と心理的モデリングを通じて冷戦開始制限を克服し、初期ユーザからのパーソナライズされた説明可能なレコメンデーションを提供する認知的認識型レコメンデーションシステムの基礎を確立する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 16:42:44 GMT)
Bypassing the Rationale: Causal Auditing of Implicit Reasoning in Language Models [0.0] 思考の連鎖(CoT)の促進は推論補助として広く用いられ、しばしば透明性のメカニズムとして扱われる。
アクティベーションパッチによるCoT忠実度に関する因果的,階層的な監査を導入する。
私たちは、CoT特有の影響は、通常、狭い「推論窓」に奥行き局所化されていることに気付きました。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 14:54:28 GMT)
Building Damage Detection using Satellite Images and Patch-Based Transformer Methods [0.0] 我々は、xBDデータセット上でビジョントランスフォーマー(ViT)モデルの性能を評価する。
本稿では,構造的特徴を分離し,背景雑音を最小限に抑えるパッチベースの前処理パイプラインを提案する。
そこで本研究では,災害分類のためのCNNベースラインと比較して,新しいトレーニング手法による小さなViTアーキテクチャが,競合するマクロ平均F1を実現することを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:45:58 GMT)
Attention-Based Deep Learning for Early Parkinson's Disease Detection with Tabular Biomedical Data [0.0] パーキンソン病(PD)の早期かつ正確な診断は、医療診断において重要な課題である。
従来の機械学習(ML)モデルはPD検出に広く適用されているが、しばしば広範な機能工学に依存し、複雑な機能相互作用を捉えるのに苦労する。
本稿では,Multi-Layer Perceptron (MLP), Gradient Boosting, TabNet, SAINTの4つの分類モデルの比較評価を行った。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:03:02 GMT)
Approximating Matrix Functions with Deep Neural Networks and Transformers [0.0] 変換器を含むニューラルネットワークを用いて,スカラー関数を行列にマッピングする行列関数の近似について検討した。
数値エンコーディングに適した変圧器エンコーダデコーダは、確率の高い5%の相対誤差で特定の行列関数を近似できることを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 03:45:25 GMT)
AGORA: Agentic Green Orchestration Architecture for Beyond 5G Networks [0.0] 5Gネットワークを越えたエージェントグリーンオーケストレーションアーキテクチャAGORAを提案する。
AGORAは、ローカルツール拡張大型言語モデル(LLM)エージェントをモバイルネットワーク制御ループに組み込んで、自然言語サステナビリティ目標をテレメトリ基底アクションに変換する。
その結果,ツール駆動制御ループにおける遅延-エネルギー結合が強く,コンパクトモデルが低エネルギーフットプリントを実現できることが示唆された。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 20:39:54 GMT)
A quantum-inspired multi-level tensor-train monolithic space-time method for nonlinear PDEs [0.0] 大域的時空定式化において非線形偏微分方程式(PDE)を解くためのマルチレベルテンソルトレイン(TT)フレームワークを提案する。
実際には、モノリシックニュートンの反復は停滞するか、強い非線形、固い、または対流支配的な体制に収束しない。
この制限を克服するために、TTフォーマットに完全に埋め込まれた粗大なマルチレベル戦略を導入する。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:38:16 GMT)
A Thermodynamic Theory of Learning Part II: Critical Period Closure and Continual Learning Failure [0.0] 有限時間にわたる学習は必然的に不可逆である。
有限散逸制約はどの解が到達可能かだけでなく、どの学習経路が動的にアクセス可能であるかを示す。
論文参考訳(メタデータ) (Sun, 08 Feb 2026 12:47:43 GMT)