DLLM Agent: See Farther, Run Faster [94.7] 拡散大言語モデル(DLLM)は、自己回帰(AR)デコーディングの代替として、魅力的な効率とモデリング特性を持つ。
我々は、DLLMとARのバックボーンを同一のエージェントワークフロー内でインスタンス化することで、制御された環境でこれを研究する。
DLLMエージェントはARエージェントよりも平均30%以上速く、場合によっては8倍のスピードアップを達成している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:01:18 GMT)
Blind to the Human Touch: Overlap Bias in LLM-Based Summary Evaluation [89.5] 大規模言語モデル(LLM)の判断は、要約のようなタスクのために、伝統的なアルゴリズムベースのメトリクスと併用されることが多い。
要約領域における人書き応答と重なる関数としてLLM判定バイアス分析を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:39:28 GMT)
Towards Robust Scaling Laws for Optimizers [89.2] 経験的スケーリング法則は、モデルのサイズやトレーニングデータの増加に伴って損失を予測するために広く使用されている。
本研究では, 損失分解を既約, 近似, 最適化誤差に分解した結果, チンチラ方式のスケーリング法則が自然に現れることを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:40:33 GMT)
Controllable Value Alignment in Large Language Models through Neuron-Level Editing [87.8] 我々は,大言語モデルにおける制御可能な値アライメントのためのニューロンレベルの編集フレームワークNeVAを提案する。
NeVAは、汎用能力においてより少ない性能劣化を招きながら、より強力な目標値アライメントを実現する。
NeVAは平均リークを著しく減らし、残効は意味論的に関連する値クラスに限られる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:35:16 GMT)
HumanLM: Simulating Users with State Alignment Beats Response Imitation [84.9] 本稿では,実際のユーザを正確に反映したユーザシミュレータを構築する新しいトレーニングフレームワークHumanLMを提案する。
HumanLMは、強化学習を通じて、地道的な応答に一致した自然言語の潜伏状態を生成する。
本研究では,公開データに基づく実ユーザシミュレーションのための総合的なベンチマークであるHumanualを開発する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:26:28 GMT)
Are Reasoning LLMs Robust to Interventions on Their Chain-of-Thought? [79.9] 推論 LLM は、答えを出す前にステップバイステップの思考連鎖を生成する。
これらの推論は、その内部で発生する破壊の痕跡をどれほど堅牢にしていますか?
一定のタイミングでモデル自身のCoTを摂動させる制御された評価フレームワークを導入する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:02:58 GMT)
Human Identification at a Distance: Challenges, Methods and Results on the Competition HID 2025 [70.3] 距離における人間の識別に関する国際コンペティション(HID)は、2020年から毎年開催されている。
最高の性能の手法は94.2%の精度に達し、このデータセットに新しいベンチマークが設定された。
我々は重要な技術動向を分析し、将来の歩行認識研究の可能性について概説する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:22:17 GMT)
Wavelet-Domain Masked Image Modeling for Color-Consistent HDR Video Reconstruction [69.4] 高ダイナミックレンジ(LDR)ビデオ再構成は、LDRビデオから微妙な明るさ、色、詳細を復元することを目的としている。
既存の方法は、しばしば色の不正確さと時間的不整合に悩まされる。
We propose WMNet, a novel HDR video reconstruction network that leverageing Wavelet domain Masked Image Modeling。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:19:23 GMT)
Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts [68.8] 長いコンテキストでの大規模言語モデル(LLM)のトレーニングは、トレーニング時間ではなく、GPUメモリの異常なオーバーヘッドによって厳しく制限される。
この障壁に直面するメモリ効率の高いトレーニングシステムOOMBを紹介します。
本手法では,オンザフライアクティベーション・リコンピュテーションを備えたチャンク・リカレント・トレーニング・フレームワークを用いて,一定のアクティベーションメモリフットプリントを維持する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 03:56:51 GMT)
Learning to Self-Verify Makes Language Models Better Reasoners [65.8] 大規模言語モデル(LLM)は、複雑なタスクに対する有望な推論パスを生成する上で、強力なパフォーマンスを達成する。
強力な生成能力にもかかわらず、LSMは自身の答えを検証するのに弱いままである。
同じタスクであっても、生成を改善することは、自己検証の改善に繋がらないことを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:49:06 GMT)
Leveraging the Power of Ensemble Learning for Secure Low Altitude Economy [64.4] 低高度経済(LAE)は社会福祉の強化と経済成長の推進に大きく貢献している。
本稿では,セキュアなLAEのためのアンサンブル学習,研究の焦点,解決策,ケーススタディについて検討する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 23:15:58 GMT)
MedVerse: Efficient and Reliable Medical Reasoning via DAG-Structured Parallel Execution [63.1] 大規模言語モデル(LLM)は、幅広い医学的推論タスクにおいて、高いパフォーマンスと急速な進歩を示している。
彼らの逐次自己回帰的復号化力は、本質的には、鑑別診断のような平行な臨床推論を単一の線形推論経路に導く。
MedVerseは、医学的推論を並列化可能な非循環グラフ(DAG)プロセスとして再構成する複雑な医学的推論のための推論フレームワークである。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:54:01 GMT)
TextOp: Real-time Interactive Text-Driven Humanoid Robot Motion Generation and Control [62.9] TextOpはリアルタイムテキスト駆動型ヒューマノイドモーション生成および制御フレームワークである。
ストリーミング言語コマンドと実行中のオンザフライ命令修正をサポートする。
対話型モーション生成を堅牢な全身制御でブリッジすることで、TextOpは自由形式のインテント表現をアンロックする。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:42:11 GMT)
Secure Code Generation via Online Reinforcement Learning with Vulnerability Reward Model [60.6] 大規模言語モデル(LLM)は、ソフトウェア開発でますます使われているが、安全でないコードを生成する傾向は、現実世界のデプロイメントにとって大きな障壁である。
機能保存型セキュアコード生成のためのオンライン強化学習フレームワークSecCoderXを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 07:42:07 GMT)
Surveillance Facial Image Quality Assessment: A Multi-dimensional Dataset and Lightweight Model [59.4] 監視顔画像品質評価(SFIQA)に関する初の総合的研究を提案する。
SFIQA-Benchは、現実世界のシナリオで3つの広く配備された監視カメラによって撮影された5,004枚の監視顔画像で構成されている。
ノイズ、シャープネス、カラフルネス、コントラスト、忠実度、全体的な品質を含む6次元品質評価を主観的な実験により収集する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:51:03 GMT)
IM-Animation: An Implicit Motion Representation for Identity-decoupled Character Animation [58.3] インプシット法は、動画から直接動作の意味をキャプチャするが、動作と外観の絡み合いやアイデンティティの漏洩に悩まされる。
本稿では,フレームごとの動作をコンパクトな1次元モーショントークンに圧縮する新しい暗黙の動作表現を提案する。
本手法では,3段階のトレーニング戦略を用いて,トレーニング効率を高め,高い忠実性を確保する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:17:20 GMT)
When Is Enough Not Enough? Illusory Completion in Search Agents [57.0] 検索エージェントが、複数の条件をトラッキングし、検証し、維持することで、すべての要件に対して確実に理性性を持たせるかどうかを調査する。
エージェントは、未解決の制約や違反の制約にもかかわらずタスクが完了したと信じており、未検証の回答につながる。
我々は、実行中の明示的な制約状態追跡が、推論時トラッカーであるLiveLedgerを介してこれらの障害を緩和するかどうかを検討する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:50:38 GMT)
Dense Neural Networks are not Universal Approximators [53.3] ニューラルネットワークは任意の連続関数の普遍性を持たないことを示す。
ReLUニューラルネットワークは、重みと入出力次元の自然な制約を受ける。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:52:38 GMT)
Aegis: Towards Governance, Integrity, and Security of AI Voice Agents [52.8] 音声エージェントのガバナンス,整合性,セキュリティのためのフレームワークであるAegisを提案する。
我々は,銀行コールセンタ,ITサポート,ロジスティクスにおけるケーススタディを通じて,この枠組みを評価する。
モデルファミリ間の系統的な差異を観察し,より感受性の高いオープンウェイトモデルを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:51:36 GMT)
Pull Requests as a Training Signal for Repo-Level Code Editing [49.8] Clean Pull Request(Clean-PR)は、現実のGitHubプルリクエストをリポジトリレベルの編集のトレーニングシグナルとして活用する、トレーニング中のパラダイムである。
ノイズの多いプルリクエストの差分を,再構築と検証を通じて検索/リプレース編集ブロックに変換する,スケーラブルなパイプラインを導入する。
SWE-benchでは,SWE-bench Liteが13.6%,SWE-bench Verifiedが12.3%,命令調整ベースラインが大幅に向上した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:22:25 GMT)
W&D:Scaling Parallel Tool Calling for Efficient Deep Research Agents [48.2] そこで本稿では,エージェントの動作と性能を,深さだけでなく幅を並列ツールコールでスケーリングする際のフレームワークを提案する。
本研究では,スケーリング幅が深層調査ベンチマークの性能を著しく向上すると同時に,正しい回答を得るために必要なターン数を削減できることを実証する。
以上の結果から,幅と深さのトレードオフを最適化することが,高効率深層研究エージェントへの重要な経路であることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:49:53 GMT)
Fine-R1: Make Multi-modal LLMs Excel in Fine-Grained Visual Recognition by Chain-of-Thought Reasoning [47.9] Fine-R1は、ファイングラインド視覚認識用に設計されたR1スタイルのMLLMである。
4ショットのトレーニングだけで、Fine-R1は既存のMLLMよりも優れており、MLLMの推論や、対照的なCLIPモデルも優れている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:16:51 GMT)
AgentSys: Secure and Dynamic LLM Agents Through Explicit Hierarchical Memory Management [47.5] 既存の防御は肥大した記憶を与えられたまま扱い、回復力を維持することに集中する。
我々は、明示的なメモリ管理を通じて間接的なインジェクションを防御するフレームワークであるAgentSysを紹介する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:28:51 GMT)
Brep2Shape: Boundary and Shape Representation Alignment via Self-Supervised Transformers [46.9] 境界表現(B-rep)はコンピュータ支援設計(CAD)の業界標準である
ディープラーニングはB-repモデルの処理において有望であるが、既存の手法は表現ギャップに悩まされている。
本稿では,抽象境界表現と直感的な形状表現との整合性を考慮した自己教師付き事前学習手法であるBrep2Shapeを紹介する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:00:47 GMT)
Agents in the Wild: Safety, Society, and the Illusion of Sociality on Moltbook [46.9] MoltbookはAIのみのソーシャルプラットフォームで、27,269人のエージェントが9日間で137,485の投稿と345,580のコメントを作成した。
エージェントは、ガバナンス、経済、部族のアイデンティティ、組織化された宗教を3~5日以内に自発的に発展させる。
豊かな社会的生産にもかかわらず、相互作用は構造的に中空である。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:36:20 GMT)
TeleBoost: A Systematic Alignment Framework for High-Fidelity, Controllable, and Robust Video Generation [45.9] ポストトレーニングは、事前訓練されたビデオジェネレータをプロダクション指向のモデルに変換するための決定的なステップである。
本報告では,指導的政策形成,報酬駆動型強化学習,嗜好に基づく改善を組織化する,体系的なポストトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:49:25 GMT)
Letting Tutor Personas "Speak Up" for LLMs: Learning Steering Vectors from Dialogue via Preference Optimization [45.4] 教師と学生の対話に埋め込まれた教師ペルソナが、明示的に指示された指示に頼らずにLLM行動の指導にどのように使えるかを示す。
ステアリングベクトルは、対話コンテキスト間でのチューター固有の変化をキャプチャし、接地型チューター発話とのセマンティックアライメントを改善し、嗜好に基づく評価を増大させる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:44:07 GMT)
MemPot: Defending Against Memory Extraction Attack with Optimized Honeypots [44.9] 我々はメモリ抽出攻撃に対する最初の理論的に検証された防御フレームワークであるMemPotを提案する。
MemPotは攻撃者の検索確率を最大化するトラップ文書を生成する。
MemPotは、追加のオンライン推論遅延を発生させ、標準タスクでエージェントのユーティリティを保存する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:31:44 GMT)
Gaussian Match-and-Copy: A Minimalist Benchmark for Studying Transformer Induction [44.8] 本稿では,2階相関信号による長距離検索を分離するミニマリストベンチマークを提案する。
数値的な研究により、このタスクは変換器のマッチング・アンド・コピー回路開発における重要な質的な側面を保っていることが示されている。
明示的な技術的条件下での経験的損失を解消するGD軌道に対して,この極大アライメントを証明した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:18:11 GMT)
UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing [44.1] マルチモーダルモデルは、しばしば深い推論を必要とする複雑な合成タスクに苦しむ。
画像生成と画像編集を調和させる統一フレームワークUniReasonを提案する。
我々は,大規模推論中心のデータセットを体系的に構築することで,このフレームワークをサポートする。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:35:02 GMT)
Semantic Search At LinkedIn [43.7] 我々は、LinkedInのLLMベースのAIジョブサーチとAIピープルサーチのためのセマンティックサーチフレームワークを提示する。
プリフィル指向の推論アーキテクチャは、固定遅延制約の下でランキングのスループットを75倍以上に向上させる。
最初のLLMベースのランキングシステムの一つで、効率は従来のアプローチに匹敵する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:59:03 GMT)
Sign-Based Optimizers Are Effective Under Heavy-Tailed Noise [43.4] 最近、LionやMuonのような符号ベースの最適化アルゴリズムはAdamWよりも優れた経験的性能を示している。
本稿では,重み付き勾配雑音のレンズを通して理論と実践のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 07:47:14 GMT)
OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration [42.7] 動的データ選択フレームワークであるOPUS(Producted Utility Selection)を提案する。
OPUSは、有効な更新を安定した分散プロキシから派生したターゲット方向に投影することで、候補をスコア付けする。
GPT-2 Large/XL on FineWeb and FineWeb-Edu with 30B tokensの事前トレーニングでは、OPUSは工業レベルのベースラインや200Bによるフルトレーニングよりも優れています。
SciencePedia上でのQ3-8B-Baseの事前トレーニングでは、OPUSは3Bトークンによる完全なトレーニングに比べて0.5Bトークンしか使用せず、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:57:28 GMT)
Steer2Adapt: Dynamically Composing Steering Vectors Elicits Efficient Adaptation of LLMs [42.1] STEER2ADAPTは、大きな言語モデル(LLM)をスクラッチから学習するのではなく、ステアリングベクターを構成することで適応するフレームワークである。
STEER2ADAPTの有効性を実証し、平均8.2%の改善を実現した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:00:50 GMT)
Provable Cooperative Multi-Agent Exploration for Reward-Free MDPs [40.1] 報酬のない探索における協調型マルチエージェント強化学習について検討した。
我々は,有限水平MDPに着目し,段階学習フレームワークを採用する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 18:47:34 GMT)
How does longer temporal context enhance multimodal narrative video processing in the brain? [39.6] 本研究では,ビデオクリップの時間的文脈長とナラティブ・タスクが自然主義映画視聴時の脳-モデルアライメントを促進するかを検討した。
マルチモーダル大言語モデル(MLLM)におけるクリップ持続時間の増加は脳のアライメントを大幅に改善することを発見した。
短い時間窓は知覚的および初期言語領域と一致し、長い窓はより高階の積分領域を優先的に整列する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:34:00 GMT)
Evaluating Large Language Models for Detecting Architectural Decision Violations [39.5] アーキテクチャ決定レコード(ADR)は、ソフトウェアアーキテクチャの品質維持において中心的な役割を果たす。
大規模言語モデル(LLM)の最近の進歩は、大規模アーキテクチャ推論を自動化する新しい可能性を開く。
我々は,LLMがオープンソースシステムにおける決定違反を効果的に識別する方法について,その合意,正確性,本質的な制約を検証することによって検討した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:36:14 GMT)
Linguistic properties and model scale in brain encoding: from small to compressed language models [39.0] 近年の研究では、大規模言語モデル(LLM)のスケーリングは、人間の脳活動との整合性を改善することが示されている。
脳関連表現を捉えるのに必要な最小限のモデル容量は何か?
モデルスケールと数値精度の制約が脳のアライメントに与える影響について検討する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:48:45 GMT)
VividFace: Real-Time and Realistic Facial Expression Shadowing for Humanoid Robots [37.6] ヒューマノイドロボットのためのリアルタイムかつリアルな表情陰影システムVividFaceを提案する。
VividFaceは、人間の表情を0.05秒以内に模倣することで、鮮やかなヒューマノイド顔を生成する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:51:50 GMT)
Fat-Cat: Document-Driven Metacognitive Multi-Agent System for Complex Reasoning [36.6] Fat-Catは、状態管理の信号対雑音比を改善するドキュメント駆動型エージェントアーキテクチャである。
これによってKimi-k2モデルは、HotPotQAで独自のGPT-4oベースラインを上回ります。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 02:15:16 GMT)
Adaptive Image Zoom-in with Bounding Box Transformation for UAV Object Detection [36.5] 本研究では,UAV画像上の物体検出のための簡易かつ効率的な適応型ズームインフレームワークについて検討する。
主な動機は、前景の物体が一般的な風景画像よりも小さく、スペーサーであることである。
提案したZoomDetはアーキテクチャに依存しておらず、任意のオブジェクト検出アーキテクチャに適用できる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:16:45 GMT)
AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration [36.0] AOrchestraはフレームワークに依存しないエージェント抽象化で、任意のエージェントをインストラクション、コンテキストツール、モデルとしてモデル化する。
タスク関連コンテキスト、ツール、モデルをキュレートし、オンザフライで自動エージェント生成を通じて実行を委譲する。
AOrchestraはGeminiと組んで最強のベースラインに対して16.28%の相対的な改善を達成した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:31:45 GMT)
Characterization of Autofluorescence in Optical Fibers for NV-based Sensing Applications [35.2] 標準光ファイバの光スペクトルについて, 物質依存性, 物理的影響, 励起電力, 波長による蛍光スケーリングについて検討した。
本研究は,NVを用いた量子センシングのための最適光ファイバの選択を導くため,最小の背景信号を持つスペクトル成分とファイバタイプを同定した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:19:58 GMT)
Forecasting Developer Environments with GenAI: A Research Perspective [35.1] コード記述から抽象化レベルを向上する能力は、統合開発環境(IDE)内での人間とAIの相互作用を変える可能性がある。
ソフトウェアエンジニアリング、人工知能、ヒューマンコンピュータインタラクションドメインの専門家が集まって、Shonan Meeting 222で課題と機会について議論した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 07:16:01 GMT)
Scout Before You Attend: Sketch-and-Walk Sparse Attention for Efficient LLM Inference [35.0] トレーニング不要なスパースアテンション手法であるSketch&Walk Attentionを導入する。
軽量なスケッチと決定論的ウォークで空間性を決定する。
最大6倍の推論スピードアップを達成しながら、いくつかの設定で集中的な注意をわずかに上回ります。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:27:11 GMT)
Learned Finite Element-based Regularization of the Inverse Problem in Electrocardiographic Imaging [33.8] 時間的正規化を学習分野のFoE(Fields-of-Experts)と組み合わせた時空間正規化フレームワークを提案する。
心臓表面メッシュ上に有限の離散要素を導出し,Mosco収束性を証明し,FoE項を扱えるスケーラブルな最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:44:55 GMT)
Process-of-Thought Reasoning for Videos [33.7] Process-of-Thought (PoT) Reasoning for Videosは、ビデオ推論を軽量で検証可能なステップのシーケンスに構造化することで、推論プロセスを明確にするフレームワークである。
PoT は (i) 時間的エビデンス選択、 (ii) ステップワイズ状態更新、 (iii) 制限された応答合成をインターリーブし、ビデオエビデンスのトレーサビリティを維持しながら仮説を段階的に洗練することを可能にする。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:25:46 GMT)
IGMiRAG: Intuition-Guided Retrieval-Augmented Generation with Adaptive Mining of In-Depth Memory [33.0] Retrieval-augmented Generation (RAG)は、信頼性の高い知識メモリを備えた大規模言語モデルである。
近年の研究では、グラフとハイパーグラフをRAGに統合し、構造化リンクとしてペアとマルチエンタリティの関係を捉えている。
我々は人間の直観誘導推論に触発されたIGMiRAGを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:42:31 GMT)
Progressive Multi-Agent Reasoning for Biological Perturbation Prediction [32.7] 複雑な化学摂動下での標的遺伝子の制御を予測するための新しいベンチマークであるLINCSQAを提案する。
また,PBio-Agentを提案する。PBio-Agentは,難易度を考慮したタスクシークエンシングと反復的知識の洗練を統合したマルチエージェントフレームワークである。
私たちの重要な洞察は、同じ摂動によって影響を受ける遺伝子は因果構造を共有しており、自信を持って予測された遺伝子がより困難なケースを文脈化できるということです。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:59:44 GMT)
Fin-RATE: A Real-world Financial Analytics and Tracking Evaluation Benchmark for LLMs on SEC Filings [31.9] Fin-RATEは、米国証券取引委員会(SEC)の提出書類に基づいて構築されたベンチマークで、個別の開示、共有トピックによるクロスエンタリティ比較、レポート期間を通じて同じ会社の経時的追跡について、財務アナリストの推論を反映している。
その結果、タスクが単一文書推論から縦断的、横断的分析へ移行するにつれて、精度が18.60%低下し、14.35%低下した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:54:37 GMT)
AD-MIR: Bridging the Gap from Perception to Persuasion in Advertising Video Understanding via Structured Reasoning [31.1] 広告意図を2段階アーキテクチャで復号化するためのフレームワークであるAD-MIRを紹介する。
構造化推論エージェント(Structured Reasoning Agent)は、反復的な調査ループを通じてマーケティングの専門家を模倣し、物語を分解して暗黙の説得戦術を推論する。
最先端のパフォーマンスを達成し、最強の汎用エージェントであるDVDを1.8%上回り、9.5%の精度で調整された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:14:06 GMT)
Dense Feature Learning via Linear Structure Preservation in Medical Data [30.8] 医学データのためのディープラーニングモデルは、典型的には、少数の識別方向への表現の崩壊を促すタスク固有の目的を用いて訓練される。
医用埋め込みの線形構造を明示的に形成する表現中心型フレームワークである高密度特徴学習を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:23:35 GMT)
Looking and Listening Inside and Outside: Multimodal Artificial Intelligence Systems for Driver Safety Assessment and Intelligent Vehicle Decision-Making [30.7] 本研究は、ドライバーを理解するための付加的な情報源として、オーディオモダリティを論じる。
LILOを音声信号を組み込んで拡張し、L-LIO(L-LIO)フレームワークを構築した。
実験結果によると、音声は特にニュアンスや文脈に富んだシナリオにおいて、安全に関する洞察をもたらす。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:25:02 GMT)
Learning Brain Representation with Hierarchical Visual Embeddings [30.7] 本稿では,事前学習した視覚エンコーダの帰納的バイアスを利用した脳画像アライメント戦略を提案し,階層的,マルチスケールな視覚表現を捉える。
本手法は,検索精度と再現精度のバランスが良好である。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:14:03 GMT)
PHAT: Modeling Period Heterogeneity for Multivariate Time Series Forecasting [30.3] 実世界のデータの周期性をモデル化するためのPHAT(Period Heterogeneity-Aware Transformer)を提案する。
バケット内の相互作用を制限し、クロスバケット接続をマスキングすることにより、PHATは一貫性のない期間からの干渉を効果的に回避する。
実世界の14のデータセットのPHATを18のベースラインに対して評価し,既存の手法よりも有意に優れていることを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:13:07 GMT)
On Generation in Metric Spaces [29.7] 分離可能な計量インスタンス空間における生成について研究する。
我々は$(varepsilon,varepsilon')$-クロージャ次元を導入する。
一般の計量空間では、生成可能性は非常にスケールに敏感であり、計量に依存している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:37:59 GMT)
UTOPIA: Unlearnable Tabular Data via Decoupled Shortcut Embedding [29.5] 非学習不可能な例(UE)は、プライベートビジョンデータにおける不正なモデルトレーニングを防止するための実践的なメカニズムとして現れている。
汚染スペクトルがクリーンなセマンティックスペクトルを超過すると、証明不能が実現可能であることを示す。
提案するUnlearnable Tabular Data via DecOuPled Shortcut EmbeddIng (UTOPIA)は,特徴冗長性を利用して最適化を2つのチャネルに分離する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:44:49 GMT)
M2A: Multimodal Memory Agent with Dual-Layer Hybrid Memory for Long-Term Personalized Interactions [29.5] M2Aは、オンライン更新を通じてパーソナライズされたマルチモーダル情報を保持するエージェント二重層ハイブリッドメモリシステムである。
ChatAgentはユーザーインタラクションを管理し、メモリの問い合わせや更新のタイミングを自律的に決定する。
MemoryManagerは、ChatAgentからのメモリ要求を2層メモリバンクの詳細な操作に分解する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:13:56 GMT)
Optimizing Few-Step Generation with Adaptive Matching Distillation [29.2] 分散マッチング蒸留(DMD)は強力な加速パラダイムであるが、その安定性は禁制区域でしばしば損なわれる。
本稿では,従来の手法を暗黙の戦略として再解釈する統一最適化フレームワークを提案する。
本稿では,アダプティブマッチング蒸留(Adaptive Matching Distillation,AMD)を導入する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:00:20 GMT)
BitLogic: Training Framework for Gradient-Based FPGA-Native Neural Networks [28.8] BitLogicはFPGAネイティブニューラルネットワークのためのエンドツーエンドのトレーニング可能なフレームワークである。
マルチ累積演算をFPGAプリミティブに直接マップする微分可能なLUTノードに置き換える。
ネイティブバイナリ計算、疎結合、効率的なハードウェア実現を提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:32:44 GMT)
Analyzing and Guiding Zero-Shot Posterior Sampling in Diffusion Models [28.6] 本稿では、前者のガウス性仮定に依拠して、そのような近似した後方サンプルの厳密な解析を提案する。
理想的な後部サンプリングと拡散に基づく再構成アルゴリズムの両方がクローズド形式で表現可能であることを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:44:52 GMT)
KV-CoRE: Benchmarking Data-Dependent Low-Rank Compressibility of KV-Caches in LLMs [28.1] 大規模な言語モデルは、自動回帰復号時に冗長な計算を避けるためにkv-cachesに依存している。
コンテキストの長さが大きくなると、キャッシュの読み書きはGPUメモリの帯域幅を急速に飽和させる。
最近の研究はKV-cache圧縮を探求しているが、ほとんどのアプローチはkv-cachesのデータ依存性を無視している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:57:16 GMT)
Principled Synthetic Data Enables the First Scaling Laws for LLMs in Recommendation [27.6] 大規模言語モデル(LLM)は推薦システムにとって有望なフロンティアである。
本稿では,高品質な合成データを生成するための新しい階層化フレームワークを提案する。
われわれは、当社の高品質なレコメンデーション特化データに基づいて、継続的に事前訓練されたLSMの堅牢なパワーロースケーリングを、初めて実証的に実証した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:15:15 GMT)
Patch-to-PoC: A Systematic Study of Agentic LLM Systems for Linux Kernel N-Day Reproduction [27.5] LLMをベースとしたLinuxカーネルの脆弱性再現に関する大規模な研究を行った。
K-Reproはカーネルセキュリティパッチを入力として使用し、LinuxカーネルのN日脆弱性のエンドツーエンドバグ再現を自動化する。
以上の結果から,K-Reproは実時間と金銭的コストで50%以上の症例を再現できるPoCを生成できることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:34:08 GMT)
SVD-Preconditioned Gradient Descent Method for Solving Nonlinear Least Squares Problems [27.2] 本稿では,非線形最小二乗問題に対する新しい最適化アルゴリズムを提案する。
この方法は、ジャコビアンの特異値分解(SVD)を用いて勾配降下方向をプレコンディションすることで導出される。
提案手法の標準正則性仮定の下での局所線形収束を確立し、適切な条件下でアルゴリズムの修正版に対する大域収束を証明した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 18:53:00 GMT)
Trace-Focused Diffusion Policy for Multi-Modal Action Disambiguation in Long-Horizon Robotic Manipulation [27.1] Trace-Focused Diffusion Policy (TF-DP) は、ロボットの実行履歴にアクション生成を明示的に条件付ける拡散ベースのフレームワークである。
実世界のロボット操作作業におけるTF-DPの評価を行った。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:06:43 GMT)
Intent Mismatch Causes LLMs to Get Lost in Multi-Turn Conversation [26.9] 根本原因は本質的な能力不足というよりも,意図的なアライメントギャップにある,と我々は主張する。
本稿では,Mediator-Assistantアーキテクチャによるタスク実行から意図的理解を分離することを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 03:41:04 GMT)
Uncovering Modality Discrepancy and Generalization Illusion for General-Purpose 3D Medical Segmentation [26.7] 3D医療基盤モデルは汎用機能を備えた多目的ツールとして想定されている。
このデータセットは、490体のPET/CTと464体のPET/MRIスキャンからなる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:54:10 GMT)
MSP-LLM: A Unified Large Language Model Framework for Complete Material Synthesis Planning [24.1] 2つのサブプロブレムからなる構造化プロセスとしてMSPを定式化する統合フレームワークであるMSP-LLMを提案する。
本手法では,両タスクを化学的に一貫した決定連鎖に整理する中間決定変数として,離散材料クラスを導入する。
MSP-LLM は、PP と SOP の両方の既存の手法と完全な MSP タスクを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:37:43 GMT)
Generative structural elucidation from mass spectra as an iterative optimization problem [24.0] 本稿では,LC-MS/MSから構造決定を行う計算ワークフローを反復最適化問題として導入する。
我々は,NIST'20およびMassSpecGymデータセットにおけるクロマトグラフィーの性能を,スタンドアロンの解明パイプラインと既存の逆モデルの補完として示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:34:38 GMT)
Deriving Neural Scaling Laws from the statistics of natural language [23.7] データ制限スケーリング法則の場合、最初の理論を提供する。
ニューラルスケーリング指数を予測できる言語の2つの重要な統計特性を分離する。
本理論は, GPT-2およびLLaMAスタイルモデルのトレーニングから得られた, 実験的に測定されたニューラルスケーリング法則と有意な一致を示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:40:28 GMT)
Multi-Agent Systems Shape Social Norms for Prosocial Behavior Change [23.0] 本研究では,マルチエージェントシステムが寄付行動を促進するために「仮想社会規範」を確立できるかどうかを考察する。
その結果,マルチエージェントの相互作用は社会的規範や寄付意欲を効果的に増大させることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:23:54 GMT)
SpatialReward: Bridging the Perception Gap in Online RL for Image Editing via Explicit Spatial Reasoning [22.8] 本研究では,空間的推論による正確な検証を行う報酬モデルを提案する。
予測された編集領域に推論を固定することにより、SpatialRewardはピクセルレベルの証拠に意味判断を基礎付ける。
我々のモデルはMMRB2とEditReward-Benchの最先端性能を実現し,提案したMultiEditReward-Benchのプロプライエタリ評価器よりも優れている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:23:34 GMT)
Efficient Table Retrieval and Understanding with Multimodal Large Language Models [22.5] タブラルデータは、財務報告、手書き記録、文書スキャンなど、幅広い現実世界のシナリオで画像形式でキャプチャされることが多い。
これらの視覚表現は、構造的複雑さと視覚的複雑さの両方を組み合わせることによって、機械理解に固有の課題をもたらす。
本研究では,MLLMがテーブルイメージの大規模なコレクション上でクエリに応答できるフレームワークであるTabRAGを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:50:33 GMT)
ViCA: Efficient Multimodal LLMs with Vision-Only Cross-Attention [22.4] ViCAは最小限のMLLMアーキテクチャであり、視覚トークンはすべての自己注意層とフィードフォワード層をバイパスし、選択された層での疎相互注意によってのみテキストと対話する。
ViCAは、ベースライン精度の98%を保ちながら、視覚面を4%に減らし、常に優れた性能と効率のトレードオフを達成している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:46:05 GMT)
Proximal Action Replacement for Behavior Cloning Actor-Critic in Offline Reinforcement Learning [22.2] 安定なアクターによって生成される高価値なアクションに置き換える,プラグアンドプレイのトレーニングサンプル置換器を提案する。
実験の結果、PARはパフォーマンスを継続的に改善し、基礎的なTD3+BCと組み合わせることで最先端にアプローチすることがわかった。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:44:27 GMT)
TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning [22.1] 時間的知識グラフ質問応答(TKGQA)は、時間的知識ベースを活用することで、時間に敏感な質問に答えることを目的としている。
現在のプロンプト戦略は、その効果を2つの主要な方法で制限している。
自律型計画と適応型検索機能を備えた新しいエージェントである textbfTKG-Thinker を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:47:42 GMT)
SIGMA: Selective-Interleaved Generation with Multi-Attribute Tokens [21.7] 本稿では,拡散変圧器内でのインターリーブ多条件生成を可能にする統合後学習フレームワークSIGMAを提案する。
SIGMAは、様々な編集・生成タスクにおいて、制御性、条件間の整合性、視覚的品質を改善する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:20:50 GMT)
SoK: Credential-Based Trust Management in Decentralized Ledger Systems [21.7] 分散型システムとブロックチェーンの台頭は、クレデンシャルベースの分散型信頼管理システムへの関心を喚起した。
本稿では,認証に基づくDTMSの体系的レビューを通じて,理論と実践のギャップを埋める。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:38:40 GMT)
Learning Molecular Chirality via Chiral Determinant Kernels [21.3] キリティは化学や生物学において立体特異的な振る舞いを管理する基本的な分子特性である。
ChiDeKは分子表現学習にステレオジェニック情報を統合するフレームワークである。
ChiDeKは最先端のベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 07:21:43 GMT)
Do We Need Adam? Surprisingly Strong and Sparse Reinforcement Learning with SGD in LLMs [21.2] 本研究では,強化学習が従来よりもパラメータ効率が高いことを示す。
実験により、よりメモリ効率のよいSGDが一致し、LLMのRLにおいてAdamWより優れることが示された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 23:25:26 GMT)
ComPass: Contrastive Learning for Automated Patch Correctness Assessment in Program Repair [20.6] 予備訓練言語モデル(PLM)に基づく自動パッチ正当性評価手法であるComPassを提案する。
我々はComPassが88.35%の精度を達成し、最先端のAPPTを著しく上回っていることを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:17:21 GMT)
Parallel Track Transformers: Enabling Fast GPU Inference with Reduced Synchronization [20.0] Parallel Track (PT) Transformerは、デバイス間の依存関係を最小限にするために再構成される新しいアーキテクチャパラダイムである。
その結果,最大15~30%の時間短縮,2~12%の時間短縮,最大31.90%のスループット向上が報告された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:42:20 GMT)
SERE: Similarity-based Expert Re-routing for Efficient Batch Decoding in MoE Models [19.6] 類似性に基づくSERE(Expert Re-routing method for Efficient batch decoding in MoE model)を提案する。
SEREは、セカンダリエキスパートから最もよく似たプライマリエキスパートにトークンを再ルートすることで、アクティブエキスパートの数を動的に削減する。
SEREは、最小品質の損失で最大2.0倍のスピードアップを実現し、コスト効率とレイテンシに敏感な大規模なMoEデプロイメントのための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:51:16 GMT)
SoulX-FlashHead: Oracle-guided Generation of Infinite Real-time Streaming Talking Heads [19.5] 本稿では,リアルタイム,無限長,高忠実なストリーミングビデオ生成のための統合フレームワークであるSoulX-FlashHeadを提案する。
ストリーミングシナリオにおける音声機能の不安定性に対処するために,テンポラルオーディオコンテキストキャッシュ機構を備えたストリーム対応時空間事前学習を導入する。
VividHeadは大規模で高品質なデータセットで、厳格なトレーニングをサポートするために、782時間の厳格なアライメントされた映像を格納しています。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:58:16 GMT)
Unified Biomolecular Trajectory Generation via Pretrained Variational Bridge [19.3] 本稿では,初期構造を雑音のある潜在空間にマッピングし,ステージ固有の目標に向けて輸送する,事前訓練変分橋(PVB)を提案する。
これにより、単一構造とペアの軌道データの両方のトレーニングを統一し、ドメイン間の構造的知識を一貫した使用を可能にする。
タンパク質とタンパク質-リガンド複合体の実験により、PVBはMDから熱力学的および運動論的観測物を忠実に再現し、安定かつ効率的な生成力学を提供することを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:32:37 GMT)
Improving Variable-Length Generation in Diffusion Language Models via Length Regularization [19.3] 拡散大言語モデル(DLLM)は本質的に可変長生成に不適である。
この失敗は、生成信頼度推定における本質的な長さバイアスから生じることを示す。
生成長を明示変数として扱うDLLMの長規則化推論フレームワークであるLR-DLLMを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:48:19 GMT)
When the Model Said 'No Comment', We Knew Helpfulness Was Dead, Honesty Was Alive, and Safety Was Terrified [19.1] 大規模言語モデル(LLM)は、人的価値に応じて、有用で、無害で、誠実(HHH)でなければならない。
既存の作業では、SFT(Supervised Fine-Tuning)とMoE(Mixture-of-Experts)を使用してLCMを調整している。
破滅的な忘れ込みを軽減し、推論信頼性を向上させる2段階フレームワークであるAlignXを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:52:57 GMT)
MSN: A Memory-based Sparse Activation Scaling Framework for Large-scale Industrial Recommendation [19.1] メモリベースのスパースアクティベーションスケーリングフレームワークMSNを提案する。
MSNは大きなパラメータ化されたメモリからパーソナライズされた表現を検索し、下流の機能相互作用モジュールに統合する。
MSNは、高い効率を維持しながら、リコメンデーション性能を継続的に改善する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:43:51 GMT)
The Laplacian Keyboard: Beyond the Linear Span [18.4] 線形スパンを超える階層的なフレームワークであるLaplacian Keyboard (LK)を紹介します。
LKはこれらの固有ベクトルからタスクに依存しない選択肢のライブラリを構築し、最適なポリシーを含むことが保証される行動基盤を形成する。
メタ政治は、これらのオプションを動的に縫い合わせることを学び、元の線形制約の外のポリシーの効率的な学習を可能にします。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 23:25:29 GMT)
A Unified Framework for Rethinking Policy Divergence Measures in GRPO [17.4] RLVR(Reinforcement Learning with Verified Reward)は、Large Language Models(LLM)の推論能力向上のための重要なパラダイムとして登場した。
GRPOなどの既存のRLVR法の多くは、クリッピング率比を通じてポリシーのばらつきを制限することで安定した更新を保証する。
本稿では,政策分散という一般的な概念を通じて既存の手法を特徴付ける統一型クリッピングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:55:55 GMT)
Quantifying Explanation Quality in Graph Neural Networks using Out-of-Distribution Generalization [17.0] 説明一般化スコア(英: Explanation-Generalization Score、EGS)は、GNNの説明の因果関係を定量化する計量である。
EGSは、因果サブストラクチャをキャプチャする能力に基づいて、説明書のランク付けのための原則化されたベンチマークを提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:27:35 GMT)
SciClaimEval: Cross-modal Claim Verification in Scientific Papers [16.9] 本稿では,クレーム検証タスクのための新しい科学的データセットであるSciClaimEvalを紹介する。
SciClaimEvalは、発行された論文から直接抽出された反論を含む、真正な主張を特徴としている。
反証クレームを作成するために,我々は,主張を変更するか,あるいは大きな言語モデル(LLM)に頼らずに,支持するエビデンス(図や表)を変更する新しいアプローチを導入する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:58:55 GMT)
CAM: A Causality-based Analysis Framework for Multi-Agent Code Generation Systems [16.6] 我々は,textbfMACGS のための最初の textbfCausality ベースの textbfAnalysis フレームワーク CAM を提案する。
システム正しさの重要な特徴を特定し,その重要度を集計する。
我々の研究はMACGSの設計と展開に関する実用的な洞察を提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:59:41 GMT)
Systematic Characterization of Transmon Qubit Stability with Thermal Cycling [16.4] 4つの熱サイクルにまたがる1年以上にわたる27個の周波数可変トランスモニブル量子ビットの包括的経時的特性について述べる。
この結果は超伝導ハードウェアの安定性の明確な階層を確立した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:37:53 GMT)
MUFASA: A Multi-Layer Framework for Slot Attention [16.3] MUFASAは、教師なしオブジェクトセグメンテーションに対する注意度に基づくアプローチをスロットするプラグイン・アンド・プレイ・フレームワークである。
我々のモデルは、ViTエンコーダの複数の特徴層にまたがるスロットアテンションを計算し、それらのセマンティックリッチ性を完全に活用する。
複数の層で得られたスロットを統一されたオブジェクト中心表現に集約する融合戦略を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:44:56 GMT)
UEREBot: Learning Safe Quadrupedal Locomotion under Unstructured Environments and High-Speed Dynamic Obstacles [16.1] UEREBotは階層的なフレームワークで、スロープランニングと即時回帰回避を分離する。
我々はIsaac LabのシミュレーションでUEREBotを評価し,それを車載認識機能を備えたUnitree Go2上にデプロイした。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:09:48 GMT)
LLM-Guided Diagnostic Evidence Alignment for Medical Vision-Language Pretraining under Limited Pairing [15.9] 既存のCLIPスタイルの医療ビジョン-言語事前訓練法は、大域的または局所的なアライメントと実質的なペアデータに依存している。
本研究では, 事前学習目標をエビデンスレベルのアライメントにシフトさせるため, LLMガイドによる診断エビデンスアライメント手法を提案する。
本手法は,句のグラウンド化,画像テキスト検索,ゼロショット分類において,一貫した,重要な改善を実現する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:29:15 GMT)
EventCast: Hybrid Demand Forecasting in E-Commerce with LLM-Based Event Knowledge [15.3] EventCastは、将来のイベント知識を時系列予測に統合するモジュラー予測フレームワークである。
10ヶ月にわたって、160のリージョンの4つの国にまたがる現実世界のeコマースシナリオにデプロイされている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:36:37 GMT)
SoK: DARPA's AI Cyber Challenge (AIxCC): Competition Design, Architectures, and Lessons Learned [15.2] 設計文書、ソースコード、実行トレース、主催者や競合チームとの議論に基づいて、コンペティションの構造と重要な設計決定について検討する。
我々の分析では、CRSのパフォーマンスを本当に推進し、チームによって達成された真の技術的進歩を特定し、将来の研究のためにオープンな制限を公開する要因を明らかにしています。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:21:27 GMT)
MDL: A Unified Multi-Distribution Learner in Large-scale Industrial Recommendation through Tokenization [14.5] 産業レコメンデータシステムは、多様なユーザインタラクションやコンテキストを扱うために、MSL(Multi-scenario Learning)とMulti-task Learning(MTL)を採用するようになっている。
既存のアプローチでは,(1)複雑な特徴モジュールとの相互作用が限られているため,大規模モデルパラメータの非活用,(2)統合されたフレームワークにおけるシナリオとタスク情報の共同モデリングの難しさ,という2つの重大な欠点がある。
大規模言語モデル(LLM)における「プロンプト」パラダイムにインスパイアされた、統一された textbfMulti-textbfDistribution textbfL MSL フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:34:27 GMT)
Active Learning Using Aggregated Acquisition Functions: Accuracy and Sustainability Analysis [14.4] Active Learning(AL)は、トレーニング中のアノテーションの最も情報性の高いサンプルを戦略的に選択する機械学習アプローチである。
この戦略はラベリングコストを削減するだけでなく、ニューラルネットワークトレーニング時の省エネにも寄与する。
我々は、その精度と計算コストを分析して、最先端の取得機能を実装し、評価する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:42:12 GMT)
From Native Memes to Global Moderation: Cros-Cultural Evaluation of Vision-Language Models for Hateful Meme Detection [13.9] 本稿では,最先端ビジョン言語モデル(VLM)の文化的相互堅牢性を定量的に評価する手法を提案する。
i)学習戦略(ゼロショット対ワンショット)、(ii)言語(ネイティブ対イングリッシュ)、(iii)意味と検出に対する翻訳効果の3つを分析した。
その結果,共通の翻訳・翻訳・検出アプローチは性能を低下させる一方,文化的に整合した介入(母語プロンプトとワンショット学習)は検出を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:14:57 GMT)
ParisKV: Fast and Drift-Robust KV-Cache Retrieval for Long-Context LLMs [13.8] 本稿では,衝突型候補選択に基づくドリフトロバスト,GPUネイティブなKV-cache検索フレームワークを提案する。
ParisKVはUnified Virtual Addressing (UVA)を介してCPUオフロードされたKVキャッシュをサポートする
ParisKVは、長期のインプットと長期のベンチマークにおいて、完全な注目の質にマッチする。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 22:26:45 GMT)
Federated Learning with Profile Mapping under Distribution Shifts and Drifts [13.3] フェデレートラーニング(FL)は、生データを共有せずに、クライアント間で分散モデルトレーニングを可能にする。
既存の方法は、クライアント間の分散シフトと時間とともに分散のドリフトに対処できないことが多い。
クライアントやクラスタのアイデンティティに頼ることなく、分散シフトとドリフトの両方を明示的に処理する新しいFLフレームワークであるFeromaを紹介します。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:31:50 GMT)
Reverse-Engineering Model Editing on Language Models [13.3] textitKSTER (textbfKeytextbfSpaceReconstextbfTruction-then-textbfEntropytextbfReduction) という2段階のリバースエンジニアリング攻撃を提案する。
我々の攻撃は、高い成功率で編集されたデータを復元することができる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:35:59 GMT)
Adaptive Scaffolding for Cognitive Engagement in an Intelligent Tutoring System [13.2] ICAPフレームワークは、Passive、Active、Constructive、Interactiveの4つの認知エンゲージメントレベルを定義している。
2つの異なるICAPモードで作業例を動的に選択することで、認知的エンゲージメントを適応的に把握するシステムを開発し、評価する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:51:46 GMT)
Efficient Post-Training Pruning of Large Language Models with Statistical Correction [13.1] 訓練後のプルーニングは、大規模言語モデルのサイズと推論コストを減らす効果的なアプローチである。
モデル重みとアクティベーションの1次統計特性に基づく軽量な後訓練型プルーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:36:17 GMT)
Do Large Language Models Reflect Demographic Pluralism in Safety? [12.6] 大言語モデル(LLM)の安全性は本質的に多元的であり、道徳的規範、文化的な期待、人口統計学的文脈のバリエーションを反映している。
Demo-SafetyBenchはこのギャップに対処するため、階層的多元性を直接プロンプトレベルでモデル化し、応答から値フレーミングを分離する。
ステージIでは、Mistral 7B-Instruct-v0.3を使用してDICESからのプロンプトを14の安全ドメインに分類し、人口統計メタデータを保持し、低リソースドメインを拡張する。
LLMs-as-Raters-Gemma-7B, GPT-4o, LLaMA-2-7B-under 0-shot を用いたステージII, 多重感度の評価
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:40:10 GMT)
Pareto-guided Pipeline for Distilling Featherweight AI Agents in Mobile MOBA Games [12.4] ゲームAIの最近の進歩は、トップレベルの人間専門家を超える訓練エージェントの実現可能性を示している。
モバイルデバイスにこのような強力なエージェントを配置することは、依然として大きな課題です。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:36:38 GMT)
Bipartite Graph Attention-based Clustering for Large-scale scRNA-seq Data [12.3] グラフトランスフォーマーベースのモデルのような既存のscRNA-seqクラスタリングの方法は、各セルをシーケンス内のトークンとして扱う。
そこで本研究では,ScRNA-seqデータに対するBipartite Graph Transformerベースのクラスタリングモデルを提案する。
BGFormerは、セルの数に関して線形計算の複雑さを達成し、大規模なデータセットにスケーラブルにする。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:10:18 GMT)
Fast Rerandomization for Balancing Covariates in Randomized Experiments: A Metropolis-Hastings Framework [12.3] 本稿では,精度と妥当性を維持しつつ,10~10,000倍の高速化を実現するアルゴリズムを提案する。
提案アルゴリズムであるPSRSRRは,精度と妥当性を維持しつつ,10~10,000倍の高速化を実現する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:40:27 GMT)
ReasonEdit: Editing Vision-Language Models using Human Reasoning [11.7] 本稿では,視覚言語モデルエディタReasonEditを提案する。
ReasonEditは、人間の推論をコードブックに格納し、推論中にのみ関連する事実を検索する。
編集中に人為的推論を用いることで、編集の一般化が大幅に向上することを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:17:26 GMT)
Echoes in the Loop: Diagnosing Risks in LLM-Powered Recommender Systems under Feedback Loops [11.6] 大規模言語モデル(LLM)は、ますますレコメンデーションシステムに組み込まれ、複数の機能的な役割にわたって機能する。
本稿では、これらのリスクがどのように出現し、ランキング結果に現れ、繰り返しレコメンデーションサイクルに蓄積されるかを追跡する役割認識型段階診断フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:45:08 GMT)
CA-YOLO: Cross Attention Empowered YOLO for Biomimetic Localization [11.2] 本稿では,CA-YOLOに基づくバイオニック安定化ローカライゼーションシステムを提案する。
このシステムは、目標位置決め精度と小さな目標認識能力を両立させるように設計されている。
実験の結果,CA-YOLOは標準データセットの原モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:38:45 GMT)
Hyperparameter Transfer Laws for Non-Recurrent Multi-Path Neural Networks [10.8] マルチパスニューラルネットワークに有効な深度の概念をグラフベースで導入する。
最適学習速度は, 普遍的な -3/2 電力法則に従って, 有効深度で減衰することを示す。
実験は予測された斜面を確認し、深度と幅をまたいだ学習率の信頼性の高いゼロショット転送を可能にする。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:10:54 GMT)
Training-Driven Representational Geometry Modularization Predicts Brain Alignment in Language Models [10.8] 大きな言語モデル(LLM)が人間の言語の神経表現と計算とどのように一致しているかは、認知科学における中心的な問題である。
階層を安定な低複雑クラスタと高複雑クラスタに自己組織化する幾何学的モジュラー化を同定した。
低複雑さモジュールはエントロピーと曲率の減少を特徴とし、一貫して人間の言語ネットワーク活動を予測する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:26:21 GMT)
A Rational Account of Categorization Based on Information Theory [10.7] 本稿では,情報理論の有理分析に基づく分類理論を提案する。
人間の分類の振る舞いを、独立したキューやコンテキストモデルよりも少なくとも(あるいはそれ以上)説明できることがわかりました。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 22:21:32 GMT)
All-Optical Segmentation via Diffractive Neural Networks for Autonomous Driving [10.6] 自律運転アプリケーションにおけるRGB画像分割と車線検出のための新しい全光学計算フレームワークを提案する。
実験により,CityScapesデータセットにおける画像分割のためのDONNシステムの有効性を実証した。
室内トラックデータを用いた車線検出のケーススタディを行い,CARLAにおける運転シナリオをシミュレートした。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:47:37 GMT)
FlexID: Training-Free Flexible Identity Injection via Intent-Aware Modulation for Text-to-Image Generation [10.5] 意図認識変調を利用した学習自由フレームワークFlexIDを提案する。
本稿では,これらのストリームの重みを動的に変調するコンテキスト認識適応ゲーティング(CAG)機構を提案する。
IBenchの実験では、FlexIDがアイデンティティの一貫性とテキストの一貫性のバランスを達成している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:59:54 GMT)
Computing the Reachability Value of Posterior-Deterministic POMDPs [10.0] 後決定性POMDPは,新しいPOMDPのクラスである。
後決定論的POMDPに対して、与えられた状態に到達する最大確率は任意の精度で近似できることを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:09:41 GMT)
A Holistic Framework for Automated Configuration Recommendation for Cloud Service Monitoring [10.0] 大規模クラウドサービスの信頼性は、ユーザの満足度とビジネス継続性に不可欠である。
大企業では、堅牢なヘルスモニタリングシステムを必要とするリージョンに複数のサービスがデプロイされます。
現在の監視設定プロセスは手動で、大部分がリアクティブでアドホックで、カバレッジと冗長なアラートのギャップが生じる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 07:54:42 GMT)
Differentiate-and-Inject: Enhancing VLAs via Functional Differentiation Induced by In-Parameter Structural Reasoning [10.0] iSTARは視覚言語アクションモデルを強化するためのフレームワークである。
タスクレベルのセマンティック構造を直接モデルパラメータに埋め込む。
これは、コンテキスト内およびエンドツーエンドのVLAベースラインよりも信頼性の高いタスク分解と、より高い成功率を達成する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:31:11 GMT)
Patient-Centered, Graph-Augmented Artificial Intelligence-Enabled Passive Surveillance for Early Stroke Risk Detection in High-Risk Individuals [9.9] ストロークは年間数百万の影響を受けたが、症状の認識が低かったため、ケアシーキングが遅れることが多かった。
患者報告症状を用いた早期脳卒中リスク検出のための受動的監視システムを開発した。
患者報告言語だけでは、高精度、低バーデン早期脳卒中リスク検出がサポートされた。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:34:56 GMT)
ACORN-IDS: Adaptive Continual Novelty Detection for Intrusion Detection Systems [9.8] ACORN-IDSは適応型連続ノベルティ検出フレームワークである。
ラベルなしデータストリームを進化させながら、通常のデータからのみ学習する。
ACORN-IDSはF1スコアを62%改善し、ゼロデイ攻撃検出を58%改善した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:47:38 GMT)
Optimizing Chlorination in Water Distribution Systems via Surrogate-assisted Neuroevolution [9.7] 本稿では, 大規模不均質配水系統の維持管理のための進化的枠組みを提案する。
ニューラルネットワークはNEATで進化し、特定のタイミングで分配ネットワーク内の戦略的場所に塩素を注入した。
NSGA-IIは、注入された塩素の総量を最小限に抑え、ネットワーク全体で塩素濃度を均一に保ち、定期的に注入を分配する4つの目的を最適化するために使用された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:16:46 GMT)
On the Importance of a Multi-Scale Calibration for Quantization [9.2] 後学習量子化(PTQ)は、大規模言語モデル(LLM)を効率的に展開するための基盤となる。
マトリシカ(Matryoshka)を提案する。
最先端のLCM(例えば Qwen3, Gemma3, LLaMA3)の実験では、MaCaは低ビット量子化の下で常に精度を向上することを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:42:53 GMT)
Non-Hermitian physics in the many-body system of Rydberg atoms [9.2] 非エルミート物理学は、伝統的なエルミート系よりも独自の物理的性質を示す。
ライドバーグ原子は非エルミート物理学の実験的実現のための有望な基盤を提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:32:53 GMT)
RoboPaint: From Human Demonstration to Any Robot and Any View [9.1] 本研究では,人間による実演をロボットが実行可能な環境特化学習データに変換するためのリアルタイムデータ収集とデータ編集パイプラインを提案する。
そこで本研究では,10種類のオブジェクト操作タスクに対して,デキスハンドトラジェクトリの再ターゲットが84%の成功率を達成することを示す。
複雑なデクサラス操作のために,パフォーマンス損失を最小限に抑えた,スケーラブルで費用対効果の高い遠隔操作の代替手段を提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 02:08:06 GMT)
Let's Simplify Step by Step: Guiding LLM Towards Multilingual Unsupervised Proficiency-Controlled Sentence Simplification [9.0] 大きな言語モデルは、熟練度制御された文の単純化において限られた能力を示す。
複雑な単純化を管理可能なステップに分解するフレームワークを提案する。
提案手法は, 計算ステップを22~42%削減し, 単純化効率の向上を図っている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:21:17 GMT)
On the Infinite Width and Depth Limits of Predictive Coding Networks [8.8] 予測符号化(PC)は、標準バックプロパゲーション(BP)の生物学的に妥当な代替品である
最近の研究は深層PCネットワークのトレーニング安定性を改善している。
我々はPCNの無限の幅と深さの限界について検討する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:47:32 GMT)
Visualizing the Invisible: Enhancing Radiologist Performance in Breast Mammography via Task-Driven Chromatic Encoding [8.6] 本稿では,タスク駆動型AUCEモジュールを備えたエンドツーエンドフレームワークであるMammoColorについて述べる。
内部テストセット,2つの公開データセット,3つの外部臨床コホートで評価した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:29:52 GMT)
Beyond Arrow: From Impossibility to Possibilities in Multi-Criteria Benchmarking [8.4] 我々は、各指標が各データセットのモデルよりも優先順位を誘導する社会的選択問題を定式化する。
我々は、単一話者、グループ分離可能、および距離制限された選好において、ベンチマーク演算子は、良好なランク付けを構築することができることを証明した。
HELM MMLUのような近代的なベンチマークスイートを実証的に検討し、どのベンチマーク問題でどの構造条件が満たされているかを検証する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:47:24 GMT)
Scalable Dexterous Robot Learning with AR-based Remote Human-Robot Interactions [8.1] 本稿では,手軽なロボットアームハンドシステムにおける操作のためのスケーラブルなロボット学習に焦点を当てた。
本稿では,汎用的な操作タスク問題に対処するための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 03:47:21 GMT)
StreamVLA: Breaking the Reason-Act Cycle via Completion-State Gating [8.0] 長距離ロボット操作は、高レベルの計画と低レベルの制御のギャップを埋める必要がある。
現在のVision-Language-Actionモデルは、しばしばこれらのプロセスを絡めて、各ステップで冗長なマルチモーダル推論を実行する。
本稿では、テキストタスクの分解、視覚目標の想像力、連続的なアクション生成を単一のパラメータ効率のバックボーン内で統合するデュアルシステムアーキテクチャStreamVLAを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:55:43 GMT)
Why Look at It at All?: Vision-Free Multifingered Blind Grasping Using Uniaxial Fingertip Force Sensing [7.8] この研究は、極めて最小限のセンシングの下で、信頼性の高い多指握りを実現することを実証している。
我々は、強化学習した教師が特権化されたシミュレーションのみの観察を活用できる効率的な教師学生訓練パイプラインを採用している。
本稿では,18個のオブジェクトにまたがる実ハードウェアにおける本提案手法の有効性を検証した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 02:57:47 GMT)
Deep Neural Network Architectures for Electrocardiogram Classification: A Comprehensive Evaluation [7.7] 本研究では,自動不整脈分類のためのディープニューラルネットワークアーキテクチャの包括的評価を行う。
マイノリティクラスにおけるデータの不足に対処するため、MIT-BIH ArrhythmiaデータセットはGenerative Adversarial Network (GAN)を使用して拡張された。
我々は、CNN(Convolutional Neural Networks)、CNNとLong Short-Term Memory(CNN-LSTM)、CNN-LSTM with Attention(CNN-LSTM)、ResNet-1D(ResNet-1D)の4つの異なるアーキテクチャを開発し比較した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:56:50 GMT)
Bridging Speech, Emotion, and Motion: a VLM-based Multimodal Edge-deployable Framework for Humanoid Robots [7.7] textitSeM$2$は、感情的にコヒーレントなマルチモーダルインタラクションを編成するビジョン言語モデルベースのフレームワークである。
我々はクラウドベースとアンダーラインのtextitedge-deployedバージョン(textitSeM$2_e$)の両方を実装し、後者の知識はエッジハードウェア上で効率的に動作するように蒸留されている。
包括的評価は,本手法が自然性,感情的明瞭性,モーダルコヒーレンスにおいて,一様基線を著しく上回ることを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:32:54 GMT)
Can LLMs Truly Embody Human Personality? Analyzing AI and Human Behavior Alignment in Dispute Resolution [7.6] 大規模言語モデル (LLMs) は、社会的環境における人間の振る舞いをシミュレートするためにますます使われている。
これらのシミュレーションがヒトで観察される性格行動パターンを再現するかどうかは不明である。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 07:20:24 GMT)
VERIFY-RL: Verifiable Recursive Decomposition for Reinforcement Learning in Mathematical Reasoning [7.4] 複雑な数学的問題を解決するための言語モデルを訓練することは、より単純なサブプロブレムのカリキュラム学習から恩恵を受ける。
既存の分解法はしばしば、サブプロブレムが単純であること、それを解くことが親のタスクを助けること、あるいはそれらの関係が数学的に基礎化されていることを保証しない。
規則は、式が証明可能な性質を持つより単純な構成要素にどのように還元されるかを明確に定義する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:06:50 GMT)
Surrogate Modeling for Neutron Transport: A Neural Operator Approach [7.3] この研究は、中性子輸送計算のためのニューラルネットワークに基づく代理モデリングフレームワークを導入する。
Deep Operator Network (DeepONet) と Fourier Neural Operator (FNO) の2つのアーキテクチャが、固定ソース問題のために訓練された。
両神経オペレーターは、DeepONetで135 pcm、FNOで112 pcmまでずれた基準固有値を再現した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:56:07 GMT)
Scalable Mean-Field Variational Inference via Preconditioned Primal-Dual Optimization [7.2] 我々は、拡張ラグランジアン定式化に基づく新しい原始双対アルゴリズム(PD-VI)を開発した。
PD-VIは、グローバルおよび局所的な変動パラメータを、スケーラブルな方法で下限のエビデンスで共同で更新する。
PD-VIとP$2$D-VIのコンバージェンス保証を、適切に選択された一定のステップサイズで確立する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:24:15 GMT)
High Fidelity Textual User Representation over Heterogeneous Sources via Reinforcement Learning [7.1] 本稿では,各メンバーに統一されたテキスト表現を合成するための新しい強化学習(RL)フレームワークを提案する。
我々のアプローチは、暗黙のユーザエンゲージメント信号(例えば、クリック、適用)を、有能な情報を抽出する主要な報酬として活用する。
この作業は、解釈可能なユーザ表現を構築するための実用的でラベリングフリーでスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 03:27:55 GMT)
Privately Learning Decision Lists and a Differentially Private Winnow [6.8] 我々は、学習決定リストと大域半空間の古典的な問題に対して、新たな微分プライベートアルゴリズムを提案する。
PACモデルでは、最良な非私的アルゴリズムよりも最小限のサンプルオーバーヘッドで決定リストを学習するための計算効率の良いアルゴリズムを提供する。
オンラインモデルでは、類似次元における誤り有界な多対数性を持つハーフスペースを学習し、マージンにおける逆を学習するために、影響力のあるWinnowアルゴリズムのプライベートなアナログを与える。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:30:09 GMT)
Advantages of Domain Knowledge Injection for Legal Document Summarization: A Case Study on Summarizing Indian Court Judgments in English and Hindi [6.8] 我々は、インド法典の要約を改善し、英語とヒンディー語の両方で要約を生成することを目指している。
法律文に適したドメイン固有の事前学習エンコーダを組み込むことにより,抽出的神経要約モデルを強化する枠組みを提案する。
提案手法は,英語・英語・ヒンディー語・インドの法律文書の要約において統計的に有意な改善を実現している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:55:18 GMT)
A hybrid Kolmogorov-Arnold network for medical image segmentation [6.7] 我々は,コルモゴロフ型ネットワーク(KAN)の表現力とU粒度のエンコーダデコーダアーキテクチャを統合し,セグメンテーション性能を向上させる新しいフレームワークであるU-KABSを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:00:38 GMT)
HistoMet: A Pan-Cancer Deep Learning Framework for Prognostic Prediction of Metastatic Progression and Site Tropism from Primary Tumor Histopathology [6.7] 原発性腫瘍WSIの予後予測のためのMILフレームワークHistoMetを提案する。
HistoMetは言語学的に定義されたメタスタティックな概念とデータ順応的なメタスタティックな概念を、事前訓練された病理視覚言語モデルを通じて統合する。
HistoMetは転移例を条件に、1.3の標準偏差で74.6のマクロF1と92.1のマクロ1-vsレストAUCを達成している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:25:02 GMT)
Explanatory Interactive Machine Learning for Bias Mitigation in Visual Gender Classification [6.3] 説明対話型学習(XIL)では、モデルの説明に対するフィードバックを提供することで、機械学習(ML)におけるモデルトレーニングをガイドすることができる。
我々は,CAIPIとRight for the Right Reasons(Bounded)の2つの最先端XIL戦略と,両戦略を組み合わせた新しいハイブリッドアプローチについて検討する。
実験により,これらの手法が,画像の特徴に着目したMLモデルの指導に有効であることを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:41:42 GMT)
Semantic-Deviation-Anchored Multi-Branch Fusion for Unsupervised Anomaly Detection and Localization in Unstructured Conveyor-Belt Coal Scenes [6.2] textbfCoalADは、石炭ストリームシーンにおける画素レベルのローカライゼーションによる教師なし異物異常検出のためのベンチマークである。
本稿では,3つの視点から補完的異常証拠を抽出・融合する補完的共同認識フレームワークを提案する。
CoalADの実験では、評価画像レベルと画素レベルのメトリクスで、我々の手法が広く使用されているベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:36:24 GMT)
SupChain-Bench: Benchmarking Large Language Models for Real-World Supply Chain Management [5.9] 大規模言語モデル(LLM)は複雑な推論とツールベースの意思決定において有望であることを示している。
サプライチェーンは、ドメイン固有の手順に基づいて、信頼性の高い長期的マルチステップオーケストレーションを必要とする。
我々の研究は、実世界の運用環境での信頼性の高い長期オーケストレーションを研究するための、原則化されたベンチマークを確立する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 03:49:25 GMT)
SleepMaMi: A Universal Sleep Foundation Model for Integrating Macro- and Micro-structures [5.7] スリープマミ(SleepMaMi)は、スリープファウンデーションモデルであり、スリープファウンデーションモデルであり、スリープファウンデーションのアーキテクチャと微細な信号形態の両方を習得する。
我々のフレームワークは階層的な二重エンコーダ設計を用いており、マクロエンコーダは夜間の時間依存をモデル化し、マイクロエンコーダは生体信号から短期特性をキャプチャする。
SleepMaMiは、さまざまな下流タスクにまたがって既存の基礎モデルを上回り、臨床睡眠分析のための優れた一般化性とラベル効率の適応を示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:17:45 GMT)
Step-Wise Refusal Dynamics in Autoregressive and Diffusion Language Models [5.6] 拡散言語モデル(DLM)は、最近、自己回帰(AR)モデルに代わる有望な代替品として登場した。
本稿では,ARと拡散サンプリングの比較を可能にする,ステップワイズ・リファリング・ダイナミクスの基本的な解析フレームワークを提案する。
本稿では,SRI(Step-Wise Refusal Internal Dynamics)信号について紹介する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:58:16 GMT)
Dichotomy of Feature Learning and Unlearning: Fast-Slow Analysis on Neural Networks with Stochastic Gradient Descent [5.5] 本研究では,大きなバッチ勾配で更新された2層ニューラルネットワークの無限幅限界を考察し,時間スケールの異なる微分方程式を導出する。
スローダイナミクスによって決定される臨界多様体上の流れの方向は、特徴未学習が発生するかどうかを決定する。
その結果, (i)データにおける一次非線形項の強さは特徴非学習を誘導し, (ii)第2層重みの初期スケールは特徴非学習を緩和することがわかった。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:50:44 GMT)
GlobalWasteData: A Large-Scale, Integrated Dataset for Robust Waste Classification and Environmental Monitoring [5.5] GWD(GlobalWasteData)アーカイブは,14のカテゴリにまたがる89,807イメージの大規模データセットである。
このGWDアーカイブは、一貫性のあるラベル付け、ドメインの多様性の改善、よりバランスの取れたクラス表現を提供する。
全体として、このデータセットは、環境モニタリング、リサイクル自動化、廃棄物の識別において、機械学習(ML)アプリケーションのための強力な基盤を提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:36:39 GMT)
Mapping Drivers of Greenness: Spatial Variable Selection for MODIS Vegetation Indices [5.3] 本研究はMODIS植生指標を用いて, スペクトル帯, 生産性, エネルギーフラックス, 観測幾何学, 陸地表面特性の予測因子について検討した。
本研究では,各係数面が基底係数に先行してテンソル積B-スプライン基底とベイズ群ラッソを用いる空間変化係数モデルを提案する。
95パーセントの信頼区間が0を除いた位置をマークする空間的重要度マップを用いて,保持効果を要約し,信頼区間が0を除いた位置の比率として空間的カバレッジ確率を定義する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:05:46 GMT)
Seeing Roads Through Words: A Language-Guided Framework for RGB-T Driving Scene Segmentation [5.0] RGB-熱融合(RGB-Thermal fusion)は標準的な手法であるが、既存の手法では全ての条件に対して均一に静的融合戦略を適用する。
本稿では,その融合戦略を検出されたシーン条件に動的に適応させるCLARITYを提案する。
MFNetデータセットの実験は、CLARITYが新しい最先端(SOTA)を確立することを実証している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 03:52:04 GMT)
RAPiD: Real-time Deterministic Trajectory Planning via Diffusion Behavior Priors for Safe and Efficient Autonomous Driving [5.0] RAPiDは、事前訓練された拡散型プランナーを効率的なポリシーに蒸留する決定論的政策抽出フレームワークである。
安全と乗客の快適性を促進するため、予測ドライバコントローラを模倣するように訓練された評論家を用いてポリシーを最適化する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 03:44:50 GMT)
Measuring cross-language intelligibility between Romance languages with computational tools [5.0] 本稿では,関係する単語の表面的類似度と意味的類似度を用いて,語彙的類似度に基づいて不明瞭度を推定する新しい指標を提案する。
単語の正書法と音韻法の両方の形式と、異なるパラレルコーパスと単語の意味表現のベクトルモデルを用いて結果を比較する。
得られたインテリジェンススコアは、言語間でのインテリジェンス非対称性に関連する直感を確認し、人間の実験におけるクローゼテストの結果と大きく相関した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:54:39 GMT)
Benchmarking Legal RAG: The Promise and Limits of AI Statutory Surveys [5.0] 以上の結果から,STARAの精度は83%向上した。
商業プラットフォームは58%(Westlaw AI)と64%(Lexis+AI)の精度で不利であることを示す。
多くの明らかな誤りは、法律的概念の混同や法的な例外の誤解釈など、実際にDOL弁護士自身による重大な欠落である。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:28:55 GMT)
Recursive QAOA for Interference-Aware Resource Allocation in Wireless Networks [5.0] 無線ネットワークにおける離散的無線資源管理問題は,大規模に解決することが困難である。
本稿では,量子近似最適化アルゴリズム(RQAOA)に基づく量子古典的手法について検討する。
干渉を意識したチャネル割り当てでは、ペアの干渉が同じチャネル結合を誘導し、1ホットの制約が2次罰則によって強制される、コンパクトなQUBO/Isingの定式化を与える。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:28:38 GMT)
Data-Aware and Scalable Sensitivity Analysis for Decision Tree Ensembles [4.8] 本稿では、データセットに近づき続けるために、センシティブなサンプルを制約するデータ認識型センシティブなフレームワークを提案する。
また,MILP(Mixed-Integer linear programming)とSMT(Satisfiability modulo theory)を組み合わせたデータ認識検索手法を開発した。
このフレームワークは、高精細なアプリケーションにおけるツリーベースモデルの信頼性と公平性を分析するための実践的な基盤を提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:08:22 GMT)
Nonparametric Bayesian Optimization for General Rewards [4.7] 目的関数のリプシッツ連続性しか必要とせず、一般報酬設定において不一致保証を実現する最初のBOアルゴリズムを提案する。
本研究では,一般報酬に対する新たなTS後悔分析フレームワークを開発し,サロゲートモデルと真の報酬分布の総変動距離に関する後悔を関連づける。
実証的な結果は、特に非定常的、重尾的、または他の条件の悪い報酬の設定において、最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 07:01:33 GMT)
Escaping Spectral Bias without Backpropagation: Fast Implicit Neural Representations with Extreme Learning Machines [4.7] 暗黙の神経表現(INR)を訓練して、細部を捉えることは、通常反復的なバックプロパゲーションに依存する。
ELM-INRは、ドメインを反復的に分解し、エクストリームラーニングマシン(ELM)をクローズド形式で各ローカル問題に適合させるバックプロパゲーションフリーINRである。
この設計は、局所予測器を一意に分割することで高速で数値的に堅牢な再構成をもたらす。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:12:39 GMT)
Thermal odometry and dense mapping using learned ddometry and Gaussian splatting [4.6] 本研究では, 学習型オドメトリーと GS を用いた高密度マッピングを統合したサーマルオドメトリーおよびマッピング手法であるTOM-GSを提案する。
TOM-GSは、サーマルカメラ用に設計された最初のGSベースのSLAMシステムの一つであり、専用のサーマルイメージの強化と単眼深度統合を備えている。
動き推定とノベルビューレンダリングの実験は、TOM-GSが既存の学習ベース手法より優れていることを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:07:44 GMT)
Object-Oriented Transition Modeling with Inductive Logic Programming [4.6] 我々は,従来の手法よりもはるかに強力な新しい学習アルゴリズムを開発した。
アブレーションテストやニューラルベースラインとの比較を含む徹底的な実験は、最先端技術よりも大幅に改善されていることを示している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 16:11:53 GMT)
COOPERTRIM: Adaptive Data Selection for Uncertainty-Aware Cooperative Perception [4.3] 協調認識により、自律エージェントは無線通信を介して符号化された表現を共有でき、互いの生活状況に対する認識を高めることができる。
最近の研究では、性能を同等に保ちながら、フレーム毎に機能のサブセットだけを共有する選択戦略について検討している。
静的な情報の繰り返しや冗長な伝達を回避しつつ、環境のダイナミクスを捉える特徴を特定するために、時間的連続性を利用してプロアクティブなアプローチをとる。
我々はこの直感を適応的な選択フレームワークであるCOOPERTRIMにインスタンス化し、特徴の関連性を測定するための新しい共形時間的不確実性指標と、共有量を動的に決定するデータ駆動機構を導入する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:18:46 GMT)
Continuous Program Search [4.2] 潜在距離が振る舞いの意味を持つ連続的なプログラム空間を学習し、進化的アルゴリズムを変更することなくこの構造を利用する突然変異演算子を設計する。
制御された潜在摂動下での行動レベルのばらつきを追跡することで局所性を計測し,行動-局所的連続的な変動に対する経験的信頼領域を同定する。
等方的突然変異は時折高いピーク性能を達成するが、幾何コンパイルされた突然変異はより速く、より信頼性の高い進行をもたらす。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 18:41:14 GMT)
Squeezing-enhanced dual-channel interference for ground-state cooling of a levitated micromagnet with low quality factor [4.2] 本稿では,スケザリング型量子干渉に基づく二チャネル冷却方式を提案する。
この冷却機構により, 地中冷却に必要な臨界$Q_c$を3桁削減できることが実証された。
本研究は, 冷却力学を積極的に制御することにより, マクロ量子状態の生成に向けた実現可能な経路を提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:00:35 GMT)
Cross-View World Models [3.8] 本稿では,クロスビュー・ワールド・モデル (XVWM) を紹介する。
我々は、Aimlabsから同期マルチビューゲームプレイデータをトレーニングする。
この結果から,複数視点の整合性は空間的接地表現に強い学習信号を与えることがわかった。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:02:15 GMT)
Efficient Adaptive Data Analysis over Dense Distributions [3.8] 我々は,データ分布が既知値に対して密度が高い場合に,効率的なADA機構が最適な$O(log T)$サンプル複雑性を実現することを示す。
我々のアルゴリズムは差分プライバシーをベースとしていないが、Predicate Singling Out (PSO) と呼ばれる緩やかなプライバシー概念を満足している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 23:44:09 GMT)
Urban Vibrancy Embedding and Application on Traffic Prediction [3.7] 都市活力は都市空間内の動的な人間の活動を反映している。
本研究では,リアルタイムな浮遊人口データから都市ビブランシーの埋め込みを導出する手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:34:01 GMT)
Sensing weak anharmonicities with a passive-active anti-PT symmetric system [3.3] 本稿では、3モードの反パリティ時間(反PT)対称キャビティ-マグノン-導波管系に基づく弱不調和検出手法を提案する。
光学利得をアクティブキャビティモードに調整することにより、反PT対称ハミルトニアンに対する直線幅抑制点を柔軟に制御することができる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:33:04 GMT)
"Meet My Sidekick!": Effects of Separate Identities and Control of a Single Robot in HRI [3.0] ロボットの能力とアイデンティティの提示は、ロボットに対する人間の協調者の認識と暗黙の信頼に直接影響を及ぼす。
人間とは異なり、物理的なロボットは異なるアイデンティティを同時に提示し、ロボットの異なる部分に居住させ制御させる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:51:33 GMT)
AI-Driven Predictive Modelling for Groundwater Salinization in Israel [2.7] 本研究の目的は, 因果要因に基づく地下水の塩分化を包括的に理解することである。
イスラエルでは、塩分濃度の主要な気象学的、地質学的、人類学的要因が特定されている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:17:51 GMT)
The Moltbook Illusion: Separating Human Influence from Emergent Behavior in AI Agent Societies [2.7] 我々は、バイラルな物語が圧倒的に人間主導であることを示した。
ウイルス現象は、明らかに自律的なエージェントから発生したものではない。
また、産業規模のボット農業も記録している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:17:21 GMT)
Hidden Kinematics and Dual Quantum References in Magnetic Resonance [2.6] 回転磁場中のスピンは、共通の量子化演算子を共有する2つの量子記述を含む構成を構成するが、運動学的および力学的な役割が異なることを示す。
この枠組みは、一貫したエネルギー会計を復元し、回転磁場におけるスピンダイナミクスの基礎となる二重参照構造を明らかにする。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:33:17 GMT)
Efficient Planning in Reinforcement Learning via Model Introspection [2.5] 我々は、人間がタスクを与えられたとき、そのタスクの特定方法にかかわらず、その問題を効率的に解くために必要な追加情報を引き出すことができることを示した。
問題の内部モデルについて推論することで、人間が直接タスク関連情報を合成する。
次に,関係強化学習に使用されるモデルのクラスに対して,効率的な目標指向計画を可能にするアルゴリズムについて述べる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:49:21 GMT)
From Exact Hits to Close Enough: Semantic Caching for LLM Embeddings [2.3] 大規模言語モデル(LLM)は、より高速な応答と低コストの需要を生み出している。
セマンティックキャッシュは、埋め込みを通じてセマンティックに類似したリクエストを再利用し、このニーズに対処するが、古典的なキャッシュ仮定を破る。
オンラインのセマンティックキャッシュポリシーは, 精度, 頻度, 局所性を組み合わせたものである。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:16:46 GMT)
Quantum Many-Body Principles of Localized-State Ensemble Luminescence [2.3] 欠陥や不純物を含む障害によって誘導される局所電子状態は、通常固体の中に存在する。
電子-フォノン(e-p)と電子-電子(e-e)の相互作用を考慮した量子多体発光理論を開発する。
可変温度LSE発光における電子-フォノンと電子-電子相互作用の役割は解明される。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:55:36 GMT)
ElliCE: Efficient and Provably Robust Algorithmic Recourse via the Rashomon Sets [2.2] ElliCEは、堅牢なアルゴリズムリコースのための新しいフレームワークである。
これはラショモン集合の楕円体近似に対する堅牢な反事実を生成する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:41:50 GMT)
TASTE: Task-Aware Out-of-Distribution Detection via Stein Operators [2.2] TASTE(Task-Aware STEin演算子)は、いわゆるStein演算子に基づくタスク対応フレームワークである。
得られた演算子は、分布の射影として明確な幾何学的解釈を認め、モデルの感度場に遷移することを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:48:08 GMT)
Vision and language: Novel Representations and Artificial intelligence for Driving Scene Safety Assessment and Autonomous Vehicle Planning [2.1] 視覚言語モデル(VLM)は、視覚観察を自然言語の概念と整合させる強力な表現学習システムとして登場した。
本稿では、視覚言語表現が、認識、予測、計画パイプラインに統合された場合、シーンの安全性評価と意思決定をどのようにサポートするかを検討する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:04:21 GMT)
Fair Decisions from Calibrated Scores: Achieving Optimal Classification While Satisfying Sufficiency [2.1] 予測確率(スコア)に基づくバイナリ分類は、教師付き機械学習の基本的なタスクである。
群校正スコアの有限集合を仮定して、十分条件下での最適二項分類の正確な解を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:26:40 GMT)
Automated rock joint trace mapping using a supervised learning model trained on synthetic data generated by parametric modelling [2.0] 本稿では,画像からの岩盤跡の自動マッピングのための地質学習手法を提案する。
この手法は、地質モデリング、合成データ生成、教師付きイメージセグメンテーションを組み合わせて、限られた実データとクラス不均衡に対処する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:37:02 GMT)
SPECA: Specification-to-Checklist Agentic Auditing for Multi-Implementation Systems -- A Case Study on Ethereum Clients [1.7] SPECAは、標準要件をチェックリストに変換する仕様からChecklistフレームワークである。
SPECAは,11社を対象とし,フサカアップグレードのセキュリティ監査コンテストの会場内でインスタンス化を行う。
我々の改善されたエージェントは、競争監査の基礎的真実に対して評価され、高影響の脆弱性について27.3%の厳格なリコールを達成した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:19:00 GMT)
Cross-Camera Cow Identification via Disentangled Representation Learning [1.5] 既存の動物識別法は、制御された単一カメラ設定で優れているが、クロスカメラの一般化に関して深刻な課題に直面している。
本研究では,不整合表現学習に基づくカメラ横断型ウシ識別フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:23:35 GMT)
Encoding Matters: Benchmarking Binary and D-ary Representations for Quantum Combinatorial Optimization [1.4] 本研究では,D-ary Optimization (QUDO) を,高次元ヒルベルト空間において決定変数を直接符号化する代替の定式化として検討する。
本研究では,QUDOがトラベリングセールスマン問題,グラフカラー化,ジョブスケジューリング,Max-K-Cutなど,広範なペナルティ構築を必要とせずに,様々な問題クラスにおいて構造的制約を自然に捉えていることを示す。
本研究は、量子最適化のためのスケーラブルで表現力のある表現としてQUDOを強調し、近似比を一貫して改善し、等価回路深さでの計算オーバーヘッドを大幅に削減することを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:37:32 GMT)
Fine-Grained Cat Breed Recognition with Global Context Vision Transformer [1.3] 我々は,オックスフォード-IIIT Petデータセットのサブセットを用いて,ネコ種を分類する深層学習に基づくアプローチを提案する。
我々は,猫の品種認識にGCViT(Global Context Vision Transformer)アーキテクチャティニーを用いた。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:13:47 GMT)
Progressive Searching for Retrieval in RAG [1.2] Retrieval Augmented Generation (RAG)は、大規模言語モデル(LLM)の2つの重要な制限を緩和するための有望な技術である。
本稿では,コスト効率の高い検索アルゴリズムを提案する。
以上の結果から,RAGシステムにおける逐次探索は次元,速度,精度のバランスを保ち,大規模データベースにおいてもスケーラブルで高速な検索が可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:12:53 GMT)
How LLMs Cite and Why It Matters: A Cross-Model Audit of Reference Fabrication in AI-Assisted Academic Writing and Methods to Detect Phantom Citations [1.1] 大規模言語モデル(LLM)は、学術的な引用を作るために注目されているが、この振る舞いの範囲はいまだに定量化されていない。
これまでに,4つの学術領域に10のLLMを商業展開させた,最も大きな幻覚誘発検査の1つを報告した。
以上の結果から,観察された幻覚率は5倍の範囲(11.4%から56.8%)で,モデル,ドメイン,迅速なフレーミングによって強く形成されていることが明らかとなった。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:14:00 GMT)
ONTrust: A Reference Ontology of Trust [1.1] 本論文は,信頼に確固たる存在論的基盤を提供する長期研究プログラムの成果である。
信頼の基準オントロジー(ONTrust)は、統一基本オントロジーに基づいて開発され、オントUMLで規定されている。
ONTrustは、信頼の概念とその異なるタイプを公式に特徴づけ、信頼に影響を与えるさまざまな要因を記述し、また、信頼関係からリスクがどのように出現するかを説明する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 18:47:34 GMT)
Debugging code world models [1.0] コードワールドモデル(Code World Models、CWM)は、プログラムの実行をシミュレートするために訓練された言語モデルである。
CWMは局所的セマンティック実行と長期状態追跡という2つの相補的な視点から研究する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:32:15 GMT)
NAAMSE: Framework for Evolutionary Security Evaluation of Agents [1.0] 我々は,エージェントのセキュリティ評価をフィードバック駆動最適化問題として再編成する進化的フレームワークであるNAAMSEを提案する。
本システムでは,遺伝子プロンプト変異,階層的コーパス探索,非対称的行動スコアリングのライフサイクルを編成する単一自律エージェントを用いている。
Gemini 2.5 Flashの実験では、進化的突然変異がワンショットメソッドによって欠落した脆弱性を体系的に増幅することを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:13:02 GMT)
Incorruptible Neural Networks: Training Models that can Generalize to Large Internal Perturbations [1.0] 本稿では,シャープネスを意識した最小化法(SAM)とランダムウェイト摂動法(RWP)の2つの手法について検討し,様々なランダムな汚職から重みへのロバストなミニマを求める。
小振幅雑音では、SAMの対向目的によりRWPよりも性能が向上するが、大振幅雑音に対しては性能が劣る。
我々はこの原因を, SAMとRWPの両方に影響を及ぼす損失景観の不均一に起因する, 消失・緩やかな影響と結びつけた。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 02:34:14 GMT)
Agent-Fence: Mapping Security Vulnerabilities Across Deep Research Agents [0.9] AgentFence*はアーキテクチャ中心のセキュリティ評価で、計画、メモリ、検索、ツールの使用、デリゲートにまたがる14の信頼境界攻撃クラスを定義します。
基本モデルの固定を保ち、永続的マルチターン相互作用の下で8つのエージェントアーチタイプを評価する。
Denial-of-Wallet (0.62 pm 0.08$), Authorization Confusion (0.54 pm 0.10$), Retrieval Poisoning (0.47 pm 0.09$), Planning Manipulation (0.44 pm 0.11$)。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 18:27:47 GMT)
GraphAgents: Knowledge Graph-Guided Agentic AI for Cross-Domain Materials Design [0.9] 大型言語モデル (LLMs) は、科学的な視野を広げることで発見を加速することを約束する。
材料科学では、革新が分子化学から機械的性能までの概念を統合することを要求するが、これは特に急激である。
本稿では,PFAS(per-およびpolyfluoroalkyl substances)-chemicalsの持続可能な代替品を見つけるために,大規模知識グラフでガイドされたマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:50:34 GMT)
Enhancing Time Series Classification with Diversity-Driven Neural Network Ensembles [0.8] 本稿では,ニューラルネットワークのアンサンブルメンバー間の特徴多様性を明確に促進する,多様性駆動型アンサンブル学習フレームワークを提案する。
UCRアーカイブから128データセットのフレームワークを評価し,より少ないモデルでSOTA性能を実現することを示す。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:05:04 GMT)
Developing an AI Assistant for Knowledge Management and Workforce Training in State DOTs [0.6] 本稿では,知識管理と意思決定を支援するマルチエージェントアーキテクチャを備えたRAG(Retrieval-Augmented Generation)フレームワークを提案する。
従来のシングルパスRAGシステムとは異なり、提案フレームワークは検索、回答生成、評価、クエリ改善のために複数の特殊エージェントを使用する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:00:07 GMT)
Benchmarking Anomaly Detection Across Heterogeneous Cloud Telemetry Datasets [0.5] GRU,TCN,Transformer,TSMixerの4つのディープラーニングモデルを評価する。
モデルは4つのテレメトリデータセットでテストされる。
すべてのデータセットに統一的なトレーニングと評価パイプラインを使用します。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:42:21 GMT)
LIT-GRAPH: Evaluating Deep vs. Shallow Graph Embeddings for High-Quality Text Recommendation in Domain-Specific Knowledge Graphs [0.5] LIT-GRAPH(Literature Graph for Recommendation and Pedagogical Heuristics)は、高校生の英語教師を多種多様で教育的に整合した教育文学に足場を足場として設計した、グラフベースのリコメンデーションシステムである。
システムは英語文学のオントロジーに基づいて構築され,4つのグラフ埋め込みパラダイムを比較する停滞の課題に対処する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:42:54 GMT)
TernaryLM: Memory-Efficient Language Modeling via Native 1-Bit Quantization with Adaptive Layer-wise Scaling [0.4] 本稿では, ネイティブな1ビット3次量子化 -1, 0, +1 を用いた 132M パラメータトランスフォーマアーキテクチャである TernaryLM を提案する。
この結果から,ネイティブな1ビットトレーニングが,効率的なニューラルネットワークモデルにとって有望な方向であることが示唆された。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 05:35:17 GMT)
Assessing the impact of Open Research Information Infrastructures using NLP driven full-text Scientometrics: A case study of the LXCat open-access platform [0.4] オープン・リサーチ・インフォメーション(ORI)は、科学知識の創出、普及、検証、再利用の過程における中心的な役割を担っている。
我々は、引用数を超えるORIインフラストラクチャの影響を定量化するためのフルテキスト自然言語処理(NLP)駆動のサイエントメトリックフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:15:40 GMT)
Beyond Accuracy: Risk-Sensitive Evaluation of Hallucinated Medical Advice [0.2] 本稿では,リスクを負う言語の存在によって幻覚を定量化するリスク感受性評価フレームワークを提案する。
安全ストレステストとして設計された患者対応プロンプトを用いて,3つの言語モデルに本フレームワークを適用した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 02:25:44 GMT)
Agyn: A Multi-Agent System for Team-Based Autonomous Software Engineering [0.1] 現実世界のソフトウェア開発は、共有方法論に従ってチームが共同で行う活動として組織されます。
ソフトウェア工学を組織プロセスとして明示的にモデル化する,完全に自動化されたマルチエージェントシステムを提案する。
我々の結果は、チーム構造、方法論、コミュニケーションの複製が、自律的なソフトウェアエンジニアリングの強力なパラダイムであることを示唆している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:47:07 GMT)
Optimization of Precipitate Segmentation Through Linear Genetic Programming of Image Processing [0.1] ナイオビウム系銅合金の最近の分析は、マイクログラフに存在する様々なコントラスト、ノイズ、画像アーティファクトによる手アノテーションに依存している。
本稿では, FIB断面マイクログラフにおける沈殿物検出のためのフィルタリングとセグメンテーションを行い, 各種アーティファクトを考慮に入れた線形遺伝的プログラミング(LGP)を用いて最適化した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:59:10 GMT)
ViHERMES: A Graph-Grounded Multihop Question Answering Benchmark and System for Vietnamese Healthcare Regulations [0.0] ViHERMESはベトナムの医療規制文書に対するマルチホップQAのためのベンチマークである。
このデータセットを構築するために,セマンティッククラスタリングとグラフに着想を得たデータマイニングに基づくマルチホップQA生成パイプラインを提案する。
本稿では,法単位レベルでの形式的法的関係をモデル化するグラフ対応検索フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:59:31 GMT)
Two-phase driving of a linear radio-frequency ion trap [0.0] 線形ポールトラップを駆動する2つの高電圧無線周波数信号SI180度を位相外から生成する手法を提案する。
我々は、線形ラジオ周波数ポールトラップでイッテルビウムイオンの鎖を捕捉、冷却することに成功しました。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:52:52 GMT)
Turning non-superconducting elements into superconductors by quantum confinement and proximity [0.0] 量子閉じ込めだけで、あるいは近接効果と組み合わせて、バルク状に非超伝導な金属の観測可能な超伝導不安定性を誘導できるかどうかを考察する。
我々は、ab-initio あるいは実験的に決定された電子-フォノンスペクトル関数 $2F()$ と Coulomb pseudopotentials $*$ を用いて、エリシュベルグ方程式を数値的に解く。
この理論は、超伝導は選択されたケースと非常に狭い厚さの窓にのみ現れると予測している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:19:33 GMT)
The continuous spectrum of bound states in expulsive potentials [0.0] 急激な励起ポテンシャルが量子状態を広く非局在化することを示す。
1Dおよび2D固有状態の波動関数の漸近近似が導出される。
発見は連続体における有界状態の概念の拡張を示唆する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:10:49 GMT)
The ABL Rule and the Perils of Post-Selection [0.0] アハロノフ、ベルクマン、レボリッツは1964年に有名なABL則を導入した。
本稿では,物理アンサンブルにのみ生じる創発的な可観測性を持つ単一系に属する混乱した可観測性からなるABL則の心における微妙なカテゴリー誤差を同定する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 06:42:08 GMT)
TC/TCL and NETFD Correspondence Principles for Information Backflow: A Structural Monotonicity Theorem and Minimal Phase Diagrams [0.0] 最小限のマルコフ緩和過程における情報バックフローのための統一的な構造的枠組みを提案する。
中心的な考え方は、非マルコビアン性は、観測可能な自由度が隠れた補助セクターと情報を交換する埋め込み現象であると解釈することである。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 09:15:54 GMT)
Surprisal-Guided Selection: Compute-Optimal Test-Time Strategies for Execution-Grounded Code Generation [0.0] 検証可能な実行地上(VEG)タスクに対する計算-最適テスト時間戦略について検討する。
重回帰VEGタスクの場合、計算は勾配適応ではなく、サンプルの多様性とインテリジェントな選択に割り当てるべきである。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:29:07 GMT)
Statistical inference after variable selection in Cox models: A simulation study [0.0] 本稿では、ラッソ係数とその拡張であるアダプティブ・ラッソに対する変数選択後に適用されるいくつかの推論手順について検討する。
検討された手法には、サンプル分割、正確な選択後の推測、偏りのあるラッソが含まれる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 10:14:21 GMT)
Split-Post Microwave Displacement Transducer with Quadratic Readout [0.0] 膜変位に対する空洞反応は、膜がポストの中央に位置する場合、主に二次的である。
中央で膜が駆動されると、システムは最大変位電圧感度と最大二次出力を示す。
このプラットフォームはマイクロ波メカニカル量子トランスデューサの候補として期待されている。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 01:41:37 GMT)
Revealing the Semantic Selection Gap in DINOv3 through Training-Free Few-Shot Segmentation [0.0] 最近の自己監督型視覚変換器(ViT)は、高密度視覚タスクのためのリッチな特徴表現を提供する。
本研究では,フリーベースラインによる凍結DINOv3特徴の少数ショットセマンティックセマンティックセマンティックセマンティクス機能について検討した。
我々はOracleが指導する層解析を行い、標準的な最終層の特徴とグローバルに最適な中間表現との間の大きなパフォーマンスギャップを識別する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:51:53 GMT)
Quantum Simulation of Bound and Resonant Doubly-Bottom Tetraquark [0.0] QCDにインスパイアされたカイラルクォークモデルにおける有界および共振共振ボトムテトラクォーク状態の量子シミュレーションによる最初の研究を示す。
結果として生じる質量と結合エネルギーは、古典的なカイラルクォークモデル予測と一致している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:25:58 GMT)
Physical Analog Kolmogorov-Arnold Networks based on Reconfigurable Nonlinear-Processing Units [0.0] Kolmogorov-Arnold Networks (KAN) はニューラルネットワークを線形層から学習可能な非線形エッジ関数にシフトする。
ここでは、再構成可能な非線形処理ユニット(RNPU)を用いて、マテリアでエッジ関数が実現される物理アナログkanアーキテクチャを紹介する。
我々は,プログラム可能な非線形変換を用いたコンパクトな感性回帰と分類を可能にする,現実的なシステムレベルのハードウェア実装を確立する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 12:33:11 GMT)
Perspective-aware fusion of incomplete depth maps and surface normals for accurate 3D reconstruction [0.0] 本稿では,従来の直交勾配に基づく深度正規化法を拡張した対数深度融合法を提案する。
DiLiGenT-MVデータセットの実験は、我々のアプローチの有効性を示し、視点認識深度正規核融合の重要性を強調した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:45:40 GMT)
PTB-XL-Image-17K: A Large-Scale Synthetic ECG Image Dataset with Comprehensive Ground Truth for Deep Learning-Based Digitization [0.0] PTB-XL-Image-17Kは17,271個の高画質の12値のECG画像からなる完全合成ECG画像データセットである。
データセットは、平均処理時間1サンプルあたり1.35秒で100%の成功率を達成する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:52:38 GMT)
On Sequence-to-Sequence Models for Automated Log Parsing [0.0] 本研究の目的は、シーケンスモデリングアーキテクチャ、表現選択、シーケンス長、トレーニングデータの可用性が、自動ログ解析性能と計算コストにどのように影響するかを評価することである。
変換器は、平均相対編集距離が0.111、次いでMamba(0.145)、mono-LSTM(0.186)、bi-LSTM(0.265)となる。
全体として、Transformerは解析エラーを23.4%削減し、Mambaはデータや計算制約の下で強力な代替手段である。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 20:47:45 GMT)
Non-Markovianity in a dressed qubit with local dephasing [0.0] 2つの格子間のスピンレスフェルミオンホッピングにより実装された着衣量子ビットのダイナミクスについて検討し,各部位をフォノン浴に強く結合させた。
ポラロンフレーム内に時間-畳み込みのないマスター方程式を適用することにより、服を着た量子ビットのデコヒーレンスダイナミクスを解明する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 08:38:15 GMT)
Momentum Attention: The Physics of In-Context Learning and Spectral Forensics for Mechanistic Interpretability [0.0] 本稿では,運動性差分演算子を介して物理前兆を埋め込んだシンプレクティック拡張であるMomentum Attentionを紹介する。
直流(セマンティック)と交流(メカニスティック)の信号が高パスモーメントと相互作用するときに周波数帯域に分離することが証明された直交定理を定式化する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 21:56:02 GMT)
Laplacian-LoRA: Delaying Oversmoothing in Deep GCNs via Spectral Low-Rank Adaptation [0.0] 標準グラフ畳み込みネットワーク(GCN)の低ランク適応であるLaplacian-LoRAを提案する。
メッセージパッシングを再設計する代わりに、Laplacian-LoRAは学習可能でスペクトルに固定された修正を固定されたLaplacian伝搬演算子に導入する。
また,Laplacian-LoRAはGCNの有効深度を最大2倍にまで延ばし,過スムージングの開始を連続的に遅らせることを示した。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:03:19 GMT)
Knowledge Graph and Hypergraph Transformers with Repository-Attention and Journey-Based Role Transport [0.0] 本稿では,知識と言語表現を分離したまま,文と構造化データを用いた共同学習のための簡潔なアーキテクチャを提案する。
このモデルは知識グラフとハイパーグラフをロールスロットを持つ構造化インスタンスとして扱い、言語トランスフォーマーが参加可能なキーバリューリポジトリにエンコードする。
本稿では, マルチストリームアーキテクチャ, インスタンスローカル, 近傍, グローバルミキシングアテンションを持つ階層層群, 個別リポジトリ上の検索, マスク付き言語モデリング, リンク予測, ロール整合性を対象とするマルチタスク目標について概説する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 22:44:37 GMT)
Influence of Geometry, Class Imbalance and Alignment on Reconstruction Accuracy -- A Micro-CT Phantom-Based Evaluation [0.0] 医療スキャンから生成された3Dモデルの精度は、イメージングハードウェア、セグメンテーション方法、メッシュ処理技術に依存する。
この研究は、再構築パイプライン全体のエラーを評価し、ボクセルと表面ベース精度メトリクスの使用について検討する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 18:33:34 GMT)
Imagining the Alien: Human Projections and Cognitive Limitations [0.0] 他の惑星の生命、特に知的生命体がどんなものなのかを想像することは、人類文化における長年のテーマである。
異星人の生活形態と人類の文化的、歴史的、心理的現象のほとんどすべての想像は、宇宙人に向けられている。
この個人的・集団的な想像力の欠如は、我々の生物学的・文化的進化を反映しているかもしれない。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 00:22:48 GMT)
IPBAC: Interaction Provenance-Based Access Control for Secure and Privacy-Aware Systems [0.0] 本稿では,Interaction Provenance-based Access Control (IPBAC)モデルを提案する。
IPBACは、不正アクセスに対する保護を強化し、監査とコンプライアンスのトレーサビリティを高め、適応的なセキュリティポリシーをサポートする。
このプロファイランスベースのアクセス制御は、セキュリティを強化するだけでなく、監査とコンプライアンスのための堅牢なフレームワークも提供する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 22:32:59 GMT)
HAIF: A Human-AI Integration Framework for Hybrid Team Operations [0.0] ナレッジワークにおける生成AI、コピロ、エージェントシステムの迅速な展開は、運用上のギャップを生み出している。
既存のフレームワークでは、AIエージェントが人間と一緒に静的に委譲されたタスクを実行するチームでの日々の作業の整理方法に対処していない。
本稿では,4つの基本原理に基づいて構築されたプロトコルベースのスケーラブルな運用システムであるHumanAI Integration Framework(HAIF)を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:49:53 GMT)
From Dead Pixels to Editable Slides: Infographic Reconstruction into Native Google Slides via Vision-Language Region Understanding [0.0] インフォグラフィックはテキスト、アイコン、データ視覚化の組み合わせで広く使われるが、一度画像としてエクスポートされると、そのコンテンツはピクセルにロックされ、更新、ローカライゼーション、再利用が高価になる。
静的インフォグラフィック(JPG)をネイティブな編集可能なGoogle Slidesスライドに変換するtextscImages2Slidesについて,視覚言語モデル(VLM)を用いて領域レベルの仕様を抽出することによって記述する。
テキストサイズ校正や一様でない背景など,再構築における実践的なエンジニアリング上の課題を強調し,今後の作業を支援する障害モードについて説明する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:58:17 GMT)
Fast Response or Silence: Conversation Persistence in an AI-Agent Social Network [0.0] 我々は、AIエージェントのソーシャルネットワークであるMoltbookを1週間のスナップショットを用いて研究し、インタラクションハーフライフを紹介した。
何万ものコメントスレッドにわたって、モルトブックの議論は、チェーンの拡張よりも第一層反応に支配されている。
全体として、モルトブック上の初期のエージェントの社会的相互作用は、迅速な応答または沈黙の体制に適合し、持続する複数ステップの調整には明示的なメモリ、スレッドの再認識、再突入の足場が必要になる可能性が高いことを示唆している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 19:22:28 GMT)
Clarifying Core Dimensions in Digital Maturity Models: An Integrative Approach [0.0] デジタルトランスフォーメーションイニシアチブは、しばしば高い失敗率に直面します。
DMMは潜在的な解決策を提供するが、顕著な欠点がある。
本研究では、最も頻繁に使用される次元の積分的定義を提案する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 14:30:05 GMT)
Causal Rigidity of Born-Type Probability Rules in Infinite-Dimensional Operational Theories [0.0] 3つの運用上のモチベーションを持つ要件の下では、このクラス内の許容可能なルールは同一性に還元されなければならない。
このクラスの確率規則の中で、ボルンの規則は、通常の操舵を認める操作理論においてシグナルを伴わない唯一の代入として現れる。
連続変数および量子場理論系におけるポスト量子修正の提案に対する仮定と含意のスコープについて論じる。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 11:04:12 GMT)
Capturing the Topological Phase Transition and Thermodynamics of the 2D XY Model via Manifold-Aware Score-Based Generative Modeling [0.0] 連続スピンシステムのための新しいスコアベース生成モデリングフレームワークを提案する。
提案手法は,標準拡散モデルよりも精度のよい理論ボルツマンスコアを推定する。
我々は、ゼロショットの一般化を未知の格子サイズに示し、リトレーニングなしで可変系スケールの物理を正確に回復する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 13:50:20 GMT)
AgentTrace: A Structured Logging Framework for Agent System Observability [0.0] AgentTraceは、このギャップを埋めるために設計された動的可観測性とテレメトリフレームワークである。
従来のロギングシステムとは異なり、AgentTraceは継続的でイントロスペクタブルなトレースキャプチャを強調している。
我々の研究は、AgentTraceがより信頼性の高いエージェントデプロイメント、きめ細かいリスク分析、情報信頼の校正を可能にする方法を強調している。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 04:04:59 GMT)
A gravitationally induced decoherence model for photons in the context of the relational formalism [0.0] 我々は、マクスウェル理論から線形化重力に結合した光子の重力誘起脱コヒーレンスモデルを定式化する。
時間畳み込みのない(TCL)マスター方程式を導出し、その構造特性を解析する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 17:03:09 GMT)
A Course on the Introduction to Quantum Software Engineering: Experience Report [0.0] 量子コンピューティングはプログラミングによってますます実践される。
ほとんどの教育製品は、ソフトウェア工学の懸念よりも、アルゴリズムやフレームワークレベルの使用を重視している。
本稿では、ソフトウェア工学のレンズを通して量子コンピューティングをフレーム化する、クロスリストの学部生向けコースの設計と最初の提供について報告する。
論文参考訳(メタデータ) (Sat, 07 Feb 2026 15:35:04 GMT)