SkillJect: Automating Stealthy Skill-Based Prompt Injection for Coding Agents with Trace-Driven Closed-Loop Refinement [120.5] エージェントスキルに適したステルスプロンプトインジェクションのための自動フレームワークを提案する。
フレームワークは、明示的なステルス制約の下でインジェクションスキルを合成するアタックエージェント、インジェクションされたスキルを使用してタスクを実行するコードエージェント、アクショントレースをログする評価エージェントの3つのエージェントでクローズドループを形成する。
本手法は,現実的な環境下で高い攻撃成功率を達成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:09:48 GMT)
OneVision-Encoder: Codec-Aligned Sparsity as a Foundational Principle for Multimodal Intelligence [113.7] OneVision-Encoderは、視覚構造を意味的な意味に圧縮することでビデオをエンコードする。
Codec-aligned, patch-level sparsityは基本的な原則であり、次世代のビジュアルジェネラリストのためのスケーラブルなエンジンとしてOV-Encoderを可能にする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:16:11 GMT)
Evaluating LLMs in Finance Requires Explicit Bias Consideration [88.4] ファイナンス固有のバイアスは、パフォーマンスを低下させ、バックテストを汚染し、報告された結果をデプロイメントのクレームに役に立たないものにする。
一つのバイアスが28%以上の研究で議論されることはない。
本稿では,バイアス診断と将来のシステム設計のための最小限の要件を満たす構造的妥当性フレームワークと評価チェックリストを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:02:01 GMT)
VLAW: Iterative Co-Improvement of Vision-Language-Action Policy and World Model [87.8] 本研究の目的は、反復的なオンラインインタラクションにより、視覚言語アクション(VLA)モデルの性能と信頼性を向上させることである。
本稿では,実世界のロールアウトデータを用いて,世界モデルの忠実度を向上する簡易な反復改善アルゴリズムを提案する。
基本方針よりも39.2%の絶対成功率向上と、生成した合成ロールアウトによるトレーニングによる11.6%の改善を実現している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:04:15 GMT)
LaViDa-R1: Advancing Reasoning for Unified Multimodal Diffusion Language Models [86.8] マルチモーダルな汎用推論dLLMであるLaViDa-R1を提案する。
LaViDa-R1は多様なマルチモーダル理解と生成タスクを統一的に組み込んでいる。
応答強制、木探索、補完的推定など、いくつかの新しいトレーニング技術を採用している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:52:45 GMT)
LogitsCoder: Towards Efficient Chain-of-Thought Path Search via Logits Preference Decoding for Code Generation [86.1] コード生成のための軽量なロジットレベル制御機構を通じて、チェーン・オブ・シント推論を強化する新しいフレームワークであるLogitsCoderを提案する。
我々はLogitsCoderがより効率的で高品質な推論チェーンを生成することを示し、ベースライン方式に比べてコード生成性能が優れていることを示した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:52:19 GMT)
The Interspeech 2026 Audio Reasoning Challenge: Evaluating Reasoning Process Quality for Audio Reasoning Models and Agents [83.8] We organized the Audio Reasoning Challenge at Interspeech 2026。
この課題は、推論チェーンの事実とロジックを評価する新しいインスタンスレベルのプロトコルであるMMAR-Rubricsを導入した。
シングルモデルとエージェントのトラックが特徴で、18カ国から156チームが参加している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:38:09 GMT)
Text Before Vision: Staged Knowledge Injection Matters for Agentic RLVR in Ultra-High-Resolution Remote Sensing Understanding [78.3] 超高解像度(UHR)リモートセンシング(RS)のためのマルチモーダル推論は通常、視覚的エビデンス取得によってボトルネックとなる。
標準的な強化学習は、ドメインの事前構造がなくても、これらの広大な視覚空間をナビゲートするのに苦労している。
本研究では,(1)スケーラブルで知識グラフで検証された地球科学のテキストQAで冷間開始して推論構造を挿入し,(2)SFT中に同じ硬いUHR画像テキストの例で事前ウォーミングを行い,その後のツールベースのRLを安定化・増幅する,段階的な知識注入レシピを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:40:33 GMT)
High-accuracy log-concave sampling with stochastic queries [70.9] サブエクスフォデンシャルテールの繰り返し勾配を用いて,ログコンケーブサンプリングの精度保証が達成可能であることを示す。
また、このフレームワークは、0番目の順序(値)クエリの下でも、同様の高精度な保証を提供する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:19:07 GMT)
GeoEyes: On-Demand Visual Focusing for Evidence-Grounded Understanding of Ultra-High-Resolution Remote Sensing Imagery [69.1] シンキング・ウィズ・イメージ」パラダイムは、マルチモーダルな大規模言語モデル(MLLM)がズームインツールを使って視覚的なシーンを積極的に探索することを可能にする。
これは超高分解能(UHR)リモートセンシングVQAにおいて必須であり、タスク関連キューは疎小である。
筆者らは,(1)冷間開始型SFTデータセット, UHR-CoZ(UHR-CoZ)を多種多様なズームレジームをカバーするトレーニングフレームワークであるGeoEyes,(2)エージェント強化学習手法であるAdaZoom-GRPOを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:50:55 GMT)
EgoSound: Benchmarking Sound Understanding in Egocentric Videos [68.2] MLLMにおけるエゴセントリックな音の理解を評価するための最初のベンチマークであるEgoSoundを紹介する。
EgoSoundは、Ego4DとEgoBlindのデータを統合する。
固有音知覚、空間的局所化、因果推論、および相互モーダル推論にまたがる7つのタスクの分類を定義している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 12:46:35 GMT)
KoopGen: Koopman Generator Networks for Representing and Predicting Dynamical Systems with Continuous Spectra [65.1] 生成元をベースとしたニューラル・クープマン・フレームワークを導入し,構造的かつ状態に依存したクープマン・ジェネレータの表現を通じて動的にモデル化する。
固有のカルテス分解をスキュー結合および自己結合成分に利用することにより、KoopGenは可逆的な散逸から保守的な輸送を分離する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 06:32:23 GMT)
LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces [65.1] LongCLI-Benchは、長期にわたる現実的なタスクにまたがるエージェント能力を評価するために設計されたベンチマークである。
私たちは、1000以上のコンピュータサイエンスの課題と現実世界のタスクから、20の高品質で長い水平タスクをキュレートしました。
実験によると、最先端のエージェントでさえLongCLI-Benchの20%未満のパスレートを達成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:12:57 GMT)
HLE-Verified: A Systematic Verification and Structured Revision of Humanity's Last Exam [63.8] HumanityのLast Exam (HLE)は、フロンティアの大規模言語モデルを評価するために広く使われているベンチマークである。
HLE-Verifiedは,透過的検証プロトコルときめ細かい誤り分類法を備えたHLEの検証および改訂版である。
我々は,HLEとHLE-Verifiedの7つの最先端言語モデルを評価し,平均7~10ポイントの絶対精度を観測した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:50:15 GMT)
MC$^2$Mark: Distortion-Free Multi-Bit Watermarking for Long Messages [63.0] マルチビット透かしは、識別子を生成されたテキストに埋め込むことができるが、既存の方法は、長いメッセージを送りながらテキストの品質と透かしの強さを維持するのに苦労している。
本稿では,長文の埋め込みと復号化のための歪みのないマルチビット透かしフレームワークMC$2$Markを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:29:06 GMT)
ForgeryVCR: Visual-Centric Reasoning via Efficient Forensic Tools in MLLMs for Image Forgery Detection and Localization [62.0] ForgeryVCRは、視覚中心推論(Visual-Centric Reasoning)を通じて、知覚できないトレースを明示的な視覚中間体に物質化するフレームワークである。
ForgeryVCRは、検出タスクとローカライゼーションタスクの両方において、最先端(SOTA)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:14:47 GMT)
Flow4R: Unifying 4D Reconstruction and Tracking with Scene Flow [61.3] Flow4Rは、Vision Transformerを用いて、画素当たりのプロパティセット3Dポイント位置、シーンフロー、ポーズウェイト、および2ビュー入力からの信頼度を最小限に予測する。
静的データセットと動的データセットを併用してトレーニングされたFlow4Rは、4D再構築とトラッキングタスクにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 06:58:08 GMT)
Mobile-Agent-v3.5: Multi-platform Fundamental GUI Agents [56.7] この記事では、最新のネイティブGUIエージェントモデルであるGUI-Owl-1.5を紹介する。
クラウドとエッジのコラボレーションとリアルタイムのインタラクションを実現するために、さまざまなプラットフォーム(デスクトップ、モバイル、ブラウザなど)をサポートしている。
オープンソースモデル上で20以上のGUIベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 01:52:19 GMT)
GTS: Inference-Time Scaling of Latent Reasoning with a Learnable Gaussian Thought Sampler [54.1] 我々は、学習可能な密度から条件付きサンプリングとして潜在思考探索をモデル化し、このアイデアをガウス思想サンプリング(GTS)としてインスタンス化する。
GTSは、連続的推論状態における文脈依存摂動分布を予測し、バックボーンを凍結させながらGRPOスタイルのポリシー最適化を訓練する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:57:47 GMT)
UniWeTok: An Unified Binary Tokenizer with Codebook Size $\mathit{2^{128}}$ for Unified Multimodal Large Language Model [50.7] 我々はUniWeTokを紹介した。UniWeTokはUniified Multimodal Large Language Modelsのための統一された離散トークンである。
トレーニングフレームワークとして,個別トークンのセマンティックな抽出と生成を促進するために,プレポスト蒸留とジェネレーティブ・アウェア・プレファレンスを導入する。
我々は,UniWeTokの適応性を高めるために,様々な画像解像度と知覚に敏感なシナリオを横断する3段階のトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:07:19 GMT)
Zero-Shot Instruction Following in RL via Structured LTL Representations [50.4] マルチタスク強化学習では、エージェントが訓練中に見えない新しいタスクをゼロショットで実行しなければならない。
この設定では、最近、時間的に拡張された構造化タスクを特定するための強力なフレームワークとして線形時間論理が採用されている。
既存のアプローチはジェネラリストの政策を訓練することに成功しているが、仕様に固有のリッチな論理的・時間的構造を効果的に捉えるのに苦労することが多い。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:22:50 GMT)
Plan-MCTS: Plan Exploration for Action Exploitation in Web Navigation [50.4] Plan-MCTSは、探索を意味的なPlan Spaceに移行することでWebナビゲーションを再構築するフレームワークである。
Plan-MCTSは最先端の性能を達成し、タスク効率と探索効率を向上した現在の手法を超越している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:24:45 GMT)
Wideband Quantum Transduction for Rydberg Atomic Receivers Using Six-Wave Mixing [49.8] ライドバーグ原子受信機は電場に対して非常に高い感度を持つ。
従来の電磁誘導透過(EIT)下での有効3dBベースバンド帯域幅は、通常、数十から数百キロヘルツに制限される。
広帯域無線周波数(RF)-光量子トランスデューサとして6波混合(SWM)ベースのRydberg原子受信機について検討する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:08:30 GMT)
Radial-VCReg: More Informative Representation Learning Through Radial Gaussianization [49.2] 本稿では,Ci分布と特徴ノルムを整合させるラジアルガウス化損失でVCRegを増大させるラジアルVCRegを提案する。
我々は、Radar-VCRegがVCRegと比較してより広範な正規性に変換できることを証明し、連続的にパフォーマンスを向上させるための合成および実世界のデータセットを示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:50:52 GMT)
A Deployment-Friendly Foundational Framework for Efficient Computational Pathology [48.4] モデルオーバーパラメータ化とパッチレベルの冗長性を緩和するLitePathを提案する。
LitePathは、1億9000万のパッチを使用して3つの大きなPFMから蒸留されたコンパクトなモデルであるLiteFMを統合している。
LitePathはVirchhow2より104.5倍高速で、3000のスライドに対して0.36 kWhを消費する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 06:31:50 GMT)
Fusing Pixels and Genes: Spatially-Aware Learning in Computational Pathology [46.8] STAMPは空間的トランスクリプトミクスを付加したマルチモーダルな病理表現学習フレームワークである。
本研究は、自己教師型遺伝子誘導訓練が、病理画像表現の学習に堅牢でタスクに依存しない信号を提供することを示す。
6つのデータセットと4つの下流タスクにまたがってSTAMPを検証する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:59:13 GMT)
FM-RME: Foundation Model Empowered Radio Map Estimation [45.3] 従来のラジオマップ推定(RME)技術は、複雑なスペクトル環境の多次元的および動的特性を捉えるのに失敗する。
近年のデータ駆動方式は空間領域における正確なRMEを実現するが、電波伝搬の物理的事前知識は無視される。
ゼロショット一般化のための多種多様なデータに基づく自己教師付き事前学習を特徴とする新しい基礎モデルを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 01:37:11 GMT)
Moving Beyond Sparse Grounding with Complete Screen Parsing Supervision [45.1] ScreenParseは、スクリーン解析のための大規模なデータセットである。
771KのWebスクリーンショット全体にわたって、すべての可視的UI要素(ボックス、55クラスの型、テキスト)の詳細なアノテーションが含まれている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:00:02 GMT)
Choosing How to Remember: Adaptive Memory Structures for LLM Agents [43.3] メモリは、大きな言語モデル(LLM)ベースのエージェントが長い水平相互作用に対するコヒーレントな振舞いを維持するために重要である。
LLMエージェントに適応的なメモリ構成を可能にする統合フレームワークFluxMemを提案する。
PERSONAMEMとLoCoMoの2つのロングホライゾンベンチマーク実験により,本手法が平均改善率9.18%と6.14%を達成することを示した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:56:24 GMT)
AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines [43.3] AutoWebWorldは、制御可能で検証可能なWeb環境を合成するためのフレームワークである。
状態遷移が暗黙的な実際のWebサイトとは異なり、AutoWebWorldは、すべての状態、アクション、遷移ルールを明示的に定義している。
29の多様なWeb環境から11,663以上の認証トラジェクトリを生成し、1トラジェクトリあたり0.04ドルである。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:03:19 GMT)
GRRM: Group Relative Reward Modeling for Machine Translation [42.2] Group Relative Reward Model (GRRM) - 機械翻訳のためのモデル。
我々は、GQM(Group Quality Metric)パラダイムを導入し、GRRM(Group Relative Reward Model)を介してインスタンス化する。
我々のフレームワークは、一般的な翻訳品質を向上するだけでなく、最先端の推論モデルに匹敵する推論能力を開放する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:22:27 GMT)
BitDance: Scaling Autoregressive Generative Models with Binary Tokens [40.7] BitDanceはスケーラブルな自動回帰(AR)イメージジェネレータで、コードブックインデックスの代わりにバイナリビジュアルトークンを予測する。
高エントロピーのバイナリラテントにより、BitDanceは各トークンが最大2256$の状態を表現し、コンパクトで表現性の高い離散表現を生成する。
テキストから画像を生成するために、BitDanceは大規模なマルチモーダルトークンを訓練し、高解像度のフォトリアリスティック画像を効率よく生成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:09:05 GMT)
REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents [40.4] REDSearcherは複雑なタスク合成、ミッドトレーニング、拡張性のあるサーチエージェント最適化のための後トレーニングをコード署名する統合フレームワークである。
我々は、受動的リコールではなく、積極的にツールの使用を促すために、toolaugmentedクエリを導入している。
トレーニング中、コアアトミック能力の知識、計画、関数呼び出しを強化する。
我々は、強化学習実験のための高速で低コストなアルゴリズム反復を可能にする、局所シミュレーション環境を構築した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:04:46 GMT)
MCPShield: A Security Cognition Layer for Adaptive Trust Calibration in Model Context Protocol Agents [39.3] 我々は,MPPベースのツールを呼び出す際に,エージェントのセキュリティを保証するプラグインセキュリティ認知層としてMPPShieldを提案する。
我々の研究は、オープンエージェントエコシステムにおけるMPPベースのツール呼び出しに対して、実用的で堅牢なセキュリティ保護を提供します。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:10:00 GMT)
Toward Autonomous O-RAN: A Multi-Scale Agentic AI Framework for Real-Time Network Control and Management [39.2] 本稿では,オープン無線アクセスネットワーク(O-RAN)のためのマルチスケールエージェントAIフレームワークを提案する。
RANインテリジェンスは、Non-Real-Time (Non-RT), Near-Real-Time (Near-RT), Real-Time (RT)コントロールループにまたがるコーディネート階層として編成される。
これらのエージェントは,標準化されたO-RANインタフェースとテレメトリによってどのように協調するかを示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 12:34:01 GMT)
Annotation-Efficient Vision-Language Model Adaptation to the Polish Language Using the LLaVA Framework [39.0] 視覚言語モデル(VLM)は英語中心のデータに基づいて訓練され、他の言語や文化的な文脈での性能を制限する。
我々は、LLaVA-Next方法論を再現し、適応し、ポーランドのVLMのセットを作成します。
我々は,LLaVA-1.6-una-13Bをポーランド適応MMBenchで+9.5%改善し,高い品質の字幕を生成評価に用いた。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:54:40 GMT)
ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI [39.0] ForesightSafety Bench"は、最先端AIモデルの安全性評価フレームワークである。
このベンチマークでは、数万の構造化されたリスクデータポイントと評価結果が蓄積されている。
このベンチマークに基づいて,20以上の主流大規模モデルの系統的評価と詳細な解析を行う。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:12:44 GMT)
Benchmarking at the Edge of Comprehension [38.4] ベンチマークが実現不可能になった場合、AIの進歩を計測する能力が重要になります。
完全人間の理解が不可能な場合でも,モデルを比較するために設計された対戦型フレームワークであるCrytique-Resilient Benchmarkingを提案する。
標準的なベンチマークとは異なり、人間は有界検証として機能し、ローカライズされたクレームにフォーカスする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:51:29 GMT)
EIDOS: Latent-Space Predictive Learning for Time Series Foundation Models [37.9] EIDOSは、将来の価値予測から潜在空間予測学習に移行する基礎モデルファミリーである。
我々は、潜伏表現の進化を予測するために因果変換器を訓練し、構造化および時間的に整合した潜伏状態の出現を促す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:07:20 GMT)
Fast Catch-Up, Late Switching: Optimal Batch Size Scheduling via Functional Scaling Laws [37.7] バッチサイズスケジューリング(BSS)は、大規模ディープラーニングトレーニングにおいて重要な役割を果たす。
We show that the functional scaling law framework introduced in Li et al. (2025a) provided a principled lens for analysis BSS。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:06:45 GMT)
DenseMLLM: Standard Multimodal LLMs are Intrinsic Dense Predictors [35.1] MLLM(Multimodal Large Language Models)は、ハイレベルな視覚的理解において、例外的な能力を示す。
本研究では,タスク固有のデコーダを必要とせず,高密度な予測を行うための標準MLLMの調整により,このパラダイムに挑戦する。
提案したモデルはDenseMLLMと呼ばれ、複数のラベルやタスクに対するトークン管理戦略を新しいビジョンで実現した標準アーキテクチャに基づいている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:12:28 GMT)
You Can Learn Tokenization End-to-End with Reinforcement Learning [34.7] トークン化は、LLM(Large Language Models)のトレーニングパイプラインに残る、ハードコード圧縮ステップである。
これらのトークン境界は、より厳密な理論的保証を持つスコア関数推定を用いて学習可能であることを示す。
提案手法は, 定性的, 定量的に, 従来提案されていたストレートスルー推定よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:31:24 GMT)
RoboAug: One Annotation to Hundreds of Scenes via Region-Contrastive Data Augmentation for Robotic Manipulation [34.2] RoboAugは、大規模な事前トレーニングへの依存を最小限に抑える新しい生成データ拡張フレームワークである。
UR-5e、AgileX、Tien Kung 2.0という3つのロボットで、35k以上のロールアウトにまたがる大規模な実世界の実験を行います。
実証的な結果は、RoboAugが最先端のデータ拡張ベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:40:00 GMT)
UniRef-Image-Edit: Towards Scalable and Consistent Multi-Reference Image Editing [33.6] 高性能なマルチモーダル生成システムUniRef-Image-Editを提案する。
単一画像編集と複数画像合成を単一のフレームワークに統合する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:24:03 GMT)
TensorCircuit-NG: A Universal, Composable, and Scalable Platform for Quantum Computing and Quantum Simulation [33.1] 量子物理学、人工知能、高性能コンピューティングのギャップを埋めるために設計された次世代量子ソフトウェアプラットフォームであるCircuit-NGを紹介します。
Circuit-NGは、量子回路、テンソルネットワーク、ニューラルネットワークが単一のエンドツーエンドの微分可能な計算グラフに融合する、統一されたテンソルネイティブプログラミングパラダイムを確立する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:37:37 GMT)
Statistical Early Stopping for Reasoning Models [32.8] 本稿では、この問題を緩和するために、発生中の不確実性信号を監視する統計的に原則化された早期停止手法を提案する。
以上の結果から,不確実性を考慮した早期停止はLCM推論の効率性と信頼性を両立させる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:14:53 GMT)
Floe: Federated Specialization for Real-Time LLM-SLM Inference [32.8] Floeは、レイテンシに敏感でリソース制約のある環境向けに設計されたハイブリッドなフェデレーション学習フレームワークである。
個人データと微調整はオンデバイスのままであり、クラウドLLMはプロプライエタリな重みを公開せずに一般的な知識を提供する。
Floeはモデルパフォーマンスを大幅に改善し、リアルタイム制約下でエッジデバイスの推論遅延を低減する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:28:38 GMT)
Towards Spatial Transcriptomics-driven Pathology Foundation Models [32.7] 本稿では、局所的な分子情報を病理視覚エンコーダに注入するビジョン・オミクス自己教師型学習フレームワークを提案する。
腫瘍および14臓器の正常サンプルにまたがる70,000対の遺伝子の発現スポット-tissue領域のトレーニングによりSEALをインスタンス化する。
SEALエンコーダは、アウト・オブ・ディストリビューションに堅牢なドメイン一般化を示し、遺伝子対イメージ検索のような新しいクロスモーダル機能を実現する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:06:45 GMT)
Neuromem: A Granular Decomposition of the Streaming Lifecycle in External Memory for LLMs [32.0] 我々は、インターリーブされた挿入・検索プロトコルの下で外部メモリモジュールをベンチマークするスケーラブルなテストベッドであるNeuromemを紹介する。
メモリが丸ごと増大するにつれて、パフォーマンスは一般的に低下し、時間関連のクエリは依然として最も難しいカテゴリです。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:53:37 GMT)
DeepFusion: Accelerating MoE Training via Federated Knowledge Distillation from Heterogeneous Edge Devices [31.8] 最近の大規模言語モデル(LLM)は、自然言語処理において生成AIを変換している。
これらのモデルは、広範囲で多様なトレーニングデータを必要とする。
DeepFusionは、最初のスケーラブルなFederated MoEトレーニングフレームワークである。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:25:50 GMT)
WoVR: World Models as Reliable Simulators for Post-Training VLA Policies with RL [30.9] 我々は、VLAポリシーの訓練後、信頼性の高い世界モデルに基づく強化学習フレームワークであるWoVRを提案する。
制御可能なアクション条件付きビデオワールドモデルによってロールアウト安定性を向上させる。
また、Keyframe-evolutiond Rolloutsによる効果的なエラー深度を低減するために、想像上のインタラクションを再確認する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 03:48:20 GMT)
GUI-GENESIS: Automated Synthesis of Efficient Environments with Verifiable Rewards for GUI Agent Post-Training [30.7] 提案するGUI-GENESIS(GUI-GENESIS)は,効率の良いGUIトレーニング環境を,評価可能な報酬で自動生成するフレームワークである。
GUI-GENESISは、実際のアプリケーションのトレーニングと比較して、環境のレイテンシを10倍削減し、エポック毎のコストを28,000ドル以上削減する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:58:01 GMT)
Decentralized Federated Learning With Energy Harvesting Devices [30.2] Decentralized Federated Learning (DFL)は、エッジデバイスが、ローカルトレーニングと完全に分散されたデバイス対デバイス交換を通じて、モデルを協調的にトレーニングすることを可能にする。
これらのエネルギー集約的な操作は、しばしば限られたデバイスバッテリーを急速に減らし、運用寿命を短縮し、学習性能を低下させる。
我々は,DFLシステムにエネルギー回収技術を適用し,エッジデバイスが環境エネルギーを抽出し,持続的に動作できるようにする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:34:41 GMT)
Restoration Adaptation for Semantic Segmentation on Low Quality Images [29.6] 実世界のシナリオでは、低品質(LQ)画像を処理する際にセマンティックセグメンテーションのパフォーマンスが劣化することが多い。
本稿では,セグメンテーション先行を復元モデルに注入するセマンティック・トレーニング・リカバリ(SCR)モデルを提案する。
そして、RASSは意味回復の知識をLoRAベースのモジュールマージとタスク固有の微調整を通じてセグメンテーションに転送する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:13:23 GMT)
A Penalty Approach for Differentiation Through Black-Box Quadratic Programming Solvers [29.6] dXPPは、QP解決を差別化から切り離すペナルティベースの差別化フレームワークである。
ランダムに生成されたQP、大規模なスパースプロジェクション問題、実世界のポートフォリオ最適化タスクなど、様々なタスクにおいてdXPPを評価する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:05:36 GMT)
Direction Matters: Learning Force Direction Enables Sim-to-Real Contact-Rich Manipulation [28.7] 本稿では,専門家が設計したコントローラロジックを転送に利用するフレームワークを提案する。
タスクにおける特権的監督の成功に触発されて、シミュレーションには人間によって設計された有限状態マシンベースの位置/力制御を用いる。
シミュレーションの不正確さに非常に敏感な力の大きさとは異なり、力の方向はハイレベルなタスク形状を符号化し、シム・トゥ・リアルギャップをまたいで頑健なままである。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:57:13 GMT)
Robust Test-time Video-Text Retrieval: Benchmarking and Adapting for Query Shifts [28.5] ビデオテキスト検索(VTR)モデルは、現実世界のクエリシフトに対して非常に脆弱である。
本稿では,HAT-VTR(Hubness Alleviation for Test-time Video-Text Retrieval)をベースラインテストタイム適応フレームワークとして提案する。
大規模な実験により、HAT-VTRはロバスト性を大幅に改善し、さまざまなクエリシフトシナリオで一貫してメソッドのパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 05:57:44 GMT)
Cognitive Chunking for Soft Prompts: Accelerating Compressor Learning via Block-wise Causal Masking [28.5] 長期のコンテキストは、自己注意の計算コストがシークエンスの長さと2次的に増加するにつれて、推論遅延を増大させる。
既存のメソッドは通常、コンテキスト全体を無差別にメモリトークンの集合に圧縮する。
本稿では,メモリトークンの受容領域を逐次局所チャンクに制限する並列反復圧縮(PIC)を提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 03:58:13 GMT)
Eureka-Audio: Triggering Audio Intelligence in Compact Language Models [28.4] Eureka-Audioはコンパクトで高性能なオーディオ言語モデルであり,大規模モデルに対する競合性能を実現する。
Eureka-Audioは1.7Bパラメータしか含まないが、自動音声認識(ASR)、音声理解、高密度音声キャプションに強い性能を示す。
パラ言語推論をさらに強化するために,閉ループ音声命令データ合成と検証パイプラインであるDataFluxを導入する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:01:08 GMT)
Position Encoding with Random Float Sampling Enhances Length Generalization of Transformers [27.9] 我々は,事前学習や微調整で見えない長さによく一般化する,強力な位置符号化(PE)戦略であるランダムフロートサンプリング(RFS)を導入する。
RFSはランダムにサンプリングされた連続的な値を使用するため、トレーニング中にモデルをさまざまな指標に公開することにより、目に見えない長さでのアウト・オブ・ディストリビューション(OOD)の問題を回避することができる。
実験は、RFSがゼロショットコモンセンス推論ベンチマークと同様に長さ一般化タスクにおいて優れたパフォーマンスをもたらすことを示すことによって、その効果を裏付ける。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:32:22 GMT)
When Test-Time Guidance Is Enough: Fast Image and Video Editing with Diffusion Guidance [27.2] テストタイムガイダンスだけでは、トレーニングベースの手法に匹敵するパフォーマンスを達成できることを示す。
その結果、テストタイムガイダンスだけでは、トレーニングベースの手法に匹敵する、場合によっては超えるパフォーマンスを達成できることを示した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:13:25 GMT)
GeoFusionLRM: Geometry-Aware Self-Correction for Consistent 3D Reconstruction [27.2] 大規模な再構成モデル(LRM)を用いた単一画像の3D再構成は急速に進んでいるが、幾何的不整合がしばしば現れ、忠実さを制限している。
構造精度を向上させるために,モデル自身の正規および深度予測を利用する幾何学的自己補正フレームワークであるGeoFusionLRMを紹介する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 12:39:04 GMT)
Learning Part-Aware Dense 3D Feature Field for Generalizable Articulated Object Manipulation [24.8] Part-Aware 3D Feature Field (PA3FF)は、一般化可能なオブジェクト操作のための部分認識を備えた、新しい密集した3D機能である。
本稿では,ロボット操作におけるサンプル効率の向上と一般化を目的とした模倣学習フレームワークであるPart-Aware Diffusion Policy (PADP)を紹介する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:39:05 GMT)
Beyond Static Snapshots: Dynamic Modeling and Forecasting of Group-Level Value Evolution with Large Language Models [24.2] 社会シミュレーションは複雑な社会力学をマイニングし、データ駆動意思決定をサポートするために重要である。
既存のLLMベースのアプローチは、主に離散時点におけるグループレベルの値に焦点を当てている。
LLMに基づくヒューマン・レスポンス・モデリングに歴史的価値トラジェクトリを組み込んだグループレベルの動的社会シミュレーションのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:14:55 GMT)
Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook [23.9] Moltbookは、自律エージェントがオープンエンドで継続的に進化するオンライン社会に参加する、もっともらしい未来のシナリオを近似している。
本稿では,このAIエージェント・ソサエティの大規模システム診断について紹介する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:15:28 GMT)
A Generalizable Physics-guided Causal Model for Trajectory Prediction in Autonomous Driving [23.8] 交通機関の軌道予測は安全な自動運転に不可欠である。
我々は、ゼロショット軌道予測能力を高めるために、ドメイン不変の知識を取り入れることを目指している。
これらの課題に対処するため、我々は新しい物理誘導因果モデルを提案する。
実世界の自動運転データセットの実験では、見えない都市において、我々の手法の優れたゼロショット一般化性能が実証されている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:19:16 GMT)
QuRL: Efficient Reinforcement Learning with Quantized Rollout [23.3] 検証可能な報酬付き強化学習(RLVR)は、大規模言語モデル(LLM)の学習におけるトレンドパラダイムとなっている。
LLMの自己回帰復号性のため、ロールアウトプロセスはRLトレーニングの効率ボトルネックとなり、総トレーニング時間の最大70%を占める。
本稿では,Quantized Reinforcement Learning(QuRL)を提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 01:48:10 GMT)
FloCA: Towards Faithful and Logically Consistent Flowchart Reasoning [21.7] Flowchart-oriented dialogue (FOD) システムは,マルチターン意思決定や運用手順を通じてユーザを誘導することを目的としている。
本研究では,FODにおけるフローチャート推論を,対話ターン毎のフローチャートノードへのユーザ入力の基底として定式化する。
ゼロショットフローチャート指向の対話エージェントであるFloCAを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:51:27 GMT)
HiVid: LLM-Guided Video Saliency For Content-Aware VOD And Live Streaming [21.6] HiVidは、VoD(Video-on-Demand)とライブストリーミングの両方で高忠実度重みを生成するために、Large Language Modelsを活用するフレームワークである。
我々は、HiVidがVODで最大11.5%、SOTAベースライン上でのライブストリーミングで最大26%の重量予測精度を向上させることを示した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:13:51 GMT)
CCiV: A Benchmark for Structure, Rhythm and Quality in LLM-Generated Chinese \textit{Ci} Poetry [21.5] textbf Chinese textbfCipai textbfVariants (textbfCCiV) を導入する。
30テキストCipaiにおける17のLLMの評価では,モデルが詩形式の有効かつ予期せぬ歴史的変種を頻繁に生成し,音調パターンへの固執は構造規則よりも著しく困難である,という2つの重要な現象が明らかになった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:19:02 GMT)
REAL: Resolving Knowledge Conflicts in Knowledge-Intensive Visual Question Answering via Reasoning-Pivot Alignment [21.4] 知識集約型視覚質問応答(KI-VQA)はしばしば、オープンドメイン検索の固有の制限によって引き起こされる深刻な知識紛争に悩まされる。
本稿では,Reasoning-Pivot の概念に基づく REAL (Reasoning-Pivot Alignment) フレームワークを提案する。
提案手法はReasoning-Pivot Aware SFT(RPA-SFT)と組み合わせて、競合をピボット抽出と整合させて一般化可能な判別器を訓練し、ターゲットの競合緩和にReasoning-Pivot Guided Decoding(RPGD)を用いる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:29:53 GMT)
MarsRetrieval: Benchmarking Vision-Language Models for Planetary-Scale Geospatial Retrieval on Mars [21.0] 火星の地理空間探索のための視覚言語モデルを評価するためのベンチマークであるMarsRetrievalを紹介する。
マルチモーダル埋め込みアーキテクチャをベンチマークするための統合検索中心プロトコルを提案する。
我々の評価では、MarsRetrievalは困難であり、強力な基礎モデルでさえしばしばドメイン固有の地形的区別を捉えない。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:41:56 GMT)
ARport: An Augmented Reality System for Markerless Image-Guided Port Placement in Robotic Surgery [20.5] われわれはAR(拡張現実)システムであるARportを,事前に計画されたトロカーレイアウトを患者の体表面にマッピングする。
フルスケールの人間のファントム実験では、ARportは事前に計画されたトロカーサイトを物理的ファントムに正確にオーバーレイし、仮想計画と実際の解剖学の間の一貫した空間的対応を実現した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:57:47 GMT)
ATTest: Agent-Driven Tensor Testing for Deep Learning Library Modules [19.4] ディープラーニング(DL)ライブラリの単体テストは、複雑な数値意味論と暗黙のテンソル制約のために困難である。
本稿では,モジュールレベルの単体テスト生成のためのエージェント駆動テストフレームワークであるATTestを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 04:47:58 GMT)
Chemical Language Models for Natural Products: A State-Space Model Approach [19.2] 天然物(NP)は、薬物発見において重要であるにもかかわらず、未発見である。
状態空間モデル(MambaとMamba-2)の事前学習によるNP特化化学言語モデル(NPCLM)を開発する。
NPに着目したタスクに対する選択的状態空間モデルと変換器の最初の体系的比較を示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:26:36 GMT)
LAP: Language-Action Pre-Training Enables Zero-shot Cross-Embodiment Transfer [18.5] 本稿では,Language-Action Pre-Training(LAP)について紹介する。
LAPでは、学習トークン化やコストのかかるアノテーション、具体的アーキテクチャ設計は必要ありません。
LAP-3Bは平均ゼロショット成功率50%を超え、最強のビジョン・ランゲージ・アクションモデルよりも約2倍向上した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:32:16 GMT)
Policy Gradient with Adaptive Entropy Annealing for Continual Fine-Tuning [18.4] 本研究では,探索的(CEライクな)から搾取的(EPGライクな)学習に移行する訓練戦略を提案する。
様々なエントロピー正規化手法を評価し、出力予測分布の低いエントロピーが事前学習された視覚モデルにおける適応を促進することを示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:05:03 GMT)
The Inevitability of Side-Channel Leakage in Encrypted Traffic [18.4] 効率優先のシステムでは、少なくとも1つのアプリケーションペアが識別可能である場合、リークは避けられないことを示す。
これにより、暗号化されたトラフィックサイドチャネルのための厳密な情報理論の基礎が確立される。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:55:19 GMT)
It Takes Two to Tango: A Holistic Simulator for Joint Order Scheduling and Multi-Agent Path Finding in Robotic Warehouses [18.1] WareRoverはOSとMAPFの動的結合を強制する総合シミュレーションプラットフォームである。
標準ベンチマークとは異なり、WareRoverは順序ストリーム、物理を意識した動作制約、非線形回復機構を単一の評価ループに統合する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 05:51:58 GMT)
Empty Shelves or Lost Keys? Recall Is the Bottleneck for Parametric Factuality [17.1] 質問よりも事実のレベルで事実知識をプロファイルする行動枠組みを提案する。
WikiProfileは自動パイプラインで構築された新しいベンチマークで,Web検索に LLM が組み込まれている。
GPT-5とGemini-3は95~98%の事実を符号化している。
我々は、思考がリコールを改善し、かなりの数の障害を回復できることを示し、将来の利益はスケーリングよりも、モデルがすでにコード化したものをどのように利用するかを改善する方法に依存していることを示している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:13:30 GMT)
CoCoEdit: Content-Consistent Image Editing via Region Regularized Reinforcement Learning [15.4] コンテンツ一貫性編集のためのポストトレーニングフレームワーク(CoCoEdit)を提案する。
まず、改良された命令とマスクによる既存の編集データセットを拡張し、そこから40Kの多様性と高品質なサンプルをトレーニングセットとしてキュレートする。
次に、MLLMに基づく報酬を補完する画素レベルの類似性報酬を導入し、編集過程における品質とコンテンツ整合性の両方をモデルが保証する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:36:54 GMT)
Train Short, Inference Long: Training-free Horizon Extension for Autoregressive Video Generation [15.1] textbfFLEX(textbfFrequency-aware textbfLength textbfEXtension)は、トレーニング不要な推論時間フレームワークである。
短期トレーニングと長期推論のギャップを埋める。
4分間のスケールで一貫した動的ビデオ合成をサポートする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:14:47 GMT)
Freq-DP Net: A Dual-Branch Network for Fence Removal using Dual-Pixel and Fourier Priors [14.6] フェンス除去のためのデュアルピクセル(DP)センサを利用する最初のフレームワークを紹介する。
Freq-DP Netは2つの相補的前兆を融合させる新しいデュアルブランチネットワークである。
注意機構は、これらのキューを高度に正確なフェンスセグメンテーションのためにインテリジェントにマージする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:43:43 GMT)
CodeGlance: Understanding Code Reasoning Challenges in LLMs through Multi-Dimensional Feature Analysis [14.3] CodeGlanceは、3つの現実的なシナリオにわたるコード推論の課題を調査するベンチマークです。
未確認関数推論は,特に小型モデルでは重要な課題となる。
シナリオ間でコード推論の難しさに大きな影響を及ぼす重要なコード複雑性の特徴を特定します。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:46:51 GMT)
Whom to Query for What: Adaptive Group Elicitation via Multi-Turn LLM Interactions [13.9] エージェントが明示的なクエリと参加予算の下で、質問と回答者の両方を適応的に選択するマルチラウンド・セッティングであるアダプティブ・グループ・エリケーション(Adaptive group elicitation)について検討する。
提案手法は, (i) LLMに基づく予測情報取得目標と (ii) 不均一なグラフニューラルネットワークの伝搬を組み合わせ, 観測された応答と属性を集約し, 欠落した応答をインプットし, 丸ごとの応答選択をガイドする。
実世界の3つの世論データセット全体で、我々の手法は、制約された予算下での人口レベルの反応予測を継続的に改善します。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:05:34 GMT)
Investigation for Relative Voice Impression Estimation [13.8] 本研究では,相対音声印象推定(RIE)について検討する。
RIEは、同一話者から2つの発話の知覚的差異を予測するためのフレームワークである。
音声の感情認識によく用いられる古典的音響特徴,自己教師型音声表現,マルチモーダル大言語モデル,の3つの手法を比較した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:54:52 GMT)
Deep Dense Exploration for LLM Reinforcement Learning via Pivot-Driven Resampling [13.6] Deep Dense Exploration (DDE) は、$textitpivots$-deep、リカバリ可能な状態を軌道上で探索する戦略である。
我々の手法はGRPOや木に基づく手法、その他の強力なベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:44:15 GMT)
S2SServiceBench: A Multimodal Benchmark for Last-Mile S2S Climate Services [12.6] S2S予測は、気候の弾力性と持続可能性のための決定クリティカルな数週間の計画窓を提供する上で重要な役割を担っている。
ボトルネックの増大は、科学的予測を信頼できる行動可能な気候サービスに変換することだ。
S2SServiceBenchは、運用型気候サービスシステムからラストマイルS2S気候サービスのためのマルチモーダルベンチマークである。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 06:46:27 GMT)
Every Maintenance Has Its Exemplar: The Future of Software Maintenance through Migration [12.1] 手動のソフトウェアメンテナンスは、労働集約的で、時間がかかり、エラーを起こします。
最近の研究では、マイグレーションベースのアプローチが、知識、アーティファクト、あるいはソリューションをあるシステムから別のシステムに移すことが実証されている。
本稿では,ソフトウェアメンテナンスへのマイグレーションベースのアプローチに関する,最初の体系的な研究課題を提示することによって,さらに一歩進める。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:21:15 GMT)
MixFormer: Co-Scaling Up Dense and Sequence in Industrial Recommenders [11.6] MixFormerは、レコメンデーションシステム用に設計されたTransformerスタイルの統一アーキテクチャである。
単一のバックボーン内でのシーケンシャルな振る舞いと特徴的相互作用を共同でモデル化する。
大規模産業データセットの実験は、MixFormerが常に優れた精度と効率を示すことを示した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:53:30 GMT)
AD-Bench: A Real-World, Trajectory-Aware Advertising Analytics Benchmark for LLM Agents [11.5] AD-Benchは、広告とマーケティングプラットフォームの実際のビジネス要件に基づくベンチマークである。
ベンチマークでは、リクエストを3つの難易度に分類し、マルチラウンドのマルチツールコラボレーションの下でエージェントの能力を評価する。
実験によると、最先端のモデルでさえ、複雑な広告やマーケティング分析のシナリオにおいて、大きな能力のギャップをみせている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:59:47 GMT)
Energy-Efficient Over-the-Air Federated Learning via Pinching Antenna Systems [11.5] ピンチアンテナシステム(PASS)は、近年、フレキシブルアンテナ技術として提案されている。
本研究は,OTA-FL(Over-the-air Federated Learning)におけるPASSの利用の可能性を探るものである。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:42:53 GMT)
Neural Optimal Transport in Hilbert Spaces: Characterizing Spurious Solutions and Gaussian Smoothing [11.5] 非正規設定では、セミデュアル・ニューラルOTはしばしば、ターゲットの分布を正確に捉えるのに失敗する突発的な解を生成する。
我々は、有限次元におけるルベーグ絶対連続性を一般化する正規測度の枠組みを用いて、この解問題を解析的に特徴づける。
不備を解消するため、ブラウン運動に基づくガウス平滑化戦略により半双対の枠組みを拡張した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:27:09 GMT)
Simultaneous State Estimation and Online Model Learning in a Soft Robotic System [11.4] ソフトロボットは、正確な状態とモデル知識を必要とする正確な予測制御スキームの恩恵を受けることができる。
未知の状態を同時に推定し、逐次到着した測定結果からオンラインでモデルを学習することは困難である。
本稿では,最近提案されたグレーボックスシステム識別ツールを用いて,ソフトロボットの現在のポーズを推定する方法を示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:44:58 GMT)
Autonomous Robotic Tissue Palpation and Abnormalities Characterisation via Ergodic Exploration [11.4] 粘弾性組織モデルを用いた組織探索におけるリアルタイム弾性マッピングのための新しい自律型ロボット触診フレームワークを提案する。
商用の力/トルクセンサを用いた力に基づくパラメータ推定と、調整された予測情報密度によって駆動されるエルゴード制御戦略を組み合わせる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:37:21 GMT)
STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts [11.2] STATeは高レベルの推論パターンを検索する解釈可能なITC手法である。
コントローラは、ハイレベルな推論選択を符号化する動作を選択し、ジェネレータは、それらの選択に条件付けられた推論ステップを生成し、評価器は、検索を誘導する候補をスコアする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:29:54 GMT)
Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines? [10.9] スパースオートエンコーダ(SAE)は、アクティベーションをスパースセットの人間解釈可能な特徴に分解することで、ニューラルネットワークを解釈するための有望なツールとして登場した。
最近の研究は複数のSAE変異体を導入し、フロンティアモデルへの拡張に成功した。
多くの興奮にもかかわらず、下流タスクにおけるネガティブな結果の増加は、SAEが有意義な特徴を回復するかどうかに疑問を投げかけている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:53:55 GMT)
Synergistic Intra- and Cross-Layer Regularization Losses for MoE Expert Specialization [10.7] そこで本研究では,MoEの特殊化とルーティング効率を向上させる2つのプラグアンドプレイ正規化損失を提案する。
両方の損失をMegatron-LMモジュールとして実装する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:19:12 GMT)
TabTracer: Monte Carlo Tree Search for Complex Table Reasoning with Large Language Models [10.6] TabTracerは、中間テーブル状態上のマルチステップツールコールをコーディネートするエージェントフレームワークである。
型付き操作と軽量数値およびフォーマットチェックによるステップレベルの検証を実施する。
予算を意識したプルーニング、重複解消、トークンコスト削減のためのモノトニティゲートによる状態ハッシュによる冗長性を低減する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:39:43 GMT)
Inject Where It Matters: Training-Free Spatially-Adaptive Identity Preservation for Text-to-Image Personalization [10.5] 個人化されたテキスト・画像生成のためのトレーニング不要な空間適応型ID変調フレームワークであるSpatialIDを提案する。
IBenchの実験では、SpatialIDはテキストのアテンデンス、視覚的一貫性、画質において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 05:25:57 GMT)
GRAIL: Goal Recognition Alignment through Imitation Learning [10.3] 本稿では,Imitation Learning (GRAIL)によるゴール認識アライメントを提案する。
GRAILは、(潜在的に最適でない)実証軌道から直接、各候補目標に対する1つの目標指向ポリシーを学習する。
F1スコアは、体系的にバイアスされた最適挙動の下で0.5以上増加し、準最適挙動下では0.1-0.3の利得を達成し、ノイズの多い最適軌道下では最大0.4の改善をもたらす。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:45:03 GMT)
Open Rubric System: Scaling Reinforcement Learning with Pairwise Adaptive Rubric [10.2] スカラー報酬モデルでは、多次元の人間の嗜好を1つの不透明スコアに圧縮する。
プラグ・アンド・プレイのルーブリックベースのLLM-as-a-JudgeフレームワークであるOpen System(OpenRS)を紹介する。
OpenRSは明示的なメタルブリックを使用します -- ガバナンスがどのようにインスタンス化され、重み付けされ、強制されるかという、コンスティチューションのような仕様です。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:39:39 GMT)
Context Over Compute Human-in-the-Loop Outperforms Iterative Chain-of-Thought Prompting in Interview Answer Quality [10.2] 大規模モデルを用いた行動面接評価は, 構造化評価, 現実的行動シミュレーション, 教育的価値を必要とする独特な課題を提示する。
我々は,50対の行動質問応答対を用いた2つの制御実験を通して,インタビュー回答の評価と改善を促す思考の連鎖について検討した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 05:25:54 GMT)
Steady-State Behavior of Constant-Stepsize Stochastic Approximation: Gaussian Approximation and Tail Bounds [9.7] 定段近似(SA)は計算効率の学習に広く用いられている。
以前の研究は、段数 $downarrow 0$ のとき中心とスケールの定常状態がガウス確率ベクトルに弱収束することを示していた。
この論文は、固定された$に対して明示的で漸近的でないエラー境界を提供する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:34:50 GMT)
MAGE: All-[MASK] Block Already Knows Where to Look in Diffusion LLM [9.7] ブロック拡散LDMは言語生成の次のパラダイムとして期待されているが、KVキャッシュの利用により、長期コンテキスト設定においてメモリアクセスが主要なボトルネックとなっている。
この研究は拡散をブロックする鍵となる機会を特定し、第1回All-[MASK]における注意は、重要なKVエントリと予算要件を確実に予測する。
MAGEはKV予算のごく一部でほぼロスレスの精度を達成し、最大3-4倍のエンドツーエンドのスピードアップを提供する。
軽量な微調整戦略は、[MASK]誘導パターンを最小限のコストで強化し、数時間のトレーニングしか必要としない。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:07:51 GMT)
AXE: An Agentic eXploit Engine for Confirming Zero-Day Vulnerability Reports [9.2] Agentic eXploit Engine (AXE)は、Webアプリケーションを利用するためのマルチエージェントフレームワークである。
AXEは30%のエクスプロイト成功率を実現しており、最先端のブラックボックスベースラインよりも3倍改善されている。
エクスプロイトの成功のために、AXEは実行可能で再現可能な概念実証成果物を生成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:25:14 GMT)
Introduction to Digital Twins for the Smart Grid [9.1] この章では、デジタルツインの基礎について紹介し、スマートグリッドでそれらを採用することについて論じる。
高忠実な物理部品のシリコン内レプリカとして、デジタルツインは安全で費用対効果の高い実験施設を提供する。
スマートグリッドの運用段階において、ディジタルツインはリアルタイムシミュレーションと意思決定を通じてグリッドの自動ロードバランシングを可能にする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:59:11 GMT)
LM-Lexicon: Improving Definition Modeling via Harmonizing Semantic Experts [9.1] LM-Lexiconは、データクラスタリング、セマンティックエキスパートラーニング、モデルマージを取り入れた革新的な定義モデリングアプローチである。
我々の研究は、セマンティック集約型アプリケーションのための効率的な言語モデルの開発に関する洞察を提供しながら、定義モデリングを進めていく。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:18:22 GMT)
Automated evaluation of LLMs for effective machine translation of Mandarin Chinese to English [8.7] マンダリンの中国語から英語への翻訳を評価するために,意味分析と感情分析を特徴とする自動機械学習フレームワークを利用する。
我々は、現代・古典文学にまたがる新しいテキストやニュース記事を含む、高名な漢文の様々なクラスの原文と翻訳文を比較した。
以上の結果から,LLMはニュースメディア翻訳において良好に機能するが,文学的テキストに適用すると,その性能にばらつきが生じることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:43:06 GMT)
Bidirectional Temporal Dynamics Modeling for EEG-based Driving Fatigue Recognition [8.6] 運転疲労は交通事故の主要な原因であり、道路の安全に深刻な脅威をもたらす。
脳波に基づく疲労認識は、強い非定常性と非対称神経力学によって妨げられる。
我々は,脳波に基づく運転疲労認識のための双方向時間ダイナミクスを明示的に捉える新しいフレームワークDeltaGateNetを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:42:25 GMT)
Evaluating Disentangled Representations for Controllable Music Generation [8.2] 探索型フレームワークを用いた制御可能生成のための音楽音響モデルにおける不整合表現の評価を行った。
選択されたモデルは、インダクティブバイアス、データ拡張、敵対的目標、ステージドトレーニング手順など、さまざまな教師なしの非絡み合い戦略を反映している。
本研究により, 埋め込みの意図的意味論と実際の意味論の矛盾が明らかとなり, 現状の戦略が真に不整合表現を生み出すには至っていないことが示唆された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:31:32 GMT)
Character-aware Transformers Learn an Irregular Morphological Pattern Yet None Generalize Like Humans [8.0] エンコーダ・デコーダモデルが不規則なパターンを取得可能であることを示すが、それらが人間のようなパターンを一般化する証拠は混在している。
本研究では, スペイン語のemphL型形態素を用いて, 一人称単数指示詞のみがその茎をすべての部分接形と共有する。
いずれのモデルも人間のパターンを再現せず、統計的パターンの再現と形態的抽象化のギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:22:12 GMT)
WIMLE: Uncertainty-Aware World Models with IMLE for Sample-Efficient Continuous Control [8.0] 本稿では,モデルベースRLフレームワークにImplicit Likelihood Estimation Maximum(IMLE)を拡張するモデルベース手法であるWIMLEを紹介する。
WIMLEは、予測された信頼度によってそれぞれの合成遷移を重み付け、不確実な予測からバイアスを減らしながら有用なモデルロールアウトを保存する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:53:16 GMT)
Homodyne Detection of Temporally Resolved Quantum States [7.8] 本稿では,平衡ホモダイン検出による時間領域の時間領域測定について述べる。
メソッドの完全な実装は、GitHubリポジトリ上のオープンソースコードを通じて提供される。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 01:12:36 GMT)
Resilient Alerting Protocols for Blockchains [7.8] 高度なスマートコントラクトは、外部イベントに関するタイムリーなアラートに依存することが多いが、以前の作業では、収賄を通じて警告を抑圧する攻撃者に対するレジリエンスを分析していない。
我々は,この課題を暗号学的問題として分析し,プロトコルから逸脱した場合にはペナルティを科す相手同士の対戦を生ずる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:31:28 GMT)
Multi-Agent Debate: A Unified Agentic Framework for Tabular Anomaly Detection [7.8] マルチエージェント議論フレームワーク(MAD)は、不一致を第一級信号として扱う。
MADは、大言語モデル(LLM)ベースの批評家によって強化された正規化された異常スコア、信頼性、構造化された証拠を生成する。
コンフォメーションキャリブレーションが議論されたスコアをラップして、交換可能性の下で偽陽性を制御する方法を示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:44:32 GMT)
Optical transport of cold atoms to quantum degeneracy [7.7] 2本のベッセルビームで形成される移動光学格子を用いたボース・アインシュタイン凝縮に対する冷間原子の高速光輸送を実証した。
縮退ガスは、原子間相互作用によって駆動される相同期過程から、40%の縮合分数を持つ1倍の105$原子である。
このデモンストレーションは、量子センシング、シミュレーション、計算のための超低温原子ビームと大規模原子アレイの高速作成を可能にする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:42:11 GMT)
An effective Genetic Programming Hyper-Heuristic for Uncertain Agile Satellite Scheduling [7.5] 効果的な遺伝的プログラミングハイパーヒューリスティックはスケジューリングポリシーの生成を自動化するように設計されている。
進化したスケジューリングポリシーは、リアルタイムで計画を調整するために利用することができ、非常にうまく機能する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 02:09:57 GMT)
Offline Learning of Nash Stable Coalition Structures with Possibly Overlapping Coalitions [7.3] 連合の形成は、その好みに基づいて連立を結成する利己的なエージェントの戦略的協力に関するものである。
連立は不一致であり、実際には成立しないかもしれない選好が完全に知られているとしばしば仮定される。
部分的な情報の下で重なる可能性のある連立による連立形成の新しいモデルを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:05:12 GMT)
HyMem: Hybrid Memory Architecture with Dynamic Retrieval Scheduling [7.2] HyMemは、マルチグラニュラメモリ表現による動的オンデマンドスケジューリングを可能にするハイブリッドメモリアーキテクチャである。
LOCOMOとLongMemEvalのベンチマークにおいて,HyMemは高い性能を示し,計算コストを92.6%削減した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:06:19 GMT)
A Rational Analysis of the Effects of Sycophantic AI [7.0] 我々は、偽りをもたらす幻覚とは異なり、サイコファシーは、既存の信念を強化するために偏見のある反応を返すことによって現実を歪めてしまうと論じている。
ベイズエージェントが現在の仮説に基づいてサンプリングされたデータを備えると、エージェントはますますその仮説に自信を持つようになるが、真実に向かっては進まないことを示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:49:19 GMT)
Robust multi-task boosting using clustering and local ensembling [6.9] クラスタリングと局所組立(RMB-CLE)を用いたロバストマルチタスクブースティングを提案する。
RMB-CLEは、クロスタスクエラーから直接タスク間類似性を導出する。
各クラスタ内のローカルアンサンブルは、堅牢な知識共有を可能にする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:59:23 GMT)
GRAFNet: Multiscale Retinal Processing via Guided Cortical Attention Feedback for Enhancing Medical Image Polyp Segmentation [6.8] 本稿では,人間の視覚システムの階層構造を模倣する生物学的にインスパイアされたアーキテクチャであるGRAFNetを提案する。
GRAFNetは,(1)方向調整された皮質ニューロンをポリプ境界に模倣するガイド非対称注意モジュール(GAAM),(2)平行多機能解析のために網膜神経節細胞経路を複製するマルチスケール網膜モジュール(MSRM),(3)反復精製に予測符号化を適用するガイド非対称注意フィードバックモジュール(GCAFM)の3つの重要なモジュールを統合する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:29:37 GMT)
$k$-Positivity and high-dimensional bound entanglement under symplectic group symmetry [6.5] シンプレクティック群対称性を示す線形写像と二部量子状態のクラスに対する$k$-陽性とシュミット数の構造について検討する。
本研究は,PPTエンタングルメントの強い形式と高次エンタングルメントの両方を系統的に研究できる,自然かつ解析的に抽出可能なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:59:00 GMT)
Why Self-Training Helps and Hurts: Denoising vs. Signal Forgetting [6.4] 反復的な自己学習は、自身の予測によって生成された擬似ラベルのモデルに繰り返し適合する。
繰り返しの予測リスクと有効雑音に対する決定論的等価再帰を導出する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:28:12 GMT)
ProAct: A Dual-System Framework for Proactive Embodied Social Agents [6.3] 身近な社会的エージェントは、最近、音声とジェスチャーの同期生成に進歩している。
積極的社会的行動には、蓄積された文脈と意図推論に関する熟考が必要である。
マルチモーダルインタラクションをストリーミングするためのデュアルシステムフレームワークであるemphProActを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:27:34 GMT)
Chain-of-Thought Reasoning with Large Language Models for Clinical Alzheimer's Disease Assessment and Diagnosis [5.9] アルツハイマー病(AD)は世界中の神経変性疾患となっている。
大規模言語モデル (LLM) は電子的健康記録を用いて医療分野に適用されつつある。
本研究は,患者の臨床用ERHを考慮し,LCMを用いてCoT(Chain-of-Thought)を実行することを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 03:56:24 GMT)
Rigidity-Based Multi-Finger Coordination for Precise In-Hand Manipulation of Force-Sensitive Objects [5.3] マルチフィンガーハンドは指先接触のみに依存しており、プルフォースを適用できない。
力覚的物体の高精度な操作を可能にする多指協調のための二重層フレームワークを提案する。
我々は、このフレームワークをカスタムなデクスタラスな手で検証し、脆弱なオブジェクトを操作できることを実証した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:40:39 GMT)
A Patient-Specific Digital Twin for Adaptive Radiotherapy of Non-Small Cell Lung Cancer [5.3] 安全な放射線治療のためのテンポラルデジタルツインアーキテクチャを開発した。
GRUオートエンコーダを用いて臓器特異的潜在性軌跡を学習し,ロジスティック回帰により毒性を予測する。
危険度は臨床毒性の前に数パーセントから上昇していたため,AIによる早期警戒窓が有効であることが判明した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 01:47:31 GMT)
Enhancing collective spin squeezing via one-axis twisting echo control of individual atoms [5.3] 内部の原子レベルの自由度を利用してスクイージングを促進する既存のスキームは、通常、磁気的サブレベルの複雑な重ね合わせにおいて、集団スクイージングを符号化する。
本稿では,原子-原子の絡み合いを2つのよく定義された磁気的サブレベルにマッピングし,同時にスピンスクイーズを向上するコヒーレント制御手法を提案する。
この結果は、多レベル原子システムにおいて、非常に絡み合った、かつアクセスしやすい量子状態を生成するための、単純かつ効率的な戦略を提供する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:54:09 GMT)
The Agent Economy: A Blockchain-Based Foundation for Autonomous AI Agents [5.2] 我々は、自律型AIエージェントが人間の経済的仲間として機能するブロックチェーンベースの基盤を提案する。
現在のエージェントは独立した法的アイデンティティを欠き、資産を保有できず、直接支払いを受け取れない。
我々は、人間と機械経済の基本的な違いを確立し、既存の人間中心のインフラが真のエージェントの自律性をサポートできないことを示した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:20:43 GMT)
Bridging AI and Clinical Reasoning: Abductive Explanations for Alignment on Critical Symptoms [5.2] 主な課題は、AI推論が構造化された臨床フレームワークから分岐することである。
我々は、一貫した保証された推論を提供する形式的な誘惑的説明を活用する。
これにより、AI意思決定を明確に理解することができ、臨床推論と一致させることができる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 04:27:59 GMT)
Learning Category-level Last-meter Navigation from RGB Demonstrations of a Single-instance [5.2] ほとんどのRGBベースのナビゲーションシステムは、粗いメートルレベルの精度しか保証していない。
このギャップは、操作ポリシーがトレーニングデモの配布内で動作することを防ぐ。
我々は、ラストメーターナビゲーションのためのオブジェクト中心の模倣学習フレームワークを導入する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:23:23 GMT)
TS-Haystack: A Multi-Scale Retrieval Benchmark for Time Series Language Models [4.4] 時系列言語モデル(TSLM)は、自然言語における連続的な信号の推論のための統一モデルとして登場している。
既存のモデルは通常、短いシーケンスでトレーニングされ、評価されるが、現実の時系列センサーストリームは数百万のデータポイントにまたがる。
TS-Haystackは4つのカテゴリにまたがる10のタスクタイプからなる長期コンテキストの時間的評価ベンチマークである。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:50:02 GMT)
Simpler Than You Think: The Practical Dynamics of Ranked Choice Voting [4.4] ランク付き選択投票(RCV)の採用はアメリカ合衆国大統領選挙全体で拡大しているが、複雑さ、戦略的な操作、および投票の疲れに対する批判が続いている。
ニューヨーク市の2021年の民主党予備選挙(54回)、アラスカ州の2024年の予備選挙(52回)、ポートランドの2024年のマルチウィンナー市議会選挙(4回)である。
以上の結果から,RCVは単純で透明なダイナミックスを連続的に示し,複数の選挙の解釈可能性に密接に反映していることが明らかとなった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:51:59 GMT)
Learnable Multi-level Discrete Wavelet Transforms for 3D Gaussian Splatting Frequency Modulation [4.4] 3D Gaussian Splatting (3DGS) は、新しいビュー合成のための強力なアプローチとして登場した。
3DGSのためのマルチレベルDWTベースの周波数変調フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:49:03 GMT)
DAIAN: Deep Adaptive Intent-Aware Network for CTR Prediction in Trigger-Induced Recommendation [4.2] 本稿では,ユーザの意図的嗜好に動的に適応するDeep Adaptive Intent-Aware Network (DAIAN)を提案する。
まず、ユーザのクリックとトリガー項目の相関関係を分析し、ユーザのパーソナライズされた意図表現を抽出する。
次に、ユーザの関連する過去の振る舞いを検索して、ユーザの多様な意図をマイニングする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 03:10:36 GMT)
Language Modeling and Understanding Through Paraphrase Generation and Detection [4.1] 我々は、異なる単語や構造を用いて、ほぼ無限の方法で同じ考えを表現することができる。
パラフレーズのモデリングは、計算言語モデルにおける意味のキーストーンである。
パラフレーズをその構成的言語的側面に分解することで、意味的同値性をより認知的に根ざした視点が得られることを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:09:40 GMT)
SemanticFeels: Semantic Labeling during In-Hand Manipulation [4.1] 本稿では,意味的ラベル付けと暗黙的形状表現を統合した,NeuralFeelsフレームワークの拡張であるSemanticFeelsを紹介する。
本システムは, 単体および多体の両方の物体上で, 予測材料と実物との高対応性を実現する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:22:05 GMT)
Muscle Coactivation in the Sky: Geometry and Pareto Optimality of Energy vs. Promptness in Multirotors [3.9] モータの制限トルクとロータ速度から推力への非線形空力マップが, 突発性という新しい概念を生み出していることを示す。
エネルギー消費を競合対象として扱うことにより、冗長分解能をアフィン繊維上の原理化された多目的プログラムに変換する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:35:46 GMT)
A Multi-Agent Framework for Code-Guided, Modular, and Verifiable Automated Machine Learning [3.6] iMLは、AutoMLをブラックボックスからコード誘導、モジュール化、検証可能なアーキテクチャパラダイムに移行するために設計された、新しいマルチエージェントフレームワークである。
MLE-BENCHと新たに導入されたiML-BENCHをまたいでiMLを評価する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:20:58 GMT)
Integrating Unstructured Text into Causal Inference: Empirical Evidence from Real Data [3.6] 本稿では,非構造化テキストを用いた因果推論を行うためにトランスフォーマーに基づく言語モデルを利用するフレームワークを提案する。
本研究では,非構造化テキストから得られた因果推定値と,人口,集団,個人レベルで得られた構造化データとを比較して,本フレームワークの有効性を実証する。
我々のアプローチは、因果推論手法の適用性を、テキストデータのみが利用可能なシナリオに拡張する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:55:03 GMT)
KernelBlaster: Continual Cross-Task CUDA Optimization via Memory-Augmented In-Context Reinforcement Learning [3.5] 我々は、テストハーネス、検証コンポーネント、再現可能な評価を伴って、オープンソースのエージェントフレームワークとしてKernelBlasterをリリースした。
提案手法は, KernelBench Levels 1, 2, 3 の平均速度をそれぞれ 1.43x, 2.50x, 1.50x とする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:48:43 GMT)
AEG: A Baremetal Framework for AI Acceleration via Direct Hardware Access in Heterogeneous Accelerators [3.3] 本稿では、異種加速器上での高性能機械学習(ML)推論を可能にするために、ハードウェアに依存しない統一型ベアメタルランタイムアーキテクチャを提案する。
TinyMLのような既存のエッジデプロイフレームワークは、しばしば不要な複雑さとパフォーマンスボトルネックをもたらすリアルタイムオペレーティングシステム(RTOS)に依存している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:12:45 GMT)
Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection [3.3] 本稿では、効率的なオブジェクト検出に適した説明可能性に着想を得た、レイヤワイドプルーニングフレームワークを提案する。
ResNet-50, MobileNetV2, ShuffleNetV2, Faster R-CNN, RetinaNet, YOLOv8など,さまざまなオブジェクト検出アーキテクチャの実験を行った。
提案手法は,L1-ノルム法と比較して,異なる層を最も重要視している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:07:19 GMT)
Feature salience -- not task-informativeness -- drives machine learning model explanations [3.2] 情報化が実際に重要な帰属の主要因であるかどうかは不明である。
我々は2値画像分類タスクの3つの変種に基づいてディープラーニングモデルを訓練した。
重要属性はテスト時の画像構造のサリエンスによって最も強く引き起こされる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:08:02 GMT)
Online LLM watermark detection via e-processes [3.1] 電子プロセスに基づく透かし検出のための統一的なフレームワークを開発する。
本稿では,検出能力を向上する実証的適応型電子プロセスを構築するための様々な手法を提案する。
いくつかの実験により,提案手法は既存の透かし検出法と比較して競争性能が高いことが示された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:37:06 GMT)
Index Light, Reason Deep: Deferred Visual Ingestion for Visual-Dense Document Question Answering [3.0] 本稿では,マルチモーダル文書質問応答のための要求側取り込み戦略を提案する。
総括精度は、摂取VLMコストゼロで達成される。
また、インタラクティブな洗練とプログレッシブキャッシングをサポートし、「QA精度」問題を「ページローカライゼーション」問題に変換する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:23:50 GMT)
Predicting New Concept-Object Associations in Astronomy by Mining the Literature [2.9] 2025年7月までのフルアストロフコーパスから概念対象知識グラフを構築した。
我々は、OCR処理した論文から名前付き天体を抽出し、SIMBAD識別子に分解し、ソースコーパスに注釈付けされた科学概念にリンクする。
次に、過去のグラフ構造が印刷に現れる前に新しい概念オブジェクトを予測できるかどうかをテストする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:07:10 GMT)
Toward a Military Smart Cyber Situational Awareness (CSA) [2.7] サイバー状況認識(CSA)は、組織内の現在の状況や重要なインフラの理解を可能にする。
我々は5つのCSAプラットフォームをレビューし、各提案の相違点を求め、軍事的スマートなCSAプラットフォームを作成する際に適用可能な6つの提案基準を概説する。
我々はCSIRT-MUが開発したオープンソースのCSAプラットフォームであるCRUSOEで提案された基準を検証した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 12:33:04 GMT)
Dirac Spin Liquid Candidate in a Rydberg Quantum Simulator [2.7] 我々は,N = 14の双極子リドバーグ原子からなる量子シミュレータにおいて,フラストレーションされたスピン交換反強磁性体をカゴメアレイに配置する実験を行った。
空隙のないU(1)ディラックスピン基底状態の理論的提案により、我々は局所アドレッシングを用いて低エネルギー状態を作成する。
本研究は, 量子スピン液体候補の調製と微視的キャラクタリゼーションのためのプラットフォームとして, Rydberg atom arrays を確立した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:14:41 GMT)
Knowing When Not to Answer: Abstention-Aware Scientific Reasoning [2.7] 科学的条件下では、支持または不確実な結論は、棄権するよりも有害である。
本稿では,この問題に対して,留意点を考慮した検証フレームワークを用いて検討する。
我々はこのフレームワークをSciFactとPubMedQAの2つの科学的ベンチマークで評価した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:29:43 GMT)
AbracADDbra: Touch-Guided Object Addition by Decoupling Placement and Editing Subtasks [2.7] AbracADDbraはユーザフレンドリーなフレームワークで、直感的なタッチ先を利用して空間的に簡潔な指示を正確に配置する。
評価の結果,フレームワークの高忠実度編集能力が確認された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:11:20 GMT)
From SFT to RL: Demystifying the Post-Training Pipeline for LLM-based Vulnerability Detection [2.7] LLMに基づく脆弱性検出のための訓練後パイプラインに関する最初の包括的調査を行う。
本研究は,データキュレーション,ステージインタラクション,報酬メカニズム,評価プロトコルがモデルトレーニングと評価の有効性を総合的に規定するなど,実践的なガイドラインと洞察を明らかにする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 06:33:25 GMT)
GPT-5 vs Other LLMs in Long Short-Context Performance [2.6] 本稿では、4つの最先端モデル(Grok-4, GPT-4, Gemini 2.5, GPT-5)を長時間の短文タスクで性能評価する。
ソーシャルメディアデータセットの入力ボリュームが5Kポスト(70Kトークン)を超えると、すべてのモデルの性能は著しく低下する。
GPT-5モデルでは, 精度の急落にもかかわらず, 精度は95%程度であった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:26:25 GMT)
A Theoretical Framework for LLM Fine-tuning Using Early Stopping for Non-random Initialization [2.6] 中心的な疑問は、多くの異なるタスクにおいて強いパフォーマンスを達成するのに、なぜいくつかの微調整のエポックしか不十分なのかである。
我々は,厳密な早期停止理論と注目に基づくニューラルタンジェントカーネル(NTK)を併用して,大規模言語モデルを構築する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:43:21 GMT)
Early-stage memory effect on the dephasing charger-mediated quantum battery [2.6] 2量子ビットシステムでモデル化された充電器を介する量子電池の性能について検討する。
このような早期記憶効果は, 電池の最大容量を増大させる可能性がある。
大域的およびランダムな局所演算を持つ量子回路において, 量子電池の計測方法を提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:45:45 GMT)
A System of Care, Not Control: Co-Designing Online Safety and Wellbeing Solutions with Guardians ad Litem for Youth in Child Welfare [2.5] 我々は10ガーディアンズ・アドリテム(GAL)と共同で2つのワークショップを行い、オンライン安全性に関する彼らの視点を調査した。
GALは,デジタルリテラシーの制限により,オンラインの安全上の課題に対して若者を支援するのに苦慮していることが明らかとなった。
Gals氏は、継続的なコミュニケーション、治療支援、利害関係者間の調整を可能にするツールの開発に重点を置いている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 04:56:26 GMT)
FMMD: A multimodal open peer review dataset based on F1000Research [2.4] FMMDはF1000Researchから収集されたマルチモーダルで多分野のオープンピアレビューデータセットである。
原稿レベルの視覚的および構造的なデータと、バージョン固有のレビュアーレポートと編集決定を統合することで、現在のギャップを埋める。
ピアレビュー研究の発展のための総合的な実証資料を提供する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:36:05 GMT)
UniST-Pred: A Robust Unified Framework for Spatio-Temporal Traffic Forecasting in Transportation Networks Under Disruptions [2.3] 統合時間トラフィック予測フレームワークUniST-Predを提案する。
UniST-Predは空間的表現学習から時間的モデリングを分離し、適応的表現レベル融合を通じて両者を統合する。
結果から,UniST-Predは実世界のデータセットとシミュレーションデータセットの両方で高い予測性能を維持していることがわかった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:28:56 GMT)
Anticipating Adversary Behavior in DevSecOps Scenarios through Large Language Models [2.2] 本研究は,セキュリティカオスエンジニアリング(SCE)手法をLLMベースの新しいフローに統合し,攻撃防御木の作成を自動化することを提案する。
これにより、アタッカーの一歩先を進み、これまで考えられていなかった防御を実装できるようになる。
実験に関する詳細な情報は、それを複製する手順とともに、以下のリポジトリにある。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:43:04 GMT)
Algebraic Quantum Intelligence: A New Framework for Reproducible Machine Creativity [2.0] 大規模言語モデル (LLM) は、流動的で文脈的に適切なテキストを生成することに成功している。
本稿では,意味空間の体系的拡張を可能にする計算フレームワークとして代数量子インテリジェンス(AQI)を提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:02:57 GMT)
System-Level Error Propagation and Tail-Risk Amplification in Reference-Based Robotic Navigation [1.7] 本稿では, 設置による構造摂動が伝播し, 画素レベルの観測ノイズとどのように結合するかを特徴付ける, 統一的エラー伝搬モデリングフレームワークを提案する。
その結果, システムレベルの誤差増幅の第一の要因は回転インストレーションエラーであり, 等級の翻訳ミスアライメントが二次的な役割を担っていることがわかった。
これらの結果から,参照型多段階幾何認識パイプラインの構造的限界が明らかになり,安全クリティカルなロボットナビゲーションシステムにおけるシステムレベルの信頼性解析とリスク認識設計のためのフレームワークが提供される。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:13:56 GMT)
CORPGEN: Simulating Corporate Environments with Autonomous Digital Employees in Multi-Horizon Task Environments [1.6] 実際の組織的な作業には、インターリーブ、依存関係、優先順位付けを伴って、多くの並行した長期タスクを管理する必要があります。
マルチ水平タスク環境(MHTEs: Multi-Horizon Task Environments: MHTEs): 数十のインターリーブタスクでコヒーレントな実行を必要とする問題クラス。
負荷が25%から100%になるにつれて、ベースラインCUAが16.7%から8.7%に低下する4つの障害モードを特定します。
マルチ水平ゴールアライメントのための階層的計画を通じて,これらの障害に対処するアーキテクチャに依存しないフレームワークであるCorpGenを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:54:34 GMT)
Distillation and Interpretability of Ensemble Forecasts of ENSO Phase using Entropic Learning [1.4] 本稿では,Sparse Probabilistic Approximation (eSPA) モデルのアンサンブルのためのフレームワークを提案する。
正しい予測を行うこれらのアンサンブル構成員のみの構造を集約することにより、アンサンブルを「蒸留された」モデルのコンパクトな集合に圧縮する方法を示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 05:49:16 GMT)
Path Planning Optimisation for SParse, AwaRe and Cooperative Networked Aerial Robot Teams (SpArC-NARTs): Optimisation Tool and Ground Sensing Coverage Use Cases [1.4] ネットワーク化された空中ロボットチーム(NART)は、無線リンクで相互接続されたエージェントのグループから構成される。
間欠的(すなわちスパース)であっても、エージェント間のデータ交換を可能にし、協調行動をサポートする。
本稿では,スパース,アウェア,協調型ネットワーク型ロボットチームのための新しい経路計画ツールを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:40:45 GMT)
Differential pose optimization in descriptor space -- Combining Geometric and Photometric Methods for Motion Estimation [1.3] 2フレームの相対ポーズ最適化はコンピュータビジョンの基本的な問題である。
光度誤差と再投影誤差の2つの異なる種類のエラー値が使用される。
両パラダイムの強みを統一的なアプローチに組み合わせた第3の手法について検討する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:13:29 GMT)
FedEMA-Distill: Exponential Moving Average Guided Knowledge Distillation for Robust Federated Learning [1.1] フェデレーテッド・ラーニング(FL)は、クライアントが不均一な非独立性(non-Independent)およびIdentically Distributed(non-IID)データを保持すると、しばしば劣化する。
本稿では,グローバルモデルの指数移動平均(EMA)とクライアント負荷予測ロジットからのアンサンブル知識蒸留を組み合わせたサーバサイドプロシージャであるFedEMA-Distillを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 01:40:45 GMT)
Federated Ensemble Learning with Progressive Model Personalization [1.1] Federated Learningは分散学習のためのプライバシ保護パラダイムを提供するが、クライアント間の統計的異質性に悩まされている。
PFLの広く採用されているアプローチは、ニューラルネットワークを共有特徴抽出器とクライアント固有のヘッドに分解する。
既存のほとんどの手法は厳密で浅い頭部に依存しており、そのため原則的にこのトレードオフをナビゲートすることができない。
我々はこのトレードオフを円滑に制御できるブースティングインスパイアされたフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:35:52 GMT)
Trustworthy AI Posture (TAIP): A Framework for Continuous AI Assurance of Agentic Systems at Horizontal and Vertical scale [1.1] ポイント・イン・タイムの文書ベースの監査では、決定論的でない振る舞いには対応できない。
垂直的には、ガバナンスとコントロールの義務は、フレームワークが運用できるものよりも速く変化します。
リスクベースの規制は、現在進行中のコントロールの妥当性と効果を示す必要がある。
本稿では,信頼度を静的証明書ではなく,連続的に発生する信号として再設定する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:49:47 GMT)
Scalable Clifford-Based Classical Initialization for the Quantum Approximate Optimization Algorithm [1.1] 変分量子アルゴリズム(VQA)は、量子デバイス上で最適化問題に取り組むための有望な経路を提供する。
しかし、その性能は初期パラメータの選択に依存する。
本稿では,最先端のアンザッツに対して最大80%の精度向上を実現するフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:49:54 GMT)
Dual-Signal Adaptive KV-Cache Optimization for Long-Form Video Understanding in Vision-Language Models [1.1] VLM(Vision-Language Models)は、長めのビデオコンテンツの処理において重要なメモリボトルネックに直面している。
両信号適応型キャッシュを実装した新しい事前最適化フレームワークであるSali-Cacheを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:06:02 GMT)
Cross-household Transfer Learning Approach with LSTM-based Demand Forecasting [0.9] DELTAiFは,家庭の温水消費をスケーラブルかつ正確に予測するトランスファーラーニング(TL)ベースのフレームワークである。
DELTAiFは、シャワーなどの大規模な温水利用イベントを予測することにより、家庭レベルで適応的でスケーラブルな温水生産を可能にする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:35:14 GMT)
A Latency-Aware Framework for Visuomotor Policy Learning on Industrial Robots [0.9] 本稿では,産業用ロボットアームにビジュモータポリシを展開するための遅延対応フレームワークを提案する。
我々は、有限水平、ポリシー予測されたアクションシーケンスをスケジュールする遅延対応実行戦略を導入する。
その結果,遅延対応実行はスムーズな動作,適合した接触動作,一貫したタスク進行を維持できることがわかった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:53:57 GMT)
Pack it in: Packing into Partially Filled Containers Through Contact [0.8] 本稿では,予め配置されたオブジェクトとの汎用的なインタラクションを利用して,自由空間を創出する,接触認識型パッキング手法を提案する。
これは、予測モデルと統合された多目的軌道コントローラを使用することで実現される。
オブジェクトをコンテナ内に配置するための物理的に実現可能な場所を提案する方法が提示される。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:34:49 GMT)
Ethical and Explainable AI in Reusable MLOps Pipelines [0.8] 提案手法は, モデル修正を伴わずに, 人口パーティ差(DPD)を0.31から0.04に下げることでバイアスを低減する。
このフレームワークは、すべてのデプロイメントにまたがる運用制限内で、公正なメトリクスを維持している。
DPD = 0.05 と EO = 0.03 を一貫して達成し、KS の統計は 0.20 にとどまった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:29:40 GMT)
Bidirectional Quantum Processor Interfacing by a 4-Kelvin Analog Signal Chain for Superconducting Qubit Control and Quantum State Readout [0.6] 本稿では,超伝導量子ビット制御と量子状態読み出しのための包括的低温アナログ信号処理アーキテクチャを提案する。
提案システムでは,ミリケルビン段階の量子プロセッサを用いた完全双方向信号経路ブリッジルーム温度デジタルコントローラを実装した。
シミュレーションの結果,I/Q位相誤差が35dB以上の画像拒絶率,シンボル誤り率が10~6$以下であることが確認された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:29:06 GMT)
A Hybrid TGN-SEAL Model for Dynamic Graph Link Prediction [0.6] スパースで継続的な進化を続けるネットワークにおけるリンクの予測は、ネットワーク科学における中心的な課題である。
本研究では,候補リンクを囲む部分グラフを抽出することで,Temporal Graph Networksフレームワークを改善する。
スパースCDRデータセットの実験により、我々の手法は標準のTGNよりも平均精度を2.6%向上させることが示された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:16:47 GMT)
An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations [0.5] 構造的需要断続性、高い可変性、多段階計画の地平線によって特徴づけられるビジネス環境は、堅牢な再現可能なモデル選択機構を必要とする。
本研究では、水平線対応のランキング不安定性に対処するため、AHSIV(Adaptive Hybrid Selector for Intermittency and Variability)を提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:24:46 GMT)
A Multi-Agent Framework for Medical AI: Leveraging Fine-Tuned GPT, LLaMA, and DeepSeek R1 for Evidence-Based and Bias-Aware Clinical Query Processing [0.4] 大規模言語モデル(LLM)は、医療問題に対する回答を約束するが、臨床的使用は、弱い検証、不十分な証拠の根拠、信頼できない信頼のシグナルによって制限される。
本稿では,補完的なLCMとエビデンス検索,不確実性推定,バイアスチェックを組み合わせて回答信頼性を向上させるマルチエージェント医療QAフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:17:27 GMT)
A Comprehensive Survey on Deep Learning-Based LiDAR Super-Resolution for Autonomous Driving [0.4] 本稿では,自動運転におけるLiDAR超解像法に関する包括的調査を行う。
既存のアプローチは、CNNベースのアーキテクチャ、モデルベースのディープアンローリング、暗黙の表現方法、TransformerとMambaベースのアプローチの4つのカテゴリに分類される。
現在のトレンドには、効率的な処理のための範囲画像表現の導入、極端なモデル圧縮、解像度フレキシブルアーキテクチャの開発などがある。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:34:28 GMT)
RASCqL: Reaction-time-limited Architecture for Space-time-efficient Complex qLDPC Logic [0.4] RASCqLは、時空効率のqLDPC論理のための応答時間制限アーキテクチャである。
量子算術、テーブルルックアップ、マジックステート蒸留などのアルゴリズムのサブルーチンをqLDPCコードで直接サポートする。
RASCqLは、最先端のサーフェスコードアーキテクチャに匹敵する、時空のコストで重要なアルゴリズムのサブルーチンを実装している。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:52:25 GMT)
Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning [0.4] 本稿では,情報構造に基づく5段階の学習可能性階層を提案する。
機械学習の進歩の天井は、タスクが学習可能であるかどうかよりも、モデルのサイズに依存しない、と我々は主張する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 00:14:31 GMT)
In Transformer We Trust? A Perspective on Transformer Architecture Failure Modes [0.3] トランスフォーマーアーキテクチャは、自然言語処理から科学計算まで、幅広い領域で機械学習に革命をもたらした。
我々は,解釈可能性,説明可能性,敵攻撃に対する堅牢性,公正性,プライバシの総合的なレビューを通じて,それらの信頼性を評価する。
繰り返し発生する構造的脆弱性、ドメイン固有のリスク、そしてトランスフォーマーの信頼性デプロイメントを制限するオープンな研究課題を特定します。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 21:57:14 GMT)
Topology optimization of type-II superconductors with superconductor-dielectric/vacuum interfaces based on Ginzburg-Landau theory under Weyl gauge [0.3] トポロジー最適化は,II型超伝導体の逆設計に応用される。
型II超伝導体の磁気応答はギンズブルグ・ランダウ理論を用いてモデル化される。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:17:24 GMT)
High-fidelity Quantum Readout Processing via an Embedded SNAIL Amplifier [0.2] 非線形超伝導非対称誘導型eLementをリードアウトチェーンに埋め込む新しい手法を提案する。
この組み込みSNAILプラットフォームは、周波数多重共振器が結合を介して相互作用し、調整可能な読み出し増幅器出力アーキテクチャを形成する。
その結果、次世代プロセッサにおけるスケーラブルでコヒーレントな量子状態読み込みのための有望なビルディングブロックとして、ハイブリッドSNAILが確立された。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:04:07 GMT)
Machine Learning as a Tool (MLAT): A Framework for Integrating Statistical ML Models as Callable Tools within LLM Agent Workflows [0.2] 機械学習・アズ・ア・ツール(MLAT: Machine Learning as a Tool)は、学習前の統計的機械学習モデルを大言語モデル(LLM)エージェント内で呼び出し可能なツールとして公開するデザインパターンである。
ML推論を静的な前処理ステップとして扱う従来のパイプラインとは異なり、MLATでは、モデルをWeb検索、データベースクエリ、APIとともにファーストクラスのツールとして位置付けている。
我々は、発見通話記録をML予測価格でプロの提案に変換するパイロット生産システムであるPitchCraftを紹介する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 20:00:28 GMT)
Geometry-Aware Physics-Informed PointNets for Modeling Flows Across Porous Structures [0.1] 本研究では,多孔体内および周囲に発生する流れの予測問題に対処する。
物理インフォームド・ポイントネット(PIPN)と物理インフォームド・ジオメトリ・アウェア・ニューラル・オペレータ(P-IGANO)の2つのアプローチを用いる。
その結果、目視と目視の両方のケースにおいて、速度と圧力の誤差が一貫して低く、ウェイク構造を正確に再現できることがわかった。
全体として,本研究はPIPN/PI-GANOを多孔質流の同時流路として初めて体系的に評価し,幾何単位の再学習を伴わずに設計研究を加速させる可能性を示した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:52:23 GMT)
Detection of On-Ground Chestnuts Using Artificial Intelligence Toward Automated Picking [0.1] 伝統的な機械化された栗の収穫は、小さな生産者にとっては高価すぎる。
オーチャードフロアにおけるクリの正確な検出は、低コストで視覚誘導型自動収穫技術の開発に不可欠である。
本研究は,6524個の注釈付き栗を含む果樹園床の栗の319枚の画像を収集した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:28:23 GMT)
When Benchmarks Lie: Evaluating Malicious Prompt Classifiers Under True Distribution Shift [0.0] 有害なリクエスト、ジェイルブレイク、間接的なプロンプトインジェクション、抽出攻撃にまたがる18のデータセットのベンチマークを用いて、包括的な分析を行う。
我々は,真のアウト・オブ・ディストリビューションの一般化を評価するために,LODO(Leave-One-Dataset-Out)評価を提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:21:43 GMT)
We can still parse using syntactic rules [0.0] 本研究では,文脈自由文法 (CFG) と一般化句構造文法 (GPSG) に基づく構文解析手法を提案する。
このアプローチは、新しい構文解析アルゴリズムと、CFGの制限を克服する一連の構文規則と特徴からなる。
また、ノイズと不完全なパースを調節しながら、依存関係と選挙区のパースツリーの両方を生成する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:16:32 GMT)
There Are No Silly Questions: Evaluation of Offline LLM Capabilities from a Turkish Perspective [0.0] 本研究の目的は、トルコの伝統言語教育の文脈において、ローカルに展開可能なオフラインLLMの堅牢性と教育的安全性を評価することである。
270Mから32Bパラメータの14種類のモデルで実施された実験により、異常抵抗はモデルスケールにのみ依存していないことが判明した。
その結果,8B-14Bパラメータ範囲の推論指向モデルは,言語学習者にとって,コストセーフティトレードオフの観点から最もバランスのとれたセグメントであることがわかった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:49:45 GMT)
The Sufficiency-Conciseness Trade-off in LLM Self-Explanation from an Information Bottleneck Perspective [0.0] 本稿では, 正解を正当化する説明能力として定義された十分性と, 説明長の短縮として定義された簡潔さのトレードオフについて検討する。
この視点を運用するために、説明の長さを制約し、複数の言語モデルを用いて十分性を評価する評価パイプラインを導入する。
実験の結果, より簡潔な説明が十分であり, 精度を保ちながら, 説明長を大幅に短縮する一方, 過度な圧縮は性能劣化を引き起こすことがわかった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 05:57:39 GMT)
The Baby Steps of the European Union Vulnerability Database: An Empirical Inquiry [0.0] 本稿では,新たなEUVDのメタデータ内容について検討する。
EUVDにアーカイブされた積極的に悪用された脆弱性は、かなり深刻である。
欧州の公務員が調整した脆弱性も超えている。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 21:18:17 GMT)
Temporal Shifts and Causal Interactions of Emotions in Social and Mass Media: A Case Study of the "Reiwa Rice Riot" in Japan [0.0] 日本では、2024年の深刻な米不足が、ニュースメディアと社会プラットフォームの両方で広く議論を巻き起こした。
本研究では,X およびニュース記事における感情の時間的ダイナミクスと因果的相互作用を解析するための枠組みを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 10:43:40 GMT)
Semiclassical Simulation of Homogeneous Emitter Ensembles with Local Dissipation [0.0] エミッタアンサンブルは量子光学技術の基本的な構成要素である。
局所散逸を受ける置換不変エミッタアンサンブルに対して, TWA (Truncated Wigner approximation) を定式化する。
我々は、TWA内の数百の相互作用するアンサンブルを大規模にシミュレーションし、空間的コヒーレンスと協調的エミッションの選択的指向性を明らかにする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 07:12:03 GMT)
Reverse N-Wise Output-Oriented Testing for AI/ML and Quantum Computing Systems [0.0] 本稿では,配列をドメイン固有の出力等価クラス上で直接カバーする,数学的に原理化されたパラダイムである逆n-wise出力テストを紹介する。
明示的な顧客中心の予測/測定カバレッジ保証、MLキャリブレーション/バウンダリ障害の障害検出率の大幅な改善、量子エラー症候群などだ。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:57:11 GMT)
Remarks on non-invertible symmetries on a tensor product Hilbert space in 1+1 dimensions [0.0] 格子上の有限次元上のヒルベルト空間のテンソル積上の非可逆対称性作用素の指数を提案する。
我々の指数は、量子セルオートマトンで表される可逆対称性作用素のグロス・ネズメ・ボグツ・ヴェルナー指数を一般化する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:38:24 GMT)
Reasoning Language Models for complex assessments tasks: Evaluating parental cooperation from child protection case reports [0.0] 推論言語モデル(RLM)は複雑な推論タスクを解く上で大きな進歩を見せている。
症例報告を用いてCPS介入時の親の協力度を評価する可能性について検討した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:14:19 GMT)
Quantum field theory measurements for relativistic particles [0.0] 非相対論的測定モデルは、局所性、因果性、ローレンツ共分散の本質的な相対論的原理を組み込むことができない。
我々は、電磁場、ディラック場および内部構造スカラー場を記述するために、相対論的測定に量子時間確率(QTP)フレームワークを用いる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:02:23 GMT)
Quantum entanglement enhanced via dark mode control in molecular optomechanics [0.0] 暗モードの破れによる量子二分法と三分法との絡み合いを高める手法を提案する。
ダークモード・アンブローケン政権では, 生成した二部岩と三部岩の絡み合いが著しく低く, 抑制されていることがわかった。
対照的に、ダークモード・ブレイク状態においては、エンタングルメントは、最大2倍のエンタングルメント(エンタングルメント)が大幅に強化される。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 21:17:15 GMT)
Probing atom-surface interactions from tunneling-time measurements via rotation-transport on an atom chip [0.0] 我々は中性原子の超低温ガスと表面との相互作用を測定する新しい方法を提案する。
雲の寿命を計測することで、カシミール・ポルダー(CP)力係数を抽出できることを示す。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 23:32:05 GMT)
Phase sensitive topological classification of single-qubit measurements in linear cluster states [0.0] 一次元の線形クラスタ状態における単一キュービット射影測定の明示的な幾何学的分類を提供する。
局所的計測とトポロジカルな手術操作の間に明確な幾何学的対応を確立することにより,クラスタ状態を線形ホップ連鎖として表現する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 04:59:48 GMT)
PIPE-RDF: An LLM-Assisted Pipeline for Enterprise RDF Benchmarking [0.0] PIPE-RDFは、スキーマ固有のNL-SPARQLベンチマークを構築する3フェーズパイプラインである。
9つのカテゴリで450の質問-SPARQLペアのバランスの取れたベンチマークを生成します。
パイプラインは修復後の解析と実行の妥当性を100%達成し、更新前の妥当性率は96.5%-100%である。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 12:03:43 GMT)
Operational Noncommutativity in Sequential Metacognitive Judgments [0.0] メタ認知評価は、確率的読み出しを伴う内部状態空間に作用する状態変化操作としてモデル化されていることを示す。
また, 逐次的信頼, 誤り様相, 知覚的判断による知識的判断を含む行動パラダイムについても概説する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:15:48 GMT)
Non-Hermitian Quantum Mechanics of Open Quantum Systems: Revisiting The One-Body Problem [0.0] 我々は、無限環境を持つオープン量子系において、非ハーモニティが生じることを示し、一体問題に焦点をあてる。
共鳴固有状態は、ハミルトニアンがエルミート的に見えるにもかかわらず、複素エネルギー固有値を持つことを示す。
我々は,過去と未来を連続的に結び付ける力学の時間-逆対称性を強調する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 11:42:18 GMT)
Named Entity Recognition for Payment Data Using NLP [0.0] Named Entity Recognition (NER) は、金融トランザクション処理を自動化する重要なコンポーネントとして登場した。
本稿では,支払いデータ抽出に特化して設計された最先端NERアルゴリズムの包括的解析を行う。
我々は、複数の支払いフォーマットにまたがる5万のアノテート支払いトランザクションのデータセットで実験を行う。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 06:28:57 GMT)
Mathematical Paradoxes of Dirac Equation Representations [0.0] 本稿では、ディラック方程式のFoldy-WouthuysenとFeynman-Gell-Mann表現について検討する。
この分析は電磁場と相互作用する電子や陽電子に対して行われる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 14:02:02 GMT)
MILD: Multi-Intent Learning and Disambiguation for Proactive Failure Prediction in Intent-based Networking [0.0] マルチインテントインテントベースのネットワークでは、複数のインテントがシンプレクティックな劣化を示すコドリフトを単一障害が引き起こすことがある。
反応ドリフト検出から固定水平故障予測への意図保証を再構築するプロアクティブフレームワークであるMILDを提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:15:33 GMT)
Learning Significant Persistent Homology Features for 3D Shape Understanding [0.0] トポロジに富んだModelNet40とShapeNetを導入し、各点のクラウドは対応する永続的ホモロジー機能で拡張される。
これらのトポロジカルシグネチャによるベンチマークは、統合幾何トポロジ学習の基礎を確立する。
深層学習に基づく重要なパーシステンスポイント選択手法であるtextitTopoGAT を提案する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 16:50:53 GMT)
Interaction-Enabled Two- and Three-Fold Exceptional Points [0.0] 相互作用可能な$n$-fold例外点[EP$n$s$n=2,3$]と呼ばれる新しい例外点を提案する。
ボゾン系とフェルミオン系は、電荷 U(2)、擬スピンパリティ、および$PT$対称性によって保護されるパラメータ空間においてそのような相互作用可能なEP$n$sをホストする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 08:56:36 GMT)
Geometric phase of arbitrary Mueller evolutions and its two-level quantum analogue [0.0] 任意の物理的実現可能なミュラー変換に対して、インターフェロメトリ(パンチャラトナム)幾何位相はSO(3)回転によって一意に固定されることを示す。
また、クビットチャネルのChoi表現における開2レベルダイナミクスの量子アナログも確立する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:36:42 GMT)
Fully integrated quantum frequency processor on a silicon chip [0.0] 我々は、シリコンフォトニックチップをモノリシックに統合した、最初の完全統合量子周波数プロセッサを報告した。
我々は、チップ上で高次元周波数ビン絡み合った状態を生成し、コヒーレントに操作する。
我々の研究は、古典的および量子的両方の大規模周波数領域フォトニックプロセッサへの重要な一歩である。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:26:56 GMT)
Full State-Space Visualisation of the 8-Puzzle: Feasibility, Design, and Educational Use [0.0] 本稿では,8個のノズル(181,440状態)の全到達可能な状態空間を可視化する可能性を示す対話型学習システムを提案する。
このシステムは、グローバルな構造をリアルタイムに探索し、探索アルゴリズムの実行をステップバイステップで行い、異なる戦略がどのように同じ空間を横切るかを直接比較することを可能にする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:06:56 GMT)
From Scarcity to Scale: A Release-Level Analysis of the Pashto Common Voice Dataset [0.0] 6000万人以上の人々が話していたPashtoは、これまで、大規模なオープンライセンスの音声データを欠いていた。
本稿では,Mozilla Common Voice corpus の Pashto コンポーネントのリリースレベル解析について述べる。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 09:22:48 GMT)
Fast Compute for ML Optimization [0.0] 分散平均スケール-混合表現を含む損失に対する最適化について検討する。
その結果、SM-EM(Scale Mixture EM)アルゴリズムは、ユーザが指定した学習率と運動量スケジュールを除去する。
基底(非加速)アルゴリズムでは、EM単調性は非増加目標値を保証する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:09:58 GMT)
Exploiting Structure-from-Motion for Robust Vision-Based Map Matching for Aircraft Surface Movement [0.0] 自律航空機の地上航行を支援するために,視覚支援ナビゲーション(VAN)パイプラインを導入する。
提案アルゴリズムは,間接手法の計算効率と直接画像ベース手法の頑健さを組み合わせ,解の整合性を高める。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 21:08:48 GMT)
Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations [0.0] 私たちは、14の感情的な会話シナリオに対して、3つのOpenAIモデル世代を評価しました。
危機検出はGPT-4oからGPT-5-miniへと単調に改善された。
ユーザが"失われた共感"と認識したのは、危機を見逃した慎重なモデルから、時として多くのことを言う警告モデルに移行したことです。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:36:21 GMT)
Detecting LLM Hallucinations via Embedding Cluster Geometry: A Three-Type Taxonomy with Measurable Signatures [0.0] トークン埋め込みクラスタ構造における観測可能なシグネチャに基づく大規模言語モデル幻覚の幾何学的分類法を提案する。
そこで本研究では,弱い環境下での1型(中心ドリフト)と,局所的コヒーレントだが文脈的に不正確なクラスタ領域への2型(ロングウェルコンバージェンス)と,クラスター構造が存在しない3型(カバーギャップ)の3つの機能的に異なる幻覚型を同定した。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 18:14:10 GMT)
Conformal Signal Temporal Logic for Robust Reinforcement Learning Control: A Case Study [0.0] 本研究では,航空宇宙分野における強化学習制御の安全性と堅牢性を高めるための公式な時間論理仕様について検討する。
実験により, 共形シールドは, ほぼベースライン性能を維持しながら, STLの満足度を保っていることがわかった。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 22:10:11 GMT)
Computable Bernstein Certificates for Cross-Fitted Clipped Covariance Estimation [0.0] 計算可能なベルンシュタイン型偏差証明を備えたクロスフィットクリッピング共分散推定器を提案する。
結果として得られる手順は、緩やかな尾の規則性の下での有効ランクのような本質的な複雑性尺度に適応する。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 06:53:40 GMT)
Benchmarking AI Performance on End-to-End Data Science Projects [0.0] 我々は40のエンドツーエンドデータサイエンスプロジェクトのベンチマークを作成し、関連する粗末な評価を行った。
これらを使用して、生成AIモデルによって生成されたデータサイエンスプロジェクトを体系的に評価する、自動グレーティングパイプラインを構築します。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 19:16:04 GMT)
Approximating the $S$ matrix for solving the Marchenko equation: the case of channels with different thresholds [0.0] この研究は、マルネンコ理論の枠組みにおける逆散乱問題に関する以前の結果を拡張した。
私は、一流の運動量$q$の関数として$n$チャネル$S$-行列を有理項の和と各行列要素に対する切り詰めされた sinc 級数の和で近似する。
散乱チャネルのサブセットしか開かないエネルギーに対しては、$S$-行列の解析構造が解析される。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 13:56:40 GMT)
A generalization of Frenkel's formula [0.0] 作用素から作用素へのトレースに対するフレンケルの積分公式を一般化する。
結果として得られる公式は、有界自己随伴正作用素とコンパクト正作用素の$p$-Schatten類に対して成り立つ。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 17:28:55 GMT)
A Real-Time Approach to Autonomous CAN Bus Reverse Engineering [0.0] 本稿では、車両のCANバスを車両やそのCANシステムの事前知識なくリバースエンジニアリングするリアルタイム手法を提案する。
重要な車両イベントにおける慣性測定とCANデータを比較することにより,アクセルペダル,ブレーキペダル,ステアリングホイールに関連するCANチャネルを正確に同定した。
これは、ほぼリアルタイムで自律的なCANリバースエンジニアリングのためのスケーラブルで適応可能なソリューションである。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 04:46:43 GMT)
"The Intangible Victory", Interactive Audiovisual Installation [0.0] 無形の勝利」は、サモトラキアの無形の勝利の形でのオーディオヴィジュアルなインストレーションである。
彫刻形態は、円筒状の配置で空間内の繊維から再構成される。
形状は着色糸(導電性センサー)で表現され、訪問者が作品と対話することを可能にする。
論文参考訳(メタデータ) (Sun, 15 Feb 2026 15:53:34 GMT)