Benchmarking Few-shot Transferability of Pre-trained Models with Improved Evaluation Protocols [123.7] より強力な事前訓練モデルと改良された適応アルゴリズムによって、わずかなショット転送が革新されている。
FEWTRANSは10種類のデータセットを含む総合的なベンチマークである。
FEWTRANS をリリースすることにより,数発の転写学習研究において再現性の向上を合理化するための厳密な "ルーラー" の提供を目指す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:41:57 GMT)
OmniGAIA: Towards Native Omni-Modal AI Agents [103.8] 我々は、深い推論とマルチターンツールの実行を必要とするタスクにおいて、オムニモーダルエージェントを評価するために設計されたベンチマークを導入する。
我々は,Omni-modal foundation agentであるOmniAtlasを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:27:12 GMT)
RLAR: An Agentic Reward System for Multi-task Reinforcement Learning on Large Language Models [86.6] RLAR(Reinforcement Learning from Agent Rewards)はエージェント駆動のフレームワークで、個別のクエリに動的に調整された報酬関数を割り当てる。
RLARは, 数学, コーディング, 翻訳, 対話タスクにおける10から60までの連続的な性能向上を示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 16:14:43 GMT)
TokenCom: Vision-Language Model for Multimodal and Multitask Token Communications [83.3] TaiChiはトークン通信用に設計された新しいVLMフレームワークである。
バイラテラル・アテンション・ネットワーク(BAN)は、マルチスケールの視覚トークンをインテリジェントに融合するために導入された。
学習可能なアクティベーション関数を持つコルモゴロフ・アーノルドネットワーク(KAN)ベースのモジュラリティプロジェクタを用いて正確な非線形アライメントを実現する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:52:35 GMT)
RAVEL: Reasoning Agents for Validating and Evaluating LLM Text Synthesis [78.3] テスト担当者が自律的に設計し、典型的な合成操作を実行できるようにするためのエージェントフレームワークであるRAVELを紹介する。
C3EBenchは、プロの人間の文章から1,258個のサンプルを抽出したベンチマークである。
SOTA LLMを演算子としてRAVELを増強することにより、そのようなエージェントテキスト合成はLLMの推論能力に支配されていることがわかった。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:47:34 GMT)
K^2-Agent: Co-Evolving Know-What and Know-How for Hierarchical Mobile Device Control [73.5] K2-Agentは、計画と実行のための宣言的(何)および手続き的(どのように)知識を知り、共進化させることによって、人間のような認知をモデル化する階層的なフレームワークである。
挑戦的なAndroidWorldベンチマークでは、K2-Agentは生とオープンソースのバックボーンのみを使用して76.1%の成功率を達成した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:33:14 GMT)
LifeEval: A Multimodal Benchmark for Assistive AI in Egocentric Daily Life Tasks [71.1] LifeEvalは、リアルタイムでタスク指向の人間とAIのコラボレーションを評価するために設計されたマルチモーダルベンチマークである。
LifeEvalは、タスク指向の全体的評価、連続したファーストパーソンストリームからのエゴセントリックなリアルタイム認識、自然な対話による人間と人間の協力的な相互作用の3つの重要な側面を強調している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:05:31 GMT)
MO-MIX: Multi-Objective Multi-Agent Cooperative Decision-Making With Deep Reinforcement Learning [68.9] 深部強化学習(RL)は複雑な意思決定問題を解決するために広く応用されている。
既存のアプローチは、別々のフィールドに限られており、単一の目的でマルチエージェントの意思決定しか処理できない。
マルチオブジェクト型マルチエージェント強化学習(MOMARL)問題の解法としてMO-mixを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 16:25:22 GMT)
SkillCraft: Can LLM Agents Learn to Use Tools Skillfully? [67.7] SkillCraftは、高レベルのツールコンポジションの生成と再利用を可能にする、明示的にストレステストエージェントのベンチマークである。
SkillCraftは、定量次元と構造次元の両方に沿ってスケールする困難を伴う、現実的で、構成性の高いツール使用シナリオを特徴としている。
本稿では,エージェントがアトミックツールを実行可能なスキルに自動生成し,タスク内およびタスク間のキャッシュと再利用を可能にする軽量な評価プロトコルを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:44:31 GMT)
M$^2$: Dual-Memory Augmentation for Long-Horizon Web Agents via Trajectory Summarization and Insight Retrieval [64.1] M$2$は、文脈効率と意思決定を最適化するために設計されたトレーニング不要のメモリ拡張フレームワークである。
本手法では,対話履歴を簡潔な状態更新に圧縮する動的トラジェクトリ要約(Internal Memory)と,オフラインのインサイトバンクから取得した実行可能なガイドラインでエージェントを誘導するInsight Retrieval Augmentation(External Memory)を併用する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:59:51 GMT)
Geometry OR Tracker: Universal Geometric Operating Room Tracking [61.4] 手術室(OR)では、世界規模のマルチビュー3Dトラッキングは、外科医の行動認識のような下流のアプリケーションをサポートする。
カメラのキャリブレーションとRGB-Dの登録は常に信頼性が低く、幾何学的不整合が生じる。
我々は、不正確なキャリブレーションをスケール一貫性と幾何学的に整合したカメラ設定に修正する2段階パイプラインであるGeometry OR Trackerを紹介する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:21:21 GMT)
MuonRec: Shifting the Optimizer Paradigm Beyond Adam in Scalable Generative Recommendation [60.2] MuonRecは、提案されたMuonイテレーションをRecSysトレーニングに導入する最初のフレームワークである。
我々は、レコメンデーションモデルのためのオープンソースのトレーニングレシピを開発し、従来のシーケンシャルなレコメンデーションモデルと近代的なジェネレーティブなレコメンデーションモデルの両方で評価する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:32:44 GMT)
Weight Updates as Activation Shifts: A Principled Framework for Steering [54.7] アクティベーションステアリングは極めてパラメータ効率のよい適応形態となるが、その有効性は重要な設計選択に依存する。
我々は,活性化空間介入と重量空間更新の1次等価性を確立し,活性化ステアリングが微調整動作を再現できる条件を導出する。
この等価性は、設計をステアリングするための原則的な枠組みをもたらし、ポストブロック出力を理論的に支持され、非常に表現力のある介入サイトとして特定する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:50:04 GMT)
DiffTrans: Differentiable Geometry-Materials Decomposition for Reconstructing Transparent Objects [53.8] 多視点画像から透明な物体を再構成することは、光伝搬の複雑な性質と不確定な振る舞いのために難しい課題である。
本稿では,透明物体の形状や材料を効率よく分解・再構成できる,DiffTransと呼ばれる透明物体の識別可能なレンダリングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:21:31 GMT)
MemPO: Self-Memory Policy Optimization for Long-Horizon Agents [52.0] 既存のメソッドは通常、外部メモリモジュールを導入し、格納されたメモリから関連する情報を検索する。
本稿では,自己記憶ポリシー最適化アルゴリズム(MemPO)を提案する。
MemPOはF1の絶対スコアが25.98%、SOTAベースラインが7.1%、トークン使用率が67.58%、73.12%である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:43:02 GMT)
Learning to Explore: Policy-Guided Outlier Synthesis for Graph Out-of-Distribution Detection [51.9] 教師なしグラフレベルのOOD検出では、モデルは通常、IDデータのみを使用して訓練される。
本稿では,スタティックスを学習した探索戦略に置き換える政策誘導型アウトリア合成フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:40:18 GMT)
Cloud-OpsBench: A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems [51.3] Cloud-OpsBenchは、State Snapshot Paradigmを使用して、クラウドの決定論的デジタルツインを構築する大規模なベンチマークである。
フルスタックにまたがる40の根本原因タイプに452の障害ケースがある。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:04:42 GMT)
Polynomial Mixing for Efficient Self-supervised Speech Encoders [50.6] Polynomial Mixer (PoM) はマルチヘッド自己注意の代替品である。
PoMは下流音声認識タスクでその性能を達成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:45:55 GMT)
ProtegoFed: Backdoor-Free Federated Instruction Tuning with Interspersed Poisoned Data [50.1] Federated Instruction Tuning (FIT)は、複数の組織(組織)にまたがる大規模な言語モデルの、プライベートなインストラクションの共有を必要とせずに、クロスサイロ環境での協調的なインストラクションチューニングを可能にする。
最近の研究では、有毒なサンプルが現実世界のデータセットに広範に埋め込まれており、たとえクライアントが良心的であっても、すべてのクライアントに分散している可能性が示唆されている。
ProtegoFedは、トレーニング中にクライアント間で汚染されたデータを正確に検出・浄化・分散する最初のバックドアフリーFITフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:25:32 GMT)
MLLM-4D: Towards Visual-based Spatial-Temporal Intelligence [50.1] 人間は視覚に基づく4D空間時間知能で生まれる。
その重要性にもかかわらず、この機能は現在の大規模言語モデル(MLLM)にとって重要なボトルネックであり続けている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:23:36 GMT)
CoMoL: Efficient Mixture of LoRA Experts via Dynamic Core Space Merging [49.9] Core Space Mixture of LoRA (bfCoMoL)は、専門家の多様性、パラメータ効率、きめ細かい適応を取り入れた新しいMoE-LoRAフレームワークである。
CoMoLは、複数のタスクで既存のメソッドを一貫して上回る。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:40:11 GMT)
NERFIFY: A Multi-Agent Framework for Turning NeRF Papers into Code [49.6] 我々はNeRF研究論文をトレーニング可能なNerfstudioプラグインに確実に変換するフレームワークであるNERFIFYを紹介する。
コード、データ、実装が公開される。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 20:57:32 GMT)
When Scaling Fails: Mitigating Audio Perception Decay of LALMs via Multi-Step Perception-Aware Reasoning [49.3] 構造化推論軌道のポストトレーニングモデルは、直接応答のポストトレーニングと比較して、限界あるいは負の利得をもたらす。
MPAR$2$は、動的知覚的推論を奨励し、複雑な質問を知覚に富んだサブプロブレムに分解するパラダイムである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:54:51 GMT)
Taxonomy-Aware Representation Alignment for Hierarchical Visual Recognition with Large Multimodal Models [47.9] 高パフォーマンスで汎用的な視覚理解モデルは、ラベルの分類木に視覚入力をマッピングすべきである。
我々は,分類学的知識をLMMに注入する簡易かつ効果的な方法として,分類学的認識表現アライメント(TARA)を提案する。
TARAはLMMの階層的一貫性と葉ノードの精度を一貫して強化し、既知のカテゴリと新しいカテゴリの両方を確実に認識する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:13:15 GMT)
Whisper-MLA: Reducing GPU Memory Consumption of ASR Models based on MHA2MLA Conversion [47.3] 本稿では,WhisperモデルにMLA(Multi-Head Latent Attention)を組み込んだ新しいアーキテクチャであるWhisper-MLAを紹介する。
我々は,Whisper-MLAにより,競合精度を維持しつつ,KVキャッシュサイズを最大87.5%削減できることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:24:01 GMT)
Draft-Thinking: Learning Efficient Reasoning in Long Chain-of-Thought LLMs [46.3] 我々は,まずモデルに,重要な推論ステップのみを保持する簡潔なテキストドラフト型推論構造を学習するよう誘導するtextbfDraft-Thinkingを提案する。
実験により、ドラフトシンキングは推論性能を保ちながら推論予算を大幅に削減することが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:57:52 GMT)
SSKG Hub: An Expert-Guided Platform for LLM-Empowered Sustainability Standards Knowledge Graphs [45.8] 本稿では,サステナビリティ標準を監査可能な知識グラフに変換するプロトタイプとインタラクティブなWebプラットフォームであるSSKG Hubを紹介する。
このシステムは、自動化された標準識別、チャンキング、標準固有のプロンプト、堅牢な3重解析、および証明可能なNeo4jストレージを統合している。
ロールベースのガバナンスフレームワークは、リードオンリーのゲストアクセス、エキスパートレビュー、メタエキスパート認定、管理監督をカバーしている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:24:55 GMT)
TokenSplat: Token-aligned 3D Gaussian Splatting for Feed-forward Pose-free Reconstruction [45.4] TokenSplatは3次元ガウス復元とカメラポーズ推定のためのフィードフォワードフレームワークである。
TokenSplatのコアとなるのは、Token-aligned Gaussian Predictionモジュールだ。
長期のクロスビュー推論を可能にするために、マルチスケールのコンテキスト特徴を集約する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:13:13 GMT)
Multi-Domain Riemannian Graph Gluing for Building Graph Foundation Models [43.6] マルチドメイングラフ事前学習は、様々なドメインからの知識を統合し、ターゲットドメインのパフォーマンスを向上させる。
既存のソリューションは、ドメイン間の知識の統合や伝達の方法という、基本的な質問に答えるには足りません。
本稿では,EMAプロトタイピングによるバッチ事前学習をサポートするGraphGlueフレームワークについて述べる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:22:19 GMT)
Wavelet-based Frame Selection by Detecting Semantic Boundary for Long Video Understanding [43.6] 現在のメソッドは、通常、与えられたクエリに高い関連性を持つフレームを選択する。
トレーニング不要なフレームワークであるセマンティック境界(WFS-SB)の検出によるウェーブレットベースのフレーム選択を提案する。
WFS-SBはLVLMの性能を大幅に向上させ、ビデオMMEでは5.5%、MLVUでは9.5%、LongVideoBenchでは6.2%の精度向上を実現した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:18:07 GMT)
Random Wins All: Rethinking Grouping Strategies for Vision Tokens [42.6] 代表的なアプローチは、トークンのグループ化、各グループ内で自己注意計算の実行、あるいは各グループ内のトークンを単一のトークンにプールすることである。
本稿では,視覚トークンに対する単純かつ高速なランダムなグループ化戦略を含むランダムなグループ化戦略を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:59:25 GMT)
TGM-VLA: Task-Guided Mixup for Sampling-Efficient and Robust Robotic Manipulation [42.5] 本稿では,モデル性能とトレーニング効率の両方を大幅に改善する,新しい包括的枠組みを提案する。
まず,サンプリング戦略の再設計と最適化を行い,メモリ消費を80%削減し,トレーニング速度を5倍に向上させた。
第二に,暗黒物体のあいまいさを解消する単純で効果的なモジュールであるカラー反転投影分岐を用いてモデルを強化する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:16:20 GMT)
Exploring 3D Dataset Pruning [42.3] 本研究では,3次元データに対するデータセットのプルーニングについて検討する。
重み付けされたサブセットで全データ予測リスクを近似すると、表現力の不足によるカバレッジエラーと、サブセットによるクラス重みとターゲットメトリクスの不整合による事前ミスマッチバイアスの2つの重要なエラーが明らかになる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:42:11 GMT)
General Proximal Flow Networks [42.0] 本稿ではGPFN(General Proximal Flow Networks)を紹介する。
GPFNは、ワッサーシュタイン距離のような任意の発散関数や距離関数に置き換える。
実験的な評価により、基礎となるデータ幾何への偏差が生成品質の計測可能な改善をもたらすことが確認された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:52:44 GMT)
Linking Modality Isolation in Heterogeneous Collaborative Perception [41.7] そこで我々は, 横断的特徴コード機能変換(FCF)によってモダリティを円滑に整列させるフレームワークであるCodeAlignを提案する。
CodeAlignはFCF翻訳を学び、特徴を他のモダリティの対応するコードにマッピングし、対象のコード空間の機能に復号する。
3つのモードを統合する場合、CodeAlignは事前アライメント手法のトレーニングパラメータの8%しか必要とせず、通信負荷を1024倍に減らし、OPV2VとDAIRV2Xの両方のデータセットにおける最先端の知覚性能を実現する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:09:08 GMT)
I-Perceive: A Foundation Model for Active Perception with Language Instructions [41.7] I-Perceiveは,自然言語命令に基づく能動的知覚の基礎モデルである。
I-Perceiveは、画像ベースのシーンコンテキストに基づいて、オープンな言語命令に従うカメラビューを予測する。
実験により、I-Perceiveは、生成したカメラビューの予測精度とインストラクションの両方において、最先端のVLMを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:38:56 GMT)
Cross-Scale Pansharpening via ScaleFormer and the PanScale Benchmark [39.8] パンシャルペニングは、低分解能MSデータのスペクトル富度とパンクロマティック画像の空間的詳細を融合することにより、高分解能マルチスペクトル画像を生成することを目的としている。
既存の手法は制限された低解像度設定で評価され、その一般化を現実の高解像度シナリオに限定する。
さまざまな解像度とスケールの一般化を評価するベンチマークであるPanScale-Benchを伴って,最初の大規模でクロススケールなパンシャーピングデータセットであるPanScaleを紹介した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:44:34 GMT)
InfoPO: Information-Driven Policy Optimization for User-Centric Agents [39.4] アクティブな不確実性低減のプロセスとしてマルチターンインタラクションをフレーム化するInfoPOを紹介する。
情報ゲイン報酬を計算し、そのフィードバックがエージェントのその後の行動分布を変化させるクレジットを回す。
そして、この信号とタスク結果とを適応分散ゲート融合により結合する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:58:14 GMT)
UniHM: Unified Dexterous Hand Manipulation with Vision Language Model [39.2] 身体的に実現可能な器用な手操作を計画することは、ロボット操作と身体的AIにおける中心的な課題である。
自由形式の言語コマンドで案内される手操作を統一する最初のフレームワークであるUniHMを紹介する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 16:37:11 GMT)
Evaluating Progress in Graph Foundation Models: A Comprehensive Benchmark and New Insights [39.2] グラフ基礎モデル(GFM)は、様々なグラフを事前学習することで、伝達可能な知識を獲得することを目的としている。
既存の GFM ベンチマークのほとんどはトピックドメインにのみ依存しており、両方の次元にわたる知識の伝達の仕方も不明である。
GFMパイプライン全体にわたるトピックとフォーマットのギャップを共同で評価する新しいベンチマークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:01:10 GMT)
Time Stepped Cyber Physical Simulation of DoS, DoD, and FDI Attacks on the IEEE 14 Bus System [39.1] 本稿では,Denial of Service(DoS),Denial of Data(DoD),False Data Injection(FDI)攻撃がIEEE 14バスシステムをどのように破壊するかを評価する。
このフレームワークは、正弦波負荷変動を伴う24時間動作サイクルをエミュレートする。
各タイムステップにおいて、システムは真および測定された電圧、ジェネレータP/Q出力、システム損失、電圧制限違反をログする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:55:03 GMT)
Optimal-Horizon Social Robot Navigation in Heterogeneous Crowds [39.1] 環境の不確実性や複雑な人間とロボットの相互作用のため、密集した動的な群集の中で社会ロボットをナビゲートすることは困難である。
MPCは、強力なリアルタイムパフォーマンスを提供し、固定された予測地平線への依存は、環境の変化や社会的ダイナミクスへの適応性を制限している。
オンライン上でのMPCの視線を推定した状況に応じて最適化する最適水平社会ナビゲーションフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:09:15 GMT)
MicroVerse: A Preliminary Exploration Toward a Micro-World Simulation [38.3] マイクロワールドベンチ(MicroWorldBench)は、マイクロスケールシミュレーションタスクのためのマルチレベルルーリックベースのベンチマークである。
MicroWorldBenchは、459のユニークなエキスパートアノテート基準を通じて、体系的でルーリックな評価を可能にする。
我々の研究はまず、マイクロワールド・シミュレーションの概念を紹介し、生物学、教育、科学的可視化の応用の道を開いた概念の証明を示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:32:49 GMT)
SesaHand: Enhancing 3D Hand Reconstruction via Controllable Generation with Semantic and Structural Alignment [38.1] 生成モデルは多様な手画像を生成するための有望な代替手段である。
本稿ではセサHandを提案する。セサHandはセマンティックと構造的アライメントの両面から手動画像を生成する。
実験により,本手法は, 生成性能の向上だけでなく, 生成した手動画像による手動3次元再構成も向上することが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:51:51 GMT)
UNICBench: UNIfied Counting Benchmark for MLLM [37.9] カウントはマルチモーダル大言語モデル(MLLM)のコア機能である
統一型マルチモーダル・マルチレベルカウントベンチマークおよび評価ツールキットであるUNICBenchを提案する。
コーパスは、5,300イメージ(5,508 QA)、872ドキュメント(5,888 QA)、2,069オーディオクリップ(2,905 QA)からなる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:05:44 GMT)
A Blockchain-Based Trust Framework for Resilient Cross-Domain UAV Service Orchestration [37.9] 本稿では、クロスドメイン分散ID検証、監査可能なタスク実行、動的サービス対応オーケストレータ選択のためのコンソーシアムブロックチェーンベースの信頼アーキテクチャを提案する。
提案フレームワークは,認証待ち時間を大幅に削減し,集中型および静的なスキームに対するシステムスループットを大幅に改善する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:26:54 GMT)
RAISE: Requirement-Adaptive Evolutionary Refinement for Training-Free Text-to-Image Alignment [37.6] 本稿では,適応型T2I生成のためのトレーニングフリーで要求駆動型進化フレームワークであるRAISEを紹介する。
RAISEは要求駆動適応スケーリングプロセスとして画像生成を定式化する。
GenEvalとDrawBenchでは、RAISEは最先端のアライメントを実現している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:53:01 GMT)
Identifying the Geographic Foci of US Local News [37.6] 地方ジャーナリズムは、地域問題について人々に知らせる民主社会において不可欠である。
しかし、経済圧力の高まりにより、地元報道局がこれらの問題を報告することがますます困難になっている。
そこで本稿では,米国の地域ニュース記事に主題の中心となる地理的位置をラベル付けするための新しいジオフォシックモデルを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 19:15:52 GMT)
Wireless Power Control Based on Large Language Models [37.5] 物理インフォームド・フレームワークであるPC-LLMを提案する。
大規模な実験では、PC-LLMは従来の最適化手法と最先端のグラフニューラルネットワークのベースラインの両方を一貫して上回っている。
我々は,モデル深度を50%削減し,推論コストを大幅に低減する軽量適応戦略を開発した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:20:38 GMT)
ReMoT: Reinforcement Learning with Motion Contrast Triplets [37.3] 本稿では,VLMの時間的欠陥に対処する統合トレーニングパラダイムであるReMoTを提案する。
ルールベースの自動フレームワークはビデオメタアノテーションから大規模(1K)モーションコントラスト三重項であるReMoT-16K三重項を生成する。
また, 微妙な識別のVLMを測定するために, 微粒な動きコントラスト三重項に対する最初のベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:42:34 GMT)
Phys-Diff: A Physics-Inspired Latent Diffusion Model for Tropical Cyclone Forecasting [37.3] Phys-Diffは物理学に着想を得た潜伏拡散モデルであり、潜伏した特徴をタスク固有成分に分解する。
実験は、グローバルデータセットと地域データセットで最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:37:02 GMT)
Curation Leaks: Membership Inference Attacks against Data Curation for Machine Learning [36.5] さらなる保護がなければ、キュレーションパイプラインはプライベート情報を漏洩する可能性がある。
それぞれのステージがプライベートデータセットに関する情報を公開し、キュレーションをガイドしたプライベートデータに関する公開データ漏洩メンバシップ情報に専用にトレーニングされたモデルでさえも示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:14:01 GMT)
IDER: IDempotent Experience Replay for Reliable Continual Learning [36.4] 破滅的忘れは継続学習(CL)における大きな課題である
既存の不確実性を考慮したCL法は、計算オーバーヘッドが高く、主流の再生法と相容れない。
本稿では、繰り返し関数が同じ出力を出力する等等性性に基づく新しいアプローチである、等等性体験再生(IDER)を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:34:18 GMT)
Improved Adversarial Diffusion Compression for Real-World Video Super-Resolution [36.3] SeedVR2、DOVE、DLoRALのようなワンステップネットワークは、数十億のパラメータとマルチ秒のレイテンシで重くなります。
最近の逆拡散圧縮(ADC)は、これらのモデルをコンパクトなAdcSRネットワークに切断・蒸留することで、有望な経路を提供する。
本稿では,空間的詳細と時間的整合性のバランスを保った実VSRのための改良されたADC手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:30:54 GMT)
MetaMind: General and Cognitive World Models in Multi-Agent Systems by Meta-Theory of Mind [35.9] マルチエージェントシステムにおける世界モデルにおける大きな課題は、相互依存エージェントのダイナミクスを理解し、インタラクティブなマルチエージェント軌道を予測し、集合的認識を伴う長い地平線を計画することである。
本稿では,マルチエージェントシステムのための汎用および認知的世界モデルであるMetaMindを提案する。
そこで,MetaMindは,マルチエージェントのマルチエージェント一般化において,タスク性能とベースラインの優れた性能を実現することができることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:03:48 GMT)
Fine-grained Semantics Integration for Large Language Model-based Recommendation [35.8] token-level Semantics を LLM ベースの Recommender に組み込む TS-Rec を提案する。
2つの実世界のベンチマークに関する大規模な実験は、TS-Recが伝統的および生成的ベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:32:44 GMT)
From Visual to Multimodal: Systematic Ablation of Encoders and Fusion Strategies in Animal Identification [35.7] 本研究は,合成テキスト記述から派生したセマンティック・アイデンティティーによる視覚的特徴を高めるマルチモーダル・検証・フレームワークを提案する。
我々はこの調査を支援するため、695,091匹の動物を含む190万枚の写真からなる大規模な訓練コーパスを構築した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:27:38 GMT)
DUCX: Decomposing Unfairness in Tool-Using Chest X-ray Agents [35.7] ツールを用いた医療エージェントは、特殊な視覚と言語モジュールを編成することにより、胸部X線質問応答を改善することができる。
MedRAXを用いた胸部X線剤の系統的評価を行った。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 18:46:45 GMT)
Station2Radar: query conditioned gaussian splatting for precipitation field [34.6] 降水場を生成するために,衛星画像を用いた気象観測と自動観測を融合する枠組みを提案する。
従来の2Dガウススプラッティングとは異なり、QCGSはキュード降水領域のみを選択的にレンダリングする。
QCGSは、従来の格子状降水生成物と比較して、RMSEの50%以上の改善を示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:35:18 GMT)
Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered [34.4] このポジションペーパーでは、現代の視覚処理システムの評価は、主にシングルメトリック画像品質評価ベンチマークによって行われるべきではないと論じている。
この論文は、メトリクスを完全に拒絶するのではなく、より人間中心でコンテキストを認識し、視覚モデルの結果を評価するためのきめ細かいアプローチを提唱する評価パラダイムの再バランスを訴える。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:24:34 GMT)
Antibody: Strengthening Defense Against Harmful Fine-Tuning for Large Language Models via Attenuating Harmful Gradient Influence [33.7] ファインチューニング・アズ・ア・サービス(Funture-tuning-as-a-service)は、サービスプロバイダがユーザからの送信されたデータセットでモデルを微調整する場合、Large Language Modelsの安全性を脅かす。
本研究では, 微調整中に発生する有害な試料の寄与を定期的に調整することにより, 有害な微調整攻撃の影響を効果的に軽減できることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:46:21 GMT)
Deepfake Word Detection by Next-token Prediction using Fine-tuned Whisper [33.5] ボナファイド発話において1つ以上の単語を意味的に異なる単語に置き換えることで、ディープフェイク発話を偽造することができる。
本研究では,入力音声を転写しながら合成語を検出するために,事前学習したWhisperモデルを微調整する手法を開発した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 00:29:53 GMT)
Spectral Condition for $μ$P under Width-Depth Scaling [33.1] 広帯域スケーリングにおいて,$$Pの簡易かつ統一的なスペクトルフレームワークを開発する。
提案したスペクトル$$Pは,条件安定な特徴学習を保ち,広帯域スケーリング下でHPの堅牢な転送を可能にすることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:38:50 GMT)
FedUAF: Uncertainty-Aware Fusion with Reliability-Guided Aggregation for Multimodal Federated Sentiment Analysis [32.9] FedUAFは統合マルチモーダル・フェデレート・ラーニング・フレームワークであり、不確実性を認識した融合と信頼性に配慮した集約を通じてこれらの課題に対処する。
我々はFedUAFが、様々な欠落したモダリティパターンと非IID設定において、最先端のフェデレーションベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:00:17 GMT)
DreamWorld: Unified World Modeling in Video Generation [32.9] 我々は、相補的な世界の知識をビデオジェネレータに統合する統合フレームワーク、textbfDreamWorldを紹介した。
我々はDreamWorldが世界の一貫性を改善し、VBenchでWan2.1を2.26ポイント上回ることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:02:39 GMT)
Analyzing and Improving Fast Sampling of Text-to-Image Diffusion Models [32.7] テキストと画像の拡散モデルは前例のない成功を収めたが、限られたサンプリング予算の下で高品質な画像を作成するのに苦戦している。
本研究では,サンプリング軌道に沿った均一な幾何変動を確実にするスケジューリング戦略として,一定全回転スケジュール(TORS)を提案する。
TORSは以前のトレーニング不要加速法より優れており、Flux.1-DevとStable Diffusion 3.5の10段のサンプリングステップで高品質な画像を生成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 18:09:44 GMT)
TraceSIR: A Multi-Agent Framework for Structured Analysis and Reporting of Agentic Execution Traces [32.4] 本稿では,エージェント実行トレースの構造化解析と報告を行うフレームワークであるTraceSIRを提案する。
TraceSIRはStructureAgent、InsightAgent、ReportAgentの3つの特殊エージェントをコーディネートする。
実験により、TraceSIRは一貫して一貫性があり、情報的で、行動可能なレポートを生成することが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:33:24 GMT)
DeepAFL: Deep Analytic Federated Learning [32.2] Federated Learning(FL)は、データサイロを分解する一般的な分散学習パラダイムである。
従来のFLアプローチは、主に勾配ベースの更新に依存している。
我々はDeepAFLという名前のDeep Analytic Federated Learningアプローチを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:58:18 GMT)
Super Research: Answering Highly Complex Questions with Large Language Models through Super Deep and Super Wide Research [31.7] 大規模言語モデル(LLM)は、ディープリサーチやワイドサーチにおいて習熟性を示しているが、非常に複雑な問題を解く能力は、まだ明らかにされていない。
我々は, (i) 構造化された分解を研究計画に統合する複雑な自律型研究タスク, (ii) 多様な視点の超広視野検索, (iii) 反復的なクエリによる不確実性解決のための超深層調査を紹介する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:22:09 GMT)
Optimizing In-Context Demonstrations for LLM-based Automated Grading [31.4] GUIDE(Grading Using Iteratively Designed Exemplars)は、経験的選択と改善を境界中心の最適化問題として再設計するフレームワークである。
物理, 化学, 教育的内容知識の実験において, GUIDE は標準的検索基準を著しく上回っていることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:52:38 GMT)
Confusion-Aware Rubric Optimization for LLM-based Automated Grading [31.4] 本稿では,精度と計算効率を向上させる新しいフレームワークであるConfusion-Aware Optimization (CARO)を紹介する。
CAROはモノリシックなエラー信号を異なるモードに分解し、明確な診断と特定の誤分類パターンの修復を可能にする。
以上の結果から,複合エラー集約を外科的,モード特異的な修復に置き換えることにより,自動評価のスケーラビリティと精度が向上することが示唆された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:17:12 GMT)
SSR: Pushing the Limit of Spatial Intelligence with Structured Scene Reasoning [30.9] SSRはStructured Scene Reasoning用に設計されたフレームワークである。
軽量アライメント機構によって2Dと3Dの表現をシームレスに統合する。
複数の空間インテリジェンスベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:05:35 GMT)
ExtremControl: Low-Latency Humanoid Teleoperation with Direct Extremity Control [30.4] 低レイテンシなヒューマノイド遠隔操作システムの構築は、多様な動的デモンストレーションの収集に不可欠である。
本稿では,低レイテンシな全身制御フレームワークExtremControlを提案する。
我々は,光学式モーションキャプチャとVRベースのモーショントラッキングの両方をサポートする低遅延ヒューマノイド遠隔操作システムを実装した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:06:47 GMT)
Neurosymbolic Learning for Advanced Persistent Threat Detection under Extreme Class Imbalance [30.0] 本稿では,最適化されたBERTモデルと論理テンソルネットワーク(LTN)を統合し,無線IoTネットワークにおける説明可能なAPT検出を実現するニューロシンボリックアーキテクチャを提案する。
その結果, ニューロシンボリック学習はIoTネットワーク監視アーキテクチャの高性能, 解釈可能, 動作可能なAPT検出を可能にすることがわかった。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:25:50 GMT)
WildActor: Unconstrained Identity-Preserving Video Generation [29.8] Actor-18Mは、制約のない視点と環境下でのアイデンティティの一貫性を捉えるために設計された、大規模なヒューマンビデオデータセットである。
本研究では,WildActorを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:34:39 GMT)
PaLMR: Towards Faithful Visual Reasoning via Multimodal Process Alignment [29.2] PaLMRは結果だけでなく、推論プロセス自体も整合するフレームワークです。
Qwen2.5-VL-7Bの実験から,本手法は幻覚の推論を著しく低減し,視覚的推論の忠実度を向上することが示された。
これらの結果から,PaLMRはプロセス整合型マルチモーダル推論への原則的かつ実践的な経路であることが明らかとなった。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:33:11 GMT)
CMI-RewardBench: Evaluating Music Reward Models with Compositional Multimodal Instruction [28.7] コンポジション・マルチモーダル・インストラクション(CMI)に基づく音楽報酬モデリングのための総合的なエコシステムを構築した。
まず,110kの擬似ラベル付きサンプルからなる大規模選好データセットであるCMI-Pref-Pseudoと,きめ細かなアライメント作業に適した高品質な人間アノテーション付きコーパスであるCMI-Prefを紹介する。
CMI-RewardBenchは,音楽性,テキスト・音楽的アライメント,コンストラクショナル・インストラクション・アライメントといった多種多様なサンプルの楽曲報酬モデルを評価する統一ベンチマークである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:10:58 GMT)
Optimizing CMOS-compatible, superconducting Titanium Nitride Resonators: Deposition Conditions and Structuring Processes [28.4] 我々は,200,mm径Si(100)基板上に堆積した窒化チタン(TiN)薄膜をベースとした超伝導コプラナー導波管(CPW)共振器の作製とその特性について報告する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:48:09 GMT)
CoLC: Communication-Efficient Collaborative Perception with LiDAR Completion [28.4] 協調認識フレームワークは、疎透過下でのシーン完全性を復元するためにLiDAR Completionを組み込んでいる。
シミュレーションと実世界の両方のデータセットの実験は、COLCが優れた認識コミュニケーショントレードオフを達成することを示した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:45:14 GMT)
A Comprehensive Evaluation of LLM Unlearning Robustness under Multi-Turn Interaction [28.1] 対話型環境での学習が安定しているかどうかを2つの共通相互作用パターンを用いて検討する。
静的評価で忘れられた知識は、しばしば相互作用によって回収される。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 22:01:31 GMT)
OPGAgent: An Agent for Auditable Dental Panoramic X-ray Interpretation [27.7] 専門的なツールを編成するエージェントシステムは、汎用性と正確性の両方への道筋を提供する。
OPGAgentは、コンセンサス機構を備えた特殊な知覚モジュールをコーディネートする。
OPG-Benchは、実際の臨床報告から派生した(ロケーション、フィールド、バリュー)トリプルに基づく構造化レポートプロトコルである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:47:51 GMT)
ArtiFixer: Enhancing and Extending 3D Reconstruction with Auto-Regressive Diffusion Models [27.3] 3Dガウススプラッティングのようなシーンごとの最適化手法は、最先端の斬新なビュー合成の質を提供するが、観測されていない領域への外挿は不十分である。
2つの重要な洞察を利用する2段階のパイプラインを提案する。
まず、新しい不透明混合戦略を用いて、強力な双方向生成モデルを訓練する。
第二に、これを因果自己回帰モデルに蒸留し、1回のパスで数百フレームを生成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:22:40 GMT)
Cycle-Consistent Tuning for Layered Image Decomposition [26.3] ビジュアルレイヤを現実世界のイメージに切り離すことは、視覚とグラフィックスにおいて永続的な課題である。
層状分離に大規模な拡散基盤モデルを利用するインコンテキスト画像分解フレームワークを提案する。
提案手法は, 高精度かつコヒーレントな分解を実現し, その他の分解タイプに対して効果的に一般化する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:10:31 GMT)
FastBUS: A Fast Bayesian Framework for Unified Weakly-Supervised Learning [26.1] 機械学習は、しばしば様々な不正確なラベルを伴い、多種多様な教師付き設定をもたらす。
そこで本研究では,様々な弱監督領域にまたがる潜在真のラベル分布を効率的に推定する枠組みを提案する。
提案手法は,最弱教師付き環境下でのSOTA結果を実現し,他の一般的な手法と比較して,実行時間の最大で数百倍の高速化を実現している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:27:21 GMT)
Multimodal Adaptive Retrieval Augmented Generation through Internal Representation Learning [25.0] 視覚的質問応答システムは幻覚による信頼性の問題に直面する。
本稿では、モデルの内部知識の信頼性を評価し、抽出した外部情報を生成プロセスに組み込むかどうかを決定するマルチモーダル適応RAG(MMA-RAG)を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:17:13 GMT)
Lookahead identification in adversarial bandits: accuracy and memory bounds [24.7] マルチアームバンディットにおける識別問題について検討する。
各ラウンドで、学習者はK$の腕のうちの1つを選択し、その報酬を観察する。
過去のパフォーマンスでは、将来についてはほとんど情報を提供しておらず、意味のある識別が可能かどうかという疑問が提起されている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 20:38:58 GMT)
Stop Treating Collisions Equally: Qualification-Aware Semantic ID Learning for Recommendation at Industrial Scale [24.4] QuaSIDは、選択的に修飾された競合ペアによって衝突修飾されたSIDを学習し、衝突重大度による反発強度をスケールするエンドツーエンドフレームワークである。
公開ベンチマークと産業データの実験は、QuaSIDを検証する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:55:49 GMT)
Zero-Shot Robotic Manipulation via 3D Gaussian Splatting-Enhanced Multimodal Retrieval-Augmented Generation [24.1] 既存のエンドツーエンドのロボット操作アプローチでは、限られたデータと弱い解釈性のために、見えないオブジェクトやタスクへの一般化が欠如していることが多い。
ゼロショットロボット操作のための3次元ガウス型マルチモーダル検索生成フレームワークRobMRAGを提案する。
提案手法は, 最高性能のゼロショットベースラインと比較して7.76%, 最先端の教師付きベースラインに比べて6.54%向上する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:48:05 GMT)
Frozen Policy Iteration: Computationally Efficient RL under Linear $Q^π$ Realizability for Deterministic Dynamics [23.7] 線形な$Q$実現可能性仮定の下で,計算的および統計的に効率的な強化学習について検討する。
我々のアルゴリズムは、$widetildeO(sqrtd2H6T)$で、$d$は特徴空間の次元、$H$は地平線長、$T$はエピソードの総数である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:41:47 GMT)
LLM-Bootstrapped Targeted Finding Guidance for Factual MLLM-based Medical Report Generation [23.7] Fact-Flowは,視覚的事実認識のプロセスとレポートの生成を分離する,革新的なフレームワークである。
これは、まず画像から臨床所見を予測し、その後、MLLMに事実的正確性のあるレポートを作成するよう指示することで達成される。
我々のアプローチの重要な進歩は、大規模言語モデル(LLM)を活用してラベル付き医療所見のデータセットを自律的に作成するパイプラインである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:50:20 GMT)
Efficient Conformal Volumetry for Template-Based Segmentation [23.6] 本稿では,効率的なボリューム不確実性定量化を実現するフレームワークであるConVOLTを紹介する。
ConVOLTは、変形空間の特徴から学習されたボリュームスケーリング係数を校正する。
我々の研究は、医用画像パイプラインにおける効率的なUQのための登録プロセスを活用する方法である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 20:16:15 GMT)
Pragma-VL: Towards a Pragmatic Arbitration of Safety and Helpfulness in MLLMs [23.5] MLLM(Multimodal Large Language Models)は、重要な安全性上の課題である。
現在の手法は、しばしば安全ユーティリティのトレードオフに直面している。過度な注意から良質なクエリを拒否するか、モーダル間相互作用の潜在リスクを見落としている。
Pragma-VL は,MLLM が安全性と利便性を現実的に仲裁できる,エンドツーエンドアライメントアルゴリズムである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:29:29 GMT)
Fair in Mind, Fair in Action? A Synchronous Benchmark for Understanding and Generation in UMLLMs [23.3] InLMにおける理解タスクと生成タスクの両方の公平性を同期的に評価するために、IRISベンチマークを導入する。
このベンチマークは任意のメトリクスを正規化し、高次元の「フェアネス空間」に集約するように設計されている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:43:32 GMT)
Texterial: A Text-as-Material Interaction Paradigm for LLM-Mediated Writing [23.3] Texterialは、テキストをユーザーが成長し、彫刻し、変換できる素材として再定義する。
現在の生成AIモデルはリッチテキスト操作を可能にするが、剛性のあるリニアインタフェースはしばしばそのような機能を隠蔽する。
我々は、テキスト・アズ・マテリアルというメタファがAI可能な操作を明らかにし、書き起こしプロセスを再構築し、魅力的なユーザー体験を育む方法について検討する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:17:30 GMT)
PointAlign: Feature-Level Alignment Regularization for 3D Vision-Language Models [23.3] 既存の手法は、言語のトークンのみを監督に用いながら、次世代の予測損失にのみ依存する。
mnameは、微粒な3次元幾何学的意味情報を保持するために、中間点のクラウドトークンを明示的に監督する。
モデルNet40および逆データセットを用いた実験により,本手法は,分類タスクの平均値に対して,textbf2.08ppの改善を達成できることを示した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:17:46 GMT)
IdGlow: Dynamic Identity Modulation for Multi-Subject Generation [23.2] We present IdGlow, a mask-free, progressive two-stage framework built on Flow Matching diffusion model。
教師付き微調整(SFT)の段階では、拡散生成力学に対応するタスク適応型時間ステップスケジューリングを導入する。
第2段階では,マルチオブジェクトアーティファクトを同時に除去するために,重み付きマージンの定式化を施したファイングラインド・グループレベル直接選好最適化(DPO)を設計する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:56:34 GMT)
Adaptive Dynamic Dehazing via Instruction-Driven and Task-Feedback Closed-Loop Optimization for Diverse Downstream Task Adaptation [23.2] 現実世界の視覚システムでは、多様な下流タスクの特定のニーズを満たすためにヘイズ除去が必要である。
閉ループ最適化機構を組み込んだ適応動的脱ハージングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:42:15 GMT)
Weakly Supervised Video Anomaly Detection with Anomaly-Connected Components and Intention Reasoning [23.0] 本稿では,WS-VAD のための Anomaly Semantics を学習するための LAS-VAD という新しいフレームワークを提案する。
本フレームワークは,異常接続されたコンポーネント機構と意図認識機構を統合している。
最先端の手法よりも優れており、顕著な利得がある。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:57:33 GMT)
MIDAS: Multi-Image Dispersion and Semantic Reconstruction for Jailbreaking MLLMs [22.9] マルチイメージ分散と意味再構成(MIDAS)
本稿では,有害なセマンティクスをリスク対応サブユニットに分解するマルチモーダルジェイルブレイクフレームワークを提案する。
MIDASはより長く、より構造化されたマルチイメージ連鎖推論を強制する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:29:36 GMT)
Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark [22.6] SCI(Spectral Compressive Imaging)は、ダイナミックスペクトルビジョンにおいて大きな可能性を秘めている。
既存の再建法は、主にイメージベースであり、2つの制限がある。
フレーム・バイ・フレームの再構築パラダイムは、ビデオ知覚において重要な時間的一貫性を確保するのに失敗する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:11:13 GMT)
RTLocating: Intent-aware RTL Localization for Hardware Design Iteration [22.2] 産業用チップの開発は本質的に反復的であり、RTLをスクラッチから書き換えるよりも、ローカライズされたインテント駆動の更新を好む。
我々は、自然言語変更要求を影響を受けるレジスタ転送レベル(RTL)構文ブロックにマッピングする多値問題である$$Spec-to-RTLローカライゼーションを形式化する。
本稿では,RTLローカライゼーションフレームワークであるRTLocatingを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:27:36 GMT)
Diversity over Uniformity: Rethinking Representation in Generated Image Detection [22.0] 我々は、確実に生成された画像検出は、単一の決定経路に依存するのではなく、複数の判断視点を維持するべきであると論じている。
本稿では,タスク非関係なコンポーネントをフィルタし,表現空間における様々なフォージェリーキュー間の過剰なオーバーラップを抑えるアンチファイン・コラプス学習フレームワークを提案する。
この設計は、モデル内で多様な補完的な証拠を維持し、小さな敬意的な手がかりへの依存を減らし、目に見えない生成条件下で堅牢性を高める。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:42:12 GMT)
Act Like a Pathologist: Tissue-Aware Whole Slide Image Reasoning [21.8] 我々は,質問誘導,組織認識,粗粒度検索フレームワークHistoSelectを提案する。
提案手法は既存の手法より優れ, 解釈可能な, 病理学的に整合した領域で解答を導出する。
以上の結果から,WSI推論に人間ライクな検索と注意パターンを取り入れることが,実用的で信頼性の高いVLMを構築する上で有望な方向であることが示唆された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:22:53 GMT)
RAIE: Region-Aware Incremental Preference Editing with LoRA for LLM-based Recommendation [21.7] Region-Aware Incremental Editing (RAIE)は、バックボーンモデルを凍結し、リージョンレベルの更新を実行するプラグインフレームワークである。
RAIEはまず、表現空間における球k-平均を通して意味的にコヒーレントな嗜好領域を構築する。
次に、信頼を意識したゲーティングを通じて、受信したシーケンスをリージョンに割り当て、ローカル化された3つの編集操作を実行する – Update、Expand、Add。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:12:38 GMT)
Stroke outcome and evolution prediction from CT brain using a spatiotemporal diffusion autoencoder [21.6] ストロークは世界中で死と障害の主な原因である。
拡散確率モデルの分野で近年のアイデアを適用し,CT画像から自己教師付き意味論的ストローク表現を生成する。
そして、この表現を長手画像とストローク開始からの時間に合わせて拡張することで改善する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 18:00:06 GMT)
Advancing Multimodal Judge Models through a Capability-Oriented Benchmark and MCTS-Driven Data Generation [20.2] M-JudgeBenchはMLLMの判断能力を総合的に評価する能力指向のベンチマークである。
judge-MCTSはデータ構築フレームワークであり、様々な正確さと長さのペアの推論軌道を生成する。
本研究は,MLLM-as-a-judgeをM-JudgeBench および judge-MCTS フレームワークで評価するための,より原則化された基盤を確立する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:49:22 GMT)
U-VLM: Hierarchical Vision Language Modeling for Report Generation [20.1] トレーニングとアーキテクチャの両方において階層型視覚言語モデリングを可能にするU-VLMを提案する。
U-VLMはCT-RATEとAbdomenAtlas 3.0で、スクラッチからトレーニングされた0.1Bデコーダのみを使用して、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:43:11 GMT)
Mathematical Foundations of Poisoning Attacks on Linear Regression over Cumulative Distribution Functions [19.8] 学習インデックスは、機械学習モデルを用いて累積分布関数(CDF)を近似することにより、高速な検索を可能にするインデックスデータ構造のクラスである。
近年の研究では、学習した指標が、トレーニングデータに少量の毒鍵を注入することで、モデルの精度が著しく低下し、インデックスのパフォーマンスが低下する可能性があることが示されている。
本稿では,CDF 上の線形回帰モデルをターゲットにした毒殺攻撃の厳密な理論的解析を行う。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:21:44 GMT)
Roots Beneath the Cut: Uncovering the Risk of Concept Revival in Pruning-Based Unlearning for Diffusion Models [19.7] プランニングベースのアンラーニングは、望ましくない概念を拡散モデルから取り除くための、高速で、トレーニング不要で、データに依存しないアプローチである。
刈り取られた重量の位置は、通常、学習中にゼロに設定され、消去された概念に関する重要な情報を漏らすサイドチャネル信号として機能する。
本研究では,完全にデータフリーかつトレーニングフリーな方法で,切断された拡散モデルから消去された概念を復活させることのできる,新たな攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 00:08:48 GMT)
High Dynamic Range Imaging Based on an Asymmetric Event-SVE Camera System [18.8] イベントカメラはマイクロ秒の時間分解能と高いダイナミックレンジを提供し、空間的に異なる露光(SVE)センサーは単発ラジオメトリックの多様性を提供する。
本研究では,SVEマイクロ減衰カメラとイベントセンサを非対称なデュアルモード構成で密に統合するハードウェア設計のHDRイメージングシステムを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:02:41 GMT)
Mamba-CAD: State Space Model For 3D Computer-Aided Design Generative Modeling [18.7] 産業における複雑なCADモデルのための自己教師型生成モデルであるMamba-CADを紹介する。
本研究では,CADモデルの偽表現を生成するために,学習した表現を用いて生成的敵ネットワークを誘導する。
Mamba-CADをトレーニングするために、より長いパラメトリックCADシーケンスを持つ77,078個のCADモデルからなる新しいデータセットを作成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:38:26 GMT)
Decoupling Stability and Plasticity for Multi-Modal Test-Time Adaptation [18.5] 既存の方法は、偏りのないモードでは負の移動にしばしば遭遇し、偏りのあるモードでは破滅的な忘れ方をする。
本稿では,新しい診断・治療フレームワークであるDASP(Decoupling Adaptation for stability and Plasticity)を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:46:58 GMT)
Enhancing Molecular Property Predictions by Learning from Bond Modelling and Interactions [18.4] 原子中心表現学習のためのデュアルグラフフレームワークである textbfDeMol を紹介する。
DeMolは、並列原子中心および結合中心チャネルを通じて分子を明示的にモデル化する。
既存のメソッドよりも優れた、最先端の新たな方法を確立します。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:36:19 GMT)
High-Performance Dual-Arm Task and Motion Planning for Tabletop Rearrangement [17.5] 2本のフィンガーグリップを装備した2つのロボットアームは、スタートとゴールの設定が強く絡み合っている再配置オブジェクトに近接して作業する必要がある。
テーブルトップ再配置のためのタスクおよび動作計画フレームワークであるSynchronous Dual-Arm Rearrangement Planner (SDAR)を提案する。
SDARは複雑で非単調で長期のテーブルトップ再構成タスクにおいて100%の成功率を示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:49:10 GMT)
ProactiveMobile: A Comprehensive Benchmark for Boosting Proactive Intelligence on Mobile Devices [17.4] 本稿では,プロアクティブなモバイルエージェント開発のためのベンチマークであるProactiveMobileを紹介する。
プロアクティブタスクは、デバイス上のコンテキスト信号の4次元にわたる潜在ユーザ意図を推測するものとして形式化されている。
このベンチマークは成功率19.15%で、実験ではo1 (15.71%) と GPT-5 (7.39%) を上回っている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:17:24 GMT)
AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution [16.9] 視覚的自己回帰モデルは、次のスケールの予測を通じて安定したトレーニング、非定性推論、高忠実性合成を提供する。
しかし、その応用は未調査のままであり、局所性に偏った注意と残留性のみの監督という2つの重要な課題に直面している。
画像超解像に適した一貫した視覚自己回帰フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:39:06 GMT)
Heterophily-Agnostic Hypergraph Neural Networks with Riemannian Local Exchanger [16.8] ハイパーグラフニューラルネットワーク(HealHGNN)のための適応的局所性を持つ新しい熱交換器を提案する。
HealHGNNはノード数とハイパーエッジ数の線形複雑性を持つノード-ハイパーエッジ双方向システムとして設計されている。
HealHGNNは, 好中球およびヘテロ親和性の両方の実験により, 最先端の性能を達成できることが示されている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:36:35 GMT)
To Use or not to Use Muon: How Simplicity Bias in Optimizers Matters [16.6] Muonはおそらく、トレーニング速度が優れているため、最も人気がある。
本稿では、このスピードアップを駆動するメカニズムから生じる潜在的な欠点について検討する。
Muonはタスク間の共通基盤構造を明らかにするのに苦労しており、刺激的な特徴に適合する傾向にある。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:37:15 GMT)
Dial E for Ethical Enforcement: institutional VETO power as a governance primitive [16.5] この論文は、軍事利用に最も脆弱なコミュニティはガバナンス設計を導く必要があると主張している。
機関の拒否権は、象徴的な保護を強制的な責任に変換するための前提条件であると主張している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:18:55 GMT)
GCL-Sampler: Discovering Kernel Similarity for Sampled GPU Simulation via Graph Contrastive Learning [16.5] GCL-Samplerは、プログラム実行のリッチな構造とセマンティックな特性をキャプチャする。
GCL-Samplerは、0.37%のエラーで全ワークロードに対して平均258.94倍のスピードアップを達成した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:03:18 GMT)
TMR-VLA:Vision-Language-Action Model for Magnetic Motion Control of Tri-leg Silicone-based Soft Robot [16.1] 我々は、より柔軟な歩行と多様な動きパターンを実現するために、多脚設計が可能な三脚磁気駆動型ソフトロボット(TMR)を開発した。
再構成可能なソフトロボットで作られたシリコンでは、ナビゲーション能力はシーケンシャルな動作に分けることができる。
TMR-VLAは,ハイブリッドモーションタイプを動作可能なトリグレッグ型磁気ソフトロボットのエンドツーエンドマルチモーダルシステムである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:39:41 GMT)
MoltGraph: A Longitudinal Temporal Graph Dataset of Moltbook for Coordinated-Agent Detection [16.0] エージェントがどのように振る舞うかを研究するための,現実的な縦型エージェントネットワークグラフデータセットとして,MortGraphを紹介した。
MoltGraphを用いて、動的ネットワークとしてMoltbookを初めてグラフ中心で特徴づける。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:35:38 GMT)
Leveraging Causal Reasoning Method for Explaining Medical Image Segmentation Models [16.0] 医用画像のセグメンテーションは臨床的な意思決定において重要な役割を担い、病変の正確な局所化と指導的介入を可能にする。
現在の説明手法は主に分類作業に重点を置いており、セグメンテーション領域は比較的過小評価されている。
本稿では、因果推論フレームワークを用いて、平均処理効果(ATE)を指標として、入力領域やネットワークコンポーネントが対象セグメンテーション領域に与える影響を推定するセグメンテーションタスクの説明モデルを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:15:34 GMT)
A Reconstruction System for Industrial Pipeline Inner Walls Using Panoramic Image Stitching with Endoscopic Imaging [15.9] 本稿では,産業用内視鏡を用いたパイプライン内壁の補修システムについて述べる。
このシステムは、内視鏡映像から鍵フレームを抽出し、極座標変換と画像縫合技術を統合する。
生成されたパノラマ縫合画像は、パイプライン内壁の詳細な特徴をすべて保存している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:38:55 GMT)
Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds [15.9] ユークリッド勾配降下アルゴリズムは、目的関数による超曲面の幾何をほとんど捉えない。
我々は,一般かつ学習率の低いリーマン勾配勾配アルゴリズムである測地勾配勾配(GGD)を提案する。
GGDは、バーガースのデータセット上での完全接続ネットワークの35.79%から48.76%まで、MNISTデータセット上の畳み込みニューラルネットワークの3.14%から11.59%までのクロスエントロピー損失削減を達成している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:04:15 GMT)
Atomicity for Agents: Exposing, Exploiting, and Mitigating TOCTOU Vulnerabilities in Browser-Use Agents [15.4] ブラウザ利用エージェントにおけるTOCTOU脆弱性に関する大規模な実証的研究を行った。
動的または敵対的なWebコンテンツは、意図しないアクションを誘発するためにこのウィンドウを利用することができる。
我々は、事前実行検証に基づく軽量な緩和を設計する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:25:03 GMT)
AIoT-based Continuous, Contextualized, and Explainable Driving Assessment for Older Adults [15.4] 我々は,高齢者の運転安全性の連続的,実世界評価のための人工知能フレームワークであるAURAを提案する。
AURAは、よりリッチな車内センシング、マルチスケールの行動モデリング、コンテキスト認識分析を統合し、定期旅行から運転性能の詳細な指標を抽出する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:03:27 GMT)
CURE: A Multimodal Benchmark for Clinical Understanding and Retrieval Evaluation [15.2] 臨床理解・検索評価ベンチマークについて紹介する。
CUREは、制御されたエビデンス設定の下で推論と検索を評価する。
閉鎖的, オープンな診断タスクにおいて, 異なるエビデンス収集パラダイムにまたがる最先端のMLLMを評価した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:56:18 GMT)
WirelessAgent++: Automated Agentic Workflow Design and Benchmarking for Wireless Networks [14.8] 各種無線タスクのためのエージェントアルゴリズム設計を自動化するフレームワークである WirelessAgent++ を提案する。
各ワークフローをモジュラー演算子で構成される実行可能なコードとして扱うことで、WirelessAgent++はプログラム検索問題としてエージェント設計をキャストする。
我々は、Wapが自律的に優れた結果を発見し、テストスコアが78.37%$ (WCHW)、90.95%$ (WCNS)、97.07%$ (WCMSA)、総検索コストが5ドル以下であることを示した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:52:52 GMT)
SCOUT: Fast Spectral CT Imaging in Ultra LOw-data Regimes via PseUdo-label GeneraTion [14.8] CT(Computed tomography)スキャンにおけるノイズとアーティファクトは、疾患の診断に影響を及ぼす根本的な課題である。
本研究は, 外部データを必要としない極低生データ条件下での復元手法を提案する。
実験により、この方法は検出器によって誘導されるリングアーティファクトを緩和するだけでなく、詳細回復において前例のない能力を示すことが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:54:16 GMT)
RAFM: Retrieval-Augmented Flow Matching for Unpaired CBCT-to-CT Translation [14.6] 医用画像におけるCBCT-to-CT翻訳にRF(rerectified flow)を導入する。
RFは、分布レベルの結合と決定論的輸送による未経験学習と理論的に互換性がある。
RAFMは、凍結したDINOv3エンコーダとグローバルCTメモリバンクを用いて検索誘導擬似ペアを構築することにより、医療環境にRFを適応させる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:19:05 GMT)
STMI: Segmentation-Guided Token Modulation with Cross-Modal Hypergraph Interaction for Multi-Modal Object Re-Identification [14.5] 3つの主要コンポーネントからなる新しいマルチモーダル学習フレームワークSTMIを提案する。
マルチモーダルReIDシナリオにおけるSTMIフレームワークの有効性とロバスト性を実証する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:07:10 GMT)
Boosting Meta-Learning for Few-Shot Text Classification via Label-guided Distance Scaling [14.1] 短いショットテキスト分類は、ラベル付きテキストサンプルが限定された未確認のクラスを認識することを目的としている。
textbfLabel-guided textbfDistance textbfScaling (LDS) 戦略を提案する。
トレーニング段階において、ラベル誘導損失を設計し、ラベルの意味情報を注入し、サンプル表現を近づける。
テスト段階では,ラベルセマンティクスを用いてサンプル表現をスケールし,さらなる監視信号を提供するラベル誘導尺度を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:59:15 GMT)
Does My README File Need To Be Updated? Exploring LLM-Based README Maintenance [13.9] 古いドキュメントは、プロジェクトを理解する上で最も頻繁で深刻な課題の1つだと見なされている。
本稿では,ループ内ワークフロー内での正確なローカル化ファイル更新を容易にするために,軽量なLarge Language Model (LLM) によるアプローチを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:04:45 GMT)
RC-GeoCP: Geometric Consensus for Radar-Camera Collaborative Perception [13.6] 協調知覚(CP)は、マルチエージェント情報共有によるシーン理解を強化する。
密集した視覚的セマンティクスと頑丈な空間測定にもかかわらず、カメラと4Dレーダーの相乗効果は、協調的な環境では未探索のままである。
RC-GeoCPは4Dレーダと画像のCPへの融合を探求する最初のフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:52:10 GMT)
MME: Mixture of Mesh Experts with Random Walk Transformer Gating [13.6] 本稿では,多種多様なアプローチの相補的強みを生かした,新たなMixture of Experts(MoE)フレームワークを提案する。
そこで我々は,各専門家が優れたクラスを専門に扱うことを奨励する新しいゲートアーキテクチャを提案する。
我々のフレームワークはメッシュ分類、検索、セマンティックセグメンテーションタスクにおける最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 22:13:00 GMT)
Silent Sabotage During Fine-Tuning: Few-Shot Rationale Poisoning of Compact Medical LLMs [13.5] 医療用大言語モデル(LLMs)の開発にはSFT(Supervised Fine-tuning)が不可欠である
SFT中における医療用LCMの推論過程を標的とした新規な毒殺攻撃を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:25:22 GMT)
Adapt Data to Model: Adaptive Transformation Optimization for Domain-shared Time Series Foundation Models [13.1] 大規模時系列モデル(LTM)は、普遍的な予測のための強力なツールとして登場したが、実世界のデータ固有の多様性と非定常性に苦しむことが多い。
本稿では,データ中心のフレームワークである時系列適応変換最適化(TATO)を提案する。
最先端のLTMと広く使用されているデータセットの実験により、TATOは一貫して、ドメイン適応予測性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:45:31 GMT)
Vision-TTT: Efficient and Expressive Visual Representation Learning with Test-Time Training [12.9] 本稿では,新しい線形時間系列モデリング手法であるTest-Time Training(TTT)を視覚に導入する。
Vision-TTTは、新しい自己教師付き学習方法で視覚トークンシーケンスを圧縮する。
texttVittt-T/S/B は ImageNet 分類において 77.3%,81.2%,82.5% のTop-1 精度を達成している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:31:43 GMT)
Wild-Drive: Off-Road Scene Captioning and Path Planning via Robust Multi-modal Routing and Efficient Large Language Model [12.9] オフロードシーンキャプションと経路計画のための効率的なフレームワークWild-Driveを提案する。
また,多様なセンサ劣化条件下でのオフロードシーンのキャプションと経路計画に関するOR-C2Pベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:06:24 GMT)
MED-COPILOT: A Medical Assistant Powered by GraphRAG and Similar Patient Case Retrieval [12.3] MED-COPILOTは,臨床医と研修医を対象としたインタラクティブな臨床意思決定支援システムである。
このシステムはWHOとNICEのガイドラインから構造化知識グラフを構築し、効率的な検索にコミュニティレベルの要約を適用し、36,000ケースの類似患者データベースを維持している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:32:03 GMT)
Unlearning Evaluation through Subset Statistical Independence [12.2] ほとんどの未学習アルゴリズムは、トレーニングデータの小さなランダムなサブセットを除去する。
統計的独立性に基づくサブセットレベルの評価フレームワークを提案する。
本手法は,非学習と整合した簡易なスタンドアロン評価手法を提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:36:50 GMT)
Rooted Absorbed Prefix Trajectory Balance with Submodular Replay for GFlowNet Training [12.1] Generative Flow Networks (GFlowNets) は、大規模な言語モデルを微調整し、報酬-比例後部を近似することができる。
そこで本研究では,根部におけるサブトラジェクティブ・インシュアランス(サブトラジェクトリ・インシュアランス)を定着させる目的として,根管吸収プレフィックスのトラジェクトリ・バランスRapTBを提案する。
さらに、報酬と多様性の両方を促進するサブモジュールリプレイリフレッシュ戦略であるSubMを導入する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:25:54 GMT)
On Best-Possible One-Time Programs [12.0] ワンタイムプログラム(OTP)は、ユーザが1つの入力でプログラムを評価し、他の何も明らかにしないようにする。
本稿では,任意のOPP構築によって達成可能な最強のワンタイムセキュリティを実現する「ベスト・バイ・ブル」なOPPを求める。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:46:02 GMT)
BLUFF: Benchmarking the Detection of False and Synthetic Content across 58 Low-Resource Languages [11.9] BLUFFは、79言語で偽と合成のコンテンツを検出するためのベンチマークである。
高リソースの "Big-head" (20) と低リソースの "Long-tail" (59) 言語の両方をカバーする。
AXL-CoIは,偽ニュース・実ニュース生成を制御するための新しいマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:58:31 GMT)
Data-Centric Benchmark for Label Noise Estimation and Ranking in Remote Sensing Image Segmentation [11.7] リモートセンシング画像のセマンティックセグメンテーションに不可欠なピクセルレベルのアノテーション。
ピクセルワイドアノテーションの労働集約的かつ時間のかかる性質は、人間のアノテータがすべてのピクセルを正確にラベル付けすることを困難にしている。
本稿では,新しいデータセットと,リモートセマンティックセマンティックセグメンテーションにおけるラベルノイズのレベルに応じたトレーニングサンプルの識別,定量化,ランク付けを行うための2つの手法とともに,新しいData-Centricベンチマークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:46:56 GMT)
Quantitative Monitoring of Signal First-Order Logic [11.3] Signal First-Order Logic (SFO) のためのロバストネスに基づく最初の定量的意味論を提供する。
SFOはそのような信号に対して表現力のあるリアルタイム仕様を提供するが、現時点ではBooleanセマンティクスのみで、ツールサポートはない。
これは、完全なSFOのオンライン定量モニタリングのための最初の公開プロトタイプである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 16:23:11 GMT)
An Interpretable Local Editing Model for Counterfactual Medical Image Generation [11.3] InstructX2Xは、Regional-Specific Editingを特徴とする反ファクトな医療画像生成のための、解釈可能な新しいローカル編集モデルである。
本モデルでは,高画質の胸部X線画像と解釈可能な説明が得られた。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:48:15 GMT)
Developing Fundamental Diagrams for Urban Air Mobility Traffic Based on Physical Experiments [11.1] UAM(Urban Air Mobility)は、都市交通システムにおける移動時間の短縮と混雑緩和を約束する無人航空機の新たな応用である。
ドローンの密度が増大するにつれて、UAMトラフィックは地上交通と同様の混雑を経験することが期待されている。
本研究では,理論解析と物理実験を統合することにより,UAMトラフィックの基本図(FD)を構築するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 19:12:43 GMT)
Smoothness Adaptivity in Constant-Depth Neural Networks: Optimal Rates via Smooth Activations [11.1] ソボレフ空間における学習関数を円滑に活性化するニューラルネットワークの近似と統計的性質について検討した。
本研究では,スムーズなアクティベーションを備えた定数深度ネットワークが,スムーズな適応性を実現することを証明した。
本稿では,ソボレフ関数クラスに対する最適速度を達成するための基本的なメカニズムとして,活性化の滑らかさを同定する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:33:36 GMT)
Improving Automatic Summarization of Radiology Reports through Mid-Training of Large Language Models [11.0] これまでの研究では、「事前学習、微調整」戦略を、要約に大規模な言語モデルを適用するために広く利用してきた。
本研究では,要約を改善するため,中間学習手法によるサブドメイン適応を提案する。
本研究は, 直接微調整戦略ではなく, 事前訓練, 中間訓練, 微調整」の使用を支援する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:36:46 GMT)
Efficient Decoder Scaling Strategy for Neural Routing Solvers [10.8] エンコーダとデコーダで構成される建設ベースのニューラルルーティングソルバは、車両ルーティング問題を解決するための有望なアプローチとして登場した。
このギャップに対処するため、我々は2つの異なる戦略、すなわちスケーリング深さとスケーリング幅を比較した系統的研究を行った。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:12:40 GMT)
SWE-Hub: A Unified Production System for Scalable, Executable Software Engineering Tasks [10.1] SWE-Hubは、データファクトリの抽象化を運用するエンドツーエンドシステムである。
環境の自動化、スケーラブルな合成、多様なタスク生成をコヒーレントなプロダクションスタックに統合する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:53:48 GMT)
Exact and Asymptotically Complete Robust Verifications of Neural Networks via Quantum Optimization [9.7] 本稿では、ディープニューラルネットワークの堅牢な検証のための2つの量子最適化モデルを提案する。
ベンチマークの実験では高い認証精度を示し、量子最適化がロバスト性を保証するための原則的プリミティブとして機能できることが示されている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:05:02 GMT)
What Do Visual Tokens Really Encode? Uncovering Sparsity and Redundancy in Multimodal Large Language Models [9.5] マルチモーダル大言語モデル(MLLM)は、言語モデルの埋め込み空間に視覚トークンを投影する。
本稿では,新しい探索ツールである $textLenEmbeds$ を特徴とする2次元解析フレームワークについて紹介する。
視覚トークンは一貫してシンク、デッド、生きたカテゴリに分けられる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:13:36 GMT)
Compile-once block encodings for masked similarity-transformed effective Hamiltonians [9.5] 電子構造演算子の類似性を符号化したオラクルを効果的に還元するためのコンパイルオンスモジュールパラメトリックパラメトリックであるComposERを提案する。
低ランク因子化はハミルトンと反エルミティアのジェネレータを圧縮し、ランク1の双線型および射影四角形のはしごに圧縮する。
固定軌道プールとキュービットレジスタは一度コンパイルされ、幾何、アクティブスペース(マスク)更新、トランケーションは再ダイオードされた単一キュービット回転によって吸収される。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 18:05:51 GMT)
High-order Knowledge Based Network Controllability Robustness Prediction: A Hypergraph Neural Network Approach [8.7] 本稿では,高次知識に基づく双対ハイパーグラフアテンションニューラルネットワークモデルを提案し,ロバストネス学習と可制御性曲線予測を実現する。
提案手法は,計算オーバーヘッドの少ない合成ネットワークと実世界のネットワークにおいて,優れた性能を実現する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:34:37 GMT)
HydroShear: Hydroelastic Shear Simulation for Tactile Sim-to-Real Reinforcement Learning [8.6] HydroShearは非ホロノミックな弾力性触覚シミュレータで、モデリングによって最先端の技術を推し進める。
提案手法は任意の水密測地から物理に基づく計算効率の高い力場を生成する。
この忠実さは、4つのタスクにまたがる強化学習ポリシーのゼロショット・シミュレートを可能にする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:59:33 GMT)
From Flat to Structural: Enhancing Automated Short Answer Grading with GraphRAG [8.4] 本稿では,参照資料を構造化知識グラフに整理するグラフ検索拡張生成(GraphRAG)フレームワークを提案する。
提案手法では,高忠実度グラフ構築のためのMicrosoft GraphRAGとHippoRAGニューロシンボリックアルゴリズムの2相パイプラインを用いる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:44:06 GMT)
Rubric-Guided Fine-tuning of SpeechLLMs for Multi-Aspect, Multi-Rater L2 Reading-Speech Assessment [8.3] 本稿では,多視点評価基準を明示的に符号化したルーリック誘導推論フレームワークを提案する。
我々は、解釈可能な信頼区間に対する共形キャリブレーションによって支持される不確実性校正回帰手法を開発する。
以上の結果から,ルーブリック誘導型不確実性校正推論は,信頼性と説明可能なSpeechLLMに基づく音声評価への原則的道筋を提供することが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:08:24 GMT)
Validation of Space Robotics in Underwater Environments via Disturbance Robustness Equivalency [8.3] 本研究では、水中環境を利用して微小重力力学を近似する宇宙ロボットの実験的検証フレームワークを提案する。
我々は、原宇宙ミッションと検証ミッションが同じ乱れ度ロバスト性を達成するような運動計画問題を定式化する。
実験衛星プラットフォームとCubeSatのどちらかの計画と制御戦略を高密度空間力学シミュレータで検証するために, 近ニュートラル浮力条件下で動作する水中ロボットを試作した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:42:24 GMT)
Are LLMs Reliable Code Reviewers? Systematic Overcorrection in Requirement Conformance Judgement [8.1] 我々は,大規模言語モデル(LLM)が自然言語要求にマッチするコードの体系的失敗を明らかにする。
より詳細なプロンプト設計、特に説明や修正提案を必要とするものは、より高い誤判定率をもたらす。
そこで本稿では,提案した修正を実効的証拠として扱う固定誘導検証フィルタを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:35:25 GMT)
SODA: Semantic-Oriented Distributional Alignment for Generative Recommendation [7.9] ジェネレーティブレコメンデーションは、コンパクトなトークン空間で操作することで、従来の検索とランクのパイプラインに代わるスケーラブルな代替手段として登場した。
既存の手法は主に個別のコードレベルの監督に依存しており、情報損失を招き、トークン化器と生成レコメンデータとの間の共同最適化を制限する。
本研究では,多層コードブック上の確率分布をソフトかつ情報豊富な表現として活用する分布レベル監視パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:18:28 GMT)
Test-Driven Agentic Framework for Reliable Robot Controller [7.9] ナビゲーションタスク用の低レベルロボットコントローラをデプロイするための,テスト駆動型エージェントフレームワークを提案する。
超音波センサを用いたロボットの画像を用いた2Dマップを作成したので,診断フィードバックを用いて生成したコントローラコードを反復的に洗練し,タスク成功を実現する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:26:31 GMT)
A Stable and General Quantum Fractional-Step Lattice Boltzmann Method for Incompressible Flows [7.8] 格子ボルツマン法(LBM)は様々な量子LBMの開発に影響を与えた。
既存のほとんどのアプローチでは、緩和時間を$=1で固定し、与えられたメッシュ解像度を1つのレイノルズ数でシミュレーションに精算する。
本研究は3次元非圧縮性熱流の量子LBMシミュレーションである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:16:45 GMT)
QQ: A Toolkit for Language Identifiers and Metadata [7.6] 統一言語メタデータ管理のための軽量PythonツールキットQwanQwaを紹介する。
QwanQwaは複数の言語リソースを単一のインターフェースに統合する。
言語識別子間の適切な正規化とマッピングを提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:29:45 GMT)
Jano: Adaptive Diffusion Generation with Early-stage Convergence Awareness [7.6] DiT(Diffusion Transformer)は、集中的なフルアテンション計算を必要とする。
私たちは、この洞察を効率的な地域認識生成に活用する、トレーニング不要のフレームワークであるJanoを紹介します。
Janoは、生成品質を維持しながら、相当な加速(平均2.0倍のスピードアップ、2.4倍)を達成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:35:01 GMT)
AI-IO: An Aerodynamics-Inspired Real-Time Inertial Odometry for Quadrotors [7.2] 慣性オドメトリー(IO)は、慣性測定単位(IMU)のみに依存するため、四重項応用において注目を集めている。
本研究では,慣性オドメトリー学習問題に対して,異なる視点からアプローチする。
ロータ速度測定を取り入れることで,速度予測精度を36.9%向上する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:17:09 GMT)
Trinity: A Scenario-Aware Recommendation Framework for Large-Scale Cold-Start Users [7.2] 効果的なレコメンデーションには、機能エンジニアリング、モデルアーキテクチャ、安定したモデル更新の相乗的な統合が必要です。
本稿では,この原理を具現化したフレームワークであるTrinityを提案する。Trinityは既存のシナリオから価値ある情報を抽出し,新たなシナリオにおける予測の有効性と精度を確保する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:58:33 GMT)
Hierarchical Classification for Improved Histopathology Image Analysis [7.0] HiClassは、組織像解析を改善するための階層的な分類フレームワークである。
HiClassは複数のインスタンス学習アプローチに基づいて構築されており、双方向機能統合を導入して拡張している。
4粒径,14粒径の胃生検データセットを用いたHiClassの性能評価を行った。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:01:04 GMT)
MobiFlow: Real-World Mobile Agent Benchmarking through Trajectory Fusion [7.0] MobiFlowは任意のサードパーティアプリケーションから引き出されたタスクに基づいて構築された評価フレームワークである。
ステートスペースを効果的に圧縮し、動的インタラクションをサポートし、現実世界のサードパーティアプリケーションシナリオとの整合性を向上できる。
AndroidWorldと比較すると、MobiFlowの評価結果は、人間の評価と高い整合性を示している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:30:33 GMT)
TENG-BC: Unified Time-Evolving Natural Gradient for Neural PDE Solvers with General Boundary Conditions [6.3] 本稿では,時間進化自然勾配に基づく高精度ニューラルネットワークPDE解法であるTENG-BCを紹介する。
各段階において、TENG-BCは、内部力学と境界条件を共同で適用する境界対応最適化を行う。
この定式化は自然な段階的な解釈を認め、微妙なペナルティチューニングなしで安定した時間進化を可能にする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:03:22 GMT)
Specializing Foundation Models via Mixture of Low-Rank Experts for Comprehensive Head CT Analysis [6.0] 複数の特殊な低ランクアダプタと教師なしソフトルーティングでLoRAを拡張したMixture of Low-Rank Experts (MoLRE) フレームワークを提案する。
2次元および3次元のアーキテクチャ、一般ドメイン、医療ドメイン、頭部CT固有の事前訓練、および7Mから431Mのモデルサイズにまたがる6つの最先端医療画像基盤モデルのMoLREのベンチマークを提示する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:32:38 GMT)
USE: Uncertainty Structure Estimation for Robust Semi-Supervised Learning [6.0] 半教師付き学習(SSL)における不確実性構造推定(USE)の導入
USEはラベル付きセットのプロキシモデルをトレーニングし、ラベルなしサンプルのエントロピースコアを計算する。
USEが一貫して精度を向上し、OOD汚染のレベルが変化していることは明らかである。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:31:46 GMT)
Learning to Attack: A Bandit Approach to Adversarial Context Poisoning [5.8] 我々は、連続武器の盗聴問題としてコンテキスト中毒を定式化するブラックボックス適応攻撃であるAdvBanditを紹介する。
攻撃者は被害者の内部パラメータ、報酬関数、勾配情報へのアクセスを必要としない。
攻撃回数において,サブリニア攻撃者の後悔と被害者の後悔に対する限界を低く抑えることを含む理論的保証を提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:34:06 GMT)
Interpretable Cross-Network Attention for Resting-State fMRI Representation Learning [5.8] BrainInterNetは、クロスアテンションによるマスク付き再構築に基づく、ネットワーク対応の自己管理フレームワークである。
我々は、マルチコアfMRIデータに基づいてBrainInterNetをトレーニングし、アルツハイマー病神経画像イニシアチブデータセットで評価する。
本手法はアルツハイマー病における脳のネットワーク相互作用の系統的変化を明らかにする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 19:15:52 GMT)
Aurchestra: Fine-Grained, Real-Time Soundscape Control on Resource-Constrained Hearables [5.7] Aurchestraは、リソース制約された聴取者に対して、きめ細かなリアルタイムサウンドスケープ制御を提供する最初のシステムである。
本システムには,(1)アクティブな音声クラスのみを探索する動的インタフェース,(2)リアルタイム・オンデバイスマルチ出力抽出ネットワークの2つの要素がある。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 00:50:00 GMT)
Dual-space posterior sampling for Bayesian inference in constrained inverse problems [5.7] 偏微分方程式によって制約される逆問題はしばしば、ノイズや不完全データ、あるいは固有の非特異性によって不等式化される。
本研究では,波動方程式などの厳密な物理的制約を,既存のサンプリング手法に適合する事前分布に翻訳する手法を開発した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 00:34:31 GMT)
PRISM: Exploring Heterogeneous Pretrained EEG Foundation Model Transfer to Clinical Differential Diagnosis [5.6] PRISMは2つの軸に沿ってアブレーションされたマスク付きオートエンコーダである。
狭義のEU/USコーパスを,多施設の南アジア臨床記録を付加した地理的に多様なプールと比較した。
PRISMはタスクの大部分でREVE(92データセット、6万時間以上)にマッチする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 19:50:28 GMT)
RelayCaching: Accelerating LLM Collaboration via Decoding KV Cache Reuse [5.6] RelayCachingはトレーニング不要な推論手法で、前のエージェントから復号フェーズKVキャッシュを直接再利用する。
RelayCachingは80%以上のKVキャッシュの再利用を実現し、TTFTを標準パイプラインと比較して最大4.7倍のコストで削減できることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:46:28 GMT)
The Alignment Flywheel: A Governance-Centric Hybrid MAS for Architecture-Agnostic Safety [5.4] 本稿では、アライメントフライホイールをガバナンス中心のハイブリッドMASアーキテクチャとして定式化する。
執行層は実行時に明確なリスクポリシーを適用し、ガバナンスMASは監査、不確実性駆動による検証、バージョン管理による改善を通じてOracleを監督します。
アーキテクチャはProposerとSafety Oracleの両方に関して実装に依存せず、実行時ゲーティング、監査、署名されたパッチ、ステージングロールアウトに必要な役割、アーティファクト、プロトコル、リリースセマンティクスを指定する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 00:48:06 GMT)
TAS-GNN: A Status-Aware Signed Graph Neural Network for Anomaly Detection in Bitcoin Trust Systems [5.4] 金融プラットフォームはウェブ・オブ・トラストの評判システムに大きく依存している。
TAS-GNNは、Bitcoin-Alphaのような機能分離されたネットワーク用に設計された新しいフレームワークである。
実験により、TAS-GNNは最先端のパフォーマンスを達成し、既存のGNNベースラインを著しく上回っていることが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:51:04 GMT)
DRIV-EX: Counterfactual Explanations for Driving LLMs [5.3] 大規模言語モデル (LLMs) は、自律運転における推論エンジンとしてますます使われている。
我々は,その意思決定プロセスについて,事実的説明を通じて検討することを提案する。
本稿では,連続埋め込みにおける勾配に基づく最適化手法であるDRIV-EXを紹介する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:12:51 GMT)
Efficient Long-Sequence Diffusion Modeling for Symbolic Music Generation [5.3] シンボリック・ミュージック・ジェネレーションは、階層的時間構造、長距離依存、きめ細かい局所的詳細を含む長いシーケンスを含む、困難なタスクである。
本研究では,効率的なグローバル構造構築と光局所改善を両立させるため,SMDIMという拡散戦略を提案する。
実験により、モデルが生成品質と計算効率の両方において、他の最先端アプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:54:02 GMT)
LOGIGEN: Logic-Driven Generation of Verifiable Agentic Tasks [4.7] 検証可能なトレーニングデータを合成するロジック駆動フレームワークである textbfLOGIGEN を紹介する。
2$-Benchでは、LOGIGEN-32B(RL)がtextbf79.5%の成功率を獲得し、ベースモデルを大幅に上回っている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:35:30 GMT)
LangGap: Diagnosing and Closing the Language Gap in Vision-Language-Action Models [4.5] VLA(Vision-Language-Action)モデルは標準ベンチマークで95%以上の成功を収めている。
現状のVLAモデルは言語命令をほとんど無視していることがわかった。
本稿では,4次元意味摂動法に基づくLangGapベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:53:33 GMT)
From Literature to Hypotheses: An AI Co-Scientist System for Biomarker-Guided Drug Combination Hypothesis Generation [4.3] CoDHyは、がん研究におけるバイオマーカー誘導薬物の組み合わせ仮説生成のための、対話的かつ人為的なループシステムである。
構造化バイオメディカルデータベースと非構造化文献証拠をタスク固有の知識グラフに統合する。
ユーザーは科学的コンテキストを設定し、中間結果を検査し、仮説を反復的に洗練することができる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:14:37 GMT)
DiagramBank: A Large-scale Dataset of Diagram Design Exemplars with Paper Metadata for Retrieval-Augmented Generation [4.2] 89,422の図からなる大規模データセットであるDiagramBankについて紹介する。
DiagramBankは私たちの自動キュレーションパイプラインを通じて開発され、数字と対応するテキスト内参照を抽出します。
我々はダイアグラムバンクをインデクシング可能な形式でリリースし、ティーザーフィギュアの模範条件による合成を実証するための検索拡張世代を提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:17:35 GMT)
QANTIS: A Hardware-Validated Quantum Platform for POMDP Planning and Multi-Target Data Association [4.1] 本稿では、量子信念更新(Grover振幅増幅とBIQAE)、FPC-QAOAによるQUBOベースのデータアソシエーション、および構成可能なエラー軽減を統合するモジュールプラットフォームであるQSを紹介する。
ハードウェア上では、タイガーの信念に適用される単一のグローバー反復は、ベイズの後部を保ちながら、0.179$から9.07$(5.1times$; ISA 18)の稀な観測確率を増幅する。
さらに、我々の知る限り、超伝導ハードウェア上で最初のクローズドループハイブリッド量子古典型Tiger POMDPを実証する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 19:13:44 GMT)
GeNeX: Genetic Network eXperts framework for addressing Validation Overfitting [3.7] モデル選択時の検証パフォーマンスへの過度な依存は、検証の過度な適合につながる可能性がある。
本稿では,モデル生成とアンサンブル構築の段階において,検証過適合を緩和するフレームワークであるGeNeXを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:26:05 GMT)
Toward Quantum-Optimized Flow Scheduling in Multi-Beam Digital Satellites [3.6] スケジューリング効率を向上させるハイブリッド量子古典フレームワークを提案する。
スループット最大化の目的と運用上の制約をコンパクトなQUBOに組み込む。
量子ハードウェア上でのソリューションの品質、ランタイム、ロバスト性を評価する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:21:38 GMT)
Towards Universal Khmer Text Recognition [3.5] Khmerは、複雑なスクリプトを特徴とする低リソース言語である。
各モダリティに対するモダリティ固有のトレーニングモデルは、モダリティ間移動学習を許さない。
多様なテキストモダリティを扱える普遍的なKhmerテキスト認識フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:23:09 GMT)
Towards Khmer Scene Document Layout Detection [3.5] 本研究は,Khmerシーンの文書レイアウト検出に関する総合的研究である。
我々は,(1)Khmerのシーンレイアウトに特化して,ロバストなトレーニングとベンチマークのデータセット,(2)リアルなシーン文書を合成してトレーニングデータをスケール可能なオープンソースドキュメント拡張ツール,(3)オブジェクト指向境界ボックス(OBB)を用いたYOLOアーキテクチャを用いたレイアウト検出ベースラインの3つの重要な要素からなる新しいフレームワークを寄贈する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:30:16 GMT)
LiTS: A Modular Framework for LLM Tree Search [3.5] LiTSは、木探索によるLLM推論のためのモジュール化されたPythonフレームワークである。
ツリー検索を3つの再利用可能なコンポーネントに分解する。
デコレータベースのレジストリにより、ドメインの専門家が新しいドメインに拡張できる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:54:37 GMT)
Heaviside Low-Rank Support Matrix Machine [3.4] 本稿では,新しいHaviside低ランクSMMモデルであるconvex-SMMを提案する。
理論上、Karush-Kuhnucker 点の解析は十分かつ必要な条件を厳密に証明する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:08:16 GMT)
From Goals to Aspects, Revisited: An NFR Pattern Language for Agentic AI Systems [3.3] エージェントAIシステムは、現在の実装ではモジュール化が不十分な多くの横断的関心事を示す。
4つのNFRカテゴリ(セキュリティ、信頼性、可観測性、コスト管理)にまたがる再利用可能なパターン12のパターン言語を提案する。
4つのパターンは、従来のAOP文献にないエージェント固有の横断的関心事に対処する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:18:38 GMT)
Hereditary Geometric Meta-RL: Nonlocal Generalization via Task Symmetries [3.2] 本研究は,タスク空間に基本システム固有の対称性によって誘導される「遺伝的幾何学」を付与する幾何学的視点を開発する。
タスク空間が基礎となるシステムの対称性から継承された場合、タスク空間は、その動作が線形化可能で、接続可能で、かつ、テスト時に効率的な学習と推論を可能にするコンパクトなプロパティを持つこれらの対称性のサブグループに埋め込まれることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 00:57:39 GMT)
SpectroFusion-ViT: A Lightweight Transformer for Speech Emotion Recognition Using Harmonic Mel-Chroma Fusion [3.1] 音声感情認識(SER)は、人間とコンピュータの相互作用、医療、教育、カスタマーサービスにおける応用の中心である。
本稿では,コンパクトなビジョントランスアーキテクチャであるEfficientViT-b0を利用した軽量SERフレームワークSpectroFusion-ViTを提案する。
提案手法は、SUBESCOで92.56%、BanglaSERで82.19%の精度を達成し、既存の最先端手法を超越している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:44:46 GMT)
A Typologically Grounded Evaluation Framework for Word Order and Morphology Sensitivity in Multilingual Masked LMs [2.9] 我々はmBERTとXLM-Rを英語、中国語、ドイツ語、スペイン語、ロシア語で評価した。
全スクランブルは全言語でゼロに近い単語レベルの再構築精度を駆動する。
トップ5ワードの精度は同じパターンを示しており、フルスクランブルの下では、ゴールドワードが5つの最上位の再構築に現れることはめったにない。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:13:34 GMT)
COMBAT: Conditional World Models for Behavioral Agent Training [2.7] 我々は、複雑な1v1格闘ゲーム『テッケン3』で訓練されたリアルタイムアクション制御世界モデルであるCOMBATを紹介する。
我々の研究は、拡散モデルがプレイヤーのアクションに反応する動的相手をうまくシミュレートできることを実証している。
シングルプレイヤー入力のみに基づいてモデルをトレーニングすることで、洗練されたエージェント動作の出現を観察する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 22:09:04 GMT)
Taking a Closer Look at Warnings Generated by PMD and SonarQube, their Rules and Compliance to Established Coding Standards [2.7] 静的コード分析ツールはソフトウェア開発において重要な役割を果たす。
コミュニティの最高のツールには、偽陽性と偽陰性が高いことが報告されている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:50:23 GMT)
EMPA: Evaluating Persona-Aligned Empathy as a Process [2.7] EMPAはプロセス指向のフレームワークであり、個別の応答よりも持続的な介入としてペルソナによるサポートを評価する。
実際の相互作用を、制御可能で心理的に根拠付けられたシナリオに蒸留する。
横方向のアライメント、累積的な影響、安定性によって、潜在心理学空間における軌跡をスコアする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:04:06 GMT)
Closing the Loop: Resource-aware Hybrid NAS Guided by Analytical and Hardware-Calibrated Quantum Cost Modeling [2.5] 実際のデバイス上での量子回路のトレーニングには数千の回路実行が必要であり、現在のNISQデバイスでは現実的ではない。
実バックエンドキャリブレーションデータを用いて,量子ハードウェア資源を推定する解析的量子コストモデルを提案する。
本稿では,ハードウェアを意識したハイブリッドニューラルネットワーク検索フレームワークHyb-HANASについて述べる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:34:23 GMT)
Keyframe-Guided Structured Rewards for Reinforcement Learning in Long-Horizon Laboratory Robotics [2.5] 実験室自動化における長い水平精度操作は、厳密な手続き論理を尊重するポリシーを必要とする。
既存のアプローチは、報酬の幅、多段階構造制約、ノイズや不完全なデモに苦しむ。
実演から固有のキネマティクス認識を自動的に抽出するKeyframe-Guided Reward Generation Frameworkを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:55:31 GMT)
How the Graph Construction Technique Shapes Performance in IoT Botnet Detection [2.3] 本研究は,グラフ構造化データセット構築手法の選択が,GNNモデルの分類性能に与える影響を評価する。
k-Nearest Neighbors, Mutual Nearest Neighbors, Shared Nearest Neighbor, Gabriel Graph, epsilon-radius Graphの5つの手法が評価された。
ガブリエルグラフの精度は97.56%、SNNの精度は78.56%である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:29:19 GMT)
The Disintegration of Free Speech [2.3] 本条は、第1条に基づくAIによるコミュニケーションの憲法的状況について考察する。
既存の法則の下では、AI生成コンテンツは保護されたスピーチである、と同社は主張する。
本条は、この教義の軌道は、憲法修正第1条をその民主的基盤から剥奪するリスクを負っていると結論付けている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:57:58 GMT)
Explainable Continuous-Time Mask Refinement with Local Self-Similarity Priors for Medical Image Segmentation [2.0] LSS-LTCNet: 連続時間ニューラルダイナミクスによる決定論的構造先行を相乗化するためのアンテホックな説明可能なフレームワークを提案する。
我々のアーキテクチャは、密集した照明不変のテクスチャ記述子を抽出するローカル自己相似性(LSS)機構を用いることで、従来のブラックボックスモデルから逸脱する。
我々は, LSS-LTCNetが最先端境界アライメントを実現し, ピークDiceスコア86.96%, 例外95%のHausdorff Distance(HD95)8.91ピクセルを確保した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:31:49 GMT)
TopoEdge: Topology-Grounded Agentic Framework for Edge Networking Code Generation and Repair [1.9] TopoEdgeは、SDN(Software-Defined Network)構成の生成と修復のためのフレームワークである。
TopoEdgeは、各ターゲットトポロジをルータレベルのグラフとして表現し、対照的に訓練されたグラフニューラルネットワーク(GNN)を使用してそれを埋め込む。
対象トポロジ、検索基準トポロジ、参照ドライバをトポロジ基底検索拡張生成コンテキスト(TopoRAG)に組み立てる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:36:48 GMT)
A Novel end-to-end Digital Health System Using Deep Learning-based ECG Analysis [1.9] AI-HEART(AI-HEART)は、長期心電図(ECG)の記録を管理し分析するためのクラウドベースの情報システムである。
システムは、複数日間の3段階のECGを取り込み、入力を正規化し、信号前処理を行い、ディープニューラルネットワークを使用して波のデライン化、ノイズ/品質検出、ビートレベルとリズムレベルの不整脈分類を行う。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:29:37 GMT)
Data-driven Synthesis of Magnetic Resonance Spectroscopy Data using a Variational Autoencoder [1.8] 本研究では,単ボクセル分光データのみに特化して訓練された可変オートエンコーダ(VAE)を用いて,生体内MRSデータを合成するためのデータ駆動フレームワークを提案する。
VAEは複素数値スペクトルの低次元潜在表現を学習し、潜在空間サンプリングと合成により新しいサンプルを生成することができる。
その結果,VOEは主成分パターンを正確に再構成し,生体内データと同じ特徴空間を占める合成スペクトルを生成することがわかった。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 16:52:16 GMT)
Analyzing Physical Adversarial Example Threats to Machine Learning in Election Systems [1.7] 我々は、米国の選挙を危険にさらすために、機械学習の投票者に対する敵対的な例を配置しようとする攻撃者を分析する。
まず、各候補者の当選確率と投票総数の観点から、選挙を覆すために印刷しなければならない敵のサンプル投票数を決定する確率的枠組みを導出する。
我々は,l_infinity-APGD,l2-APGD,l1-APGD,l0 PGD,l0 + l_infinity PGD,l0 + sigma-map PGDの6種類の対向攻撃を解析した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:49:30 GMT)
A short tour of operator learning theory: Convergence rates, statistical limits, and open questions [1.5] 本稿では,演算子学習,統計学習理論,近似理論の交点における最近の展開を概観する。
これは、ミニマックスパースペクティブを採用し、正則性以外の様々な概念を考慮し、サンプルサイズの観点からの基本的な性能限界を示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:36:40 GMT)
Leveraging Computerized Adaptive Testing for Cost-effective Evaluation of Large Language Models in Medical Benchmarking [1.5] 医療における大規模言語モデル(LLM)の急速な普及は、スケーラブルで心理的に健全な評価方法への緊急なニーズを生み出している。
項目応答理論(IRT)に基づくコンピュータ適応テスト(CAT)フレームワークの提案と検証を行う。
CAT由来の習熟度推定は, フルバンク推定とほぼ完全に相関していることを示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:45:08 GMT)
TAP-SLF: Parameter-Efficient Adaptation of Vision Foundation Models for Multi-Task Ultrasound Image Analysis [1.5] Task-Aware Prompting and Selective Layer Fine-Tuning (TAP-SLF) はマルチタスク超音波画像解析のための統合フレームワークである。
TAP-SLFは、タスク固有の先行情報を入力トークンシーケンスに組み込み、LoRAをエンコーダの選択した特定のトップ層に適用する。
The FMC_UIA 2026 Challenge test set, with the evaluations on the officially released training dataset using a 8:2 train-test split, show that task-aware prompting and selective layer tuning is effective strategy for efficient VFM adapt。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:21:07 GMT)
Constitutional Black-Box Monitoring for Scheming in LLM Agents [1.5] 我々は言語モデルを用いて不審な行為に対するエージェントの行動を調べる。
本研究では,外部観測可能な入力と出力のみを用いて,スケジューリングを検出する構成的ブラックボックスモニタについて検討する。
我々の設定では、より広範な最適化の結果と一致する単純なプロンプトスイープによって、パフォーマンスが急速に飽和していることが分かりました。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 22:31:32 GMT)
Direct low-field MRI super-resolution using undersampled k-space [1.4] アンサンプされた低磁場k空間から直接高磁場MRライクな画像を再構成するための新しいフレームワークを提案する。
提案手法では, アンダーサンプされたk空間の実および虚構成分を処理し, 欠落した周波数コンテンツを復元するk空間二重チャネルU-Netを用いる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:23:31 GMT)
ContextCov: Deriving and Enforcing Executable Constraints from Agent Instruction Files [1.3] 我々は、受動的エージェント命令をアクティブで実行可能なガードレールに変換するフレームワークであるContextCovを紹介する。
ContextCovは自然言語の制約を抽出し、3つのドメインにわたる強制チェックを合成する。
ContextCovが99.997%の妥当性を持つ46,000以上の実行可能なチェックを抽出した723のオープンソースリポジトリの評価。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:56:47 GMT)
CaptionFool: Universal Image Captioning Model Attacks [1.3] 本稿では,最新のトランスフォーマーベースキャプションモデルに対する新たな攻撃であるCaptionFoolを提案する。
本攻撃は攻撃内容を含む任意のキャプションの生成において94-96%の成功率を達成した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:57:23 GMT)
CIRCUS: Circuit Consensus under Uncertainty via Stability Ensembles [1.3] そこで本研究では,CIRCUSが閾値ローバストな「コア」回路を生成できることを示す。
Gemma-2-2BとLlama-3.2-1Bでは、厳密なコンセンサス回路はコンストラクタの結合よりも40倍小さい。
我々はさらに,合意を確定したノードが非合意制御と一致しない場合に,アクティベーションパッチの因果関係を検証した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:44:04 GMT)
ACES: Accent Subspaces for Coupling, Explanations, and Stress-Testing in Automatic Speech Recognition [1.3] 本稿ではアクセント識別サブ空間を抽出する表現中心監査ACESを紹介する。
アクセント情報は低次元のアーリー層部分空間に集中していることがわかった。
以上の結果から,アクセント関連の特徴は認識クリティカルな手がかりと深く絡み合っていることが示唆された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:34:27 GMT)
Decentralized Multi-Robot Obstacle Detection and Tracking in a Maritime Scenario [1.1] 本稿では,自律型表面容器と協調する複数のUAVを用いて,浮遊容器の検出と追跡を行う分散マルチロボットフレームワークを提案する。
それぞれのUAVは、ステレオ不均一で強化されたYOLOv8検出器を実行し、ターゲットごとのEKFトラックを不確実性を認識したデータアソシエーションで維持する。
情報駆動アロケータは、旅行作業における期待される不確実性低減と安全分離を取引することで、目標を割り当て、UAVホバリング視点を選択する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:49:32 GMT)
Energy-Efficient Information Representation in MNIST Classification Using Biologically Inspired Learning [1.1] 我々は、情報理論の概念を用いて、これまで開発された生物学的にインスパイアされた学習規則を分析した。
脳の構造的可塑性をエミュレートし、シナプスの本質的な数だけを保持する。
また、ネットワークアーキテクチャの事前最適化の必要性を排除し、適応性を高め、新しい記憶のために「空間」を保留する脳の能力を反映する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 10:38:57 GMT)
Personalities at Play: Probing Alignment in AI Teammates [1.1] 大型言語モデル (LLM) はツールではなく協力者としての役割を担っている。
本稿では,3段階評価フレームワークを用いたAIの人格アライメントについて検討する。
結果は、AIの性格は測定可能であるが、多層構造であり、文脈に依存していることを示唆している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:06:02 GMT)
Online Generation of Collision-Free Trajectories in Dynamic Environments [1.0] 状態列で表される任意の幾何経路を対応する運動可能軌道に変換するオンライン手法を提案する。
ユーザが指定した制御速度で離散化して低レベルロボットコントローラにストリームできるクインティック/クアティック・スプラインのシーケンスを生成する。
実際のロボットの実験では、提案手法が人間の存在を含む現実のシナリオで使用できることを示した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 18:04:50 GMT)
ROKA: Robust Knowledge Unlearning against Adversaries [0.9] データ操作を必要とせず、知識汚染の結果を生かして、セキュリティクリティカルな予測に対するモデルの精度を乱す、新たな非学習誘発攻撃モデル、すなわち間接的非学習攻撃を導入する。
我々の研究は、未学習における知識保存の理論的保証を初めて提供するものである。ビジョントランスフォーマー、マルチモーダルモデル、および大規模言語モデルなど、様々な大規模モデルに対する評価は、Rokaが保持されたデータの正確性を維持しつつ、効果的に目標を解き放つことを示している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:30:39 GMT)
Imperfect Graphs from Unitary Matrices -- I [0.8] 量子作用素の行列表現は計算的に完全であるが、しばしば量子回路内の情報フローの構造的トポロジーを曖昧にする。
本稿では、ユニタリ行列を有向グラフにマッピングすることで量子演算子を解析するための一般化グラフ理論フレームワークを提案する。
このフレームワークは、量子回路を離散力学系として見るための新しい視点を提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:21:08 GMT)
A Parameter-efficient Convolutional Approach for Weed Detection in Multispectral Aerial Imagery [0.8] 雑草分割のための効率的なモデルであるFCBNetを紹介する。
このアーキテクチャは、完全に凍結されたConvNeXtバックボーン、提案されている特徴補正ブロック(FCB)、軽量デコーダに基づいている。
FCBNetは、RGBとマルチスペクトルの両モードでWeedBananaCODとWeedMapのデータセットで評価される。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:49:16 GMT)
General linear correction method for DFT+X energy: application to U-M (M=Al, Ga, In) alloys under high pressure [0.7] DFT+Xアプローチにおいてモデルハミルトンにより導入された曖昧なエネルギー寄与を除去する一般線形補正法を提案する。
この方法は、DFT+Xファミリーの重要なメンバーであるDFT+Uのフレームワーク内で検証される。
その後、ウラン系二元系U-M(M=Al, Ga, In)合金の重要な核材料に適用される。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:08:41 GMT)
Low-entropy arrays of microwave-shielded molecules prepared by interaction blockade [0.7] 本稿では, 熱または退化ガスから単一分子を光学的ツイーザアレイや格子に決定的にロードすることを提案する。
本提案は, 運動基底状態において, 決定論的単一分子生成のための頑健なスキームを示す。
この方法は、貯水池分子数によって制限された数千のトラップに拡張することができ、大きな低エントロピー極性分子アレイへの扉を開くことができる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:14:21 GMT)
ReloQate: Transient Drift Detection and In-Situ Recalibration in Surface Code Quantum Error Correction [0.6] 表面符号の量子誤差補正で容易に利用できる過渡情報を利用して、論理誤差率(LER)をリアルタイムで予測する。
実ハードウェアから物理誤差率をサンプリングして予測モデルを推定し, 検出器火災率(DFR)をLERにマッピングする。
この結果から,DFRに基づく予測がLER予測の有効性を示すとともに,小さな符号距離に対する空間的に効率的かつタイムリーな緩和応答として再マッピングを行った。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 23:16:53 GMT)
Identifying and Characterising Response in Clinical Trials: Development and Validation of a Machine Learning Approach in Colorectal Cancer [0.5] 精密医療は、臨床結果を大幅に改善する個別の治療を提供することで、医療を変革することを約束する。
現在のアプローチは治療の成功の静的な測定に限られており、ほとんどの臨床試験で繰り返し見られる措置を無視している。
提案手法は,ヴァーチャルツインズ法に基づく条件付きモデリングと処理効果推定を併用する。
肝転移性大腸癌に対する Panitumumab の有用性を検討した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 18:00:26 GMT)
A Consistency-Centric Approach to Set-Based Optimization with Multiple Models of Unranked Fidelity [0.3] 現実世界のアプリケーションでは、モデル精度は先入観としてほとんど知られておらず、単一の最も正確なモデルが誤解を招く可能性があると仮定する。
本稿では,S-BOMM(Set-Based Optimization with Multiple Models)と呼ばれる,フレキシブルなセットベース最適化手法を提案する。
単一のベストソリューションに頼るのではなく、モデル間の一貫性を重視することで、このセットベースのアプローチは最適化問題に対する実用的な代替手段を提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 20:30:41 GMT)
Learning Nested Named Entity Recognition from Flat Annotations [0.2] モデルがフラットアノテーションだけでネスト構造を学習できるかどうかを検討する。
NERELは、29のエンティティタイプを持つロシアのベンチマークで、21%のエンティティがネストされている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 23:37:03 GMT)
Historian: Reducing Manual Validation in APR Benchmarking via Evidence-Based Assessment [0.2] 我々は,大規模言語モデルを利用して,歴史的に検証されたパッチの知識ベースに対して,複数参照比較を行うフレームワークであるHistorianを提案する。
アウト・ワン・ツールアウトの評価では、ヒストリアンは95.0%のカバレッジを88.4%の精度で達成し、手作業による検証を5%に削減した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:41:29 GMT)
Lissajous coherent states via projection [0.0] 我々は、等方性および異方性調和振動子のリッサホス図形に集中した定常コヒーレント状態を構築する。
定常状態が真のコヒーレントな状態であることを示し、それぞれの退化部分空間上の関連する恒等作用素を解くのに使うことができる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 19:16:33 GMT)
Why Not? Solver-Grounded Certificates for Explainable Mission Planning [0.0] 既存のアプローチは、非因果属性、不完全制約結合、およびソルバパス依存のリスクを負う。
すべての説明は最適化モデル自体から派生した証明書です。
200のオーダーと30の衛星のスケーラビリティ解析により、運用バッチの実際の抽出時間を確認する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:08:55 GMT)
Wave-Attractor-Tree: A Hierarchical Binary Tree Reduction Architecture for Efficient Sequence Modeling [0.0] 作業は階層的なバイナリツリーベースのリダクションを導入し、通常の自己アテンションを置き換える。
このモデルは、コンバージェンス速度と長距離構造上の依存関係の精度の両方において、標準トランスフォーマーを著しく上回っている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 21:17:27 GMT)
Unsupervised Discovery of Intermediate Phase Order in the Frustrated $J_1$-$J_2$ Heisenberg Model via Prometheus Framework [0.0] 本稿では,Prometheus変分オートエンコーダフレームワークを適用して,J_1$-$J$位相図を探索する。
構造因子 $S(,)$ と $S(,)$ を支配的順序パラメータとして同定する。
この研究は、フラストレーションのある量子システムに機械学習を適用するためのスケーラブルな経路を確立する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:36:00 GMT)
Theory of Code Space: Do Code Agents Understand Software Architecture? [0.0] Theory of Code Space (ToCS) は、コヒーレントなアーキテクチャの信念を構築し、維持し、更新する能力を評価するベンチマークである。
ToCSはモジュール依存の上に構造化された信念状態を構築するためにエージェントを必要とする。
事前アーキテクチャ制約発見(Preliminary Architectural Constraint Discovery)は、コード固有の評価である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:40:17 GMT)
The Synthetic Web: Adversarially-Curated Mini-Internets for Diagnosing Epistemic Weaknesses of Language Agents [0.0] 言語エージェントは、様々なソースから情報を検索し、閲覧し、合成するWeb対応システムとしてますます機能する。
これらの情報源は信頼できない、あるいは敵対的な内容を含むことができ、敵のランク付けに対するエージェントの堅牢性はいまだに理解されていない。
提案するSynthetic Web Benchmarkは, 何千ものハイパーリンク記事と, 信頼性と事実性に関する基礎的なラベルから構成される手続き的に生成された環境である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 20:27:44 GMT)
The On-Chain and Off-Chain Mechanisms of DAO-to-DAO Voting [0.0] 投票は、分散自治組織が決定に達するための主要なメカニズムである。
本稿では,ブロックチェーン上のメタゴバンスを識別する手法を提案する。
我々は,61と72のメタオーバナンスを有するメタオーバナンスネットワークを作成した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:30:27 GMT)
Self-Correction Inside the Model: Leveraging Layer Attention to Mitigate Hallucinations in Large Vision Language Models [0.0] 内部自己補正機構は、生成中に隠れた状態を直接操作する。
LLaVA1.5-7BとQwen2.5-VL-7Bの0.2Mと0.1Mの追加パラメータの導入とトレーニングにより、複数の幻覚ベンチマークの視覚的グラウンド化が一貫して改善される。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 03:33:12 GMT)
Security Is Not Enough: Privacy in Encryption Regulation and Lawful-Surveillance Protocols [0.0] この記事では、政府による暗号化されたデータへの例外的なアクセスのリスクを、セキュリティが完全に把握するには不十分である、と論じる。
政策の評価と法的な監視プロトコルの研究を導くためにも、より豊かな理解が必要である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 23:41:22 GMT)
Reward-Modulated Local Learning in Spiking Encoders: Controlled Benchmarks with STDP and Hybrid Rate Readouts [0.0] 我々はSTDPにインスパイアされた競合プロキシと,同じスパイク集団エンコーダ上に構築された実用的なハイブリッドベンチマークを評価する。
プロキシは、3要素遅延報酬変調を備えた統合およびファイアE/I回路モデルによって動機付けられる。
スクラルディジットでは、固定シード評価では、古典的なピクセルベースラインが98.06から98.22%の精度で、一方、局所的なスパイクベースのモデルは87.17 +/- 3.74%に達する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 15:34:23 GMT)
Retrodictive Forecasting: A Proof-of-Concept for Exploiting Temporal Asymmetry in Time Series Prediction [0.0] 本稿では時系列の予測パラダイムを提案する。
過去から未来を予測する代わりに、観測された現在を最もよく説明する未来を特定する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:07:35 GMT)
ResGene-T: A Tensor-Based Residual Network Approach for Genomic Prediction [0.0] 本稿では,遺伝子型と表現型を関連づけた遺伝的予測(GP)のための新しいディープラーニングモデルを提案する。
ジェノタイプをジェノタイプ-フェノタイプ分類の2Dイメージとして表現した初期の研究に触発されて、このアイデアを回帰タスクであるGPに拡張する。
私たちは基盤となるアーキテクチャとしてResNet-18を使用し、このモデルをResGene-2Dと呼びます。
そこで本研究では,ResNet-18アーキテクチャに2Dイメージをテンソルに変換する新たなアイデアを提案し,これをResGene-Tと呼ぶ。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:43:31 GMT)
Plasmon manipulation by exchange magnetic field in two-dimensional spin-orbit coupled electronic systems: A higher-order relativistic k.p study [0.0] 2次元電子系におけるプラズモン励起を記述するために高次相対論的k.pモデルが開発された。
このモデルは非ラシュバスピンモメンタムロックを可能にし、交換場と電子の実際のスピンとの直接結合を可能にする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 14:13:55 GMT)
Planning Method for Skill-Based Control of Robots Using a PLC as Skill Trigger [0.0] 既存のソリューションは、動作シーケンスの最適化を無視し、実行の非効率をもたらす。
本研究は,動作シーケンス最適化を統合することで,スキルベースのロボットプログラミングを向上する計画手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:14:25 GMT)
Physics-Aware Learnability: From Set-Theoretic Independence to Operational Constraints [0.0] 本稿では、明示的なアクセスモデルに対する学習可能性を定義する物理認識学習性について紹介する。
有限符号や量子モデルの場合、PLの実現性は線形あるいは半定値となる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 02:34:09 GMT)
Nonclassical Many-Body Superradiant States with Interparticle and Spin-Momentum Entanglement [0.0] 本稿では,集合散逸ダイナミクスのみを用いて定常超放射能を実現するクロスキャビティシステムを提案する。
我々は,システムのジャンプ演算子の強い対称性を利用した,精密なマスター方程式シミュレーション手法を開発した。
また, 2つのキャビティ出力の偏差測定により, 粒子・粒子の絡み合いが著しい状態になることを示した。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:51:45 GMT)
Multiple Inputs and Mixwd data for Alzheimer's Disease Classification Based on 3D Vision Transformer [0.0] 本研究では,Multiple Inputs and Mixed Data 3D Vision Transformer (MIMD-3DVT)と呼ばれる新しい手法を提案する。
この方法は、連続してスライス処理を行い、特徴次元と空間情報をキャプチャし、複数の3次元ROI画像データ入力を融合し、人口統計学的要因、認知的評価、脳画像からの混合データを統合する。
正常認知とアルツハイマー病の鑑別において,MIMD-3DVTの精度は97.14%であった。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 08:48:31 GMT)
Multi-Agent Reinforcement Learning for Dynamic Pricing: Balancing Profitability,Stability and Fairness [0.0] 競合条件下での動的価格最適化のためのマルチエージェント強化学習(MARL)手法の体系的実証評価を行った。
我々は、これらのアルゴリズムを、MARL文学において広く使われている独立学習者であるIDDPGベースラインと比較した。
本結果からMAPPOは,競争価格最適化のための安定かつ再現可能なアプローチとして,分散度の低い平均リターンを一貫して達成できることが示唆された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 05:05:39 GMT)
Machine Learning Grade Prediction Using Students' Grades and Demographics [0.0] 本研究では、パス/フェイル結果と連続的なグレードを同時に予測する統合機械学習フレームワークを導入する。
中学生4424人の学歴データと人口統計データを用いて、分類モデルは最大96%の精度を達成した。
その結果,リスクのある学生の早期・データ駆動型識別の可能性が確認された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 11:56:39 GMT)
Instantons In A Symmetric Quartic Potential [0.0] 二重井戸ポテンシャルの半古典的解析を4つの縮退ミニマを備えたクォート系に拡張する。
我々は,ミニマ間のトンネルを媒介する縦,横,斜めのインスタントン配置を同定した。
離散的な$D_4$対称性が連続な$O(2)$回転対称性への「融解」遷移を行う臨界結合状態が見つかる。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 13:44:21 GMT)
How AI Systems Think About Education: Analyzing Latent Preference Patterns in Large Language Models [0.0] 本稿では,大規模言語モデルにおける教育的アライメントの最初の体系的測定について述べる。
8つの教育理論次元にわたる48項目からなるデルフィ価楽器を用いて、GPT-5.1は高いコヒーレントな嗜好パターンを示すことが明らかとなった。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 12:49:48 GMT)
Genuine certifiable randomness from a black-box [0.0] ブラックボックス設定における真正のランダム性証明を示す。
ランダムなシードを使わずに、単一粒子状態の測定のみを用いてランダムな数値を確実に生成する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:22:52 GMT)
Generalized Bopp shift, Darboux Canonicalization, and the Kinematical Inequivalence of NCQM and QM [0.0] 2次元非可換量子力学は、しばしば表現された位置と運動量作用素の線型変換によって定式化される。
数理対称性群と既約ユニタリ表現のレベルで、そのような構成の表現論的意味を明らかにする。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 07:49:53 GMT)
From Stochastic Answers to Verifiable Reasoning: Interpretable Decision-Making with LLM-Generated Code [0.0] 大規模言語モデル(LLM)は、高い意思決定にますます使われている。
ブラックボックスモデルはそれらの推論を曖昧にし、最近のLCMベースのルールシステムはサンプル単位の評価に依存している。
我々は,LLMをインスタンスごとの評価器ではなくコードジェネレータとして再フレーミングすることを提案する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 00:27:29 GMT)
Efficient Polynomial-Scaled Determination of Algebraic Entanglement Entropy Between Collective Degrees of Freedom [0.0] 本研究では, 粒子間絡み合いと粒子間絡み合いをサポートする物理系について検討する。
2つの粒子の自由度の間の代数的絡み合いのエントロピーを計算するための簡単な手法を導出する。
これらの系における代数的絡み合いエントロピーと、粒子の自由度を記述するリー群の既約表現との関連性を示す。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 04:51:51 GMT)
Dynamic Spatio-Temporal Graph Neural Network for Early Detection of Pornography Addiction in Adolescents Based on Electroencephalogram Signals [0.0] 本研究では,位相ラグ指数(PLI)に基づくグラフ注意ネットワーク(GAT)を統合した動的時空間グラフニューラルネットワーク(DST-GNN)を提案する。
データセットは、14人の青年(7人は中毒、7人は健康)と、9つの実験条件で19チャンネルの脳波で構成されている。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:04:39 GMT)
Collective radiance in degenerate quantum matter: interplay of exchange statistics and spatial confinement [0.0] ボソニック・エンハンスメントとパウリ・ブロッキングが超ラディアントおよび亜ラディアント・スケーリングをいかにブロックするかを考察する。
この分析は、運動力学と内部力学を結合した量子退化原子系における集合放出のベンチマークを提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 18:58:14 GMT)
BornoViT: A Novel Efficient Vision Transformer for Bengali Handwritten Basic Characters Classification [0.0] ベンガル語手書きの基本文字と数字を効果的に分類する新しい,効率的かつ軽量な視覚変換器モデルを提案する。
提案手法は,従来のDCNNアーキテクチャと比較して,より単純化された方法でディープ畳み込みニューラルネットワーク(DCNN)を利用する。
パラメータがわずか0.65万、モデルサイズが0.62MB、0.16GFLOPsであるBornoViTは、現在の最先端モデルよりも大幅に軽量である。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:59:36 GMT)
Bi-cLSTM: Residual-Corrected Bidirectional LSTM for Aero-Engine RUL Estimation [0.0] 頑健なRUL推定のための双方向残差補正LSTM(Bi-cLSTM)モデルを提案する。
提案アーキテクチャは、双方向時間モデルと適応的残差補正機構を組み合わせることで、反復的に配列表現を洗練させる。
NASA C-MAPSSデータセットの4つのサブセットの大規模な実験は、提案されたBi-cLSTMがLSTMベースのベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 17:44:06 GMT)
Axiomatic Foundation of Quantum-Inspired Distance Metrics [0.0] 我々は、射影ヒルベルト空間上の量子インスピレーションされた距離測定のための包括的公理的フレームワークを開発する。
任意の許容距離が状態重なりにのみ依存していることを示し、標準測地距離としてフビニ・スタディ計量の特異性を確立する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:48:03 GMT)
Agent-Based User-Adaptive Filtering for Categorized Harassing Communication [0.0] オンラインソーシャルネットワークにおける分類されたハラスメント通信のパーソナライズされたフィルタリングのためのエージェントベースのフレームワークを提案する。
均一なフィルタリングルールを適用するグローバルなモデレーションシステムとは異なり、我々のアプローチは適応的なフィルタリングエージェントを通して、ユーザ固有の許容レベルと嗜好をモデル化する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:52:48 GMT)
AI Runtime Infrastructure [0.0] AI Infrastructureは、モデル上およびアプリケーション下で動作する、異なる実行時レイヤです。
モデルレベルの最適化や受動的ロギングシステムとは異なり、ランタイムインフラストラクチャは、実行自体を最適化サーフェスとして扱う。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:27:25 GMT)
A Robust Framework for Secure Cardiovascular Risk Prediction: An Architectural Case Study of Differentially Private Federated Learning [0.0] FedCVR Learningは、異種臨床ネットワークに適用されるプライバシー保護フレームワークである。
我々は,サーバサイド適応最適化の運用上のトレードオフを,ユーティリティ優先の差分プライバシーの下で定量化する。
以上の結果から,サーバ側の適応性は,現実的なプライバシ予算の下で臨床ユーティリティを回復するための構造的前提条件であることが確認された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 09:36:38 GMT)
A Polynomial-Time Axiomatic Alternative to SHAP for Feature Attribution [0.0] 我々は,XAI-TUゲームの一クラスを定式化することにより,協調ゲーム理論のレンズを通して特徴属性を研究する。
本稿では,2時間の閉形式ルールを組み合わせることで,低コストな帰属規則ESENSC_rev2を提案する。
実験により、ESENSC_rev2は正確なSHAPを近似し、スケーラビリティを大幅に向上することが示された。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 06:30:35 GMT)
A Gauge Theory of Superposition: Toward a Sheaf-Theoretic Atlas of Neural Representations [0.0] 本研究では,大言語モデル(LLM)における重ね合わせの枠組みを開発し,局所意味チャートの層理論的アトラスに置き換える。
コンテキストは階層化されたコンテキスト複合体にクラスタ化され、各チャートは局所的な特徴空間と局所的な情報幾何学的計量を持つ。
これにより、フィッシャー重み付き干渉エネルギーと3つの測定可能な障害物が大域的解釈可能性に結びつく。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 22:05:14 GMT)
A Data-Driven Analysis for Engineering Conferences: The Institute of Industrial and Systems Engineering (IISE) Annual Conference Proceedings (2002-2005) [0.0] 本稿では,2002年から2025年までのIISE手順の計算解析について述べる。
我々は、テーマの進化を、支配的、新興、そして後退する研究トピックを特定するためにマッピングする。
この発見は分野の知的資産を照らし、ISEの将来を導くためのデータインフォームドマップを提供する。
論文参考訳(メタデータ) (Sat, 28 Feb 2026 01:10:46 GMT)