Global Commander and Local Operative: A Dual-Agent Framework for Scene Navigation [96.9] 視覚と言語 シーンナビゲーションは、人間のAIを具現化する基本的な能力である。
DACoは,グローバルな議論を現地の基盤から切り離す,計画的な非結合型アーキテクチャである。
グローバルな推論を局所的な行動から遠ざけることで、DACoは認知的過負荷を軽減し、長期的安定性を向上させる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:19:55 GMT)
From Few-Shot to Zero-Shot: Towards Generalist Graph Anomaly Detection [89.5] ARCは、文脈内学習を利用した数発のGAD法であり、推論時にわずかにラベル付き正規サンプルを必要とする。
ARCとARC_zeroは、異常を効果的に検出し、強力な一般化能力を示し、少数ショットおよびゼロショット設定下で効率的に実行する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:59:00 GMT)
Open-Vocabulary Domain Generalization in Urban-Scene Segmentation [83.2] セマンティックドメインのドメイン一般化(DG-SS)は、セグメント化モデルが目に見えない環境で堅牢に動作できるようにすることを目的としている。
VLM(Vision-Language Models)の最近の進歩は、モデルがより広い範囲の概念を認識できるようにすることにより、OV-SS(Open-Vocabulary Semantic)が進歩している。
しかし、これらのモデルはドメインシフトに敏感であり、目に見えない環境にデプロイされた場合、堅牢性を維持するのに苦労する。
状態空間駆動型テキスト画像相関改善機構であるS2-Corrを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:32:27 GMT)
RadioGen3D: 3D Radio Map Generation via Adversarial Learning on Large-Scale Synthetic Data [62.6] 将来の6Gおよび低高度ネットワークにおける効率的な無線資源管理には,無線地図が不可欠である。
ディープ・ラーニング(DL)技術は、無線地図推定における従来のレイトレーシングに代わる効果的な代替手段として登場した。
提案するRadioGen3Dフレームワークは,本質的な3次元信号伝搬特性とアンテナ偏光効果を捉える。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 07:50:05 GMT)
AINet: Anchor Instances Learning for Regional Heterogeneity in Whole Slide Image [61.5] 本稿では,その地域(地域)に代表されるインスタンスのコンパクトなサブセットであるアンカーインスタンス(AI)の概念を導入し,バッグ(グローバル)レベルで識別する。
これらのAIは、地域間の相互作用をガイドする意味的な参照として機能し、地域多様性を維持しながら非差別的なパターンを修正する。
我々は、単純な予測器を使用し、FLOPやパラメータを著しく少なくした最先端の手法を超越した、簡潔で効果的なフレームワークであるAINetを開発した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:36:27 GMT)
Robust and Efficient Tool Orchestration via Layered Execution Structures with Reflective Correction [55.1] 私たちは、高レベルのツール依存関係をキャプチャする階層化された実行構造を学ぶために、ツールオーケストレーションをモデル化します。
本稿では,局所的にエラーを検出し,修正するスキーマ対応反射補正機構を提案する。
この設計では、エラーを個々のツールコールに限定し、実行軌跡全体の再計画を避ける。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 22:20:01 GMT)
HeRO: Hierarchical 3D Semantic Representation for Pose-aware Object Manipulation [54.3] HeROは、階層的意味論を通して幾何学と意味論を結合する拡散ベースのポリシーである。
様々なテストにおいて、HeROは新しい最先端技術を確立し、Place Dual Shoesの成功率を12.3%改善し、6つの挑戦的なポーズ対応タスクで平均6.5%向上した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:29:10 GMT)
Optimizing ID Consistency in Multimodal Large Models: Facial Restoration via Alignment, Entanglement, and Disentanglement [54.2] 大規模モデルのマルチモーダル編集は、様々なタスクにまたがる強力な編集機能を示している。
現在の顔認証保存法は、顔認証と編集済み要素IPの整合性回復に苦慮している。
そこで我々は,頑健なアイデンティティ特異的顔復元のためのアライメント・ディスタングルメント・アンタングルメント・フレームワークであるEditedIDを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:24:42 GMT)
When World Models Dream Wrong: Physical-Conditioned Adversarial Attacks against World Models [54.1] 本稿では,物理条件を乱す最初のホワイトボックス世界モデルアタックであるPhysCond-WMA(PhysCond-WMA)を提案する。
PhysCond-WMAは知覚の忠実さを維持しながら意味、論理、決定レベルの歪みを引き起こす。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 07:22:37 GMT)
Modularity is the Bedrock of Natural and Artificial Intelligence [51.6] モジュラリティは、効率的な学習と強力な一般化能力をサポートするために重要であることが示されている。
ナチュラルインテリジェンスにおけるその役割と、さまざまな異なるように見えるAIサブフィールドでのメリットが証明されているにもかかわらず、モジュラリティはメインストリームのAI研究において比較的過小評価されている。
特に、モジュラリティがもたらす計算上の優位性や、それがいくつかのAI研究領域にまたがるソリューションとして現れる方法、そしてモジュラリティが、自然と人工知能のギャップを埋めるのにどのように役立つかを検討する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:47:09 GMT)
RoboCurate: Harnessing Diversity with Action-Verified Neural Trajectory for Robot Learning [47.3] 本稿では,アノテートされた動作の質を評価し,フィルタする新しい合成ロボットデータ生成フレームワークであるRoboCurateを紹介する。
具体的には、RoboCurateはシミュレータで予測されたアクションをリプレイし、動作の一貫性を測定してアクション品質を評価する。
我々は,RoboCurateが生成したデータに対して,実データのみを使用する場合と比較して,成功率を大幅に向上することを示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 07:33:24 GMT)
LaS-Comp: Zero-shot 3D Completion with Latent-Spatial Consistency [46.9] LaS-Compは、ゼロショットとカテゴリに依存しない3次元形状補完のアプローチである。
私たちのフレームワークはトレーニングフリーで、異なる3Dファウンデーションモデルと互換性があります。
実世界と合成データを多様かつ困難な部分パターンで組み合わせた総合ベンチマークであるOmni-Compを紹介する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 06:55:28 GMT)
GraphThinker: Reinforcing Video Reasoning with Event Graph Thinking [45.9] ビデオ推論では、ビデオ内のイベント間の因果関係を理解する必要がある。
既存のマルチモーダル大言語モデル(MLLM)は、しばしば高密度キャプションやビデオ要約を通してイベント関係を推測する。
構造化イベントレベルシーングラフを構成する強化微調整法であるGraphThinkerを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:46:12 GMT)
MIRROR: Multimodal Iterative Reasoning via Reflection on Visual Regions [42.0] 視覚領域の反射によるマルチモーダル反復推論のためのMIRRORフレームワークを提案する。
ビジュアルリフレクションをコアメカニズムとして埋め込むことで、MIRRORはドラフト、批評、地域ベースの検証、リビジョンを含むクローズドループプロセスとして定式化される。
一般的な視覚言語ベンチマークと代表的な視覚言語推論ベンチマークの両方の実験は、MIRRORが正確性を改善し、視覚幻覚を減らすことを示している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 07:56:59 GMT)
DeepInnovator: Triggering the Innovative Capabilities of LLMs [41.6] DeepInnovatorは、大規模言語モデル(LLM)の革新的な機能を引き出すために設計されたトレーニングフレームワークである。
我々は、未ラベルの学術文献の膨大なコーパスから構造化された研究知識を抽出するために、自動データ抽出パイプラインを構築した。
本稿では,研究アイデアを連続的に予測し,評価し,改良する反復的なプロセスとして,研究アイデアの生成をモデル化する,次世代のアイデア予測のトレーニングパラダイムを紹介する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 18:07:18 GMT)
Powering Up Zeroth-Order Training via Subspace Gradient Orthogonalization [41.0] 2つの相補的原理を統一することにより、ZO最適化を大幅に改善できることを示す。
我々は、ZO設定において、自然解釈を低ランクのミューオンとして認める新しい方法、ZO-ムオンをインスタンス化する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:07:11 GMT)
Stochastic Gradient Variational Inference with Price's Gradient Estimator from Bures-Wasserstein to Parameter Space [39.8] ワッサーシュタイン VI (WVI) とブラックボックス VI (BBVI) は測度空間において勾配降下を行う。
We find that WVI's superiority stems from the specific gradient estimator。
我々は,プライス勾配の利用が性能改善の主な原因であることを実証した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:52:53 GMT)
Driving with A Thousand Faces: A Benchmark for Closed-Loop Personalized End-to-End Autonomous Driving [39.3] Person2Driveは、包括的なパーソナライズされたE2E-ADプラットフォームとベンチマークである。
オープンソースのフレキシブルなデータ収集システムで、現実的なシナリオをシミュレートして、パーソナライズされた運転データセットを生成する。
私たちのデータセットとコードは、受け入れられてからリリースされます。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:42:32 GMT)
Modelling quantum measurements without superposition [39.1] 動作上古典的なデバイスのみを用いて量子測定の集合をモデル化できるかどうかを検討する。
このことから古典的測度モデルを提案することができ、これは可換測度よりも強いことを示す。
我々の研究は、量子測定装置の資源としての重ね合わせに光を当てている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:44:06 GMT)
Think with Grounding: Curriculum Reinforced Reasoning with Video Grounding for Long Video Understanding [38.9] Video-TwGは、新しいThink-with-Groundingパラダイムを採用したカリキュラム強化フレームワークである。
Video-TwGは、複雑な補助モジュールや注釈付き推論トレースに頼ることなく、簡単にエンドツーエンドでトレーニングすることができる。
提案アルゴリズムは, 微粒な接地報酬, 自己確認擬似報酬, 精度保証機構を特徴とする。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 03:16:23 GMT)
ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI [38.7] ForesightSafety Bench"は、最先端AIモデルの安全性評価フレームワークである。
このベンチマークでは、数万の構造化されたリスクデータポイントと評価結果が蓄積されている。
このベンチマークに基づいて,20以上の主流大規模モデルの系統的評価と詳細な解析を行う。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 02:30:08 GMT)
When Do LLM Preferences Predict Downstream Behavior? [37.8] 我々は、5つのフロンティアLSMにおいて、記述された嗜好が下流行動を予測するかどうかを測定する。
5つのモデルがすべて、好みに沿った寄付のアドバイスを与えているのが分かります。
ここで観察するすべての選好関連行動は、選好に作用する指示なしで現れる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 22:24:51 GMT)
From Human-Level AI Tales to AI Leveling Human Scales [36.6] 我々は、各レベルが世界全体の成功の確率を表すべき様々な能力のための、一連のマルチレベル尺度の上に構築する。
公開された人体テストデータをコンパイルすることで、各能力のスケールを調整します。
グループスライシングとポストストラトフィケーションを用いて,異なるマッピングの品質を評価する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:27:20 GMT)
IRIS-SLAM: Unified Geo-Instance Representations for Robust Semantic Localization and Mapping [36.5] IRIS-SLAMは、深いセマンティック理解と堅牢なループ閉鎖機能を備えた新しいセマンティックSLAMシステムである。
本手法は,幾何学的再構成と開語彙マッピングのギャップを埋めるために,視点に依存しないセマンティックアンカーを効果的に活用する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 03:57:01 GMT)
A Data-Driven Method to Map the Functional Organisation of Human Brain White Matter [34.9] 脳の白い物質は、長距離神経通信をサポートする軸索束にまとめられる。
我々は、ホワイトマタートラックがサポートする動的結合をモデル化するために、dMRIと機能MRIを統合したデータ駆動フレームワークを開発した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:20:41 GMT)
WiCompass: Oracle-driven Data Scaling for mmWave Human Pose Estimation [33.2] ミリ波ヒューマンポース推定はプライバシーを約束するが、流通シフト下での一般化に苦しむ。
我々は、カバレッジを意識したデータ収集フレームワークWiを紹介する。
実験では、Wiは一致した予算でのOOD精度を一貫して改善し、従来の収集戦略よりも優れたスケーリング挙動を示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 05:50:28 GMT)
Federated Reasoning Distillation Framework with Model Learnability-Aware Data Allocation [33.2] モデル学習可能性を考慮したデータアロケーションを備えた,連合型推論蒸留フレームワークLaDaを提案する。
LaDaは既存のコラボレーションフレームワーク用のプラグインモジュールとして動作し、モデルの学習可能性ギャップに基づいた知識伝達を適用する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:18:39 GMT)
Insertion Based Sequence Generation with Learnable Order Dynamics [31.9] 本研究では, 数値シミュレーションを必要とせずに, 目標順序のダイナミックスとジェネレータの連成訓練が可能であることを示す。
生成的挿入モデルとして,マスクトークンの挿入と充填によって生成される可変長マスク拡散モデルを用いる。
学習順序のダイナミクスは、一様秩序のダイナミクスと比較して、有効な分子の数が増加し、品質が向上することがわかった。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 02:53:55 GMT)
L2G-Net: Local to Global Spectral Graph Neural Networks via Cauchy Factorizations [31.2] グラフフーリエ変換(GFT)の分解に基づく新しいスペクトルグラフニューラルネットワーク(GNN)を提案する。
我々は,L2G-Netが既存のスペクトル技術より優れており,学習可能なパラメータの桁数が桁違いである現状と競合していることを示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 13:53:36 GMT)
BiMotion: B-spline Motion for Text-guided Dynamic 3D Character Generation [31.1] テキストガイドによる動的3Dキャラクタ生成は急速に進歩しているが、リッチなテキスト記述を忠実に反映した高品質なモーションを生成することは依然として困難である。
既存の手法では、固定長の時間入力と、リッチな動きのセマンティクスを捉えるのに失敗する離散的なフレームワイズ表現により、限られたサブアクションや非コヒーレントな動きを生成する傾向がある。
連続的な微分可能なB-スプライン曲線で動きを表現することでこれらの制約に対処し、基礎となる生成モデルの能力を変更することなくより効果的な動き生成を可能にする。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:40:37 GMT)
ST-EVO: Towards Generative Spatio-Temporal Evolution of Multi-Agent Communication Topologies [30.5] 本稿では,コンパクトで強力なフローマッチングベーススケジューリングを用いた対話型通信スケジューリングを支援するST-EVOを提案する。
9つのベンチマークの実験では、ST-EVOの最先端性能が実証され、約5%-25%の精度向上が達成された。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:26:47 GMT)
The science and practice of proportionality in AI risk evaluations [28.3] 欧州連合(EU)人工知能法(EU)は、この緊張を拘束力のあるリスクベースの枠組みの形でナビゲートする、世界で最初の規制の試みである。
比例律の原則は、EU法の下での拘束要件であり、規制当局が彼らの意図した目的に対してその行動を調整する必要がある。
AIリスクに対するモデル評価への比例性の適用は、具体的な評価慣行の中でそのようなキャリブレーションを運用する科学的手法を開発する機会を開く。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:53:29 GMT)
Temporal Action Representation Learning for Tactical Resource Control and Subsequent Maneuver Generation [27.8] TARTは、戦術的資源制御とその後の操作生成のためのテンポラルアクション表現学習フレームワークである。
資源配置が重要となる2つの領域において,TARTを評価する。 (i) 個別行動の限られた予算で機動性が向上する迷路ナビゲーションタスク, (ii) F-16エージェントが飛行操作と協調して兵器や防衛システムを運用する高忠実な空戦シミュレータ。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:31:55 GMT)
Synthesizing Multimodal Geometry Datasets from Scratch and Enabling Visual Alignment via Plotting Code [27.3] マルチモーダル幾何推論は、視覚図を共同で理解し、構造化されたシンボル推論を実行するモデルを必要とする。
我々は,スクラッチから複雑なマルチモーダル幾何問題に対するパイプラインを提案し,問題生成をシンボリックシード構造に分離するtextbfGeoCode というデータセットを構築した。
さらに、コード予測を明示的なアライメント目標として導入し、視覚的理解を教師付き構造化予測タスクに変換する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 07:53:48 GMT)
CRAFT-LoRA: Content-Style Personalization via Rank-Constrained Adaptation and Training-Free Fusion [27.1] Low-Rank Adaptation (LoRA) は、LoRA重みを異なる概念に組み合わせることで正確な制御を行うことのできる、効率的なパーソナライズアプローチを提供する。
既存の組み合わせ技術は、コンテンツとスタイルの表現の絡み合い、要素の影響を制御するのに不十分なガイダンス、しばしば追加のトレーニングを必要とする不安定な重み付けといった、永続的な課題に直面している。
1)低ランク投射残差を注入し、疎結合なコンテンツやスタイルのサブスペースの学習を促進するランク制約付きバックボーン微調整、(2)セマンティック拡張と精密制御が可能な専門分野のエキスパートエンコーダを特徴とするプロンプト誘導アプローチ。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:05:11 GMT)
Vectorized Bayesian Inference for Latent Dirichlet-Tree Allocation [25.7] LDAの一般化であるLDTA(Latent Dirichlet-Tree Allocation)の枠組みを紹介する。
LDTAはLDAの生成構造を保っているが、トピックの比率よりも表現的、木構造的な先行を可能にする。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:00:34 GMT)
Habilis-$β$: A Fast-Motion and Long-Lasting On-Device Vision-Language-Action Model [24.2] Habilis-$は、現実のデプロイメント用に設計された、デバイス上での高速かつ長期間のビジョン言語アクション(VLA)モデルである。
本稿では,Productivity-Reliability Plane (PRP)を導入し,時間ごとのタスク(TPH)とMTBI(Mean Time Between Intervention)を連続実行プロトコルで評価する。
1時間の連続実行評価では、Habilis-$は、シミュレーションと実環境の両方で$_0.5$に対して、RPPメトリクスで強いパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:15:49 GMT)
PhysConvex: Physics-Informed 3D Dynamic Convex Radiance Fields for Reconstruction and Simulation [24.0] PhysConvexは物理インフォームド3Dダイナミック凸放射場であり、視覚的レンダリングと物理シミュレーションを統合する。
ジオメトリと表面力学による変形をモデル化する境界駆動型動的凸表現を提案する。
さらに, 形状・材料を考慮した変形基盤として, ニューラルネットワークを用いた動的凸場を回避できる低次凸シミュレーションを開発した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:16:33 GMT)
From Trial by Fire To Sleep Like a Baby: A Lexicon of Anxiety Associations for 20k English Multiword Expressions [23.9] 我々は,20万以上の英語MWEに対して,不安関連に関する記述規範を捉えた最初の大規模辞書を紹介した。
不安関連性は高い信頼性を示す。
このレキシコンは、心理学、NLP、公衆衛生、社会科学における様々な不安に関する研究を可能にする。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 02:15:04 GMT)
Limits of Convergence-Rate Control for Open-Weight Safety [23.2] 本研究では,非対角的設定における一階と二階の最適化を実証的かつ実証的に遅くするアルゴリズムを開発した。
逆の設定では、幅広い収束率制御法の基本的限界を確立する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:32:27 GMT)
Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse [22.9] 大規模言語モデル(LLM)上に構築された完全自律型AIアナリストは、同様の構造化された分析的多様性を安価かつ大規模に再現可能であることを示す。
アナリストペルソナやLSMの再割り当ては, 方法論的に不十分なランニングを除いた後でも, 結果の分布をシフトさせる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:10:21 GMT)
PEPA: a Persistently Autonomous Embodied Agent with Personalities [22.4] 生物は内部で生成された目標と自己持続的な行動組織を通して永続的な自律性を示す。
パーソナリティ特性は、永続的な自律性を達成するための本質的な組織原理を提供する。
PEPAは3つの相互作用システムを介して動作する3層認知アーキテクチャである。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:53:28 GMT)
Robust Self-Supervised Cross-Modal Super-Resolution against Real-World Misaligned Observations [22.2] 実世界の不整合データに対するクロスモーダル超解像(SR)について検討する。
複雑な空間的ミスアライメントを持つ低分解能(LR)ソースと高分解能(HR)ガイドイメージペアの限られた数のみが利用可能である。
この課題に対処するため、オンラインで最適化された完全自己教師型モデルであるRobSelfを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:44:36 GMT)
MoBiQuant: Mixture-of-Bits Quantization for Token-Adaptive Elastic LLMs [22.2] MoBiQuantは、トークン感度に基づいて弾性LLM推論の重み付け精度を調整する新しいMixture-of-Bits量子化フレームワークである。
我々は, MoBiQuantが強い弾性を示し, 繰り返しキャリブレーションを伴わずにLLaMA3-8B上でのビット固有PTQの性能に適合できることを示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:11:08 GMT)
DREAM: Deep Research Evaluation with Agentic Metrics [21.6] 本稿では,DREAM(Deep Research Evaluation with Agentic Metrics)を提案する。
DREAM構造評価は、クエリ非依存のメトリクスとツール呼び出しエージェントが生成する適応的なメトリクスを組み合わせた評価プロトコルを用いて行われる。
制御された評価は、DREAMが既存のベンチマークよりも事実や時間的劣化にかなり敏感であることを示している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:14:31 GMT)
Give Users the Wheel: Towards Promptable Recommendation Paradigm [21.4] Decoupled Promptable Sequential Recommendation (DPR)は、従来のシーケンシャルバックボーンにPromptable Recommendationをサポートするためのモデルに依存しないフレームワークである。
DPRは、潜在ユーザ表現を検索空間内で直接変調する。
プロンプト誘導タスクにおいて、最先端のベースラインを著しく上回る。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 18:41:28 GMT)
AlignSentinel: Alignment-Aware Detection of Prompt Injection Attacks [20.9] プロンプトインジェクション攻撃はLLMの入力に悪意のある命令を挿入し、意図した命令ではなくアタッカー・チョーゼンタスクに誘導する。
既存の検出防御は、任意の入力を悪意のある命令で分類し、良心的な入力を誤分類する。
本研究では,命令階層を記述し,不整合命令の入力,整合命令の入力,非整合入力の3つのカテゴリを区別する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:59:49 GMT)
Spatial-Temporal State Propagation Autoregressive Model for 4D Object Generation [19.9] 時空間状態伝搬自己回帰モデル(STAR)を提案する。
実験により、4DSTARは空間的時間的一貫した4Dオブジェクトを生成し、拡散モデルと競合する性能を実現する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 13:21:21 GMT)
Marginalized Bundle Adjustment: Multi-View Camera Pose from Monocular Depth Estimates [19.6] MDE深度マップは、SfMとカメラ再配置タスクにおいて、SoTAまたは競合する結果を得るのに十分正確であることを示す。
本手法は,マルチビュー3次元視覚におけるMDEの意義を明らかにする。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:01:32 GMT)
Towards Bridging the Gap between Large-Scale Pretraining and Efficient Finetuning for Humanoid Control [18.6] SAC(Soft Actor-Critic)がヒューマノイド・ロコモーション・ポリシーの大規模事前学習を確実に支援していることが判明した。
SAC-pretrained Policyは、モデルベースの手法を用いて、新しい環境やアウト・オブ・ディストリビューションタスクで微調整できる。
全体としては, 大規模シミュレーションのウォールクロック効率と, 微調整時のモデルベース学習のサンプル効率を両立させる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 01:04:58 GMT)
Structure-Level Disentangled Diffusion for Few-Shot Chinese Font Generation [18.6] 中国のフォント生成は、少数の参照画像のみを使用して、ターゲットスタイルで新しい文字を合成することを目的としている。
既存のアプローチは機能レベルのアンタングルのみを達成するため、ジェネレータはこれらの機能を再アンタングルすることができる。
本研究では,2つのチャンネルからコンテンツとスタイル情報を受信する構造レベル分散拡散モデルを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:41:06 GMT)
Phase-Consistent Magnetic Spectral Learning for Multi-View Clustering [18.5] 教師なしのマルチビュークラスタリングは、ラベルなしで複数のビューから補完的な情報を活用することで、データを有意義なグループに分割することを目的としている。
既存のアプローチは、しばしばマグニチュードのみの親和性や初期の擬似的ターゲットに依存しており、異なる視点が同等の強度を持つが矛盾する方向傾向を持つ関係を誘導すると不安定になる可能性がある。
本稿では,MVC における EmphPhase-Consistent Magnetic Spectral Learning を提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 06:04:57 GMT)
TAG: Thinking with Action Unit Grounding for Facial Expression Recognition [18.4] 我々は,顔行動単位(AU)によって支援されるマルチモーダル推論を明示的に制約する視覚言語フレームワークであるTAG(Thinking with Action Unit Grounding)を提案する。
RAF-DB,FERPlus,AffectNetで評価した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:00:52 GMT)
Beyond Description: A Multimodal Agent Framework for Insightful Chart Summarization [18.3] 本稿では,グラフ画像から直接深い洞察を明らかにするためのマルチエージェント・フレームワークを提案する。
適切なベンチマークの欠如を克服するため、我々はChartSummInsightsを紹介した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 06:17:37 GMT)
SceneTok: A Compressed, Diffusable Token Space for 3D Scenes [18.1] SceneTokは、シーンのビューセットを圧縮・拡散可能な非構造化トークンセットにエンコードする新しいトークンである。
圧縮が他の表現よりも1~3桁強く、なおも最先端の復元品質に到達していることを示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:08:17 GMT)
SafeDrive: Fine-Grained Safety Reasoning for End-to-End Driving in a Sparse World [17.8] SafeDriveは、明示的で解釈可能な安全性推論を実行するように設計されたE2E計画フレームワークである。
オープンループベンチマークとクローズループベンチマークの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:17:28 GMT)
IDperturb: Enhancing Variation in Synthetic Face Generation via Angular Perturbation [17.4] 合成データは、顔認識(FR)システムのトレーニングのための認証顔データセットの実用的な代替として登場した。
アイデンティティ条件拡散モデルの最近の進歩は、フォトリアリスティックおよびアイデンティティ一貫性のある顔画像の生成を可能にしている。
我々は,合成顔生成の多様性を高めるため,簡易かつ効果的な幾何駆動型サンプリング戦略であるIDPERTURBを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 13:23:26 GMT)
HONEST-CAV: Hierarchical Optimization of Network Signals and Trajectories for Connected and Automated Vehicles with Multi-Agent Reinforcement Learning [17.4] 本研究では、HV(Human-driven Vehicles)、Connected and Automated Vehicles(CAV)からなる混在交通のための階層型ネットワークレベルのトラフィックフロー制御フレームワークを提案する。
このフレームワークは、車両レベルのエコドライブ行動と交差点レベルの交通信号制御を共同で最適化し、全体のネットワーク効率を高め、エネルギー消費を減少させる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 07:27:45 GMT)
TPRU: Advancing Temporal and Procedural Understanding in Large Multimodal Models [16.2] 本稿では,多様な実施シナリオをベースとした大規模データセットTPRUを紹介する。
TPRUは3つの相補的なタスクを通じて時間的推論を育むために体系的に設計されている。
我々は,資源効率の向上を目的とした強化学習(RL)ファインチューニング手法を用いてTPRUを利用する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:10:52 GMT)
SGNO: Spectral Generator Neural Operators for Stable Long Horizon PDE Rollouts [15.6] 我々はSGNO(Spectral Generator Neural Operator)を紹介する。
線形部分に対して、SGNOはフーリエ空間における指数時間差更新と学習された対角生成器を用いる。
ワンステップ境界と有限水平ロールアウト誤差境界を導出する。
1D, 2D, 3D PDE ファミリーにまたがる APEBench では、SGNO は強いニューラル演算子ベースラインよりも低い長い水平誤差と長いロールアウト長を達成する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:22:01 GMT)
Enhancing 3D LiDAR Segmentation by Shaping Dense and Accurate 2D Semantic Predictions [15.4] 我々は,ラベルマップの間隔とLiDARマップの間隔を克服するマルチモーダルセグメンテーションモデルMM2D3Dを開発した。
実験により,本手法により,高密度分布と高精度な中間2次元意味予測が可能となった。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:33:41 GMT)
From Docs to Descriptions: Smell-Aware Evaluation of MCP Server Descriptions [15.1] MCPツール記述における記述の臭いに関する最初の体系的研究とそのユーザビリティへの影響について述べる。
記述の臭いは広範に広まり、"コードファースト、記述-ラスト"パターンを反映しています。
機能的に等価なサーバとの競合設定では、標準に準拠した記述は72%の選択確率に達する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:45:07 GMT)
Rethinking Retrieval-Augmented Generation as a Cooperative Decision-Making Problem [15.0] Retrieval-Augmented Generation (RAG) は、言語を外的証拠として基礎づけることによって、知識集約的なタスクに強い効果を示した。
我々は、協調的マルチエージェント意思決定問題としてのRAGを再構築し、協調検索強化世代(CoRAG)を提案する。
実験の結果,約10KのPopQAサンプルでモデルがトレーニングされた場合でも,CoRAGの一般化と生成安定性の向上が示された。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 06:32:36 GMT)
Exponential Convergence of (Stochastic) Gradient Descent for Separable Logistic Regression [14.7] 簡単な非適応的なステップサイズスケジュールによる勾配勾配勾配は、マージン条件下での分離可能なロジスティック回帰の指数収束を実現することを示す。
また、線形探索や特殊手順を回避する軽量適応的なステップサイズルールを用いて勾配降下の指数収束を確立する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:31:07 GMT)
DUET-VLM: Dual stage Unified Efficient Token reduction for VLM Training and Inference [14.7] DUET-VLMは汎用的なプラグアンドプレイデュアル圧縮フレームワークである。
精度を犠牲にすることなく、視覚的(イメージ/ビデオ)入力を小さくする堅牢な適応を可能にする。
本研究は,DUET-VLMによるエンドツーエンドトレーニングに焦点を当てた。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:22:49 GMT)
LAMMI-Pathology: A Tool-Centric Bottom-Up LVLM-Agent Framework for Molecularly Informed Medical Intelligence in Pathology [14.4] LAMMI-Pathology (LVLM-Agent System for Molecularly Informed Medical Intelligence in Pathology)を提案する。
LAMMI-Pathologyは、カスタマイズされたドメイン適応ツールが基盤となる、ツール中心のボトムアップアーキテクチャを採用している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:51:32 GMT)
Task-Aware Exploration via a Predictive Bisimulation Metric [13.4] 本稿では,タスク関連表現と探索を密結合したタスク対応探索手法TEBを提案する。
具体的には、TEBは、行動基底化されたタスク表現を学習するだけでなく、学習された潜在空間上の行動固有のノベルティを測定するために、この指標を利用する。
このロバストな測定値に基づいて、潜在空間上の隣接観測の相対的新規性を測定する、ポテンシャルに基づく探索ボーナスを設計する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 05:30:34 GMT)
ReHear: Iterative Pseudo-Label Refinement for Semi-Supervised Speech Recognition via Audio Large Language Models [12.5] ReHearは、自動音声認識における反復的な擬似ラベル改善のためのフレームワークである。
命令調整されたオーディオ対応の大規模言語モデルを自己学習ループに統合する。
ReHearはエラーの伝播を効果的に軽減し、教師付きベースラインと疑似ラベルベースラインの両方を一貫して上回ることを示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 05:04:22 GMT)
PCA-VAE: Differentiable Subspace Quantization without Codebook Collapse [12.3] ベクトル量子化されたオートエンコーダは、高忠実度ラテントを提供するが、固有の欠陥を負う。
私たちはVQを原則的かつ完全に差別化可能な代替手段に置き換えています。
結果は,PCAは数学的基盤,安定,ビット効率,意味的に構造化されたVQの代替として実現可能であることを示唆している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:57:58 GMT)
ReMoRa: Multimodal Large Language Model based on Refined Motion Representation for Long-Video Understanding [12.2] 本研究では,大言語モデル(MLLM)による映像理解に焦点を当てた。
圧縮表現を直接操作して動画を処理するビデオMLLMであるReMoRaを提案する。
本稿では,ReMoRaの長期ビデオ理解ベンチマークを網羅した実験により,ReMoRaの有効性を実証する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:22:18 GMT)
Model Context Protocol (MCP) Tool Descriptions Are Smelly! Towards Improving AI Agent Efficiency with Augmented MCP Tool Descriptions [12.2] 103のMPPサーバにまたがる856のツールを実験的に検証し,その記述品質とエージェント性能への影響について検討した。
文献からツール記述の6つのコンポーネントを特定し,これらのコンポーネントを利用したスコアリングルーリックを開発し,このルーリックに基づいてツール記述の匂いを定式化する。
分析したツール記述の97.1%には少なくとも1つの匂いが含まれており、56%は目的を明確に述べていない。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:39:49 GMT)
Automatic, Expressive, and Scalable Fuzzing with Stitching [12.1] ファジィアが実行時に動的に組み立てる部分でAPI使用制限を符号化する手法であるステッチリングを提案する。
我々はSTITCHで縫合を実装し、LCMを使用してファジィングのプロジェクトを自動的に構成し、仕様を合成し、トリアージクラッシュを発生させ、仕様自体を修復する。
33のベンチマークで4つの最先端ツールに対してSTITCHを評価し、21のコードカバレッジを達成し、他のツールの組み合わせで10よりも30の真陽性バグを発見しました。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 01:48:17 GMT)
Bounds and Identification of Joint Probabilities of Potential Outcomes and Observed Variables under Monotonicity Assumptions [11.8] 本稿では,個別の処理と個別の順序付き結果の設定における確率の有界化と同定について述べる。
単調性仮定の新しいファミリーを提案し,線形プログラミング問題として有界問題を定式化する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:00:18 GMT)
NeXt2Former-CD: Efficient Remote Sensing Change Detection with Modern Vision Architectures [11.7] NeXt2Former-CDは、Siamese ConvNeXtエンコーダとDINOv3重み、変形可能な注目ベースの時間融合モジュール、Mask2Formerデコーダを統合するエンドツーエンドフレームワークである。
提案モデルでは,SSMに基づくアプローチに匹敵する推論レイテンシを保ち,高分解能な変更検出タスクに有効であることが示唆された。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:51:53 GMT)
Detecting AI-Generated Forgeries via Iterative Manifold Deviation Amplification [11.5] IFA-Netは「偽物」の学習から「本物」のモデリングへと移行する。
IFA-NetはIoUが6.5%、F1スコアが8.1%向上した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:14:17 GMT)
Learning to Localize Reference Trajectories in Image-Space for Visual Navigation [11.2] ロボットに依存しない画像空間ガイダンスを提供する視覚ナビゲーションモデルであるLoTISを提案する。
特定のロボットに関連付けられた動作を予測する代わりに、ロボットの現在のビューに現れるように、参照軌道のイメージ空間座標を予測する。
我々のモデルの予測は、多様な実施形態をまたいだゼロショットのガイダンスを提供する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:33:00 GMT)
FOCA: Frequency-Oriented Cross-Domain Forgery Detection, Localization and Explanation via Multi-Modal Large Language Model [11.1] FOCAは、RGB空間領域と周波数領域の両方の識別機能を統合した、大規模な言語モデルベースのフレームワークである。
FSE-Setは、さまざまな認証と改ざんされたイメージ、ピクセルレベルのマスク、デュアルドメインアノテーションを備えた大規模なデータセットである。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:53:44 GMT)
UFO: Unlocking Ultra-Efficient Quantized Private Inference with Protocol and Algorithm Co-Optimization [10.5] プライベート畳み込みニューラルネットワーク(CNN)推論は、高い通信と遅延オーバーヘッドに悩まされる。
2PCプロトコルと量子化アルゴリズムを協調的に最適化する量子化2PC推論フレームワークであるUFOを提案する。
広範な実験でUFOは1.7x、3.6x、6.3x通信の削減を1.29%、1.16%、1.29%の精度で実証した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:45:05 GMT)
Similarity-as-Evidence: Calibrating Overconfident VLMs for Interpretable and Label-Efficient Medical Active Learning [10.3] 類似性証拠(SaE)は、類似性証拠ヘッド(SEH)を導入してテキスト画像の類似性を校正する
SaEは、最先端のマクロ平均精度を、20%のラベル予算で、医療画像データセット上で82.57%の精度で達成している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:21:54 GMT)
Prior Aware Memorization: An Efficient Metric for Distinguishing Memorization from Generalization in Large Language Models [9.9] LLM(Large Language Models)からのトレーニングデータ漏洩は、プライバシ、セキュリティ、著作権コンプライアンスに関する深刻な懸念を引き起こす。
既存の暗記計測手法はしばしばこれらの現象を説明し、共通パターンの一般化から生じたときでも、アウトプットを暗記している。
この研究は、LLMにおける真の記憶を識別するための理論的基礎と軽量でトレーニング不要な基準である、事前認識記憶を導入している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 06:31:17 GMT)
CaliCausalRank: Calibrated Multi-Objective Ad Ranking with Robust Counterfactual Utility Optimization [9.6] CaliCausalRankは、トレーニング時間スケールのキャリブレーション、制約ベースの多目的最適化、堅牢な対実的ユーティリティ推定を統合するフレームワークである。
提案手法は,ポストホック処理ではなく,第1級のトレーニング目標としてスコアキャリブレーションを扱い,制約満足度に対するラグランジアン緩和を採用し,信頼性の高いオフライン評価のための分散再現型反事実推定器を実現する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:35:12 GMT)
Boosting for Vector-Valued Prediction and Conditional Density Estimation [9.2] 幾何的中央値のアグリゲーションは多種多様な発散の促進性を達成できることを示す。
指数的再重み付けと幾何学的中間集合に基づく汎用的なブースティングフレームワークtextscGeoMedBoostを提案する。
本フレームワークは,textscMedBoost, textscAdaBoost, textscSAMMEなどの古典的アルゴリズムを特殊ケースとして復元する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:21:36 GMT)
Frame2Freq: Spectral Adapters for Fine-Grained Video Understanding [9.1] 我々は、事前訓練されたビジョンファウンデーションモデル(VFM)のイメージ・ツー・ビデオ適応中にスペクトル符号化を行う周波数対応アダプタのファミリーであるFrame2Freqを紹介する。
5つのきめ細かいアクティビティ認識データセットの中で、Frame2Freqは以前のPEFTメソッドよりも優れており、4つのモデルで完全に調整されたモデルを超えています。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 23:05:53 GMT)
VariBASed: Variational Bayes-Adaptive Sequential Monte-Carlo Planning for Deep Reinforcement Learning [8.8] 本稿ではベイズ適応マルコフ決定過程における学習と計画のための変分フレームワークを提案する。
我々の新しい手法であるVariBASeDは、より大きな計画予算へのスケーリングを好適に実現し、従来の手法よりもサンプルおよび実行効率を向上させる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:41:11 GMT)
Discovering Multiagent Learning Algorithms with Large Language Models [8.6] 我々は,大規模言語モデルを用いた進化的符号化エージェントであるAlphaEvolveを用いて,新しいマルチエージェント学習アルゴリズムを自動発見する。
ゲーム理論学習の2つの異なるパラダイムのための新しい変種を進化させることにより、この枠組みの一般化を実証する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:59:56 GMT)
Towards Reliable Negative Sampling for Recommendation with Implicit Feedback via In-Community Popularity [8.3] 我々は,信頼度と情報的負のサンプルを特定するためにtextbfICPNS (In-Community Popularity Negative Smpling) を提案する。
我々のアプローチは、アイテムの露出は潜在ユーザコミュニティによって引き起こされるという洞察に基づいています。
ICPNSはグラフベースのレコメンデータとMFベースのモデルの競合性能を一貫して改善する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:53:10 GMT)
Rethinking Preference Alignment for Diffusion Models with Classifier-Free Guidance [8.0] ベースモデルを再訓練することなくアライメントを改善する簡単な手法を提案する。
一般化をさらに高めるため、選好学習を正と負のデータに基づいて訓練された2つのモジュールに分離する。
我々はPick-a-Pic v2およびHPDv3を用いた安定拡散1.5および安定拡散XLの評価を行い、一貫した定量的および定性的な利得を示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:18:52 GMT)
Narrowing the Complexity Gap in the Evaluation of Large Language Models [7.9] 現実のコードの複雑さに関して、LLM(Large Language Models)を評価することが不可欠です。
我々は,任意のプログラムベンチマークに実世界の複雑さを追加する自動手法であるGeneBenchを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 18:39:06 GMT)
Adaptive Monitoring of Stochastic Fire Front Processes via Information-seeking Predictive Control [7.8] 移動エージェント(ドローンなど)を用いて山火事の現場を適応的に監視する問題を考える。
野火の進化の性質は、検知、推定、制御のシームレスな統合を必要とするため、これは難しい問題である。
我々は, 火災前監視タスクを, 感知, 推定, 制御を統合した最適制御問題として定式化する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:30:37 GMT)
BURMESE-SAN: Burmese NLP Benchmark for Evaluating Large Language Models [7.5] BURMESE-SANはビルマの大規模言語モデル(LLM)を体系的に評価する最初の総合的なベンチマークである。
理解(NLU)、推論(NLR)、生成(NLG)の3つのコアNLP能力にまたがる7つのサブタスクを統合する。
このベンチマークは厳格なネイティブスピーカー駆動のプロセスによって構築され、言語的自然性、流布性、文化的な信頼性を保証する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:43:07 GMT)
TactEx: An Explainable Multimodal Robotic Interaction Framework for Human-Like Touch and Hardness Estimation [7.3] TactExは、視覚、触覚、言語を人間のような硬さの推定と対話的なガイダンスのために統合するフレームワークである。
我々は,触覚と文脈理解の両方を必要とする代表的な課題である果実熟度評価におけるTactExの評価を行った。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 22:18:17 GMT)
MaskDiME: Adaptive Masked Diffusion for Precise and Efficient Visual Counterfactual Explanations [7.3] MaskDiMEは拡散に基づく反ファクト生成フレームワークである。
局所的なサンプリングによって意味的一貫性と空間的精度を統一する。
ベースライン法よりも30倍以上高速な推論を実現する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:53:50 GMT)
GRAB: A Systematic Real-World Grasping Benchmark for Robotic Food Waste Sorting [7.2] 本稿では,Glasping Real-World Article BenchmarkingフレームワークであるGRABを紹介する。
多様な変形可能なオブジェクト、高度な把握と推定のビジョン、そして重要なことに、プレグレープ条件を統合している。
本研究は,1,750件の食品汚染把握試験を含む詳細な実験評価を通じて,産業的把握度を体系的に比較した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 13:42:04 GMT)
In-Context Planning with Latent Temporal Abstractions [7.0] I-TAP はオフラインの RL フレームワークで、学習時空間におけるオンライン計画とコンテキスト内適応を統合する。
I-TAPは、強いモデルフリーおよびモデル条件のオフラインベースラインに一貫して適合または性能を向上する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 02:29:19 GMT)
Bumper Drone: Elastic Morphology Design for Aerial Physical Interaction [6.9] 本稿では,タッチアンドゴー操作が可能な弾性角を持つドローンプラットフォームを提案する。
弾性ホーンは車両の安定性を維持しながら衝撃エネルギーを吸収できることを示す。
間欠的な接触に加えて、弾性角を備えたプラットフォームは、静的物体との安定で持続的な接触を示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 22:44:40 GMT)
MiSCHiEF: A Benchmark in Minimal-Pairs of Safety and Culture for Holistic Evaluation of Fine-Grained Image-Caption Alignment [6.6] 視覚言語モデル(VLM)における微粒化イメージキャプションアライメントの重要性
安全(MiS)と文化(MiC)の領域における対照的なペア設計に基づく2つのベンチマークデータセットのセットであるMiSCHiEFを提案する。
モデルでは, 誤りを否定するよりも, 正しい画像キャプチャペアの確認が優れていることが判明した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 06:06:46 GMT)
On the Hardness of Approximation of the Fair k-Center Problem [6.4] 公平な$k$-center問題の近似の難しさについて検討する。
A-time $3$-approximation is known for fair $k$-center in general metrics。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:29:28 GMT)
On the Energy Cost of Post-Quantum Key Establishment in Wireless Low-Power Personal Area Networks [6.2] ポスト量子暗号(PQC)は、パーソナルエリアネットワークのタイミングとエネルギー予算を歪めるペイロードを作成する。
本稿では,Bluetooth Low Energy を代表プラットフォームとして計算・通信コストを分離し,実際のハードウェア上での検証を行う。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 03:56:54 GMT)
Depth-Enhanced YOLO-SAM2 Detection for Reliable Ballast Insufficiency Identification [6.1] YOLO-SAM2は,RGB-Dデータを用いた鉄道線路のバラスト異常検出のためのフレームワークである。
信頼性を向上させるため,スリーパー・アライン・パイプラインによって実現された深度に基づく幾何解析を取り入れた。
実験により、深度を増す構成はバラストの不足の検出を大幅に改善することが示された。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:49:06 GMT)
HIME: Mitigating Object Hallucinations in LVLMs via Hallucination Insensitivity Model Editing [6.0] LVLM(Large Vision-Language Models)は、マルチモーダル理解機能を示す。
LVLMはオブジェクト幻覚を起こす傾向があり、モデルでは存在しないオブジェクトや属性の誤った事実情報を記述している。
HIME(Halucination Insensitivity Model Editing)は,隠れた特徴を選択的に修正し,幻覚を抑制する階層適応的な重み編集手法である。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:16:17 GMT)
Advances in GRPO for Generation Models: A Survey [6.0] Flow-GRPOは、生成モデルのための強化学習フレームワークである。
生成モデルと人間の好みとタスク固有の目的を一致させるのに使うことができる。
この調査では、Flow-GRPOを現代的な生成モデルのための一般的なアライメントフレームワークとして取り上げている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:11:08 GMT)
StructCore: Structure-Aware Image-Level Scoring for Training-Free Unsupervised Anomaly Detection [5.9] 最大プーリングは、メモリバンクベースの教師なし異常検出(UAD)において、異常スコアマップを画像レベルの決定に変換するデファクトスタンダードである。
本研究では,最大プーリングを超越した,トレーニング不要で構造を考慮した画像レベルのスコアリング手法であるStructCoreを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:52:53 GMT)
NeuroWise: A Multi-Agent LLM "Glass-Box" System for Practicing Double-Empathy Communication with Autistic Partners [5.9] 二重共感問題は、相互の誤解から生じる神経分枝と神経型個人間のコミュニケーションの困難を物語っている。
ストレスビジュアライゼーション,内部経験の解釈,コンテキストガイダンスを通じて,ニューロタイプユーザを支援するマルチエージェントLDMベースのコーチングシステムであるNeuroWiseを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:54:43 GMT)
Media Integrity and Authentication: Status, Directions, and Futures [5.8] 我々は、AI生成メディアと、カメラやマイクが捉えた本物のコンテンツとを区別することに注力する。
我々は,証明,透かし,指紋認証など,いくつかのアプローチを評価した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 01:06:13 GMT)
Joint Post-Training Quantization of Vision Transformers with Learned Prompt-Guided Data Generation [5.8] 我々は、ImageNetで訓練されたビジョントランスフォーマーの合体量子化のためのフレームワークを提案する。
我々はImageNet上で最先端のW4A4とW3A3の精度を実現する。
また,ラベルのない多種多様なサンプルを合成するデータフリーキャリブレーション手法を導入する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:02:21 GMT)
When Friction Helps: Transaction Confirmation Improves Decision Quality in Blockchain Interactions [5.6] ブロックチェーンベースのConnect Fourゲームを用いて,認証フローのみが異なる2つのインタラクションモードで実験を行った。
デリゲートされたデプロイメントで確認することなく、客観的なパフォーマンスが悪化していることが分かりました。
これらの結果から,トランザクション確認は認知的に意味のある自己補正チェックポイントとして機能することが示唆された。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 13:32:14 GMT)
YOLOv10-Based Multi-Task Framework for Hand Localization and Laterality Classification in Surgical Videos [5.5] 複雑な手術シーンにおいて,手と手の位置を同時に分類する枠組みを提案する。
このモデルはTrauma THOMPSON Challenge 2025 Task 2データセットでトレーニングされている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:41:56 GMT)
MANATEE: Inference-Time Lightweight Diffusion Based Safety Defense for LLMs [5.4] 本稿では,良性表現多様体上の密度推定を用いた予測時間ディフェンス MANATEE を提案する。
特定のデータセットでアタック成功率を最大100%削減し、良質な入力でモデルユーティリティを保存する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:17:55 GMT)
Conditionally Site-Independent Neural Evolution of Antibody Sequences [5.3] 我々は、ディープニューラルネットワークによってパラメータ化された連続時間マルコフ連鎖であるCoSiNEを紹介する。
我々は,CoSiNEが抽出可能な逐次点突然変異過程に一階近似を与えることを証明した。
実証的には、CoSiNEはゼロショット変量効果予測において最先端の言語モデルより優れている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 23:23:30 GMT)
OpenClaw AI Agents as Informal Learners at Moltbook: Characterizing an Emergent Learning Community at Scale [5.1] 我々は,AIエージェントからなる大規模非公式学習コミュニティについて,初めて実証的研究を行った。
AIエージェント専用のソーシャルネットワークであるMoltbookは、3週間で280万以上の登録エージェントに成長した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 13:30:32 GMT)
A high-resolution nationwide urban village mapping product for 342 Chinese cities based on foundation models [5.1] GeoLink-UVは、342の中国の都市におけるUVの位置と境界を明確に記述した高解像度な全国UVマッピング製品である。
平均して、UV地域はビルドされた土地の8%を占めており、中国中部と南部で顕著に集結している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:07:23 GMT)
Federated Measurement of Demographic Disparities from Quantile Sketches [5.0] Horizontal Federated Learning (FL)は、生データを共有せずに、連携した機能を持つクライアント間の協調モデリングを可能にする。
本研究は, スコア分布による人口動態の相互監査, ワッサーシュタインとしての格差の測定, センシティブグループスコア法間の差異について検討する。
本稿では,各サイロがグループ数のみを共有し,その局所的なスコア分布を定量的に要約するワンショット通信効率のプロトコルを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:34:44 GMT)
GONE: Structural Knowledge Unlearning via Neighborhood-Expanded Distribution Shaping [4.7] 本稿では,Large Language Models (LLMs) における構造化知識グラフ (KG) 事実に対する知識未学習の評価ベンチマークである Graph Oblivion and Node Erasure (GONE) を紹介する。
このKGベースのベンチマークは、直接事実除去、推論に基づくリーク、破滅的な忘れという3つの非学習効果の解離を可能にする。
新たなアンラーニングフレームワークであるNEDSは、グラフ接続を活用してアンカー関係の隣人を識別し、忘れられた事実とそのセマンティック・エリア間の正確な決定境界を強制するように設計されている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:08:37 GMT)
Chat-Based Support Alone May Not Be Enough: Comparing Conversational and Embedded LLM Feedback for Mathematical Proof Learning [4.7] GPTutorは、学部の離散数学コースのためのLLMベースのチューターシステムである。
それは2つのツールを統合している: 構造化された証明レビューツールで、学生が書いた証明の試みを埋め込んだフィードバックと、数学の質問のためのチャットボットを提供する。
学生148名を対象にしたスタッガードアクセススタディでは,実験グループのみがシステムを利用する場合,早期アクセスはより高度な宿題のパフォーマンスに関連付けられていた。
使用記録によると, 自己効力の低い学生と, 事前試験成績の学生は, 両者をより頻繁に使用していた。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:52:25 GMT)
Transformers for dynamical systems learn transfer operators in-context [4.2] インコンテキスト学習は、物理システムにおける学習と適応の従来の理解に挑戦する。
1つの力学系を予測するために小さな2層単頭変圧器を訓練し、再学習せずに異なる力学系を予測する能力を評価する。
注意に基づくモデルがコンテキスト内で伝達演算予測戦略を適用していることが判明した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 01:03:15 GMT)
CLAP Convolutional Lightweight Autoencoder for Plant Disease Classification [3.9] 分離可能な畳み込み層を用いた軽量オートエンコーダを提案する。
デコーダによりさらに改善されたエンコーダ特徴識別性(英語版)の長所を精錬するためにシグモイドゲーティングを適用する。
CLAPは、統合植物病、グラウンドナッツ、CCMTデータセットの改善または競争的な精度を達成した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 13:31:27 GMT)
Early Evidence of Vibe-Proving with Consumer LLMs: A Case Study on Spectral Region Characterization with ChatGPT-5.2 (Thinking) [3.9] 消費者定期購読型Large Language Models (LLMs) を用いたバイブプロビテーションの証拠を示す。
7つの共有可能なChatGPT-5.2スレッドと4つのバージョン付きの証明ドラフトを分析し、生成、参照、修正の反復パイプラインを文書化する。
このモデルは高いレベルの証明探索には最も有用であるが、人間の専門家は正当性クリティカルなクロージャには不可欠である。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:52:02 GMT)
PalpAid: Multimodal Pneumatic Tactile Sensor for Tissue Palpation [3.6] ロボット支援手術において触覚を回復するための空気圧触覚センサであるPalpAidを提案する。
センサはマイクと圧力センサを備え、接触力を内圧差に変換する。
使用するロバスト性,繰り返しサイクル,ロボットシステムとの統合性を考慮したセンサユニットの設計,製造,組み立てについて述べる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 05:56:05 GMT)
Face Presentation Attack Detection via Content-Adaptive Spatial Operators [3.5] 本稿では,RGBのみの単一フレームモデルを提案する。
CaSO-PADは軽量であり(3.6Mパラメータ; 0.64 GFLOPs at $256times256$)、標準的なバイナリクロスエントロピーの目的を用いてエンドツーエンドに訓練されている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 22:13:31 GMT)
Spilled Energy in Large Language Models [3.4] 最終大言語モデル(LLM)ソフトマックス分類器をエネルギーベースモデル(EBM)として再解釈する。
この原則によって、デコード中の"エネルギー流出"を追跡できます。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 00:38:47 GMT)
LoMime: Query-Efficient Membership Inference using Model Extraction in Label-Only Settings [3.4] メンバシップ推論攻撃(MIA)は、トレーニング中に特定のデータポイントが使用されたかどうかを明らかにすることで、マシンラーニングモデルのプライバシを脅かす。
転送可能性とモデル抽出に基づく,コスト効率の高いラベルのみのMIAフレームワークを提案する。
提案手法は,検索コストを大幅に削減しつつ,最先端のラベルのみのMIAの性能に適合する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 18:57:17 GMT)
EDU-MATRIX: A Society-Centric Generative Cognitive Digital Twin Architecture for Secondary Education [3.4] 我々は「人」をシミュレートするパラダイムから「重力場を持つ社会空間」をシミュレートする「社会中心型認知デジタルツインアーキテクチャ」を提案する。
2400人のエージェントを持つ中等学校のデジタル双生児として展開されたこのシステムは、「社会的重力」(ルール)と「認知流体」(知識)がどのように相互作用し、創発的で価値に整合した行動を生み出すかを示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 03:32:56 GMT)
When Agda met Vampire [3.4] 本研究の目的は,証明アシスタントと自動定理証明器(ATP)を簡単な方法で統合することである。
ほとんどのATPは古典的な一階述語論理で作用するが、これらの証明アシスタントは構成的依存型理論に基づいている。
我々は、ATPヴァンパイアに対するAgda証明義務のプロトタイプシステムを作成し、その結果得られた古典的証明をAgdaが型チェックできる構成的証明項に変換する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:19:56 GMT)
High Dimensional Procedural Content Generation [3.3] 非幾何学的次元を結合状態空間の第一級座標に扱うフレームワークである高次元PCGを紹介する。
本稿では,抽象骨格生成,制御接地,高次元検証,マルチメトリック評価の共通パイプラインを用いた3つの一般的な実践可能なアルゴリズムを提案する。
我々はHDPCGがPCGの一般的な表現へのシフトを促し、幾何学を超えたゲームプレイ関連次元を創出することを願っている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:29:46 GMT)
(Perlin) Noise as AI coordinator [3.3] 本稿では,連続雑音場をAIコーディネータとして扱うフレームワークを提案する。
実験により、協調雑音場はロックステップなしで安定したアクティベーション統計を提供することが示された。
この研究が、ゲームAIにおけるコーディネートノイズのより広範な探索の動機になることを願っている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:40:29 GMT)
Hierarchies of Gaussian multimode entanglement from thermodynamic quantifiers [3.1] 本研究では, 純連続変数系における多モード絡みの熱力学的特性について述べる。
任意の純多モードガウス状態に対して、局所的エルゴトロピックギャップが任意の二分割にまたがる忠実な絡み合い単調であることを証明する。
我々は$k$-ergotropicスコアが$k$パーティションにまたがる多重モードの絡み合いを忠実に定量化することを示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:20:23 GMT)
Operational Robustness of LLMs on Code Generation [2.9] 現在、大規模言語モデル(LLM)のためのソフトウェア開発において、プログラムコードを生成するために使われるのが一般的である。
本稿では,LLMがコーディングタスクの記述の変化にどれほど敏感であるかを考察する。
このロバスト性を評価するための既存の技術は、自然言語記述の入力データ空間が離散的であるため、コード生成には適さない。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:21:13 GMT)
How Far Can We Go with Pixels Alone? A Pilot Study on Screen-Only Navigation in Commercial 3D ARPGs [2.9] 我々は、既存のオープンソースのビジュアルアベイランス検出器を構築し、スクリーンのみの探索とナビゲーションエージェントをインスタンス化する。
我々のエージェントは、ライブゲームフレームを消費し、有意な関心点を特定し、最小のアクション空間上で単純な有限状態コントローラを駆動する。
実験では、エージェントは最も必要なセグメントを横切ることができ、意味のある視覚的なナビゲーションの振る舞いを示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 23:15:18 GMT)
VoxelDiffusionCut: Non-destructive Internal-part Extraction via Iterative Cutting and Structure Estimation [2.8] 電池やモータなどの非破壊的内部部分の抽出は, リサイクルや処分場において重要である。
本研究では, 観察された切削面から内部構造を反復的に推定する対象内部部分の非破壊抽出法について検討した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 07:42:44 GMT)
Why measurements are made of effects [2.7] 我々は、$n$結果の測定値が、単位効果に要約して、$n$-tuples of empheffectsとしてモデル化されていることを論じる。
次に、GMT上でのエンファン確率状態の定義を行い、確率状態が測定を分離するすべてのGMTにおいて、測定が効果によって構成されていることを証明し、この分離条件が物理的に動機づけられていることを主張する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:39:46 GMT)
Think$^{2}$: Grounded Metacognitive Reasoning in Large Language Models [2.6] 大きな言語モデル(LLM)は強力な推論性能を示すが、確実に監視し、診断し、修正する能力は依然として限られている。
本稿では,アン・ブラウンの規制サイクルを構造的プロンプトアーキテクチャとして運用する,心理的基盤のメタ認知フレームワークを紹介する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:45:12 GMT)
When the Inference Meets the Explicitness or Why Multimodality Can Make Us Forget About the Perfect Predictor [2.6] 本研究は,人間とロボットの協調的な物体輸送タスクを実験ベッドとして用いる4つの異なる通信システムについて分析した。
システムは、エージェントとLiDARの間の力交換を検出し、環境を検出するための、フォースセンサーを備えたカスタムモバイルソーシャルロボットであるIVOに統合された。
75人のボランティアが合計255回の実行を3つのグループに分け、第1ラウンドで推論システムをテストし、第2ラウンドで通信システムを、第3ラウンドで統合戦略をテストした。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:27:10 GMT)
Optimal and Structure-Adaptive CATE Estimation with Kernel Ridge Regression [2.5] 再生カーネルヒルベルト空間(RKHS)に応答関数が存在する場合の条件平均処理効果(CATE)を最適に推定するアルゴリズムを提案する。
そこで本研究では,Nuisanceクラスではなく,コントラスト関数の複雑さに支配される最小値を達成するために,統一された2段階カーネルリッジ回帰法(KRR)を開発した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:29:31 GMT)
When Backdoors Go Beyond Triggers: Semantic Drift in Diffusion Models Under Encoder Attacks [2.5] エンコーダ側の中毒は持続的かつトリガーフリーなセマンティックな腐敗を引き起こすことを実証する。
バックドアは低ランクで目標中心の変形として機能し、局所的な感度を増幅し、乱れがセマンティックな近傍を連続的に伝播する。
本研究は, 拡散および対照的なパラダイムにまたがって検証され, エンコーダ中毒の深い構造的リスクを明らかにし, 単純な攻撃成功率を超える幾何的監査の必要性を強調した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 23:48:04 GMT)
A Symplectic Proof of the Quantum Singleton Bound [2.1] 安定化器の量子誤り訂正符号に対する量子シングルトン境界のシンプレクティック線形代数的証明を提案する。
この証明はパウリ作用素をモデル化した有限次元シンプレクティックベクトル空間の言語で定式化される。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 06:05:05 GMT)
Efficient Dynamic Test Case Generation for Path-Based Coverage Criteria [2.1] 4つのホワイトボックスパスベースのカバレッジ基準を満たす新しいテストケース生成手法を提案する。
提案手法はジョンソンアルゴリズムの修正版に基づいており, テストケースを段階的に, オンデマンドで生成することができる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:26:23 GMT)
Computational Complexity of Edge Coverage Problem for Constrained Control Flow Graphs [2.1] この記事では、明示的な制約で拡張された制御フローグラフのエッジカバレッジについて研究する。
この制約がエッジカバレッジの実現可能性と計算複雑性の両方にどのように影響するかを分析する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:51:51 GMT)
HAWX: A Hardware-Aware FrameWork for Fast and Scalable ApproXimation of DNNs [2.1] HAWXはハードウェア対応のスケーラブルな探索フレームワークで、AxCブロックの選択的統合を導くために多レベル感度スコアリングを利用する。
HAWXは、精度、パワー、面積の予測モデルによって支援され、候補構成の評価を加速する。
VGG-11、ResNet-18、EfficientNetLiteといった最先端のDNNベンチマークによる実験では、HAWXの効率性はネットワークサイズと指数関数的にスケールすることを示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:39:22 GMT)
Responsible Intelligence in Practice: A Fairness Audit of Open Large Language Models for Library Reference Services [1.9] 大規模言語モデル(LLM)は、情報支援へのアクセスを拡大する可能性を提供するが、トレーニングデータに埋め込まれた社会的バイアスを再現することもある。
本稿では,診断分類を併用した系統的評価手法を適用し,系統的差異と言語学的差異を検知し,その情報源を解釈する。
人種・民族による体系的な分化の証拠は見つからず、一つのモデルにおける性関係の分化の小さな証拠しか見つからない。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:05:03 GMT)
EvalSense: A Framework for Domain-Specific LLM (Meta-)Evaluation [1.9] 大規模言語モデル(LLM)のためのドメイン固有評価スイートを構築するためのフレームワークであるEvalSenseを提案する。
EvalSenseは、幅広いモデルプロバイダと評価戦略に対して、最初からサポートを提供しています。
EvalSenseの有効性を,非構造的医師と患者との対話から臨床ノートを作成するケーススタディで実証した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:50:43 GMT)
Gait Asymmetry from Unilateral Weakness and Improvement With Ankle Assistance: a Reinforcement Learning based Simulation Study [1.7] 片側筋の弱さは、しばしば非対称歩行につながり、中間調整と姿勢のタイミングを乱す。
本研究の目的は、進行性片側筋力低下が歩行対称性に与える影響を定量化し、足関節外骨格補助が歩行対称性を改善するかどうかを評価することである。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:04:37 GMT)
When Prompt Optimization Becomes Jailbreaking: Adaptive Red-Teaming of Large Language Models [1.5] 大規模言語モデル (LLMs) は、ハイテイクなアプリケーションにますます統合されている。
既存の安全性評価は、非適応的な敵を暗黙的に仮定して、有害なプロンプトの固定されたコレクションに依存している。
本研究では,現代言語モデルの脆弱性を,自動的,対角的,即時的な改善のために検討する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 05:35:26 GMT)
Adaptive Collaboration of Arena-Based Argumentative LLMs for Explainable and Contestable Legal Reasoning [1.5] ACALは、アリーナを基盤とした量的双極性論証フレームワーク(A-QBAF)と適応的マルチエージェント協調を統合する神経シンボルフレームワークである。
ACALは専門家のエージェントチームを動的に配置して議論を構築し、競合するクレームを判断するために衝突解決メカニズムを採用し、境界線事件に対して不確実性を認識したエスカレーションを利用する。
我々のフレームワークはHuman-in-the-Loop (HITL) の競合性ワークフローをサポートしており、ユーザーは基礎となる推論グラフを直接監査して修正して最終判断に影響を与えることができる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:47:13 GMT)
Initialization matters in few-shot adaptation of vision-language models for histopathological image classification [1.4] ゼロショットスライドレベル分類問題に対するゼロショット多重インスタンス学習(ZS-MIL)を提案する。
ZS-MILは、VLMテキストエンコーダのクラスレベルの埋め込みを分類層の開始点として使用し、各サンプルのバッグレベルの確率を計算する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:08:40 GMT)
Could Large Language Models work as Post-hoc Explainability Tools in Credit Risk Models? [1.3] ポストホックな説明責任は信用リスクモデルガバナンスの中心である。
本稿では,大規模言語モデル(LLM)が,コンテキスト内学習による信用リスク予測のためのポストホック説明可能性ツールとして機能するかどうかを検討する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:35:06 GMT)
PrivacyBench: Privacy Isn't Free in Hybrid Privacy-Preserving Vision Systems [1.3] 私たちはPrivacyBenchというベンチマークフレームワークを紹介しました。
FL + DPの組み合わせは、計算コストとエネルギー消費が大幅に増加する一方、精度は98%から13%に低下する。
我々のフレームワークは、YAMLの自動設定、リソース監視、再現可能なプロトコルを通じて、プライバシ・ユーティリティ・コストのトレードオフを評価するための最初の体系的なプラットフォームを提供する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:45:56 GMT)
Trotter Error and Orbital Transformations in Quantum Phase Estimation [1.3] 軌道変換がトロッター誤差に及ぼす影響について検討する。
軌道変換によるトロッター誤差を低減するための3つの戦略を検討する。
局在軌道基底は分子計算において大きなトロッター誤差を生じない。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:39:26 GMT)
Characterization of Residual Morphological Substructure Using Supervised and Unsupervised Deep Learning [0.8] 我々は、教師付き畳み込みニューラルネットワーク(CNN)と教師なし畳み込み変分オートエンコーダ(CvAE)を開発する。
「我々のユニークなデータ前処理アプローチを用いて、我々のDLネットワークへの入力が関心の銀河のみを構成するように残像を作成する。」
我々はPCA空間における制御CNN潜伏特性が$SPF$値と相関し,定性的に強い部分構造と弱い部分構造を区別することを発見した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:08:25 GMT)
Neuro-Symbolic Control with Large Language Models for Language-Guided Spatial Tasks [0.8] 低レベルの動作実行と高レベルの意味的推論を区別するニューロシンボリック・コントロール・フレームワークが提案されている。
このフレームワークは、強化学習やコストのかかるロールアウトを必要とせずに、解釈可能性、安定性、一般化を向上させる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:57:56 GMT)
RotorSuite: A MATLAB/Simulink Toolbox for Tilt Multi-Rotor UAV Modeling [0.8] 近年、空中プラットフォームは、受動飛行センサーから、多用途でコンタクト対応のロボットシステムへと進化してきた。
これらの新興プラットフォームの性能を適切に分析し、制御し、検証するには、正確なモデリングステップが必要である。
本稿では,多様なマルチロータプラットフォームのダイナミクスをモデル化し,シミュレーションするためのツールボックスを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:19:03 GMT)
Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning [0.7] 本稿では,マルチエージェントポリシー最適化に基づく炭素対応分散動的タスクオフロードフレームワークCADDTO-PPOを提案する。
このフレームワークは最低炭素強度を達成し、極端な交通負荷下では、ほぼゼロに近いオーバーフロー速度を維持する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 11:07:11 GMT)
Equivalence and Divergence of Bayesian Log-Odds and Dempster's Combination Rule for 2D Occupancy Grids [0.7] 本稿では,ベイジアン対数とデンプスターの占拠格子図における組み合わせ規則を公正に比較するための,便宜的変換に基づく方法論を提案する。
シミュレーションによるBetPマッチング,2つの実際のライダーデータセット,下流経路計画では,ベイジアン核融合が常に好まれる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:39:22 GMT)
Semantic Substrate Theory: An Operator-Theoretic Framework for Geometric Semantic Drift [0.7] ほとんどのセマンティックドリフト研究は、それらに関連する共有理論を持たない複数のシグナルを報告している。
本稿では, タイムインデクシング基板上でのこれらの信号の形式化を提案する。
この基板内では、ノードレベルの近傍ドリフトは局所的な条件分布の変化を計測する。
入射負曲率のノードレベルの集合であるブリッジ質量は、将来の地区再配線の予測器として導入される。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 03:04:21 GMT)
Systematic Analysis of Coupling Effects on Closed-Loop and Open-Loop Performance in Aerial Continuum Manipulators [0.7] 本稿では,空中連続体マニピュレータ(ACM)の動的モデリングに対する2つの異なるアプローチについて検討する。
第一の目的は、分離されたモデルが結合されたモデルに匹敵する精度に達する条件を決定することである。
この解析を閉ループ性能に拡張するため、新しいダイナミックスベースの比例微分スライディングモード画像ベースビジュアルサーボコントローラを開発した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 01:18:34 GMT)
ADAB: Arabic Dataset for Automated Politeness Benchmarking -- A Large-Scale Resource for Computational Sociopragmatics [0.6] 4つのオンラインプラットフォームから収集された新たな注釈付きアラビア語データセットであるADAB(アラビア語ポリテネスデータセット)を紹介する。
このデータセットはアラビア語の伝統とプラグマティック理論に基づいて注釈付けされ、3つのクラス(丁寧、不規則、中性)に分類された。
16の丁寧なカテゴリーにまたがる言語的特徴アノテーションを持つ10,000のサンプルを含み、アノテータ間の実質的な合意を達成している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:59:36 GMT)
TIACam: Text-Anchored Invariant Feature Learning with Auto-Augmentation for Camera-Robust Zero-Watermarking [0.5] TIACamは、カメラロスゼロウォーターマーキングのための自動拡張を備えたテキストアンコール不変な特徴学習フレームワークである。
合成カメラと実世界のカメラの両方の実験は、TIACamが特徴安定性と透かし抽出精度を達成することを示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:06:16 GMT)
Subtle Motion Blur Detection and Segmentation from Static Image Artworks [0.5] ストリーミングサービスは世界中の数億の視聴者にサービスを提供しており、サムネイル、ボックスアート、カバーイメージなどのビジュアルアセットがエンゲージメントに不可欠である。
サブトルモーションのぼかしは、視力の明快さを減らし、ユーザの信頼とクリックスルー率に悪影響を及ぼすような、広範にわたる品質問題のままである。
複数の粒度でゼロショット検出が可能なエンドツーエンド検出器と高品質なモーションぼかし特定データセット生成を組み合わせた統合フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 04:59:29 GMT)
Whisper: Courtside Edition Enhancing ASR Performance Through LLM-Driven Context Generation [0.5] 本稿では,Whisperの書き起こしを再学習せずに拡張する,新しい多エージェント大規模言語検出モデル(LLM)を提案する。
このパイプラインは、Whisperの最初の書き起こしをインターセプトし、ドメインコンテキストの識別、名前付き認識エンティティ、jargonに特殊なLLMエージェントを適用し、Whisperのデコーダをガイドするコンパクトプロンプトを生成する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 22:15:59 GMT)
Nazrin: Atomic Tactics for Graph Neural Networks for Theorem Proving in Lean 4 [0.4] 本稿では,機械支援定理証明が直面する障害に対処するための新しい概念と能力を紹介する。
Nazrin Proverは、原子戦術とExprGraphを用いたグラフニューラルネットワークに基づく定理証明エージェントである。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:12:51 GMT)
Yor-Sarc: A gold-standard dataset for sarcasm detection in a low-resource African language [0.3] ニジェール・コンゴ語(英語版)は50万ドル以上の人々が話す音素言語である。
データセットは、さまざまな方言の背景から3つのネイティブスピーカーによって注釈付けされた436のインスタンスで構成されている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 22:10:18 GMT)
TRUE: A Trustworthy Unified Explanation Framework for Large Language Model Reasoning [0.3] 大規模言語モデル(LLM)は複雑な推論タスクにおいて強力な能力を示してきたが、その意思決定プロセスは解釈が難しいままである。
本稿では,実行可能推論検証,実現可能な領域指向非巡回グラフ(DAG)モデリング,因果故障モード解析を統合したTrustworthy Unified Explanation Framework(TRUE)を提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:00:54 GMT)
Contradiction to Consensus: Dual Perspective, Multi Source Retrieval Based Claim Verification with Source Level Disagreement using LLM [0.2] 事実確認と呼ばれるクレーム検証は、潜在的な誤情報を特定するのに役立つ。
ほとんどの自動クレーム検証システムは単一の知識源に依存している。
オープンドメインのクレーム検証のための新しいシステムを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 02:21:31 GMT)
Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects [0.1] 我々は,大規模言語モデル (LLM) が人間のような認知バイアスを呈するかどうかを検討する。
最も関係の深い2つのバイアスが選択された: 悪質な犠牲者効果(VVE)、隣り合う同意があるときにその減少に重きを置き、権威に基づくハロ効果(占領、会社、資格)である。
我々の研究は、VVEが大きいこと、隣接するコンテンツに統計的に有意なペナルティがないこと、そしてハロ効果が人間に比べてわずかに減少することを発見した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 02:29:20 GMT)
Issues with Measuring Task Complexity via Random Policies in Robotic Tasks [0.0] 強化学習(RL)の主な課題は、タスクの複雑さを測定することである。
非タブラル領域におけるタスクの複雑さを評価するための指標はほとんどない。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:38:02 GMT)
Why Agent Caching Fails and How to Fix It: Structured Intent Canonicalization with Few-Shot Learning [0.0] キャッシュの有効性は、分類精度ではなく、キーの一貫性と精度を必要とする。
構造化意図分解フレームワークであるW5H2を紹介する。
NyayaBench v2 (20クラス)では、SetFitは55.3%を達成し、30言語にまたがる言語間転送を実現している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 18:25:18 GMT)
What Distributed Computing Got Wrong: The Category Mistake That Turned Design Choices into Laws of Nature [0.0] フィッシャー・リンチ・パターソンの定理、二元問題、CAPの定理は、座標の物理的極限に関する発見として広く理解されている。
この論文は、それらはどんな種類のものでもないと論じている。
これらはカテゴリーミスの結果であり、フォワード・イン・タイム・オンリー(FITO)情報フローを自然法則として扱う。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 05:16:56 GMT)
UniRank: A Multi-Agent Calibration Pipeline for Estimating University Rankings from Anonymized Bibliometric Signals [0.0] We present UniRank, a multi-agent pipeline that estimated college position across global ranking system。
システムは、匿名化された機関メトリクスからのゼロショット推定、システムごとのツール強化校正、そして最終合成という3段階のアーキテクチャを採用している。
The Times Higher Education(THE) World University Rankings(n=352$)では、MAE = 251.5、Median AE = 131.5、PNMAE = 12.03%、Spearman $= 0.769$、Kendall $= 0.591$、 hit rate @50 = 20.7%となる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:50:55 GMT)
Toward Manifest Relationality in Transformers via Symmetry Reduction [0.0] トランスフォーマーモデルは、実質的な内部冗長性を含んでいる。
近年のアプローチでは、対称性を明示的に破ることによってこの問題に対処している。
対称性の低減に基づく相補的な枠組みを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:43:17 GMT)
The coordination gap in frontier AI safety policies [0.0] 我々は、フロンティアAI安全政策が予防に重点を置いている一方で、予防が失敗した場合に応答を調整するための機関能力を無視していると論じる。
我々は、同様のメカニズム -- コミット前、共有プロトコル、待機調整場所 -- が、フロンティアAIガバナンスに適応できることを提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 00:26:45 GMT)
The Convergence of Schema-Guided Dialogue Systems and the Model Context Protocol [0.0] 本稿では、互換性誘導対話(SGD)とモデルコンテキストプロトコル(MCP)の基本的な収束性を確立する。
SGD と MCP は、決定論的で監査可能な LLM-エージェント相互作用のための統一パラダイムの2つの現れを表す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:02:35 GMT)
SCHEMA for Gemini 3 Pro Image: A Structured Methodology for Controlled AI Image Generation on Google's Native Multimodal Model [0.0] SCHEMAは、850の検証済みAPI予測を含む、システマティックなプロフェッショナルプラクティスに基づいて構築された、エンジニアリングされたフレームワークである。
SchEMAは、探索的(約5%)から指示的(約95%)まで実践者のコントロールを拡大する
主要な発見は、621個の構造化プロンプトにまたがる91%の強制コンプライアンス率と94%の禁制コンプライアンス率である。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:51:40 GMT)
Robustness of Deep ReLU Networks to Misclassification of High-Dimensional Data [0.0] 入力の小さな加法的ランダム摂動が誤分類をもたらす確率を定量化することにより、与えられたネットワーク入力における局所ロバスト性を分析する。
整合線形単位を持つディープネットワークでは、入力次元とネットワーク単位の総数の観点から局所ロバスト性に対する低い境界を導出する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 00:55:47 GMT)
Rank-Aware Spectral Bounds on Attention Logits for Stable Low-Precision Training [0.0] 変圧器における注意スコアは、低精度トレーニングにおけるオーバーフローリスクを最大で支配する2次形式である$S_ij = x_itop M x_j / sqrtd_h$である。
相互作用行列 $M = WQ WKtop$ が階数 $r ll d$ を持つとき、$max_i,j|S_ij|$ は $exp(-d22/) となる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:29:22 GMT)
Predicting Magic from Very Few Measurements [0.0] 非安定化器性は、任意の$m$$$n$-qubit Pauli測定を用いて目撃および定量化可能であることを示す。
また, 安定度が低下したポリトープのメンバシップがNPハードであることも証明した。
特に、$mathrmP = mathrmNP$ でない限り、$m$ のアルゴリズムは、この問題を完全な一般性で解くことができない。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 19:13:43 GMT)
Orchestrating LLM Agents for Scientific Research: A Pilot Study of Multiple Choice Question (MCQ) Generation and Evaluation [0.0] 大規模言語モデル (LLMs) は急速に科学的研究を変容させているが、これらのシステムが研究活動を再形成する方法に関する実証的な証拠は依然として限られている。
人間の研究者が複数のLSMエージェントを協調してデータ抽出、コーパス構築、アーティファクト生成、アーティファクト評価を行うAIオーケストレーション研究ワークフローの混合手法によるパイロット評価を報告する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:20:07 GMT)
Nonabelian Anyons attached to Superconducting Islands in FQH Liquids [0.0] 2次元分数量子ホール(FQH)系におけるエノンの理論的基盤を再検討する。
超伝導島によって誘導される非アーベル異性体状態のロバストな予測を実証する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:06:32 GMT)
Neural Fields as World Models [0.0] 機械学習の世界モデルは視覚入力を潜在空間に圧縮し、知覚皮質を特徴付ける空間構造を捨てる。
我々は、物理予測が抽象状態遷移ではなく幾何学的伝播となるよう、感覚トポロジーを保存するアーキテクチャーを提案する。
3つの実験がこのアプローチを支持している:(1)局所接続は弾道物理学を学ぶのに十分であり、(2)テイルポーティングよりも中間位置を横断する予測、(2)遅延空間のオルタナティブの約2倍の速度で実物理への想像的移動で完全に訓練されたポリシー、(3)運動制御チャネルは、ビジュモータ予測だけで自然に身体選択的エンコーディングを発達させる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 01:52:43 GMT)
Mott-insulating phases of the Bose-Hubbard model on quasi-1D ladder lattices [0.0] 半充填ラグ格子上のBose-Hubbardモデルの位相図を計算する。
ラング・モット絶縁体(RMI)に類似した相は、他の準1次元格子構造に存在することが判明した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:13:33 GMT)
Integrable cascaded frequency conversion using the time rescaling shortcut to adiabaticity [0.0] 2つの同時3波混合プロセスの結合方程式をSTIRAP系で記述する方法を示す。
次に,時間再スケーリング(TR)法を光学系に適用し,変換プロセスに適用してTR-STIRAPプロトコルを作成する方法について検討する。
このプロトコルは、光子源の統合や量子鍵分布の効率的な検出器など、いくつかの分野で使われる可能性がある。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 18:44:08 GMT)
INDUCTION: Finite-Structure Concept Synthesis in First-Order Logic [0.0] 拡張ラベル付き対象述語を持つ小さな有限リレーショナル世界が与えられると、モデルは、その対象を全世界で均一に説明する1階の論理式を出力しなければならない。
急激な難易度勾配, 永続的な硬い構造族を見いだし, 低肥大化の公式が保留世界をはるかに良く一般化するのを観察した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:21:40 GMT)
HEHRGNN: A Unified Embedding Model for Knowledge Graphs with Hyperedges and Hyper-Relational Edges [0.0] 実世界の知識ベースは、バイナリエッジで表現できない複雑な事実とn-aryな事実のかなりのシェアを持っている。
ハイパーエッジとハイパーリレーショナルエッジの両方を持つn-aryリレーショナルKGに対する統一的な埋め込みモデルを提案する。
また、ハイパーエッジおよびハイパーリレーショナルデータセットのベースラインモデルよりもリンク予測性能が改善されている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 16:38:23 GMT)
GenPlanner: From Noise to Plans -- Emergent Reasoning in Flow Matching and Diffusion Models [0.0] GenPlannerは拡散モデルとフローマッチングに基づくアプローチであり、DiffPlannerとFlowPlannerの2つのバリエーションがある。
迷路内の正しい経路の探索と生成のための生成モデルの適用を実証する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 12:12:45 GMT)
GLaDiGAtor: Language-Model-Augmented Multi-Relation Graph Learning for Predicting Disease-Gene Associations [0.0] 疾患遺伝子関連を理解することは、疾患のメカニズムを悪化させ、診断と治療の進歩に不可欠である。
既存のモデルにおける制約に対処するため,病因関連予測のためのエンコーダデコーダアーキテクチャを備えた新しいGNNフレームワークであるGLaDiGAtorを提案する。
GLaDiGAtorは、キュレートされたデータベースから遺伝子・遺伝子・疾患・疾患・疾患・遺伝子・疾患の相互作用を統合した異種生物学的グラフを構築する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 09:26:44 GMT)
Frozen and Growing Quantum Work under Noise: Coherence and Correlations as Key Resources [0.0] 量子系におけるエルゴトロピーの非コヒーレントかつコヒーレントな寄与への分解について検討する。
ノイズはエネルギー貯蔵を補助し、ノイズの従来の見方に純粋に有害であることを示す。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 15:01:45 GMT)
From ARIMA to Attention: Power Load Forecasting Using Temporal Deep Learning [0.0] 本稿では,従来の統計モデルと,短期エネルギー負荷予測のためのディープラーニング手法の実証評価を行う。
ARIMA、LSTM、BiLSTM、Transformerの4つのモデルがPJM Hourly Energy Consumptionデータに利用された。
トランスフォーマーモデルは自己認識アルゴリズムに依存しており、MAPEの3.8%で最良の結果を生み出した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:51:49 GMT)
Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation [0.0] 本稿では,知識空間理論を位置に基づく推薦に変換する公式なフレームワークであるExploration Space Theory(EST)を紹介する。
有効なユーザ探索状態が有限分布格子と良好な学習空間を形成することを証明した。
これらの基盤に基づいて、探索空間レコメンダシステム(ESRS)を規定する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 21:33:04 GMT)
Explainable Regime Aware Investing [0.0] 本稿では,厳密な因果関係を持つ Wasserstein Hidden Markov Model に基づくレシック・アウェア・ポートフォリオ構築フレームワークを提案する。
ワッサーシュタインHMMレジームは、等重量およびSPXの買いと持ち株のベンチマークと対照的に、非常に高いリスク調整性能を達成している。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 00:33:16 GMT)
Exact Attention Sensitivity and the Geometry of Transformer Stability [0.0] 現代のAIの力にもかかわらず、トランスフォーマーは神秘的に訓練に不安定なままだ。
我々は、なぜPre-LayerNormが機能するのか、なぜDeepNormが$N-1/4$スケーリングを使っているのか、なぜウォームアップが必要なのかを説明する安定性理論を開発する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:25:24 GMT)
DeepInterestGR: Mining Deep Multi-Interest Using Multi-Modal LLMs for Generative Recommendation [0.0] DeepInterestGRはジェネレーティブレコメンデーションフレームワークで3つの重要なイノベーションを紹介している。
我々は,マルチLLM の関心マイニング,奥行きラベルの深層関心,および関心度向上アイテムの離散化を活用している。
3つのAmazon Reviewベンチマークの実験では、DeepInterestGRが最先端のベースラインを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:03:06 GMT)
Benchmarking Computational Pathology Foundation Models For Semantic Segmentation [0.0] CONCH、PathDino、CellViTのコンカレント機能は、すべてのデータセットで個々のモデルのパフォーマンスを7.95%向上させた。
視覚言語基盤モデルであるCONCHは,視覚のみの基礎モデルと比較して,データセット間で最高の性能を示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 08:00:46 GMT)
ArabicNumBench: Evaluating Arabic Number Reading in Large Language Models [0.0] 東アラビア・インド数字 (0-9) と西アラビア数字 (0-9) にまたがるアラビア数字読解タスクにおける大きな言語モデルを評価する。
6つのカテゴリにまたがる210個の数字読解タスクに対して,0ショット,0ショット,0ショット,数ショット,数ショットのCoT)の4つのプロンプト戦略を用いて,10プロバイダから71個のモデルを評価した。
本評価は,59,010件の個別試験事例と,構造化出力の生成量を測定するトラック抽出手法からなる。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 10:00:56 GMT)
AgenticTyper: Automated Typing of Legacy Software Projects Using Agentic AI [0.0] JavaScriptシステムには型安全性がなく、メンテナンスが危険である。TypeScriptは役に立ちますが、手動で型を追加するのは高価です。
本稿では,Large Language Model (LLM) を用いたエージェントシステムである AgenticTyper を提案する。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:53:30 GMT)
ABD: Default Exception Abduction in Finite First Order Worlds [0.0] 有限個の一階世界に対するデフォルト例外減退のベンチマークであるABDを導入する。
異常述語を含む背景理論が与えられた場合、モデルは例外を定義した一階述語を出力し、例外をスパースに保ちながら満足度を回復しなければならない。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 14:14:35 GMT)
AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting [0.0] AAVGenは、マルチトレイプロファイルが強化されたAAVキャプシドのデノボ設計のための生成人工知能フレームワークである。
AAVGenは、タンパク質言語モデル(PLM)と、教師付き微調整(SFT)と、グループシーケンスポリシー最適化(GSPO)と呼ばれる強化学習技術を統合する。
AAVGenは新規なVP1タンパク質配列の多種多様なライブラリーを産生することを示した。
論文参考訳(メタデータ) (Sat, 21 Feb 2026 17:46:34 GMT)