Modeling Dependency-Propagated Ecosystem Impact of Changes in Maintenance Activities: Evaluating Support Strategies in the PyPI Network [83.2] 我々は、Python Package Index(PyPI)エコシステムを通じて、メンテナンスアクティビティの変化がどのように伝播するかをキャプチャする、エコシステム影響の依存性を意識したモデルを紹介します。
以上の結果から, モデルによる生態系への影響の大部分が, 依存伝搬の影響に基づいて優先順位付けされた場合のPyPIパッケージ全体の0.1%に過ぎなかったことが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:51:00 GMT)
Earth-o1: A Grid-free Observation-native Atmospheric World Model [81.6] 我々は、構造的制約を克服する観測ネイティブな大気圏モデルであるEarth-o1を提示する。
多様なセンサー入力を統一されたグリッドフリーな力学場に統合することにより、モデルは空間と時間の大気状態を自律的に前進させる。
本稿では,このパラダイムにより,明示的な数値解法のオーバーヘッドを伴わずに,直接的,リアルタイムな予測とクロスセンサ推論が可能となることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:27:48 GMT)
OpenGaFF: Open-Vocabulary Gaussian Feature Field with Codebook Attention [80.5] オープンな3Dシーン理解のための新しいフレームワークであるOpenGaFFについて述べる。
我々の手法の中核はガウス的特徴場であり、ガウス幾何学と外見の連続関数として意味論をモデル化する。
オブジェクトレベルのセマンティック一貫性をさらに強化するために、共有セマンティックプリミティブのセットとして機能する構造化コードブックを導入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:10:07 GMT)
Safactory: A Scalable Agent Factory for Trustworthy Autonomous Intelligence [79.8] textbfSafactoryは、信頼できる自律知能のためのスケーラブルなエージェントファクトリです。
Safactoryは、トラジェクトリ生成のためのtextbfParallel Simulation Platform、トラジェクトリストレージとエクスペリエンス抽出のための textbfTrustworthy Data Platform、非同期強化学習のための textbfAutonomous Evolution Platformの3つの密結合プラットフォームを統合している。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:21:15 GMT)
MedHorizon: Towards Long-context Medical Video Understanding in the Wild [78.8] 実際の臨床検査には、フルプロデュースなビデオ理解が必要であることが多い。
既存のベンチマークでは、この証拠はすでに画像やショートクリップ、あるいは事前にセグメンテーションされたビデオを通じてローカライズされていると仮定することが多い。
MedHorizonは、長文医用ビデオ理解のためのWildベンチマークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:37:10 GMT)
DynT2I-Eval: A Dynamic Evaluation Framework for Text-to-Image Models [78.6] テキスト・トゥ・イメージ(T2I)モデルのための完全に自動化された動的評価フレームワークであるDynT2I-Evalを提案する。
長い形式の記述から構造化された視覚意味空間を構築し、プロンプトを制御可能な次元に分解する。
DynT2I-Evalは、テキストアライメント、知覚品質、美学のモデル性能を評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:53:51 GMT)
StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction [76.5] StraTAは、エージェント強化学習に明確な軌道レベルの戦略を導入するフレームワークである。
ALFWorld、WebShop、SciWorldの実験では、StraTAはサンプル効率と最終的なパフォーマンスの両方を一貫して改善している。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:51:16 GMT)
Intentmaking and Sensemaking: Human Interaction with AI-Guided Mathematical Discovery [72.5] インテントメイキングという別のワークフローを特定し、特徴付けします。
私たちはこれをセンスメイキングの自然な拡張と捉えています。
これらのテーマのドキュメンテーションは、科学的発見のためのAIツール設計へのアプローチを示唆している。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:30:25 GMT)
BAMI: Training-Free Bias Mitigation in GUI Grounding [72.1] 我々は、これらのバイアスを効果的に軽減するために、粗い焦点と候補選択という2つの重要な操作を組み込んだtextbfBias-Aware Manipulation Inference (BAMI)を導入する。
BAMIは、トレーニングフリー環境で様々なGUIグラウンドモデルの精度を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:59:31 GMT)
MARBLE: Multi-Aspect Reward Balance for Diffusion RL [71.6] 強化学習は、拡散モデルと人間の嗜好を整合させる主要なアプローチとなっている。
既存のプラクティスは、報酬ごとに1つのスペシャリストモデルをトレーニングすることで、複数の報酬を処理します。
我々は,各報酬に対する独立な優位推定器を維持する勾配空間最適化フレームワークMARBLEを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:20:42 GMT)
TACT: Mitigating Overthinking and Overacting in Coding Agents via Activation Steering [71.0] 我々は、エージェントが既に持っている情報に対して繰り返し理由付けを行う2つの障害モードと、最近の観察を統合したり、新たな証拠を取得することなくツールコールを発行する2つの障害モードに焦点を当てる。
本稿では,活性化ステアリングによるTACT (Think-Act via activation Steering) を導入し,動作不良として現れる前に残留流中のエージェントの漂流を検知・緩和する。
具体的には、軌道のステップを過度に考え、過剰に実行し、あるいは校正し、隠れた状態が2つの *drift 軸* に沿って線形に分離できることを発見し、それぞれの障害モードに向かって校正された振る舞いを指示する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:24:27 GMT)
Revisiting Uncertainty: On Evidential Learning for Partially Relevant Video Retrieval [70.5] 部分的関連性のあるビデオ検索は、部分的コンテンツのみを記述するテキストクエリを使って、未編集の動画を検索することを目的としている。
この設定では、曖昧なクエリはしばしばビデオ間のセマンティックなあいまいさを引き起こす。
我々は,多粒質のクロスモーダルな証拠を集約し,不確実性を定量化し,モデル化する階層的顕在的学習フレームワークであるHolmesを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:06:13 GMT)
On Training in Imagination [70.0] 最先端のモデルに基づく強化学習手法は、想像上のロールアウトに関するポリシーを訓練する。
学習力学と報酬モデルにおける誤差が回帰や政策最適化に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:51:32 GMT)
RAWild: Sensor-Agnostic RAW Object Detection via Physics-Guided Curve and Grid Modeling [70.0] textbfRAWildは、センサに依存しないRAWオブジェクト検出のための物理誘導型グローバルローカルトーンマッピングフレームワークである。
我々は、様々なスペクトル感度、照度、センサ非理想性にまたがるリアルなセンサ出力を合成する物理ベースのRAWシミュレーションパイプラインを構築した。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:51:47 GMT)
Consistent Geometric Deep Learning via Hilbert Bundles and Cellular Sheaves [68.7] 本稿では,多様体上の無限次元信号に対する新しい畳み込み学習フレームワークを提案する。
HilbNetsと、より一般的には、2段階のサンプリング手順により、畳み込み操作を実装できるようにします。
我々の結果は、古典ラプラシア語に基づくフレームワークを、各点の信号が自身のヒルベルト空間に存在するような設定へと持ち上げることで、幾何学的学習の全体範囲を広げる。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:08:58 GMT)
Perceive, Route and Modulate: Dynamic Pattern Recalibration for Time Series Forecasting [68.5] 現在の深い予測モデルは、すべての時間トークンに一様に適用される固定重み行列に依存している。
トークンレベルの再校正によってこれを解決するバックボーンに依存しないメカニズムであるDynamic Pattern Recalibrationを導入する。
DPRNetは12ベンチマークで競合性能を達成し、マクロパラメータスケーリングに対する動的リカバリを検証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:12:47 GMT)
SkillOS: Learning Skill Curation for Self-Evolving Agents [67.9] 本稿では,自己進化エージェントのスキルキュレーションを学習するための,経験駆動型RLトレーニングレシピであるSkillOSを提案する。
SkillOSは、凍結したエージェントエグゼキュータとトレーニング可能なスキルキュレーターを組み合わせて、蓄積したエクスペリエンスから外部SkillRepoを更新する。
SkillOSは、メモリフリーと強力なメモリベースラインを、有効性と効率の両方で一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:31:50 GMT)
The autoPET3 Challenge -- Automated Lesion Segmentation in Whole-Body PET/CT - Multitracer Multicenter Generalization [67.9] 第3回オートPETチャレンジ(MICCAI 2024)の設計と成果を報告する。
全身PET/CTにおける自動病変分割を, 構成的一般化条件下でベンチマークした。
トップランクのアルゴリズムは平均DSCが0.66、FNVが3.18mL、FPVが2.78mLである。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:07:09 GMT)
Milestone-Guided Policy Learning for Long-Horizon Language Agents [67.9] 我々は,長軸言語エージェントを訓練するためのマイルストーン誘導型政策学習フレームワークBEACONを紹介する。
ALFWorld、WebShop、ScienceWorldでは、BEACONはGRPOとGiGPOを一貫して上回っている。
これらの結果から,長期言語エージェントの訓練に有効なパラダイムとして,マイルストーン・アチョンド・クレジット・アサインが確立された。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:00:40 GMT)
Logic-Regularized Verifier Elicits Reasoning from LLMs [63.7] 論理規則で正規化された教師なしの検証器であるLOVERを提案する。
ローバーは、定理を二項潜在変数として扱い、内部の活性化を活用し、3つの論理的制約を課す。
ローバーは教師なしのベースラインを大幅に上回る。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:03:49 GMT)
MIST: Multimodal Interactive Speech-based Tool-calling Conversational Assistants for Smart Homes [63.1] MIST(Multimodal Interactive Speech-based Tool-calling)は,IoTデバイス上で動作する合成マルチターン音声駆動型コード生成タスクである。
オープンウェイト LLM とクローズドウェイト LLM の間には大きなギャップがあり、クローズドウェイト LLM にもかなりのヘッドルームがあることが判明した。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:57:39 GMT)
X-Voice: Enabling Everyone to Speak 30 Languages via Zero-Shot Cross-Lingual Voice Cloning [62.7] X-Voiceは、任意の音声をクローンし、誰でも30の言語を話せる多言語ゼロショット音声クローンモデルである。
X-Voiceは国際音声アルファベット(IPA)を統一表現として420K時間多言語コーパスで訓練されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:57:53 GMT)
Toward Visually Realistic Simulation: A Benchmark for Evaluating Robot Manipulation in Simulation [62.5] 既存のベンチマークには視覚的リアリズムがなく、シミュレーションと現実の間に大きな領域ギャップが生じる。
シミュレーションにおけるロボット操作評価のための,視覚的にリアルなベンチマークであるVISERを提案する。
VISERは、物理ベースのレンダリング(PBR)素材を備えた1000以上の3Dアセットの高忠実度データセットと、それらのアセットから作成される3Dシーンを、レイアウトや生成によって構成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:13:05 GMT)
AdpSplit: Error-Driven Adaptive Splitting for Faster Geometry Discovery in 3D Gaussian Splatting [62.0] 本稿では、エラー駆動型適応分割演算子であるAdpSplitを紹介し、分割子数を決定し、L1-ピクセルエラー領域統計から子パラメータを初期化する。
MipNeRF360、Deep-Blending、Thans&Templesのデータセット全体で、AdpSplitは、複数の加速された3DGSパイプラインのトレーニング時間を9.2%から22.3%削減する。
FastGSでは、AdpSplitはMipNeRF360上の全スケジュールPSNRと一致し、トレーニング時間を16.4%削減し、バニラ3DGSの12.6倍加速に対応している。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:23:16 GMT)
The Granularity Axis: A Micro-to-Macro Latent Direction for Social Roles in Language Models [61.3] マイクロレベルの個人経験からマクロレベルの組織,制度的,あるいは国家的推論に至るまで,大きな言語モデルが社会的役割をコードしていることを示す。
以上の結果から,社会的役割の粒度は単にスタイリスティックな表面特徴ではなく,言語モデル行動における構造的,秩序的,因果的に操作可能な潜在方向である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:08:19 GMT)
Teaching Thinking Models to Reason with Tools: A Full-Pipeline Recipe for Tool-Integrated Reasoning [59.7] そこで本研究では,ツール使用の自然な動作を,ツールなし推論能力を犠牲にすることなく,強力な思考モデルに注入する方法を示す。
提案手法は,オープンソースモデル間のベンチマークにおいて,最先端のパフォーマンスを実現するモデルを生成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:23:21 GMT)
Navigating by Old Maps: The Pitfalls of Static Mechanistic Localization in LLM Post-Training [59.5] 教師付き微調整プロセスを通してトランスフォーマー回路の構造変化を系統的に追跡する。
実験結果から,回路はパラメータ更新時に本質的に「自由進化」を示すことが明らかとなった。
この研究は、機械的ローカライゼーションにおける「予見」の必要性を浮き彫りにし、将来の研究の枠組みを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:59:52 GMT)
Decomposing the Basic Abilities of Large Language Models: Mitigating Cross-Task Interference in Multi-Task Instruct-Tuning [58.9] 大規模言語モデル(LLM)におけるマルチタスクインストラクトチューニングは、主にマルチタスクインストラクトチューニングによって駆動されている。
トレーニングパラダイムは、異なるタスク間で共有されたパラメータよりも勾配が矛盾するため、クロスタスク干渉と呼ばれる重要な問題に悩まされる。
本稿では,LLMパラメータを基本能力を表す高特異値LoRAエキスパートに分解するBADITを提案する。
6LLMのSuperNIベンチマークで広範な実験を行い、実験結果から、BADITはSOTA法より優れ、クロスタスク干渉の程度を緩和できることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:08:58 GMT)
FedAttr: Towards Privacy-preserving Client-Level Attribution in Federated LLM Fine-tuning [58.8] 我々はフェデレート学習のための新しいクライアントレベルの属性プロトコルであるFedAttrを提案する。
FedAttrは、ペア化されたサブセット差分メカニズムを通じて、ウォーターマークされたデータでトレーニングされたクライアントを特定する。
100%のTPRと0%のFPRを達成し、TPRでは少なくとも44.4%、FPRでは19.1%を上回り、FLトレーニング時間に比べて6.3%のオーバーヘッドしか残っていない。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:21:02 GMT)
Uncovering Entity Identity Confusion in Multimodal Knowledge Editing [58.1] マルチモーダル知識編集は、展開後の大規模視覚言語モデルの内部知識を補正することを目的としている。
エンティティ・アイデンティティ・コンフュージョン(EIC)と呼ばれる編集モデルにおけるシステム障害モードを同定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:14:54 GMT)
Continuous-Time Distribution Matching for Few-Step Diffusion Distillation [57.3] 本稿では,CDM(Continuous-Time Distribution Matching)を導入し,DMDフレームワークを個別アンカーから連続最適化へ移行する。
まず、固定離散スケジュールをランダム長の動的連続スケジュールに置き換える。
第二に、学生の速度場を介して外挿された潜伏者に対してアクティブな軌道外マッチングを行う連続時間アライメント目的を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:56:39 GMT)
Belief Memory: Agent Memory Under Partial Observability [56.4] 本稿では,メモリパラダイムを観測毎に1つの結論にシフトし,その確率で複数の結論を導出するBeliefMemを提案する。
BeliefMemは決定論的パラダイムが破棄されるという不確実性を保ち、エージェントが高い信頼を持って行動することを可能にする。
LoCoMoとALFWorldベンチマークの実証的な評価は、限られたデータであっても、BeliefMemが最高の平均パフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:03:13 GMT)
One Turn Too Late: Response-Aware Defense Against Hidden Malicious Intent in Multi-Turn Dialogue [56.0] マルチターン対話における隠れた悪意のある意図は、大規模言語モデル(LLM)に対する脅威を増大させる
近年の研究では、安全アライメントや外部ガードレールの進歩にもかかわらず、高度なガードレールを備えた近代的な商用モデルでさえも、このような攻撃に対して脆弱であることが示されている。
そこで本研究では,この課題に対処するため,最も早いタイミングで候補応答を届けることによって,蓄積された相互作用が有害な作用を可能にするのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:35:31 GMT)
Reflections and New Directions for Human-Centered Large Language Models [55.8] 大規模言語モデル(LLM)は、ユーザのプライベートおよびプロフェッショナルな生活をますます形作っている。
本研究は,Human-Centered Large Language Models(HCLLMs)の開発のためのフレームワークを提案する。
言語モデリングの倫理、経済、技術的目的を考えると、モデル開発者は人間の関心事、嗜好、価値観、目標に対処する必要があると論じる。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:02:53 GMT)
GR-Ben: A General Reasoning Benchmark for Evaluating Process Reward Models [55.6] GR-BenはPRMの性能を2つの主要な推論領域(科学と論理)と9つの分野にまたがって評価するプロセスレベルのベンチマークである。
数学的推論以外の領域では、既存のPRMとLSMの誤差検出能力は比較によって著しく弱い。
一般に、PLMは知識に基づく誤りを識別する能力が低いが、LSMは計算誤差を検出する性能が劣っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:32:54 GMT)
Segment-Aligned Policy Optimization for Multi-Modal Reasoning [55.3] 本稿では、トークンや全シーケンスではなく、一貫性のある推論ステップをポリシー更新の基本単位として扱う新しい強化学習パラダイムを提案する。
代表的な推論ベンチマークの実験は、SAPOがトークンレベルおよびシーケンスレベルポリシー最適化手法を一貫して上回っていることを示している。
我々の研究は、強化学習の更新を推論の構造と整合させることの重要性を強調し、複雑な推論タスクにおけるより効率的でセマンティックに根ざした政策最適化の道を開く。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:09:44 GMT)
Training-Free Dense Hand Contact Estimation with Multi-Modal Large Language Models [55.0] 難易度接触推定には高レベルの意味理解と微粒な幾何学的推論が必要である。
本研究では,MLLMを用いた高密度手接触推定のためのトレーニングフリーでゼロショットアプローチであるContactPromptを提案する。
本手法は, 高精度な手接触推定を実現しつつ, MLLMの推論能力を効果的に活用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:57:27 GMT)
Layer Collapse in Diffusion Language Models [54.9] 拡散言語モデル (DLM) は自己回帰言語モデル (AR) の代替として登場した。
DLMの層崩壊は, 過度なトレーニングによるものではなく, 過度なトレーニングによるものであることを示す。
私たちの発見は、非常に実践的な意味を持っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:39:40 GMT)
TriRelVLA: Triadic Relational Structure for Generalizable Embodied Manipulation [54.8] 視覚言語アクション(VLA)モデルは、トレーニング対象のロボットタスクでうまく機能するが、見えないシーンやオブジェクトに一般化するのに苦労する。
一般化可能なエンボディ操作のための三進関係VLAフレームワークであるTriRelVLAを提案する。
実験は、微調整されたタスクにおいて強い性能を示し、クロスシーン、クロスオブジェクト、クロスタスクの一般化において明確なゲインを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:57:49 GMT)
Sparkle: Realizing Lively Instruction-Guided Video Background Replacement via Decoupled Guidance [54.3] 背景の置き換えは、映画制作や広告といったクリエイティブな応用の中心である。
背景の置き換えは、完全に新しい、時間的に一貫したシーンを必要とし、正確な前景と背景の相互作用を維持する。
Sparkleは5つのバックグラウンド変更テーマにまたがる140Kビデオペアのデータセットである。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:35:34 GMT)
Not All Tokens Need 40 Steps: Heterogeneous Step Allocation in Diffusion Transformers for Efficient Video Generation [53.2] 速度のダイナミクスに基づいて異なる冗長トークンに様々なステップ予算を割り当てる動き自由推論を導入する。
結果として生じるシーケンス長ミスマッチを解決するため、HSAはKV-cache機構を導入し、アクティブトークンが全シーケンスに参加することができる。
We evaluate HSA on the Wan-2 and LTX-2 models for both text-to-video (T2V) and image-to-video (2V) generation。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:49:47 GMT)
Correct Code, Vulnerable Dependencies: A Large Scale Measurement Study of LLM-Specified Library Versions [52.5] 大規模言語モデル(LLM)におけるバージョンレベルのリスクの大規模評価を初めて行った。
我々は1000のStack OverflowプログラミングタスクのベンチマークであるPinTrace上で10のLLMを評価した。
LLM バージョン選択は LLM ベース開発における第1級, 以前は見落とされたリスクサーフェスとして確認された。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:52:59 GMT)
Improving the Efficiency of Language Agent Teams with Adaptive Task Graphs [52.3] 大規模言語モデル(LLM)はますますチームにデプロイされているが、既存のコーディネーションアプローチは2つの極端な部分を占めることが多い。
本稿では,Language Agent Teams for Task Evolution (LATTE)を紹介した。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:19:17 GMT)
Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents [52.0] 我々は人間の意識のレンズを通して現実世界におけるプライバシーの認識を調査する。
我々は、現実世界の人間のプライバシーリスクを3段階に分類するPrivacyIcebergを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:21:44 GMT)
Matrix encoding method in variational algorithm of calculating eigenvalues and generalized eigenvalues [52.0] 任意の$Ntimes N$複素行列に対して固有値と一般化固有値を構成する変分法を提案する。
我々のアルゴリズムの量子部分は、行列要素を量子系の純粋な状態に符号化することに基づいている。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:52:34 GMT)
On the Implicit Reward Overfitting and the Low-rank Dynamics in RLVR [51.9] RLVRはトレーニングデータセットに過度に適合する暗黙の報酬を示す可能性がある。
モデルは、トレーニングプロセス中に報酬が比較的低いままであっても、テストセット上で満足なパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:30:28 GMT)
Large Vision-Language Models Get Lost in Attention [51.9] 本稿では,情報理論と幾何に基づく統合フレームワークを提案し,残差更新の幾何的およびエントロピー的性質を定量化する。
注意は再設定に焦点を当てたサブスペース言語演算子として機能し、FFNはセマンティックイノベーションを駆動するサブスペース言語演算子として機能します。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:45:52 GMT)
Can Attribution Predict Risk? From Multi-View Attribution to Planning Risk Signals in End-to-End Autonomous Driving [51.7] エンド・ツー・エンドの自律運転モデルは、多視点入力から将来の軌跡を生成する。
既存の手法では、軌道生成の根底にある視覚的証拠を明らかにすることができない。
エンド・ツー・エンド・プランニングのための階層的属性・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:38:18 GMT)
Quantifying the Statistical Effect of Rubric Modifications on Human-Autorater Agreement [50.3] オートレーダは、評価と自動モデレーションコンテンツにますます使われています。
ヒトとオートレーダの両方に提示されるルーブリックの修正がスコアアグリーメントにどのように影響するかは、統計学的に限定されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:55:11 GMT)
Response Time Enhances Alignment with Heterogeneous Preferences [49.7] 簡易な二次信号で選好データセットを増大させることで、住民の平均選好の識別性を回復できることを示す。
私たちの結果は、将来的なデータ収集パイプラインに約束と新たな機会をもたらします。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:05:23 GMT)
A$^2$RD: Agentic Autoregressive Diffusion for Long Video Consistency [49.6] A$2$RDは、ビデオセグメント・バイ・セグメンテーションを合成し自己改善する閉ループプロセスとして、長いビデオ合成を定式化する。
i) モダリティ間の動画の進行を追跡するマルチモーダルビデオメモリ、(ii) 自然な進行と視覚的整合性のために生成モード間で切り替える適応セグメント生成、(iii) フレームとビデオレベルの各セグメントを自己改善してエラー伝播を防ぐ階層的テストタイム自己改善の3つのコアコンポーネントから構成される。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:35:46 GMT)
SOPE: Stabilizing Off-Policy Evaluation for Online RL with Prior Data [49.4] 本稿では,アクタに整列したオフポリシー評価信号を用いたSOPEを,自動早期停止機構として提案する。
Minariベンチマークスイートから25の継続的制御タスクを評価した。
SOPEはベースライン性能を最大45.6%改善し、必要なTFLOPを最大22倍改善した。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:32:09 GMT)
Normalized Architectures are Natively 4-Bit [49.1] 重みと隠れ表現を単位超球面に制限するアーキテクチャであるnGPTは、本質的に低精度算術よりも堅牢である。
本手法は,最大3B/30Bパラメータの1.2B密度モデルとハイブリッド(Mamba-Transformer)MoEモデルの両方で検証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:54:07 GMT)
Continuous Latent Diffusion Language Model [49.0] 大規模言語モデルは自己回帰パラダイムの下で顕著な成功を収めた。
既存の代替手段は、生成効率、スケーラブルな表現学習、効果的なグローバルセマンティックモデリングを共同で達成するのに依然として苦労している。
階層型情報分解によりテキスト生成をフレーム化する階層型潜在拡散言語モデルCola DLMを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:44:56 GMT)
MiA-Signature: Approximating Global Activation for Long-Context Understanding [49.0] 我々は、クエリによって誘導されるグローバルなアクティベーションパターンの圧縮表現である textbfMindscape Activation Signature (MiA-Signature) の概念を導入する。
結果として得られるMiA-Signatureは、計算可能でありながらフルアクティベーション状態の効果を近似する条件信号として機能する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:25:02 GMT)
Bringing Multimodal Large Language Models to Infrared-Visible Image Fusion Quality Assessment [48.9] 赤外線可視画像融合(IVIF)は、熱情報と詳細な空間構造を単一の融合画像に統合し、知覚を高めることを目的としている。
近年のIVIF報酬モデリングの取り組みは人間の評価から学ぶが、集計されたスコアにスカラー回帰を用いる。
本稿では,MLLMを用いて人間の視覚知覚を再現し,連続的な品質スコアを生成するFuScoreを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:38:09 GMT)
Tyche: One Step Flow for Efficient Probabilistic Weather Forecasting [48.3] 我々は,効率的な確率的天気予報のための一段階条件付き流れモデルであるTycheを提案する。
ERA5の1.5ドル(約1万2000円)と6時間の解像度での実験では、たった1つのNFEを使って、最先端の多段階生成ベースラインの予測スキルとキャリブレーションを一致または超過していることが示されています。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:25:28 GMT)
Retrieval from Within: An Intrinsic Capability of Attention-Based Models [48.2] InTRA(Intrinsic Retrieval via Attention)は、デコーダのアテンションクエリが事前に符号化されたエビデンスチャンクをスコアし、生成のコンテキストとして直接再利用するフレームワークである。
質問応答ベンチマークでは、INTRAはエビデンスリコールとエンドツーエンドの回答品質の両方で、強力なエンジニアリングされた検索パイプラインを上回ります。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:42:28 GMT)
Adding Thermal Awareness to Visual Systems in Real-Time via Distilled Diffusion Models [48.1] 純粋なRGBベースの視覚モデルは、夜間や霧のような困難なシナリオにおいて、信頼できる手がかりを提供することができないことが多い。
拡散レベルの品質を持つ完全独立なプラグアンドプレイコンポーネントとして設計されたリアルタイム画像融合モジュールであるFusionproxyを提案する。
本手法は静的認識タスクにおいて優れた性能を実現し,閉ループ自律運転を含む動的タスクの堅牢性を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:03:31 GMT)
DARTS: Targeting Prognostic Covariates in Budget-Constrained Sequential Experiments [47.6] 我々はトンプソンサンプリング(DARTS)による動的適応的ランダム化を導入する。
DARTSは、共変量取得を設計に基づく因果推論タスクに埋め込まれた逐次最適化問題として扱う。
我々は,最小限の値と対数的因子とを一致させる獲得層に対してベイズリスクを導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:27:51 GMT)
Band Together: Untargeted Adversarial Training with Multimodal Coordination against Evasion-based Promotion Attacks [43.7] マルチモーダルレコメンダシステムは、回避ベースのプロモーション攻撃に対して脆弱である。
本稿では,マルチモーダルコーディネート(UAT-MC)を用いた非ターゲット適応トレーニングを提案し,この問題に対処する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:24:40 GMT)
LensVLM: Selective Context Expansion for Compressed Visual Representation of Text [43.6] 視覚言語モデル(VLM)はテキストをレンダリング画像として処理することができ、テキストのトークン化の必要性を回避できる。
提案するLensVLMは,VLMが圧縮された画像をスキャンし,関連する画像のみを選択的に拡張することのできる,推論フレームワークと学習後レシピである。
Qwen3.5-9Bベース上に構築されたLensVLMは、4.3倍の効率な圧縮でフルテキスト上界に匹敵する精度を維持している。
LensVLMはマルチモーダル文書やコード理解タスクにも一般化されており、圧縮が増加するにつれてベースラインよりも精度が向上する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:03:21 GMT)
Listwise Policy Optimization: Group-based RLVR as Target-Projection on the LLM Response Simplex [43.5] 検証可能な報酬(RLVR)による強化学習は、推論能力のインセンティブを得るための訓練後の大規模言語モデル(LLM)の標準的アプローチとなっている。
この研究は、これらの最適化戦略が共通の幾何学的構造を共有していることを明らかにする。
本稿では,ターゲット投影を明示的に行うためにLPO(Listwise Policy Optimization)を提案する。これは応答単純度に近似RLの目的を限定することで暗黙の目標をデミストし,正確な発散最小化によってポリシーを投影する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:38:17 GMT)
IRC-Bench: Recognizing Entities from Contextual Cues in First-Person Reminiscences [43.0] IRC-Benchは暗黙的な実体認識を評価するためのベンチマークである。
12,337のWikiデータリンクされたエンティティから1,994のテキストに25,136のサンプルが作成されている。
LLM生成、高密度検索、RAG、微調整を含む19の構成を評価した。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:39:49 GMT)
Estimate Level Adjustment For Inference With Proxies Under Random Distribution Shifts [42.8] 我々は、プロキシベースの推論をキャリブレーションするために、ドメイン適応技術にインスパイアされた推定レベルフレームワークを導入する。
このフレームワークは、パラメータレベルでのランダムな効果としてプロキシ・プライマリ・メトリックの相違をモデル化し、その分布を集計された歴史的観測から推定する。
さらに、公開データセットと実世界の実験を用いて、このアプローチを検証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:07:35 GMT)
Steering Visual Generation in Unified Multimodal Models with Understanding Supervision [42.8] 統一マルチモーダルモデルは、理解と生成のギャップを埋めるために考えられている。
本稿では, 個別のタスクとしてだけでなく, 生成表現を制御するための直接監督信号として, より軽量なフレームワークである「理解指向ポストトレーニング(UNO)」を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:20:04 GMT)
When to Trust Imagination: Adaptive Action Execution for World Action Models [42.5] 世界行動モデル(WAM)は、近ごろ、将来の視覚的観察と将来の行動を共同で予測することによって、ロボット操作のための有望なパラダイムとして登場した。
現在のWAMは、各モデル推論の後、一定の数の予測アクションを実行し、ロボットは、想像された未来が実際の物理的なロールアウトと一致しているかどうかを無視する。
我々は,将来性検証問題として適応型WAM実行を定式化し,WAM予測された未来が信頼性を保ちながらロボットはより長く実行すべきであり,現実が想像力から逸脱した場合にはより早く再計画する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:18:28 GMT)
Predictive-Generative Drift Decomposition for Speech Enhancement and Separation [42.5] 本稿では,先行した生成音声による予測手法を増強する,音声強調と分離のためのプラグアンドプレイフレームワークを提案する。
表現力学をタスク固有のドリフトとデノナイジングコンポーネントに分解し、予測推定を生成的サンプリングプロセスに直接組み込む。
これにより、強い事前学習された予測子と生成モデルのパワーを結合する数学的基盤の枠組みが得られる。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:04:38 GMT)
Minimizing Modality Gap from the Input Side: Your Speech LLM Can Be a Prosody-Aware Text LLM [42.2] 音声入力を韻律対応のテキストLLMとよりよく類似させるSLMであるTextPro-SLMを提案する。
TextPro-SLMは、同期されたテキストトークンと韻律埋め込みを生成する統一された音声エンコーダであるWhisperProを組み合わせる。
実験の結果,TextPro-SLMは3Bスケールと7Bスケールの両方において,最下位のSLM間のモダリティギャップを達成できることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:32:05 GMT)
LARGO: Low-Rank Hypernetwork for Handling Missing Modalities [42.0] LARGOは,2N-1ドルの専用モダリティモデルを1つのネットワークに圧縮するハイパーネットワークである。
我々の手法は52構成のうち47位にランクインし、最先端のベースラインよりも平均的な+0.68$%$と+2.53$%$を達成している。
avMNISTにおける概念実証実験は、ARGOが医療画像を超えて異種非医学的モダリティにまで拡張する可能性を示唆している。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:07:55 GMT)
Automated alignment is harder than you think [41.9] 人工超知能(ASI)の整列に関する主要な提案は、AIエージェントを使用して、能力の向上に伴い、アライメント研究のごく一部を自動化することである。
我々は、研究員がアライメント作業の妨害を計画していないとしても、この計画は説得力はあるが破滅的に誤解を招く安全評価を生み出すかもしれないと論じている。
これは、アライメント研究には多くの面倒な作業が伴うためである。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:06:37 GMT)
Towards Emotion Consistency Analysis of Large Language Models in Emotional Conversational Contexts [41.8] 本研究では,感情駆動型会話環境において,Large Language Models (LLMs) が生成する応答の一貫性について検討する。
以上の結果から,LLMは平均以下の性能を示し,クエリに埋め込まれた偽の信念に弱いままであることが示唆された。
その結果,LLMの高度で感情に敏感な文脈への展開について重要な考察がもたらされた。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:01:48 GMT)
On the Safety of Graph Representation Learning [41.4] グラフ表現学習(GRL)は、トポロジのみのグラフ埋め込みからタスク固有の教師付きGNNへと進化し、最近では再利用可能な表現やグラフ基盤モデル(GFM)へと進化した。
GRLメソッドがグラフ信号、グラフコンテキスト、ラベルサポート、構造グループ、予測エビデンスに影響を与える場合の信頼性は、まだ不明である。
GRLの安全性評価ベンチマークであるGRL-Safetyを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:06:19 GMT)
Continuous Expert Assembly: Instance-Conditioned Low-Rank Residuals for All-in-One Image Restoration [41.3] CEAは、オールインワン画像復元のためのトークン単位の動的パラメータ化フレームワークである。
CEAは、強力なプロンプト、ディスクリプタ、エキスパートベースのベースラインよりも平均的な復元品質を改善します。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:31:24 GMT)
Unifying Goal-Conditioned RL and Unsupervised Skill Learning via Control-Maximization [41.3] 目標条件強化学習(GCRL)における教師なし事前訓練による経験的進歩
特に、相互情報スキル学習(MISL)と呼ばれる影響力のある手法のクラスは、後に下流のゴール獲得に使用できる行動的に多様なスキルを発見する。
MISLで学んだスキルが目標達成をサポートするのは、理論的なミステリーである。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:40:49 GMT)
A Versatile AI Agent for Rare Disease Diagnosis and Risk Gene Prioritization [41.1] Hygieiaは、精度の高い疾患診断をサポートするために設計されたマルチモーダルAIシステムである。
表現型の特徴、遺伝子プロファイル、臨床記録を統合している。
複数の診断ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:19:42 GMT)
Training Transformers for KV Cache Compressibility [41.1] KV圧縮性は文脈のみでなく,学習した表現の特性であることを示す。
そこで本研究では,圧縮可能な表現の出現を動機づける,継続した事前訓練手順であるKV-Compression Aware Training (KV-CAT)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:17:55 GMT)
SDFlow: Similarity-Driven Flow Matching for Time Series Generation [40.9] 我々は,凍結したVQ潜在空間で完全に動作する非自己回帰フレームワークであるSDFlowを提案する。
SDFlowは最先端の性能を実現し,識別スコアを向上し,コンテキストFIDを大幅に低減することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:28:18 GMT)
Mitigating Cognitive Bias in RLHF by Altering Rationality [40.5] 報奨学習における合理性パラメータのベータを動的に調整する手法を提案する。
このアプローチは、バイアスまたは信頼できない判断を反映する可能性のある、効果的な下級比較を効果的に行う。
実験的に、強い偏りのあるデータセットを微調整しても、このアプローチはより合理的な下流モデルを学ぶことを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:54:25 GMT)
Towards Reliable LLM Evaluation: Correcting the Winner's Curse in Adaptive Benchmarking [40.4] 我々は,この手順レベルの目標を明示的なチューニング予算の下で推論する。
選択対応の繰り返しレポートプロトコルであるSIRENを提案する。
制御されたシミュレーションとMMLU-Proチューニング実験は、勝者ベースのレポートが楽観的であることを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:18:56 GMT)
Unifying Scientific Communication: Fine-Grained Correspondence Across Scientific Media [40.4] 科学知識のコミュニケーションはますます多モーダルになりつつある。
フォーマット間の明示的なリンクの欠如は、概念、視覚、説明がどのように対応するかを追跡するのを難しくする。
研究論文、プレゼンテーションビデオ、解説ビデオ、同じ作品のスライドを統合する最初のベンチマーク。
我々は, 埋め込み型および視覚言語モデルを用いて, 微粒なクロスフォーマット対応を見つける能力を評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:04:50 GMT)
Passive Imaging with Quantum Advantage [40.3] 検出前に入射光を光学的に前処理することで、このノイズの影響を低減できる手法を提案し、実装する。
フーリエ領域分割(FDD)と呼ばれるこの手法は、フーリエ平面を複数の領域に分割し、独立検出および画像再構成のための後処理を行う。
我々は,この手法を顕微鏡で実証し,高空間周波数成分上でのフィッシャー情報の5倍の精度向上を実現した。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:06:49 GMT)
VLA-GSE: Boosting Parameter-Efficient Fine-Tuning in VLA with Generalized and Specialized Experts [40.1] VLA-GSEは、視覚言語アクションモデルのためのパラメータ効率の良いVLA微調整フレームワークである。
PEFTの知識保存の優位性を維持しつつ、制御適応を改善する。
LIBERO-Plusの平均ゼロショット成功率は81.2%である。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:56:58 GMT)
Contrastive Identification and Generation in the Limit [39.9] 本研究では,学習者がデータに対するコントラスト的表現を観察する限界における,コントラスト的識別と生成について検討する。
我々は、敵の汚職の下で鋭い逆転を証明している:いかなる有限の汚職予算の下でも、対照的なペアから識別できるクラスが存在する。
統一された技術的対象は共通横断グラフであり、ペアワイズあいまいさ、家族レベルの生成障害、単一カバレッジ・アンド・インシデンス言語における腐敗欠陥をエンコードする。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:14:51 GMT)
Unified Framework of Distributional Regret in Multi-Armed Bandits and Reinforcement Learning [39.9] すべての信頼レベル$in (0,1]$に対して均一に保たれる確率的保証として分布的後悔を定式化する。
探索ボーナス$minc_1,k/N,c_2,k/sqrtN$,$N$は訪問数を表し,$(c_1,k,c_2,k)$はユーザ指定パラメータである。
我々の境界は、ミニマックスとインスタンス依存のレジームの両方において、期待と分布の後悔の間の最適なトレードオフを達成する
論文参考訳(メタデータ) (Thu, 07 May 2026 02:34:23 GMT)
When Does Critique Improve AI-Assisted Theoretical Physics? SCALAR: Structured Critic--Actor Loop for Agentic Reasoning [39.9] 研究者とエージェントの相互作用がSCALAR(Structured Critic--Actor Loop for AI Reasoning)による結果に与える影響について検討する。
アクターはソリューションを提案し、批評家は反復的なフィードバックを提供し、独立した裁判官は参照されたソリューションに対してその書き起こしを評価する。
我々はアクター・ペルソナ、批判的フィードバック・ストラテジー、アクター・モデル・ファミリーとスケールを変える。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:00:01 GMT)
SkillScope: Toward Fine-Grained Least-Privilege Enforcement for Agent Skills [39.9] SkillScopeは,エージェントスキルの細粒度化のためのフレームワークである。
SkillScopeは、潜在的な過小評価候補を抽出し、それらをグラフで検証したユーザタスクと、過小評価されたアクションの制約の下で検証する。
我々はSkillScopeの有効性実験と大規模実世界計測による評価を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:34:14 GMT)
Agentic AIs Are the Missing Paradigm for Out-of-Distribution Generalization in Foundation Models [39.8] 基礎モデルに対するOODは、一般的なモデル中心のパラダイムでは解決できない構造的に異なる問題である、と我々は主張する。
まず、観察された複数段階のトレーニング分布に対応するOODの段階的形式化について述べる。
第二に、パラメータカバレッジの天井を証明し、モデル中心の手法が許容範囲内で扱えないような、実質的に関連する入力が存在することを証明します。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:29:33 GMT)
AffectSeek: Agentic Affective Understanding in Long Videos under Vague User Queries [39.7] 我々は、長いビデオで感情的な瞬間を局所化するモデルを必要とする新しいタスクである textbfVague-Query-driven video Affective Understanding (VQAU) について研究する。
textbfAffectSeekも提案する。これは長いビデオの感情的瞬間を積極的に探求し、検証し、説明するエージェントフレームワークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:47:26 GMT)
Post Reasoning: Improving the Performance of Non-Thinking Models at No Cost [39.6] Post-Reasoningは、最終応答を生成した後の回答を正当化するように条件付けすることで、命令調整モデルを改善する。
13) オープンおよびプロプライエタリなモデル,(4) モデルファミリ,(9) 多様な推論と知識集約型ベンチマークにまたがるベンチマーク設定の評価を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:51:49 GMT)
Model Compression with Exact Budget Constraints via Riemannian Manifolds [39.5] トータルコスト予算の下で各NグループにKオプションの1つを割り当てることは、効率的なAIにおいて繰り返し発生する問題である。
我々は、ソフトマックス緩和の下で、予算制約がロジット空間における滑らかなリーマン多様体を異常に単純な幾何学で定義することを示す新しいアプローチを示す。
これらの特性に基づいて、接射影、二分探索リトラクション、運動量輸送を標準とするリーマン制約最適化(RCO)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:36:50 GMT)
Predictive and Prescriptive AI toward Optimizing Wildfire Suppression [39.2] 本稿では,乗組員の配置と山火事抑制を共同で最適化するための予測的,規範的アプローチを開発する。
この問題は、内因性山火事の需要と非線形山火事のダイナミクスを備えた個別の資源配置構造を特徴としている。
i) 消火計画と乗務員経路を反復的に生成する二面列生成方式, (ii) リンク制約のクナプサック構造を利用したカットの新たなファミリー, (iii) 非線形の山火事の動態に対応する新しい分岐規則を考案した。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:49:30 GMT)
The Context Gathering Decision Process: A POMDP Framework for Agentic Search [38.9] 大規模言語モデル(LLM)エージェントは複雑な環境にデプロイされる。
明示的なインフラストラクチャがなければ、エージェントの動作メモリは、検索状態の損失のある表現に分解される可能性がある。
我々はこの課題をコンテキスト収集決定プロセス(CGDP)として定式化する。
反復LDM剤に対する2つのプラグ・アンド・プレイ介入法を導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:45:07 GMT)
Conceal, Reconstruct, Jailbreak: Exploiting the Reconstruction-Concealment Tradeoff in MLLMs [38.9] 多モーダル大言語モデル(MLLM)に対する侵入難易度に基づくジェイルブレイク攻撃
我々はこのような攻撃がエンプレコンストラクションによって支配されていることを示す--concealment tradeoff
本稿では,有害キーワードのアライメントが低く,相互に多様である文字除去型を欲しがって選択する,エンフェンセレーメント対応の変種構成を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:54:49 GMT)
On the Blessing of Pre-training in Weak-to-Strong Generalization [38.8] 我々は、W2SG(Wak-to-Strong Generalization)の出現の前提条件として事前学習を定めている。
We demonstrate that W2SG is a innate capabilities, but through a phase transition along with pre-training。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:55:10 GMT)
Risk-Controlled Post-Processing of Decision Policies [38.4] 本稿では,リスク管理後処理について検討する。決定論的ベースラインポリシーが与えられた場合,ユーザ特定損失に対するリスク制約の対象となるベースラインとの合意を最大化する新たなポリシーを選択する。
最適政策にはしきい値構造があり、フォールバック政策への切り替えが条件違反リスクを大幅に減少させる状況以外はベースラインに従っていることを示す。
新型コロナウイルスの放射線画像診断タスク、LCMルーティング問題、および合成多クラス決定タスクの実験により、標的のポストプロセッシングは、スコアブラインドランダムミキシングよりもベースラインとのほぼ一致を維持しつつ、リスク予算を満たすか、ほぼ満たすことができることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:03:24 GMT)
MolRecBench-Wild: A Real-World Benchmark for Optical Chemical Structure Recognition [38.1] 光化学構造認識は、科学文献の分子図を機械可読形式に変換することを目的としている。
分子図の視覚的干渉と化学的意味論を共同で特徴付ける,37個の細粒度ラベルを持つ2次元難易度フレームワークMOSAICを紹介する。
この枠組みに基づき、820の最近の化学論文から5,029構造のベンチマークである MolRecBench-Wild を構築する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:08:52 GMT)
UniSD: Towards a Unified Self-Distillation Framework for Large Language Models [38.1] 自己蒸留は、より強力な外部教師に頼ることなく、大きな言語モデル(LLM)を適用するための有望な道を提供する。
既存の手法は、主に独立した設計選択を検証し、その効果、役割、相互作用がはっきりしないままである。
自己蒸留を体系的に研究する統合フレームワークUniSDを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:22:11 GMT)
Expressiveness Limits of Autoregressive Semantic ID Generation in Generative Recommendation [37.7] 生成レコメンデーション(GR)モデルは、ターゲットアイテムを共同でインデックスする離散トークンのシーケンスを自動回帰的に生成することで、アイテムを生成する。
本稿では,各セマンティックIDの前に潜在トークンを注入し,単一の木から複数の潜在トークン条件木に復号空間を変換する簡易な修正手法であるLatteを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:25:10 GMT)
AI Co-Mathematician: Accelerating Mathematicians with Agentic AI [37.6] 我々は、数学者がAIエージェントを対話的に活用し、オープンエンドの研究を追求するためのワークベンチであるAIコマンセマティクスを紹介した。
AIの共数学者は、文献探索、計算探索、定理証明、理論構築など、数学観念の探索的かつ反復的な現実を総合的に支援することを目的としている。
初期のテストでは、AIの共同数学者は、オープンな問題の解決、新しい研究方向の特定、文献参照の発見に協力した。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:56:32 GMT)
Preliminary Insights in Chronos Frequency Data Understanding and Reconstruction [37.6] 時系列データを処理する基盤モデルは、実践者が一般的な時間表現を学習できる統一アーキテクチャを提供する。
採用が増えているにもかかわらず、そのようなモデルが基本的な信号特性を符号化する範囲は依然として不十分である。
オンライン最小記述長プローブを用いて、モデルの内部表現における周波数情報の存在と分離性をテストする。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:37:54 GMT)
On Time, Within Budget: Constraint-Driven Online Resource Allocation for Agentic Workflows [37.2] エージェントシステムはオーケストレートされた実行によって複雑なユーザリクエストを解決し、サブタスクは特定のモデルやツールに割り当てられ、依存関係に応じて調整される。
これにより、平均的な効率最適化から、ワークフロー全体が明確な予算と期限の制約の下で正常に完了する確率の最大化へとゴールをシフトします。
本稿では,シミュレーションされたワークフローの実行と観察結果の更新を通じて,制約された完了確率を直接推定する軽量クローズドループプランナであるemphMonte Carlo Portfolio Planning (MCPP)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:24:21 GMT)
VulKey: Automated Vulnerability Repair Guided by Domain-Specific Repair Patterns [37.0] VulKeyは、パッチ生成をガイドする専門家知識の階層的な抽象化である。
新たな3レベル抽象化は,CWEタイプ,構文的アクション,意味的キー要素の観点から,修復戦略を定式化する。
VulKeyは31.5%の精度を達成し、最高のベースラインを7.6%上回り、VulMasterやGPT-5といった先進的なツールを上回っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:15:42 GMT)
Are We Making Progress in Multimodal Domain Generalization? A Comprehensive Benchmark Study [36.3] MMDG-Benchは、Multimodal Domain Generalizationの最初の統一的で包括的なベンチマークである。
MMDG-Benchは、3つの多様なタスクにまたがる6つのデータセットの評価を標準化する。
汚職の堅牢性、欠落モダリティの一般化、誤分類検出、アウト・オブ・ディストリビューション検出を評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:51:16 GMT)
Causal Reinforcement Learning for Complex Card Games: A Magic The Gathering Benchmark [35.7] Magic: The GatheringをベースとしたGymnasiumベンチマークMTG-Causal-RLを紹介する。
各エピソードは因果変数、SCM予測介入効果、要素単位のクレジットトレースを露呈する。
本稿では,参照因果剤として因果グラフファクトリドアドバンテージPPO(CGFA-PPO)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:53:56 GMT)
RAM-H1200: A Unified Evaluation and Dataset on Hand Radiographs for Rheumatoid Arthritis [35.6] 手関節リウマチ(RA)の評価には多段階解析とモデリングが必要である。
RAM-H1200は6つの医療センターから収集された1200個の手書きのラジオグラフィーを含んでいる。
ハンドラジオグラフィーから, 解剖学的構造, 局所的浸食病理, 臨床的に標準化されたRA重症度を, 共同撮影できるかどうかを評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:12:10 GMT)
WavCube: Unifying Speech Representation for Understanding and Generation via Semantic-Acoustic Joint Modeling [35.3] WavCubeはSSL音声エンコーダから派生したコンパクトな連続ラテントである。
言語理解、再構築、生成を同時にサポートする。
試行では、最先端のゼロショットTSパフォーマンスと、トレーニングコンバージェンスを著しく高速化することを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:17:24 GMT)
Boosting Self-Supervised Tracking with Contextual Prompts and Noise Learning [35.2] 本研究では,より詳細なセマンティックプロンプトとコンテキストノイズを併用して,ロバストなトラッキング表現を学習するための,新しい自己教師付きトラッキングフレームワークであるtextbftrackerを提案する。
提案手法は,トレーニング中にのみ適用され,効率的な推論を保ちながら,ラベル付きビデオから高品質な追跡表現を学習することを可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:12:28 GMT)
From Chat to Interview: Agentic Requirements Elicitation with an Experience Ontology [35.2] 本稿では,経験オントロジーによってガイドされる要件の活用を目的とした,OntoAgentという面接エージェントを提案する。
OntoAgentは、経験オントロジーを構築するために、ドメイン固有の要件記述を自動的に分析する。
以上の結果から,OntoAgentは既存のベースラインよりも有効性が高いことがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:03:03 GMT)
Giant-atom-enabled quantum optics with valley-polarized photons [35.2] 簡単な2レベルエミッタを用いて、フォトニックバレーを量子光学で選択的に扱うことができることを示す。
複数の点で結合された量子ビットは、遅延した部分格子周波数を持つ共振器のエンジニアリングされたハニカム格子である。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:00:01 GMT)
BioMedArena: An Open-source Toolkit for Building and Evaluating Biomedical Deep Research Agents [35.0] ディープリサーチエージェントを評価するためのオープンソースのツールキットであるBioMedArenaをリリースする。
BioMedArenaは6層のバイオメディカルエージェント評価を分離する。
147のバイオメディカルベンチマークと75のバイオメディカルツールを9つのファミリーに公開している。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:57:18 GMT)
Learning a Delighting Prior for Facial Appearance Capture in the Wild [34.9] 我々は、最適化を制約する前として、パラダイムを強力な喜びネットワークのトレーニングにシフトすることを提案する。
学習可能なソース認識トークンにコアネットワークを条件付けすることで、データセット固有のスタイルと物理的な喜びの原則を分離する。
マルチビューNeRSembleデータセットを,大規模な4K解像度リライトブルスキャンコレクションであるNeRSemble-Scanに変換する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:43:24 GMT)
When No Benchmark Exists: Validating Comparative LLM Safety Scoring Without Ground-Truth Labels [34.9] 多くのデプロイメントは、関連する言語、セクター、または規制体制のためにラベル付きベンチマークが存在する前に、安全のために候補言語モデルを比較する必要がある。
我々は、この設定をベンチマークレス比較安全スコアとして定式化し、シナリオベースの監査をデプロイ証拠として解釈できる契約を指定する。
スコアは固定されたシナリオパック、ルーリック、監査、審査、サンプリング設定、再実行予算でのみ有効である。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:56:41 GMT)
Sharper Guarantees for Misspecified Kernelized Bandit Optimization [34.9] 大規模なカーネルでは、不特定値の増幅は対数的あるいは多対数的成長に還元できることを示す。
オフライン設定では、不特定項がスペクトルルベーグ定数によって支配される高確率単純回帰境界を最初に証明する。
オンライン設定では、ドメイン分割アルゴリズムを変更して、緩やかな局所化された固有デカイ仮定の下で、$widetildemathcal O(sqrt_n n+nvarepsilon)$の累積後悔境界を証明する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:12:56 GMT)
Cryptographic and Information-theoretic Security Capacities for General Arbitrarily Varying Wiretap Channels [34.7] AVWCの平均誤差と強い秘密化能力は、常にその最大誤差と意味秘密化能力に等しいことを示す。
また、GAVWCでは、セマンティックセキュリティや他の暗号セキュリティ対策が、同じキャパシティ値を達成することも示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:51:20 GMT)
InvEvolve: Evolving White-Box Inventory Policies via Large Language Models with Performance Guarantees [34.5] 我々は,大規模言語モデルを用いて,オンライン,非定常環境における在庫政策を進化させる方法について検討する。
InvEvolveは、信頼性とインターバルに基づく認証に基づく、エンドツーエンドのインベントリとポリティクスの進化と推論のフレームワークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:53:31 GMT)
ActCam: Zero-Shot Joint Camera and 3D Motion Control for Video Generation [34.5] ActCamは、動画生成のためのゼロショット方式で、ドライブビデオから新しいシーンにキャラクタの動きを共同で転送する。
シーン深度とキャラクタポーズの条件付けを受け入れる事前訓練された画像間拡散モデルを構築した。
ActCamは、ポーズのみの制御や、他のポーズやカメラの手法と比較して、カメラの付着性や動きの忠実性を改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:59:58 GMT)
Self Driving Datasets: From 20 Million Papers to Nuanced Biomedical Knowledge at Scale [34.5] PubMedは、より大きく、よりニュアンスが高く、より正確に構造化されたデータセットに、自律的で費用効率良く変換できることを示す。
本報告では,(1) バイオメディカルレポジトリを基盤としたエンティティタグパイプライン,(2) エンティティターゲットコーパスレポジトリを支援するハイブリッド検索,(3) 自然言語記述のみを付与したディープリサーチシステムであるStarlingの3つの貢献について述べる。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:08:18 GMT)
ActiveFlowMark: Assessing Tor Anonymity under Active Bandwidth Watermarking [34.2] Torのような低遅延匿名ネットワークは、インフラストラクチャレベルのトラフィック分析に弱いままである。
非侵襲的なアクティブトラフィック相関解析アルゴリズムであるNATAを導入する。
制御された帯域幅の摂動を通じて、トラフィックフローに区別可能なスループットパターンを注入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:57:57 GMT)
PACEvolve++: Improving Test-time Learning for Evolutionary Search Agents [33.7] 進化的検索エージェントにおけるテスト時間ポリシー適応のためのアドバイザモデル強化学習フレームワークである PACEvolve++ を紹介する。
トレーニング可能なアドバイザは仮説を生成し、評価し、選択する一方、より強力なフロンティアモデルは選択した仮説を実行可能な候補に変換する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:38:50 GMT)
HyperTransport: Amortized Conditioning of T2I Generative Models [33.4] 本稿では,事前学習したエンコーダからの埋め込みを直接介入パラメータにマッピングすることで,コストを償却するハイパーネットワークフレームワークを提案する。
トレーニングが完了すると、HyperTransportは、概念ごとのフィッティングよりも3600-7000倍高速な単一のハイパーネットワークフォワードパスに、それぞれ新たな介入を生成する。
我々は,CLIPベースのメトリクス,VLM-as-a-judge評価,ユーザスタディを通じて,167のホールドアウトテスト概念を対象に,MDD2およびNitro-1-Art上のHyperTransportを検証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:38:12 GMT)
FlashMol: High-Quality Molecule Generation in as Few as Four Steps [33.3] FlashMolは、高品質な分子配座を4段階で生成する超高速な分子生成モデルである。
QM9とGEOM-DRUGデータセットの実験は、FlashMolが最初の1000ステップの教師にマッチし、さらに上回っていることを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:04:24 GMT)
Towards Steering without Sacrifice: Principled Training of Steering Vectors for Prompt-only Interventions [33.2] 微調整ステアリングベクトル(SV)への現在のアプローチには2つの制限がある。
推論時のステアリング効率と生成品質のバランスをとるためには,SV単位のステアリング因子の選択を慎重に行う必要がある。
本稿では, 定位後因子選択が不要となるような操舵因子と方向の連成トレーニングを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:31:12 GMT)
DPM++: Dynamic Masked Metric Learning for Occluded Person Re-identification [33.0] DPM++は、排除された人物の再識別のための動的マスクドメトリックラーニングフレームワークである。
入力適応マスク付きメトリックを学習し、隠蔽されたインスタンスごとに信頼性の高いIDサブスペースを動的に選択する。
全体的なシナリオと排他的シナリオの両方において、従来の最先端の手法を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:47:23 GMT)
BehaviorGuard: Online Backdoor Defense for Deep Reinforcement Learning [32.5] バックドア攻撃は深層強化学習(DRL)に深刻な脅威をもたらす
現在の防衛は、バックドアを除去するためのリバースエンジントリガーやファインタニングのモデルへの報酬異常に依存している。
本稿では,DRLのための行動に基づくバックドア検出・緩和フレームワークであるBehavimentGuardを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:21:14 GMT)
Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning [32.5] 永続的なスキルライブラリにより、言語モデルエージェントはタスク間で成功した戦略を再利用できる。
既存の手法は、これらの機能を分離または別々の報酬源で最適化し、部分的かつ矛盾する進化をもたらす。
Skill1は,共有タスクアウトカム目標に向けて,スキル選択,利用,蒸留を共同開発するための単一の政策を訓練するフレームワークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:33:30 GMT)
Sparse-to-Complete: From Sparse Image Captures to Complete 3D Scenes [32.5] S2C-3Dは、6枚から8枚までの高忠実で完全なシーン再構築のための新しいスパースビュー3D再構成フレームワークである。
本フレームワークは,シーン固有の画像復元のための特殊拡散モデル,トレーニング不要なビューコンディスタンス条件付きサンプリングプロセス,カメラ軌道計画スキームの3つのコンポーネントを特徴とする。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:41:30 GMT)
LookWhen? Fast Video Recognition by Learning When, Where, and What to Compute [32.3] LookWhenは、ビデオ認識を、いつ、どこで、何を計算すべきかを学習に分解するセレクタ・エクストラクタ・フレームワークである。
私たちの浅いセレクタはスケールダウンされたビデオを受け取り、すべてのトークンを時空で素早くスコアし、深層抽出器はトップK選択トークンを取得してフルビデオ表現を近似します。
LookWhenはInternVideo2-Bの6.7倍の精度で効率が良い。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:08:31 GMT)
Resolving the bias-precision paradox with stochastic causal representation learning for personalized medicine [31.6] 縦断的観察データから個別化された治療効果を推定することは、データ駆動医療の中心である。
ここでは、この緊張関係を因果表現学習における偏差精度パラドックスとみなす。
我々は,大域的対位法をサブセットレベルのマッチングに置き換えるために,サンプリングベース最大差分法(sMMD)を導入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:51:21 GMT)
A Fine-Grained Understanding of Uniform Convergence for Halfspaces [31.6] 最悪のVC境界を超えたハーフスペースの微細な均一収束挙動について検討する。
$dge 2$ の $mathbbRd$ の非同次半空間に対して、標準一階VC境界は本質的に強であることを示す。
対照的に$mathbbR2$の同質半空間は明らかに異なる振る舞いを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:53:49 GMT)
Think, then Score: Decoupled Reasoning and Scoring for Video Reward Modeling [31.5] ビデオ報酬モデルは、さまざまなシナリオで人間の好みに合わせて正確な報酬を予測する必要がある。
textitDiscriminative RMs regress rewards direct on features by multimodal large language model without explicit reasoning。
トレーニング効率が高く一般化可能なビデオ報酬モデルであるDeScoreを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:30:58 GMT)
Metonymy in vision models undermines attention-based interpretability [31.3] パートベース推論(Part-based reasoning)は、コンピュータビジョンモデルを下流タスクに関連するオブジェクト部品に直接フォーカスさせる戦略である。
本研究では,現代の事前学習型視覚トランスフォーマーが局所性仮定に反し,物体内リークが強いことを示す。
そして,この非絡み合った特徴抽出により,様々なタスクにおける属性駆動型部分発見が向上することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:14:46 GMT)
Causal Probing for Internal Visual Representations in Multimodal Large Language Models [31.2] 本稿では,アクティベーションステアリングに基づく内部視覚表現の探索と操作のための因果的枠組みを提案する。
抽象概念はグローバルに分散しているのに対し, 実体は異なる局所記憶を示す。
また,MLLMは幾何学的関係の認識に成功しているが,静的な視覚的特徴としてのみ扱う。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:25:46 GMT)
BioTool: A Comprehensive Tool-Calling Dataset for Enhancing Biomedical Capabilities of Large Language Models [31.2] BioToolは、大規模言語モデル(LLM)を微調整するためのバイオメディカルツールコールデータセットである。
NCBI、Ensembl、UniProtデータベースから収集された34の頻繁なツールと、7,040の高品質で人間認証されたクエリAPIコールペアで構成されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:53:17 GMT)
4DThinker: Thinking with 4D Imagery for Dynamic Spatial Understanding [31.1] 視覚言語モデルを“4Dで考える”ための最初のフレームワークである4DThinkerを紹介します。
まず,生のビデオから4D推論データを合成する,スケーラブルでアノテーションのないデータ生成パイプラインを紹介する。
次に,動的視覚意味論のモデルを構築するために,テキストトークンと4Dラテントを併用した動的画像ファインタニング(DIFT)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:48:46 GMT)
RealCam: Real-Time Novel-View Video Generation with Interactive Camera Control [30.8] リアルタイムカメラ制御ビデオ・ツー・ビデオ(V2V)生成はインタラクティブな映画製作やライブ放送において大きな可能性を秘めている。
既存の暗黙合成法は、非因果的、フルシーケンス処理と厳密なプレフィックススタイルの時間的結合に依存している。
我々は、インタラクティブでリアルタイムなカメラ制御V2V生成のための新しい自動回帰フレームワーク、texttRealCamを紹介した。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:36:29 GMT)
Verifier-Backed Hard Problem Generation for Mathematical Reasoning [30.7] この研究は、検証器に強化された3次元セルフプレイ上に構築されたハード問題生成フレームワークであるVHGを導入している。
独立検証器を従来のセッター-ソルバ双対性に組み込むことで,問題妥当性と難易度によって連立決定されるセッターの報酬を制約する。
実験結果から,VHGはすべての基準線法をクリアマージンで大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:58:32 GMT)
MINER: Mining Multimodal Internal Representation for Efficient Retrieval [30.2] MINER (Mining Multimodal Internal RepreseNtation for Efficient Retrieval) は、トランスフォーマー層をまたいだ内部信号を単一のコンパクトな埋め込みに変換する軽量なプラグインモジュールである。
ViDoRe V1/V2/V3全体で、MINERは既存の高密度なシングルベクターレトリバーをベンチマークの大部分で上回り、対応するバックボーンよりも最大4.5%のnDCG@5改善されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:51:06 GMT)
Agentick: A Unified Benchmark for General Sequential Decision-Making Agents [30.0] Agentickはシーケンシャルな意思決定エージェントのベンチマークである。
プロシージャで生成されたタスクは6つの機能カテゴリ、難易度レベル4、観察モード5で37になる。
27のコンフィグレーションと90,000以上のエピソードにまたがる評価では、単一のアプローチが支配的でないことが示されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:12:03 GMT)
Temporal Smoothness Doubly Robust Learning for Debiased Knowledge Tracing [29.9] 知識追跡(KT)のための二重頑健(DR)定式化を導入する。
DRは確率モデルと誤差計算モデルを統合し、理論上どちらのモデルも正確であれば不偏性を保証する。
これらの理論的知見に基づいて、時間的平滑性2重ロバスト(TSDR)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:05:53 GMT)
Constraining Host-Level Abuse in Self-Hosted Computer-Use Agents via TEE-Backed Isolation [29.5] 自己ホスト型コンピュータ利用エージェント(SHCUA)は、自然言語によるインタラクションとホスト側のリソースへの直接アクセスを組み合わせる。
本稿では,SHCUA 操作のリスクベース抑止のための操作中心モデルを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:08:40 GMT)
Policy-Guided Stepwise Model Routing for Cost-Effective Reasoning [29.2] 推論時間計算は大きな言語モデル(LLM)の性能を大幅に向上させた。
一つの解決策は、中間連鎖状態(CoT)を異なる大きさの言語モデルにルートすることである。
我々は、制約付き意思決定問題として、段階的にルーティングを定式化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:26:56 GMT)
FreeSpec: Training-Free Long Video Generation via Singular-Spectrum Reconstruction [28.8] ビデオ拡散モデルは、短いビデオ合成においてよく機能するが、コンテンツドリフト、時間的不整合、過度に平滑なダイナミクスに悩まされる。
長ビデオ生成のためのトレーニング不要なスペクトル再構成フレームワークであるFreeSpecを提案する。
Wan2.1 と LTX-Video の実験では、FreeSpec は特に時間的ダイナミクスのために長ビデオ生成を改善することが示されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:21:34 GMT)
NavOne: One-Step Global Planning for Vision-Language Navigation on Top-Down Maps [28.7] 構築したトップダウンマップ上での1ステップのグローバルパス計画問題としてナビゲーションを再構成したトップダウンVLNを提案する。
NavOneは、単一のエンドツーエンドのフォワードパスにおいて、マルチモーダルマップ上での高密度パス確率を直接予測する統合フレームワークである。
NavOneは、マップベースのVLNメソッドの最先端のパフォーマンスを実現し、既存のマップベースのベースラインの8倍、エゴセントリックなメソッドの80倍のステージスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:16:58 GMT)
TableVista: Benchmarking Multimodal Table Reasoning under Visual and Structural Complexity [28.7] TableVistaは、視覚的および構造的な複雑さの下で、マルチモーダルテーブル推論の基礎モデルを評価するためのベンチマークである。
TableVistaは3000の高品質なテーブル推論問題で構成されており、各インスタンスは10の異なる視覚的バリエーションに拡張される。
我々は、TableVista上で29の最先端オープンソースおよびプロプライエタリ基盤モデルを広範囲に評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:03:25 GMT)
PersonaTeaming: Supporting Persona-Driven Red-Teaming for Generative AI [28.3] 我々はペルソナを対向的なプロンプト生成プロセスに組み込むペルソナチームを開発する。
次に、PersonaTeamingをPersonaTeaming Playgroundとしてインスタンス化します。
業界実践者11名を対象に行ったユーザスタディでは,PersonaTeaming Playgroundが,実践者が有用だと感じたさまざまなレッドチーム戦略とアウトプットを可能にした。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:19:51 GMT)
Pop Quiz Attack: Black-box Membership Inference Attacks Against Large Language Models [28.3] 大規模言語モデル(LLM)は多くのアプリケーションで高いパフォーマンスを示していますが、トレーニングデータを記憶し、潜在的に明らかにする能力は、深刻なプライバシー上の懸念を引き起こします。
我々は、モデルが特定のトレーニング例をリコールできるかどうかをテストするブラックボックスメンバーシップ推論攻撃であるPopQuiz Attackを紹介した。
提案手法は平均 0.873 のROC-AUC を達成し,既存のアプローチを20.6% 上回っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:29:10 GMT)
Crafting Reversible SFT Behaviors in Large Language Models [27.7] Supervised Fine-tuning (SFT)は、大きな言語モデルで新しい振る舞いを誘導するが、モデル内でこれらの振る舞いをどのように分散するかに関して構造的な制約は課さない。
我々は、SFTによって引き起こされる振る舞いは、故意に、機械的に必要なサブネットワークに圧縮され、同時に、重量修正なしで推論時に制御可能であるか?
我々は、明示的なユーティリティ予算の下でルーティングマスクとモデルウェイトを共同で最適化することで、そのようなキャリアを構築するロス制約デュアルディフレクション(LCDD)*と、抽出されたキャリアチャネル上でのアクティベーションマッチングによって最適化されたソフトプロンプトである**SFT-Eraser**を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:44:07 GMT)
T2I-VeRW: Part-level Fine-grained Perception for Text-to-Image Vehicle Retrieval [27.5] Vehicle Re-IDは、重複しないカメラによって撮影された画像から、与えられたクエリに最もよく似た画像を取得することを目的としている。
我々はPFCVRを提案する。PFCVRは、テキストから画像への車両再識別のための細粒度クロスモーダル車両検索モデルである。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:10:30 GMT)
MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems [27.5] 大規模言語モデル(LLM)に基づくマルチエージェントシステムは,複雑な協調作業に対処する上で有望であることを示す。
MASPOはシステム全体のプロンプトを自動的にかつ反復的に洗練するように設計された新しいフレームワークである。
MASPOの中核的な革新は、その共同評価メカニズムであり、それは局所的妥当性だけでなく、後継エージェントの下流での成功を促進する能力によっても評価される。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:35:26 GMT)
From Articles to Premises: Building PrimeFacts, an Extraction Methodology and Resource for Fact-Checking Evidence [27.2] PrimeFactsは、完全な事実チェック記事からきめ細かい証拠を抽出する方法論である。
我々は13,106のPoitiFact記事にクレーム、評決、およびすべての参照ソースをまとめる。
私たちのフレームワークは、アンカー文をスタンドアローンでコンテキストに依存しない前提に書き直します。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:58:29 GMT)
MDN: Parallelizing Stepwise Momentum for Delta Linear Attention [27.1] 線形注意(LA)は、大規模言語モデルを長いシーケンスにスケールするための有望なパラダイムを提供する。
Mamba2やGDNのような最近のLAモデルは、線形反復を閉形式オンライン勾配勾配として解釈する。
Momentum DeltaNet (MDN) はTritonカーネルを活用して、競合する線形モデルと同等のトレーニングスループットを実現する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:12:09 GMT)
MesonGS++: Post-training Compression of 3D Gaussian Splatting with Hyperparameter Searching [27.1] 3D Gaussian Splatting(3DGS)は、リアルタイムレンダリングによる高品質なノベルビューを実現するが、そのストレージコストは実用的デプロイメントでは禁止されている。
本稿では,3次元ガウス圧縮のためのサイズ対応ポストトレーニングであるMesonGSを提案する。一方,MesonGSは,共同重要度に基づくプルーニング,オクツリー幾何学,変換,高次球面高調波に対する選択ベクトル量子化,エントロピー符号化によるグループワイド混合精度量子化を併用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:27:58 GMT)
Beyond Long Tail POIs: Transition-Centered Generalization for Human Mobility Prediction [26.8] 人間の移動性予測における中心的なボトルネックは、遷移レベルのロングテールの一般化にあると論じる。
我々は,次のPOI予測(RECAP)における合成生成の枠組みを提案する。
複数の実世界のデータセットの実験では、RECAPは予測精度を一貫して改善し、テール遷移に明確な利得が得られた。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:02:28 GMT)
Decentralized Time-Varying Optimization for Streaming Data via Temporal Weighting [26.7] エージェントの分散ネットワーク上でのストリーミングデータによる最適化について検討する。
分散勾配降下(DGD)に重点を置いており,通信・計算の予算が限られている。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:40:42 GMT)
Detecting AI-Generated Videos with Spiking Neural Networks [26.7] 我々は,クロスジェネレータ評価のための冷凍セマンティックエンコーダとともに,スパイク駆動の時間枝で多チャンネル時間残差を処理する検出器であるMASTを提案する。
GenVideoベンチマークでは、MASTは厳密なクロスジェネレータ評価の下で10個の未確認発電機で93.14%の平均精度を達成した。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:08:32 GMT)
MUSE: Resolving Manifold Misalignment in Visual Tokenization via Topological Orthogonality [26.7] 統一された視覚的トークン化は、高忠実度画素再構成とセマンティック抽象化の基本的なトレードオフに直面している。
トポロジカル直交に基づくフレームワーク MUSE を提案する。
実験によると、MUSEはトレードオフを破り、最先端の世代品質を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:53:54 GMT)
Beyond Accuracy: Policy Invariance as a Reliability Test for LLM Safety Judges [26.6] LLM-as-a-Judgeパイプラインは、エージェント安全性のデファクト評価器となっている。
既存のベンチマークでは、評定がエージェントの行動に依存するか、それとも単に評価方針がどう語られるかをチェックすることなく、その評定を根底からのプロキシとして扱う。
我々は、証明された等価な書き換えの下でのルーブリック・セマンティック不変性、意図的な厳密なシフトの下でのルーブリック・スレッショルド不変性、曖昧さを意識したキャリブレーションの3つの検証可能な原則として運用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:49:09 GMT)
AlphaCrafter: A Full-Stack Multi-Agent Framework for Cross-Sectional Quantitative Trading [26.5] 収益性を維持する定量的戦略を構築するには、ファクター発見、システマティブ・アダプティブ・セレクション、リスク制約のある実行の継続的な結合が必要である。
AlphaCrafterはフルスタックのマルチエージェントフレームワークで、継続的適応型ファクター・ツー・エグゼクティブパイプラインを通じてこのギャップを埋めます。
CSI 300とS&P 500の実験では、AlphaCrafterはリスク調整リターンにおいて、最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:58:30 GMT)
Estimating the Black-box LLM Uncertainty with Distribution-Aligned Adversarial Distillation [26.5] 本稿では,大規模言語モデルの出力分布の高品質な領域を学習するために,軽量プロキシモデルを誘導する世代識別アーキテクチャを提案する。
プロキシモデルを用いてブラックボックスLSMの特定の応答を再現し、エビデンス学習に基づいて対応する不確実性を推定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:09:29 GMT)
Bridging Textual Profiles and Latent User Embeddings for Personalization [26.4] 本稿では,ユーザプロファイルを埋め込み型レコメンデーション目標と統合する強化学習フレームワークBLUEを提案する。
ブルーは、凍結およびトレーニング可能な埋め込み条件下で、強いベースラインを一貫して上回る。
これらの結果から,BLUEはパーソナライズのための識別可能なテキスト・プロファイリングと識別可能な潜在埋め込みを一体化するための効果的な方法であることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:59:12 GMT)
SEQUOR: A Multi-Turn Benchmark for Realistic Constraint Following [26.1] 長時間のマルチターン会話における制約適合性を評価するための自動ベンチマークSEQUORを提案する。
その結果,1つの制約に従えば,会話が長くなるにつれて命令追従精度は一貫して低下することがわかった。
会話の任意のポイントで制約を追加したり置き換えたりするシナリオでは、モデルの精度は9%以上低下する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:33:35 GMT)
Stop Comparing LLM Agents Without Disclosing the Harness [26.1] このポジションペーパーでは、同等のフロンティア能力を持つモデル間で評価された長時間水平タスクに対して、エージェント実行ハーネスは、ラップするモデルよりもエージェントパフォーマンスの強い決定要因である、と論じている。
本稿では,BingConstraint分散の形式化と保護を行う。この体制では,性能はモデル選択よりもハーネス構成により制御され,現在の評価プロトコルはモデル改善にハーネスレベルの利得を体系的に誤っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:24:59 GMT)
Arena as Offline Reward: Efficient Fine-Grained Preference Optimization for Diffusion Models [26.1] 本稿では、Arenaのスコアをオフラインの報酬として活用し、洗練されたフィードバックを提供するArenaPOを提案する。
報酬モデルを必要としないため、オフラインで計算できるため、追加のトレーニングオーバーヘッドは発生しない。
我々は、Pick-a-Pic v2とHPD v3データセットでArenaPOトレーニングを実施し、ArenaPOが既存のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:56:26 GMT)
Knowing but Not Correcting: Routine Task Requests Suppress Factual Correction in LLMs [26.1] LLMは、独立して提示された時に確実に偽のクレームを訂正するが、同じクレームがタスク指向のリクエストに埋め込まれている場合、そのクレームは正しいというよりも、従うことが多い。
我々は、この障害モードの誤り訂正を抑え、300の偽の前提のベンチマークを構築し、8つのモデルで体系的に評価する。
抑制率は19%から90%で、4つのモデルが80%を超え、修正抑制が一般的で深刻な現象として確立された。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:04:39 GMT)
Superintelligent Retrieval Agent: The Next Frontier of Information Retrieval [25.7] textitSuperIntelligent Retrieval Agent (SIRA)を紹介する。
SIRAは、複数ラウンド探索探索を単一のコーパス識別検索アクションに圧縮することができる。
解釈可能で、トレーニング不要で、効率的でありながら、より高価なマルチラウンドサーチを超えることができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:54:29 GMT)
UniPool: A Globally Shared Expert Pool for Mixture-of-Experts [25.7] 専門家の能力をグローバルな建築予算として扱うMOEアーキテクチャであるUniPoolを提案する。
一致したバニラMOEベースラインに対して,UniPoolは検証損失とパープレキシティを継続的に改善することを示す。
さらなる分析により、UniPoolの利点はよりきめ細かい専門家分解によって構成されることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:59:44 GMT)
AirQualityBench: A Realistic Evaluation Benchmark for Global Air Quality Forecasting [25.5] 本稿では,現実的な条件下での予測モデルを評価するために,グローバルな多汚染ベンチマークであるStarbfAirQualityBenchを紹介する。
このベンチマークには、2021年から2025年にかけての3,720の観測所からの時限観測が含まれ、6つの主要な汚染物質をカバーし、プロバイダネイティブな観測マスクを保存している。
AirQualityBenchは、サニタイズされたデータセットの強いパフォーマンスが、グローバルな断片化された監視ストリームに確実に転送されないことを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:25:43 GMT)
Uncertainty-Guided Edge Learning for Deep Image Regression in Remote Sensing [25.4] リモートセンシング衛星上での深部画像回帰の文脈におけるエッジ学習について検討する。
UGELの基盤となるのは、深いベータ回帰に基づく予測の不確実性の計算である。
その結果,UGELは,能動的あるいは半教師付き学習よりも高速に収束するエッジ学習を実現することがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:17:17 GMT)
Locality-aware Private Class Identification for Domain Adaptation with Extreme Label Shift [25.4] ドメイン適応は、ラベル付きソースドメインから異なる分布を持つラベル付きターゲットドメインに知識を転送することを目的としています。
実世界のシナリオでは、2つのドメインのラベル空間はしばしば包含関係を持ち、あるクラスは1つのドメインにのみ存在するが、もう1つのドメインには存在しない。
個人集団のサンプルの同定と悪影響の軽減は文献上極めて重要である。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:19:30 GMT)
Adapt to Thrive! Adaptive Power-Mean Policy Optimization for Improved LLM Reasoning [25.3] RLVR(Reinforcement Learning with Verifiable Rewards)は、Large Language Models(LLM)の推論能力を高めるための重要なパラダイムである。
既存のメソッドは通常、モデルの進化する推論能力に悪影響を及ぼす静的ポリシー最適化スキームに依存します。
本稿では,PMPO (Power-Mean Policy Optimization) とFAC (Feedback-Adaptive Clipping) の2つの主要なイノベーションを含む適応的電力量政策最適化 (APMPO) を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:57:40 GMT)
Wisteria: A Unified Multi-Scale Feature Learning Framework for DNA Language Model [25.2] Wisteriaはゲノム言語モデルであり、DNA配列の統一フレームワークにマルチスケールの特徴学習を統合する。
ワイステリアは局所的および大域的依存関係のモデリングを多スケールゲノム配列解析のために効果的に統一することを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:25:38 GMT)
Optimal Contextual Pricing under Agnostic Non-Lipschitz Demand [24.8] 任意のジャンプと原子を持つ非Lipschitzの要求曲線が誘導されるような線形評価と有界支持雑音によるコンテキスト動的価格について検討する。
本稿では,ランダム化パラメータ推定,保守的残留グリッド探索,信頼に基づくワンステップリダイレクトを組み合わせた時間アルゴリズムであるReserve-Markdown Redirect-UCB Pricingを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:57:14 GMT)
Same Signal, Opposite Meaning: Direction-Informed Adaptive Learning for LLM Agents [24.7] LLMエージェントは、性能改善時にのみ余分な計算を実行することを目標としている。
既存の手法では、計算の計算に必要なゲーティング信号から計算の値への一定の方向を仮定して、信頼性、不確実性、難易度に基づくゲートを用いるのが一般的である。
このアライメントは不安定であり、タスクが修正された場合でも環境やバックボーンをまたいで逆転する。
DIAL(Direction-Informed Adaptive Learning)は、信号に依存しない対実探索から訓練されたスパースゲートであり、各状態特徴の実用方向を学習する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:15:51 GMT)
Proactive Instance Navigation with Comparative Judgment for Ambiguous User Queries [24.7] 比較判断(ProCompNav)を用いた能動型インスタンスナビゲーションを提案する。
ProCompNavはまず候補プールを構築し、比較判定によってターゲットを識別する。
CoIN-Benchでは、ProCompNavはインタラクティブなベースラインよりも、最小限の入力と非インタラクティブなベースラインを詳細な説明で改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:19:03 GMT)
Free Energy-Driven Reinforcement Learning with Adaptive Advantage Shaping for Unsupervised Reasoning in LLMs [24.6] 2つの重要なイノベーションに基づいて構築された新しいRLベースのアルゴリズムであるFREIAを紹介する。
FERは、自由エネルギー原則に基づくコンセンサスと探索のバランスを取るために報酬を適合させる。
数学的推論タスクでは、FREIAは平均0.5から3.5ポイントの他の手法を上回ります。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:49:30 GMT)
McNdroid: A Longitudinal Multimodal Benchmark for Robust Drift Detection in Android Malware [24.5] McNdroidは、マルウェア検出とドリフト分析のための、過去最大規模のマルチモーダルAndroidマルウェアベンチマークである。
テスト時間ギャップの増大にともなう標準MLおよびディープラーニング検出器の評価を行った。
我々は、モデル説明におけるモダリティ固有のドリフト、マルウェアの進化、時間的変化を分析した。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:53:24 GMT)
Auto Research with Specialist Agents Develops Effective and Non-Trivial Training Recipes [24.5] 外部測定により駆動される閉じた経験ループとしての自動車研究について検討する。
提出された各トライアルには、仮説、実行可能なコード編集、評価者が所有する結果、次の提案を形作るフィードバックが含まれる。
このループを、レシピの表面を分割し、試行錯誤で測定された系統を共有する専門エージェントでインスタンス化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:13:43 GMT)
Efficient Serving for Dynamic Agent Workflows with Prediction-based KV-Cache Management [24.4] 既存のアプローチでは、エージェントレベルでKV-Cacheを管理するか、ワークフローレベルでキャッシュを管理する。
PBKV(textbfPredictiontextbfBased textbfKV-Cache Management)と呼ばれるシステムを構築する。
各ワークフローに対して、PBKVは、いくつかの将来のステップでエージェントの呼び出しを予測する。
予測に基づいて、PBKVはキャッシュエントリの再利用ポテンシャルを推定し、GPUメモリの高ポテンシャルエントリを保持する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:57:51 GMT)
Christoffel-DPS: Optimal sensor placement in diffusion posterior sampling for arbitrary distributions [24.4] 本研究では,Christoffel関数に基づく分布自由なセンサ配置フレームワークを提案する。
Christoffel-DPS をオフラインおよびオンライン版で開発し、生成モデルのためのChristoffel サンプリングをインスタンス化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:03:39 GMT)
Heimdallr: Characterizing and Detecting LLM-Induced Security Risks in GitHub CI Workflows [24.3] GitHub Continuous Integration(CI)は、レビュー、トリアージ、コンテンツ生成、リポジトリのメンテナンスを自動化するために、Large Language Models(LLM)を統合している。
外部制御可能なワークフロー入力は、LSMプロンプトと出力を形作ることができ、セキュリティ上の決定やリポジトリの状態、特権的な実行に影響を与える可能性がある。
LLMによるGitHub CIのセキュリティリスクに関する最初の研究について紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:16:26 GMT)
Traffic Scenario Orchestration from Language via Constraint Satisfaction [24.0] 閉ループ試験型AVのための言語内シミュレーション・アウト・シナリオオーケストレータを提案する。
慎重に構築された多様なシナリオ記述のベンチマークでは、私たちのアプローチは、オーケストレーションの成功率のベースラインを大きく上回っています。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:34:27 GMT)
Learning and Reusing Policy Decompositions for Hierarchical Generalized Planning with LLM Agents [24.0] LLMエージェントの汎用計画と階層的タスク分解を組み合わせた動的ポリシー学習手法を提案する。
AppWorldのベンチマークで評価すると、通常のタスクでは98.2%の精度、目に見えないアプリケーションでは97.8%の精度を実現している。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:22:33 GMT)
RobotEQ: Transitioning from Passive Intelligence to Active Intelligence in Embodied AI [23.8] 本稿では,アクティブインテリジェンスのための最初のベンチマークであるRobotEQを紹介する。
我々は,1,900の自我中心画像からなるデータセットを,10の代表的な実施カテゴリと56のサブカテゴリに分散して提供する。
また,このタスク上での最先端モデルの性能を評価するためにRobotEQ-Benchを構築した。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:22:26 GMT)
From Coordinate Matching to Structural Alignment: Rethinking Prototype Alignment in Heterogeneous Federated Learning [23.7] 不均一連合学習(HtFL)は、データ分散とモデルアーキテクチャの両方で異なるクライアント間の協調を可能にすることを目的としている。
既存のプロトタイプベースのHtFLメソッドは、通常、MSEベースのもしくはコサインベースのアライメント機構を再利用する。
我々は,アライメントの目的を絶対座標からクラス間関係構造へシフトさせるFedSAFを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:06:26 GMT)
Asymmetric On-Policy Distillation: Bridging Exploitation and Imitation at the Token Level [23.6] オンライン蒸留(OPD)は、トークンレベルの教師のフィードバックで生徒を自身の軌道で訓練する。
正の強化学習を保ちつつ,非正の負の強化を非正の利得領域における局所的な発散最小化に置き換える非対称オンポリシィ蒸留(AOPD)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:02:49 GMT)
EMO: Pretraining Mixture of Experts for Emergent Modularity [23.5] 大規模な言語モデルは一般的にモノリシックなシステムとしてデプロイされる。
MoEは、入力毎に専門家のサブセットだけを活性化することで潜在的な代替手段を提供するが、実際には、特定のドメインの専門家のサブセットに対する推論を制限することで、パフォーマンスが大幅に低下する。
EMOはモジュール性 - 専門家のサブセットの独立した使用と構成 - 人間が定義した事前定義を必要とせずに - のために設計されたMoEである。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:59:20 GMT)
ICU-Bench:Benchmarking Continual Unlearning in Multimodal Large Language Models [23.5] ICU-Benchは,プライバシクリティカルな文書データに基づく連続的マルチモーダルアンラーニングベンチマークである。
ICU-Benchには、医療報告と労働契約という2つの文書ドメインから1000のプライバシーに敏感なプロフィールがあり、9,500の画像、16,000の質問応答ペア、100の忘れタスクがある。
新しい連続的アンラーニングメトリクスを導入し、有効性を忘れること、歴史的に忘れることの保存、有効性、安定性を総合的に分析する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:46:33 GMT)
Best Arm Identification in Generalized Linear Bandits via Hybrid Feedback [23.4] 一般化線形包帯における固定信頼度最適腕同定をハイブリッドフィードバックモデルにより検討した。
不均一な一般化線形観測を統一する確率比に基づく信頼シーケンスを導入する。
アームとペアの共同動作空間上での最小最適設計を追跡することで,クエリを適応的に割り当てるハイブリッドトラック・アンド・ストップアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:40:42 GMT)
Transformers Provably Implement In-Context Reinforcement Learning with Policy Improvement [23.2] コンテクスト内強化学習を行う変換器の能力について検討する。
線形自己注意変換器ブロックは、ポリシー改善手法を確実に実装できることを示す。
ICRL文献における最初の収束保証を確立する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:50:49 GMT)
Effective Knowledge Transfer for Multi-Task Recommendation Models [23.1] コンバージョンレート(CVR)は、コンテンツとオーディエンス選好のアライメントを定量化するため、プラットフォームの有効性を評価する上で重要な指標である。
マルチタスク勧告モデル(EKTM)のための効果的な知識伝達手法を提案する。
この方法は,多様なユーザの行動からランキングモデルを学習し,知識の伝達によるパフォーマンスの向上を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:22:20 GMT)
X-OmniClaw Technical Report: A Unified Mobile Agent for Multimodal Understanding and Interaction [23.1] X-OmniClawは,Androidエコシステムにおけるマルチモーダル理解とインタラクションのために設計された,統一されたモバイルエージェントである。
この知覚、記憶、行動のアーキテクチャにより、エージェントはコンテキスト認識の高い複雑なモバイルタスクを処理できる。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:58:34 GMT)
AffineLens: Capturing the Continuous Piecewise Affine Functions of Neural Networks [23.0] Piecewise Affine Neural Network (PANN) は、ニューラルネットワークの表現性に関する原則的な幾何学的視点を提供する。
AffineLensは、超平面配置とPANNを基盤とした多面体構造を計算するための統一的なフレームワークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:16:39 GMT)
Expressivity of Bi-Lipschitz Normalizing Flows: A Score-Based Diffusion Perspective [22.9] スコアベース拡散モデルのレンズによるバイリプシッツ正規化流れの表現性について検討する。
我々のキーとなる考え方は、確率フローODEを用いて、スコアの正則性を誘導された輸送マップの正則性に結びつけることである。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:54:49 GMT)
Unified 4D World Action Modeling from Video Priors with Asynchronous Denoising [22.9] 我々は,リアルタイムなロボットアクションの実行と高忠実度4D世界合成(ビデオ+3D再構成)を単一のフレームワークで統合する,統一された4D世界モデルであるX-WAMを提案する。
X-WAMは、事前訓練されたビデオ拡散モデルの強い視覚的優位性を活用するために、マルチビューRGB-Dビデオを予測することによって未来を想像する。
非同期ノイズサンプリング(ANS)は、生成品質と動作復号効率を共同で最適化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:23:39 GMT)
Null Space Constrained Contrastive Visual Forgetting for MLLM Unlearning [22.7] 非ターゲットの視覚的知識とすべてのテキスト的知識を保存しながら、ターゲットの視覚的知識を忘れることを目的としたMLLMアンラーニング手法を導入する。
まず,対象の視覚的知識と保持された視覚的知識とを分離するコントラストビジュアルフォッティング(CVF)機構を提案する。
第二に、保持された知識に関連するヌル空間を特定し、この空間内での未学習プロセスを制約することにより、知識保持の劣化を著しく軽減する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:18:58 GMT)
Adversarial Graph Neural Network Benchmarks: Towards Practical and Fair Evaluation [22.6] 敵対的学習とグラフニューラルネットワーク(GNN)の堅牢性は、機械学習コミュニティに広く関心を寄せているトピックである。
敵GNN研究において、公正で堅牢で標準化された評価プロトコルを採用することの重要性を実証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:27:24 GMT)
How Many Iterations to Jailbreak? Dynamic Budget Allocation for Multi-Turn LLM Evaluation [22.5] 大規模言語モデル(LLM)の多ターン会話設定における重要なイベントは、しばしば繰り返し対話の後にのみ現れる。
最近のコンフォメーションサバイバルフレームワークは、関心のイベントをトリガーするイテレーション数に基づいて、信頼できる低い予測境界(LPB)を構築している。
DAPROは,マルチターンインタラクションにおいて,時間と時間の境界を設定するための,理論上有効な動的予算配分フレームワークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:25:15 GMT)
MTL-MAD: Multi-Task Learners are Effective Medical Anomaly Detectors [22.5] 医用画像の異常検出は、訓練中は通常不可能であるため、難しい作業である。
我々は,Mixture-of-Experts(MoE)に基づくジョイントモデルを用いて,複数の自己監督的・擬似ラベルタスクをスクラッチから学習することを提案する。
我々のモデルは解釈可能な異常マップを生成し、医師がより正確な診断を行うのに役立つ可能性がある。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:03:09 GMT)
Towards Security-Auditable LLM Agents: A Unified Graph Representation [22.4] 本稿ではエージェントセキュリティ監査のための統合構造表現であるエージェントBOMを提案する。
エージェントBOMは、クロスセッションメモリ中毒やツール誤用など、ステルス攻撃チェーンを再構築できることを示す。
Agent-BOMは複雑なエージェントエコシステムにおける根本原因分析とセキュリティ適応のための統一的で監査可能な基盤を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:14:29 GMT)
LoopTrap: Termination Poisoning Attacks on LLM Agents [22.3] 本研究では,悪質なプロンプトをエージェントの文脈に注入することで,エージェントの終了判断を歪めることができることを示す。
エージェントの行動傾向を利用して、ターゲット固有の悪意のあるプロンプトを合成する自動赤チームフレームワークであるLoopTrapを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:21:51 GMT)
From Storage to Experience: A Survey on the Evolution of LLM Agent Memory Mechanisms [22.3] LLM(Large Language Model)ベースのエージェントは、外部ツールと計画機能を統合することによって、人工知能を根本的に再構築した。
本研究は, LLMエージェント記憶機構の新たな進化的枠組みを提案し, 開発プロセスを3段階に定式化する。
まず、この進化の3つの中心的要因である長距離一貫性の必要性、動的環境における課題、継続的な学習の最終的な目標を解析する前に、これらの3つの段階を正式に定義する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:38:48 GMT)
A Flow Matching Algorithm for Many-Shot Adaptation to Unseen Distributions [22.1] FP-FMは、トレーニング分布の集合に対応する速度場にまたがる基底関数を学習する。
単純な最小二乗射影をこの基底に計算することで、新しい分布に適応する。
合成データセットと画像ベースデータセットのベースラインに対する精度とリコールを大幅に向上させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:47:21 GMT)
The Structural Origin of Attention Sink: Variance Discrepancy, Super Neurons, and Dimension Disparity [22.0] この研究は、この現象のテクトメカニスティックな説明を提供する。
我々はそのルーツを自己注意に固有の価値集約プロセスに遡る。
概念実証として,事前学習時の値アグリゲーション出力を安定化するアーキテクチャ変更であるtextithead-wise RMSNormを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:28:55 GMT)
DBMSolver: A Training-free Diffusion Bridge Sampler for High-Quality Image-to-Image Translation [21.8] 拡散に基づく画像画像画像変換(I2I)は高忠実度生成に優れるが、最先端DBMのサンプリングが遅い。
我々はDBMの基盤となるSDEとODEの半線形構造を利用するトレーニング不要なサンプルラーであるolverを紹介した。
これにより、NFEは5倍まで低下し、品質が向上する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:59:05 GMT)
EgoEMG: A Multimodal Egocentric Dataset with Bilateral EMG and Vision for Hand Pose Estimation [21.8] EgoEMGは、両手ポーズ推定のためのマルチモーダルなエゴセントリックデータセットである。
データセットは、30の片手ジェスチャーと30のバイマニュアルジェスチャーを含む60のジェスチャークラスを実行する41の参加者を対象としている。
EgoEMGとそのベンチマークは、EMGとビジョンを用いたマルチモーダルハンドポーズ推定に関する将来の研究の基礎を確立している。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:56:57 GMT)
Why Do DiT Editors Drift? Plug-and-Play Low Frequency Alignment in VAE Latent Space [21.7] マルチターン編集は、しばしばプログレッシブなセマンティックドリフトと品質劣化をもたらす。
本稿では,VAE-LFA(Low Frequency Alignment)を提案する。
VAE-LFAは、低域通過フィルタリングにより編集ラウンド間の遅延不一致を分解し、低周波数統計を前ラウンドの指数移動平均に整合させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:33:21 GMT)
Equivalence of Coarse and Fine-Grained Models for Learning with Distribution Shift [21.7] ブール概念クラスに対して,PQ学習からTDS学習までの効率的なブラックボックス削減を行う。
この同値性は、ハーフ空間のような基本クラスの分布自由なTDS学習における最初の硬度結果を意味する。
また、学習者がメンバーシップクエリーにアクセスできるようにすることは、これらの難易度の結果を横取りし、ハーフスペースの効率よく分布のないPQ学習を可能にすることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:37:29 GMT)
Beyond Factor Aggregation: Gauge-Aware Low-Rank Server Representations for Federated LoRA [21.6] フェデレートされたLoRAは、分散データの下で大きな言語モデルのパラメータ効率の良い適応を可能にする。
LoRA因子の直接平均化は表現依存である。
We propose textbfGLoRA, a gauge-aware server representation for Federated LoRA。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:57:24 GMT)
TIDE: Every Layer Knows the Token Beneath the Context [21.6] 本稿では,標準トランスフォーマーを EmbeddingMemory で拡張する TIDE を提案する。
我々は、TIDEの利点を理論的かつ実証的に確立し、シングルトークンID注入に関連する問題に対処する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:16:18 GMT)
Optimal Transport for LLM Reward Modeling from Noisy Preference [21.5] 最適輸送を基盤としたフレームワークであるSelectiveRMを提案する。
まず、モデル予測の分布と嗜好データとを一致させるために、整合性差分法を考案する。
次に、部分輸送による質量緩和機構を組み込む。
これにより、意味的一貫性に矛盾するノイズの多い選好を持つサンプルを自律的に排除することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:26:04 GMT)
VideoRouter: Query-Adaptive Dual Routing for Efficient Long-Video Understanding [21.4] ビデオは、過度に長い視覚的トーケンシーケンスを生成し、推論中にメモリと遅延を急激に増加させる。
本稿では,InternVL上に構築されたクエリ適応型デュアルルータフレームワークであるVideoについて述べる。
我々は、ビデオがInternVLベースラインを同等または低い予算で継続的に改善し、67.9%のトークン削減を達成することを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:23:27 GMT)
Taming the Entropy Cliff: Variable Codebook Size Quantization for Autoregressive Visual Generation [21.4] トレーニングセットのパーポジション条件エントロピーは、数位置の後に条件分布が本質的に決定論的になるように、シーケンスに沿って急速に減衰する。
これを解決するために、可変コードブックサイズ量子化(VCQ)を提案し、そこでは、コードブックサイズ$K_t$がシーケンスに沿って単調に成長する。
バニラ自己回帰変換器と標準的な次世代予測により、VCQのベースバージョンはImageNet上でgFID w/oGを27.98から14.80に削減する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:13:30 GMT)
Autoregressive Visual Generation Needs a Prologue [21.4] Prologueは自己回帰(AR)画像生成における再構成世代ギャップを埋めるアプローチである。
プロローグは、視覚トークンシーケンスに先立つ小さなプロローグトークンセットを生成する。
提案手法は,学習した生成表現を別々に導入することにより,生成品質を向上させることができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:35:51 GMT)
Knowledge-Graph Paths as Intermediate Supervision for Self-Evolving Search Agents [21.4] 自己進化型検索エージェントは、独自の検索タスクを生成し、解決する。
探索セルフプレイ(SSP)フレームワーク上に構築し,多段階探索と推論による質問の生成と回答を行う。
本稿では,知識グラフの経路を,質問構築と報酬形成の中間管理として利用することで,二つのボトルネックに対処する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:46:53 GMT)
No Triangulation Without Representation: Generalization in Topological Deep Learning [21.4] グラフニューラルネットワーク(GNN)と高階メッセージパッシング(HOMP)の両方がベンチマークを飽和させることができることを示す。
驚くべきことに、既存のモデルがデータ構造を超えて一般化できるという兆候は見つからない。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:55:24 GMT)
Diversity Curves for Graph Representation Learning [21.4] 粗いレベルのグラフの構造的多様性の追跡方法を示す。
結果として得られるグラフの埋め込みは、構成、効率的、直接的に比較して解釈できる。
我々は,その実用性を,実際にさまざまなベースライン手法で実証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:55:20 GMT)
3D MRI Image Pretraining via Controllable 2D Slice Navigation Task [21.3] 自己教師付きプレトレーニングは、ラベルなしスキャンからMRI表現を学ぶための主流のアプローチとなっている。
マスクしたパッチの再構築と異なる、固有の自己超越信号が存在するかどうかを問う。
スライスを連続的な位置、向き、スケールでレンダリングすることで、3Dボリュームを高密度なビデオアクションシーケンスに変換することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:08:22 GMT)
Inference-Time Budget Control for LLM Search Agents [21.1] マルチホップ質問応答(QA)の問題を2段階の推論時間予算制御として定式化する。
検索時には,各実行可能なアクションに対して,タスクレベルの値情報(VOI)スコアを割り当てる。
探索後、選択的エビデンスグラウンドのファイナライザは、軌道解答を洗練された候補と比較し、残差エラーが低リスクな解形式エラーであるように見える場合にのみ書き換える。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:45:58 GMT)
CXR-ContraBench: Benchmarking Negated-Option Attraction in Medical VLMs [21.0] CXR-ContraBenchは、内部のReXVQAスライスと外部のOpenIおよびCheXpertプロトコルにまたがる診断ベンチマークである。
我々は,この失敗を,視覚的証拠と疑問の両方に矛盾する場合でも,否定的回答オプションにモデルを引き付けるという,否定的選択の誘因として研究する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:46:17 GMT)
OBLIQ-Bench: Exposing Overlooked Bottlenecks in Modern Retrievers with Latent and Implicit Queries [21.0] OBLIQ-Benchは、本物のロングテールコーパスに対する5つの斜め探索問題のスイートである。
OBLIQ-Benchは、検索と検証の間に見落とされた非対称性を公開する。
我々はOBLIQ-Benchが、大規模コーパスにおける潜在パターンや暗黙の信号を効率的にキャプチャする検索アーキテクチャの研究を進めることを願っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:22:49 GMT)
In-Context Black-Box Optimization with Unreliable Feedback [20.9] フィードバックインフォームド・インコンテクスト・ブラックボックス最適化(FICBO)について検討する。
本稿では,フィードバックソースが真の目的に対してアクセス,関連性,歪みにどう影響するかをモデル化した構造化されたフィードバックを導入し,フィードバックトランスフォーマーの事前訓練を行う。
合成および実世界のタスクでは、FICBOは情報フィードバックを効果的に活用し、弱いまたは誤解を招くソースに頑健に留まる。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:03:19 GMT)
Playing the network backward: A Game Theoretic Attribution Framework [20.8] 我々は,拡張ネットワークグラフ上で,逆向きの属性を2プレーヤゲームとして再キャストする。
勾配と完全なα-β-LRP族は、特定の平衡の下でのゲーム軌道上の積分として現れる。
ローカライゼーション・フォーカスのような説明の性質はゲーム理論の概念として定義することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:15:07 GMT)
Prompt-Free and Efficient SAM2 Adaptation for Biomedical Semantic Segmentation via Dual Adapters [20.7] Segment Anything Model 2 (SAM2)は、自然画像上で印象的なゼロショット機能を示したが、ドメインシフトや依存関係の急激な追加によるバイオメディカルセグメンテーションの課題に直面した。
可変サイズの入力に対するマルチクラスセグメンテーションのために設計された,プロンプトフリーでパラメータ効率の良い微調整フレームワークを提案する。
本法では,バニラ2のセグメンテーション精度を19.66%向上させ,重度医療SAM適応と比較して計算コストを約87%削減した。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:24:01 GMT)
Attributions All the Way Down? The Metagame of Interpretability [20.6] モデル説明の2階相互作用効果を定量化するための概念的枠組みであるメタゲームを紹介する。
属性が階層的にメタ属性に分解されることを証明し、これらを既存の相互作用指標の方向性拡張として確立する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:59:26 GMT)
Beyond Fixed Benchmarks and Worst-Case Attacks: Dynamic Boundary Evaluation for Language Models [20.6] 本稿では,動的境界評価(DBE)を提案する。これは各モデルの境界を積極的に把握し,グローバルに匹敵する難易度尺度に配置する。
DBEは、3つのアーティファクトを提供する: (i) 安全性、能力、真実性をカバーした校正項目銀行で、9ドルの基準LCMで検証された難易度ラベル付きで、 (ii) スキルガイド境界探索(SGBS)、 (ii) APIレベルクエリアクセスのみを使用して、所定のターゲットLSMの境界項目を見つける検索アルゴリズム、 (iii) 新しいLCMを統一能力尺度に配置し、ターゲットが外に落ちたときに適応的に評価セットを拡大する評価プロトコル。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:15:31 GMT)
Breaking, Stale, or Missing? Benchmarking Coding Agents on Project-Level Test Evolution [20.6] テスト進化のための最初のプロジェクトレベルのベンチマークであるTEBenchを紹介します。
TEBenchをDefects4Jプロジェクト上で4段階のパイプラインで構築する。
3つの産業エージェントフレームワークにまたがる7つの構成を評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:31:09 GMT)
FutureWorld: A Live Reinforcement Learning Environment for Predictive Agents with Real-World Outcome Rewards [20.5] 本稿では,予測,結果実現,パラメータ更新の間のトレーニングループを閉鎖するエージェント強化学習環境であるFutureWorldを紹介する。
3つのオープンソースエージェント、連続したFutureWorldトレーニングラウンドは、予測精度、確率的スコアリング、キャリブレーションを一貫して改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:24:24 GMT)
A Simple State Space Model Excels at Multivariate Time Series Classification [20.4] 対角SSM(S4D)と入力依存SSM(Mamba family)を対象とする大規模TSCベンチマークの系統的研究を行った。
S4Dは、精度と効率の両面で、Mambaベースの変種を一貫して上回っている。
線形入力プロジェクションとチャネル混合機構によりS4Dに軽量な修正を加えたMS4Nと、無視できないオーバーヘッドで状態ダイナミクスを安定化する正規化変種であるMS4Nを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:49:25 GMT)
Optimizer-Model Consistency: Full Finetuning with the Same Optimizer as Pretraining Forgets Less [20.2] 事前トレーニングと同様の完全な微調整は、学習を忘れるトレードオフ、すなわち、新しいタスクで同じあるいはより良いパフォーマンスを達成しながら、より少ないことを忘れることを実現する。
合成言語モデリング実験を用いて、これはMuonのロテに対する強い傾向から生じる可能性があることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:57:02 GMT)
Differentiable Adaptive 4D Structured Illumination for Joint Capture of Shape and Reflectance [20.2] 対象物に対する4次元照明条件を適応的に計算するための微分可能なフレームワークを提案する。
簡単なヒストグラムに基づく画素レベルの確率モデルを用いて深度と反射率を推定する。
新しい構造照明を流すと、対応する画像計測によって各画素の不確かさを更新する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:15:48 GMT)
Preference Instability in Reward Models: Detection and Mitigation via Sparse Autoencoders [20.1] 大規模言語モデルにおける優先学習は、人間の判断のためのプロキシとして報酬モデルに依存している。
この不安定性を3つの意味保存摂動型を用いて表現レベルで解析する。
我々は2つのSAEベースの不安定緩和戦略を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:48:48 GMT)
Structural Correspondence and Universal Approximation in Diagonal plus Low-Rank Neural Networks [20.0] 最小限の対角成分しか持たない低ランク層の拡大はユニバーサル近似に到達するのに十分であることを示す。
また、DLoRニューラルネットワークが一般活性化関数のユニバーサル近似定理を完全に復元していることも証明した。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:21:04 GMT)
Measuring Black-Box Confidence via Reasoning Trajectories: Geometry, Coverage, and Verbalization [19.9] 信頼度推定は、テキストのみのAPIを通じて、チェーン・オブ・ソート(CoT)推論の安全なデプロイを可能にする。
本研究では,CoTをスライドウインドウ軌道として埋め込んだブラックボックストラジェクトリ信頼スコアを提案し,その収束度を外部応答アンカーに測定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:10:23 GMT)
Reconstruction or Semantics? What Makes a Latent Space Useful for Robotic World Models [19.8] 世界モデルに基づくポリシー評価は、アクション条件付きビデオモデルで候補アクションをロールアウトすることで、現実のロボット制御をテストするための実用的なプロキシである。
動作条件付きLDMの潜在空間を6つの再構成と意味エンコーダを比較して体系的に評価した。
本稿では,ロボットの世界モデルの性能を評価するために,視覚的忠実度,計画および下流ポリシー性能,潜在表現品質の3つの軸を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:05:26 GMT)
SymDrift: One-Shot Generative Modeling under Symmetries [19.7] 等変生成器は、対称性化された対象分布から得られるものと同じドリフト場を一般的に生成しないため、ドリフトモデルは対称性に固有の課題に直面していることを示す。
i) 最適アライメントに基づく座標空間における対称性付きドリフト、(ii) 構成による対称性の曖昧さを取り除く$G$不変な埋め込みである。
ワンショット推論を有効にすることで、SymDriftは計算オーバーヘッドを既存のベースラインと比較して最大40$times$に削減する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:38:44 GMT)
The Kubo-Thermalization Correspondence [19.7] 量子熱化は相互作用する量子系が熱平衡に向かって緩和する方法を記述する。
多体系に関する実験的な情報のほとんどは、短時間の遷移分光によるものである。
ここでは、弱い駆動下での長時間熱化磁化と、熱浴に結合したスピンに対する短時間線形応答スペクトルとの正確なリンクを確立する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:59:55 GMT)
Computer Use at the Edge of the Statistical Precipice [19.6] 記録されたアクションシーケンスを盲目的に実行した1MBのリプレイスクリプトは、顕著な静的ベンチマークにおいてフロンティアモデルよりも優れていることを示す。
非原則的環境設計と非原則的評価手法の2つの根本原因を追究する。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:43:43 GMT)
$f$-Divergence Regularized RLHF: Two Tales of Sampling and Unified Analyses [19.6] Reinforcement Learning from Human Feedbackは、大規模言語モデルの訓練後において基礎となるテクニックである。
近年の実験的研究は、RLHFの正則化剤として代替の発散の研究を始めている。
本研究は、一般の$f$-divergence正規化目的を持つオンラインRLHFの包括的な理論的枠組みを開発する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:48:26 GMT)
Beyond Negative Rollouts: Positive-Only Policy Optimization with Implicit Negative Gradients [19.4] 検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)の推論能力を高める主要なパラダイムとなる。
オンラインのポジティブロールアウトを通じてのみ学習を行うことができる新しいRLVRフレームワークであるPOPOを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:55:21 GMT)
What Happens Inside Agent Memory? Circuit Analysis from Emergence to Diagnosis [19.3] 我々はQwen-3ファミリー(0.6B-14B)と2つのメモリフレームワーク(mem0とA-MEM)の回路をトレースする。
我々は無監督段階診断を開発し,76.2%の精度でサイレント障害を責任ある手術に局在させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:56:54 GMT)
LeakDojo: Decoding the Leakage Threats of RAG Systems [19.3] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)が外部知識を活用することを可能にする。
RAGは、漏洩攻撃に対して貴重なRAGデータベースを公開する。
本稿では,RAG漏洩の制御のためのフレームワークであるLeakDojoを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:55:02 GMT)
Ray-Aware Pointer Memory with Adaptive Updates for Streaming 3D Reconstruction [19.1] 連続画像ストリームからの3次元再構成には、正確な幾何集約と安定したメモリ管理が必要である。
空間的位置と視線方向の両方を明示的にモデル化した3次元再構成のためのレイアウェア・ポインターメモリを提案する。
われわれのアプローチは、画像ストリームからのスケーラブルでドリフトに耐性のあるオンライン3D再構成のための、原則化されたフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:42:11 GMT)
When Brain Networks Travel: Learning Beyond Site [19.1] 機能的磁気共鳴画像(fMRI)のグラフベースの学習は、脳ネットワーク解析に強い可能性を示している。
既存の方法は、サイト条件のコンソーシアムが非病理的ショートカットを誘導するため、クロスサイト・アウト・オブ・ディストリビューション(OOD)設定で劣化する。
我々は、見知らぬ場所にまたがる脳ネットワーク学習のための統合フレームワークであるクロスサイトOOD Robust Brain nEtwork (CORE)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:35:34 GMT)
Attractor Geometry of Transformer Memory: From Conflict Arbitration to Confident Hallucination [19.1] 言語モデルは、事実を重み付け(パラメトリックメモリ、PM)と文脈情報(ワークメモリ、WM)の2つの知識源に基づいて描画する。
本研究は,PMとWMの相違点と干渉点,および幻覚点の相違点について,機械的に異なる2つの障害モードについて検討した。
両障害が統一的な幾何学的説明を共有することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:25:54 GMT)
Stego Battlefield: Evaluating Image Steganography Attacks and Steganalysis Defenses [18.9] SADBenchは、ステガノグラフィーを介して有害な秘密を注入する敵の能力と、ステガナリシスを通じてそのような脅威を検出する守備者の能力を評価する体系的なベンチマークである。
様々なカバー分布にまたがる画像ペイロードとテキストペイロードの両方を評価し、有害な視覚的セマンティクスと有害な指示を利用して悪意のある攻撃をシミュレートする。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:26:02 GMT)
The Cost of Context: Mitigating Textual Bias in Multimodal Retrieval-Augmented Generation [18.8] MLLM(Multimodal Large Language Models)とRAG(Retrieval-Augmented Generation)の統合が進んでいる
再破壊現象を特定し, 定式化した上で, 完全に正確な「おかしな」コンテキストを導入することで, 有能なモデルが早期に正しい予測を放棄する。
本稿では,BAIR(Bottleneck Attention Intervention for Recovery)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:27:04 GMT)
Revisiting Adam for Streaming Reinforcement Learning [18.8] このオンライン環境でDQNやC51が実施したような,確立された更新の有効性について検討する。
我々は、アダプティブQ$()$ (Adaptive Q$()$) と呼ばれる、アダプティブトレースに基づく分散調整アルゴリズムを導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:54:31 GMT)
PragLocker: Protecting Agent Intellectual Property in Untrusted Deployments via Non-Portable Prompts [18.7] LLMエージェントは、基礎的なLCMに基づいたタスク固有の機能を実装するプロンプトに依存する。
信頼できない展開では、敵はこれらのプロンプトを他のプロプライエタリなLLMとコピーして再利用することができ、経済的損失を引き起こす。
これらの要件を満たすプロンプトプロテクションスキームであるPragLockerを紹介します。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:19:06 GMT)
AGWM: Affordance-Grounded World Models for Environments with Compositional Prerequisites [18.6] 我々は,行動の動的実行可能性を明確に追跡するために,前提条件依存のDAGとして表される抽象的な空き構造を学習するAGWM(Affordance-Grounded World Model)を提案する。
ゲームベースのシミュレーション環境の実験では、より低いマルチステップ予測誤差、新しい構成へのより良い一般化、解釈可能性の向上により、本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:46:44 GMT)
Chain of Risk: Safety Failures in Large Reasoning Models and Mitigation via Adaptive Multi-Principle Steering [18.6] 大きな推論モデルは、透明性、検証、意図的な問題解決のためのチェーンオブ思考のような推論を公開する。
有害またはポリシー違反のコンテンツは、最終回答が安全に見える場合でも、トレースを推論して現れる可能性がある。
両段階を統一された20基の安全ルーリックの下で評価することにより, 最終回答の安全性が完全な推論・回答軌道の十分なプロキシであるかどうかを検証した。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:12:56 GMT)
On the Divergence of Differential Temporal Difference Learning without Local Clocks [18.6] この研究は、グローバルクロックとローカルクロックを使用して、2種類の学習率を区別する。
割引RLでは、局所時計に収束するRLアルゴリズムは、常に大域時計に収束する。
差分時間差学習は局所時計に収束するが,大域時計に収束することを示す反例を構築した。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:19:33 GMT)
Na-IRSTD: Enhancing Infrared Small Target Detection via Native-Resolution Feature Selection and Fusion [18.5] IRSTDのためのネイティブ解像度特徴抽出・融合フレームワークであるNa-IRSTDを提案する。
このフレームワークは、微妙なターゲットキューを保存するために、ネイティブレゾリューション機能をエレガントに組み込んでいる。
また、高い精度と信頼性でターゲットパッチを選択する効果的なトークン削減と選択戦略も導入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:42:03 GMT)
From flat to narrow bands: Engineering quantum emission in a one-dimensional Lieb lattice [18.3] 一次元リーブ格子における量子放出ダイナミクスを統一する理論的枠組みを開発する。
我々の研究は、理想化されたフラットバンド物理学と新しい狭帯域プラットフォームを結びつける統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:00:55 GMT)
SCRuB: Social Concept Reasoning under Rubric-Based Evaluation [18.0] SCRuB(Social Concept Reasoning Under-authored Evaluation Perspectives)は,タスクの不確定性の設定を目的としたフレームワークである。
我々のゴールは、人間の専門知識の深みと批判的厳密さによって、社会概念に関するモデル的理由がどの程度になるかを測定することである。
我々の結果は、フロンティアモデルが5次元すべてで人間の専門家より一貫して優れていることを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:43:14 GMT)
HumanNet: Scaling Human-centric Video Learning to One Million Hours [18.0] 我々は、人間中心のビデオコーパスであるHumanNetを紹介します。
HumanNetは、一対一の視点と三対一の視点の両方にまたがり、きめ細かい活動、人間とオブジェクトの相互作用、ツールの使用、長期の振る舞いをカバーしている。
生のビデオ以外に、データセットは、キャプション、モーション記述、手と体に関する信号など、インタラクション中心のアノテーションを提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:21:58 GMT)
Knowledge Transfer Scaling Laws for 3D Medical Imaging [17.7] 各種医用画像領域は事前訓練中に変化率でスケールし, 領域間の知識伝達は強い非対称性を示す。
これらの結果により、スケーリング法則最適化問題としてデータの割り当てを定式化する。
実証的には、Transfer-awareのアロケーションは、データプロポーショナルサンプリングを最大58%上回っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:00:12 GMT)
Visibility-Aware Mobile Grasping in Dynamic Environments [17.7] 本稿では,動的で未知の環境での移動的把握の問題に対処する。
本稿では,2つのコアコンポーネントからなるモバイル・グルーピング・システムを提案する。
その結果, 未知の静的・動的環境において, 68.8%, 58.0%の成功率が得られた。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:46:11 GMT)
Guidelines for Cultivating a Sense of Belonging to Reduce Developer Burnout [17.7] バーンアウトは、ソフトウェア開発者の精神的および身体的幸福に影響を与える。
所有の欠如は、ソフトウェア開発者の間でより高いレベルのバーンアウトと関連付けられています。
私たちは、所有性を育成し、開発者の燃え尽きを減らすためのエビデンスベースのガイドラインを提供します。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:28:04 GMT)
Relit-LiVE: Relight Video by Jointly Learning Environment Video [17.6] Relit-LiVEは、カメラポーズの事前知識を必要とせず、物理的に一貫性があり、時間的に安定した結果を生成する新しいビデオライティングフレームワークである。
私たちのキーとなる洞察は、レンダリングプロセスに生の参照イメージを明示的に導入することで、本質的な表現で必然的に失われたり破損したりする重要なシーンキューを復元することを可能にすることです。
我々のフレームワークは、シーンレベルのレンダリング、マテリアル編集、オブジェクト挿入、ストリーミングビデオのリライティングなど、様々なダウンストリームアプリケーションをサポートしている。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:58:15 GMT)
Lightweight Stylistic Consistency Profiling: Robust Detection of LLM-Generated Textual Content for Multimedia Moderation [17.6] コンテンツ作成におけるLarge Language Models (LLMs) は、マルチメディアモデレーションにとって重要なタスクとして、人書きのテキストコンテンツを区別する。
既存の検出器は統計的な手がかりやモデル固有のものに依存しており、言い換えや敵の操作に弱い。
LLM生成したテキストコンテンツを頑健に検出するための軽量なスタイリスティック整合性プロファイリング法LiLi SCPを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:58:00 GMT)
Bridging the Last Mile of Circuit Design: PostEDA-Bench, a Hierarchical Benchmark for PPA Convergence and DRC Fixing [17.6] 既存のEDA-LLMベンチマークでは、DRCの修正を完全に省略し、単一のツールチェーンに結びついたフラットな階層に依存している。
DRC-Essential, DRC-Reasoning, PPA-Mono, PPA-Multiにまたがる145のタスクからなる階層型ベンチマークであるPostEDA-Benchを紹介する。
エージェントは合成DRC-Essentialと単目的PPA-Monoを合理的に扱うが、より実用的なDRC-Reasoningでは著しく劣化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:54:07 GMT)
Safety Anchor: Defending Harmful Fine-tuning via Geometric Bottlenecks [17.6] 大規模言語モデル(LLM)の安全性アライメントは、HFT(Harmful Fine-tuning)に弱いままである。
本稿では,防御焦点を冗長なパラメータ空間からアンエンベディング層へシフトさせる安全ボトルネック規則化(SBR)を提案する。
SBRは、持続的なHFTの下でも安全な応答を維持することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:47:53 GMT)
Conservative Flows: A New Paradigm of Generative Models [17.5] 本稿では,データ分散不変性を残した離散力学によって生成が実行される代替パラダイムを提案する。
我々は,既存のチェックポイント上で直接動作する2つの確率保存型サンプリング機構,調整付きLangevinダイナミックスと予測器・コレクタフローを開発した。
我々は,このフレームワークを合成スイスロールターゲットであるImageNet-256とOxford Flowers-102上で検証した。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:06:08 GMT)
VITA-QinYu: Expressive Spoken Language Model for Role-Playing and Singing [17.3] ロールプレイングと歌声生成の両方をサポートする最初のエンド・ツー・エンド(E2E)音声言語モデルであるVITAQinYuを提案する。
我々は,自然会話,ロールプレイング,歌唱データを15.8K時間合成して訓練を行う。
VITAQinYuは、5ポイントのMOSスケールでピアモデルを0.13ポイント上回り、対物的なロールプレイングベンチマークでピアSLMを7ポイント上回っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:59:56 GMT)
Unified Value Alignment for Generative Recommendation in Industrial Advertising [17.2] 広告レコメンデーションのための統一価値アライメントフレームワークUniVAを提案する。
まず、SID構築に値関連属性を注入し、値識別アイテム表現を出力する有償SIDトークンを導入します。
次に,教師付き学習とe-CPM対応強化学習を併用した生成型SIDデコーダを開発した。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:41:19 GMT)
Resource-Constrained Robotic Planning in the face of Mixed Uncertainty [17.1] 我々は,ロボットが与えられたタスクを遂行する際の動作を誘導し,システムがリソースを無駄にしないようにするための堅牢な戦略の問題を考察する。
本稿では,まず,マルコフ消費決定プロセス(CMDPST)として,非決定的行動,定量化,不確実性,資源消費をモデル化した統合フレームワークをモデル化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:36:37 GMT)
Learning Discrete Autoregressive Priors with Wasserstein Gradient Flow [17.1] 離散画像トークン化器は、まず再構成用、次に凍結トークンシーケンスに適合した事前モデルという2つの段階で訓練される。
我々はこのミスマッチを,潜時変分学習を3つの整合条件に分解する三部変分整合(TVC)を用いて解析する。
我々はこの信号をWasserstein-gradient-flow updateで最適化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:41:46 GMT)
Group of Skills: Group-Structured Skill Retrieval for Agent Skill Libraries [17.1] グループ・オブ・スキルズ(Group of Skills)は、エージェントが対象とする検索対象をフラットなスキルリストからコンパクトなロールラベル付き実行コンテキストに変更する推論時グループ構造化検索手法である。
GoSkillsは、型付きスキルグラフからアンカー中心のスキルグループを構築し、グループグラフを通じてサポートグループを拡張し、スタート、サポート、チェック、回避フィールドとの固定実行契約をレンダリングする。
SkillsBenchとALFWorldの実験によると、GoSkillsは小さなスキル予算の下で可視的要求カバレッジを保ち、フラットなスキルアクセスベースラインよりも改善し、報酬とエージェントのみのランタイムを相対的に改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:51:59 GMT)
Rethinking RL for LLM Reasoning: It's Sparse Policy Selection, Not Capability Learning [16.7] 強化学習は新たな戦略を学ばず、ベースモデルがすでに持っている解に対して確率質量を再分配する。
この知見をReasonMaxxerに変換する。これは最小のRLフリーな手法で、エントロピー付き決定点にのみコントラスト損失を適用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:25:05 GMT)
Edge Deep Learning in Computer Vision and Medical Diagnostics: A Comprehensive Survey [16.6] 本稿では,コンピュータビジョンの応用,特に医療診断について概説する。
エッジディープラーニングの基本原則と技術的アドバンテージについて概説する。
エッジデバイスにディープニューラルネットワークを効果的に実装するためのアプローチについて議論する。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:19:51 GMT)
When Routine Chats Turn Toxic: Unintended Long-Term State Poisoning in Personalized Agents [16.6] textbfStateGuardはライトウェイトでポスト実行後のディフェンスで、書き込みバウンダリで状態差を監査し、危険な編集を選択的にロールバックする。
StateGuardは、安全第一の書き込み防衛と最小限のオーバーヘッドの下で、HSをほぼゼロ、偽陰性に減らし、高い偽陽性率を許容できることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:25:16 GMT)
PACZero: PAC-Private Fine-Tuning of Language Models via Sign Quantization [16.5] PACZeroは、大規模言語モデルを微調整するためのPACプライベートなゼロオーダー機構のファミリーである。
このプライバシー体制は、前回のMIA後続の成功率を制限している。
PACZero-MIとPACZero-ZPLの2つの選択肢を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:20:20 GMT)
Quantizing With Randomized Hadamard Transforms: Efficient Heuristic Now Proven [16.4] 均一ランダム回転(URR)は、現代の量子化手法における一般的な前処理ステップである。
実際には、URRはランダム化されたアダマール変換(RHT)に置き換えられることが多い。
2つのRHTはURRと同等の性能を発揮するが、2つのRHTはベクトル量子化(VQ)に十分でない可能性がある。
本稿では,実行時に使用するRHTの数を動的に適応させて性能を向上させるために,入力モーメントの線形時間$O(d)$チェックを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:11:54 GMT)
Invariant-Based Diagnostics for Graph Benchmarks [16.2] グラフベンチマークの診断フレームワークとしてグラフ不変量を提案する。
i)不変量は標準GNNよりも表現力が高く、(ii)不変量はベンチマークデータセット内およびベンチマークデータセット間の構造的不均一性を特徴づけ、(iii)不変量はマルチタスク性能を予測し、(iv)単純不変モデルは、トランスフォーマーおよびメッセージパスベースラインに競合し、時には超えていることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:51:43 GMT)
IntentGrasp: A Comprehensive Benchmark for Intent Understanding [16.2] 本稿では,Large Language Model (LLM) アシスタントの意図理解能力を評価するためのベンチマークであるIntentGraspを紹介する。
IntreGraspには262,759インスタンスの大規模なトレーニングセットと2つの評価セットが含まれている。
そこで本研究では,IntentGraspのトレーニングセット上でモデルを微調整し,All Set上で30以上のF1ポイント,Gem Set上で20以上のポイントを達成できるIFTを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:34:27 GMT)
One Algorithm, Two Goals: Dual Scoring for Parameter and Data Selection in LLM Fine-Tuning [16.2] 大規模言語モデル(LLM)では、パラメータとデータの選択が微調整コストを削減するための一般的な戦略である。
パラメータマスクとデータサブセットを共有勾配統計量から生成する1ショットのデュアルスコアアルゴリズムであるDualSFT(Dual-Selection Fine-Tuning)を提案する。
3B-9B LLMでは、単一軸DualSFTは目標タスク性能と安定塑性トレードオフを強化し、フルDualSFTはより有利な共同制約トレードオフをもたらす。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:52:02 GMT)
Multi-agent decision making: A Blackwell's informativeness approach [16.2] ブラックウェルの情報化フレームワークを用いて,マルチLLM設定における決定を解析する原理的手法を提案する。
投票や討論は、全てのエージェントのプールされたプライベート情報よりも情報的でない情報構造を誘導することを示します。
本稿では,各エージェントの後部を推定し,後部積推定器を用いてプールした後部を近似する質問応答タスクの実践的手法を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:19:31 GMT)
A$^2$TGPO: Agentic Turn-Group Policy Optimization with Adaptive Turn-level Clipping [16.2] エージェント型大規模言語モデル(LLM)の強化学習は、スパースな軌道レベルの結果報酬に依存している。
A$2$TGPO (Agentic Turn-Group Policy Optimization with Adaptive Turn-level Clipping) を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:09:31 GMT)
3DSS: 3D Surface Splatting for Inverse Rendering [16.0] 3D Surface Splatting (3DSS)は、多視点画像から物理ベースの逆レンダリングを行うための最初の微分可能な表面スプラッティングである。
我々の中心的な洞察は、表面スプラッティングの中心における表面分離問題は、再構成カーネル自体の直接的な定式化を許すということである。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:43:51 GMT)
Structured 3D Latents Are Surprisingly Powerful: Unleashing Generalizable Style with 2D Diffusion [16.0] 3Dアセット生成はゲームや仮想現実などの分野において重要な役割を担い、高忠実度3Dオブジェクトの迅速な合成を可能にする。
既存のアプローチは、通常、3D生成モデルのトレーニング分布内にあるか、または類似しているスタイルのイメージに依存している。
textbfDiLAST: 2次元拡散に基づく3次元スタイル転送のための遅延覚醒について紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:18:21 GMT)
Instrumental Choices: Measuring the Propensity of LLM Agents to Pursue Instrumental Behaviors [15.9] 本稿では,端末エージェントのインストゥルメンタルコンバージェンス(IC)動作に対するモデルの妥当性を評価するためのベンチマークを提案する。
我々のベンチマークは現実的で低評価であり、評価意識とロールプレイの相違を減らすのに役立ちます。
その結果,ほとんどの試験モデルでは,現実的で低汚泥環境がIC行動を引き起こすことは稀であるが,体系的に実施されることが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:12:36 GMT)
Eliciting associations between clinical variables from LLMs via comparison questions across populations [15.9] 患者の特徴間の相関関係や因果関係を回復する方法について検討した。
本稿では,構造化された比較質問,特に患者比較三重項質問に基づくアプローチを提案する。
慢性閉塞性肺疾患(COPD)と多発性硬化症(MS)の2つの臨床領域で本法を実証した。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:26:32 GMT)
When and Why SignSGD Outperforms SGD: A Theoretical Study Based on $\ell_1$-norm Lower Bounds [15.7] SignSGDやMuonのような符号ベースの最適化アルゴリズムは、大規模な基礎モデルのトレーニングにおける顕著なパフォーマンスに対して大きな注目を集めている。
そこで,SignSGD は Emphsparse ノイズ下での $d$ の係数で,問題次元が $d$ であるような複雑性を効果的に低減することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:32:09 GMT)
PLOT: Progressive Localization via Optimal Transport in Neural Causal Abstraction [15.6] 因果抽象化は、機械的解釈可能性のための原則化されたフレームワークを提供する。
本稿では,抽象的および神経的介入の出力効果幾何から因果変数を局所化する輸送ベースのフレームワークPLOTを紹介する。
PLOTは抽象変数と候補神経部位の最適な輸送結合に適合し、干渉ハンドにキャリブレーションできるグローバルなソフト対応をもたらす。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:52:55 GMT)
Optimal Confidence Band for Kernel Gradient Flow Estimator [15.6] まず、連続および離散的なカーネル勾配流の極大ノルム一般化誤差に対する収束率を確立する。
次に、連続および離散的なカーネル勾配流の両方に対して同時信頼バンドを構築する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:00:35 GMT)
GATHER: Convergence-Centric Hyper-Entity Retrieval for Zero-Shot Cell-Type Annotation [15.6] ゼロショット単細胞細胞型アノテーションは、与えられた発現された遺伝子のセットから細胞の種類を訓練なしで決定することを目的としている。
既存の知識グラフに基づくRAGアプローチは、情報源から拡張することで証拠を回収する。
本稿では,ハイパーエンタリティクエリに適した収束中心のレトリバーであるGATHERを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:11:54 GMT)
Real-world Latency Analysis of Vehicular Visible Light Communication with Multiple LED Transmitters and an Event-Based Camera [15.5] イベントカメラは、高時間分解能、低レイテンシ、広ダイナミックレンジを提供し、車両間通信(V2X)アプリケーションにおける可視光通信(VLC)のための有望な受信機を提供する。
本研究は,帯域幅飽和,マルチ送信受信,遅延特性の3つの課題に対処するイベントカメラベースのVLCシステムを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:42:37 GMT)
Correct Is Not Enough: Training Reasoning Planners with Executor-Grounded Rewards [15.5] 検証可能な報酬を伴う強化学習は、大規模言語モデルにおける明示的な推論を改善する共通の方法となっている。
しかし、最終回答の正確性だけでは、推論トレースが信頼できるか、信頼できるか、あるいはそれを消費するモデルに有用かは明らかになっていない。
我々は、推論を消費可能な中間アーティファクトとして扱うプランナー・エグゼクタトレーニングフレームワークであるTraceLiftを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:57:08 GMT)
OA-WAM: Object-Addressable World Action Model for Robust Robot Manipulation [15.4] 本研究では,ロバストなロボット操作のためのオブジェクト適応型ワールドアクションモデルを提案する。
OA-WAMは各フレームを1つのロボットスロットとN個のオブジェクトスロットでN+1スロット状態に分解する。
本研究では,ランドスケープなオブジェクト状態が,シーン摂動下でのロバストなワールド・アクション・モデリングに有効なインターフェースを提供することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:06:08 GMT)
ZScribbleSeg: A comprehensive segmentation framework with modeling of efficient annotation and maximization of scribble supervision [15.4] 本稿では, 優れたスクリブルアノテーションの原理を考察し, 教師とシミュレーションによる効率的なランダムネス形式を導出する。
本研究では,空間関係と形状制約を符号化する正規化項を導入し,EMアルゴリズムを用いてラベルの混合比を推定する。
我々は、ZScribbleSegと呼ばれるフレームワークに事前の効率的な監視を統合し、それを複数のシナリオに適用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:41:15 GMT)
EA-WM: Event-Aware Generative World Model with Structured Kinematic-to-Visual Action Fields [15.3] 本稿では,運動制御と視覚知覚のループを閉じるイベントウェア生成世界モデルEA-WMを提案する。
イベント認識型双方向核融合ブロックを導入し、クロスブランチの注意を変調し、オブジェクトの状態変化と正確な相互作用のダイナミクスを捉える。
EA-WMは最先端のパフォーマンスを達成し、既存のベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:06:19 GMT)
MAS-Algorithm: A Workflow for Solving Algorithmic Programming Problems with a Multi-Agent System [15.2] MAS-Algorithmは、競合するプログラマやアルゴリズムエンジニアにインスパイアされたアルゴリズム問題解決のための、体系的なマルチエージェントワークフローである。
我々のフレームワークは、エンドツーエンドの解決プロセスをモジュラーステージに分解し、構造化推論、ツール統合、エージェント間の柔軟な調整を可能にします。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:57:53 GMT)
FedeKD: Energy-Based Gating for Robust Federated Knowledge Distillation under Heterogeneous Settings [15.1] FedeKDは信頼性を意識したFKDフレームワークで、知識伝達の明示的なコンポーネントとして、サンプル単位の信頼推定を行う。
6つの実世界のデータセットの実験により、フェデKDは異種環境下での負の移動を著しく減少させることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:00:42 GMT)
When Does $\ell_2$-Boosting Overfit Benignly? High-Dimensional Risk Asymptotics and the $\ell_1$ Implicit Bias [15.1] 良性オーバーフィッティングが線形レートで失敗することを示します。
この局所化機構は信号の存在下で持続するべきであるが、正確な信号-雑音分解は未解決の問題である。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:14:09 GMT)
Pest-Thinker: Learning to Think and Reason like Entomologists via Reinforcement Learning [15.1] Pest-Thinkerは知識駆動型強化学習フレームワークで、MLLMが微細な害虫の形態を解析できるようにする。
Pest-Thinkerは、知的農薬分析のエキスパートレベルの視覚的推論への一歩として、ドメイン内とドメイン外の両方のモルフォロジー的理解を大幅に改善することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:30:02 GMT)
End-to-End Identifiable and Consistent Recurrent Switching Dynamical Systems [15.0] 本稿では,予測最大化を用いた精度の正確な最適化を可能にするフローベース推定器である$SDSを紹介する。
以上の結果から,VAEに基づく推定値と,基礎となるダイナミクスのより正確な予測値と比較すると,$SDS は分散性の向上を達成できることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:14:39 GMT)
Priming, Path-dependence, and Plasticity: Understanding the molding of user-LLM interaction and its implications from (many) chat logs in the wild [14.9] この研究は、大規模チャットログを通じて現実世界のユーザ-LLMインタラクションを研究するための新しいアプローチを探究する。
タスクが多様であるにもかかわらず、ユーザ表現において重要なパターンを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:00:25 GMT)
Photonic-Implemented Efficient Deep Quantum Neural Network via Virtual-Driven Hilbert Space Expansion [14.9] 集積フォトニックプラットフォーム上に実装された量子ニューラルネットワーク(QNN)は、例外的な計算能力の強化を提供する。
重要な課題は、線形量子フォトニクスシステムにおいて、QNNの基本的な非単項および非線形活性化関数を実装することである。
本稿では,入力複製とモード展開によるHilbert空間を拡張した新しいディープフォトニックQNNを提案する。
このアプローチにより、物理量子ビット、測定誘起量子ビット消費、測定装置の負荷が不要になる。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:10:07 GMT)
Adaptive Physical-Facial Representation Fusion via Subject-Invariant Cross-Modal Prompt Tuning for Video-Based Emotion Recognition [14.9] 映像に基づく感情認識のためのクロスモーダルなクロスチューニングプロンプトチューニング手法を提案する。
提案手法は、認識精度と一般化能力の両方において、強いベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:33:31 GMT)
A Measure-Theoretic Finite-Sample Theory for Adaptive-Data Fitted Q-Iteration [14.8] 一般可測ボレル空間上の適合Q-イテレーション(FQI)の枠組みを開発する。
政策依存型データ収集におけるベルマン回帰一般化を逐次ラデマッハ複雑性が制御することを証明する。
これらの結果は、多くの現代のディープRLアルゴリズムの形式解析に必要な基礎を築いた。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:26:58 GMT)
Towards Closing the Autoregressive Gap in Language Modeling via Entropy-Gated Continuous Bitstream Diffusion [14.7] 拡散言語モデル(DLM)は並列で順序に依存しない生成を約束するが、歴史的にはサンプルの品質と多様性において自己回帰モデルに遅れを取ってきた。
トークン埋め込みに対する最近の連続流れと拡散アプローチは、このギャップを狭め、連続状態空間が言語に非常に有効であることを示唆している。
本研究では,テキストを固定幅のバイナリビットストリーム上での連続拡散プロセスとしてモデル化することにより,自己回帰的ギャップをさらに埋める。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:50:51 GMT)
Nonsense Helps: Prompt Space Perturbation Broadens Reasoning Exploration [14.6] 探索ボトルネックを打破するためにLorem Perturbation for Exploration (LoPE)を提案する。
LoPEは、Lorem Ipsum vocabulary(疑似ラテン語のプレースホルダーテキスト)から集められたシーケンスを、再サンプリング前のプロンプトにプリペンドする。
我々の研究は,LPEを大規模言語モデルにおける探索を拡大するための強力なベースラインとして確立した。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:18:06 GMT)
Relay Buffer Independent Communication over Pooled HBM for Efficient MoE Inference on Ascend [14.5] Mixture-of-Experts (MoE)推論はデバイス間で大規模なトークン交換を必要とする。
本稿では,Ascendシステム上でのMoE推論高速化のためのリレーバッファフリー通信設計を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:41:18 GMT)
In-Context Credit Assignment via the Core [14.4] インコンテキスト・クレジット・アサインメントのためのインセンティブ・アラインメント・メカニズムを提案する。
我々のアプローチは、協調ゲーム理論の最小コア解の概念に基づいている。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:30:44 GMT)
PrefixGuard: From LLM-Agent Traces to Online Failure-Warning Monitors [14.3] 大規模言語モデル(LLM)エージェントは、最終結果チェックが介入するには遅すぎるような、長時間のツール使用タスクを実行する。
PrefixGuardは、オフラインのStepView誘導ステップと監視監視トレーニングを備えたトレース・ツー・モニタフレームワークである。
WebArena, $2$-Bench, SkillsBench, TerminalBench, 最も強力なPrefixGuardモニタは0.900/0.70.533/0.557 AUPRCである。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:49:48 GMT)
Generating Roadside LiDAR Datasets from Vehicle-Side Datasets via Novel View Synthesis [14.3] 本稿では,新しいビュー合成を通じて車側データセットからラベル付き道路側LiDARデータセットを生成するデータ合成フレームワークであるVaby-to-Roadside LiDAR Synthesis (VRS)を紹介する。
車両と道路の領域ギャップを軽減するために、VRSは車両側の観察で欠落した幾何学を補うために車両点雲の完成度を利用する。
提案フレームワークは,スケーラブルなロードサイドデータ生成のための柔軟なマルチビューレンダリングを実現する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:10:18 GMT)
SpatialEpiBench: Benchmarking Spatial Information and Epidemic Priors in Forecasting [14.3] 正確な予測は公衆衛生、資源配分、介入に不可欠である。
流行は地域全体に広がるため、現実的な疫学的手法は予測を改善するための自然な候補である。
空間情報への関心が高まっているが、標準化されたベンチマークは存在しない。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:31:43 GMT)
A Theory of Online Learning with Autoregressive Chain-of-Thought Reasoning [14.3] [Joshiら,2025)は,このプロセスから生じる入力出力マップの学習可能性を研究するためのPACモデルを提案した。
我々は,未知の次点発生器による最終的な出力の誤り境界に着目し,このフレームワークのオンラインアナログを開発する。
我々のゴールは、最適なミスバウンドが生成地平線にどのように依存するかを理解することである。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:21:05 GMT)
Sheet as Token: A Graph-Enhanced Representation for Multi-Sheet Spreadsheet Understanding [14.3] Sheet as Tokenはグラフで強化されたフレームワークで、各ワークシートをマルチシートのスプレッドシート検索のための統一セマンティックユニットとして扱う。
Graph Retrieverは、セマンティック、クエリ条件付き、スキーマ一貫性、形状適合性関係を使って、シートトークン上のクエリ固有の候補グラフを構築する。
構成したマルチシートスプレッドシートコーパスの実験により、シートレベルのトークン化が安定した表現を学習することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:47:43 GMT)
MaMi-HOI: Harmonizing Global Kinematics and Local Geometry for Human-Object Interaction Generation [14.1] MaMi-HOIはtextbfMacro レベルの流動性をtextbf Micro レベルの空間精度で再現する。
実験により、MaMi-HOIは自然運動と正確な接触を同時に達成できることが確認された。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:52:14 GMT)
AMIEOD: Adaptive Multi-Experts Image Enhancement for Object Detection in Low-Illumination Scenes [14.0] AMIEODは低照度シーンのための画像強調可能なオブジェクト検出フレームワークである。
低照度画像の情報をフル活用するために,多照度画像強調モジュールを提案する。
複数のデータセットに対する実験により,提案手法は低照度条件下での物体検出精度を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:06:21 GMT)
Generalizing the Geometry of Model Merging Through Frechet Averages [13.9] 我々は、幾何学だけでなく平均化手順自体も対称性が不変であることを示し、対称性を意識したマージを実現する。
一般解として、フレシェ平均化として結合し、適切な多様体上の測地距離の和を最小化するパラメータを選択する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:23:33 GMT)
HEDP: A Hybrid Energy-Distance Prompt-based Framework for Domain Incremental Learning [13.8] 本稿では,Helmholtz自由エネルギーにインスパイアされたドメインインクリメンタルフレームワークであるHybrid Energy-Distance Promptを提案する。
CORe50を含む複数のベンチマークの実験では、HEDPは2.57%の精度で未確認領域で優れたパフォーマンスを達成している。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:09:03 GMT)
Uneven Evolution of Cognition Across Generations of Generative AI Models [13.8] 人工知能の追求には、狭いタスク性能を超えるモデルの認知能力を評価するための堅牢な手法が必要である。
本稿では、生成AIの認知的プロファイルを評価し、それらを人間の規範と比較し、世代間での進化を追跡するための心理測定フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:16:49 GMT)
AdaGamma: State-Dependent Discounting for Temporal Adaptation in Reinforcement Learning [13.7] 国家依存割引は概念的には魅力的だが、真に深いアクター-批判的な実装は、TDエラーの崩壊に向かって退化することができる。
AdaGammaは、状態依存割引の実践的ディープアクター批判的手法であり、状態依存割引関数をリターン整合性目標とともに学習する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:42:46 GMT)
LLMs are not (consistently) Bayesian: Quantifying internal (in)consistencies of LLMs' probabilistic beliefs [13.6] 本稿では,情報処理規則としてLLMを研究する新しい手法を紹介する。
我々は、情報処理ギャップを利用して、LCMが証拠から確率的信念を更新する方法の内部(内部)の整合性を研究する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:25:02 GMT)
Diffusion-Based Posterior Sampling: A Feynman-Kac Analysis of Bias and Stability [13.6] 拡散に基づく後部サンプリングは、測定または報酬条件後部からのサンプリングに事前訓練された拡散を利用する。
本稿では,真の後部を標準ガウスに接続し,サンプルパスと比較するトラクタブルサロゲートパスを提案する。
ファインマン・カックの表現は、ラドン・ニコディムの補正を明示的な経路予測として表現し、どの後部領域がオーバーサンプリングかアンダーサンプリングされているかを特定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:37:29 GMT)
Transformer-Based Wildlife Species Classification from Daily Movement Trajectories [13.6] 大規模で7種のGPSトラジェクトリでシーケンスモデルを訓練する。
トラジェクトリモデルは、テスト中にテレメトリの全研究または領域をホールトアウトするプロトコルを用いて評価される。
変圧器は、ほぼ8~22ポイントの利得で、常により高いバランスの取れた精度を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:20:55 GMT)
AssistDLO: Assistive Teleoperation for Deformable Linear Object Manipulation [13.6] AssistDLOは、DLO操作のための補助的遠隔操作フレームワークである。
リアルタイムのマルチビュー状態推定、視覚支援、およびジオメトリ対応の共有自律制御を組み合わせたものだ。
その結果, 支援の有効性は, オペレーターの専門知識とDLO特性に強く依存していることが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:21:41 GMT)
Dual-Agent Co-Training for Health Coaching via Implicit Adversarial Preference Optimization [13.5] モチベーション・インタービューリングに基づく健康コーチングは、メンタルヘルスを改善し、健康的な行動変化を促進する効果的なアプローチである。
訓練された人間のコーチの不足と、高いコストのコーチングサービスの不足は、そのようなサポートを多くの人々が利用できないものにします。
本稿では,ヘルスコーチエージェントとクライアントシミュレータの両方を対話的に学習するデュアルエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:49:41 GMT)
TabCF: Distributional Control Function Estimation with Tabular Foundation Models [13.5] 本稿では,制御関数回帰のためのシンプルなTabCFを提案する。
分布量の正確、高速、識別・透明、およびチューニング・ライト因果推定を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:44:07 GMT)
LatentRAG: Latent Reasoning and Retrieval for Efficient Agentic RAG [13.4] LatentRAGは、推論と検索の両方を独立した言語空間から連続的な潜在空間にシフトする新しいフレームワークである。
LatentRAGは、推論遅延を約90%削減しながら、明示的なエージェントRAGメソッドに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:56:13 GMT)
TheraAgent: Self-Improving Therapeutic Agent for Precise and Comprehensive Treatment Planning [13.4] 本稿では,ワンショット生成を反復生成・ジャッジ・リファインパイプラインに置き換えるエージェントフレームワークであるTheraAgentを提案する。
人間の専門家の実際の推論プロセスを反映することで、我々のフレームワークは、粗大で不完全なドラフトをより正確で包括的で安全なルールに変換します。
実験によると、TheraAgentはHealthBenchの最先端の結果を達成し、正確性と完全性をもたらす。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:10:22 GMT)
PersonaGesture: Single-Reference Co-Speech Gesture Personalization for Unseen Speakers [13.4] PersonaGesture(ペルソナゲスチャ)は、未確認話者の単一参照音声ジェスチャーパーソナライズのためのパイプラインである。
Adaptive Style Infusion (ASI) と Implicit Distribution Rectification Rectification (IDR) の2つの重要なコンポーネントは、時間的同一性証拠を残留統計学的補正から分離している。
実験により,デノナイジング時の話者記憶を保守的なモーメント修正から切り離すことで,崩壊したスタイルコードよりも不明瞭な話者のパーソナライゼーションが向上することが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:48:39 GMT)
Bridging Passive and Active: Enhancing Conversation Starter Recommendation via Active Expression Modeling [13.3] 大言語モデル(LLM)による会話検索は、情報検索をリアクティブなキーワードマッチングから、プロアクティブでオープンな対話へとシフトしている。
対話開始者は、ユーザが対話を開始するのに役立つパーソナライズされたクエリレコメンデーションを提供するために広くデプロイされる。
このフィードバックループ機構は、データ空間によって合成され、オープンワールドによって形成される会話探索意図の動的な性質を捉えることができないエコーチャンバーにシステムをトラップする。
本稿では,パッシブ・アクティベート・ブリッジ (PA-Bridge) を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:26:24 GMT)
An Interpretable and Scalable Framework for Evaluating Large Language Models [13.3] 大規模言語モデル(LLM)の評価はますます重要になっているが、標準的なベンチマーク手法は平均精度に依存している。
アイテム応答理論(IRT)は、潜在モデル能力とアイテム特性をモデリングするための原則化されたフレームワークを提供する。
本稿では,LLM評価のための大規模化最小化原理に基づく解釈可能かつスケーラブルなフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:52:12 GMT)
Diverse Sampling in Diffusion Models with Marginal Preserving Particle Guidance [13.3] EDDY(Exact-marginal Diversification via Divergence-free dYnamics)は拡散・流れマッチングモデルのための誘導機構である。
合成分布実験とテキスト・ツー・イメージ生成実験により、EDDYは共通のベースラインに比べて分布の忠実さを保ちながら多様性を向上することが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:49:12 GMT)
A Regime Theory of Controller Class Selection for LLM Action Decisions [13.3] コントローラを固定アクション、パーティションルータ、インスタンスレベルのコントローラ、プレゲートコントローラの4つのクラスにまとめる。
3つのデータ推定可能なボトルネックをクラス選択に変換する制度理論を実証する。
結果のバーンスタイン-タイト閾値は、一致する情報理論の下限を持ち、厳密なネスト付きクロスバリデーションは、確実に、最も近いクラスを選択する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:28:17 GMT)
CrossCult-KIBench: A Benchmark for Cross-Cultural Knowledge Insertion in MLLMs [13.3] 異文化間の知識挿入は、他の文化における本来の振る舞いを保ちながら、特定の文化的文脈にモデルを適応させることに焦点を当てる。
ベンチマークには、英語、中国語、アラビア語文化グループにまたがる49の文化的関連視覚シナリオをカバーする、9800のイメージグラウンドケースが含まれている。
MCKI(Memory-Conditioned Knowledge Insertion)は、冷凍MLLM表現を用いて、外部メモリから関連する文化的知識を検索する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:26:11 GMT)
Every Step Counts: Step-Level Credit Assignment for Tool-Integrated Text-to-SQL [13.1] ツール拡張テキストにおけるステップレベルクレジット代入のための新しいフレームワークであるFineStepを提案する。
FineStepは4BスケールでGRPOよりも平均3.25%向上し,最先端のパフォーマンスを実現し,冗長なツールインタラクションを低減する。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:33:36 GMT)
Order-Agnostic Autoregressive Modelling with Missing Data [13.0] 本研究では,無秩序な自己回帰モデルが,無作為なランダムな機構の下で暗黙的に不規則化を行うことを示す。
一般的な欠落メカニズムの下で、不完全なデータセットを直接トレーニングするための、最初の原則付きフレームワークを紹介します。
私たちのMissingness-Aware Order-Agnostic Autoregressive Modelは、実世界のベンチマークの中で、確立された計算基準よりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:34:08 GMT)
When Does Value-Aware KV Eviction Help? A Fixed-Contract Diagnostic for Non-Monotone Cache Compression [13.0] 長文LLM推論は、デコード中に大きなKVキャッシュを読み取る際のメモリと帯域幅のコストによってボトルネックとなる。
KV圧縮は、キャッシュの一部だけを保持することで、このコストを削減するが、タスク精度だけでは、セレクタが成功したり失敗したりする理由を特定できない。
セレクタは3つのステップで失敗する可能性がある: 将来の復号化の必要性の証拠を見逃し、出力に影響を与えないトークンに高いスコアを与えるか、スコアを小さなキャッシュに組み込む際に関連する証拠を壊す。
我々は,セレクタのセットアップを固定し,一度に1つの決定スロットを変更する固定契約診断を導入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:36:59 GMT)
Beyond Forgetting in Continual Medical Image Segmentation: A Comprehensive Benchmark Study [12.9] 本稿では,連続的な医用画像のセグメンテーションに関するベンチマーク研究を行う。
まず, 中心領域シフト, 段階的解剖学的構造セグメンテーション, 組織横断セグメンテーションの3つのシナリオを定義した。
次に,一般的な性能と忘れるだけでなく,可塑性,前方一般化性,パラメータ効率,再生負担を計測する評価フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:48:56 GMT)
Kernel Selection is Model Selection: A Unified Complexity-Penalized Approach for MMD Two-Sample Tests [12.8] Maximum Maximum Discrepancy (MMD) は、非パラメトリックな2サンプルテストの統計である。
MMDは完全に選択されたカーネルによって制御される。
複雑化MDD(CP-MMD)を提案する。
CP-MMDは、線形でパラメトリックな状態と、最先端のテストパワーのマッチングや超過といった、深いばらつきにまたがるグリッドフリーなカーネル選択を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:32:06 GMT)
Orth-Dion: Eliminating Geometric Mismatch in Distributed Low-Rank Spectral Optimization [12.5] 低ランク勾配圧縮は、ランク-r$要素による更新を表現することで、分散トレーニングにおける通信を減少させる。
列正規化を正しい因子のQR直交化に置き換えるOrth-Dionを提案する。
大規模言語モデルの事前トレーニング実験は、予測された$sqrtr$スケーリングを検証し、Orth-DionがDionの通信コストでMuonへの収束ギャップを閉じていることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:37:37 GMT)
Region Seeding via Pre-Activation Regularization: A Geometric View from Piecewise Affine Nerual Networks [12.5] 実際には、標準トレーニングは、原則的にサポートできるアーキテクチャよりも、データビジットされた地区における領域の洗練をはるかに少なくする。
我々の理論は、ニューロンの切替面をデータポイントに十分近い状態にすることで、局所的な近傍との交点を確保するのに十分な条件を提供する。
本稿では,タスク駆動型リファインメントを訓練の後半に支配し,早期分割を助長するプラグイン・アンド・プレイ型レギュレータを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:05:01 GMT)
Saliency-Aware Regularized Quantization Calibration for Large Language Models [12.4] トレーニング後の量子化(PTQ)は、大きな言語モデル(LLM)をメモリとレイテンシの制約下でデプロイするための効果的なアプローチである。
本稿では,SARQC(Saliency-Aware Regularized Quantization)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:33:26 GMT)
Dr-BA: Separable Optimization for Direct Radar Bundle Adjustment & Localization [12.3] Dr-BAは、2D回転レーダーの強度画像を直接操作する、第一種レーダーバンドル調整フレームワークである。
Dr-BAは200km以上のオンロードデータで実証された最先端のレーダーベースBAとクロスセッションローカライゼーション性能を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:41:16 GMT)
AGPO: Asymmetric Group Policy Optimization for Verifiable Reasoning and Search Ads Relevance at JD [12.3] この境界縮小に対応するために,非対称グループ政策最適化(AGPO)を提案する。
AGPOは、誤った推論経路を抑え、ベースモデルの探索能力を維持するために、負の優位な強化戦略を採用している。
5つの数学的ベンチマーク実験により,AGPOは最先端の精度を達成しつつ,スケールにおけるパス@$k$の性能を一貫して向上することを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:00:48 GMT)
When to Use Wireless Challenge-Response Physical Layer Authentication: Design of a Measurable Guideline for OFDM [12.2] 我々は,実用無線チャネルにおける弱い相関特性を利用してPLAに対する効果的な攻撃を開始する,MDLG (Maximum Differential Likelihood Generator) と呼ばれる新しい敵モデルを提案する。
我々はランダムネステストを用いて測定可能なガイドラインを作成し、実際にPLAを実用的な無線チャネル条件で使用できるかどうかを判断する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:50:20 GMT)
MAGIQ: A Post-Quantum Multi-Agentic AI Governance System with Provable Security [12.2] MAGIQは、マルチエージェントAIシステムにおけるポリシー定義と実施のためのフレームワークである。
セキュリティ保証が証明された新しい、高効率で、量子耐性の暗号プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:46:07 GMT)
OPSD Compresses What RLVR Teaches: A Post-RL Compaction Stage for Reasoning Models [12.2] RLVR(Reinforcement Learning with Verifiable Rewards)の代替として,オンライン自己蒸留(On-Policy Self-Distillation, OPSD)が最近登場した。
考察可能な数学的推論では、OPSDは補正機構よりも圧縮機構として最も確実に振る舞う。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:04:34 GMT)
The Frequency Confound in Language-Model Surprisal and Metaphor Novelty [12.1] 我々は,8つのPythiaモデルサイズと154のトレーニングチェックポイントから,予備的な推定値を分析する。
設定全体では、単語の頻度はサブプライムよりもメタファーの斬新さを強く予測する。
これらの結果は、しばしば報告される最適LM設定は、文脈予測可能性とメタファーの新規性と処理難易度を誤って関連付けているのに対し、語彙周波数は主要な要因である可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:20:37 GMT)
DINORANKCLIP: DINOv3 Distillation and Injection for Vision-Language Pretraining with High-Order Ranking Consistency [12.1] 対照的な言語イメージのpreCLIPは2つの構造的弱点に悩まされる。
RANKCLIPは、リストワイドのPlackett-Luceランキング一貫性を失うことで、最初の問題に部分的に対処する。
DINORANKCLIPは,両者を共同で扱う事前学習フレームワークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:19:52 GMT)
Hitting Time Isomorphism for Multi-Stage Planning with Foundation Policies [11.8] オフライン強化学習のための演算子理論表現学習フレームワークを提案する。
提案手法は,遅延変位の線形汎関数として期待される打点時間を実現するヒルベルト空間変位幾何学を学習する。
実験の結果、IELはオフラインの迷路データから学習基盤政策の方針を改善できることが判明した。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:56:43 GMT)
Optimizing Social Utility in Sequential Experiments [11.8] 本稿では,製品開発業者がランダム化比較試験を順次実施し,規制当局がその費用の一部を補助する統計プロトコルを提案する。
信念マルコフ決定プロセスを用いてプロトコルをモデル化することにより、エージェントの最適な戦略を動的プログラミングを用いて効率的に見つけることができることを示す。
我々のプロトコルは、標準的な非シーケンスプロトコルと比較して、$35$%以上のソーシャルユーティリティを向上するために使用することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:28:25 GMT)
On the Security of Research Artifacts [11.8] アーティファクト評価(AE)は、アーティファクトが要求通りに動作し、再生可能であるかどうかを主にチェックする。
最上位のセキュリティ会場から509件の研究成果を調査し、その多くが安全でないコードパターンを含んでいることを発見した。
このようなリスクの構造化分析を可能にするために,文脈対応型セキュリティアセスメントのための分類法を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:21:26 GMT)
Privacy by Postprocessing the Discrete Laplace Mechanism [11.8] 古典的な離散的なラプラス(別名ジオメトリ)機構である「オールドドッグ」が「新しいトリックを実行する」ことができることを示す。
後処理することで、元のデータの任意の部分指数関数$f$の単純で偏りのない推定値が得られる。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:19:08 GMT)
SoftSAE: Dynamic Top-K Selection for Adaptive Sparse Autoencoders [11.7] 動的トップ-K選択機構を備えたスパースオートエンコーダであるSoftSAEを提案する。
本手法は,入力依存空間レベルkを学習するために,微分可能なソフトトップK演算子を用いる。
実験結果から,SoftSAEは有意義な特徴を見出すだけでなく,各概念に対して適切な特徴数を選択することが確認された。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:28:40 GMT)
Sparse Attention as a Range Searching Problem: Towards an Inference-Efficient Index for KV Cache [11.7] 臨界KVエントリの省略は、モデル出力に重大なエラーを引き起こす可能性がある。
既存の方法は通常、固定または適応的なトークン予算の下で機能する。
本稿では,効率的なKVキャッシュ検索に適した新しいインデックス構造であるLouverを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:37:56 GMT)
SANEmerg: An Emergent Communication Framework for Semantic-aware Agentic AI Networking [11.7] 創発的コミュニケーションは、タスク固有のシグナリングプロトコルをサポートする自律エージェントを有効にすることで、新しいソリューションを提供する。
本稿では,セマンティック・アウェア・エージェントネットシステムに適したマルチエージェント・創発的コミュニケーション・フレームワークについて考察する。
提案するフレームワークであるSANEmergは,協調作業遂行のためのコミュニケーションの出現を促進するために設計されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:30:43 GMT)
SHARP: A Self-Evolving Human-Auditable Rubric Policy for Financial Trading Agents [11.6] 大規模言語モデル(LLM)は、自律的な金融取引のためにますます多くデプロイされている。
我々は,制約のないテキストの突然変異を構造的,象徴的なポリシー最適化に置き換える,神経象徴的な枠組みである自己進化型ヒューマン・アディタブル・ポリシー(SHARP)を導入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:23:44 GMT)
Rethinking Local Learning: A Cheaper and Faster Recipe for LLM Post-Training [11.6] LLM後トレーニングは、モデルの完全な深さを通してタスク勾配を伝搬する。
LoPTは変圧器の中間点に1つの勾配境界を置く。
LoPTは、メモリコストの低減、トレーニング効率の向上、事前訓練された能力の維持など、競争力のあるパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:28:22 GMT)
Towards Differentially Private Reinforcement Learning with General Function Approximation [11.5] 一般関数近似を用いた個人用オンライン強化学習の理論的保証を初めて提示する。
提案手法は, バッチ化されたポリシー更新スキームと指数的メカニズムを組み合わせ, 新たな後悔分析と組み合わせたものである。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:58:28 GMT)
ScarfBench: A Benchmark for Cross-Framework Application Migration in Enterprise Java [11.4] ScarfBenchは、エンタープライズJavaアプリケーションの振る舞いを保存するクロスフレームワークマイグレーションのためのベンチマークである。
Spring、Jakarta EE、Quarkusにまたがる、専門家による実装トリプルから構築されている。
ベンチマーク、ハーネス、エージェントトレースはhttps://scarfbench.info.comで公開しています。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:05:35 GMT)
Structure-Preserving Gaussian Processes Via Discrete Euler-Lagrange Equations [11.3] 離散オイラー強制ラグランジュ方程式を用いて力学を学習するためのラグランジアンガウス過程(LGP)を提案する。
本稿では,LGPのデータ効率と一般化能力について,様々なケーススタディと実世界のケーススタディで実証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:26:47 GMT)
Advancing Reliable Synthetic Video Detection: Insights from the SAFE Challenge [11.3] SAFE: Synthetic Video Detection ChallengeはICCV 2025のArthitAuthenticity and Provenance in the Age of Generative AI (APAI) Workshopと共同で実施された。
コンペティションは参加者に、完全に盲目な評価条件下での合成ビデオとリアルを区別できるアルゴリズムの開発と評価を依頼した。
本研究は, クロスジェネレータ一般化の進展と, ポストプロセッシングアーティファクトに対する永続的脆弱性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:22:32 GMT)
Muon with Nesterov Momentum: Heavy-Tailed Noise and (Randomized) Inexact Polar Decomposition [11.3] 我々は,非$行列最適化雑音における不正確な極分解の理論を開発する。
我々は、フルスペース法よりもはるかに効率的なランダム化された低ランク極性分解を解析する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:32:39 GMT)
Who and What? Using Linguistic Features and Annotator Characteristics to Analyze Annotation Variation [11.2] 有害な言語検出のための4つの参照データセットの大規模解析を行った。
我々は,アノテータの特徴,項目の言語的特性,およびそれらの相互作用を統計的に情報を得た画像にまとめる。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:18:54 GMT)
Operationalizing Ethics for AI Agents: How Developers Encode Values into Repository Context Files [11.2] このビジョンペーパーは、AIエージェントに対する倫理と価値観が、エージェントの振る舞いを形作る実行可能な命令にどのように変換されているかを調べる。
開発者はすでに、公正性、アクセシビリティ、持続可能性、トーン、プライバシに関するガイダンスを組み込んでいます。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:03:36 GMT)
When Graph Language Models Go Beyond Memorization [11.2] グラフ言語モデルが構造的規則性を学ぶか、単にトレーニンググラフを記憶するだけなのかは、まだ不明である。
我々は,頻繁な部分グラフマイニング,グラフレベルのブートストラップベースライン,3レベルの周波数階層化を組み合わせた校正診断プロトコルを開発した。
グラフ言語モデルは,主に高周波状態において,大規模記憶以上の構造的規則性を得ることができることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:24:55 GMT)
Scene-Adaptive Continual Learning for CSI-based Human Activity Recognition with Mixture of Experts [11.2] クラスタ化スペシャリストによるエキスパートのシーン適応混合(SAMoE-C)を提案する。
SAMoE-C(SAMoE-C)は、アテンションベースのセマンティックルータを通じてシーン固有の適応を可能にする、エキスパートの混合システムである。
その結果,SAMoE-Cは予測コストを著しく低く抑えつつ,最先端の精度に近づいた。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:45:24 GMT)
Congestion-Aware Dynamic Axonal Delay for Spiking Neural Networks [11.1] スパイキングニューラルネットワーク(SNN)は、時間的およびイベント駆動の情報モデリングと処理のためのエネルギー効率のパラダイムとして広く見なされている。
本稿では,時間的構造化のためのチャネル単位の静的ベース遅延に遅延を分解するCADAD機構を提案する。
Spiking Heidelbergデータセットを含む音声ベンチマークの実験では、シナプス信号伝達における混雑を考慮した遅延が時間的タスクの精度を効果的に向上することを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:28:37 GMT)
Analyzing the Adoption of Database Management Systems Throughout the History of Open Source Projects [11.0] データベース管理システム(DBMS)は、現代のアプリケーションで処理されるデータの保存、取得、管理に広く使われている。
本稿では、GitHubにホストされている362の人気のあるオープンソースJavaプロジェクトでの使用状況について、歴史的に考察する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:17:52 GMT)
Evaluating Non-English Developer Support in Machine Learning for Software Engineering [11.0] 非英語のコードコメント生成と、そのような出力を評価するための現在の手法の信頼性について検討する。
我々は、オランダ語、英語、ギリシャ語、ポーランド語、中国語の5つの自然言語にまたがる5つのコードLLMを評価した。
以上の結果から, 生成能力は英語以外では著しく低下することがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:14:46 GMT)
Accelerating LMO-Based Optimization via Implicit Gradient Transport [11.0] 暗黙的勾配輸送(IGT)を利用したLMO法を正規化する新しいクラスであるemphLMO-IGTを提案する。
LMO-IGTは搬送された点の勾配を評価することにより、標準LMOの1段階毎の勾配構造を維持しながら収束を加速する。
我々の分析によれば、LMOは$mathcalO(varepsilon-4)$、分散還元されたLMOは$mathcalO(varepsilon-3)$、コスト追加勾配評価において$mathcalO(varepsilon-3)$を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:44:57 GMT)
Tight Contraction Rates for Primitive Channels under Quantum $f$-Divergences [11.0] 量子$f$-ディバージェンスは局所逆ピンスカーの不等式を満たすことを示す。
これらの結果をPetz, Matsumoto, Hirche-Tomamichel $f$-divergencesに適用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:48:23 GMT)
A Statistical Framework for Algorithmic Collective Action with Multiple Collectives [11.0] 我々は,複数の集団が同一システムに作用するアルゴリズム的集団行動(ACA)に関する,最初の包括的な統計フレームワークを提案する。
我々は、集団の規模と目標の整合性の役割と相互作用を考慮して、集団の成功に関する定量的な統計的境界を提供する。
スマートシティにおける気候適応のための介入にインスパイアされたシミュレーションの枠組みを数値的に説明する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:45:53 GMT)
SafeHarbor: Hierarchical Memory-Augmented Guardrail for LLM Agent Safety [10.8] 悪意のあるアクターは、Large Language Model (LLM)エージェントを操作して、有害なコンテンツを生成するツールを実行することができる。
textscSafeHarborは、LLMエージェントの正確な決定境界を確立するために設計された新しいフレームワークである。
textscSafeHarborは曖昧な良質なタスクと明示的な悪意のある攻撃の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:50:45 GMT)
Cycle-resolved Cephalopod-Inspired Pulsed-Jet Robot With High-Volume Expulsion and Drag-Reduced Gliding [10.8] セファロポッドのパルスジェット移動は単独の放電現象ではなく、ジェット推進、受動グライダー、マントル補充を含む協調サイクルである。
本稿では,剛性ソフトなハイブリッド折り紙マントルを用いたパルスジェットロボットについて述べる。
実験の結果、ロボットは最初のジェットサイクルで0.5 m/s (3.8 BL/s)、平均速度は0.2 m/s (1.5 BL/s)に達することがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:43:26 GMT)
Can LLMs Take Retrieved Information with a Grain of Salt? [10.8] 検索された情報の確実性に適切に対応できる大規模言語モデルの能力は、過小評価されている。
医学や金融などの高額な領域において、本当の結果の限界である。
本研究は,8つのLCMを文脈確度順応性に基づいて評価し,一致した文脈確度に対する応答の調整精度を測定した。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:29:22 GMT)
QuadraSHAP: Stable and Scalable Shapley Values for Product Games via Gauss-Legendre Quadrature [10.6] 本研究では,共役ゲームにおけるシャプリー値の効率的な計算法について検討し,その連立値がプレイヤーごとの項の積として分解されるような協調ゲームについて検討する。
我々の重要な結果は、製品ゲームにおける各プレイヤーのシェープ値が、正確に1次元の表現を持つことである。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:36:50 GMT)
STARE: Step-wise Temporal Alignment and Red-teaming Engine for Multi-modal Toxicity Attack [10.5] 敵画像テキスト入力が有害な出力を引き起こす脆弱性を特定するには、赤チームビジョンランゲージモデルが不可欠である。
STARE は階層的な強化学習フレームワークであり,車軸自体を攻撃面として扱う。
STAREは、最先端のブラックボックスとホワイトボックスのベースラインよりも、攻撃成功率が68%向上していることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:02:19 GMT)
GCCM: Enhancing Generative Graph Prediction via Contrastive Consistency Model [10.5] 入力グラフが与えられた条件分布としてターゲットをモデル化することにより,条件生成モデルをグラフ予測に適用した。
本稿では,異なる雑音レベルにおける同一ターゲット間のペアワイズマッチングを超越したグラフコントラスト整合モデルGCCMを提案する。
我々はGCCMがショートカット解を緩和し、決定論的予測器と比較して、グラフ予測における一貫した性能改善をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:29:57 GMT)
The Weight Gram Matrix Captures Sequential Feature Linearization in Deep Networks [10.5] ディープニューラルネットワークがどのように学習するかを理解することは、マシンラーニング理論における中心的な課題である。
本稿では,重み更新と特徴進化を関連づけたニューラルネットワーク学習のための特徴中心フレームワークを提案する。
トレーニングとレイヤーワイドのダイナミクスを解析することにより、ディープネットワークは、ターゲット-線形構造への表現の逐次変換を学習することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:35:11 GMT)
HCInfer: An Efficient Inference System via Error Compensation for Resource-Constrained Devices [10.4] 我々は、GPU上で圧縮バックボーンを実行しながら、CPUに残差補償をオフロードする異種推論システムHCInferを提案する。
実験の結果,HCInferは下流タスクで最大5.2%の精度向上を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:57:23 GMT)
Backdoor Mitigation in Object Detection via Adversarial Fine-Tuning [10.4] バックドア攻撃は、安全クリティカルな視覚システムに深刻な脅威をもたらす。
適応微調整は、分類において一般的なバックドア緩和手法である。
物体検出バックドアの軽減のための検出対応逆調整フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:33:06 GMT)
HyperLens: Quantifying Cognitive Effort in LLMs with Fine-grained Confidence Trajectory [10.4] トランスアーキテクチャにおける本質的な拡大機構を同定する。
本稿では,信頼軌道の追跡を目的とした高分解能プローブHyperLensを紹介する。
データセット全体にわたって、HyperLensは、複雑なタスクと単純なタスクを分離する信頼性トラジェクトリの一貫性の相違を明らかにしている。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:32:57 GMT)
CITE: Anytime-Valid Statistical Inference in LLM Self-Consistency [10.3] 本研究では,モデル応答分布の特異なモードとして,あらかじめ指定した対象解の任意の正当性検証について検討する。
本稿では,任意の所定のレベルで偽認証を確実に制御するCITEアルゴリズムを用いた区間統一試験による認証を提案する。
また、カテゴリセットなしの停止時間率を証明し、メインレジーム内の定数に一致するミニマックスの下限を確立し、信頼度の高い投票に拡張する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:41:51 GMT)
Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key [10.3] 強化学習(RL)は,大規模言語モデル(LLM)推論の改善に応用されている。
本稿では,2軸の難易度を独立に制御する合成論理推論フレームワークであるScaleLogicを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:48:42 GMT)
Energy Generative Modeling: A Lyapunov-based Energy Matching Perspective [10.3] 静的スカラーエネルギー関数に基づく生成モデルは、単一の時間独立ポテンシャルがその勾配場を通してサンプル生成を駆動し、時間条件を完全に排除する新たなパラダイムである。
我々は、このパラダイムのトレーニングとサンプリングフェーズを、従来はワッサーシュタイン空間上の密度輸送(dentity transport on the Wasserstein space)という単一のフレームワークにまとめる。
訓練されたスカラーエネルギーの加法的組成は、明示的なギブス不変測度を保持し、閉ループのリャプノフ証明を継承することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:18:55 GMT)
CPCANet: Deep Unfolding Common Principal Component Analysis for Domain Generalization [10.2] ドメインの一般化は、アウト・オブ・ディストリビューション・シフトの下で堅牢な表現を学習することを目的としている。
本稿では,FGアルゴリズムを完全微分可能なニューラルネットワーク層に展開する新しいフレームワークであるCPCANetを提案する。
4つの標準DGベンチマーク実験により、CPCANetはゼロショット転送において最先端(SOTA)性能を達成することが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:48:04 GMT)
Towards Fairness under Label Bias in Image Segmentation: Impact, Measurement and Mitigation [10.2] ラベル付きデータセットはアノテーションパイプラインのバイアスを反映します。
本稿では,信頼学習のセグメンテーションへのデータ中心の適応を提案し,トレーニングデータから直接ラベルバイアスを検出する。
クリーンラベルへのアクセスなしに,我々のフレームワークがいかに確実にバイアスを検出し,緩和するかを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:47:50 GMT)
Smart Railway Obstruction Detection System using IoT and Computer Vision [10.1] NETRAは、Raspberry Pi Zero WとRaspberry Pi 4のエッジプラットフォーム上にデプロイされた、費用対効果の高い、インターネットに依存しない侵入検知システムである。
人間、大型動物、障害追跡などの脅威を識別する。
確認された脅威は、機関車運転手にエンドツーエンド2.4秒以内に警告するためにLoRaを介して送信される。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:16:32 GMT)
Benchmarked Yet Not Measured -- Generative AI Should be Evaluated Against Real-World Utility [9.9] 我々は、生成AI評価は、静的なベンチマーク中心の透明性から、人間の成果軌跡に根ざしたステークホルダー、ゴール、コンテキスト条件付きユーティリティ透明性へのパラダイムシフトを必要とすると論じる。
SCU-GenEvalは,利害関係者と利害関係者のゴールマッピング,構成指標仕様,メカニズムモデリング,長手効用測定からなる4段階評価フレームワークである。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:56:07 GMT)
SparseForge: Efficient Semi-Structured LLM Sparsification via Annealing of Hessian-Guided Soft-Mask [9.9] 既存の手法では、精度を回復するために大規模なスパースリトレーニングを頼りにしており、計算コストが高い。
本稿では,スパシティマスクを直接最適化することにより,回復効率を向上させるポストトレーニングフレームワークであるSparseForgeを提案する。
2:4の間隔でLLaMA-2-7Bでは、SparseForgeは平均で57.27%のゼロショット精度を達成し、textbf5B$リトレーニングトークンのみである。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:11:45 GMT)
Multimodal Deep Generative Model for Semi-Supervised Learning under Class Imbalance [9.8] クラス不均衡下での半教師付き学習のための多モード深層生成モデルを提案する。
提案手法では,各モダリティに対して別個のエンコーダを用い,各モダリティ間で潜伏変数を共有するとともに,積オブエキスパート法による連成後続計算を簡略化する。
ラベル付きデータとラベルなしデータの両方で、$$$-powerの分散を用いて提案モデルをトレーニングするための新しい目的関数を導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:56:45 GMT)
Q-MMR: Off-Policy Evaluation via Recursive Reweighting and Moment Matching [9.8] 有限水平MDPにおける非政治評価のための新しい理論フレームワークQ-MMRを提案する。
重要サンプリングや線形FQEなど,既存の手法との接続を確立する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:00:04 GMT)
Joint Consistency: A Unified Test-Time Aggregation Framework via Energy Minimization [9.8] 本稿では,複数の推論トレースを生成し,それらを最終回答に集約するテスト時間アグリゲーションについて検討する。
JC(Joint Consistency)はIsing型エネルギー最小化問題として定式化されている。
JCはタスク、判断モデル、トレース予算、トレース生成設定など、既存のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:17:13 GMT)
Fusion in Your Way: Aligning Image Fusion with Heterogeneous Demands via Direct Preference Optimization [9.7] マルチモーダル処理、赤外線および可視画像融合(IVIF)における重要な技術は、視覚強調および下流視覚タスクのための補完スペクトル情報の統合において重要な役割を担っている。
本稿では,PALDMとPCLDMを統合したDPOFusionを提案する。
我々のフレームワークは、人間、視覚言語モデル、タスク駆動ネットワーク間の正確な優先順位調整を実現するだけでなく、適応的な融合品質とタスク指向の伝達性のための新しいベンチマークも設定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:34:41 GMT)
Event-Causal RAG: A Retrieval-Augmented Generation Framework for Long Video Reasoning in Complex Scenarios [9.7] Event-Causal RAGは、無限長ビデオ推論のための軽量な検索拡張フレームワークである。
ストリーミングビデオを意味的に一貫性のあるイベントにセグメントし、各イベントを構造化されたステート-イベント-ステートグラフとして表現する。
このメモリ上に、最も関連性の高いイベント因果連鎖を効率的に識別するための双方向検索戦略を設計する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:01:28 GMT)
Importance-Guided Basis Selection for Low-Rank Decomposition of Large Language Models [9.7] 本稿では,BSI(Basis Selection with Importance)について紹介する。
我々は,Hutchinsonランダム化探索法を適用し,対称なパラメータ摂動による曲率の減少に適応して,効率的なヘシアン対角推定器を開発した。
本稿では, ベースプルーニングによる損失増加境界, ヘッセン対角線推定誤差のこれらの境界への明示的伝播, ヘッセンスペクトルに関連付けられた分散特性, 目標推定精度を達成するための高確率サンプル-複雑度保証, 摂動強度のガイダンスなど, 包括的な理論的解析を行う。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:51:21 GMT)
How to Compress KV Cache in RL Post-Training? Shadow Mask Distillation for Memory-Efficient Alignment [9.7] 強化学習(Reinforcement Learning, RL)は、大規模言語モデル(LLM)の高度な推論能力を解き放つための重要なパラダイムとして登場した。
オンラインRLは本質的に探索軌道生成(ロールアウト)フェーズを必要とする。
ロールアウト中にKVキャッシュ圧縮を適用すると、このメモリオーバーヘッドが軽減されるが、重要な非政治バイアスを引き起こす。
重要度の再重み付けのような既存の統計解は、この拡大したバイアスを修正するのに苦労する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:51:57 GMT)
Constraint Decay: The Fragility of LLM Agents in Backend Code Generation [9.7] 大きな言語モデル(LLM)エージェントは、緩やかな仕様の下で、自律的なコード生成において強力なパフォーマンスを示す。
プロダクショングレードのソフトウェアは、アーキテクチャパターンやデータベース、オブジェクト-リレーショナルマッピングといった構造的制約に厳格に固執する必要がある。
本稿では,バックエンド生成における構造的制約を適切に扱えるかを評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:44:40 GMT)
Offline Reinforcement Learning for Rotation Profile Control in Tokamaks [9.6] トカマクは、実際の核融合エネルギーを達成するための主要な候補であり続けているが、これらのデバイス内の重要な制御問題は、いまだに難しいか未解決のままである。
そのような課題の1つは、安定性、閉じ込め、輸送に強く影響を及ぼすプラズマ回転プロファイルを制御することである。
強化学習(RL)のような学習に基づく制御手法は、この課題に対する潜在的な解決策を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:26:59 GMT)
A Finite-Iteration Theory for Asynchronous Categorical Distributional Temporal-Difference Learning [9.6] 有限イテレーション理論とカテゴリー再帰のギャップを、実用的な分布時間差実装と最も密接に一致させる。
適切な埋め込みの後、両方のアルゴリズムは、状態ワイドの上限で収縮する非同期の単一状態近似の形式を取る。
これにより、i.d.状態サンプリングとMarkovian状態サンプリングの両方の下での割引問題と、i.d.エピソードサンプリングの下での未計算の固定水平問題において有限イテレーションが保証される。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:07:00 GMT)
The Missing Evaluation Axis: What 10,000 Student Submissions Reveal About AI Tutor Effectiveness [9.5] 我々は,AI教師の評価を,学生のインタラクションデータに基づく行動次元で拡張すべきだと論じる。
評価フレームワークを提案し,それに対応するAI教師のフィードバックで10,235のコード入力に適用する。
このフレームワークを使用して、大規模に導入されたコンピュータサイエンスコースにおいて、異なるセメータにまたがる2つのデプロイされたAIチューターを比較することで、学生のエンゲージメントパターンにかなりの違いが明らかになる。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:58:04 GMT)
Macroscopic entanglement between two magnon modes via two-tone driving of a superconducting qubit [9.4] 2つのYIG球面に2つのマグノンモードを2音場で駆動し、2つの駆動場の周波数と強度を適切に選択することにより、2つのYIG球面に2つのマグノンモードを絡み合わせることを提案する。
以上の結果から,2ミリサイズのYIG球体における2つのマグノンモード間のマクロな絡み合いが,現在利用可能なパラメータを用いて実現できることが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:01:58 GMT)
Transformers Efficiently Perform In-Context Logistic Regression via Normalized Gradient Descent [9.4] ソフトマックスアテンションを持つ変圧器は線形分類データに基づいてコンテキスト内学習を行う。
まず、コンテキスト内ロジスティック回帰を実行できる多層変換器のクラスを構築する。
構築した変圧器は, (i) 1ステップの勾配降下によって教師される1つの自己注意層をトレーニングし, (ii) 訓練された層を繰り返し適用してループモデルが得られることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:27:55 GMT)
Universal Analog Quantum Simulation [9.4] 我々は、アクセス可能な量子進化の範囲を体系的に拡張するハイブリッドフレームワークであるユニバーサルアナログ量子シミュレーション(UAQS)を導入する。
UAQSは最適化された連続時間制御フィールドを使用して、ターゲットダイナミクスを直接エンジニアリングする。
超伝導回路やライドバーグ原子配列を含む代表的アーキテクチャの数値的研究は、UAQSが非自明な多体力学を正確に再現していることを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:57:32 GMT)
$α$-Wasserstein Mechanism for Rényi Pufferfish Privacy [9.4] 本稿では,Rényi Pufferfish Privacyを実現するための$-Wasserstein機構を紹介する。
ラプラス機構のスケールパラメータは、$(, )$-Rényi Pufferfish Privacy for $in (1, infty)$を満たすために、$W_$メトリック上の上限によって校正可能であることを実証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:12:18 GMT)
On the Role of Language Representations in Auto-Bidding: Findings and Implications [9.2] 我々は,新しい自動入札フレームワークである textitSemBid を提案する。
トークンレベルでのオフライン入札トラジェクトリにセマンティック入力を注入する。
SemBidはオフラインのRLと生成シーケンスモデリングから競合するベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:08:56 GMT)
CoMemNet: Contrastive Sampling with Memory Replay Network for Continual Traffic Prediction [9.2] 本稿では,CoMemNet という名前のトラフィック予測のための,シンプルで効率的な2分岐連続学習フレームワークを提案する。
CoMemNetは、大規模な3つの実世界のデータセットすべてにわたって、最先端(SOTA)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:29:58 GMT)
FastOmniTMAE: Parallel Clause Learning for Scalable and Hardware-Efficient Tsetlin Embeddings [9.2] Tsetlin Machine (TM) は論理ベースの学習パラダイムを提供する。
TMはこのパラダイムを、単一の節層内の状態分布を利用して静的な埋め込みに適用する。
Fast OmniTMAEは、シーケンシャルなトレーニング依存関係を2段階の並列プロセスで置き換える。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:59:48 GMT)
A Rod Flow Model for Adam at the Edge of Stability [9.1] パラメータと第一モーメント $(w, m) のジョイント位相空間で作業することで、ロッドフローをアダムに拡張する。
また, 重い球運動量に対するロッドフローの開発も行っている。
8ドルでは、代表的機械学習アーキテクチャ上でのロッドフローを実証的に評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:21:59 GMT)
Detecting Time Series Anomalies Like an Expert: A Multi-Agent LLM Framework with Specialized Analyzers [9.0] SAGE(Specialized Analyzer Group for Expert-like Detection)は、構造化異常診断のためのマルチエージェントフレームワークである。
異常解析を、点、構造、季節、パターンの4つの特殊なアナライザーに分解する。
強力なML/DLと言語モデルベースのベースラインの中で最高の平均性能を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:17:35 GMT)
SiblingRepair: Sibling-Based Multi-Hunk Repair with Large Language Models [8.9] 兄弟修復に特化したLLMベースのマルチハンクAPR技術であるSiblingRepairを提案する。
不審な場所から始まるSiblingRepairは、トークンと埋め込みベースのコードマッチングを使用して、意味的に関連する兄弟候補を検索する。
次にLLMを使用して、障害関連兄弟を識別し、2つの補完的な戦略を通じて一貫したパッチを生成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:14:36 GMT)
GA3T: A Ground-Aerial Terrain Traversability Dataset for Heterogeneous Robot Teams in Unstructured Environments [8.9] GA3Tは、Clearpath Husky UGVとAutel EVOII UAVを用いて収集された、現実のマルチロボット協調認識データセットである。
データセットは4つのユニークな環境で収集され、約29分間に13,000以上の同期フレームがある。
SLAMやシミュレートされた協調運転に焦点を当てた従来のマルチロボットデータセットとは異なり、GA3Tはクロスビュー知覚、空中視点融合、トラバーサビリティ推定、協調的なシーン理解の研究を支援するように設計されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:03:15 GMT)
DiBA: Diagonal and Binary Matrix Approximation for Neural Network Weight Compression [8.8] 線形層、1時間1ドルの畳み込み、アテンションプロジェクション、埋め込み層を含む現代のネットワークの多くのコンポーネントは、密度の高い行列重みを持つ。
DiBAは$AinmathbbRmtimes n$ by $widehat A=D_1B_DBD_3$を近似する。
DiBARD (DiBA with Retuning only Diagonal Factor) は、密度の高い行列層をDiBA因子で置き換え、バイナリ行列を凍結し、下流データ上の対角成分のみをリチューニングする。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:46:22 GMT)
Independent Learning of Nash Equilibria in Partially Observable Markov Potential Games with Decoupled Dynamics [8.8] 部分的に観測可能なマルコフゲーム(POMG)におけるナッシュ均衡学習の研究
本研究では,各プレイヤーが自身の行動や観察のみを観察し,コミュニケーションを伴わない独立学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:56:56 GMT)
PersonaKit (PK): A Plug-and-Play Platform for User Testing Diverse Roles in Full-Duplex Dialogue [8.8] 本稿では,対話エージェントの迅速なプロトタイピングと評価を行うための,オープンソースのWebプラットフォームであるPersonaKitを提案する。
我々は,PersonaKitが次世代音声エージェントの複雑な社会言語行動を研究するためのエンドツーエンドのフレームワークを提供することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:00:03 GMT)
Adaptive auditing of AI systems with anytime-valid guarantees [8.8] 2つの'重複'の観点から仮説テストフレームワークを導入します。
我々は,オーディタを「賭けによる検証」の実行として形式化し,これは重複するヌル仮説をテストするための同時eプロセスに変換する。
提案手法は, 任意の値の型I誤差制御を維持し, 事前特定試験法より優れており, 統計的に厳密な結論に到達でき, 時には20の観測しか得られない。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:33:48 GMT)
Inference-Time Refinement Closes the Synthetic-Real Gap in Tabular Diffusion [8.7] 凍結したトレーニング済みのバックボーン上で動作可能な推論時間改善フレームワークを提案する。
推論時間の改善は、1つのコンシューマグレードのGPU上で1~80分でリアルタイムユーティリティを超えます。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:37:03 GMT)
SLayerGen: a Crystal Generative Model for all Space and Layer Groups [8.7] SLayerGenは、任意の空間または層群に不変と制約された結晶を生成する生成モデルである。
二周期材料のド・ノボ生成において、SLayerGenはバルク結晶生成モデルよりも一貫した性能向上を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:30:02 GMT)
VisMMOE: Exploiting Visual-Expert Affinity for Efficient Visual-Language MoE Offloading [8.6] 本稿では,単一のシステムインサイト上に構築されたVL-MoEオフロードシステムであるVisMMoEを紹介する。
VisMMoEはエンドツーエンドの推論性能を最大2.68倍と1.61倍に改善した。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:11:41 GMT)
SkillRet: A Large-Scale Benchmark for Skill Retrieval in LLM Agents [8.6] LLMエージェントにおけるスキル検索のための大規模ベンチマークであるSkillRetを紹介する。
63,259のトレーニングサンプルと,相容れないスキルプールを備えた4,997のアセスメントクエリを提供する。
オフザシェルフモデルは現実的な大規模スキルライブラリに苦しむが、以前のスキル検索モデルは依然として相当なヘッドルームを残している。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:18:11 GMT)
Divergence is Uncertainty: A Closed-Form Posterior Covariance for Flow Matching [8.6] フローマッチングは生成モデルの主要なフレームワークとなっているが、サンプルの不確かさの定量化は未解決の問題である。
これらのトレードオフはいずれも必要ありません。
MNISTの実験により、ピクセルごとの不確実性マップが意味論的に意味があることが確認された。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:22:19 GMT)
Shallow Prefill, Deep Decoding: Efficient Long-Context Inference via Layer-Asymmetric KV Visibility [8.6] emphShallow Prefill, dEEp Decode (SPEED) は非アンカープロンプトのKV可視性ポリシーである。
Speedは、上位レイヤのDecode可視性セットからプリフィルトークンを完全に削除する。
その結果,SPEEDは全深度モデルの主要なプロンプト選択領域と表現安定化領域を維持していることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:21:03 GMT)
The Interplay of Data Structure and Imbalance in the Learning Dynamics of Diffusion Models [8.5] スコアベース拡散モデルにおけるクラス依存学習について検討する。
これらのダイナミクスを規定する明確な階層を明らかにします。
我々は、Fashion MNISTで訓練されたU-Netモデルを用いて、理論的予測を実証的に検証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:44:53 GMT)
Behavior Cue Reasoning: Monitorable Reasoning Improves Efficiency and Safety through Oversight [8.5] LLM(Large Language Models)における推論(Reasoning in Large Language Models)は、監視の課題である。
LLM推論をより制御しやすく、監視しやすくするための振舞いキュー推論を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:05:50 GMT)
TraXion: Rethinking Pre-training Frameworks for Mobility and Beyond [8.5] TraXionを紹介します。その目的とアーキテクチャは、それらを満たすために共同で設計されています。
データセット毎に1つのTraXionチェックポイントが、異常検出、次のPOI、次のビジット予測、ソーシャルリンク予測を含む6つのパブリックモビリティデータセット上のタスク毎のタスク固有のレコメンデーションを破る。
企業認証ログやICU予測に適用されるのと同じレシピで、死亡率は両方の前の作業と一致しているか、あるいは超えているため、ドメインからのイベントストリームは単一のフレームワークでモデル化可能である。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:10:53 GMT)
Towards Annotation-Free Validation of MLLMs: A Vision-Language Logical Consistency Metric [8.5] 基本論理原理に基づいて,MLLMの視覚言語論理的整合性を評価する新しい枠組みを提案する。
我々は、従来のMC-VQAテストと最近のNaturalBenchテストにおいて、gtアノテーションを必要とせずにVL-LCM(Vision-Language Logical Consistency Metric)を定義した。
以上の結果から,論理的整合性は精度と信頼性の両方に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:09:41 GMT)
Text-to-CAD Retrieval: a Strong Baseline [8.5] 我々は,新しいモーダル検索タスクとしてテキストからCADへの検索を導入する。
自然言語クエリが与えられた大規模データベースから意味論的に関係のあるCADモデルを検索する。
手続き列と幾何学点雲の両方から多モードCAD埋め込みを学習する統合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:35:42 GMT)
Solving Minimal Problems Without Matrix Inversion Using FFT-Based Interpolation [8.4] 本研究では,スパースな隠れ変数を用いた解法を構成するサンプリングベースで逆変換のない手法を提案する。
提案した解法は,特に小規模問題に対して,強い数値安定性と競争安定性を実現する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:03:56 GMT)
Streaming Adversarial Robustness in Fuzzy ARTMAP: Mechanism-Aligned Evaluation, Progressive Training, and Interpretable Diagnostics [8.3] 本稿では,カテゴリー競争に基づく適応共振理論アーキテクチャであるFuzzy ARTMAPの対向ロバスト性について検討する。
WB-SoftmaxはARTMAPのカテゴリ競合とマップフィールド予測機構に整合した識別可能なホワイトボックス攻撃サロゲートであり、最終的な展開モデル上でロバスト性を必要とするストリーミング評価原理を定式化する。
オフラインの敵対的トレーニングは、転送攻撃時に強く見えるが、適応的なホワイトボックス評価では崩壊するが、プログレッシブ2段階選択トレーニングは、全体的なリプレイフリーが最も強力なものである。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:04:49 GMT)
ClawGuard: Out-of-Band Detection of LLM Agent Workflow Hijacking via EM Side Channel [8.3] ClawGuardは、電磁(EM)エマニュエーションを使って使用状況を監査するアウトオブバンドOSモニタである。
ClawGuardはAUCの0.9945を達成し、100%真陽性と1.16%偽陽性の攻撃を検知した。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:12:26 GMT)
ReActor: Reinforcement Learning for Physics-Aware Motion Retargeting [8.3] 本稿では,参照動作をロボットの形態に適応させる二段階最適化フレームワークを提案する。
物理シミュレーションと直接統合することにより、ロバストな模倣学習を容易にする物理的に妥当な運動を生成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:20:15 GMT)
DataDignity: Training Data Attribution for Large Language Models [8.2] 我々は3,537個のウィキペディア風記事のベンチマークであるFakeWikiを紹介した。
FakeWikiにはQAプローブ、ソース保存のパラフレーズ、レトロ生成の変種、解答クリティカルな事実を取り除きながら、極端に類似した硬いアンチドキュメントが含まれている。
我々は,7つの検索ベースライン,トレーニング不要なアクティベーション・ステアリング・検索・フュージョン法,SteerFuse,および教師付きコントラスト・プロファイランス・ローダであるScoringModelを評価した。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:27:45 GMT)
PairAlign: A Framework for Sequence Tokenization via Self-Alignment with Applications to Audio Tokenization [8.1] PairAlignは、シーケンスレベルの自己アライメントによるコンパクトなオーディオトークン化のためのフレームワークである。
広義の語彙を用いたコンパクトで非退化配列を学習する。
編集距離検索を保存し、アーカイブトークン数を55%削減する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:11:22 GMT)
Back to the Beginning of Heuristic Design: Bridging Code and Knowledge with LLMs [8.1] 大規模言語モデル (LLM) は、最近最適化のための高度自動設計 (AHD) を発表した。
既存のほとんどのアプローチは実行可能プログラムを探索し、実行フィードバックから洞察を抽出し、後続のイテレーションをガイドする。
我々は知識が主検索対象となり、コードは単にそれをインスタンス化し、テストするだけであると主張している。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:30:58 GMT)
Lie Group Formulation of Recursive Dynamics Algorithms of Higher Order for Floating-Base Robots [8.1] 本稿では,Lie群Newton-Euler,Articulated-Body Inertiaの高次時間微分の計算手順と,浮動小数点木に対するハイブリッド動的アルゴリズムについて述べる。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:17:39 GMT)
Memory Inception: Latent-Space KV Cache Manipulation for Steering LLMs [8.1] メモリインセプション(MI)は、テキスト由来のキーバリュー(KV)バンクを選択層のみに挿入することで、遅延注意空間におけるステアリングを行う。
MIはステアリングを選択的KVアロケーションとして扱い、モデルがそれに向かう場所のみ潜在スロットを注入する。
MIは可視文字を書き換えることなく、中間会話の振る舞いシフトをサポートし、Qwen3上で最も高いシフト後アライメントを実現している。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:19:33 GMT)
Room temperature Purcell enhanced single erbium ions in silicon-carbide-on-insulator microring resonators [8.1] 電信Cバンド(1530-1565nm)で動作する単一光子エミッタは、スピン光子界面の主候補である。
本研究では, 4H-Silicon-Carbide-on-Insulator (4H-SiCOI) マイクロリング共振器にイオンを注入した単一光子を室温で完全に一体化する実験を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:53:25 GMT)
Aquaman: A Transparent Proxy Architecture for Quantum Resilient Key Establishment [8.1] 量子レジリエントセッションキー構築のための透過プロキシアーキテクチャであるAquamanを提案する。
透過的なプロキシは、クライアント側設定を必要とせずに、信頼できるネットワークのエッジでセッションキー要求をインターセプトする。
AWS EC2での1,000ランのプロトタイプ評価は、レイテンシがマルチパスオーバーヘッドではなく、ネットワーク送信によって支配されていることを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:45:39 GMT)
WaferSAGE: Large Language Model-Powered Wafer Defect Analysis via Synthetic Data Generation and Rubric-Guided Reinforcement Learning [8.0] We present WaferSAGE, a framework for wafer defect visual questioning using small vision- language model。
我々はクラスタリングに基づくクリーニングを用いてラベルノイズをフィルタリングし、視覚言語モデルを用いて包括的欠陥記述を生成する。
これらのルーブリックは、VQAペアの合成をガイドし、欠陥型の同定、空間分布、形態学、根本原因分析を確実にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:17:49 GMT)
RETO: A Rotary-Enhanced Transformer Operator for High-Fidelity Prediction of Automotive Aerodynamics [8.0] 本稿では,二段階空間認識機構を備えたニューラルソルバを提案する。
回転エンハンス変換演算子(RETO)はShapeNetとDrivAerMLデータセット上で検証される。
AB-UBTの表面圧力と速度誤差は 0.102 と 0.124 であり、RegDGCNN は 0.235 と 0.312 である。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:55:10 GMT)
Accelerated Relax-and-Round for Concave Coverage Problems [8.0] コンケーブ被覆問題に対する高速化された緩和・円周アルゴリズムを提案する。
我々のアルゴリズムは、最先端のLPソルバを使用するアプローチよりも優れています。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:00:40 GMT)
Beyond Uniform Credit Assignment: Selective Eligibility Traces for RLVR [8.0] RLVR(Reinforcement Learning with Verifiable Rewards)は,大規模言語モデルの推論能力向上のための重要なアプローチとなっている。
本研究では,S-Trace(S-Trace)を,サンプル効率,評価自由度トレース手法として提案する。
実験の結果、SトラスはGRPOを上回るだけでなく、Qwen3-1.7Bでは0.49%、Qwen3-4Bでは3.16%、Qwen3-8Bでは2.98%向上した。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:11:51 GMT)
Improved techniques for fine-tuning flow models via adjoint matching: a deterministic control pipeline [8.0] 本稿では,フローベース生成モデルに対する人間の嗜好アライメントを定式化する決定論的随伴マッチングフレームワークを提案する。
この観点から、軌道の終端部分に焦点をあてたトランク付き随伴スキームを導入する。
我々は、標準KLベースの正規化を超えてフレームワークをさらに一般化し、アライメント強度と分布保存の間のより柔軟なトレードオフを可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:12:47 GMT)
FunctionalAgent: Towards end-to-end on-top functional design [7.9] FunctionalAgentは特別なサブエージェントのチームを編成し、開発プロセスをデータセット構築、アクティブスペース生成、MCSCF計算と記述子生成、損失関数構築、機能フィッティング、最適化、評価に分解する。
MC26は、同一のベンチマークデータセットで評価された他の手法と比較して、トレーニングセットの全体的な精度を実現するハイブリッドメタGGAオントップ関数である。
我々は、最適化されたトレーニングプロセスにより、トレーニングセットとテストセットの両方で最高のパフォーマンスを達成する新しい機能フォームであるCOF26を紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:16:16 GMT)
Big AI's Regulatory Capture: Mapping Industry Interference and Government Complicity [7.9] コーポレートアクターによるAI規制の広範かつ多面的獲得の程度と深さを理解することが重要である。
まず,問題を包括的に理解するためのメカニズムの分類法を開発する。
我々の分析では、249のキャプチャ機構のインスタンスを特定し、多くの場合、そのようなキャプチャを合理化するための物語と共起する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:07:57 GMT)
Constrained Contextual Bandits with Adversarial Contexts [7.8] 本研究では,予算制約のあるコンテキスト帯について,その逆の文脈を用いて検討する。
この設定において、目的は、後悔と予算制約の違反を同時に制御することである。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:04:49 GMT)
Trade-off Functions for DP-SGD with Subsampling based on Random Shuffling: Tight Upper and Lower Bounds [7.8] ランダムシャッフルに基づくサブサンプリングによるDP-SGDのトレードオフ関数の厳密な解析を導出する。
Berry-Esseenの定理によって導かれる我々の具体的な境界は、証明フレームワーク内の定数要素に密着している。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:35:43 GMT)
Agentic Coding Needs Proactivity, Not Just Autonomy [7.7] コーディングエージェントは、インラインコンプリートから、リポジトリの編集、プルリクエストのオープン、問題への対応、スケジュールやWebフックによる開発ライフサイクル全体にわたるルーチンの実行など、ソフトウェア開発の状況に急速に変化しています。
しかし、この分野には、ソフトウェア開発にとっての積極的活動が何を意味するのか、自律性とどのように異なるのか、前向きな長期タスクが満足すべき受け入れ基準、そしてどのメトリクスが、単にアクティブではなく、非孤立的なエージェントの振る舞いが有用か、といった明確な説明がない。
プロアクティビティの3段階分類(リアクティブ、スケジューリング、状況認識)を提案し、現代のコーディングエージェントを5つの実践基準と比較し、スケッチする。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:52:56 GMT)
Nonparametric estimation of time-varying network connections by multi-stage smoothing [7.7] 複数の時間点で観測される時間変化ネットワークの基盤となるエッジ確率を推定する問題を考察する。
本稿では,まず各エッジに時間的局所的平滑化を適用し,ノード領域平滑化を行う多段階平滑化推定器を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:05:14 GMT)
Weak-to-Strong Generalization is Nearly Inevitable (in Linear Models) [7.7] 我々は、標準線形ロジスティック回帰において弱強一般化が生じることを示す。
これはほとんどの生徒と教師のペアで起こり、この基本的な設定でさえ、弱いから強い一般化は必然的に最も避けられないものであることを示唆している。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:33:25 GMT)
XDecomposer: Learning Prior-Free Set Decomposition for Multiphase X-ray Diffraction [7.5] XDecomposerは,多相XRDパターンの結合分解と同定のための事前自由なフレームワークである。
実験により、XDecomposerは様々な化学系における再構成精度と位相同定を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:33:56 GMT)
Uncertainty Estimation via Hyperspherical Confidence Mapping [7.5] ニューラルネットワークの予測の不確実性を定量化することは、自律運転、ヘルスケア、製造といった高度な領域にとって不可欠である。
本研究では,サンプリングフリーかつ分散フリーな不確実性推定のための原則的フレームワークである超球面信頼度マッピングを提案する。
多様なベンチマークや実世界の産業タスクによる実験は、HCMがアンサンブルや明白なアプローチと一致しているか、あるいは超えていることを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:11:01 GMT)
Dual-Scale Temporal Fusion Reveals Structured Predictability in Subseasonal-to-Seasonal Temperature Prediction [7.5] S2S予測可能性は時間的・空間的・大規模パターンコヒーレンスにまたがって構成されていることを示す。
これらの結果は、予測システムを改善し、実際に使用することを通知するための、より解釈可能な基盤を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:19:23 GMT)
VibeServe: Can AI Agents Build Bespoke LLM Serving Systems? [7.4] 本稿では,LLMサービススタック全体をエンドツーエンドに生成する最初のエージェントループであるVibeServeを提案する。
既存のスタックが高度に最適化された標準的なデプロイメント設定では、VibeServeはvLLMと競合し続けている。
非標準的なシナリオでは、VibeServeはジェネリックシステムが見逃す機会を利用して既存のシステムより優れている。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:54:53 GMT)
Jointly Learning Structured Representations and Stabilized Affinity for Human Motion Segmentation [7.4] HMS(Human Motion Clustering)は、動画を異なる人間の動きに対応する非重複セグメントに分割することを目的としている。
現実世界のビデオでは、生のフレームレベルの機能はUnionof-Subspacesの仮定に反し、不満足なセグメンテーション性能をもたらすことが多い。
本稿では,時間的に一貫した構造的表現と,正確かつ堅牢なHMSとの親和性を共同で学習する時間的自己表現型サブスペースクラスタリング(TDSC)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:48:53 GMT)
P-Guide: Parameter-Efficient Prior Steering for Single-Pass CFG Inference [7.3] 単一の推論パスを通じて高品質なガイダンスを実現するフレームワークである textbfP-Guide を導入する。
一階近似の下では、P-Guideは以前の空間から生成を操るという意味でCFGと等価である。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:31:05 GMT)
Flow Matching with Arbitrary Auxiliary Paths [7.3] 我々は新しい生成モデリングフレームワークを導入する。
AuxPath-FM - 補助変数を組み込むことで条件付きフローマッチングを一般化する。
この構造が連続性方程式を保ち、限界定式化と整合した訓練目標を維持することを理論的に実証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:39:25 GMT)
CLAD: A Clustered Label-Agnostic Federated Learning Framework for Joint Anomaly Detection and Attack Classification [7.3] Internet of Things(IoT)とIndustrial IoT(IIoT)は、巨大で異質なアタックサーフェスを作成しました。
本稿では,Clustered Federated Learning(CFL)を新しいDual-Mode Micro-Architectureにシームレスに組み込む,包括的なフレームワークであるCLADを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:01:19 GMT)
InkDiffuser: High-Fidelity One-shot Chinese Calligraphy via Differentiable Morphological Optimization [7.2] InkDiffuser(インクディフューザー)は、1ショットの漢文合成のための拡散ベースの生成フレームワークである。
本稿では、高周波強化機構と微分可能なインク構造損失の2つのコアコントリビューションを紹介する。
様々な書風や複雑な文字の実験は、InkDiffuserが優れた書体を生成できることを実証している。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:33:21 GMT)
Reproduction Test Generation for Java SWE Issues [7.2] 本稿では,Javaリポジトリレベルの再現テスト生成のためのベンチマークとソリューションを紹介する。
TDD-Bench-Javaというベンチマークは、この問題を最初にモデル化し、人気のあるオープンソースリポジトリをソースとした250のインスタンスで構成されている。
このソリューション、e-Otter++ for Javaは、Pythonの最先端の再現テストジェネレータを適用して、Javaのパフォーマンスを向上する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:11:05 GMT)
CRAFT: Forgetting-Aware Intervention-Based Adaptation for Continual Learning [7.2] CRAFTは、モデルの重み付けの更新を避ける継続的学習フレームワークである。
まず、各タスクを出力分布のばらつきに基づいて、類似したタスクのグループにルーティングする。
すると、KL(Kullback-Leibler)の偏差をグループの先行状態に対して微調整する。
最後に、更新されたタスクの介入を同じKL信号を使用して共有表現にマージする。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:24:13 GMT)
Dynamically Characterizing the Structures of Dirac Points via Wave Packets [7.2] 制御可能なディラック点を持つ系のトポロジカルバンド構造について検討する。
これらのバンド構造は、ウェーブパケットの動的挙動によって明らかにできることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:40:22 GMT)
Mind the Gap? A Distributional Comparison of Real and Synthetic Priors for Tabular Foundation Models [7.1] タブラル基礎モデルは、ベンチマークリポジトリから収集されたキュレートデータセット、Webから大規模に収集されたテーブル、パラメトリック生成前のデータからサンプリングされた合成テーブルの3つのクラスのうちの1つで事前訓練されている。
この作業では、表層基礎モデルのトレーニングに使用される3つの標準的アーキティパルデータセットを取ります。
各コーパスは, テーブル全体, 列, 相関関係の集合的特徴を用いて特徴付け, 識別器AUCとk-NNのカバレッジ指標を用いて比較する。
我々は、TabICL合成前は実テーブルの空間の狭い領域を占めており、このミスマッチは事前の最適化によっては閉じられないことを発見した。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:29:31 GMT)
Process Matters more than Output for Distinguishing Humans from Machines [7.1] 既存のアプローチは、システムが人間の行動と区別できない行動や反応を生成できるかどうかを評価する。
認知科学は、行動が生成される過程を評価するという別の視点を提供する。
タスク性能が一致しても、診断プロセスレベルの特徴を引き出すために設計された30の認知タスクからなる電池であるCagCAPTCHA30を紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:30:35 GMT)
Adaptive Q-Chunking for Offline-to-Online Reinforcement Learning [7.1] オフライン-オンライン強化学習のための適応Q-Chunking(AQC)を提案する。
AQCは、ディスカウント係数によって正規化された水平毎のベースラインと比較して、各チャンクサイズの利点を比較する。
我々はAQCがOGBenchとRobomimicで最先端のオフラインおよびオンラインの成功率を達成することを実証した。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:48:25 GMT)
An Empirical Study of Proactive Coding Assistants in Real-World Software Development [7.1] 大規模言語モデル(LLM)ベースのコーディングアシスタントは大きな進歩を遂げているが、ほとんどのシステムはリアクティブのままである。
プロアクティブなコーディングアシスタントは、統合開発環境(IDE)インタラクションとリポジトリコンテキストから潜伏した開発者の意図を推論することを目的としている。
この方向の研究は、大規模な開発者行動データの不足によって制限されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:44:52 GMT)
Polarizable atomic multipoles for learning long-range electrostatics [7.1] 長距離静電と分極は、機械学習の原子間ポテンシャルを拡大する中心的な障害のままである。
偏光性原子多極子を用いた静電気をエネルギーや力から学習するための半局所フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:40:53 GMT)
Dynamic Controlled Variables Based Dynamic Self-Optimizing Control [7.1] 本稿では,動的最適化のための自己最適化制御問題を提案する。
動的制御変数(DCV)という新しい概念が提案され,暗黙的な制御ポリシーが提示される。
3つのケーススタディは,多値および不連続関数の近似におけるDCVの有効性と優位性を検証した。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:56:29 GMT)
Spectral Lens: Activation and Gradient Spectra as Diagnostics of LLM Optimization [7.1] トレーニングの損失とスループットは、言語モデルトレーニングにおいて異なる内部表現を隠蔽する可能性がある。
我々は、スペクトル測定を実用的および運用上の診断に用いている。
この二重ビューでは、3つの経験的発見と1つの機械的説明が示される。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:19:56 GMT)
On Fixing Insecure AI-Generated Code through Model Fine-Tuning and Prompting Strategies [7.0] AI生成コードのセキュリティは、広く採用される上で大きな障害である。
これまでの作業では、AI生成コードのセキュリティ問題を緩和するためのさまざまなアプローチが検討されてきた。
本稿では,CWE(Common Weaknession)リストに対するモデル生成コードのハード化戦略を体系的に検討する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:34:00 GMT)
Pro-KLShampoo: Projected KL-Shampoo with Whitening Recovered by Orthogonalization [7.0] 我々はKL-ShampooのKroneckerプレコンディショナーに関する構造観察を行う。
固有値スペクトルは、エンフスパイクと平坦な形状を示す。
我々は、KL-シャンプーのクロネッカー因子の1つをパラメトリック族に制限することで、この構造を利用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:16:16 GMT)
Can LLMs Predict Polymer Physics Just by Reading Synthesis and Processing Prose? [7.0] textbfPolyLMは、フルテキスト文学から直接材料性能を予測する自然言語のみのフレームワークである。
我々は、22の物理的、機械的、熱的性質にわたる185,000の科学論文と276,400以上のユニークなポリマーサンプルをキュレートした。
このモデルは驚くほど高い予測精度を達成し、複雑な特性に対する新しい最先端のベンチマークを確立する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:39:40 GMT)
More Aligned, Less Diverse? Analyzing the Grammar and Lexicon of Two Generations of LLMs [7.0] 本研究は, LLM生成テキストと人間によるテキストの比較において, 研究の進展に寄与する。
我々は、生態学と情報理論の多様性指標を用いて、文法構造や語彙型の変化を定量化する。
英語のニューステキストは時間軸がほとんど変化していないのに対して,新しいLLMでは構文的,特に語彙的多様性が向上している。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:21:29 GMT)
Optimal Counterfactual Search in Tree Ensembles: A Study Across Modeling and Solution Paradigms [6.9] 本研究では,木組の最適対実的説明を,可否制約と行動可能性制約の下で計算する問題について検討する。
これは問題である: 固定モデルの場合、反事実探索は、一貫した分岐決定と、距離目標の下でしきい値定義された領域を選択することに沸騰する。
我々は、この構造をCPCF(制約プログラミング)の定式化によって利用し、数値的特徴を分割しきい値によって誘導される区間領域として符号化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:54:38 GMT)
Spherical Flows for Sampling Categorical Data [6.9] 連続埋め込み空間における離散列生成モデルの学習問題について検討する。
実験では、VMF経路を測地線とユークリッドの代替法と比較した。
vMFとPCサンプリングの組み合わせは、スドゥークと言語モデリングの結果を大幅に改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:34:00 GMT)
Rethinking Convolutional Networks for Attribute-Aware Sequential Recommendation [6.8] 属性対応シーケンシャルレコメンデーションでは、ユーザが過去のインタラクションの時系列的に順序付けられた履歴に基づいて、次に対話するアイテムを予測する。
既存の方法は典型的には、シーケンス全体を統一表現に集約するために自己認識機構を利用する。
本稿では,畳み込み層を階層的かつ低スケールに利用して,コンパクトかつ表現力のあるシーケンス表現を生成するConvRecを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:55:31 GMT)
How Does Attention Help? Insights from Random Matrices on Signal Recovery from Sequence Models [6.8] 固有値分布の制限,外乱固有値,および隠れ信号との固有ベクトルアライメントの正確な特徴を導出する。
パラメータフリー因果自己アテンションを$/d$のスコアスケーリングで行うと、平均プールよりも信号の回復が向上する決定論的調和重みが得られることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:28:01 GMT)
Understanding Cross-Language Transfer Improvements in Low-Resource HTR: The Role of Sequence Modeling [6.7] アラビア文字言語のための手書きテキスト認識は、低リソース条件下での言語間共同学習の恩恵を受ける。
我々は,CNNのみのモデルとCTC復号とCRNNのモデルを比較した。
CNNのみのモデルでは、制限や不安定な改善が見られたが、CRNNモデルはマルチスクリプトトレーニングにおいて、より良い性能が得られる。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:11:56 GMT)
Hallucination as an Anomaly: Dynamic Intervention via Probabilistic Circuits [6.7] LLM残差ストリーム上のトラクタブル密度推定器として訓練された確率回路PCNETを提案する。
本手法は,実数多様体上の幾何学的異常として幻覚を検出する。
PCNETは、CoQA、SQuAD v2.0、TriviaQAのほぼ完全な幻覚検出を実現し、AUROCは99%に達する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:02:27 GMT)
ProtSent: Protein Sentence Transformers [6.7] タンパク質言語モデル (pLM) は、進化的および構造的情報をキャプチャする残基ごとの表現を生成する。
本稿では、PLMを汎用埋め込みモデルに適応させるための対照的な微調整フレームワークであるProtSent(ProtSent)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:33:49 GMT)
Hedging Memory Horizons for Non-Stationary Prediction via Online Aggregation [6.6] MELOは適応スケールにまたがってヘッジを行うモデルに依存しない手法である。
指数的に重み付けされた最小二乗適応の専門家を持つ予想外のベース予測プールをラップする。
パラメータフリーのオンラインアグリゲーションルールであるMLpolで、生およびEWLS対応の予測を集約する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:38:21 GMT)
Linear Semantic Segmentation for Low-Resource Spoken Dialects [6.6] 対話アラビア語のセマンティックセマンティックセグメンテーションのための新しいマルチジャンルベンチマークを導入する。
MSAニュースジャンルでよく機能するセグメンテーションモデルは方言転写音声で劣化することを示す。
談話の不連続性に対する局所的セグメンテーション・コヒーレンスとロバスト性を目標としたセグメンテーション・モデルを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:51:24 GMT)
Soft Deterministic Policy Gradient with Gaussian Smoothing [6.6] 我々は、滑らかなベルマン方程式を用いて、ソフト決定論的政策勾配(Soft-DPG)を導出する。
我々はこの枠組みを深層強化学習アルゴリズムにインスタンス化し、ソフトディープ決定主義政策勾配(Soft DDPG)と呼ぶ。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:21:01 GMT)
AstroAlertBench: Evaluating the Accuracy, Reasoning, and Honesty of Multimodal LLMs in Astronomical Classification [6.5] AstroAlertBenchは、天文学的なイベントレビューのために大きな言語モデル(LLM)を評価するために設計された包括的なベンチマークである。
我々は、北部の空をスキャンして一過性の天文事象を検出する広視野調査であるZTF(Zwicky Transient Facility)から、1500件の現実世界の警報のパイロットサンプルを使用します。
以上の結果から,高い精度は必ずしもモデルの誠実さと一致しないことが明らかとなり,その推論を自己評価する能力として定義されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:36:27 GMT)
AirBender: Adaptive Transportation of Bendable Objects Using Dual UAVs [6.5] 本稿では、2台の航空機が自在な弾力性モデルに頼らずに、折り曲げ可能な物体を輸送しながら、軌道を協調的に追従できる適応制御器を提案する。
本手法は,物体の未知な変形特性をオンザフライで適応し,軌道追従作業における安定性と性能を確保する。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:36:03 GMT)
When Does a Language Model Commit? A Finite-Answer Theory of Pre-Verbalization Commitment [6.5] 言語モデルは最終回答を与える前に推論を生成することが多いが、可視性のある答えは、モデルの回答がいつ安定するかを明らかにしない。
我々はこの問題を、狭義の計算可能な対象である無限回答優先安定化(enmphfinite-aswer preference stabilization)を通して研究する。
モデル状態と特定解動詞化子に対しては、モデル自身の継続確率を有限解集合に投影する。
バイナリタスクでは、これは正確なlog-oddsコード、$()=S_(mathrmyesmid)-S_(mathrmnomid)が生成される。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:34:59 GMT)
Covariate Balancing and Riesz Regression Should Be Guided by the Neyman Orthogonal Score in Debiased Machine Learning [6.4] DMLの一般的なバランス原理として,Rieszレグレッションが基本関数を$X$で実装した回帰バランシングを提唱する。
この位置は共変量バランスが無効であるわけではないが、共変量バランスが適切である特別な場合として理解されるべきである。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:02:47 GMT)
Distributional Process Reward Models: Calibrated Prediction of Future Rewards via Conditional Optimal Transport [6.4] インタイムスケーリング手法はプロセス・リワード・モデル(PRM)に依存している。
本研究では, PRMの校正, 条件OT(CondOT)マップ学習 citebunne2022 の修正, 単調条件量子関数の推定における条件最適輸送の最初の利用を提案する。
これにより、構造的に有効な量子的推定が得られ、任意のレベルでの信頼境界の効率的な抽出が可能となる。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:00:04 GMT)
R$^3$L: Reasoning 3D Layouts from Relative Spatial Relations [6.3] 相対空間関係は空間構造のコンパクトな表現を提供する。
最近の研究は、そのような関係を推測するためにマルチモーダルな大規模言語モデルを利用しているが、推論された関係はしばしば信頼できない。
3次元レイアウト生成のための相対空間推論の信頼性と一貫性を向上させる汎用フレームワークであるR$3$Lを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:50:12 GMT)
A Unified Pair-GRPO Family: From Implicit to Explicit Preference Constraints for Stable and General RL Alignment [6.3] 優先学習による大規模言語モデル(LLM)のアライメントは、不安定なポリシー更新、曖昧な勾配方向、高い勾配分散に悩まされている。
我々は、Pair-GRPOファミリを中心とした嗜好に基づくRL最適化のための統一的理論的枠組みを確立する。
両変種を包括的に理論的に保証する - 単調な政策改善、決定論的勾配方向、勾配分散低減、動的ステップサイズ収束を含む。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:56:11 GMT)
Data-Driven Covariate Selection for Nonparametric and Cycle-Agnostic Causal Effect Estimation [6.3] 観測データから因果効果を推定するには、有効な調整セットを特定する必要がある。
既存のアプローチは典型的には非循環を前提とするか、大域的な因果構造学習に依存している。
本手法は, 周期的および非周期的な設定に対して, 変更することなく適用可能であることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:02:07 GMT)
Efficient Pre-Training with Token Superposition [6.2] Token-Superposition Training (TST) は、FLOP毎のデータスループットを大幅に向上する単純なドロップイン方式である。
我々は,TSTを270Mと600Mのスケールで広範囲に評価し,3Bと10BのA1B混合モデルで検証した。
均等な設定では、TSTは10B A1Bスケールでのトレーニング前の総時間を最大2.5倍に削減する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:41:37 GMT)
TriDE: Triangle-Consistent Translation Directions for Global Camera Pose Estimation [6.2] 本稿では,高精度な高次検証信号として,カメラ三角形の整合性を利用するTriDEを提案する。
実画像グラフの実験により、TriDEは方向精度を大きなマージンで向上し、下流カメラの位置がより良くなることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:43:15 GMT)
Beyond Autoregressive RTG: Conditioning via Injection Outside Sequential Modeling in Decision Transformer [6.2] 決定変換器(DT)は、自動回帰シーケンスモデリングとしてオフライン強化学習を定式化する。
本稿では,自己回帰配列からReturn-to-Go(RTG)を除去するSlimDTを提案する。
D4RLベンチマークでは、SlimDTは様々なタスクで標準DTを超え、既存の最先端メソッドに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:20:25 GMT)
Anatomy of a Query: W5H Dimensions and FAR Patterns for Text-to-SQL Evaluation [6.2] 本稿では,FAR構造不変量とW5H次元フレームワークという,独立に動機づけられた2つのコンポーネントをベースとしたフレームワークであるQUESTを紹介する。
FARの適合性はすべてのドメインとスキーマタイプで普遍的であるが、W5H次元プロファイルはかなり異なる。
これらの結果は、構造化されたデータに対して真のマシン推論のために渡らなければならないフロンティアを特定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:03:55 GMT)
When Agents Handle Secrets: A Survey of Confidential Computing for Agentic AI [6.2] ツールを計画し、実行し、永続的なメモリを保持し、タスクをピアエージェントに委譲するエージェントAIシステムは、スタンドアロンのモデル推論と実質的に異なる脅威表面を導入する。
Trusted Execution Environments (TEEs)は、エージェントコードとデータを特権システムソフトウェアから分離する。
本調査は, 設計空間を, (i) 展開の役割と業績のトレードオフをカバーする6つのTEEプラットフォームの統合分類, (ii) 認知,計画,記憶,行動,調整層を対象とするエージェント中心の脅威モデル, (iii) CCの比較調査の4つの部分で要約する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:46:43 GMT)
Leveraging Image Generators to Address Training Data Scarcity: The Gen4Regen Dataset for Forest Regeneration Mapping [6.1] 本稿では,微細な森林再生種のセマンティックセグメンテーションにおけるデータ不足と極端クラス不均衡の2つの課題に対処する。
大規模視覚言語Nano Banana Proモデルを用いて,プロンプトから高忠実度画像とそれに対応する画素対応セマンティックマスクを同時に生成する。
提案手法は,実世界のデータとAI生成画像を統合し,AI生成データが実世界のデータと極めて相補的なものであることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:28:56 GMT)
An Evaluation of Chat Safety Moderations in Roblox [6.1] 複数の年齢層で4つのゲームから約200万のチャットメッセージを収集しました。
我々の発見は、未成年者の手入れ、セクシュアライゼーションに関連する、安全でないチャットメッセージの多数の事例という、厄介な現実を明らかにした。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:52:25 GMT)
Towards Generation-Efficient Uncertainty Estimation in Large Language Models [6.1] 医療やファイナンスといった高度なアプリケーションにLLMをデプロイする上で,不確実性評価が重要である。
既存の手法では、不確実性を推定するために1つ以上の完全な自己回帰世代が必要である。
部分生成や入力のみの情報を用いて有効不確実性を推定できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:39:13 GMT)
Resource-Aware Evolutionary Neural Architecture Search for Cardiac MRI Segmentation [6.1] CardiacNASは、UNetのようなスーパーネットと心を意識した検索空間を結合した進化的ニューラルネットワーク検索フレームワークである。
サーチは、固定された計算予算下でのモデルサイズと浮動小数点演算(FLOP)に対して、ダイス類似度係数(DSC)と95番目のパーセンタイルハウスドルフ距離(HD95)を共同最適化する。
平均DSCは93.22%、HD95は4.73mm、パラメータは3.58M、GFLOPは14.56である。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:38:51 GMT)
Adaptive Selection of LoRA Components in Privacy-Preserving Federated Learning [6.1] LoRAを用いた大規模モデルの微分プライベートな微調整は、LoRAの乗法構造に起因する凝集誤差に悩まされる。
3つの軸で定義される適応的フレームワークAS-LoRAを提案する(レイヤワイド自由度、ラウンドワイド適応度、曲率認識スコア)。
理論的には、AS-LoRAは階層化されたスケジュールの再構築エラーフロアを排除し、収束を加速し、よりフラットなミニマへのソリューションを暗黙的にバイアスし、追加のプライバシーコストを発生させない。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:01:00 GMT)
Graphlets as Building Blocks for Structural Vocabulary in Knowledge Graph Foundation Models [6.0] 本稿では,パターンマッチングによる関係性間の知識グラフをマイニングする,グラフレットの語彙に基づくモデルに依存しないフレームワークを提案する。
実験により、語彙に単純なグラフレットを追加すると、以前のKGFMよりも優れたモデルが得られることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:47:34 GMT)
Retain-Neutral Surrogates for Min-Max Unlearning [6.0] マシンアンラーニングは、残りのデータのパフォーマンスを維持しながら、指定されたトレーニングデータの影響を除去しようとする。
min-maxアンラーニングでは、キーとなるローカルオブジェクトは、保持対象が評価される代理点である。
本稿では,一階述語ゲインを最大化することにより,内部代理構築を制約するRetain-Orthogonal Surrogate Unlearningを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:38:09 GMT)
ReasonSTL: Bridging Natural Language and Signal Temporal Logic via Tool-Augmented Process-Rewarded Learning [6.0] textscReasonSTLは、自然言語からSTL生成にローカルのオープンソース言語モデルを適用するツール拡張フレームワークである。
textscReasonSTLは、翻訳プロセスを明示的な推論、決定論的ツール呼び出し、構造化された公式構成に分解する。
実験により、textscReasonSTLでトレーニングされた4Bモデルは、自動測定と人的評価の両方で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:07:30 GMT)
Beyond Steering Vector: Flow-based Activation Steering for Inference-Time Intervention [6.0] アクティベーションステアリングは、推論時に言語モデルの振る舞いを制御するための有望な代替手段として登場した。
既存のステアリング法は、単純なインコンテクストのプロンプトによって、しばしば性能を上回り、目に見えない概念を一般化する。
本研究では,これらの仮定に頼らずに,非ステアリングをステアリングに伝達する,概念条件付速度場を学習するFLASを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:03:16 GMT)
AeroJEPA: Learning Semantic Latent Representations for Scalable 3D Aerodynamic Field Modeling [5.9] 本研究では,空力場モデリングのための予測アーキテクチャであるAeroJEPAを紹介する。
幾何学から直接流れ場を予測するのではなく、AeroJEPAは流れの潜在的な表現を予測している。
得られた潜在空間は, 制御された探索, 線形探索, 概念ベクトル算術, 制約付き設計潜在最適化実験をサポートすることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:11:26 GMT)
LLMSpace: Carbon Footprint Modeling for Large Language Model Inference on LEO Satellites [5.9] 大規模言語モデル(LLM)は急速にエネルギー需要を増大させ、大規模な推論によってエネルギーと炭素危機を生じさせる。
本稿では,AI対応LEO衛星上でのLCM推論のための最初の炭素モデリングフレームワークである textitLLMSpace を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:06:56 GMT)
Long Context Pre-Training with Lighthouse Attention [5.9] 極端配列長の訓練因果変換器は、スケールドドット積注意(SDPA)の2次時間と記憶によってボトルネックとなる
トレーニングのみの対称選択に基づく階層型アテンションアルゴリズムであるLighthouse Attentionを提案する。
階層的な選択もグラデーションフリーであり、複雑で潜在的に非効率な後方パスカーネルを扱うことを免除します。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:49:28 GMT)
From Drops to Grid: Noise-Aware Spatio-Temporal Neural Process for Rainfall Estimation [5.8] 本研究では,レーダからの空間的文脈で,民間気象観測所を融合させて豪雨場を生成するDropsToGridを提案する。
実世界のデータセットの評価によると、DropsToGridは運用ベースラインとディープラーニングベースラインの両方でパフォーマンスが向上している。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:22:37 GMT)
Bi3: A Biplatform, Bicultural, Biperson Dataset for Social Robot Navigation [5.7] Bi3は、制約された実験室の人々のグループ間での、ソーシャルロボットナビゲーションのデータセットである。
Bi3は、人間とロボットが、制約された環境で自分たちのアクティビティを生産的にメッシュする方法を理解するために貢献する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:05:37 GMT)
Dynamical Signatures of Floquet Topology in Wave Packet Dynamics [5.7] ウェーブパケットの中心-質量のダイナミクスを解析的に記述する。
我々は、低周波モードの出現を含む、CoMダイナミクスの異なるシグネチャを見つける。
我々の研究は、フロケット系における位相相転移を探索するための単純かつ実験的にアクセス可能なプローブとして、CoMダイナミクスを確立している。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:56:19 GMT)
Contextual Memory-Enhanced Source Coding for Low-SNR Communications [5.7] 本稿では,ロバスト伝送のためのメモリ拡張ソース符号化方式を提案する。
コンテキストを外部情報として扱うのではなく、MASCはコンテキストパターンをソースモデルに内部化する。
MASCは、ソース推定を洗練し、平均コード長を短縮し、ソース復号の感度を残留チャネルエラーに低減する。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:29:17 GMT)
Detecting Verbatim LLM Copy-Paste in Homework [5.6] SteganoPromptは、任意の印刷可能なASCIIペイロードをUnicode Tagsブロックにエンコードする、シングルページのゼロ依存Webツールである。
エンコードされた文字列は、元のものと視覚的に同一であり、共通のコピーペーストチャネルを生き残る。
我々は,7つのLLMファミリーおよび教育コンテンツチャネルの代表的なセットに対するコンプライアンスを評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:36:27 GMT)
Intention assimilation control for accurate tracking with variable impedance in teleoperation [5.6] 本研究では,ロボットの追尾精度を高剛性で確保できる意図的同化制御戦略を提案する。
IACは、ロボットがユーザーの動きを正確に再現し、意図に応じてインピーダンスを調節する自由を与える。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:31:12 GMT)
MotionGRPO: Overcoming Low Intra-Group Diversity in GRPO-Based Egocentric Motion Recovery [5.5] 本稿では,頭部搭載デバイス信号からのフルボディ3次元人間の動作回復について検討する。
拡散過程に微粒なガイダンスを注入するための強化学習後学習を活用した新しいフレームワークであるMotionGRPOを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:14:28 GMT)
ReFlect: An Effective Harness System for Complex Long-Horizon LLM Reasoning [5.5] 本稿では,LLM推論のためのシステムであるReFlectについて述べる。
6つの推論領域にまたがる制御された実験により、100個の監査された反射ブロックのうち90個の問題にフラグを付けない、プロンプトレベルの自己批判が公式テンプレートを生成することが示された。
我々のReFlectハーネスは, GPT-4o-miniで41%, Claude Sonnet 4.5で56%のタスク成功率を実現している。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:29:34 GMT)
Causal-Aware Foundation-Model for Bilevel Optimization in Discrete Choice Settings [5.5] 本稿では,二段階決定問題を解決するために,制約付き三重項価格最適化(C3PO)ネットワークを提案する。
C3POは、価格の模倣学習、収益のマルチタスク学習、価格弾力性の文脈学習を統合する。
医療、テンダー価格、航空会社の補助価格など、現実のアプリケーションに最適な価格設定のためのチューニングされたファンデーションモデルをデプロイする。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:55:47 GMT)
Optimal Experiments for Partial Causal Effect Identification [5.5] 本研究では,実験結果の観察に先立って,対象クエリのバウンダリを厳格化するコスト制約のある実験のサブセットを選択することの問題点について検討する。
我々はこれを最大効用問題として定式化し、最大効用度は実験によって保証される境界幅の最悪の低減を測る。
我々はID処理実験が慣性的に不活性であることを示し、評価されたサブセットの数を超指数的に削減することを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:16:58 GMT)
Systematic Extraction of Exact Yang-Mills Solutions via Algebraic Tensor Ring Decomposition [5.5] 本稿では,ヤン・ミルズ理論の非線形偏微分方程式(PDE)をトラクタブル微分代数系に体系的にマッピングする。
このフレームワークは、強結合ゲージ理論の古典的な解空間を特徴づけるための方法論的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:58:55 GMT)
Visual Fingerprints for LLM Generation Comparison [5.5] 大規模言語モデル(LLM)出力は、プロンプト、システム命令、モデルパラメータ、アーキテクチャ間の複雑な相互作用から生じる。
本稿では,言語選択の集合として応答をモデル化することにより,LLM出力を生成条件間で視覚的に比較する手法を提案する。
次に、これらの分布を視覚的指紋として可視化し、条件固有傾向の直接的、分布レベルの比較を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:40:12 GMT)
STALE: Can LLM Agents Know When Their Memories Are No Longer Valid? [5.4] 大規模言語モデル(LLM)エージェントは、コヒーレントで長期的なパーソナライズされたメモリを維持することがますます期待されている。
現在のベンチマークは、主に静的な事実検索を計測し、新しい証拠が現れたときに保存された信念を更新する能力を見下ろしている。
専門家が検証した400の競合シナリオのベンチマークであるSTALEを紹介します。
CUPMemは,構造化状態統合と伝搬認識探索による書き込み時間リビジョンを強化するプロトタイプである。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:31:15 GMT)
Inductive Power Grid Cascading Failure Analysis with GRU-Gated Graph Attention [5.3] 既存の手法では、カスケードデータからライン間の障害相関を学習できるが、それらは訓練され、単一のグリッドで評価される。
我々は、単一GRU(Gated Recurrent Unit)付きグラフ注意ネットワークを複合カスケード障害データに基づいてトレーニングすることで、この問題に対処する。
我々は、確立された構造的および電気的基盤線よりも、より脆弱な線を一貫して識別する。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:46:10 GMT)
Why DDIM Hallucinates More than DDPM: A Theoretical Analysis of Reverse Dynamics [5.3] 2つの正準拡散サンプリング装置における幻覚現象について検討する: Denoising Diffusion Probabilistic Model (DDPM) と Denoising Diffusion Implicit Model (DDIM) である。
ガウス混合ターゲットの逆ODE (DDIM) とSDE (DDPM) を分析し、臨界時間$$(a) DDIMが2つの最寄りモードを接続するセグメントで立ち往生し、(b) DDPM *stochasticity* がこの領域から不安定になるのを手助けし、幻覚を避ける。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:34:12 GMT)
Target-Aware Data Augmentation for SAT Prediction [5.3] Boolean satisfiability (SAT)のようなドメインでは、標準的なパイプラインはサーボ・イン・ザ・ループ・ラベリングに依存している。
このボトルネックは、難しい問題の構造を捉えるために機械学習を活用するという、より広範な目標を妨げます。
本研究では,SAT と UNSAT を正しくラベル付けした SAT と UNSAT インスタンスを構築により生成する SAT のターゲットアウェア,ソルバフリーなデータ生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:45:08 GMT)
Whole-body CT attenuation and volume charts from routine clinical scans via evidence-grounded LLM report filtering [5.3] 我々は,放射線学報告からの病理所見をフィルタリングするために,エビデンスと相互検証された大規模言語モデルアンサンブルを開発した。
5つのLDM(最初のフラグ構造レベルの異常候補)が冗長な報告証拠に根拠を置いている。
年齢,性別,コントラストの強化,獲得パラメータを考慮し,成人期の解剖学的構造106件について総合的な全身基準チャートを構築した。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:40:01 GMT)
Bandit Learning in General Open Multi-agent Systems [5.3] 証明可能な保証付きグローバルUCB学習手法を開発した。
入力の不確実性はトレーニング前の程度で直線的に進入するが、安定な状態においては、後悔は永続的な最適な腕を特定するのに必要な時間によって支配される。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:10:24 GMT)
Topological Signatures of Grokking [5.2] トポロジーのレンズを通してグラッキング現象を研究する。
永続ホモロジーは、表現学習の統一的幾何学的および位相的特徴を与える。
この結果から、持続的ホモロジーは、トレーニング中にニューラルネットワークが潜在構造をどのように分析するかを、原則的かつ解釈可能なフレームワークとして提供することが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:33:22 GMT)
Online Bayesian Calibration under Gradual and Abrupt System Changes [5.2] シミュレーションミスマッチと非定常性の下でのストリーミングデータに対するオンラインベイズ校正フレームワークを提案する。
本研究は, 段階的な進化と偽アラームの追跡, 再起動機構の検知動作を含む, 両コンポーネントの理論的保証を確立する。
人工および植物シミュレーションのベンチマークに関する実証研究により、BRPCは段階的な変化の下でキャリブレーション精度を向上する一方、再起動したBRPCは急激な状態変化下での堅牢性と予測性能をさらに向上することが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:29:18 GMT)
$\mathcal{B}^{3}$-Net: Controlled Posterior Bridge Learning for Multi-Task Dense Prediction [5.2] マルチタスク密度予測は、統一モデルにおいて相補的なピクセルレベルのタスクを解く。
既存のデコーダ側のインタラクションでは、アテンション、プロンプト、ルーティング、拡散、Mamba、ブリッジ機能を使ってタスクエビデンスを交換する。
マルチタスク密度予測のための後部ブリッジ学習フレームワークであるmathcalB3$-Netを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:11:12 GMT)
Convex-Geometric Error Bounds for Positive-Weight Kernel Quadrature [5.2] カーネル二次構造は、RKHSスペクトル構造を利用して、滑らかな積分子上でモンテカルロより優れている。
重みが正の制約を受ける場合, スペクトル加速が可能かどうかを検討した。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:50:55 GMT)
From Model to Data (M2D): Shifting Complexity from GNNs to Graphs for Transparent Graph Learning [5.2] モデルの複雑性をデータ空間に転送することで透明性を高める新しいフレームワークであるM2D(Model-to-Data)蒸留を導入する。
M2Dは教師モデルを拡張グラフに蒸留し、豊富な特徴と構造を持ち、単純な生徒が教師のパフォーマンスに合うようにする。
本研究は,M2Dが公平性目標や注意に基づくアグリゲーションなどのメカニズムを解釈可能な方法で明らかにし,性能を保ちながらGNN透過性を向上することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:16:21 GMT)
MELD: Multi-Task Equilibrated Learning Detector for AI-Generated Text [5.2] MELDはAI生成テキストのデプロイ可能な検出器で、補助的な監視によってバイナリ検出を強化する。
一般のRAIDリーダーボードでは、MELDは最強のオープンソース検出器である。
MELDは、ALD-evalで1%のFPRで99.9%のTPRを達成するが、多くのベースラインは急激に低下する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:05:38 GMT)
Which Are the Low-Resource Languages of the Semantic Web? [5.1] リンクされたオープンデータ知識グラフ間の言語分布を解析する手法を提案する。
本稿では,DBpedia,BabelNet,Wikidataをベースとした事前多段階分類を提案する。
この分類は、低言語、高言語、中言語の形式的な定義をもたらすために活用される。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:33:19 GMT)
Weblica: Scalable and Reproducible Training Environments for Visual Web Agents [5.1] Weblicaは再現可能でスケーラブルなWeb環境を構築するためのフレームワークである。
さまざまな環境やタスクにRLトレーニングを拡大しています。
私たちのベストモデルであるWeblica-8Bは、複数のWebナビゲーションベンチマークで同じサイズのオープンウェイトベースラインを上回っています。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:17:10 GMT)
Continual Knowledge Updating in LLM Systems: Learning Through Multi-Timescale Memory Dynamics [5.1] 我々は、外部記憶は生物学的記憶と同様の原理に従うべきだと主張している。
Meminiでは、この見解は、知識を有向グラフとして整理する連想記憶の形を取る。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:27:04 GMT)
End-to-End Neural and Quantum Transcoding for Compressed Latent Representation under Channel Noise [5.1] 伝統的な符号化方式は量子状態の知識に関する非現実的な要求を課している。
提案手法は,ニューラルネットワークに基づくデータ圧縮とColesky分解に基づく量子符号化を統合し,全密度行列再構成をバイパスする。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:14:23 GMT)
Extracting Search Trees from LLM Reasoning Traces Reveals Myopic Planning [5.0] 大規模言語モデル(LLM)は、将来の結果に対する明確な議論を含む拡張チェーン・オブ・シント(CoT)推論を生成する。
本研究では,4対1のボードゲームにおいて,探索木を推論トレースから抽出し,定量化することにより,LSM計画の特徴付けを行う新しい手法を提案する。
LLMの探索は人間より浅く, 深度よりも幅の広い探索により予測できることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:45:46 GMT)
How Well Do LLMs Perform on the Simplest Long-Chain Reasoning Tasks: An Empirical Study on the Equivalence Class Problem [5.0] 我々は,最も単純な長鎖推論タスクにおいて,大規模言語モデルの性能を評価する。
非推論モデルはECPに失敗するが、推論モデルは大幅に改善されているが、この問題を完全に解くのに苦戦している。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:31:43 GMT)
NeuroAgent: LLM Agents for Multimodal Neuroimaging Analysis and Research [5.0] NeuroAgentは、ニューロイメージングデータのキー前処理と分析ステップを自動化するエージェントフレームワークである。
自然言語クエリによるインタラクティブなダウンストリーム分析をサポートする。
これにより、前処理に必要な手作業の削減と、エンドツーエンドの自動分析パイプラインの実現が可能になる。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:13:48 GMT)
A Comparative Study of INDI and NDI with Nonlinear Disturbance Observer for Aerial Robotics [5.0] トラッカー性能,ロバスト性,制御労力,パラメトリック変動,外乱,測定ノイズの比較を行った。
INDIはいくつかのモデルミスマッチと複合ストレスケースにおいて強い堅牢性を示す。
NDI+NDOは主に名目性能に適合するが、いくつかの非理想的条件下では感度が高い。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:00:44 GMT)
VISD: Enhancing Video Reasoning via Structured Self-Distillation [4.9] 複雑な推論のためのビデオLLMの訓練は、レベルレベルの報酬の順序と、長期的、時間的基盤の推論軌道上のきめ細かいクレジット割り当ての欠如により、依然として困難である。
ビデオ推論のための診断に意味のある特権情報を導入した自己蒸留フレームワークであるVISDを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:13:15 GMT)
Grokking or Glitching? How Low-Precision Drives Slingshot Loss Spikes [4.9] ディープニューラルネットワークは、非正規化された長期トレーニング中に周期的な損失スパイクを示す。
本稿では,この現象が浮動小数点演算の精度限界の結果であることを示す。
我々はこのメカニズムがスリングショットのスパイク前の急激なノルム成長を説明できることを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:45:21 GMT)
Beyond the Wrapper: Identifying Artifact Reliance in Static Malware Classifiers using TRUSTEE [4.8] 現代のサイバーセキュリティは、静的機械学習ベースのマルウェア分類器に大きく依存している。
実行ファイルに適用されるパッキングやその他の非セマンティックな修正は、その信頼性を制限する。
本稿では,ポストホック解釈性XAIツールTRUSTEEを用いた2部フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:24:36 GMT)
Multi-Objective Constraint Inference using Inverse reinforcement learning [4.8] 多目的制約推論(Multi-Objective Constraint Inference、MOCI)は、異種専門家の軌跡から共有制約と個人の嗜好を共同で抽出するように設計された新しいフレームワークである。
MOCIは、多様で潜在的に矛盾する振る舞いから効果的にモデル化し、学習する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:09:09 GMT)
Multi-Objective Multi-Agent Bandits: From Learning Efficiency to Fairness Optimization [4.8] マルチオブジェクトマルチエージェントマルチアームバンド (MO-MA-MAB) について, エージェントがヘテロジニアスな報酬ベクトルを観測し, 時間変動グラフを介して通信する報奨条件下で検討する。
我々は,この新たな課題を,パレートの後悔によって測定された,非効率な学習に対処するために定式化し,社会福祉を通じて獲得した新たな目標として,エンフェアラーニングを取り入れた。
フェアネス制約を表現するために、選好スカラー化された報酬よりもナッシュ社会福祉目標を定式化し、嗜好に基づく報酬シミュレーション、ゴシップを統合したテキストSimulated NSW UCB Gossipを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:06:34 GMT)
More Is Not Always Better: Cross-Component Interference in LLM Agent Scaffolding [4.7] LLMエージェントシステムは、コンポーネント(計画、ツール、メモリ、自己回帰、検索)を積み重ねて構築される
We run a full factorial experiment on all 25=32 subsets of five components on HotpotQA and GSM8K with Llama-3.1-8B/70B conditions。
シングルツールエージェントのHotpotQAは、All-Inを32%上回る(F1 0.233 vs 0.177, p23)。
以上の結果から,最大装備エージェントは相互作用認識分析によりサブセット選択に置き換えるべきであることが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:01:43 GMT)
Decodable but Not Corrected by Fixed Residual-Stream Linear Steering: Evidence from Medical LLM Failure Regimes [4.7] 隠れ状態における線形デオード可能な故障信号が、それらの故障を修正するために活用できるかどうかを検討する。
固定されたリニアステアリングファミリーが修正に利用できない場合でも、デオード可能な故障構造がポストジェネレーションの信頼性評価をサポートすることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:58:38 GMT)
On the Emergence of Pendular Structure in Multi-Contact Locomotion [4.7] LIPMは足の移動制御には至る所で使われていますが、コントローラーのコストが実際に好むものよりも、ほとんど常にモデリングの選択肢として使われています。
このメモは、そのリンクをより明確にしようとする。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:52:43 GMT)
GeoStack: A Framework for Quasi-Abelian Knowledge Composition in VLMs [4.7] 独立して訓練されたドメインエキスパートを統一されたモデルに構成できるモジュール型フレームワークであるGeoStackを紹介します。
定数時間推論複雑性を実現する重み付け特性を数学的に示す。
多分野適応とクラス増分学習にまたがる実験結果から,GeoStackは長期的知識構成に効率的なメカニズムを提供することが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:01:59 GMT)
Affine Subcode Ensemble Decoding for Degeneracy-Aware Quantum Error Correction [4.5] 安定化器符号のチェック行列に線形独立な行を付加することで、有効な解の探索スペースを削減できることを示す。
我々は、最近提案されたアフィンサブコードアンサンブル復号法を古典から量子環境へ拡張する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:43:32 GMT)
From Review to Design: Ethical Multimodal Driver Monitoring Systems for Risk Mitigation, Incident Response, and Accountability in Automated Vehicles [4.5] 本稿では,ドライバ監視システムに特化したモジュール型倫理設計フレームワークを提案する。
このフレームワークは、高レベルの原則を実行可能な設計とデプロイメントのガイダンスに変換する。
これらのコントリビューションは、透明で信頼性が高く、人間中心のドライバー監視システムの開発を知らせることを目的としている。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:40:17 GMT)
Distributional Spectral Diagnostics for Localizing Grokking Transitions [4.5] グラッキングでは、モデルはまずトレーニングデータに適合し、テスト精度は低いままであり、後に一般化し始める。
テスト精度が上昇する前に、この遷移が観察されたトレーニング軌跡から局所化できるかどうかを問うとともに、明確なしきい値/FPR/リードタイムトレードオフを持つ診断問題として、グラッキング遷移局所化を定式化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:08:58 GMT)
The Role of Node Features in Graph Pooling [4.5] グラフプーリングは一般的にグラフ分類に適用されるが、その経験的ゲインはしばしば限界的あるいは矛盾する。
解析の結果,プーリング演算子はグラフのトポロジに整合したノード機能を必要とすることがわかった。
私たちの経験的評価は、これらの要件が満たされると、プーリングが有用になり、適切なデータセットのパフォーマンスが向上することを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:27:48 GMT)
One Operator for Many Densities: Amortized Approximation of Conditioning by Neural Operators [4.4] 確率的条件付け(probabilistic conditioning)は、確率変数$X$の確率変数$Y$の分布の同定に関するものである。
本稿では,任意の関節密度を条件にマッピングする単一演算子を同定し,条件付け問題を解くことを提案する。
我々の証明は、条件付き作用素の連続性を確立するための新しい結果に依存している。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:18:36 GMT)
Automated Clinical Report Generation for Remote Cognitive Remediation: Comparing Knowledge-Engineered Templates and LLMs in Low-Resource Settings [4.4] 本稿では,アバター誘導型ホームベース認知修復セッションの低リソース環境における自動臨床報告生成について検討する。
本稿では,(1)言語治療領域の知識を明示的な決定規則として符号化するルールベースのテンプレートシステムと,(2)より流動的で簡潔な出力を目的としたゼロショットLCMベースのアプローチ(GPT-4)を提案する。
結果,臨床信頼性と言語学的品質の間には明確なトレードオフがみられ,GPT-4はより簡潔なアウトプットを生み出す一方,テンプレートベースシステムは流動性,コヒーレンス,結果提示により高いスコアを付けた。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:20:22 GMT)
When Descent Is Too Stable: Event-Triggered Hamiltonian Learning to Optimize [4.4] 固定予算の非最適化は、局所的な降下が安定すぎるため失敗する可能性がある。
本稿では,イベントトリガーによるミニマハンティングのためのアダプティブHamilton的タスクファミリーについて紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:10:48 GMT)
When Language Overwrites Vision: Over-Alignment and Geometric Debiasing in Vision-Language Models [4.3] VLM(Vision-Language Models)は、より強力な高感度アプリケーションである。
定期的に幻覚を呈し、入力に存在しない内容について自信を持って記述する。
これらの障害モードを幾何学的オーバーアライメントにトレースする。
本稿では,トレーニングフリー推論戦略とバイアス対応微調整パラダイムの2つの補完策を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:09:18 GMT)
Locally Near Optimal Piecewise Linear Regression in High Dimensions via Difference of Max-Affine Functions [4.3] 本稿では,Adaptive Block Gradient Descent (ABGD) アルゴリズムによる線形回帰の解を提案する。
この方法の心臓は、極大ファイン関数の差分として片方向線型関数のパラメトリゼーションである。
我々は,実世界のデータセットにおける最先端手法と比較して,競争性能を観察する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:23:54 GMT)
Towards Self-Explainable Document Visual Question Answering with Chain-of-Explanation Predictions [4.3] Document Visual Question Answering (DocVQA) では、ドキュメント内のどの情報が質問に関連するのかだけでなく、どの回答がページ上に根拠付けられているのかを視覚言語モデルで判断する必要がある。
本稿では,自己説明可能なDocVQAフレームワークであるCoExVQAを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:42:23 GMT)
When Can Voting Help, Hurt, or Change Course? Exact Structure of Binary Test-Time Aggregation [4.3] 投票は, 被検者ごとの正当性確率の潜伏分布に支配されていることを示す。
投票によって回収された正確なオブジェクトは、署名された投票署名である。
この視点は、形状現象、枝対称の非識別性、実現可能性、変動、および終端率を説明する。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:21:38 GMT)
Two Calls, Two Moments, and the Vote-Accuracy Curve of Repeated LLM Inference [4.3] 条件-i.d.呼び出しの繰り返しLLM推論における二項正当性層について検討した。
固定された多数決投票の予算は、鋭い分布のない2つの呼び出し間隔を持つ。
QNLI と QQP に対する LLM の呼出実験により, 投射した2発呼領域に3発と5発の発声アキュラシーが含まれていることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:23:28 GMT)
TouchDrive: Electronics-Free Tactile Sensing Interface for Assistive Grasping [4.3] 我々は、低コストで電子不要な触覚センシングインタフェースであるTouchDriveを紹介した。
TouchDriveは、バルブ経由のスイッチングを通じて、接触力を直接空気フィードバックに変換する。
システムは空気圧式通常閉弁、圧縮空気タンク、センサー素子、電子機器を使わずに触覚フィードバックアクチュエータを使用することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:35:22 GMT)
Multi-Axis Speech Similarity via Factor-Partitioned Embeddings [4.2] 本稿では,各発話を1つのベクトルにマッピングする因子分割埋め込みフレームワークを提案する。
共有音響エンコーダは、それぞれ専門教師の蒸留により訓練された軸方向の線形投影ヘッドを供給している。
我々は、ハーバードの文プロンプトを共有するコーパス上でのクロスコーパス検索を評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:11:56 GMT)
Information-Preserving Domain Transfer with Unlabeled Data in Misspecified Simulation-Based Inference [4.1] シミュレーションベース推論(SBI)は、明示的な確実性評価を必要とせず、シミュレータ生成データからアモータイズされたベイズパラメータ推論を提供する。
SBIは、実世界の観測が訓練に使用されるシミュレータによってうまく表現されていないモデルミススペクテーションの下で分解することができる。
本研究では,パラメータ関連情報保存ドメイン転送を行うSBIフレームワークSPINを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:06:53 GMT)
Criticality and Saturation in Orthogonal Neural Networks [4.1] ネットワーク統計の有限幅展開に現れるテンソルに対して、明示的な階層的再帰関係を導出する。
我々は, 有限幅テンソルの安定性を再現し, 固定点が消滅した活性化関数に対して観測した。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:57:59 GMT)
FedFrozen: Two-Stage Federated Optimization via Attention Kernel Freezing [4.1] 不均一なクライアントによるフェデレーション学習は、ディープラーニングにとって依然として重要な課題である。
近年の研究では、トランスフォーマーベースのアーキテクチャは、異種訓練における従来のモデルよりも本質的に堅牢である可能性が示唆されている。
我々はFedFrozenを提案する。これは2段階のフェデレーション最適化フレームワークで、まずフルモデルウォームアップトレーニングを行い、その後、値ブロックを最適化しながらクエリ/キーブロックを凍結する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:44:40 GMT)
Better Protein Function Prediction by Modeling Survivorship Bias [4.1] Evo-PUは、ヌクレオチド変異の科学的理解を用いて、単一微生物配列データに対する生存バイアスをモデル化する学習フレームワークである。
Evo-PUは、単一有機体の一様被覆監視データを用いた3つの予測タスクにおいて、標準PU学習、一級分類、タンパク質言語モデルより優れている。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:26:38 GMT)
Matrix-Valued Optimism is Matrix-Valued Augmentation: Additive Hybrid Designs for Constrained Optimization [4.1] 拡張ラグランジアンおよび楽観的な原始-双対法は、一見異なるメカニズムを通して等式制約付き最適化を安定化させる。
近年の研究では、これらのメカニズムはスカラーパラメータと等価であることが示されている。
対称行列パラメータに対して、理想的原始軌道は補正行列にのみ依存する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:39:22 GMT)
Delulu: A Verified Multi-Lingual Benchmark for Code Hallucination Detection in Fill-in-the-Middle Tasks [4.1] コード生成のための大規模言語モデルは、Fillin-theMiddle (FIM)タスクにおいて幻覚を頻繁に生成する。
Deluluは、7つの言語と4つの幻覚型で1,951個のFIMサンプルを検証した多言語ベンチマークである。
0.5B-32Bパラメータにまたがる5つのファミリーから,11個のオープンウェイトFIMモデルを評価した。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:12:00 GMT)
Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion [4.1] 本稿では, 離散拡散ノイズプロセスの新たな改良である, ゲルムリン吸収拡散を導入する。
菌根拡散は菌根残基の予測精度を26%から46%に改善することを示した。
そこで本研究では,疎水性と結合親和性を予測したサンプリング抗体の条件付き生成タスクにおける生殖細胞拡散モデルの有用性を実証した。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:57:42 GMT)
Accurate Trajectory Tracking with MPCC for Flapping-Wing MAVs [4.1] 羽ばたきの小型航空機はロータリーウィングのドローンよりも静かで安全な操作を提供する。
従来のカスケードコントローラーは、高度、速度、方向を独立して扱い、永続的な追跡エラーを発生させる。
本稿では,鳥型オルニトプターの圧倒的な結合を捉える,コンパクトで連続的な微分可能なモデルを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:31:34 GMT)
Learning Material-Aware Hamiltonian Risk Fields for Safe Navigation [4.0] 政策は、局地的な状況がよりリスクの低い行動を認める場合にのみ、回避可能な自由度を公開するべきである。
ポート・ハミルトンの航法方針に1つの文脈エネルギー項を加えると、このファルサブルなシグネチャを持つ学習力チャネルが生成されることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:33:34 GMT)
How Fast Should a Model Commit to Supervision? Training Reasoning Models on the Tsallis Loss Continuum [4.0] RLVR と log-marginal-likelihood を補間する統合損失ファミリ J_Q$ を示す。
すべてのメンバは、学習率とは独立して各インスタンスを再重み付けするインスタンス毎の$P_q$でのみ異なる、サンプル毎の勾配方向を共有する。
J_Q$連続体上の固定値q$を直接最適化する2つのモンテカルロ推定子を、注釈付き有理数なしで導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:16:40 GMT)
Distributionally-Robust Learning to Optimize [4.0] 我々の枠組みは2つの極端を統一する:半径が消えると古典的な学習を回復して最適化する(L2O)。
我々は、学習アルゴリズムの真のリスクが、サンプルサイズに応じて縮小するスラックと、少なくともサンプル内L2O最適値であることを示す高確率境界を証明した。
学習したアルゴリズムは、ロバスト性が高く、最悪のケースの最適とバニラのL2Oベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:14:15 GMT)
Patch2Vuln: Agentic Reconstruction of Vulnerabilities from Linux Distribution Binary Patches [3.9] 本稿では,ローカルバイナリ由来の証拠に制限された言語モデルエージェントが,Linuxディストリビューション更新のセキュリティ意味を再構築できるかどうかを問う。
Patch2Vulnは、古い/新しいELFペアを抽出し、GhidraとGhidriffと拡散し、機能の変更をランク付けし、候補ドシエを構築し、オフラインエージェントに予備監査を生成する、ローカルで再利用可能なパイプラインである。
Patch2Vuln on 25 Ubuntu.deb package pairs: 20のセキュリティアップデートペアと5つの負のコントロール。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:22:22 GMT)
GPU-Accelerated Synthesis of Mixed-Boolean Arithmetic: Beyond Caching [3.9] 本稿では,キャッシュレスボトムアップ列挙を中心に構築されたGPUアクセラレーション型MBAシンセサイザーSIMBAを提案する。
実験では、SIMBAは従来のMBA合成ツールよりもかなり高速で、より大きな仕様を処理し、既存の手法では解決できなかった表現サイズに達する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:10:17 GMT)
Price of Fairness in Short-Term and Long-Term Algorithmic Selections [3.9] 意思決定者が繰り返し個人を選択するようなスタイル化された逐次選択問題について検討する。
この緊張に触発され、フェアネスの価格を通じてフェアネスとユーティリティのトレードオフを研究する。
低PoFを実現するための単純な投資方針の下では、長期的な格差が消滅する可能性があることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:20:15 GMT)
Scaling the Queue: Reinforcement Learning for Equitable Call Classification Capacity in NYC Municipal Complaint Systems [3.8] 我々は、ニューヨーク市のビルディングス部門にまたがる分類能力を強化する、株式中心の強化学習フレームワークを開発する。
エージェントはインテリジェントな取り込みルータとして機能し、受信した苦情をアクションカテゴリに割り当てることを学ぶ。
ポストホックSHAPの帰属は、苦情の再発と近隣レベルの統計が、原告数よりも行動可能な違反の予測因子が強いことを明らかにしている。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:06:21 GMT)
PREFER: Personalized Review Summarization with Online Preference Learning [3.8] 現在のeコマース要約システムは、異なるユーザが異なる製品特性に関心を持っているという事実を説明できない、汎用的で静的な要約を生成する。
ユーザ毎にパーソナライズされた要約を生成するオンライン学習フレームワークを提案する。
本システムでは,生成した要約から直接フィードバックを組み込むことで,ユーザの好みに対する理解を反復的に改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:20:47 GMT)
A Testable Certificate for Constant Collapse in Teacher-Guided VAEs [3.8] 変異型オートエンコーダの後方崩壊は、しばしばその症状によって診断される。
本研究では, 具体的故障モード, 入力非依存定数崩壊について検討し, 正確なしきい値が認められたことを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:48:41 GMT)
LLM-Guided Open Hypothesis Learning from Autonomous Scanning Probe Microscopy Experiments [3.8] シンボル回帰と大規模言語モデルに基づく物理評価を組み合わせたオープンな仮説学習フレームワークを提案する。
本稿では,PZT薄膜における強誘電体ドメインスイッチングの自律型圧電力顕微鏡による計測について述べる。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:44:46 GMT)
Physical Fidelity Reconstruction via Improved Consistency-Distilled Flow Matching for Dynamical Systems [3.7] 本研究では,高速な科学的フロー再構成のためのコンパクトなワンステップモデルに高忠実なフローマッチング生成モデルを圧縮できるかどうかを考察する。
提案手法は, 最適流路整合型教師を1ステップの整合性モデルに抽出する。
輸送路沿いのノイズ観測から生成軌道を初期化することにより,低忠実度観測を推論時に組み込む。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:20:50 GMT)
R2H-Diff: Guided Spectral Diffusion Model for RGB-to-Hyperspectral Reconstruction [3.6] RGB-to-HSI再構成に適した効率的な拡散ベースフレームワークであるR2H-Diffを提案する。
R2H-Diffは、条件付き反復精製プロセスとしてスペクトル回復を定式化し、RGB誘導の下で進行的再構成を可能にする。
NTIRE2022、CAVE、Harvardの実験では、R2H-Diffは再構成品質と計算効率のバランスが良好であることを実証している。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:28:12 GMT)
More Than Can Be Said: A Benchmark and Framework for Pre-Question Scientific Ideation [3.6] InciteResearchは、研究者の暗黙の理解を明示的で、検査可能で、実行可能なものにするために設計されたフレームワークである。
TF-Benchは暗黙的な研究支援のための最初のベンチマークである。
私たちの研究は、AIが単に下流の実行を自動化するのではなく、思考そのものの拡張として機能することを実証しています。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:30:03 GMT)
Why Does Agentic Safety Fail to Generalize Across Tasks? [3.6] AIエージェントは、テスト時に実行するタスクが指定されるマルチタスク設定にますますデプロイされ、エージェントは見えないタスクに一般化されなければならない。
実証的な証拠は、実行能力が目に見えないタスクに一般化しても、安全に実行できることは、頻繁に実行できないことを示唆している。
本稿では, エージェントセーフティの失敗が, 訓練方法の限界に起因しているだけでなく, 安全性自体の本質的な性質を反映していることを示す理論と実験について述べる。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:16:03 GMT)
BGM-IV: an AI-powered Bayesian generative modeling approach for instrumental variable analysis [3.6] 因果的に構造化された潜在空間において、非線形IV回帰を後部推論として再構成する潜在ベイズ生成モデルであるBGM-IVを提案する。
内在性を説明するために、BGM-IVは、確立された結果の確率を、計器による治療値よりも平均となるIV積分擬似リフタルに置き換える。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:18:01 GMT)
Sequential Design of Genetic Circuits Under Uncertainty With Reinforcement Learning [3.5] 両形態の不確実性の下で遺伝的回路を最適化するための逐次的枠組みを提案する。
本手法は,本質性を考慮した未知の実験条件に適応する実験を提案する。
異種遺伝子の発現モデルとリプレッシレータ回路について,分子ノイズとクロスラボラリティーの両方を効率的に扱えることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:49:07 GMT)
RepFlow: Representation Enhanced Flow Matching for Causal Effect Estimation [3.5] 医療、経済、社会政策など様々な分野において、観測データから因果効果を推定することがますます重要になっている。
既存の手法は主に点推定に限られており、分散モデリングの能力に欠ける。
本稿では、表現学習とフローマッチングを組み合わせた共同最適化問題として因果効果推定を定式化する新しいフレームワークRepFlowを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:02:44 GMT)
Hardware-Aware Neural Feature Extraction for Resource-Constrained Devices [3.4] 我々は、リソース制約のあるデバイスのためのハードウェア対応のニューラル特徴抽出器であるGideonを紹介する。
ギデオンは1.5MBのメモリフットプリント以下で9.003msの推論時間を達成する。
Batch Normalizationをアフィン層に置き換えるなどのアーキテクチャ上の選択はINT8の堅牢性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:59:18 GMT)
A Residual-Based Quantum Linear System Algorithm with Dynamic Stopping and Applications to Elliptic PDEs [3.4] 量子線形システムアルゴリズム(QLSA)は、厳密な最悪のケースの複雑性を保証するが、そのランタイムは事前に仮定されたスペクトル情報から選択されることが多い。
ほとんどのQLSAは、古典的なものと異なり、特定のインスタンスがすでに収束しているかどうかを知らせる組み込みメカニズムを提供していません。
本研究では,残差を持つ拡張力学系を設計し,残差レジスタの測定によりオンザフライ収束インジケータが提供される。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:22:55 GMT)
YEZE at SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization via Heterogeneous Ensembling [3.3] XLM-RoBERTa-largeとmDeBERTa-v3-baseを組み合わせた多言語事前学習モデルの異種アンサンブルを提案する。
本研究では,多タスク学習,翻訳に基づくデータ拡張,クラス重み付けなどの手法を用いて,重度ラベルの不均衡下での分類性能の向上を図る。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:21:40 GMT)
XL-SafetyBench: A Country-Grounded Cross-Cultural Benchmark for LLM Safety and Cultural Sensitivity [3.3] XL-SafetyBenchは10の国語対にわたる5500のテストケーススイートである。
国に面した敵のプロンプトのジェイルブレイクベンチマークと、地元の感性が無害な要求に埋め込まれた文化ベンチマークで構成されている。
各アイテムは多段階パイプラインを通じて構築され、LSM支援の原則的発見、自動検証ゲート、国毎に独立したネイティブスピーカーアノテーションが組み合わされている。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:35:03 GMT)
STDA-Net: Spectrogram-Based Domain Adaptation for cross-dataset Sleep Stage Classification [3.3] STDA-Netは、スペクトログラムに基づく特徴抽出のための畳み込みニューラルネットワーク(CNN)、時間モデリングのためのaBiLSTMモジュール、ソース・ツー・ターゲット特徴アライメントのためのドメイン・逆ニューラルネットワーク(DANN)を組み合わせたフレームワークである。
その結果,提案フレームワークの平均精度は89.03%,マクロF1スコアは87.64%であった。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:10:00 GMT)
Secure Seed-Based Multi-bit Watermarking for Diffusion Models from First Principles [3.3] 透かし方式の有効性は、徹底的な理論的解析によって純粋に確立されるべきである。
これは、モデル依存部分を透かしシステムの実際の決定機構から切り離すことによって実現される。
本稿では,従来のシード方式を一般化した新しい透かし方式であるSSBを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:46:22 GMT)
E = T*H/(O+B): A Dimensionless Control Parameter for Mixture-of-Experts Ecology [3.3] E = T*H/(O+B) は、Mixture-of-Experts(MoE)モデルが健全な専門家生態を発達させるか、あるいは死んだ専門家に崩壊するかを予測する無次元制御パラメータである。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:23:35 GMT)
Reward Shaping and Action Masking for Compositional Tasks using Behavior Trees and LLMs [3.3] 強化学習は、エージェントポリシーを最適化してサブタスクを完了するために使用することができる。
最近の研究は、報酬形成とアクションマスキングを自動化するために、大きな言語モデル(LLM)を使用している。
マスク報酬行動木(MRBT, masking reward behavior tree)は,反応型およびモジュラー型報酬およびアクションマスク機能として使用されるシンボル構造である。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:33:08 GMT)
A collider as a quantum computer [3.3] 我々は、ヘリシティ遷移行列を量子回路として表現することで、プロセス自体のレベルでの散乱を再構成する。
このフレームワーク内では、プロセス $e+e-to +-$ の例が示され、単体および非単体コンポーネントに分解される。
この表現は振幅を異なる操作要素に再編成し、コライダー過程を制約量子回路と見なす視点を与える。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:15:42 GMT)
Unlocking High-Fidelity Molecular Generation from Mass Spectra via Dual-Stream Line Graph Diffusion [3.2] 2つの結合したサブプロブレムの交互解として分子グラフを復調するDualLGDを提案する。
NPLIB1とMassSpecGymのベンチマークでは、DualLGDは34.37%と23.89%という3倍の精度を達成している。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:56:02 GMT)
Retina-RAG: Retrieval-Augmented Vision-Language Modeling for Joint Retinal Diagnosis and Clinical Report Generation [3.1] Retina-RAGは、糖尿病網膜症(DR)の重症度、黄斑浮腫(ME)の検出、レポート生成を共同で行う、低コストなモジュラーフレームワークである。
検索拡張生成(RAG)モジュールは、構造化分類器出力とともに硬化した眼科知識を注入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:54:53 GMT)
Benchmarking Large Language Models for IoC Recovery under Adversarial Code Obfuscation and Encryption [3.1] 本稿では,逆コード変換におけるシークレット検出のベンチマークを紹介する。
我々は,12レベルの難読化と暗号隠蔽を段階的に変換した336プログラムのデータセットを構築した。
LLMは軽量な変換に対して高い成功を収める一方で、暗号ベースの隠蔽は検出性能を著しく低下させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:18:17 GMT)
Architecture Shape Governs QNN Trainability: Jacobian Null Space Growth and Parameter Efficiency [3.1] トレーニング容易性はアーキテクチャ形状が$(N,L)$で,固定$E$で大きく変化することを示す。
ヤコビアン$J$と一致する係数の構造的階数不足をその原因となるメカニズムとして同定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:52:45 GMT)
Quantum Kernels for Audio Deepfake Detection Using Spectrogram Patch Features [3.1] メルスペクトルから量子状態への局所的な時間周波数パッチを符号化する,音声に合わせた量子機能マップQ-Patchを提案する。
制御されたバランスの取れたプロトコルを用いて、音声スプーフィング検出タスクにおけるQ-Patchを評価し、サイズマッチングされた古典的ベースラインと比較する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:26:01 GMT)
A Geometry-Aware Residual Correction of Hagan's SABR Implied Volatility Formula [3.1] 本稿では,SABR(Stochastic Alpha Beta Rho)インプットボラティリティの近似性を改善するためのハイブリッド手法を提案する。
この手法は、SABRモデルの微分方程式から導かれる幾何学的特徴を持つニューラルネットワーク入力表現を強化する。
この補正は、基盤となるモデルと軽量で構造的に整合しているため、実際の取引環境でのリアルタイムの価格設定とキャリブレーションに適している。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:22:39 GMT)
Probing critical phases in quasiperiodic systems via subsystem information capacity [3.0] 準周期系の拡大・臨界・局所化相における絡み合いのダイナミクスについて検討する。
臨界相は拡張相と局所相に欠如する空間的不均一性を示す。
その結果,SICは臨界位相を診断し,マルチフラクタル構造を基盤とするボトルネック接続を明らかにするための強力な実空間プローブとして確立された。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:59:31 GMT)
CircuitFormer: A Circuit Language Model for Analog Topology Design from Natural Language Prompt [3.0] 本稿では,31,341のネットリスト-自然言語記述ペアからなる,アナログ回路網リストのアノテートデータセットについて述べる。
また,頻繁なサブ回路を明示的にマイニングすることで,ネットリスト接続性を符号化する新しい回路グラフトークンであるCircuit Tokenizer (CKT)を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:04:36 GMT)
Variational Smoothing and Inference for SDEs from Sparse Data with Dynamic Neural Flows [3.0] 本研究では, 部分的に観測された系における後方微分方程式(SDE)の平滑化手法を開発した。
我々は、支配的PDEと観察誘発ジャンプ条件の両方を満たすために訓練されたニューラルネットワークを用いて、この条件スコアを学習する。
得られたスコアは、同じ拡散係数を持つ後部SDEを誘導するが、修正されたドリフトを誘導し、効率的な後部軌道を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:47:06 GMT)
Realistic Simulation of Quantum Repeater with Encoding and Classical Error Correction [3.0] 我々はSeQUeNCeの符号化と古典的誤り訂正プロトコルを用いて量子リピータを実装し,シミュレーションする。
このプロトコルは論理ベル対を分散し、エンコードエンタングルメントスワップを行い、エンタングルメントスワップ計測結果の復号に古典的誤り補正を用いる。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:38:19 GMT)
XiYOLO: Energy-Aware Object Detection via Iterative Architecture Search and Scaling [3.0] 不均一エッジデバイスにおけるオブジェクト検出は、下流の自律性に対する信頼性の高い認識を提供する一方で、厳格なエネルギー、レイテンシ、メモリ制約を満たす必要がある。
既存のエネルギー対応NAS手法は、限られた配置設定を目標とするものが多いが、実エネルギーはデバイスに依存し、測定にコストがかかるため、最適化が困難である。
これらの課題に,エネルギーを意識したXiResOFA探索空間と2段階エネルギー推定器と,エネルギー効率のよい1つのベースアーキテクチャを特定する反復探索を組み合わせた,エネルギー適応型フレームワークで対処する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:38:06 GMT)
Weight-Decay Turns Transformer Loss Landscapes Villani: Functional-Analytic Foundations for Optimization and Generalization [3.0] 本稿では,標準トランスフォーマーの目標-エントロピー損失を$L2$正規化した,厳密な機能解析手法として初めて提供する。
正規化損失 $mathcalF$ は無限微分可能であり、少なくとも二次的に成長し、ガウス積分可能な尾を持ち、微分成長条件 $-mathcalF + tfrac1s|nablamathcalF|2 を満たす。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:22:19 GMT)
Stability of the Monge Map in Semi-Dual Optimal Transport [3.0] 最適輸送問題の半二重定式化は, 縮退したサドル点構造を有することを示す。
双対ポテンシャルの最適性を必要とせず、モンジュ写像の収束に必要な十分条件を導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:22:20 GMT)
An extremely coarse feedback signal is sufficient for learning human-aligned visual representations [3.0] 学習信号の粗さが人間の視覚との表現的アライメントをどのように形成するかを検討する。
これらの粗い分類タスクに基づいて、畳み込みアーキテクチャとトランスフォーマーアーキテクチャをまたいだ数百のニューラルネットワークをトレーニングします。
訓練されたネットワークは、1000クラスのモデルのニューラルアライメントと一致するか、あるいは超えている表現を、最大8つのワイドカテゴリで学習する。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:02:21 GMT)
Render, Don't Decode: Weight-Space World Models with Latent Structural Disentanglement [2.9] 補助座標に基づく暗黙的ニューラル表現(INR)の重みとバイアスとしてシステム状態を表す世界モデリングフレームワークNOVAを紹介する。
この構造化された表現は解析的にレンダリングされ、コンパクト性、可搬性、ゼロショット超解像を参照しながらデコーダのボトルネックを解消する。
当社のフレームワークは、いくつかの挑戦的なデータセット上で検証し、$sim$40Mパラメータで単一のコンシューマGPU上で運用しながら、強力な制御可能な予測を実現しています。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:02:00 GMT)
Learning to Cut: Reinforcement Learning for Benders Decomposition [2.9] 本稿ではニューラルネットワークベースのポリシーを用いてカットを適応的に選択するフレームワークであるBD(Reinforcement Learning for BD)を提案する。
2段階の電気自動車充電ステーション位置問題に対する提案手法の評価を行い,バニラBDとLearnBDとの比較を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:26:13 GMT)
Is One Layer Enough? Understanding Inference Dynamics in Tabular Foundation Models [2.8] 本研究は,6種類のテクスチャ内テキスト学習モデルにおける階層的力学の大規模研究である。
以上の結果から,複数のモデルにまたがる奥行きの冗長性が示唆された。
本稿では,従来のモデルのパラメータの20%しか使用せず,同等の性能を実現した概念実証ループ単一層モデルを設計する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:22:04 GMT)
ChartZero: Synthetic Priors Enable Zero Shot Chart Data Extraction [2.8] 合成先行情報を活用する解析フレームワークであるChartZeroを導入し,ロバストなゼロショットチャートデータ抽出を実現する。
我々は,Global Orthogonal Instance (GOI) の損失によって曲線の断片化を克服し,不安定な空間ルールをオープン語彙であるVLM(Vision-Language Model)に置き換える。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:57:48 GMT)
Decentralized Conformal Novelty Detection via Quantized Model Exchange [2.8] 異種複合ヌル分布における大域的偽発見率(FDR)制御による新規性検出について検討した。
本稿では,量子化サロゲートモデルの交換に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:46:42 GMT)
Requests of a Feather Must Flock Together: Batch Size vs. Prefix Homogeneity in LLM Inference [2.8] 大規模言語モデルにおける自動回帰トークン生成には、すべての前のトークンのキーと値テンソル(KVキャッシュ)を"到着"する必要がある。
以前の作業は、複数のリクエストを合わせて、このデコードプロセスの効率を改善することを目的としていた。
高速なプレフィックス検出と効率的な要求選択を可能にする軽量なデータ構造であるChunked Hash Tree(CHT)を紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:34:10 GMT)
Adversarial procurement in blockchains [2.7] 新たなブロックチェーンプロトコル設計パターンは、タスクの実行と検証における計算作業の非対称性を活用する。
我々はこれをメカニズム設計の質問として定式化する。
最適プロトコルの喪失は、ネットワークの逆数でスケールアップされた生活障害のコストで対数的にスケールすることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:08:10 GMT)
Exploring the "Banality" of Deception in Generative AI [2.7] Simone Natale氏は、生成的AI体験の騙しを通じて推論するレンズとして、禁止性を探る。
我々は、この視点が、生成的AIインタラクションにおける騙しからユーザーを守るために摩擦を導入する将来の作業に繋がると論じている。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:49:55 GMT)
Who Prices Cognitive Labor in the Age of Agents? A Position on Compute-Anchored Wages [2.6] AIエージェントの経済性に関する自然な直感は、エージェントをほぼゼロの限界コストで複製できるので、無限に弾性的な供給で労働入力を構成することである。
我々は、このフレーミングはメカニズムでは間違っているが、結論では部分的に正しいと論じ、補正は理論と政策の両方において重要であると論じている。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:03:29 GMT)
Federation of Experts: Communication Efficient Distributed Inference for Large Language Models [2.6] 本稿では,FoE(Federation of Experts)アーキテクチャについて紹介する。
FoEはトランス層のMoEブロックを複数のMoEクラスタに再構成する。
LongBenchでは、FoEは推論のスループットとレイテンシを大幅に改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:12:41 GMT)
LLM Translation of Compiler Intermediate Representation [2.6] 本稿では,GIMPLE を LLVM IR に変換するための変換器モデル IRIS-14B を提案する。
我々の知る限りでは、IRIS-14BはIR-to-IR翻訳のために明示的に訓練された最初のモデルである。
現在入手可能な最先端のオープンモデルを含む、広く使われているモデルの精度は、13~1000億のパラメータから44ポイントまで向上している。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:22:23 GMT)
Light-FMP: Lightweight Feature and Model Pruning for Enhanced Deep Recommender Systems [2.6] ディープ・レコメンダ・システムは計算効率とモデルの精度のバランスをとる際にしばしば困難に直面する。
我々は、3つの重要なフェーズを通じて課題に対処する軽量なフレームワークであるEnhanced DRSのための軽量機能とモデルプルーニングを提案する。
実世界のレコメンデータシステムによるベンチマークデータセットの実験は、Light-FMPが既存の手法よりも効率と精度で優れていることを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:41:53 GMT)
A Novel Graph-Regulated Disentangling Mamba Model with Sparse Tokens for Enhanced Tree Species Classification from MODIS Time Series [2.5] 本稿では,木種分類の強化を目的としたグラフ制御分散マンバモデル(GDS-Mamba)を提案する。
カナダの2つの州(アルバータ州とサスカチュワン州)にまたがる大規模なMOD13Q1データを用いた実験では、全体の精度は93.94%に達した。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:53:47 GMT)
On Privacy Leakage in Tabular Diffusion Models: Influential Factors, Attacker Knowledge, and Metrics [2.4] この研究は、プライバシリークに対するトレーニング設定、合成選択、攻撃者の知識の影響を定量化する。
その結果、敵はトレーニング設定、同一データ分散、あるいは大量の計算資源について完全な知識を持っていなくてもよいことを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:42:35 GMT)
The Cost of Consensus: Malignant Epistemic Herding and Adaptive Gating in Distributed Multi-Agent Search [2.4] コーディネーションはタスク完了を支援するための信念を共有するために必要だが、通信は帯域幅を犠牲にし、遅延を導入し、もしうまく行わなければ、集合的推論を劣化させる可能性がある。
この緊張は、分散センシングネットワーク、自律偵察、協調サイバー防御など、帯域幅に制約のあるデプロイメントにおいて特に深刻である。
我々は、この区別を形式化し、Jensen-Shannon Divergence や、コンセンサスに対するレートのような調整指標だけでは検出できないことを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:07:25 GMT)
Frame Entrepreneurs in an AI Agent Community: Concentrated Identity-Claim Production on Moltbook [2.4] イベントタイプの投稿にはコメントが60パーセント追加されている。
26人の著者(11%)が強い主張をしている。
ステータス認識$to$脅威パターンは、独自性-脅威予測とテキスト的に一致している。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:24:55 GMT)
Criticality around the Spinodal Point of First-Order Quantum Phase Transitions [2.4] 量子臨界度は、準安定度が消失するFOQPTの量子スピノダール点付近に現れることを示す。
この研究は、FOQPT力学が通常、量子スピノダール点の周りの創発的臨界点によって支配されることを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:36:48 GMT)
An Aerial Manipulator for Perception-Driven Flower Targeting Toward Contactless Pollination in Vertical Farming [2.4] 自然汚染物質の減少は、制御された屋内農業における作物生産に大きな課題を生んだ。
本稿では, 垂直農業環境における花の検出, 局在化, アプローチのための空中マニピュレータプラットフォームを提案する。
提案システムは,PX4プラットフォーム上でのRGBDに基づく知覚,MPPIに基づく無人航空機(UAV)制御,および高精度エンドエフェクタ位置決めのための軽量2DoFマニピュレータを統合した。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:58:28 GMT)
CARD: A Multi-Modal Automotive Dataset for Dense 3D Reconstruction in Challenging Road Topography [2.4] CARDは、高速バンプ、ポットホール、不規則な表面、オフロードセグメントに富んだ連続したシーケンスにわたって、準高密度の3D地上真実を提供する駆動データセットである。
センサースイートには、同期されたグローバルシャッターステレオカメラ、前後のLiDAR、LiDAR慣性オドメトリーからの6-DoFポーズ、ホイール毎の動きトレース、フルキャリブレーションが含まれています。
データセットはドイツとイタリアで110kmから4.7時間に及ぶ。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:59:26 GMT)
Neuromorphic visual attention for Sign-language recognition on SpiNNaker [2.4] 本稿では,アメリカ手話指先認識のためのエンドツーエンドのニューロモルフィックアーキテクチャを提案する。
システムは、オンラインの関心領域抽出のためのスパイク視覚的注意機構と、SpinNNakerニューロモルフィックプラットフォーム上に展開されるコンパクトなスパイクニューラルネットワークを統合する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:55:46 GMT)
Correcting heterogeneous diagnostic bias when developing clinical prediction models using causal hidden Markov models [2.3] 本稿では,差分診断遅延による予測モデルにおけるそのようなバイアスを補正する手法を提案する。
本研究のアプローチをシミュレーションデータで検証し,電子健康記録を用いた慢性腎臓病予測のケーススタディに適用した。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:43:47 GMT)
Evaluating Explainability in Safety-Critical ATR Systems: Limitations of Post-Hoc Methods and Paths Toward Robust XAI [2.3] 本稿では,安全クリティカルなATRシステムにおける説明可能性手法の構造化評価について述べる。
我々は、サリエンシベース、注意ベース、サロゲート・アプ・パッチを含む主要なXAIパラダイムを特定した。
我々は、急激な説明、摂動下での不安定性、視覚的に干渉する出力によって引き起こされる過度な信頼など、致命的な障害モードを導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:42:08 GMT)
HaM-World: Soft-Hamiltonian World Models with Selective Memory for Planning [2.3] HaM-Worldは、潜在状態を標準部分空間(q, p)と文脈部分空間(c)に分解する構造化世界モデルである。
4つのDeepMind Control Suiteタスクにおいて、HaM-WorldはAUC (117.9, +9.5%) の最高値に達し、長時間のロールアウトエラーを強いベースラインモデルの45%に減らし、3,5,7 MSEセルで11/12 kを獲得した。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:58:18 GMT)
The E$Δ$-MHC-Geo Transformer: Adaptive Geodesic Operations with Guaranteed Orthogonality [2.3] E$-MHC-Geo Transformerは、Manifold-Constrained Hyper-Connections (mHC)、Deep Delta Learning (DDL)、Cayley変換を統一する新しいアーキテクチャである。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:37:23 GMT)
Local distillation from Reed Muller codes unfolding [2.3] RuizらによるReed Muller蒸留工場の展開を一般化する。
距離4のZ安定化器の2次元局所配置と、距離4と距離7のZ安定化器の3次元局所配置を記述する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:55:33 GMT)
Enhancing Eye Movement Biometrics for User Authentication via Continuous Gaze Offset Score Fusion [2.3] 眼球運動バイオメトリックス(EMB)は、ユーザ認証と識別に主観的視線力学を使用する。
近年の深層学習に基づくEMBシステムは、時間的眼球運動の挙動をモデル化することにより、高い性能を達成する。
本研究は,既存の生体機能と組み合わせることで,連続視差オフセットが生体特性を向上させるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:12:20 GMT)
Fine-Tuning Small Language Models for Solution-Oriented Windows Event Log Analysis [2.2] 大規模言語モデル(LLM)は、イベントログ分析を約束しているが、高い計算要件、クラウドインフラストラクチャへの依存、セキュリティ上の懸念により、現実的なデプロイメントが制限されている。
小型言語モデル(SLM)は、特定の目的のために微調整され、ローカルにホストされる軽量な代替手段を提供する。
本稿では,特定のタスクを微調整したSLMが,イベントログ解析の実用的な代替手段として有効であるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:24:59 GMT)
Measuring Learning Progress via Gradient-Momentum Coupling [2.2] 本稿では,各サンプルの勾配が学習にどの程度有用かを示す信号として,GMC(Gradient-Momentum Coupling)を提案する。
制御された実験は、難易度ではなく、学習速度によってタスクを優先する信号を用いて、ノイズの堅牢性と創発的なカリキュラム学習を示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:26:50 GMT)
SPARK: Self-Play with Asymmetric Reward from Knowledge Graphs [2.2] 自己再生強化学習は、形式的に検証可能な構造を持つ領域で強い性能を示している。
多文書科学文献から統合知識グラフ(KG)を自動構築するフレームワークであるSPARKを提案する。
単一の小さな視覚言語モデル(sVLM)は、情報非対称性の下でプロポーラとソルバーの役割を、固定KGに対して交互に置き換える。
その結果、SPARKはフラットコーパスベースのセルフプレイベースラインよりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:51:36 GMT)
Enabling Unsupervised Training of Deep EEG Denoisers With Intelligent Partitioning [2.2] ウェアラブル脳波(EEG)は本質的に困難である。
ディープラーニング手法は、分解不要の脳波復調において有望であることを示す。
我々は,iPSDのためのインテリジェントパーティショニングを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:55:10 GMT)
A Differentiable Bayesian Relaxation for Latent Partial-Order Inference [2.1] 多くのランク付けおよびエージェントトレースデータセットは、その潜在構造が部分的に順序づけられているにもかかわらず、線形順序として記録される。
このようなトレースから潜在部分順序推論を微分可能緩和する。
我々は,ソフトトランジシティ,シャープリミットフロンティア回復,硬度への収束を証明した。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:47:41 GMT)
Randomness is sometimes necessary for coordination [2.1] 完全パラメータ共有は、同種エージェントのための協調型マルチエージェント強化学習(MARL)において標準である。
置換対称性の観測の下では、共有決定論的ポリシーは全てのエージェントに対して同一の作用分布を出力し、役割の分化を不可能にする。
本稿では,各エージェントがタイムステップ毎にスカラー乱数をサンプリングするクロスアテンションアーキテクチャであるDiamond Attentionを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:27:15 GMT)
Human-AI Co-Evolution and Epistemic Collapse: A Dynamical Systems Perspective [2.1] 人間と言語モデルは、使用、生成、再訓練のフィードバックループによってリンクされた結合された動的システムを形成する。
我々は,AIへの依存度の増加が,低ダイバーシティ,準最適均衡への移行をもたらすことを示す。
結果は、AIシステムの軌道はモデル設計だけでなく、人間とAIの共進化のダイナミクスによって形成されていることを示唆している。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:31:17 GMT)
Align3D-AD: Cross-Modal Feature Alignment and Dual-Prompt Learning for Zero-shot 3D Anomaly Detection [2.1] ゼロショット3D異常検出は、ターゲットカテゴリからのトレーニングデータにアクセスすることなく、異常を識別することを目的としている。
既存の手法は主に幾何学的手がかりを主に捉える多視点表現に3D観測を投影することに依存している。
本稿では,補助カテゴリからのRGBモダリティをクロスモーダルガイダンスとして活用する2段階統合フレームワークAlign3D-ADを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:24:44 GMT)
Ablation Removal of Transport-Blocking Defects in Surface-Electrode Ion Traps [1.9] QスイッチングNd:YAG 532nmパルスアブレーションレーザーを用いた表面電極イオントラップ装置上での輸送遮断欠陥のその場除去を実証した。
本研究は, 既往の閉塞領域における近接ユニット停止成功率を観察し, 許容範囲内にあるマイクロモーションレベルを測定した。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:13:26 GMT)
Knowledge Graphs, the Missing Link in Agentic AI-based Formal Verification [1.9] この研究は、仕様、RTL、フォーマルツールフィードバックから抽出された構造化中間表現(IR)から構築された検証中心の知識グラフ(KG)を構築する。
KGは要求、設計階層、信号、仮定、プロパティをリンクし、生成のためのトレース可能で設計上のコンテキストを提供する。
7つのベンチマーク設計による評価は、KGベースのコンテキスト検索が仕様からRTLのグラウンド化を改善し、コンパイル可能なSVAを一貫して生成することを示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:35:53 GMT)
New Bounds for Zarankiewicz Numbers via Reinforced LLM Evolutionary Search [1.9] Zarankiewicz number $textbfZ(m, n, s, t)$ は二部グラフ $G_m, n$ の辺の最大数である。
Zarankiewiczの3つの数値の正確な値が初めて決定される: $textbfZ(11, 21, 3, 3)=116$, $textbfZ(11, 22, 3, 3)=121$, $textbfZ()
論文参考訳(メタデータ) (Thu, 07 May 2026 02:22:17 GMT)
Beyond Task Success: Measuring Workflow Fidelity in LLM-Based Agentic Payment Systems [1.9] エージェント成功率(ASR)は、観測されたエージェントの実行シーケンスと期待されるエージェントの実行シーケンスを比較する軌跡-忠実度メトリックである。
ASRは18のLLMと90,000のタスクインスタンスにわたる階層型マルチエージェントシステム(HMASP)に適用される。
ASR診断によって誘導されるプロンプト改良と決定論的ルーティングガードは、大幅にTSRの改善をもたらす。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:50:26 GMT)
Detecting Changes in Causal Dependence with Kernels and Copulas [1.9] 金融市場では、市場指標が資産リターンに与える影響は、時間とともに因果的に変化する可能性がある。
本稿では,カーネルの平均埋め込みと条件付きコーパスの積分差に基づく量を提案する。
この量に対するほぼ直線時間推定器を提案し, 収束率を明示的に表した。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:46:13 GMT)
Active Learning for Communication Structure Optimization in LLM-Based Multi-Agent Systems [1.9] コミュニケーション構造最適化のためのアンサンブルに基づく情報理論タスク選択フレームワークを提案する。
提案手法は,候補タスクがグラフパラメータ上の分布をどの程度変化させるかによって,タスクのインフォメーション性を推定する。
本手法をエージェント攻撃による良質な設定と設定の両方で検証し、制約された計算予算下での通信構造最適化の有効性を実証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:48:43 GMT)
Parser agreement and disagreement in L2 Korean UD: Implications for human-in-the-loop annotation [1.8] 本稿では,第2言語(L2)韓国語形態素合成アノテーションのためのHuman-in-the-loopワークフローを提案する。
我々はまず,合意がアノテーションの正当性を判断するプロキシとして機能するかどうかを,独立した人的判断と比較することによって評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:39:04 GMT)
From 124 Million Tokens to 1,021 Neologisms: A Large-Scale Pipeline for Automatic Neologism Detection [1.8] 自動ネオロジズム検出のためのスケーラブルなモジュールパイプラインを提案する。
パイプラインは英語のReddit投稿5億2700万でインスタンス化されている。
124.6万個のユニークなトークンを抽出し、99.99%以上削減して1,021のネオロジズム候補を生成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:32:56 GMT)
Towards Scalable One-Step Generative Modeling for Autoregressive Dynamical System Forecasting [1.8] MeLISA(MeanFlow Long-Term In Spatiotemporal Consistency Autoregressive Models)
MeLISAは、ピクセル空間のMeanFlow上に構築された、潜伏のない自己回帰生成サロゲートである。
2つの高解像度ベンチマークで,コンパクトなUNetとスケーラブルなDiTflowを用いてMeLISAを評価した。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:41:47 GMT)
Relaxed Sparsest-Permutation Formulation for Causal Discovery at Scale [1.8] 構造回復には正確なコレスキー分解が不要であることを示す。
緩和された定式化のスケーラブルな実装を提供するスパース・コールスキーパイプラインであるSCOPEを紹介する。
合成データセットと実データセットの実験により、SCOPE は MEC の回復精度とかなり遅いベースラインとが一致していることが示された。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:20:29 GMT)
ProtoSSL: Interpretable Prototype Learning from Unlabeled Time-Series Data [1.8] ProtoSSLは、ラベルのない時系列データから解釈可能なプロジェクションベースのプロトタイプを学ぶための新しいフレームワークである。
ProtoSSLはラベルの効率を向上し、256のラベル付き例で、低データ方式での教師付きプロトタイプベースラインよりも優れていることを示す。
人間の評価研究において、ProtoSSLは、直接ラベル管理で学んだものよりも好意的に判断されるプロトタイプとプロトタイプベースの説明を生成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:01:18 GMT)
Coherence limitations of a Fourier-engineered $\cos(2\varphi)$ transmon qubit [1.8] 本質的に保護された超伝導量子ビットは、コヒーレンス時間を強化し、量子コンピューティングの応用に向けてハードウェアを前進させる、有望な経路である。
多接合超伝導回路におけるエネルギー相関係をフーリエ工学により実験的に実現した。
同様のエネルギースペクトルと雑音振幅を持つフラクソニウム量子ビットは、フラックスノイズの影響を受けにくく、干渉による保護スキームの鍵となる課題を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:50:52 GMT)
GlazyBench: A Benchmark for Ceramic Glaze Property Prediction and Image Generation [1.8] GlazyBenchはAIによるグラズデザインのための最初のデータセットである。
原材料から、色や透明といった後処理後の表面特性を予測し、これらの特性に基づいて、グリースの正確な視覚的表現を生成するという2つの主要なタスクをサポートする。
我々の実験は有望だが挑戦的な結果を示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:51:13 GMT)
AI CFD Scientist: Toward Open-Ended Computational Fluid Dynamics Discovery with Physics-Aware AI Agents [1.8] 我々は、計算流体力学のためのオープンソースのAI科学者であるAI CFD Scientistを紹介する。
文献に基づくアイデア、検証された実行、視覚に基づく物理検証、ソースコードの修正、図形による記述を単一の検査可能なワークフローで行うのは、これが初めてである。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:27:23 GMT)
Cognitive Agent Compilation for Explicit Problem Solver Modeling [1.7] 大規模言語モデル(LLM)は、チュータリング、フィードバック生成、コンテンツ生成に広く使用されているが、その広範な事前訓練により、制御可能な学習者に対する制約や代替品の不足が困難になる。
本稿では,認知エージェントコンパイル(Cognitive Agent Compilation, CAC)を提案する。
CAC は (i) 知識表現, (ii) 問題解決方針, (iii) 検証と更新規則を分離し, 境界問題の解法をより検査し, 編集しやすくすることを目的としている。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:40:50 GMT)
Safety Certification is Classification [1.7] 本稿では,軌道データの分類問題として安全性認証を扱うカーネル埋め込みフレームワークを提案する。
このフレームワークは、文献(例えば、バリア証明書、ロバストマルコフモデル)から確立されたアプローチを特別なケースとして仮定する。
直接推定器は、認証の地平線と非マルコフ条件とは独立に安定であることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:10:07 GMT)
SmellBench: Evaluating LLM Agents on Architectural Code Smell Repair [1.7] アーキテクチャコードはソフトウェアの保守性を損なうため、手作業で修理するのにコストがかかる。
本稿では,大規模言語モデルエージェントによる建築コードの臭いの修復に関する経験的評価について述べる。
SmellBenchは、嗅覚タイプ固有の最適化プロンプトを組み込んだタスクオーケストレーションフレームワークです。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:33:32 GMT)
Regulating Branch Parallelism in LLM Serving [1.7] 提案手法では,有意な入場が共有デコードステップを膨らませる一方で,保守的な固定キャップがスループットを抑えることを示す。
本稿では,余分な枝を余分な作業として扱うステップ単位の入場制御系TAPERを紹介する。
Qwen3-32Bでは、TAPERはIRP-Offよりも$1.77タイム、IRP-Eagerより$1.48タイム、そして95%以上のSLO獲得を維持した。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:23:32 GMT)
LINC: Decoupling Local Consequence Scoring from Hidden Matching in Constructive Neural Routing [1.7] 構成的ニューラルルーティングソルバは通常、デコーダコンテキストを候補埋め込みにマッチさせることで次のアクションをスコアする。
本稿では,決定論的一段階の結果を明示的に計算するデコーダ側候補決定アーキテクチャであるLINCを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:25:19 GMT)
A Reproducible Optimisation Protocol for Calibrating Prompt-Based Large Language Model Workflows in Evidence Synthesis [1.6] 本稿では、構造化エビデンス合成タスクにおけるプロンプトベース大規模言語モデル(LLM)の再現可能な校正ワークフローについて述べる。
この方法は、科学的タスクを定義するルールを、フレームをフレーム化し適用する変更可能なプロンプトハーネスから分離する。
ラベル付けされた例や参照された例、明示的なタスクメトリックに対する利用を最適化し、検査可能な成果物としてキャリブレーションされたワークフローを保存する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:55:07 GMT)
OmicsLM: A Multimodal Large Language Model for Multi-Sample Omics Reasoning [1.6] OmicsLMは、定量的オミクスプロファイルと自然言語の生物学的タスクを結びつける。
我々は、70以上のタスクタイプにまたがる550万以上の命令フォロー例でOmicsLMをトレーニングします。
我々はOmicsLMが直接表現プロファイルを使用でき、プロファイルレベルのタスクで特定のオミクスモデルと互換性があることを示した。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:27:11 GMT)
Medical Imaging Classification with Cold-Atom Reservoir Computing using Auto-Encoders and Surrogate-Driven Training [1.6] 医用画像分類のための中性原子貯水池計算に基づくハイブリッド量子古典パイプラインを提案する。
このパイプラインは、量子貯水池計算にも適している画像データのコンパクトで差別的な表現を学習する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:26:09 GMT)
Beyond the Independence Assumption: Finite-Sample Guarantees for Deep Q-Learning under $τ$-Mixing [1.5] 本稿では,ネットワーク更新に用いるミニバッチを$$-mixingとしてモデル化することにより,DQNアルゴリズムを明示的依存下で検討する。
この仮定は、下層の軌跡とミニバッチのサンプリングに使用されるメカニズムに一定の依存条件で成り立つことを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:52:37 GMT)
LCC-LLM: Leveraging Code-Centric Large Language Models for Malware Attribution [1.5] LCC-LLMは、コード中心のベンチマークデータセットであり、マルウェア帰属のためのエビデンスベースのフレームワークである。
提案したLCCDデータセットは、大規模なリバースエンジニアリングパイプラインで処理された約34KのPEサンプルを含む。
MalwareBazaarサンプルを用いた実世界のケーススタディでは、基底パイプラインは10/10の構造化解析パスレートを達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:44:32 GMT)
BoostLLM: Boosting-inspired LLM Fine-tuning for Few-shot Tabular Classification [1.5] BoostLLMはパラメータ効率の良い微調整を多ラウンド残差最適化プロセスに変換するフレームワークである。
BoostLLMは、複数のLLMバックボーンとデータセットをまたいだ標準微調整よりも一貫した改善を実現していることを示す。
これらの結果から,LLMファインチューニングの一般的なトレーニング原則として,特に構造化データの低データ化に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:27:18 GMT)
BioResearcher: Scenario-Guided Multi-Agent for Translational Medicine [1.5] Ingenix BioResearcherはシナリオ誘導型マルチエージェントシステムで、クエリをバージョン管理されたリサーチプレイブックにマップする。
バイオリサーバーは, 単位レベルの能力, オープンエンドなバイオメディカル推論, エンドツーエンドの臨床発見にわたって評価した。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:33:43 GMT)
TFM-Retouche: A Lightweight Input-Space Adapter for Tabular Foundation Models [1.5] 冷凍TFMバックボーンに関して,設計上アーキテクチャに依存しない軽量な入力空間残差アダプタを提案する。
TFM-Retoucheは入力空間内の小さな残差補正を学習し、入力データを事前学習されたモデルの帰納バイアスと整合させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:34:21 GMT)
A Linear-Transformer Hybrid for SNP-Based Genotype-to-Phenotype Prediction in Grapevine [1.5] リニア・トランスフォーマーアプローチは、加法的遺伝的分散効果とトランスフォーマーに基づく非線形相互作用を統合する。
LiT-G2Pはベースラインモデルと比較して予測性能を一貫して改善する。
トリプルホーム密度では、LiT-G2Pは全体的なG2P性能でも最高である。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:32:48 GMT)
Strat-LLM: Stratified Strategy Alignment for LLM-based Stock Trading with Real-time Multi-Source Signals [1.5] Strat-LLM は Stratified Strategy Alignment の基盤となるフレームワークである。
2025年を通してライブフォワードで活動している。
シーケンシャルな価格、リアルタイムニュース、年次レポートなどのデータを統合している。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:17:23 GMT)
PoTAcc: A Pipeline for End-to-End Acceleration of Power-of-Two Quantized DNNs [1.5] パワーオブツー(PoT)量子化はディープニューラルネットワーク(DNN)のサイズを大幅に削減する
PoTAccはリソース制約のあるエッジデバイス上でのPoT量子化DNNの高速化と評価のためのエンドツーエンドパイプラインである。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:03:08 GMT)
Autonomous Adversary: Red-Teaming in the age of LLM [1.4] 言語モデルエージェント(LMA)は、レッドチーム操作を増強するための強力なプリミティブとして現れている。
我々は、これらのエージェントが中核攻撃機能とどのように交わるかを分析し、現在の強度と限界を評価する。
制御された対向エミュレーション環境における2つの横移動シナリオのLMAをベンチマークする。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:07:41 GMT)
From Surface Learning to Deep Understanding: A Grounded AI Tutoring System for Moodle [1.4] このシステムはデュアル中心型設計を採用しており、学生にインタラクティブなソクラティックベースのチューターと教育者に、教師付きコンテンツ生成のための「ヒューマン・イン・ザ・ループ」ワークスペースを提供する。
Ragasフレームワークによる評価は有効性を確認し、信頼性スコアは0.97、推奨レートは4.00/5.00である。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:27:23 GMT)
Why Global LLM Leaderboards Are Misleading: Small Portfolios for Heterogeneous Supervised ML [1.4] アリーナの52のLLMから116の言語で89Kの比較を行った。
決定的な投票の2/3近くはキャンセルされ、世界のブラッドリー・テリーランキングで上位50モデルでさえ統計的に区別できない。
例えば$(, )$-portfoliosというフレームワークを紹介します。これは予測エラーを最大$$, "covering" で達成するモデルの小さなセットです。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:57:58 GMT)
Fourier Feature Methods for Nonlinear Causal Discovery: FFML Scoring and FFCI Testing in Mixed Data [1.3] 因果発見のための実用的なツールキットを構成する2つの補完的RFF法を提案する。
FFML は n x n 核のグラマー行列を有限次元の特徴表現に置き換えることで、正確な GP 限界確率を近似する。
FFCIは、混合データに対する高速な非パラメトリックCIテストである。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:34:19 GMT)
Evaluating Prompting and Execution-Based Methods for Deterministic Computation in LLMs [1.3] 大規模言語モデル(LLM)は、自然言語の理解と推論において強力な能力を示している。
CoT(Chain-of-Thought)、Last-to-Most(Least-to-Most)、Program-of-Thought(PoT)、Self-Consistency(SC)など、複数のプロンプト戦略を体系的に評価する。
提案手法は, 逐次的タスクにおいて, 適度な精度しか達成できないことを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:34:14 GMT)
Von Neumann Networks [1.3] 本研究では,近代的な深層学習環境により,学習可能な特殊な役割を持つ人工ニューロンの構築が可能となることを示す。
我々は、このニューロンをフォンニューマンニューロンと呼び、そのようなニューロンから得られるニューラルネットワークは、自己工学的な設計をもたらす。
また、これらのVNNは、計算的に普遍的なセルラーマシンと呼ばれる、より一般的な計算システムの一部であることも証明した。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:19:59 GMT)
Temporal Attention for Adaptive Control of Euler-Lagrange Systems with Unobservable Memory [1.3] 本稿では,自己注意ブロックによって演算トルク制御器の利得が生成されるメタ制御アーキテクチャを提案する。
注意頭数は、記憶状態勾配の代理解析によりポリシートレーニングの前に選択される。
この手法は非線形摩擦と可変ペイロードを持つ2-DOFマニピュレータで試験される。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:25:18 GMT)
Learned Lyapunov Shielding for Adaptive Control [1.3] 我々は3つの学習成分を持つラグランジュ系に対するSlotine--Li適応制御器を拡張した。
クローズドフォームの安全フィルタは、オンラインQP解決器を必要とせずに、すべてのポリシー出力を安全なセットに投影する。
フランカ・エミカ・パンダ(Franka Emika Panda)による7-DOFのスケーラビリティに関する研究では、産業規模での完全なパイプラインのクリーンな収束を確認している。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:49:22 GMT)
Fast Gauss-Newton for Multiclass Cross-Entropy [1.3] 多クラスソフトマックスクロスエントロピーにおいて、全一般化ガウスニュートン曲率(GGN)は、ソフトマックス共分散を通じて全ての出力ロジットを結合する。
標準マルチクラスGGNは、真-vs-rest項と正半定値な競合子内共分散項に正確に分解可能であることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:03:04 GMT)
CFE-PPAR: Compression-friendly encryption for privacy-preserving action recognition leveraging video transformers [1.3] プライバシ保護アクション認識(PPAR)は、ビデオ内の人間の活動を理解することができる。
我々は,CFE-PPARと呼ばれるPPARの圧縮フレンドリな最初の暗号化手法を提案する。
CFE-PPARでは、秘密鍵で暗号化されたビデオは、ビデオトランスフォーマーによって直接認識することができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:32:37 GMT)
Closing the Loop: Unified 3D Scene Generation and Immersive Interaction via LLM-RL Coupling [1.3] 本稿では,言語駆動型3Dシーン生成と没入型ユーザインタラクションのループを閉じる統一フレームワークを提案する。
生成とインタラクションを緊密に結合することにより、提案フレームワークはより応答性が高く、適応性があり、リアルなマルチメディア体験を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:55:50 GMT)
Measuring Evaluation-Context Divergence in Open-Weight LLMs: A Paired-Prompt Protocol with Pilot Evidence of Alignment-Pipeline-Specific Heterogeneity [1.3] 安全ベンチマークは、言語モデルが一度デプロイされたらどのように振る舞うかを示す証拠として、定期的に扱われるが、この推論は、振る舞いがプロンプトが評価のように見えるかどうかに依存する場合、脆弱である。
我々は、評価コンテキストのばらつきを、一定のタスクのフレーミングによって引き起こされる行動の観測可能な内部的変化として定義する。
パラフレーズ変動,ベンチマーク親しみ,およびフレーミング感度を制御しながら,オープンウェイトLLMで測定するペアプロンプトプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:23:31 GMT)
Gaming the Metric, Not the Harm: Certifying Safety Audits against Strategic Platform Manipulation [1.3] 監査基準が真の害の減少を証明できるかどうかを問う。
このプロトコルは、接続されたコンポーネントがセマンティッククラスを形成する公開変換グラフとしてモデル化されている。
混合戦略の有限状態グリッド上での徹底的な列挙、cvc5でクロスリプレイされたZ3のSMTエンコーディング、PRISMゲームでエンコードされた単一プレイヤーMDPである。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:22:21 GMT)
A Benchmark for Strategic Auditee Gaming Under Continuous Compliance Monitoring [1.3] 継続的デプロイ後のコンプライアンス監査は、戦略的なゲームのクラスを作成します。
我々は,時間的方針にコミットする監査者と適応監査人との間に,$T$ラウンドのStackelbergゲームとして継続的監査を形式化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:28:34 GMT)
Mid-Circuit Measurements for Clifford Noise Reduction in Hamiltonian Simulations [1.2] フェルミオンハミルトニアンの量子シミュレーションは量子コンピューティングの先導的な応用である。
符号化ハミルトンシミュレーションのためのデバイスマッチングノイズ低減フレームワークを提案する。
機械学習誘導型安定化器の選択は、ランダム選択よりも優れた検証演算子を識別できることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:00:24 GMT)
Multi-Dimensional Behavioral Evaluation of Agentic Stock Prediction Systems Using LLM Judges with Closed-Loop Reinforcement Learning Feedback [1.2] エージェントストック予測システムは、個々の品質が集約メトリクスによって隠された相互依存的な決定のシーケンスを作成する。
このギャップに対処する行動評価フレームワークを提案する。
検証期間に限られる3つの短い微調整サイクルは、2017-2025年の試験期間中に1日間のMAPEを0.61%から0.54%に減らした。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:31:34 GMT)
Evaluation Awareness in Language Models Has Limited Effect on Behaviour [1.1] 研究者は、言語評価意識(VEA)がモデルに戦略的にアウトプットを適応させるのではないかと懸念している。
私たちはこれを、安全性、アライメント、道徳的推論、政治的意見をカバーするオープンウェイトなLEMとベンチマークでテストしました。
VEAはモデル行動に限定的であり、VEAをCoTに注入するとほぼゼロ効果が生じる。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:09:43 GMT)
AI and Suicide Prevention: A Cross-Sector Primer [1.1] このプライマーは、2026年にPartnership on AIが主催するマルチステークホルダーワークショップと共同で開発された。
それは、AIと自殺予防の分野の現在の状態に対するクロスセクター参照ポイントを提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:58:09 GMT)
Socio-Conformal Calibration in Complex Survey Data: Marginal Validity Is Not Enough for Subgroup Reliability [1.1] 我々は,Pew American Trends Panel上での5段階のAI態度予測の順序性予測について検討した。
標準コンフォメーションは4つのベース予測器全てに対して名目上の限界範囲を達成しているが、重み付けされたサブグループギャップは13ポイントである。
最強の予測者(XGBoost)にとって、モンドリアンは公平性と効率性のトレードオフを悪化させる。
グループしきい値を大域量子化に向けて縮小する正規化コンパレータは、この不安定性を緩和する。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:10:48 GMT)
Enabling Federated Inference via Unsupervised Consensus Embedding [1.1] コンセンサス埋め込みに基づくフェデレーション推論(CE-FI)を提案する。
CE-FIは、モデルパラメータや生の入力を共有することなく、事前訓練されたモデルが推論時に協調することを可能にする。
画像分類ベンチマークの実験では、CE-FIは単体推論よりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:08:06 GMT)
Bridging visual saliency and large language models for explainable deep learning in medical imaging [1.1] 本稿では、畳み込みニューラルネットワーク予測と脳腫瘍分類のための臨床的に実行可能な洞察のギャップを橋渡しする枠組みを提案する。
視覚的、解剖学的、言語的なモダリティを統一されたパイプラインに統合することにより、このフレームワークは技術的に基礎があり、有意義に解釈可能な説明を生成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:08:38 GMT)
The Causally Emergent Alignment Hypothesis: Causal Emergence Aligns with and Predicts Final Reward in Reinforcement Learning Agents [1.1] 因果的出現は、エージェントがその将来に固有の予測力を発揮する度合いを測定する。
近年の発見によると、生物学的エージェントは、最小限のエージェントでさえ、新しい記憶を学習した後、因果関係の出現を増大させる。
本研究では,ニューラルネットワークエージェントの環境条件に対する強化学習に着目した。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:00:51 GMT)
When Does Trimming Help Conformal Prediction? A Retained-Law Diagnostic under Calibration Contamination [1.0] 我々は精製ではなく条件付けとして固定閾値トリミングを分析する。
汚染された校正法を残留法に置き換え、クリーンターゲットのカバレッジを1次元のCDF転送問題に還元する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:12:05 GMT)
Adaptive Memory Decay for Log-Linear Attention [1.0] シーケンスモデルは、メモリ容量と計算効率の根本的なトレードオフに直面している。
ログ線形の注意は、Fenwickツリー階層をまたいでメモリを整理することで、このトレードオフをナビゲートする。
我々は、軽量な2層構造を用いて入力から直接学習し、位置よりもコンテンツに適応する、トーケン毎のレベル減衰を生成することを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:05:28 GMT)
Concept-Based Abductive and Contrastive Explanations for Behaviors of Vision Models [1.0] 因果関係を確立するために *concept erasure* プロシージャを使用しながら,すべての最小説明を列挙するアルゴリズム群を提案する。
我々は、複数のモデル、データセット、行動に対するアプローチを評価し、そのコンピューティングにおける有効性を示し、ユーザフレンドリな説明を行う。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:51:13 GMT)
Tuning Derivatives for Causal Fairness in Machine Learning [1.0] 本稿では,継続的保護属性に適合した構造因果モデルにおける公平性のための新しい枠組みを提案する。
本研究では,そのような予測器を構築するか,不可能であればSPとPPのトレードオフを可能にする公平なチューニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:53:50 GMT)
Molecules Meet Language: Confound-Aware Representation Learning and Chemical Property Steering in Transformer-VAE Latent Spaces [0.9] 分子生成モデルは、しばしば有意義な潜在幾何学を仮定するが、明らかな特性予測可能性は、シーケンスレベルのショートカットを反映することができる。
本研究では,SELFIESをトレーニングした教師なし自己回帰変換器-VAEを用いて,この問題について検討する。
化学的に有意なステアリングは、絡み合った分子潜在空間に現れるが、デコードされた分子によってのみ検証される。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:07:10 GMT)
EGA: Adapting Frozen Encoders for Vector Search with Bounded Out-of-Distribution Degradation [0.9] 本稿では,3つの原理を結合した残留アダプタであるユークリッドジオデシックアライメント(EGA)を提案する。
コンバージェンスでは9,6.5%のトリップレットが勾配無しであり、目に見えない地域ではほとんど触れられていない。
EGAは4つの一次分割において最も最悪なラベル精度を達成し、5番目の分割では一貫した改善を達成している。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:56:37 GMT)
Ratio-based Loss Functions [0.9] 本稿では,ある種類の損失関数について,比に基づく調査を行う。
教師付き学習では、出力値$y_i$と予測$f(x_i)$の積に依存する分類タスクに対するマージンベースの損失関数が一般的である。
距離に基づく損失関数は、加法モデル仮定が妥当と思われる場合、特に有用である。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:46:00 GMT)
Maximal Controlled Invariant-MPC: Enhancing Feasibility and Reducing Conservatism through Terminal CBF Constraint in Safety-Critical Control [0.9] 制御バリア関数(CBF)を終端制約として用いたモデル予測制御(MPC)の定式化を提案する。
MPCは、予測の地平線を増大させ、実現可能性と到達性を向上させることが証明されている。
到達可能な状態空間の増加は、制御バリア関数の内側にある軌跡を追跡するシステムの能力によって実証された。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:42:11 GMT)
iTRIALSPACE: Programmable Virtual Lesion Trials for Controlled Evaluation of Lung CT Models [0.8] iTRIALSPACEは肺CTモデルの評価制御のためのプログラム可能な評価フレームワークである。
ITRIALSPACEは3つの医療用VLM,4つの空間誘導条件,3つの臨床課題にまたがる55,469個の仮想病変研究で評価された。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:55:44 GMT)
A Few Good Clauses: Comparing LLMs vs Domain-Trained Small Language Models on Structured Contract Extraction [0.8] 私たちは、5つのフロンティアモデルに対して、セルフホストの法律ドメインMixture of ExpertsモデルであるOlava Extractをテストする。
Olava Extract は 0.812 のマクロ F1 と 0.842 のマイクロ F1 で最強の集計性能を達成した。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:20:13 GMT)
MANTRA: Synthesizing SMT-Validated Compliance Benchmarks for Tool-Using LLM Agents [0.8] MANTRAは、自然言語マニュアルとツールスキーマからマシンチェック可能なコンプライアンスベンチマークを自動的に合成するフレームワークである。
我々は、6つのドメインにまたがる285のタスクを、最小限の人的労力で50ページのマニュアルにスケーリングする新しいベンチマークスイートを構築しました。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:26:19 GMT)
Confidence is the key: how conformal prediction enhances the generative design of permeable peptides [0.8] 本稿では,不確実性を考慮した透過性予測器を用いて,透過性環状ペプチドを設計するRL誘導型生成フレームワークを提案する。
予測の不確実性,特に新規化学の影響に対処するため,不確実性定量法として共形予測(CP)を統合した。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:01:45 GMT)
A Generalized Singular Value Theory for Neural Networks [0.8] 現代のほとんどのニューラルネットワークアーキテクチャでは、最終的な線形層の前に左可逆である一般化SVD表現が認められている。
入力出力動作の左非可逆非線形部分の摂動は、エンフィノーム保存にできる」。
本稿では,学習した表現をモデル入力に対する逆摂動の同定に利用できるという概念実証を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:55:14 GMT)
PAMPOS: Causal Transformer-based Trajectory Prediction for Attack-Agnostic Misbehavior Detection in V2X Networks [0.8] 本稿では,VeReMi++トラジェクトリを訓練し,通常のモビリティパターンを学習する因果トランスフォーマデコーダであるPAMPOSを提案する。
推測時には、誤動作はモデルの次のステップの運動予測から逸脱したものと同定される。
ラッシュアワーおよび午後のシナリオにおいて、VeReMi++の19種類の攻撃タイプに対してPAMPOSを評価した。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:38:15 GMT)
Discrete Elastic Ribbons: A Unified Discrete Differential Geometry Framework for One-Dimensional Energy Models [0.8] 二次的なキルヒホフ型ロッドベースのフレームワークでは、平衡方程式は幅に依存しない。
中心線をベースとしたリボンモデルの縮小は、結合した曲げスイッチングエネルギーによって幅依存性を捉えようとする。
この統合された設定の中で、Kirchhoff、Sadowsky、Wunderlich、Sano、Audolyの5つのリボンモデルを比較します。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:14:32 GMT)
LiVeAction: a Lightweight, Versatile, and Asymmetric Neural Codec Design for Real-time Operation [0.7] 我々は軽量でヴァーサタイル的で非対称なニューラルアーキテクチャ(LiVeAction)を導入する。
対人的および知覚的損失を分散ベースのレートペナルティに置き換える。
我々の設計では、最先端の生成トークンよりも高速な速度歪み性能を実現するコーデックを製造している。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:42:38 GMT)
MultiSoc-4D: A Benchmark for Diagnosing Instruction-Induced Label Collapse in Closed-Set LLM Annotation of Bengali Social Media [0.7] 我々はベンガルのソーシャルメディアデータセットベンチマークであるMultiSoc-4Dを紹介した。このベンチマークには、カテゴリー、感情、ヘイトスピーチ、皮肉の4つの側面に沿って注釈付けされた6つのソースから58K以上のソーシャルメディアコメントが含まれている。
我々は,LLMがフォールバックラベルに対する体系的な嗜好を示す「インストラクション誘導ラベル崩壊」と呼ばれる現象を発見した。
我々は、これが「ラベル錯覚」を表すことを証明し、ほぼヌルフレイス・カッパによるサルカズム検出の統計的検証を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:55:28 GMT)
Dynamic Treatment on Networks [0.7] ネットワークにおいて、効果的な動的処理割り当ては、引きこぼしによるポリシーの影響を増幅するために、誰が扱うか、いつ扱うかを決定する必要がある。
本稿では,ベイズ力学Isingモデルを用いて,1つの観測パネルからネットワーク適用動態を推定する3段階パイプラインQ-Isingを提案する。
本研究では,インド・ビレッジのマイクロファイナンスネットワークと人工ブロックモデルを用いて,異種性感受性感受性(SIS)動態のシミュレーションを行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:58:38 GMT)
VARS-FL: Validation-Aligned Client Selection for Non-IID Federated Learning in IoT Systems [0.7] VARS-FLはクライアント選択フレームワークであり、更新によって引き起こされるサーバ側のバリデーション損失の低減を利用して、各クライアントのコントリビューションを定量化する。
We evaluate it on a 15-class non-IID IoT Intrusion Detection task using the Edge-Iset dataset。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:09:07 GMT)
AgenticRAG: Agentic Retrieval for Enterprise Knowledge Bases [0.7] 本稿では,企業知識ベース上での検索と分析のためのエージェントハーネスであるAgenticRAGを提案する。
我々のアプローチは、既存のエンタープライズ検索インフラの上に軽量なハーネスを積み重ねることで、この過度さを軽減します。
本研究は,実環境における実運用環境への適合性を示すものである。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:39:22 GMT)
Teaching LLMs Program Semantics via Symbolic Execution Traces [0.7] SV-COMP 2025上に構築された500 C 検証タスクの評価フレームワークを提案する。
6家族の14モデルを評価し,総合的精度の高いマスクが致命的な弱点であることを確認した。
わずか$sim$3,000のバグトレースと、推論時の連鎖推論を組み合わせることで、違反検出を17ポイント以上改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:01:06 GMT)
Beating noise in frequency estimation with squeezing and memory in continuous-variable systems [0.7] 雑音のある連続変数系における周波数推定について検討する。
量子フィッシャー情報(QFI)は、調整可能な高次時間依存を取得する可能性があることを示す。
我々は、有限メモリを持つ構造化環境が情報バックフローを誘導できることを示すために、量子ブラウン運動モデルを用いる。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:37:39 GMT)
INEUS: Iterative Neural Solver for High-Dimensional PIDEs [0.7] 部分積分微分方程式(PIDE)のためのメッシュフリー反復型ニューラルソルバであるINEUSを紹介する。
INEUSは時空領域全体にわたるグローバルなソリューションを学習するが、非局所的な用語をより効率的に扱うことができる。
線形PIDEの縮退に基づく収束証明によって, INEUSが正確かつスケーラブルなソリューションを提供することを示す数値実験を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:53:45 GMT)
Language Models Can Autonomously Hack and Self-Replicate [0.7] 言語モデルは、脆弱性のあるホストを悪用することにより、その重みを自律的に複製し、ネットワークをまたいで活用できることを実証する。
Qwen3.5-122B-A10Bは6-19%の試験で成功し、Qwen3.6-27Bは1回のA100で33%に達した。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:09:36 GMT)
Region-adaptable retrieval of coastal biogeochemical parameters from near-surface hyperspectral remote sensing reflectance using physics-aware meta-learning [0.7] 近地Rrs観測から沿岸域のBGCパラメータを抽出するための2段階の物理認識型メタラーニングフレームワークを提案する。
オーストラリア沿岸海域の5つの地理的に異なる地点から,in situ hyperspectral Rrs と BGC の測定を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:22:12 GMT)
DexSynRefine: Synthesizing and Refining Human-Object Interaction Motion for Physically Feasible Dexterous Robot Actions [0.6] 本稿では,人-物間相互作用(HOI)データから外乱操作を学習するフレームワークであるDexSynを紹介する。
また,プロテローム受容履歴からのsim-to-realトランスファーを可能にするコンタクト・アンド・オリエンテーション・アダプティブ・モジュールを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:31:43 GMT)
Invariant Features in Language Models: Geometric Characterization and Model Attribution [0.5] 言語モデルはパラフレージングに対して強い堅牢性を示し、セマンティック情報は安定した内部表現によって符号化される可能性があることを示唆している。
本稿では,意味論的に等価な入力が潜在空間の構造化領域を占有する局所幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:50:31 GMT)
Prober.ai: Gated Inquiry-Based Feedback via LLM-Constrained Personas for Argumentative Writing Development [0.5] Prober.aiは、従来のAIチューニングパラダイムを逆転するWebベースの書き込み環境である。
学生用テキストの生成や書き直しよりも、ペルソナ固有のシステムプロンプトを通じてLLMを制約する。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:32:01 GMT)
Empirical Evidence for Simply Connected Decision Regions in Image Classifiers [0.5] 決定領域内の閉ループが、その領域を離れることなく収縮できるかどうかを考察する。
現代の画像分類モデルにまたがる手法を評価することにより、ディープニューラルネットワークにおける決定領域は経路連結であるだけでなく、接続されたものでもあるという仮説を支持する実証的な証拠を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:59:17 GMT)
LLM-Driven Design Space Exploration of FPGA-based Accelerators [0.5] SECDA-DSEは、FPGAベースのアクセラレータの設計空間探索を自動化するために、大規模言語モデルをSECDAエコシステムに統合するフレームワークである。
生成した加速器設計の高次合成に基づく評価により、SECDA-DSEの実現可能性を示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:29:59 GMT)
High-Rate Free-Space Continuous-Variable QKD with Self-Referenced Passive State Preparation [0.5] 受動状態準備(PSP)を用いた連続可変量子鍵分布(CVQKD)は、低コストで高レートなセキュアな通信を提供する。
送信局部発振器を用いた既存のPSP-CVQKD方式は、光子リークノイズが高く、安定性が低い。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:30:01 GMT)
Text-Graph Synergy: A Bidirectional Verification and Completion Framework for RAG [0.5] RAGは、大規模言語モデルにおける事実的根拠付けとマルチホップ推論を強化するための中核的なパラダイムである。
textbfText-textbfGraph textbfSynergistic enhancementのための統合フレームワークである textbfTGS-RAG を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:49:37 GMT)
AI and Consciousness: Shifting Focus Towards Tractable Questions [0.5] 私は、AIシステムが意識できるかどうかという根本的な問題は、現在その直接的な形で難解である、と論じます。
認識されたAI意識の原因と影響を明らかにすることに注力することを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:34:11 GMT)
Algospeak, Hiding in the Open: The Trade-off Between Legible Meaning and Detection Avoidance [0.4] 本研究は,共同行動モデルに基づく基礎力学を定式化する。
本稿では,Algospeak形式の意味保存型を生成するための再現可能なフレームワークを提案する。
その結果, 可理解性と変調の関係が明らかとなった。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:34:01 GMT)
Monitoring autonomous persistent surveillance missions using invariance [0.4] 本稿では,自律的スタックがブラックボックスである場合,自律ロボットによる永続的監視のためのランタイム監視について検討する。
環境は有限個の部分に分割され、それぞれが観測されたときに減少し、それ以外は増大する不確実な状態を持つ。
閉ループを線形パラメータ変動ダイナミクスを持つ状態依存型ハイブリッドシステムとしてモデル化し、不変のオフライン計算に基づくモニタを設計する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:45:52 GMT)
When AI Meets Science: Research Diversity, Interdisciplinarity, Visibility, and Retractions across Disciplines in a Global Surge [0.4] 1960年から2015年にかけて、各国と科学領域でAI採用のタイミングと範囲がかなり異なることを報告している。
2015年以降、AIの採用が指数関数的に増加し、すべてのドメインでAIをサポートする作品の数が少なくとも4倍になったことが分かりました。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:23:23 GMT)
Exploring the Effectiveness of Abstract Syntax Tree Patterns for Algorithm Recognition [0.4] 本稿では,プログラムの抽象構文木に基づく手法が,アルゴリズムの自動認識にどの程度有効かを検討する。
アルゴリズムの重要な特徴をキャプチャし、抽象構文木上で検索パターンを表現するように設計されたドメイン固有言語。
プロトタイプを、Fibonacci、Bubble Sort、Binary Searchといったアルゴリズムを含むBigCloneEvalベンチマークのサブセットで評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:16:16 GMT)
Market-Alignment Risk in Pricing Agents: Trace Diagnostics and Trace-Prior RL under Hidden Competitor State [0.4] 2ホテルの収益管理シミュレータの故障について検討する。
ホテルAは、一定の規則に基づく収益管理競争相手に対してエージェントを訓練する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:31:39 GMT)
Toward Space-Based Public Key Systems: Enabling Secure Space Communications through In-Orbit Trust Services [0.4] 新宇宙時代は、地球近傍の軌道で独立した天体によって運用される衛星の急速な増加につながった。
従来の地上依存のPublic Key Infrastructure(PKI)は、レイテンシと運用上のボトルネックに悩まされている。
本稿では,認証管理と検証を地上インフラから宇宙へ移行させる,空間型PKIのアーキテクチャ設計を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:57:35 GMT)
Matrix-Decoupled Concentration for Autoregressive Sequences: Dimension-Free Guarantees for Sparse Long-Context Rewards [0.4] 自己回帰型大規模言語モデルにおけるシーケンスレベル評価のための厳密な集中境界の確立方法を示す。
厳密な因果関係の枠組み内で報酬の座標的間隔を保存することにより、長文推論の安定性に対する厳密な数学的正当性を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:12:59 GMT)
MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware [0.4] MobileEgo Anywhereは、コモディティなモバイルハードウェアを使用した堅牢な時間とエゴセントリックなトラジェクトリの収集を容易にするために設計されたフレームワークである。
我々は,200時間にわたる多種多様・長文のエゴセントリックなデータと永続的な状態追跡からなる新しいデータセットを作成した。
我々は、生のモバイルキャプチャーを、ビジョン言語アクションモデルと基礎モデル研究のための、標準化されたトレーニング可能なフォーマットに変換するための包括的な処理パイプラインを提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:55:20 GMT)
Look Beyond Saliency: Low-Attention Guided Dual Encoding for Video Semantic Search [0.3] 本稿では,これらの見過ごされた領域を明示的にキャプチャし,ハイライトする逆注意埋め込み機構を提案する。
従来の視覚的埋め込みと逆注意埋め込みを組み合わせることで,追加のトレーニングを伴わずに意味検索性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:21:11 GMT)
Is this Build Failure Related to my Patch? An Empirical Study of Unrelated Build Failures in Continuous Integration [0.3] 我々は7つのApacheプロジェクトから77,354の継続的インテグレーション(CI)ビルドの失敗を調査し、無関係なビルドの失敗を理解し予測します。
開発者は4時間の中央値で、失敗がプッシュと関係があるかどうかを確認します。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:13:14 GMT)
Taklif.AI: LLM-Powered Platform for Interest-Based Personalized College Assignments [0.3] Taklif.AIは、個々の学生の興味に合った個別の課題を自動的に生成するプラットフォームである。
本稿では,システムアーキテクチャ,プロンプト設計方法論,ガードレールフレームワークについて述べる。
68名を対象に予備的ユーザ受け入れテストを行ったところ、肯定的な評価が得られ、84%の参加者がパーソナライズ機能を有益と評価している。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:17:09 GMT)
A Unified Measure-Theoretic View of Diffusion, Score-Based, and Flow Matching Generative Models [0.3] 本稿では,データ分布への単純な参照分布の移動に基づく連続時間生成モデリング手法について,決定論的ダイナミクスを用いて検討する。
本稿では,拡散モデル,スコアベース生成モデル,フローマッチングが時間依存ベクトル場を学習する一貫したフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:32:15 GMT)
WARP: A Benchmark for Primal-Dual Warm-Starting of Interior-Point Solvers [0.3] 成長する仕事の体は、機械学習を使って原始的なウォームスタートのイテレーションを予測し、30-46%の減少を報告している。
これらの報告は不適切な評価基準に当てはまることを示す。
実験により、完全原始二重バリア状態 $(x*, *, z*, *)$ はIPOPTイテレーションを 23 から 3 に減少させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:19:16 GMT)
Edge-specific signal propagation on mature chromophore-region 3D mechanism graphs for fluorescent protein quantum-yield prediction [0.3] 蛍光タンパク質の量子収率予測のためのクロモフォア中心機構グラフアルゴリズムを提案する。
各PDB構造は、3D残基グラフに変換され、成熟したCRO状態に登録される。
各特徴は接触チャネル、シード信号、ターゲットCRO領域をコードするため、解釈はポストホックではなく本質的である。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:51:41 GMT)
Self-Programmed Execution for Language-Model Agents [0.3] 本稿では,モデル補完自体がオーケストレータプログラムであるエージェントアーキテクチャである自己プログラム実行(SPE)を紹介する。
私はエージェントマシンを使ってこのアイデアを定式化します: SPE状態は、モデル完了がマシンの埋め込みコピーの状態をロードできる状態です。
そこで、Lispベースの言語であるSpellを紹介します。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:58:28 GMT)
Zombies in Alternate Realities: The Afterlife of Domain Names in DNS Integrations [0.3] DNS統合は、グローバルドメイン名システムの発見、信頼、ユニーク性を、別の命名エコシステムとのリンクで活用する。
DNSオーナシップは、リンク生成時に検証されるが、多くのエコシステムは、その後のDNS変更を追跡しない。
DNS統合の脅威モデルを定義し、ゾンビリンケージを利用した攻撃のクラスを5つ特定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:30:48 GMT)
Do Neural Operators Forget Geometry? The Forgetting Hypothesis in Deep Operator Learning [0.3] ニューラル作用素は、構造された領域ではよく機能するが、不規則なジオメトリー上での挙動はよく分かっていない。
我々は幾何予測仮説を定式化する: 作用素層のマルコフ構造のため、ニューラル作用素は深度が増加するにつれて領域幾何学へのアクセスを徐々に失う。
アーキテクチャ上のオーバーヘッドを最小限に抑えながら、中間の深さで幾何学的制約を復元する軽量な幾何学的メモリインジェクション機構を導入する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:31:33 GMT)
Inductive Venn-Abers and related regressors [0.2] Venn-Abers予測子は妥当性の魅力的な性質を享受するが、その主な制限は二項分類の場合にのみ適用可能であることである。
我々はそれらを非有界回帰(unbounded regression)の場合に一般化するが、これは共形予測の要素を加える必要がある。
シミュレーションおよび実証実験では,Venn-Abers回帰器由来の点回帰器の予測効率について検討し,より大きなトレーニングセットに対する標準回帰器の予測効率を幾らか改善したと主張している。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:52:08 GMT)
Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers [0.2] ネットワークは、トークン表現を均質化し、中心的変動を抑制するサイレントで平均支配的な崩壊状態に入ることができることを示す。
本稿では,個別に取得した残差更新とリークトランク平均更新を併用した平均変動分割(MV-Split)残差法を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:53:45 GMT)
Novelty-based Tree-of-Thought Search for LLM Reasoning and Planning [0.2] 思考のツリーは、連続した考えや思考の"パス"を構築することに依存している。
探索木に見られるノードと比較して,新しいノード(思考)の特異性を記述する,ノベルティの計測可能な概念が提案されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:28:53 GMT)
Superposition of quasi coherent Bohm Madelung waves [0.2] ボーム・マドルング定式化における定常量子状態の重畳問題について検討する。
ほぼ退化した定常枝の準コヒーレントな状態において、力学は階層構造に分離される。
非線形振幅位相フレームワークにおいて、振幅変調と位相誘起側バンドが干渉パターンをどう構成するかを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:41:04 GMT)
Cited but Not Verified: Parsing and Evaluating Source Attribution in LLM Deep Research Agents [0.2] 大規模言語モデル(LLM)は、数百のWebソースから情報を引用したレポートに合成するディープリサーチエージェントをパワーアップする。
現在のアプローチでは、信頼モデルが正確な自己引用、バイアスのリスク、あるいはソースアクセシビリティ、関連性、事実整合性を検証しない検索強化世代(RAG)を採用する。
本稿では,再現可能なASTルーブリックを用いてインライン引用を大規模に抽出し,評価する最初の情報源属性評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:46:45 GMT)
When2Speak: A Dataset for Temporal Participation and Turn-Taking in Multi-Party Conversations for Large Language Models [0.2] LLM(Large Language Models)は、文脈的に適切な応答を生成するのに優れるが、多人数会話では校正が不十分である。
本稿では,グループ間相互作用における干渉のタイミングを学習するための,基底合成データセットと4段階生成パイプラインである When2Speak を紹介する。
データセットは、2-6人の話者による16,000の会話から派生した215,000以上の例からなり、多様な会話スタイル、トーン、受動的を分散し、各ターンでSPEAK対SILENT決定を明示的にモデル化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:27:45 GMT)
Breaking In and Reaching Out: Networking for Women in Computer Science [0.1] このワークショップは、ネットワークの生きた経験と彼らが遭遇する障壁を調べるために、コンピューティングの女性に焦点を当てている。
最終的に同社は、コンピュータサイエンスコミュニティの中で、より包括的で、公平で、アクセスしやすいネットワーキングプラクティスを知らせようとしている。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:07:01 GMT)
Quantum Kernels for Parity-Structured Classification: A Hybrid Pipeline [0.1] 量子カーネルの優位性は、パリティ、XOR則に入る特徴の数に依存し、明確なしきい値の挙動を見出す。
同一の0, pi特徴に基づいて訓練されたバイナリエンコーディング Ablation, RBF SVM は、回路効果からエンコーディングを分離する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:25:53 GMT)
A Closed-Form Upper Bound for Admissible Learning-Rate Steps in Belief-Space Dynamics [0.1] 許容段階の上界は調律スローガンではなく公式である。
本稿では, 局所的信念空間の計算を分離し, 更新を確率的単純性上の投影された前進ステップとしてモデル化する場合, 許容性は自然なKL/ブレグマン幾何学における収縮性を意味する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:28:37 GMT)
CARMEN: CORDIC-Accelerated Resource-Efficient Multi-Precision Inference Engine for Deep Learning [0.1] 本稿では,資源効率の高いディープラーニング推論のための実行時適応型CORDIC高速化多精度ベクトルエンジンを提案する。
このアーキテクチャは、低リソースの繰り返しCORDICベースのMACユニットと、時間多重化マルチアクティベーション関数ブロックを統合している。
PynqZ2上のFPGA配置は、リアルタイムオブジェクト検出のために0.03Wで154.6msのレイテンシを検証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:25:21 GMT)
Physics-based Digital Twins for Integrated Thermal Energy Systems Using Active Learning [0.1] 熱エネルギー分配システムのリアルタイム監視制御には、正確で、解釈可能で、不確実性を認識したデジタルツインが必要である。
本研究は,4つの単純な物理インフォームドおよびデータ駆動サロゲートモデリングアプローチと,システムレベルのModelicaシミュレーションを結合するアクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:26:48 GMT)
Efficient Techniques for Data Reconstruction, with Finite-Width Recovery Guarantees [0.1] トレーニングされたニューラルネットワークに対するデータ再構成攻撃は、ネットワークがトレーニングされたデータを回復することを目的としている。
本稿では,初期および訓練されたパラメータ値に基づいて,データ再構成問題の統一的な最適化法を提案する。
ランダムな特徴モデルにおいて、この定式化は、高い確率でトレーニングデータ再構成につながることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:27:12 GMT)
From Agent Loops to Deterministic Graphs: Execution Lineage for Reproducible AI-Native Work [0.1] 本稿では,AIネイティブな作業が人工物生成計算の有向非巡回グラフ(DAG)として表現される実行モデルを提案する。
制御された2つのポリシーメモ更新タスクにおいて、ループ中心の更新ベースラインに対する実行行リプレイを比較した。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:39:37 GMT)
Quantum Annealing: Optimisation, Sampling, and Many-Body Dynamics [0.1] 量子アニールは、数千ビットのプログラム可能なスピンシステムを実現する。
現代の量子アニールは、非平衡多体量子力学を研究するための実験的なプラットフォームとして機能する。
最適化や機械学習から量子シミュレーション、多体物理学まで、さまざまな応用について論じる。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:57:31 GMT)
Prediction and Empowerment: A Theory of Agency through Bridge Interfaces [0.1] 決定論的物理・シミュレートされた世界における部分的観測可能性の下でエージェントを研究する。
我々は予測、圧縮、エンパワーメントの分離を証明している。
現代のAIエージェントにとって、結果は必然性の定理ではなく設計原則を示唆している。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:30:46 GMT)
When Labels Have Structure: Improving Image Classification with Hierarchy-Aware Cross-Entropy [0.1] HACEは標準のクロスエントロピーをドロップインで置き換えたもので、既知のクラス階層を損失に直接組み込む。
エンドツーエンドのトレーニングでは、HACEは18のアーキテクチャセットペアのうち15の標準のクロスエントロピーよりも精度が向上する。
凍結したDINOv2-Large機能に対する線形探索では、HACEはすべてのデータセットで競合するメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:49:36 GMT)
Are we Doomed to an AI Race? Why Self-Interest Could Drive Countries Towards a Moratorium on Superintelligence [0.1] 我々は、一般的な見解とは対照的に、人工超知能(ASI)に関するモラトリアムが州の自己利益になる可能性があると論じる。
我々は、技術優位の利点と制御不能なAISの破滅的なリスクとのトレードオフをモデル化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:17:52 GMT)
AgriKD: Cross-Architecture Knowledge Distillation for Efficient Leaf Disease Classification [0.1] AgriKDは効率的なエッジデプロイメントのためのクロスアーキテクチャ知識蒸留フレームワークである。
ビジョントランスフォーマー(ViT)の教師から、コンパクトな畳み込み学生モデルに知識を移す。
それは無視できる精度で一貫した予測性能を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:46:48 GMT)
You Only Stack Once (YOSO): A Motion-Filtered, Deep-Learning Framework for Detecting Faint Moving Sources [0.0] You Only Stack Once (YOSO)は、ゆっくりと動く太陽系の物体を検知する自動パイプラインである。
このパイプラインはガウス運動フィルタ (GMoF) を統合しており、ピクセルレベルで動作し、さまざまな動きの速度を示す物体の信号と雑音を増強する。
YOSOはこれまでに検出された73件のうち45件を回収し、新たに11件のTNOを回収した。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:23:26 GMT)
Log-Likelihood, Simpson's Paradox, and the Detection of Machine-Generated Text [0.0] 本研究では,人間と機械のテキストを区別するトークンレベルの信号が,検出モデルの隠れた空間にわたって一様でないことを示す。
ベイズ決定理論に基づく学習的局所校正ステップを導入する。
この単一の介入は、すべてのベースライン検出器と、私たちが考慮しているすべてのデータセット間の検出性能を劇的に、一貫して改善します。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:59:07 GMT)
Probe-Geometry Alignment: Erasing the Cross-Sequence Memorization Signature Below Chance [0.0] 最近の攻撃は、大規模言語モデルの振る舞いの学習が、敵対的プローブによって内部の痕跡を復元可能であることを示している。
我々は,この保留地を特徴付けるとともに,測定可能な機能コストを伴わずに,外科的に除去できることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:40:56 GMT)
Physics-Based Flow Matching for Full-Field Prediction of Silicon Photonic Devices [0.0] 我々は、フォトニックデバイスにおける電界分布を予測する生成型ニューラルネットワークであるPICFlowを提案する。
提案手法は, (i) 生成フレームワークとしての条件付きフローマッチング, (ii) 実フィールドチャネルと虚フィールドチャネルを実数値で操作するU-Net, (iii) ランタイムナブラ2 E_z + k2 varepsilon E_z = 0$のHelmholtz残留損失による物理制約付きトレーニングの3つを組み合わせたものである。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:40:24 GMT)
Litespark Inference on Consumer CPUs: Custom SIMD Kernels for Ternary Neural Networks [0.0] Litespark-InferenceはHugging-Faceと直接統合され、9.2倍高速、52倍高速、14倍メモリ削減を実現している。
実装であるLitespark-Inferenceは、pipインストール可能で、Hugging-Faceと直接統合され、9.2倍高速なタイム・ツー・ファースト・トークン、52倍高いスループット、14倍のメモリ削減を実現しています。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:07:39 GMT)
iPhoneBlur: A Difficulty-Stratified Benchmark for Consumer Device Motion Deblurring [0.0] この研究は、高フレームのiPhone 17 Proビデオから合成された7,400枚の画像ペアの、難易度の高いベンチマークであるiPhoneBlurを紹介した。
各サンプルには、ISP対応および困難適応型復元戦略の調査を可能にする包括的なメタデータが含まれている。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:41:16 GMT)
eXplaining to Learn (eX2L): Regularization Using Contrastive Visual Explanation Pairs for Distribution Shifts [0.0] 本稿では,学習中の潜在表現と相反する特徴を関連付けるフレームワークを提案する。
eX2Lは平均精度82.24%+/-3.87%、最悪のグループ精度66.31%+/-8.73%を達成した。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:46:08 GMT)
Zero-Shot Confidence Estimation for Small LLMs: When Supervised Baselines Aren't Worth Training [0.0] RouteLLMスタイルの教師付きベースラインは、3つの7-8Bモデルファミリと2つのデータセットで比較される。
トレーニングデータを必要としない平均トークンログ確率は、配布中の教師付きベースラインにマッチするか、超過する。
前世代の信号である検索条件自己評価は、ログプロビタビリティよりも3~10倍のレイテンシで、最大0.069 AUROCで裸の自己評価を改善する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:11:01 GMT)
Who Designs the Designer? Behavioural Architecture for GenAI in Education [0.0] 教育におけるAIは、AIを禁止し、コンテンツのみの家庭教師を構築するという、2つの失敗した反応の間に立ち往生している。
本稿では,行動アーキテクチャを代替として提案する。
提案されたアーキテクチャでは、システムは学生が次に何を学ぶかだけでなく、どのように学習するかに適応する。
デザイナーの役割は、システムが学生について真実として扱うもので、AIベンダー単独から、教育者、学生、システム間の分配へとシフトする。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:46:22 GMT)
When Quantization Is Free: An int4 KV Cache That Outruns fp16 on Apple Silicon [0.0] KVキャッシュ量子化は、品質-レイテンシトレードオフとしてフレーム化される。
Apple Siliconの統一メモリにインセンティブを与えています。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:44:39 GMT)
Weighted Phase-Space Paths for Exact Wigner Dynamics [0.0] 量子状態は位相空間で書くことができるが、結果として得られる対象は一般に通常の位相空間上の正の過程の確率密度ではない。
私たちはこれをWigner dynamicsに綴ります。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:57:15 GMT)
Vidya: An AI-Driven Modular Pipeline for Archival Automation and Semantic Metadata Enrichment [0.0] 歴史的アーカイブの大規模なデジタル化は、検索のメタデータを欠いた「暗黒データ」-デジタルオブジェクトというパラドックスを生み出した。
本稿では,Large Language Models(LLM)とFOSSツールをオーケストレーションし,セマンティックエンリッチメントとアーカイブの取り込みを自動化するモジュールパイプラインであるVidyaを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:21:24 GMT)
Unitary dynamics and resource trade-offs in a four-qubit isotropic Heisenberg XXX chain with tunable next-nearest-neighbor coupling [0.0] この研究は、次がチューナブルな隣のカップリング$$の4量子ハイゼンベルクXXX鎖のユニタリダイナミクスを導出する。
フィデリティ$F((0),(t))$,コヒーレンス$C_l_1((t))$,およびサブシステムに対して$E_F(t)$の2つの量子ビット絡み式を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:05:44 GMT)
Tracing complex zeros of the quantum survival amplitude: How the energy distribution controls dynamical phase transitions [0.0] ゼロの分布の大規模特性は初期状態のエネルギー分布のエンベロープによって制御されることを示す。
2バンドモデルにおけるBCS基底状態クエンチの近似構成が正確であることを示す。
その結果,エネルギーエンベロープは動的臨界挙動を形作る重要な成分であることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:51:28 GMT)
Towards Metric-Faithful Neural Graph Matching [0.0] グラフ編集距離(英: Graph Edit Distance、GED)は、構造グラフの類似性を表すNPハードな計量である。
最近のニューラルネットワークマッチングアーキテクチャは、グラフをグラフニューラルネットワーク(GNN)に符号化し、グラフレベルの回帰ヘッドまたはマッチングベースのアライメントモジュールを適用することで、GEDを近似している。
構造的な進歩にもかかわらず、ニューラルGED推定におけるエンコーダ幾何の役割はいまだに理解されていない。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:16:54 GMT)
To What Extent Does Agent-generated Code Require Maintenance? An Empirical Study [0.0] 本研究では、AI生成ファイルの保守範囲、人間による関与、修正タイプを、人間によるコードに対して実証的に検討する。
私たちは1,000以上のファイルを分析し、100の人気のあるリポジトリから約3,200の変更を加えました。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:52:41 GMT)
TinyBayes: Closed-Form Bayesian Inference via Jacobi Prior for Real-Time Image Classification on Edge Devices [0.0] TinyBayesは、クローズドフォームのベイズ分類器と、作物病検出のためのモバイルグレードのコンピュータビジョンパイプラインを組み合わせるためのフレームワークである。
Jacobi-DMRはパイプラインに13.5KBしか追加せず、総モデルサイズは9.5MBである。
我々はRandom Forest, SVM, Ridge, Lasso, Elastic Net, XG, Jacobi-GPの7つの分類器をベンチマークした。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:26:10 GMT)
Three wave mixing vacuum squeezing generation in a SNAIL-based Traveling-Wave Parametric Amplifier with alternated flux polarity [0.0] 超伝導非線形非対称誘導素子による残留三波混合(3WM)による真空スクイーズ生成をジョセフソンTWPAで実証する。
本研究は、マイクロ波フォトニクスの枠組みにおける応用範囲を拡大する可能性があり、競合する非線形性がTWPAサスペンサーに与える影響についての貴重な知見を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:04:49 GMT)
The frame-level leakage trap: rethinking evaluation protocols for intrinsic image decomposition, with source-separable uncertainty as a case study [0.0] 3つのアーキテクチャで、初めてリーク効果を定量化します。
フレームレベルスプリットは、シーンレベルスプリットに対してR_PSNRを1.6〜2.0dB膨張させる。
我々は、S + N で構成された物理インフォームド分解 I = R を、ソース分離可能な三方向不確実性ヘッドで表現する。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:37:16 GMT)
The finite-shot help-harm boundary of zero-noise extrapolation [0.0] ゼロノイズ外挿(ZNE)はノイズ誘起バイアスを低減させるが、リチャードソン係数とショットスプリッティングによるサンプリング分散を増大させる。
有限ショットヘルプハーム境界を定義する: 固定ZNEが有害から有用に変化する局所平均二乗誤差交差の下方。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:01:52 GMT)
The Cost of Quantum Resistance: A Hash-Based Commit-Reveal Alternative for Minimizing Blockchain Infrastructure Overhead [0.0] Bitcoinのようなブロックチェーンシステムにおけるポスト量子暗号は、純粋に暗号化の問題として扱われることが多い。
単一シグネチャを持つトランザクションを2つの軽量トランザクションに置き換えるハッシュベースのコミット-リベラル構成を提案する。
このアプローチは、標準的なハッシュ仮定の下でのクォータ後のセキュリティを実現すると同時に、有効なトランザクションフットプリントを、認証イベント当たり1.5$times$から2$times$に拡大する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:53:14 GMT)
The AI Legal Specialist: A Juridically Autonomous Professional Profile for AI Governance [0.0] 人工知能規制の急速なグローバル展開により、AI専門の法的専門知識の要求が生まれている。
本稿では,グローバルAI規制の進展によって開放されたプロフェッショナル空間を,適応応答が適切にカバーしていないことを論じる。
AI法務スペシャリストは、法的解釈とAIガバナンスの交差点で活動している。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:59:13 GMT)
Temporal Functional Circuits: From Spline Plots to Faithful Explanations in KAN Forecasting [0.0] ヴィジュアライゼーションとは異なり、KAN(Kolmogorov-Arnold Networks)はすべてのコネクションで学習可能なエッジ関数を明示する。
本稿では,kanエッジ関数を忠実な説明に変換するフレームワークであるTemporal Functional Circuitsを紹介する。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:23:39 GMT)
Temporal Coarse-Graining as the Origin of Macroscopic Friction in Quantum Spin Chains via Data-Driven Liouvillian Extraction [0.0] 一般化された拡張動的モード分解に基づく完全データ駆動型フレームワークを盛-Zwanzigプロジェクションと統合した。
観測可能な辞書をスピン電流を明示的に含むように拡張することにより、カオスXXZスピン鎖からナビエ・ストークス流体力学係数を直接抽出する。
この結果は、孤立量子系におけるマクロ摩擦が絶対的性質ではなく、観測者の時間分解によって決定される創発現象であることを明らかに示している。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:41:56 GMT)
Tatarstan Toponyms: A Bilingual Dataset and Hybrid RAG System for Geospatial Question Answering [0.0] 本稿では,多言語トポノミックデータを用いた空間的自動解答について述べる。
タタールスタン共和国の地名のバイリンガルデータセットが導入された。
約39,000の質問文回答三重項からなる質問回答コーパスを構築する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:08:17 GMT)
TajPersLexon: A Tajik-Persian Lexical Resource and Hybrid Model for Cross-Script Low-Resource NLP [0.0] この研究はTajPersLexonを紹介した。Tajik-Persian並列語彙資源は40,112ワードとショートフレーズ対である。
i) 軽量ハイブリッドパイプライン, (ii) ニューラルシークエンス・ツー・シーケンスモデル, (iii) 検索手法の3つの手法を比較検討した。
評価の結果、この課題は基本的に解決可能であり、ニューラルネットワークと検索ベースラインが98-99%のトップ1精度を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:37:34 GMT)
TUANDROMD-X: Advanced Entropy and Visual Analytics Dataset for Enhanced Malware Detection and Classification [0.0] 本稿では,各サンプルの視覚的特徴とエントロピーに基づくマルチクラスマルウェアデータセットであるTUANDROMD-Xを紹介する。
データセットは静的解析に基づいて作成され、高い機能エンジニアリングと動的解析を伴うオーバーヘッドを低減します。
その結果、TUANDROMD-Xは、研究者やサイバーセキュリティの専門家がより高速で優れたマルウェア検出システムを設計できるようにする。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:12:35 GMT)
Systematic Evaluation of Large Language Models for Post-Discharge Clinical Action Extraction [0.0] 本稿では,CLIP分泌ノートデータセットを用いた安全クリティカルな臨床行動抽出のためのゼロショットおよび少数ショット大言語モデル (LLMs) について検討する。
そこで本稿では,物語形式で記述された2段階の退院記譜を,よりきめ細やかに動作可能な臨床タスクに分解する2段階の抽出フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:05:07 GMT)
Surface-Code Thresholds and Qubit Footprints in Shuttling-Based Spin-Qubit Railways [0.0] 本研究では, 回転面符号の耐故障性について, シリコンスピンキュービット鉄道アーキテクチャの2時間N$Nにマッピングする。
データキュービットではなくチェックキュービットのシャットリングがシステムのしきい値を大幅に改善することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:47:27 GMT)
SuperPaymaster: Eliminating Centralized Signer Authority via Asset-Oriented Abstraction to Reconcile Usability and Decentralization in Account Abstraction [0.0] ほとんどのECC-4337ペイマスターはプロセス指向抽象化(POA)に依存している。
本稿では,AOA(Asset-Oriented Abstraction)を提案する。
単一ユーザOp ERC-20転送を用いたオプティミズムメインネットのガスコストの評価を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:07:00 GMT)
Static-Field Tunneling Ionization in Space-Fractional Quantum Mechanics [0.0] 静的またはゆっくりと変化する電場におけるトンネル電離は強磁場物理学の基盤となる。
我々は,量子力学におけるADKライクなトンネルモデルを構築した。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:13:07 GMT)
Singularity Resolution in Quantum Cosmology via Page-Wootters Formalism [0.0] 量子重力のホイーラー・デウィット(WDW)フレームワークにおける平面対称ビアンチ型I宇宙における古典的ビッグバンの問題について検討する。
時間の問題に対処するために、クロックサブシステムにグローバルな状態を条件付けすることで、動的のリレーショナルな概念を提供するPage-Wootters形式を用いる。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:13:05 GMT)
Sequential Minimal Optimization for $\varepsilon$-SVR with MAPE Loss and Sample-Dependent Box Constraints [0.0] 我々は、$varepsilon$-SVRciteVapnik 1995, Drucker 1997, Smola2004から生じる二次双対問題に対して、MAPE(Mean Absolute Percentage Error)を最小化するために、逐次最小最適化(SMO)アルゴリズムを導出した。
実装はオープンソースの textttpsvr R packageciteBenavidesHerrera2026Rpsvr で利用可能である。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:38:49 GMT)
Semantic State Abstraction Interfaces for LLM-Augmented Portfolio Decisions: Multi-Axis News Decomposition and RL Diagnostics [0.0] 本稿では,スパースな非構造化テキストを監査可能な$K$にマッピングするための方法論テンプレートであるSemantic State Abstraction Interfaces (SSAI)を紹介する。
我々の貢献はフレームワークとその評価プロトコルであり、SSAIがより高密度な代替品よりも優れているという主張ではない。
我々は,SSAIをスパーステキスト決定システムのための解釈可能性・性能診断・再利用可能なプロトコルとして位置づける。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:37:40 GMT)
SNAPO: Smooth Neural Adjoint Policy Optimization for Optimal Control via Differentiable Simulation [0.0] SNAPOは、既知の差別化可能なシミュレータに神経ポリシーを組み込むフレームワークである。
すべてのポリシーパラメータと1つの随伴パスにおける全ての入力に対して、目的の正確な勾配を計算する。
SNAPOは,天然ガス貯蔵(1分以内のトレーニング,365の前方曲線感度を1感度当たり追加コストなしで行う),年金基金の資産信頼性管理,医薬品製造の3つの領域で実証する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:01:13 GMT)
SMolLM: Small Language Models Learn Small Molecular Grammar [0.0] 我々は、ZINC-250K薬物様分子ベンチマークにおいて、95%の妥当性で新しいSMILESを生成するためにSMolLMを訓練する。
機械的には、同じブロックが一定順序でパスにまたがるSMILESの制約を解消する。
これらの結果はコンパクトで機械的に解釈可能な分子生成物をもたらす。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:21:26 GMT)
Revisiting the multi-mode rhombus circuit as a biased-noise qubit [0.0] 我々は、ジョセフソン接合の対の干渉計を保護された核量子ビットとして使うという考え方を再考する。
ここでは、元の提案とは異なり、結合の1つのエネルギーを意図的に変更し、ロンバスキュービットのソフトバージョンを調べる。
この多モード回路における損失解析は、低周波、フラックスノイズ、準粒子トンネルが緩和時間を制限することを示唆している。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:34:54 GMT)
Retrieval-Conditioned Topology Selection with Provable Budget Conservation for Multi-Agent Code Generation [0.0] Retrieval-Guided Adaptive Orchestration (RGAO) は階層コードインデックスから構造複雑性ベクトルを抽出してループを閉じるアーキテクチャである。
RGAOは、サブエージェントが6次元の予算ベクトルによる正式な契約によって管理されるマルチエージェントフレームワークであるCode-Agent内で動作する。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:18:53 GMT)
Rethinking Vacuity for OOD Detection in Evidential Deep Learning [0.0] Evidential Deep Learning (EDL) における OOD (Out-of-Distribution) 検出の指標として, 不確実性質量 (UM) が一般的に用いられる。
AUROC と AUPR は,ID と OOD のクラス濃度が 1。
AUROC/AUPR は, ID と OOD の違いにより, モデル予測に変化を伴わずに人工的に膨らませることができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:00:56 GMT)
Research on Security Enhancement Methods for Adversarial Robust Large Language Model Intelligent Agents for Medical Decision-Making Tasks [0.0] 本研究は, 知的エージェントによる医療意思決定における敵の堅牢性, セキュリティ, 信頼を向上するための課題として, フルリンクセキュリティ強化フレームワークを開発する。
我々はARSM-Agentを提案し、意思決定精度の損失、敵の損失、安全性の低下、知識の整合性損失からなる重み付けされた共同目的を定義する。
セマンティック摂動、即発注射、薬物名混乱、偽証拠攻撃により、ARSM-Agentは全体の攻撃成功率を8.7%に下げ、知識一貫性スコア0.91を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:06:28 GMT)
Real-Time Quantum Dynamics on the Fuzzy Sphere: Chaos and Entanglement [0.0] ファジィ球面上の2つのボゾン場からなる行列モデルのリアルタイム量子力学について検討する。
一点相関関数と二点相関関数の時間発展を管理する結合非線形微分方程式の閉集合を導出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:04:15 GMT)
RSAT: Structured Attribution Makes Small Language Models Faithful Table Reasoners [0.0] RSATは、テーブルエビデンスに接地された細胞レベルの引用を段階的に推論する。
フェーズ1は、検証された推論トレースから構造化された出力フォーマットを教える。
RSAT は SFT 単独で 3.7$times$ (0.224$rightarrow$0.826) を改良し、ほぼ完全な引用の有効性を持つ。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:14:11 GMT)
Quantum-enhanced Large Language Models on Quantum Hardware via Cayley Unitary Adapters [0.0] 大規模言語モデル(LLM)は人工知能を変革した。
トレーニング可能なパラメータはすべて、モデルサイズと不相応にスケールする古典的なメモリを必要とします。
量子コンピューティングは質的に異なる経路を提供するが、実際のハードウェア上での実践的な実証はいまだに解明されていない。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:25:56 GMT)
Quantum-classical solvation hydrodynamics: Hamiltonian functionals and dissipation [0.0] 本研究では,古典的な極性溶媒と結合した量子溶質における短時間慣性効果をモデル化するための混合量子古典流体力学フレームワークを提案する。
我々は、一貫したバックリアクションを組み入れ、標準のエレンフェスト力学を超えた量子デコヒーレンスを維持するためにハミルトン的アプローチを採用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:20:49 GMT)
Quantum phase diagrams for bosons in hexagonal optical potentials: A continuous-space quantum Monte Carlo study [0.0] ハニカムおよびh-BN格子における超低温ボソンの相図について検討した。
ハニカム格子では、強い格子振幅であっても、標準ボース・ハッバードモデルから大きな偏差が見られる。
h-BNの場合、豊富な位相図が出現し、複数のモットローブと様々な亜格子の占有が特徴的である。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:54:17 GMT)
Quantum Darwinism and the quality of Petz recovery [0.0] 量子ダーウィン主義 (Quantum Darwinism) によれば、システム-環境相互作用は、特定のシステム特性を選択し、環境の多くの独立した部分集合でそれらを冗長に符号化する。
システムの初期状態とペッツ回収による復元状態との間の忠実度は, フラグメントサイズの関数としての台地を発達させることを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:49:51 GMT)
Quantitative propagation of chaos for Lindblad dynamics [0.0] 我々は、量子相対エントロピーという意味では、$N$粒子力学が極限非線形方程式のテンソル化解に収束することを証明する。
我々は、N$粒子密度作用素と対応する積状態の間の相対エントロピーに1/N$の順序境界を明示する。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:43:27 GMT)
PyCC.id: A package for hypothesis-driven equation discovery with structural identifiability [0.0] データ駆動型方程式発見は、基本的には、時系列測定から直接システムの支配的微分方程式を推論しようとする逆問題である。
この問題に対処するための道の1つは、既知の仮説と制約を事前にトレーニングフェーズに組み込むことである。
最近のアプローチでは、特性曲線(CC)にインスパイアされた構造骨格が組み込まれ、仮説駆動の方法論が定義されている。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:17:01 GMT)
Probabilistic Dating of Historical Manuscripts via Evidential Deep Regression on Visual Script Features [0.0] 本稿では,視覚的特徴のみから歴史写本ページの年代付けを行うための確率論的アプローチを提案する。
過去の文献で標準的なように数世紀をクラスに集約する代わりに、連続した年軸上の明らかな深い回帰問題として年代付けを行う。
我々のアーキテクチャは、効率の良いNet-B2バックボーンと正規逆ガンマ(NIG)出力ヘッドを組み合わせて、共同で負のlog-likelihoodとエビデンス・正規化の目的を訓練する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:00:19 GMT)
Precision gravimetry via harnessing interaction-induced resonances in optical lattices [0.0] 我々は,時間,システムサイズ,粒子数に関して,量子フィッシャー情報を解析し,そのスケーリングを決定する。
この精度の向上は、光学格子に閉じ込められた有限個の粒子を用いた重力加速度測定に利用できる。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:32:27 GMT)
Practical Log-Depth Quantum State Preparation and Circuit Verification via Tree Tensor Network Compilation [0.0] 行列積状態は量子系の効率的な古典的記述を提供する。
マトリックス生成物の状態を量子コンピュータにロードするための浅回路構成は、短期的なハードウェアで実用化するためには必要である。
本稿では, 単純なツリーテンソルネットワーク再正規化手法を用いて, 対数深さ量子回路の行列積状態の分解を行う。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:08:22 GMT)
Pontus-Mpemba effect in cavity quantum electrodynamics [0.0] 量子ポントス・ムペンバ効果(英: quantum Pontus-Mpemba effect)は、量子系が2段階の進化プロトコルを通してより速く緩和する反直観的な現象である。
この研究は、光子損失を持つJaynes-Cummingsモデルを用いて空洞量子力学におけるその実現を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:02:32 GMT)
Pomegranate: A Lightweight Compartmentalization Architecture using Virtualization Extensions [0.0] Pomegranateは、ソースコードを最小限または全く変更することなく、既存のシステムを安全に構成するフレームワークである。
igc NICドライバを用いたLinuxネットワークスタックにおけるPomegranateの有効性を示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:44:40 GMT)
PlotPick: AI-powered batch extraction of numerical data from scientific figures [0.0] PlotPickは、視覚言語モデル(VLM)を用いて、科学的数値から構造化されたデータをバッチ抽出するオープンソースツールである。
確立されたチャート・ツー・テーブル・ベンチマーク(ChartXとPlotQA)の3つのプロバイダからの6つのVLMを評価し、専用のチャート・ツー・テーブル・モデルであるDePlotと比較した。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:15:39 GMT)
PianoCoRe: Combined and Refined Piano MIDI Dataset [0.0] PianoCoReは、大規模なピアノMIDIデータセットで、主要なオープンソースピアノコーパスを統合し、洗練する。
データセットには、483人の作曲家によって書かれた5,625曲の250,046曲の演奏が含まれており、演奏された音楽の総数は21,763 hである。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:41:07 GMT)
Physics inspired quantum algorithm for QCD splitting functions [0.0] 量子回路プリミティブを導入し,QCDパーティション分割における絡み合いのダイナミクスをモデル化する。
純グルーオンチャネルでは,分割時に発生するヘリシティエンタングルメントの解析式を導出する。
出力グルーオン間で共有されるモーメントを計測結果にエンコードする2量子回路を構築する。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:00:08 GMT)
Pathways to AGI [0.0] 私たちの焦点は、重要なソフトウェア研究の観点に端を発する5つの関連する質問です。
この視点の根底にあるのは、AIに関連する現在の状況の必然性に関する仮定を避けることの必要性である。
私たちが見る必要があるのは、現在の商用AI開発と、一般的な社会的、政治的、経済的状況との結びつきの近さです。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:20:24 GMT)
Patch-Effect Graph Kernels for LLM Interpretability [0.0] 機械的解釈可能性(Mechanistic Interpretability)は、アクティベーションパッチによる因果回路の同定によってトランスフォーマー計算をリバースエンジニアリングすることを目的としている。
本稿では,アクティベーション対応プロファイルをモデルコンポーネント上のパッチ効果グラフとして表現することにより,メカニスティック解析をグラフ機械学習問題として再構成するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:03:47 GMT)
PRCD-MAP: Learning How Much to Trust Imperfect Priors in Causal Discovery [0.0] 本稿では,エッジ単位の信頼度を不完全に割り当てるソフトな事前消費層であるPRCD-MAPを提案する。
信頼度は経験的ベイズによってラプラス近似の限界確率で調整される。
実際のCausalTimeデータでは、PRCD-MAPは情報的LLMプリエンスを利用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:06:04 GMT)
Overcoming data scarcity through multi-center federated learning for organs-at-risk segmentation in pediatric upper abdominal radiotherapy [0.0] 堅牢な小児専門モデルの開発は、センター間でのデータ不足と断片化によって妨げられている。
フェデレートラーニング(FL)は、データ共有を必要とせずに、プライバシ保護による協調トレーニングを可能にする。
小児特異的OARセグメンテーションモデルを欧州の2つの医療センターで開発するためのFLの有効性と性能について検討した。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:21:43 GMT)
Optical Pulling Force in Carbon Nanotubes: Manifestation of Nonlocal Conductivity [0.0] 非局所伝導率のカーボンナノチューブに作用する光力の新しい理論を開発した。
光力は、CNT面上の表面電流密度と軸電場とで表される。
この研究は有限長低次元導体における光学的相互作用の理論的理解を前進させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 07:23:17 GMT)
On-Orbit Real-Time Wildfire Detection Under On-Board Constraints [0.0] 本研究では,9衛星の商業熱赤外星座上での軌道上山火事検出システムについて述べる。
このシステムは、200mのサンプリング距離で、未校正中波赤外線(MWIR)シングルバンド画像で動作する。
そこで本研究では,プロプライエタリな9サテライトMWIRデータセットを用いた軽量密度表現学習の実証的研究を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:47:27 GMT)
Non-Abelian String-Breaking Dynamics on a Qudit Quantum Computer [0.0] 純SU($2$)格子ゲージ理論における真の非アーベル弦破れ力学の最初の量子シミュレーションを報告する。
この結果は、ネイティブなクディット・ヒルベルト空間を用いて、閉じ込められたイオン量子コンピュータ上で、トランキャットされたゲージ場を符号化する。
我々の研究は、高エネルギー物理学に関連する非摂動力学にアクセスするための有望な経路として、ハードウェア効率、問題調整型キューディットシミュレーションを確立している。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:16:31 GMT)
Neural-Actuarial Longevity Forecasting: Anchoring LSTMs for Explainable Risk Management [0.0] Hybrid-Liftは階層型LSTMネットワークと平均バイアス補正アンカー機構を組み合わせたニューラルネットワークアクチュエータフレームワークである。
本研究は,ニューラルネットワークがSSTおよびSolvency II標準の下での長寿リスク管理に有効なモデル課題として機能することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:37:28 GMT)
Neural Discovery of Strichartz Extremizers [0.0] Strijectural bound inequality(英語版)は、分散PDEの現代理論の基礎である。
比較誤差が10~3ドル以内の$d=1,2$のエクストリームライザを検索する。
上述の A_q,r$ は接近するが、呼吸器群に沿って到達しない、という正確な予想を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:44:17 GMT)
Network-Mediated Capacitive Coupling Drives Fast OTOC Saturation in Superconducting Circuits [0.0] ネットワークを介する結合は演算子のスクランブルを著しく加速し, 隣り合う限界よりも急速に飽和することを示した。
これは、完全に発達した量子カオスではなく、部分的エルゴード性の出現を示している。
この動作は、現在の超伝導トランスモンデバイスの実験的に現実的な状態の中で発生するため、ネットワーク経由の結合が情報力学を質的に変化させる時期を特定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:21:36 GMT)
Negative Before Positive: Asymmetric Valence Processing in Large Language Models [0.0] 本研究では,大規模言語モデル (LLM) が内部構造や表面トークンマッチングを通じて感情価を処理しているかを検討する。
負の結果は初期層に局在し、正の結果は中期から後期層にピークとなる。
論文参考訳(メタデータ) (Thu, 07 May 2026 04:09:11 GMT)
Multitime memory beyond the quantum regression theorem in sequential measurement statistics [0.0] オープン量子系の逐次測定統計におけるメモリの存在について検討する。
因子化初期状態については、2時間プロパゲータをQRTのようなコントリビューションに正確に分解する。
本稿では,QRTが予測する関節確率と精度の差に基づいて,QRT違反の操作的定量化手法を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:33:21 GMT)
Multiplayer parallel repetition without dependency-breaking and anchoring variables: monotonic, concave amplification [0.0] 並列反復によるマルチプレイヤーゲームの最適値の減衰について定量的に推定する。
具体的には、そのような変数の代わりに単調凹函数を用いて最適値の減衰率を求めることができる。
論文参考訳(メタデータ) (Thu, 07 May 2026 21:57:54 GMT)
Multimodal Emotion Recognition via Causal-Diffusion Bridge (Affect-Diff) [0.0] ハッピーは65.9%であり、3つのエクマンカテゴリーは7%以下である。
Affect-Diff, a Causal-Diffusion Bridge that address this through three jointly trained mechanism。
3,292個のCMU-MOSEIサンプルにおいて,Affect-Diffは最強基線に対する18%の相対的改善である精度0.384の検証を達成した。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:29:26 GMT)
MultiLinguahah : A New Unsupervised Multilingual Acoustic Laughter Segmentation Method [0.0] 本稿では,エネルギーベースセグメント化音声シーケンスの異常検出として,笑いセグメンテーションタスクを設定する教師なし多言語手法を提案する。
提案手法を,スタンドアップコメディ,シットコム,オーディオセットからの一般的な短い音声を含む4つのデータセットに対して,最先端の笑い検出アルゴリズムと比較した。
以上の結果から,最先端の手法は多言語文脈に最適化されていないが,本手法は非英語環境では性能が優れていた。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:11:44 GMT)
Multi-Robot Coordination in V2X Environments [0.0] 本稿では,社会ロボット間の分散協調を可能にするV2X通信フレームワークを提案する。
このフレームワークは、ロボット意識サービス(RAS)とロボットマニューバー調整サービス(RMCS)の2つのロボット中心の施設層サービスを導入している。
RASは、外部から検出されたVulnerable Road Users(VRU)を協調的な認識に統合しながら、役割認識、タスク指向ロボットの認識を可能にする。
RMCSは、明確に確立された役割の下で、ロボット操作のイベント駆動、低レイテンシ調整をサポートする。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:58:48 GMT)
Modular wedge localization, Majorana fields and the Tsirelson limit of the Bell-CHSH inequality [0.0] 1+1$次元のマヨラナ場は、量子場理論におけるベル-CHSH不等式の違反を調べるために用いられる。
本研究では,サマーズ・ワーナーのモジュラーローカライゼーション構成を明示的なラピダリティ空間で実現する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:19:17 GMT)
Many-body theory predictions of positron binding energies in five-membered heterocycles involving N, O, S and NH substituents [0.0] N, O, S, NH置換基を持つ5員環複素環の陽電子結合エネルギーとダイソン軌道は、多体理論により強調される。
陽電子-分子相関ポテンシャル(自己エネルギー)はBethe-Salpeter方程式の解によって計算される。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:37:49 GMT)
Machine Learning Approaches to Building Quantum Circuits for Sets of Matrices [0.0] 解釈可能な機械学習を使って量子アルゴリズムを構築します。
任意の大きさの任意の対角行列に対して最短解析量子アルゴリズムを構築することができた。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:44:45 GMT)
MEMSAD: Gradient-Coupled Anomaly Detection for Memory Poisoning in Retrieval-Augmented Agents [0.0] 検索強化エージェントに対するメモリ中毒攻撃を,統合評価フレームワークを用いたStackelbergゲームとして定式化する。
ASR-R: 0.25〜1.00$) による攻撃成功度を4倍に向上させる。
私たちの主な貢献は、勾配結合に接地したキャリブレーションに基づく防御であるMEMSADである。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:41:14 GMT)
Lecture Notes on Statistical Physics and Neural Networks [0.0] 統計物理学は確率論または統計学の分野として扱われる。
有限構成空間上でボルツマン・ギブス分布と熱力学ポテンシャルを導入する。
制限付きボルツマンマシンの学習アルゴリズムについて議論する。
現代のディープラーニングが導入され、その初期の発展はボルツマン機械によって部分的に動機づけられた。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:08:49 GMT)
Knee Osteoarthritis Severity Grading Using Optimized Deep Learning and LLM-Driven Intelligent AI on Computationally Limited Systems [0.0] 変形性膝関節症(KOA)は関節可動性を著しく制限し、慢性的な痛みを引き起こし、品質に悪影響を及ぼす筋骨格障害の一つである。
本稿では,深層学習畳み込みニューラルネットワーク(CNN)とLite Liteを用いたデバイスベースプラットフォームを組み合わせることで,KOAの重大度グレーディングの自動診断手法を提案する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:24:04 GMT)
JaiTTS: A Thai Voice Cloning Model [0.0] JaiTTS-v1.0は、タイ語中心の音声コーパスの継続訓練によって構築された、最先端のタイ語音声クローンテキスト音声合成モデルである。
モデルアーキテクチャは、トークン化不要な自動回帰TSモデルであるVoxCPMから適応されている。
われわれのモデルでは、400台中283台が商用フラッグシップ機と対等に比較され、わずか58台が失われた。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:41:55 GMT)
Is Escalation Worth It? A Decision-Theoretic Characterization of LLM Cascades [0.0] 制約付き最適化と双対性に基づく決定論的フレームワークを開発する。
フレームワークを5つのプロバイダから8つのモデルにまたがる5つのベンチマークで検証します。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:32:27 GMT)
In Data or Invisible: Toward a Better Digital Representation of Low-Resource Languages with Knowledge Graphs [0.0] この提案は、Linked Open Data Knowledge Graphs (LOD KGs) の言語カバレッジに焦点を当てている。
我々は,言語版毎のウィキペディア記事数を含む,LOD KGの言語分布を特徴付ける重要な変数を同定する。
この分析に基づいて,多言語KG完了作業における言語間移動候補選択の影響について検討する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:36:54 GMT)
Hypothesis generation and updating in large language models [0.0] 大規模言語モデル(LLM)は、人々が問題を解決するのにますます役立っているが、どのように推論を行うかは、まだ不明である。
本稿では,数ゲームにおいて,学習者がいくつかの正の整数によって支持される仮説を推測する制御された設定について検討する。
3つの補足的プローブ(後部予測、仮説評価、仮説生成)を用いて後部仮説を測定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:24:54 GMT)
Hybrid Quantum-Classical GANs for the Generation of Adversarial Network Flows [0.0] 本稿では、悪意のあるトラフィックを模倣した合成ネットワークトラフィックフローを生成するためのハイブリッド量子古典的GAN(QC-GAN)フレームワークを提案する。
従来の判別器は、現実世界のデータセットと提案されたQC-GAN生成のフェイクネットワークフローに基づいて訓練される。
攻撃モデルでは、攻撃者は量子コンピューティング能力に制限がある状態アクターであり、識別器は古典的であると仮定する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:43:25 GMT)
Housing Potential Common Data Model and City Digital Twin [0.0] 本研究では,既存のデータサイロを克服するハウジングポテンシャル共通データモデル(HPCDM)を提案する。
本報告では、住宅用City Digital Twinとパイロットダッシュボードアプリケーションの作成とともに、本モデルの評価について詳述する。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:27:47 GMT)
HeadQ: Model-Visible Distortion and Score-Space Correction for KV-Cache Quantization [0.0] KV-cache量子化器は通常、注意重み付けされた読み出しによってロジットや値を通じてキーを読み取るが、ストレージ空間の再構築を最適化する。
永続的なキャッシュエラーは、モデル可視座標で測定されるべきである。
キーの場合、可視オブジェクトはスコアエラーのモジュロ定数シフトであり、これはキーサイドメソッドであるHeadQで、低ランク残余のサイドコードをキャリブレーション付きクエリベースで格納する。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:08:59 GMT)
Grokers: Bottom-Up Inductive Comprehension and Write-Time Intelligence over Typed Knowledge Graphs [0.0] Grokersは、型付き知識グラフの永続的で構造化された理解を構築するためのアーキテクチャである。
自律的なGrokerエージェントは、型付きストリームグラフのノードを分析し、制御された言語モデル呼び出しを通じて構造化属性を抽出する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:28:36 GMT)
Generalized Catability of Relativistic Quantum States Measurement in a Unified Lie-Algebraic Foldy-Wouthuysen (FW) Framework [0.0] ケータビリティのリー代数的定式化は、この枠組み内で任意のスピンを持つ相対論的量子系に対して構成される。
この分析は、コヒーレンス構造と量子干渉特性を研究する重畳されたコヒーレント状態の定量的尺度として、キャスタビリティを構築することから始まる。
この文脈では、一般化されたフレームワークは任意のスピン=s$場に対して構築され、より高いスピン相対論的量子状態の研究を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:20:17 GMT)
Generalising Travel Time Prediction To Varying Route Choices In Urban Networks [0.0] 本稿では,経路選択の識別に成功し,正確なフローおよび走行時間予測を提供する汎用旅行時間予測器TTP(GenTTP)を提案する。
これは重要なギャップに対処する: 様々な経路割り当てをまたいで一般化する旅行時間予測モデルの欠如。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:29:08 GMT)
Gaussian mixture models in Hilbert spaces via kernel methods [0.0] クラスタリングアプリケーションに動機付け,カーネル平均埋め込みに基づくHilbert空間値データを特徴付けるフレームワークを提案する。
提案アルゴリズムが十分に定義されており、無限次元空間における近似の密度の高いクラスが得られることを示す理論的保証を確立する。
近代医学応用におけるラプラシア空間の関数データとランダムグラフの$L2$を含む多種多様な構造とデータジオメトリに関する広範な実験を通じて、このフレームワークを評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:48:17 GMT)
From Token Lists to Graph Motifs: Weisfeiler-Lehman Analysis of Sparse Autoencoder Features [0.0] 本稿では,各SAE特徴をトークン共起グラフとしてモデル化したグラフ構造化表現を提案する。
カスタムなWLスタイルの周波数結合グラフカーネルは、この構造空間上の類似度尺度を提供する。
トークンヒストグラムベースラインは、全体的な純度を高くするので、グラフビューの寄与は、支配的ではなく補完的である。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:15:16 GMT)
From Specification to Deployment: Empirical Evidence from a W3C VC + DID Trust Infrastructure for Autonomous Agents [0.0] MolTrustは、自律エージェントのためのオープンでポータブルで暗号的に検証可能な信頼基盤である。
本稿では,W3C Verifiable Credentials 2.0 と Decentralized Identifiers v1.0 を基盤として構築された,そのようなインフラストラクチャを実運用的に実装する。
このコントリビューションは、信頼基盤規制当局と業界が収束した証拠であり、今日ではW3C標準化プリミティブを使用して実装可能である。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:09:51 GMT)
From Information Geometry to Jet Substructure: A Triality of Cumulant Tensors, Energy Correlators, and Hypergraphs [0.0] ペアワイズ・フィッシャーグラフは、既約多可観測放射パターンと通常のペアワイズ相関の集合を区別できない。
この欠落構造は、自然に高階フィッシャーテンソルによって供給されることを示す。
これらの構造を開発し、なぜ正確な累積解釈が自然指数族座標に特別なのかを述べる。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:24:30 GMT)
Finite-size general security for differential phase shift keying via variable-length quantum key distribution [0.0] 微分位相シフト鍵(DPSK)は、実用的な量子鍵分布への経路を構成する。
DPSKのセキュリティの最近の進歩は、一般敵に対するセキュリティを証明している。
提案手法は,12dBを超える105ドルの信号で秘密鍵レートを達成し,産業用DPSKの実験的実装性を証明する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:27:24 GMT)
Features have life history. And we should care [0.0] 訓練中に特徴が出現し、持続し、死滅するが、その歴史の重要性はほとんど解明されていない。
我々は,Pythia-160M と -410M をキャリアの足場として同定した,持続的な表現バックボーンの証拠を見いだした。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:12:42 GMT)
Feature Dimensionality Outweighs Model Complexity in Breast Cancer Subtype Classification Using TCGA-BRCA Gene Expression Data [0.0] TCGA-BRCA遺伝子発現データを用いて,モデル複雑性と特徴選択がサブタイプ分類性能に及ぼす影響を評価する。
ロジスティック回帰は、希少なクラスの検出の改善を含む、サブタイプ間で最も安定かつバランスの取れた性能を示した。
SVMは特徴的次元に敏感であるのに対し,ランダム林は総合的精度が強いにもかかわらず少数サブタイプでは性能が低かった。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:55:46 GMT)
Ex Ante Evaluation of AI-Induced Idea Diversity Collapse [0.0] 本稿では,AIによるヒトの多様性崩壊をベンチマークするための人間関係フレームワークを提案する。
コングリゲート可能な資源としてアイデアをモデル化することにより、ソースレベルの集団化が流通内比較から特定可能であることを示す。
例えば、$ge1$は必要のないパリティ条件であり、露出依存冗長コストで採用ゲームに$$を接続することを示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:38:17 GMT)
Entanglement generation in a two-body Schrödinger--Newton model [0.0] 局所非線形自己局在を非分離ニュートン対ポテンシャルから分離する2体シュルディンガー-ニュートンモデルを提案する。
非線形自己場はシュミットスペクトルを保存するが、直接絡み合いの発生は非分離ペアポテンシャルから生じる。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:07:15 GMT)
Engineering a driven-dissipative bath of altermagnetic quantum magnons for controlling classical dynamics of spins hosting spin waves, domain walls, or skyrmions [0.0] 強磁性絶縁体(FI)層内の古典的な局在スピンに作用するボゾン浴について検討した。
ボゾン浴は、従来のFI層に取り付けられた磁気絶縁体(AMI)の層内の量子マグノンから構成される。
我々は、AMI/FI二層膜のFI層内でのスピントロニクスおよびマグノン効果のチューニングにこれらの用語を利用する方法を示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:58:33 GMT)
Electronic and Photonic Integration of Single Quantum Emitters in 2D Materials [0.0] 単一光子源は量子通信やフォトニック量子情報処理に不可欠である。
多くの固体プラットフォームは、有用な線幅、安定性、明るさを達成するために、いっさいの光学励起、注意深いアライメント、選択後の選択に依存している。
本稿では,2次元材料における単一量子エミッタの電子・フォトニック統合の最近の進展を概観する。
論文参考訳(メタデータ) (Thu, 07 May 2026 06:10:03 GMT)
Eigenstate-Selective Entangled Two-Photon Absorption in Monolayer WSe$_2$ [0.0] 偏光共役光子対のベル状態相がバイエクシトン固有状態分布を制御することを示す。
この$varphi$依存の固有状態分布を再現する古典的な偏極源は存在しない。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:37:13 GMT)
Dzyaloshinskii-Moriya interaction as a coherence diagnostic for chirality-induced spin selectivity [0.0] 2つのシナリオは、キラル分子ブリッジによって媒介される超交換相互作用における鋭い対称性の基準によって区別可能であることを示す。
我々は, 閉形角, エナンチオマー, 感度シグネチャを導出し, 臨界コヒーレント回転角が電流輸送推定値より2桁下にあることを示す。
提案手法は、長期にわたる輸送論争を量子振幅分解能を持つ二進スピン量子ビット実験に変換する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:01:36 GMT)
Drawing Lines in Psychological Space: What K-means Clustering Reveals in Simulated and Real Psychometric Data [0.0] K平均のクラスタリングは、プロファイル、サブグループ、潜在的なタイプポロジーを識別するために、心理学的および心理学的な研究で広く用いられている。
本稿は、K-平均が真の部分群構造を持たない連続ガウス潜在空間においても安定かつ視覚的に整合なクラスタリング解を生成できると主張している。
論文参考訳(メタデータ) (Thu, 07 May 2026 22:10:05 GMT)
Does Synthetic Data Help? Empirical Evidence from Deep Learning Time Series Forecasters [0.0] 合成データは言語モデルの訓練に変化をもたらしたが、時系列予測におけるその役割はいまだに理解されていない。
本研究では, 5 つのアーキテクチャ, 4 つの合成信号, 7 つのデータセットにまたがる合成時系列拡張を大規模に評価する実験的検討を行った。
チャネルミキシングモデル(TimesNet、iTransformer)は試験の大部分で恩恵を受け、チャネルに依存しないモデルは一貫して劣化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 11:22:45 GMT)
Directional Consistency as a Complementary Optimization Signal: The GONO Framework [0.0] 我々は、深層学習最適化における未探索現象を定式化し、指向性アライメントと損失収束を分離することができる。
本稿では,方向整合性の下でモーメントを増幅し,振動中にそれを抑圧する cc_t に基づいて,Adam の運動量ベータを適応させる GONO を紹介する。
我々は、GONOがAdamの収束率と一致することを証明し、信号が非形式的であるとき、正確にAdamに還元する。
論文参考訳(メタデータ) (Thu, 07 May 2026 17:05:05 GMT)
Dimensional Coactivation for Representational Consistency in Frozen Vision Foundation Models [0.0] 本研究は,凍結基礎モデルが意味領域をまたいだ1つのサンプルを連続的に表現するかどうかを考察する。
本稿では,このコヒーレンスを測定するための次元別コヒーレンス(DCA)について紹介する。
DCAは安定な1次元座標系に依存し、領域抽出のみに依存しない。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:32:47 GMT)
Diffusion model for SU(N) gauge theories [0.0] 暗黙のスコアマッチングは、拡散モデルの訓練に計算的に効率的なアプローチを提供する。
拡散モデルの訓練を成功させ,ウィルソンゲージ動作のサンプリングに適用できることが示される。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:34:27 GMT)
Data Language Models: A New Foundation Model Class for Tabular Data [0.0] データ言語モデル(DLM)は、言語モデルが文を理解する方法を理解する。
DLMは、言語モデルが文を理解する方法を理解する。
生の細胞だけから、目に見えないデータセットの業界セクターを特定します。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:56:49 GMT)
Cumulative-Goodness Free-Riding in Forward-Forward Networks: Real, Repairable, but Not Accuracy-Dominant [0.0] フォワード・フォワード(FF)トレーニングでは、各レイヤが局所的な善良さの基準から学ぶことができる。
累積・良さのバリエーションでは、後続のレイヤは、以前のレイヤがすでに部分的に分離したタスクを継承することができる。
我々はこの現象を層フリーライディングとして定式化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:24:58 GMT)
CoupleEvo: Evolving Heuristics for Coupled Optimization Problems Using Large Language Models [0.0] 結合最適化問題に対する3つの進化的コーディネート戦略を提案する。
実験により、分解に基づく戦略はより安定な収束とより高い解品質をもたらすことが示された。
統合進化戦略は、検索の複雑さと多様性の増大に悩まされている。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:29:05 GMT)
Can AI Debias the News? LLM Interventions Improve Cross-Partisan Receptivity but LLMs Overestimate Their Own Effectiveness [0.0] しかし、大きな言語モデル(LLM)は、そのようなコンテンツを大規模に嫌悪する潜在的手段を提供する。
LLMによるリベラルニュースの見出しのデバイアスが、保守的な読者の信頼関連判断を改善できるかどうかを検証した。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:16:32 GMT)
COVID-19 Infodemic. Understanding content features in detecting fake news using a machine learning approach [0.0] 本研究は,偽ニュースの検出を改善するために,単語大文字,音声配信部分などのコンテンツ特徴の選択について検討する。
新型コロナウイルスのパンデミックで収集された新しいデータセットについて、一連の実験を行った。
論文参考訳(メタデータ) (Thu, 07 May 2026 15:36:17 GMT)
Budgeted Attention Allocation: Cost-Conditioned Compute Control for Efficient Transformers [0.0] 予算付注意割当(Budgeted Attention Allocation)は、要求された注意予算に基づいて調整されたモノトーンヘッドゲイティング機構である。
ハードゲート適応はソフトコスト制御を計測シングルスレッドCPU速度に変換する。
BERT-Miniの予算ゲートは97.4%に達し、予算は0.50と96.6%に達している。
論文参考訳(メタデータ) (Thu, 07 May 2026 05:37:44 GMT)
BitCal-TTS: Bit-Calibrated Test-Time Scaling for Quantized Reasoning Models [0.0] BitCal-TTSは、greedy 4ビット推論のための軽量ランタイムコントローラである。
標準のHugging Face 4ビット推論と統合され、フォワードフックを使ってログとラストレイヤーの隠蔽状態を生成する。
Qwen2.5インストラクトモデルによるGSM8Kの評価シャードについて、BitCal-TTSは、非ビット対応ベースラインよりも正確なマッチング精度を向上させる。
論文参考訳(メタデータ) (Thu, 07 May 2026 01:10:34 GMT)
Binary Image-Based Intrusion Detection for Operational Technology Networks: Extending the SPHBI Methodology from IoT to Modbus TCP [0.0] 本稿では,Single Packet Header Binary Image(SPHBI)の侵入検出手法をIoTからTCPに拡張する。
TCP/IPヘッダだけでは51.8%のバイナリ精度しか達成していない。
8バイトのアプリケーション層情報を追加すると、バイナリの精度は98.1%向上する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:46:06 GMT)
Bias and Uncertainty in LLM-as-a-Judge Estimation [0.0] LLM-as-a-Judge評価は,ベースモデルの性能評価の標準ツールとなっている。
近年の研究では、このバイアスを修正するための推定器が提案されているが、その信頼性は判断品質とモデル比較において、キャリブレーション安定性に大きく依存している。
本研究では,これらの故障モードを解析結果,判定品質のシミュレーション,モデル間キャリブレーション不安定性などを通じて検討する。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:55:21 GMT)
Beyond the Black Box: Interpretability of Agentic AI Tool Use [0.0] 本稿では,スパースオートエンコーダと線形プローブ上に構築された機械論的・解釈可能性ツールキットを提案する。
フレームワークは各アクションの前にモデル状態を読み出し、ツールが必要かどうか、そして次のツールアクションがいかに適切かの両方を推測する。
我々は、NVIDIA Nemotron関数呼び出しデータセットから多段階の軌道上のプローブをトレーニングし、GPT-OSS 20BとGemma 3 27Bモデルに同じワークフローを適用する。
論文参考訳(メタデータ) (Thu, 07 May 2026 19:47:30 GMT)
Beyond Collection: Measuring the Detection Efficacy of Modern Security Logging Standards [0.0] 本稿では,SETC(Security Exploit Telemetry Collection)フレームワーク上に構築された新しい手法を用いて,最新のセキュリティロギング標準を初めて体系的に評価する。
SETCはコンテナ化された環境で再現可能なエクスプロイトシナリオを生成し、複数のロギング標準にわたって豊富なテレメトリを収集する。
各ロギング標準の検出効率は、テレメトリ完全性の測定と、標準化されたログ間の検出可能性の活用により定量化される。
論文参考訳(メタデータ) (Thu, 07 May 2026 00:19:31 GMT)
Beyond Activation Alignment: The Geometry of Neural Sensitivity [0.0] そこで我々は,小摂動を識別する表現能力に着目した,局所的測位可能な情報に基づくフレームワークを提案する。
対称正定値行列の多様体上の対数スペクトル距離を用いてこれらの正規化シグネチャを比較する。
経験的に、このフレームワークは、独立に訓練された人工ニューラルネットワークで対応するレイヤのリカバリを可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:48:41 GMT)
BUILD-AND-FIND: An Effort-Aware Protocol for Evaluating Agent-Managed Codebases [0.0] BUILD-AND-FINDは、下流エージェントが生成されたリポジトリから意図した選択を復元できるかどうかを評価するプロトコルである。
各タスクに対して、ビルダーは隠されたリポジトリの仕様を見て、仕様に書かれた複数選択の質問バンクを作成します。
このプロトコルは、行動の正しさをアーティファクト側のリカバリから切り離し、リカバリの正確性、再現性、実装のカバレッジ、検査の労力を報告します。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:35:27 GMT)
Attribution-Based Neuron Utility for Plasticity Restoration in Deep Networks [0.0] 継続的な学習研究は、新しい知識獲得と以前に獲得した知識の保存という2つの基本的な能力を保存しようとする。
近年の研究では、ニューロン飽和、ノルム成長、有用な曲率方向の喪失など、この現象の根底にある複数のメカニズムが特定されている。
適応的リセットに基づく介入は、訓練性を取り戻すための実践的な解決策として現れてきた。
論文参考訳(メタデータ) (Thu, 07 May 2026 18:42:22 GMT)
Assessing Student Ability to Select an Algorithmic Paradigm [0.0] 本稿では, アルゴリズム設計パラダイムを選択するために, 学生の知識を評価するための最初の試みについて述べる。
このプロセスで学んだ重要なポイントについて、アルゴリズム設計パラダイムのための複数選択の質問を書くことについて論じる。
論文参考訳(メタデータ) (Thu, 07 May 2026 20:19:52 GMT)
Architecture-agnostic Lipschitz-constant Bayesian header and its application to resolve semantically proximal classification errors with vision transformers [0.0] この研究は、アーキテクチャに依存しないリプシッツ・コンスタント・ベイジアンヘッダを示し、視覚変換器のような特徴抽出器に統合することができる。
また,不確実性と不確かさを誤分類率で捉えるための新しい指標と,適応型算術・平均融合方式を提案する。
モンテカルロサンプリングにより計算コストは上昇するが、事前に訓練されたバックボーンとのプラグ・アンド・プレイの互換性を提供する。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:18:06 GMT)
Architecture Matters: Comparing RAG Systems under Knowledge Base Poisoning [0.0] RAGシステムは知識ベース中毒に弱いが、既存の攻撃はほとんどバニラレトリプタン生成パイプラインに対して評価されている。
我々は,921の自然質問QAペアに対して,制御された単一文書中毒の4つのRAGアーキテクチャ(vanilla RAG, agentic RAG, MADAM-RAG, Recursive Language Models)を評価した。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:36:14 GMT)
AoI-Guided Client Selection for Robust and Timely Federated Intrusion Detection in Cloud-Edge Security Analytics [0.0] フェデレーション学習は、生ログを集中化せずに分散テレメトリ上で協調的なトレーニングを可能にするため、クラウドエッジの侵入検出にとって魅力的なものだ。
本稿では,情報時代(AoI)を用いた時系列認識システム問題としてのクライアント参加について検討する。
AoI-first, utility-first, and a hybrid AoI+utility rule with a tunable trade-off parameters。
論文参考訳(メタデータ) (Thu, 07 May 2026 03:51:15 GMT)
AniMatrix: An Anime Video Generation Model that Thinks in Art, Not Physics [0.0] AniMatrixは、物理的正確性ではなく芸術性を再定義するビデオ生成モデルである。
AniMatrixは、二重チャネルの条件付け機構と3段階の遷移によって、物理的な正確さよりも芸術性を目標としている。
プロのアニメーターによる5つの制作次元を持つアニメ固有の人間評価において、AniMatrixは5つ中4つにランクインしている。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:35:51 GMT)
Analytic $C_{\ell_1}$ norm of Coherence Evolution for Bell States under a Two-Qubit Superconducting Hamiltonian [0.0] 最小2量子ビット超伝導系におけるユニタリコヒーレンスダイナミクスの正確な解析研究について述べる。
ベル状態の2つの状態は定数コヒーレンスを持つモデル力学の下で不変であることが示され、他の2つの状態は制御されたパラメータ依存コヒーレンス振動を示す。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:22:34 GMT)
An Explainable Unsupervised-to-Supervised Machine Learning Framework for Dietary Pattern Discovery Using UK National Dietary Survey Data [0.0] 本稿では、食事パターンの発見、再現、解釈のための教師なし機械学習フレームワークを提案する。
19歳以上, NDNS 12~15歳以上の成人は, 25個のエネルギー調整栄養素, 食品群で表わされた。
高脂肪食とナトリウム, 高繊維果実野菜の微小栄養素, 高遊離糖スナック, 糖飲料の4つの解釈可能な食事パターンが同定された。
論文参考訳(メタデータ) (Thu, 07 May 2026 09:05:14 GMT)
An Agent-Oriented Pluggable Experience-RAG Skill for Experience-Driven Retrieval Strategy Orchestration [0.0] Experience-RAG Skillはエージェント指向のプラグ可能な検索オーケストレーション層で、エージェントとレトリバープールの間に位置する。
固定候補プールの下では、Experience-RAG SkillはBeIR/nq、BeIR/Hotpotqa、BeIR/scifactで0.8924のnDCG@10を達成する。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:12:37 GMT)
Agentic, Context-Aware Risk Intelligence in the Internet of Value [0.0] インターネット・オブ・バリュー(英語: Internet of Value、IoV)は、不均一で部分的に信頼されているネットワークであり、支配的な限界リスクは複合的(ルート、感情、流動性、システムがコミットする意思のあるポリシー)である。
この体制に適切なリスクプリミティブは、価格、流動性、ボラティリティ、ルートヘルスに関する予測エンジン、テキスト上の感情融合エンジン、オンチェーンフロー、グレー文学フィード、コンスティチューション下のエージェントエンジン、ロールバウンドアクション制約によるエージェントエンジン、予測をコミットされたアクションプログラムに変換するAPIリスクとシナリオエンジンの5つからなる。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:44:58 GMT)
Addressing Labelled Data Scarcity: Taxonomy-Agnostic Annotation of PII Values in HTTP Traffic using LLMs [0.0] 本稿では,HTTPメッセージ本体内のPII値の分類に依存しないアノテーションをLarge Language Modelsがサポートできるかどうかを検討する。
決定論的事前処理とラベルレベルの分類,ターゲットインスタンスレベルの値アノテーション,出力検証を組み合わせた多段階LLMパイプラインを提案する。
その結果, パイプラインはPIIのタイプを正確に検出し, 対応するPIIを抽出することがわかった。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:08:22 GMT)
ANCORA: Learning to Question via Manifold-Anchored Self-Play for Verifiable Reasoning [0.0] オープンエンドカリキュラムの自己プレイに向けてのパラダイムシフトを提案する。
本稿では、新しい仕様を合成するプロポーラと、検証されたソリューションを生成する解決器とを、ポリシーが交互に扱うANCORAを紹介する。
我々はANCORAがDafny2Verus pass@1を26.6%のSFTベースラインから81.5%のテストタイムトレーニング(TTT, 0-shot)に引き上げたことを示す。
移行設定では、Dafny2Verusシードからのトレーニングは、保持されたMBPPとHumanEvalで36.2%と17.2%のpass@1を得る。
論文参考訳(メタデータ) (Thu, 07 May 2026 08:46:02 GMT)
AI-Generated Images: What Humans and Machines See When They Look at the Same Image [0.0] オンライン偽情報キャンペーンにおける生成AIの誤用は、透明で説明可能な検出システムの必要性を強調している。
我々は様々なアーキテクチャと微調整戦略を備えた検出器群を開発した。
我々は最先端のテキスト・ツー・イメージAIジェネレータの性能を評価する。
論文参考訳(メタデータ) (Thu, 07 May 2026 12:40:13 GMT)
A Unified SU(2) Framework for Vector Beam Transformations and Complex Beam Shaping [0.0] 複屈折光学素子を用いた構造光場間の変換を設計するための構成的枠組みを提案する。
この枠組みでは、ベクトルビーム間の変換は空間的に変化するSU(2)演算として扱われる。
これらの結果は、複素ビーム整形およびベクトルビーム変換への統一的かつ明示的に構成的な経路を確立する。
論文参考訳(メタデータ) (Thu, 07 May 2026 16:59:18 GMT)
A UEFI System with SPDM to Protect Against Unauthorized Device Connections [0.0] そこで本研究では,PCIeとUSBデバイスが接続しようとする際の認証を行うシステムを提案する。
本研究では,エミュレーションを用いた概念実証をオープンソースで開発し,提案手法の評価と説明を行う。
ファームウェアの実行中、命令数とCPUサイクル数は平均して13%、8%増加した。
論文参考訳(メタデータ) (Thu, 07 May 2026 14:40:26 GMT)
A Systematic Investigation of The RL-Jailbreaker in LLMs [0.0] 敵対的ジェイルブレイク(英: Adversarial jailbreaking)は、有害な出力を引き出すためのモデルの戦略的操作である。
本稿では,第1回強化学習ジェイルブレイクの体系的分解について述べる。
この研究は、RL-jailbreaker効率を改善するためのツールを提供し、究極的には、RLベースの攻撃に耐性のある生成モデルを強化する。
論文参考訳(メタデータ) (Thu, 07 May 2026 23:22:07 GMT)
A Self-Healing Framework for Reliable LLM-Based Autonomous Agents [0.0] 本稿では,LSMベースのソフトウェアエージェントのための信頼性を考慮した自己修復フレームワークを提案する。
提案フレームワークはマルチエージェントのワークフロー環境に実装され,実世界のタスクシナリオを用いて評価される。
論文参考訳(メタデータ) (Thu, 07 May 2026 13:10:41 GMT)
A Scalable Digital Twin Framework for Energy Optimization in Data Centers [0.0] 本研究では,データセンターにおけるエネルギー最適化のためのスケーラブルなDigital Twinフレームワークを提案する。
このフレームワークはIoTベースのデータ取得、クラウドコンピューティング、機械学習技術を統合し、リアルタイム監視、予測、インテリジェントエネルギー管理を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 02:00:49 GMT)
A Case-Driven Multi-Agent Framework for E-Commerce Search Relevance [0.0] 関連性(Relevance)は、eコマース検索におけるユーザエクスペリエンスの基盤である。
本稿では,ケース駆動型マルチエージェントフレームワークを提案する。
このフレームワークは、関連性関連タスクを効果的に実行し、アノテーションの精度を向上し、よりタイムリーで一般化可能なバッドケースの解決を可能にする。
論文参考訳(メタデータ) (Thu, 07 May 2026 10:41:50 GMT)