SpecEyes: Accelerating Agentic Multimodal LLMs via Speculative Perception and Planning [104.0] エージェント・マルチモーダル・大規模言語モデル(MLLM)は,反復的な視覚的ツールの実行によって顕著な推論能力を達成する。
しかし、カスケード認識、推論、ツール呼び出しループは、重要なシーケンシャルなオーバーヘッドをもたらす。
このオーバーヘッドはエージェントディープと呼ばれ、禁止されたレイテンシを発生させ、システムレベルのスループットを著しく制限します。
本稿では,エージェントレベルの投機的アクセラレーションフレームワークであるSpecEyesを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:45:47 GMT)
Who Spoke What When? Evaluating Spoken Language Models for Conversational ASR with Semantic and Overlap-Aware Metrics [99.9] 音声の重複や遠距離雑音,話者数の変化など,会話の自動音声認識は依然として困難である。
近年のLCMベースのシステムは単一話者のベンチマークでは良好に動作するが、マルチ話者設定におけるロバスト性は不明確である。
重なり、意味的忠実度、話者数、シングルチャンネルとマルチチャネル入力の4つの軸に沿って、LLMベースのアプローチとモジュラーアプローチを体系的に比較する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:01:21 GMT)
Form-Fitting, Large-Area Sensor Mounting for Obstacle Detection [99.1] 本研究では,センサをロボットリンクに装着して大規模センシングを行うための低コストな手法を提案する。
コンピュータ支援設計(CAD)を用いることで、ロボットの皮膚カバー、またはスキンユニットをプロシージャ的に生成し、非発達可能な表面の周囲に適合させることができる。
スキンユニットは、どんなサイズでもプリントされた回路基板のマウントを埋め込んで、センサーを固定された場所や既知の場所に保持する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:20:57 GMT)
Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.5] フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:39:09 GMT)
Cluster-Wise Spatio-Temporal Masking for Efficient Video-Language Pretraining [86.5] ClusterSTMは、効率的なビデオ言語事前学習のためのクラスタワイズ時空間マスキング戦略である。
従来の視覚的再構成以上の高レベルなマルチモーダル・セマンティクスを整列するビデオテキスト関連性再構築手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:48:15 GMT)
FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization [84.6] 本稿では,大規模言語モデルにおける推論ボトルネックを克服する強化学習アルゴリズムであるFuture-KL Influenced Policy Optimization (FIPO)を提案する。
FIPOは、割引先KLの分岐をポリシー更新に組み込むことでこの問題に対処し、その後の軌道行動への影響に基づいてトークンを再重み付けする密集した有利な定式化を作成する。
Qwen2.5-32Bで評価され、FIPOは平均チェーン長を約4,000から10,000以上のトークンに拡張し、AIME 2024 Pass@1の精度を50.0%から58.0%に向上させた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:56:41 GMT)
Cog3DMap: Multi-View Vision-Language Reasoning with 3D Cognitive Maps [77.6] マルチビュー画像から明示的な3Dメモリを連続的に構築するフレームワークであるCog3DMapを紹介する。
本フレームワークは空間的に構造化された3次元マップ上での直接推論を可能にし,様々な空間推論ベンチマーク上で最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:05:32 GMT)
Rethinking Token-Level Policy Optimization for Multimodal Chain-of-Thought [73.4] マルチモーダル・チェーン・オブ・ソート(CoT)推論は、推論軌道を構築するために大きな視覚言語モデルを必要とする。
既存のReinforcement Learning with Verifiable Rewards (RLVR) 法は、様々な視覚的接地度を区別することなく、CoTを均一に扱う。
本稿では,隠れ状態の類似性に先立って認識を導き,トークンのエントロピーと統合する知覚探索ポリシー最適化(PEPO)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:38:00 GMT)
PoseDriver: A Unified Approach to Multi-Category Skeleton Detection for Autonomous Driving [72.7] PoseDriverは、駆動シナリオで一般的なオブジェクトに合わせたボトムアップのマルチカテゴリスケルトン検出のための統合フレームワークである。
骨格表現に基づく車線検出のための新しい手法を提案し,OpenLaneデータセット上での最先端性能を実現する。
自転車の骨格検出のための新しいデータセットを提案し,新しいカテゴリーへのフレームワークの転送性を評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:56:35 GMT)
Adapting Self-Supervised Speech Representations for Cross-lingual Dysarthria Detection in Parkinson's Disease [72.0] 音声表現は、しばしば言語に依存した構造を符号化する。
本稿では,ソース言語による自己教師型音声表現とターゲット言語分布とを一致させる表現レベル言語シフトを提案する。
チェコ語,ドイツ語,スペイン語におけるパーキンソン病音声データセットの経口DDK記録に対するアプローチについて検討した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:05:08 GMT)
PERMA: Benchmarking Personalized Memory Agents via Event-Driven Preference and Realistic Task Environments [72.0] 静的な嗜好リコールを超えてペルマの一貫性を評価するためのベンチマークであるPERMAを紹介する。
PerMAは、複数のセッションとドメインにまたがる時間的に順序付けられたインタラクションイベントと、時間とともに好みに関連するクエリで構成されている。
実験により、関連するインタラクションをリンクすることで、高度なメモリシステムはより正確な好みを抽出し、トークン消費を減らすことができることが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:04:11 GMT)
TDATR: Improving End-to-End Table Recognition via Table Detail-Aware Learning and Cell-Level Visual Alignment [70.8] TDATR(Table Detail-Aware Table Recognition)は、テーブルの詳細学習とセルレベルの視覚アライメントにより、エンドツーエンドのTRを改善する。
データセット固有の微調整なしで、7つのベンチマークで最先端または高い競争性能を達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:45:02 GMT)
UniDial-EvalKit: A Unified Toolkit for Evaluating Multi-Faceted Conversational Abilities [70.8] 対話型AIシステム評価のための統合評価ツールキットUniDial-EvalKit(UDE)を提案する。
UDEは異種データフォーマットを普遍的なスキーマに標準化し、モジュールアーキテクチャを通じて複雑な評価パイプラインを合理化し、一貫したスコアリングインターフェースの下でメートル法計算を調整する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:01:31 GMT)
Dual-Teacher Distillation with Subnetwork Rectification for Black-Box Domain Adaptation [69.7] ブラックボックスドメイン適応は、非常に実用的で非常に困難な設定である。
ブラックボックスソースモデルに埋め込まれた特定の知識を活用するサブネットワーク整合モデル(DDSR)を用いた二重蒸留法を提案する。
我々の手法は、ソースデータやモデルの使用を含む、最先端の手法に対する一貫した改善を実証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:54:19 GMT)
GeoTikzBridge: Advancing Multimodal Code Generation for Geometric Perception and Reasoning [68.8] GeoTikzBridgeは、Tikzベースのコード生成を通じて局所的な幾何学的知覚と視覚的推論を強化するフレームワークである。
このフレームワーク内では、2つの補完的なデータセットによってサポートされている2つのモデルを構築します。
本モデルは,オープンソースMLLMの最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:27:51 GMT)
PhysSkin: Real-Time and Generalizable Physics-Based Animation via Self-Supervised Neural Skinning [68.1] PhysSkinは、リアルタイム物理ベースのアニメーションのための物理インフォームドフレームワークである。
メッシュフリー、離散化非依存、物理的に一貫したスキンフィールドを生成し、様々な3D形状でうまく一般化する。
PhysSkinは、一般化可能なニューラルスキンの優れた性能を示し、リアルタイム物理ベースのアニメーションを可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:41:14 GMT)
UniQueR: Unified Query-based Feedforward 3D Reconstruction [68.0] 提案するUniQueRは,未提示画像からの3次元再構成を効率よく正確に行うための,クエリベースの統合フィードフォワードフレームワークである。
我々のモデルは、明示的な幾何学的クエリとして機能する3Dアンカー点のコンパクトな集合を学習する。
Mip-NeRF 360とVR-NeRFの実験により、UniQueRはレンダリング品質と幾何学的精度の両方において最先端のフィードフォワード法を上回ることを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:42:02 GMT)
GSwap: Realistic Head Swapping with Dynamic Neural Gaussian Field [66.3] GSwapは一貫したリアルなビデオヘッドスワッピングシステムで、ダイナミック・ニューラル・ガウシアン・ポートレートによって強化されている。
GSwapは、視覚的品質、時間的コヒーレンス、アイデンティティの保存、3D整合性など、様々な面で既存の手法を超越している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:11:25 GMT)
End-to-End Efficient RL for Linear Bellman Complete MDPs with Deterministic Transitions [66.2] 決定過程(MDP)における線形関数近似を用いた強化学習の研究
本稿では, 線形ベルマン完全オラクルに対して, 決定論的遷移, 初期状態, 報奨を伴う計算効率のよいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:32:29 GMT)
JFTA-Bench: Evaluate LLM's Ability of Tracking and Analyzing Malfunctions Using Fault Trees [64.6] 複雑なシステムのメンテナンスにおいて、障害木は問題を特定し、ターゲットとするソリューションを提供するために使用される。
画像として格納されたフォールトツリーを,大規模言語モデルで直接処理可能にするために,新しいフォールトツリーのテキスト表現を提案する。
複雑な環境におけるロバストな相互作用を強調するマルチターン対話システムのためのベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:13:43 GMT)
Test-Time Adaptation via Cache Personalization for Facial Expression Recognition in Videos [59.8] 本稿では,キャッシュベースのTTA方式であるキャッシュパーソナライゼーション(TTA-CaP)を提案する。
実験により,TTA-CaPは,対象種別および環境変化下で,最先端のTTA法より優れることが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:00:35 GMT)
Harnessing Lightweight Transformer with Contextual Synergic Enhancement for Efficient 3D Medical Image Segmentation [59.7] モデル効率を実現するための軽量トランスであるLight-UNETRを提案する。
Light-UNETRは軽量次元減少(LIDR)モジュールを備えており、空間次元とチャネル次元を減少させる。
また,変換器のデータ効率向上を目的としたCSE学習戦略も導入した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:24:19 GMT)
Selective Noise Suppression and Discriminative Mutual Interaction for Robust Audio-Visual Segmentation [59.1] 本稿では,SNRPモジュールとDAMF戦略を備えたSDAVSを提案する。
実験により,提案手法はベンチマークAVSデータセットの最先端性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:58:19 GMT)
ForestPrune: High-ratio Visual Token Compression for Video Multimodal Large Language Models via Spatial-Temporal Forest Modeling [59.0] 本研究では,フォレストプルーンと呼ばれるビデオMLLMの新規かつトレーニング不要なトークン解析手法を提案する。
ForestPruneは、時空間フォレストモデリングによる効果的で高率な伐採を実現する。
実際には、フォレストプルーンは意味的制約、空間的制約、時間的制約に基づいてビデオフレームにトークンフォレストを構築している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:01:16 GMT)
ScaleEdit-12M: Scaling Open-Source Image Editing Data Generation via Multi-Agent Framework [58.4] 大規模で高品質な画像編集データセットをエンドツーエンドに構築するための階層的マルチエージェントフレームワークであるScaleEditorを提案する。
パイプラインは3つの重要なコンポーネントから構成される:ワールド知識注入によるソース画像拡張、適応型マルチエージェント編集命令画像合成、タスク認識データ品質検証機構である。
ScaleEditorを使って、これまでで最大のオープンソースの画像編集データセットであるScaleEdit-12Mをキュレートします。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:53:50 GMT)
The Evolution of Tool Use in LLM Agents: From Single-Tool Call to Multi-Tool Orchestration [58.1] ツールの使用により、大きな言語モデルが外部情報にアクセスし、ソフトウェアシステムを実行し、モデルパラメータだけで解決できるもの以外のデジタル環境で動作することができる。
エージェントシステムが進化するにつれて、中央の問題は、中途半端な状態、実行フィードバック、環境の変化、安全性、コスト、検証可能性といった実践的な制約によって、孤立呼び出しからマルチツールオーケストレーションへと移行した。
推論時の計画と実行、トレーニングと軌道構築、安全と制御、リソース制約下での効率性、オープン環境における能力の完全性、およびベンチマーク設計と評価の6つの分野に関する文献を整理する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:05:05 GMT)
Reasoning over Semantic IDs Enhances Generative Recommendation [56.8] 本稿では,SID 言語アライメントを強化することによって,SID に対する推論を実現する2段階のフレームワークを提案する。
SIDReasonerはさらに、結果駆動強化最適化によるレコメンデーション推論を改善している。
実世界の3つのデータセットに対する実験により,SIDに基づく生成推薦の有効性が示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:31:48 GMT)
Cerebra: A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.6] CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:51:01 GMT)
I3DM: Implicit 3D-aware Memory Retrieval and Injection for Consistent Video Scene Generation [56.3] I3DMは、一貫した映像シーン生成のための暗黙的な3D対応メモリ機構である。
われわれのアプローチの核心は3D対応メモリ検索戦略である。
検索した履歴フレームをフル活用するために,3次元メモリインジェクションモジュールを導入する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:45:40 GMT)
M3T: Discrete Multi-Modal Motion Tokens for Sign Language Production [56.2] 非手動的特徴として, 口づけ, まぶたの上昇, 視線, 頭部運動は文法的に義務付けられ, 手動調音器のみでは回復できない。
既存の3Dプロダクションシステムは、それらを統合するための2つの障壁に直面している。
本稿では,FLAMEのリッチな表現空間とSMPL-X本体を結合したSMPL-FXを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:05:03 GMT)
ForeSea: AI Forensic Search with Multi-modal Queries for Video Surveillance [56.2] ForeSeaは3段階のプラグアンドプレイパイプラインを備えたAI法医学検索システムである。
ForeSeaは従来のビデオRAGモデルよりも精度を3.5%向上し、一時IoUは11.0向上した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:15:28 GMT)
Mind Your HEARTBEAT! Claw Background Execution Inherently Enables Silent Memory Pollution [55.9] この脆弱性はClawエコシステム全体で共有されるアーキテクチャ設計から生じる。
外部ソースから取り込まれたコンテンツは、フォアグラウンドインタラクションに使用される同じメモリコンテキストに入ることができる。
私たちはMissClawを使ってエージェントネイティブな社会設定でこの経路をインスタンス化する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:01:09 GMT)
RealMaster: Lifting Rendered Scenes into Photorealistic Video [55.0] 最先端のビデオ生成モデルは驚くべきフォトリアリズムを生み出すが、生成したコンテンツをシーン要求に合わせるために必要な正確な制御は欠如している。
本稿では,3Dエンジンの出力と完全な整合性を維持しつつ,映像拡散モデルを用いてレンダリング映像をフォトリアリスティックビデオに引き上げる手法であるRealMasterを提案する。
RealMasterは既存のビデオ編集のベースラインを大幅に上回り、ジオメトリ、ダイナミックス、アイデンティティを元の3Dコントロールで指定しながら、フォトリアリズムを改善している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:32:42 GMT)
EchoKV: Efficient KV Cache Compression via Similarity-Based Reconstruction [55.0] EchoKVは、標準と圧縮された推論間のオンデマンド移行を可能にする柔軟なKVキャッシュ圧縮スキームである。
高速で低コストなトレーニングを可能にする2段階の微調整戦略を導入する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:58:42 GMT)
SortedRL: Accelerating RL Training for LLMs through Online Length-Aware Scheduling [54.3] SortedRLを提案する。SortedRLは、強化学習をスケールするためのオンライン長対応スケジューリング戦略である。
SortedRLは、出力長に基づいてロールアウトサンプルをリオーダーし、短いサンプルが早期更新のためにグループを形成することを優先順位付けする。
LLaMA-3.1-8BとQwen-2.5-32Bを論理パズルを含む様々なタスクで実験した結果、SortedRLはRLトレーニングバブル比を50%以上削減することが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:48:31 GMT)
MSR-HuBERT: Self-supervised Pre-training for Adaptation to Multiple Sampling Rates [54.2] MSRHuBERTはマルチサンプリングレート適応型事前学習法である。
異なるサンプリングレートからの生波形を、再サンプリングせずに共有時間分解能にマッピングする。
16kHzから48kHzに及ぶ実験において、MSRHuBERTはHuBERTよりも音声認識と全帯域音声再構成に優れていた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:40:23 GMT)
MsFormer: Enabling Robust Predictive Maintenance Services for Industrial Devices [53.9] 信頼性の高い産業用予測保守のための統合型AIサービスモデルとして設計された軽量なマルチスケールトランスを提案する。
MsFormerには、マルチスケールサンプリング(MS)モジュールと、シーケンシャルな相関をキャプチャするための調整された位置符号化機構が組み込まれている。
実世界のデータセットの実験では、提案したフレームワークが最先端の手法よりも大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:12:50 GMT)
I Came, I Saw, I Explained: Benchmarking Multimodal LLMs on Figurative Meaning in Memes [53.7] 本研究では,6種類の図形的意味を検出・説明する能力に基づいて,8種類の最先端生成型大言語モデル (MLLM) の評価を行った。
以上の結果から,すべてのモデルにおいて,そのような意味が存在しない場合でも,ミームと図形的意味を関連づけるバイアスが強いことが示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:02:48 GMT)
FG-Portrait: 3D Flow Guided Editable Portrait Animation [52.5] ドライブからソースポートレートへのモーション転送は、ポートレートアニメーションにおいて依然として重要な課題である。
現在の拡散に基づくアプローチは、ソース間通信の取得に失敗する駆動運動にのみ適用される。
パラメトリックな3次元頭部モデルから直接計算した学習不要かつ幾何学駆動の運動対応である3Dフローを導入する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:09:19 GMT)
Transformers Trained via Gradient Descent Can Provably Learn a Class of Teacher Models [52.1] 教師モデルのクラスから学習するために,トランスフォーマーを学生として活用することについて理論的に検討する。
教師モデルのパラメータブロックの復元に成功し,「配置のみ」を簡略化した一層変圧器の有効性を実証した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:55:13 GMT)
A Latency Coding Framework for Deep Spiking Neural Networks with Ultra-Low Latency [51.8] スパイキングニューラルネットワーク(SNN)は、エネルギー効率のよいニューラル処理に重要な可能性を持つ生物学的にインスパイアされたコンピューティングパラダイムを提供する。
Time-To-First-Spike (TTFS)コーディングは、ニューロンの最初のスパイクの正確なタイミングを通じて情報を符号化する。
TTFSモデルには効率的なトレーニング方法がなく、高い推論遅延と限られたパフォーマンスに悩まされている。
本稿では,バックプロパゲーション・スロー・タイム(BPTT)アルゴリズムを用いて,深層TTFS符号化SNNの効率的なトレーニングを可能にする包括的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:52:03 GMT)
Efficient Hybrid SE(3)-Equivariant Visuomotor Flow Policy via Spherical Harmonics for Robot Manipulation [51.5] E3Flowは、同変拡散ポリシーの限界に対処する新しいフレームワークである。
安定な多モード同変学習による効率的な整流を初めて統一する。
E3Flowは、最先端の球拡散政策よりも平均的な成功率を3.12%向上させる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:00:36 GMT)
VISion On Request: Enhanced VLLM efficiency with sparse, dynamically selected, vision-language interactions [51.4] 視覚情報を捨てることなく推論コストを削減するVISOR(VISion On Request)を導入する。
VISORは画像とテキストトークン間の相互作用をスパースすることで効率を向上する。
実験により、VISORは、最先端の結果を一致または超えながら、計算コストを大幅に削減することが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:58:17 GMT)
UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation [51.4] インターリーブドジェネレーションが可能な統一モデルが有望なパラダイムとして登場している。
インターリーブ・ジェネレーションに適した統合強化学習フレームワークを提案する。
実験により,この統合学習レシピは推論による画像生成品質を著しく向上させることが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:59:17 GMT)
Beyond Matching to Tiles: Bridging Unaligned Aerial and Satellite Views for Vision-Only UAV Navigation [51.3] 本稿では,UAVの絶対位置と近距離からの進路を共同で予測する視覚駆動型クロスビューナビゲーション手法であるBering-UAVを提案する。
我々はまた、クロスビューのローカライゼーションとナビゲーションを評価するベンチマークである Bearing-UAV-90k も提示する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:17:00 GMT)
Re-Prompting SAM 3 via Object Retrieval: 3rd of the 5th PVUW MOSE Track [51.2] 目標の消失と再出現下でのロバスト性を改善するための自動再飛散フレームワークを開発した。
我々のソリューションはテストセットで51.17%のJ&Fを達成し、MOSEv2トラックで3位となった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:45:15 GMT)
AuthorMix: Modular Authorship Style Transfer via Layer-wise Adapter Mixing [50.9] AuthorMixは軽量でモジュール化され、解釈可能なスタイル転送フレームワークである。
我々は、個々のスタイル固有のLoRAアダプタを、オープンソース作者の小さなセットで訓練する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:07:00 GMT)
ImplicitRM: Unbiased Reward Modeling from Implicit Preference Data for LLM alignment [49.9] 現在の報酬モデリングは、収集コストの高い実験的なフィードバックデータに大きく依存している。
ImplicitRMは、暗黙の嗜好データから偏見のない報酬モデルを学ぶことを目的としている。
実験によると、ImplicitRMは暗黙の選好データセット間で正確な報酬モデルを学ぶ。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:32:14 GMT)
SafeSeek: Universal Attribution of Safety Circuits in Language Models [49.6] 我々は,統合された安全解釈可能性フレームワークである ourmethod を提案する。
提案手法は,大規模言語モデルにおける機能的完全安全回路を同定する。
LLMの安全性には2つの重要なシナリオがある。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:32:53 GMT)
FCL-COD: Weakly Supervised Camouflaged Object Detection with Frequency-aware and Contrastive Learning [49.6] 既存のカモフラージュオブジェクト検出(COD)手法は、マスクアノテーションでガイドされた完全に教師付き学習に依存している。
完全教師付き手法と比較して、既存の弱い教師付きCOD法は性能が著しく劣っている。
本稿では,FCL-CODという,周波数認識とコントラスト学習に基づくWSCODフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:05:41 GMT)
Dual Contrastive Network for Few-Shot Remote Sensing Image Scene Classification [49.0] リモートセンシング画像シーン分類(FS-RSISC)は、少数のラベル付きサンプルでリモートセンシング画像を分類することを目的としている。
主な課題は、リモートセンシング画像の本質的な性質である、クラス間の小さなばらつきとクラス内の大きなばらつきである。
本稿では,2つの補助的教師付きコントラスト学習ブランチを学習過程中に組み込んだトランスファーベースDual Contrastive Network (DCN)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:03:44 GMT)
Group Editing : Edit Multiple Images in One Go [48.8] GroupEditingは、グループ内の画像間の明示的で暗黙的な関係を構築するフレームワークである。
GroupEditDataは、高品質なマスクと多数のイメージグループの詳細なキャプションを含むデータセットである。
グループレベルの画像編集の有効性を評価するためのベンチマークであるGroupEditBenchを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:31:47 GMT)
VTAM: Video-Tactile-Action Models for Complex Physical Interaction Beyond VLAs [48.0] Video-Action Models (VAM) は、インテリジェンスを具現化するための有望なフレームワークとして登場した。
本稿では,触覚を接地信号として組み込んだマルチモーダル世界モデリングフレームワークであるVideo-Tactile Action Model (VTAM)を紹介する。
VTAMは、触覚ストリームでトレーニング済みのビデオトランスフォーマーを軽量なモダリティ転送ファインタニングで強化する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:45:06 GMT)
EVA: Aligning Video World Models with Executable Robot Actions via Inverse Dynamics Rewards [47.3] ビデオ生成モデルは、ロボット工学の世界モデルとしてますます使われている。
現在のビデオワールドモデルは、明示的な実行可能性の制約を欠いている。
本稿では,ビデオワールドモデルを調整するための強化学習フレームワークであるExecutable Video Alignment (EVA)を紹介する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:12:47 GMT)
SMSP: A Plug-and-Play Strategy of Multi-Scale Perception for MLLMs to Perceive Visual Illusions [46.3] MLLM(Multimodal Large Language Models)は、隠れパターンの視覚錯覚に対して非常に脆弱である。
この欠損は、現在のMLLMとヒトの知覚上の不一致を強調し、また潜在的な安全性の懸念も引き起こす。
マルチスケール知覚戦略(SMSP)は,人間の視覚的知覚戦略に適合するプラグイン・アンド・プレイ・フレームワークである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:15:31 GMT)
Gimbal360: Differentiable Auto-Leveling for Canonicalized $360^\circ$ Panoramic Image Completion [46.0] 拡散モデルは2D出力で優れていますが、パノラマ画像から360ドル(約3万3000円)のパノラマ画像に拡張することは難しいです。
我々は、視線観測と球状パノラマを明示的に橋渡しする、原則化されたフレームワークであるGimbal360を提示する。
幾何的および位相的事前条件を明示的に標準化することで,Gimbal360は構造的に整合性のある360円のシーンコンプリートにおいて,最先端のパフォーマンスを実現することができることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:27:49 GMT)
Patchwork: A compact representation for 3D polygonal shapes [45.4] Patchworkは2次元と3次元の幾何学を少数のパラメータでモデル化できる汎用形状表現である。
そこで本研究では,2次元および3次元データにPatchwork表現を適合させる最適化手法を提案する。
我々のアプローチは、高速な適合性能、既存の代替手段と比較して要求されるパラメータのごく一部、および内外分類のネイティブサポートを提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:20:32 GMT)
Reconstruction-Guided Slot Curriculum: Addressing Object Over-Fragmentation in Video Object-Centric Learning [45.2] Video Object-Centric Learningは、生のビデオを小さなオブジェクトスロットに分解しようとしている。
既存のスロットモデルは、しばしば厳しい過度なオーバーフラグメントに悩まされる。
我々はこの制限を再構築誘導スロットカリキュラムで解決する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:34:51 GMT)
Looking Beyond the Window: Global-Local Aligned CLIP for Training-free Open-Vocabulary Semantic Segmentation [44.3] スライディングウインドウ推論戦略は、訓練のないオープン語彙セマンティックセマンティックセグメンテーション法で一般的に採用されている。
それぞれのウィンドウは独立して処理され、ウィンドウ間のセマンティックな相違が生じます。
GLA-CLIP(Global-Local Aligned CLIP)は,ウィンドウ間の包括的情報交換を容易にするフレームワークである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:10:12 GMT)
SG-VLA: Learning Spatially-Grounded Vision-Language-Action Models for Mobile Manipulation [43.8] VLA(Vision-Language-Action)モデルは、ロボット制御の可能性を秘めているが、複雑な家庭環境におけるパフォーマンスは、まだ準最適である。
モバイル操作には、グローバルなシーンレイアウト、きめ細かい形状、高次元連続的な動作の推論が必要である。
知覚と表現を強化する空間的接地型VLAモデルの学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:44:25 GMT)
Confidence Calibration under Ambiguous Ground Truth [43.7] 多数発声ラベルに装着したポストホックキャリブレータは、従来の評価ではよく校正される。
しかし、それらが根底にあるアノテータ分布に対してかなり誤解されている。
我々は,完全ラベル分布に対して適切なスコアリングルールを最適化する,あいまいさを意識したポストホックキャリブレータのファミリーを開発する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:24:09 GMT)
PolarAPP: Beyond Polarization Demosaicking for Polarimetric Applications [43.5] ポラリメトリックイメージングは、通常の推定やデフレクションのような高度な視覚応用を可能にする。
既存のアプリケーションは、焦点の分割センサーから生計測を鼻で再分類することで構築されたデータセットに依存している。
デモサイクリングと下流タスクを協調的に最適化する最初のフレームワークであるPolarAPPを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:07:17 GMT)
Probing Ethical Framework Representations in Large Language Models: Structure, Entanglement, and Methodological Challenges [43.2] 我々は,4B-72Bパラメータにまたがる6つのLLMにおいて,5つの倫理的枠組み(デオントロジー,実用主義,徳,正義,常識)にまたがる隠された表現を探索する。
我々の分析では、非対称な伝達パターンを持つ区別された倫理的部分空間が明らかにされている。例えば、デオントロジーは、部分的に美徳のシナリオに当てはまるが、コモンセンスプローブは、公正に破滅的に失敗する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:01:29 GMT)
Generalization Bounds for Physics-Informed Neural Networks for the Incompressible Navier-Stokes Equations [42.6] この研究は、ナヴィエ・ストークス方程式の解を近似する方法の一般化誤差に基づいて、厳密な上界を確立する。
我々は、教師なし物理情報ニューラルネットワークフレームワークを用いて、深度2のニューラルネットワークを訓練した。
提案する活性化関数と対応する境界を,Taylor-Green vortexベンチマークを解くPINNセットアップ上で実証検証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:08:34 GMT)
How Far Can VLMs Go for Visual Bug Detection? Studying 19,738 Keyframes from 41 Hours of Gameplay Videos [41.5] 長めのゲームプレイのためのビデオベースの品質保証(QA)は、労働集約的でエラーを起こしやすい。
近年のベンチマークでは、視覚言語モデル(VLM)は、キュレートされたデータセットの視覚的グリッチの検出において、有望な結果が得られることが示唆されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:59:06 GMT)
Gau-Occ: Geometry-Completed Gaussians for Multi-Modal 3D Occupancy Prediction [40.6] Gau-Occは、密度の高いボリューム処理をバイパスするマルチモーダルフレームワークである。
幾何整列した2Dサンプリングとクロスモーダルアライメントにより、マルチビューイメージセマンティクスを統合する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:44:46 GMT)
Graph Energy Matching: Transport-Aligned Energy-Based Modeling for Graph Generation [39.9] グラフエネルギーマッチング(英: Graph Energy Matching、GEM)は、離散拡散モデルとエネルギーベースモデルの間の忠実度ギャップを埋めるグラフのための生成フレームワークである。
GEMは置換不変ポテンシャルエネルギーを学習し、ノイズからデータへのトランスポート整列誘導を同時に提供し、高いデータ可能性の領域内のサンプルを精査する。
サンプルの品質以外にも、相対可能性の明示的なモデリングは、推測時間でのターゲット探索を可能にし、構成生成を容易にし、プロパティ制約されたサンプリング、グラフ間の測地学を可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:35:25 GMT)
WorldMesh: Generating Navigable Multi-Room 3D Scenes via Mesh-Conditioned Image Diffusion [39.8] テキスト・ツー・イメージとビデオのアプローチは、明示的な幾何学が欠如しているため、限られた環境スケールを超えてシーンレベルの一貫性とオブジェクトレベルの一貫性を維持するのに苦労する。
本稿では,大規模な3次元シーン合成の複雑な問題を構造合成に分解する幾何学的手法を提案する。
これにより、スケーラブルで任意の大きさのオブジェクトのリッチさと多様性の3Dシーンが実現され、堅牢な3D一貫性とフォトリアリスティックなディテールが組み合わさる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:10:08 GMT)
URA-Net: Uncertainty-Integrated Anomaly Perception and Restoration Attention Network for Unsupervised Anomaly Detection [39.7] 産業欠陥検査や医用画像解析において,教師なし異常検出は重要な役割を担っている。
革新的不確実性統合型異常知覚・回復注意ネットワーク(URA-Net)を提案する。
URA-Netは、異常パターンを対応する正常性に明示的に復元する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:27:17 GMT)
Know3D: Prompting 3D Generation with Knowledge from Vision-Language Models [39.5] Know3Dは、大規模言語モデルからの豊富な知識を3D生成プロセスに組み込む新しいフレームワークである。
抽象的な指示と未観測領域の幾何学的再構成のギャップを埋めることに成功した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:18:29 GMT)
MLLM-HWSI: A Multimodal Large Language Model for Hierarchical Whole Slide Image Understanding [39.3] Whole Slide Images (WSIs) は階層構造を示し、診断情報は細胞形態、局所組織組織、世界的文脈から現れる。
既存の計算病理学(CPath) マルチモーダル言語モデル(MLLM)は一般にWSI全体を単一の埋め込みに圧縮する。
我々は、WSIレベルのMLLMであるtextbfMLLMHWSIを導入し、4つの異なるスケールで視覚特徴とマルチスケール言語を整列する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:04:58 GMT)
TETO: Tracking Events with Teacher Observation for Motion Estimation and Frame Interpolation [39.2] マイクロ秒の解像度で画素ごとの明るさが変化し、RGBフレーム間で連続的な動き情報が失われる。
本稿では,事前学習したRGBトラッカーからの知識蒸留を通じて,実世界の無注釈記録のsim$25分からイベント動作推定を学習するTETOを提案する。
EVIMO2 と DSEC の光学的フローの同時追跡を極小のトレーニングデータを用いて達成し、正確な動き推定がBS-ERGB とHQ-EVFI のフレーム品質に直接変換されることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:53:41 GMT)
DetPO: In-Context Learning with Multi-Modal LLMs for Few-Shot Object Detection [39.2] 勾配のないテスト時間最適化手法である検出プロンプト最適化(DetPO)を提案する。
提案手法は,Roboflow20-VLおよびLVIS上の一般MLLMに対して一貫した改善をもたらす。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:26:55 GMT)
Can LLM Agents Be CFOs? A Benchmark for Resource Allocation in Dynamic Enterprise Environments [39.1] 長期のエンタープライズリソースアロケーションにおけるエージェント評価のための最初のベンチマークであるEnterpriseArenaを紹介する。
CFOスタイルの意思決定を、企業レベルの財務データ、匿名化されたビジネス文書、マクロ経済と産業のシグナル、専門家が検証した運用ルールを組み合わせた132ヶ月の企業シミュレータでインスタンス化する。
実験の結果、ランの16%のみが全地平線を乗り越えており、より大きなモデルでは、より小さなモデルよりも確実に性能が良くないことがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:25:00 GMT)
MVRD-Bench: Multi-View Learning and Benchmarking for Dynamic Remote Photoplethysmography under Occlusion [39.0] リモート光胸腺撮影(Remote Photoplethysmography, CFA)は、顔画像の微妙な肌の色変化を分析し、生理的信号を推定するノンコンタクト技術である。
既存のrメソッドは、静的およびシングルビューの顔ビデオに依存するため、顔の動きやシナリオ下での性能劣化に遭遇することが多い。
本研究は、多視点顔ビデオにおけるr測定における運動誘発リズム閉塞問題に対処することに焦点を当てる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:01:56 GMT)
Digital Twin-Assisted Measurement Design and Channel Statistics Prediction [38.6] 本研究は,オープンソースマップから導出される未校正DTを利用して,GP予測のための幾何学的事前情報を抽出するハイブリッドチャネル予測フレームワークを提案する。
提案手法は,測定オーバーヘッドを低減し,予測精度を向上し,資源効率の高い無線チャネル予測のための実践的なアプローチを確立する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:43:59 GMT)
Foveated Diffusion: Efficient Spatially Adaptive Image and Video Generation [38.5] 拡散とフローマッチングモデルにより、インタラクティブな画像やストリーミングビデオ生成といった、前例のない創造的コンテンツ生成能力が解放された。
我々の研究は、ユーザの視線位置が分かっている設定や、例えば視線追跡を用いて推定できる設定において、生成プロセスの効率を最適化することを目指している。
これらの設定では、偏心性に依存した人間の視力を活用し、ユーザは視線付近の小さな領域において、非常に高解像度な視覚情報を知覚する。
我々のアプローチは、フェーベ分解能をモデル化して、トークンを一様ではなく一様に割り当て、より高いトークン密度をフォーベ領域以下に割り当てることから始まる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:57:35 GMT)
Physically Accurate Rigid-Body Dynamics in Particle-Based Simulation [38.4] 粒子ベースのシミュレータは、現在のシミュレータに代わる魅力的な代替手段を提供する。
位置ベース力学(PBD)は、その計算効率と視覚的可視性で有名な解法である。
物理的に正確な剛体力学を強制する PBD-R を改訂した PBD-R を導入する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:24:39 GMT)
WildWorld: A Large-Scale Dataset for Dynamic World Modeling with Actions and Explicit State toward Generative ARPG [38.2] 明示的な状態アノテーションを備えた大規模アクション条件付き世界モデリングデータセットであるWildWorldを提案する。
セマンティックなリッチなアクションをモデル化し、長期的状態整合性を維持する上での課題を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:58:25 GMT)
Think 360°: Evaluating the Width-centric Reasoning Capability of MLLMs Beyond Depth [37.8] 推論幅は、広範囲な試行錯誤探索や多重制約最適化のためのモデルの能力に焦点を当てる。
難易度、質問タイプ、必要なスキルにまたがる12のモデルファミリーを評価した。
その結果、現在のモデルでは、一般的なVQAタスクや常識的なVQAタスクに強いパフォーマンスを示す一方で、深いシーケンシャルな思考連鎖と広い探索探索の組み合わせに苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:29:24 GMT)
AgentRVOS: Reasoning over Object Tracks for Zero-Shot Referring Video Object Segmentation [37.7] Video Object(RVOS)は、自然言語クエリが与えられたビデオ全体を通じて対象オブジェクトをセグメントすることを目的としている。
そこで本研究では,SAM3とMLLMの相補的な長所をベースとした,トレーニング不要なエージェントパイプラインであるAgentOSを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:55:17 GMT)
MKA: Memory-Keyed Attention for Efficient Long-Context Reasoning [37.4] マルチレベルKVキャッシュ(ローカル,セッション,長期)を統合した階層型アテンション機構を提案する。
FastMKAは、MLAに匹敵する複雑さと、最大5倍高速なトレーニングスループットと1.8倍低い評価レイテンシという、良好な精度と効率のトレードオフを実現している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:05:44 GMT)
VQ-Jarvis: Retrieval-Augmented Video Restoration Agent with Sharp Vision and Fast Thought [37.2] VQ-Jarvisは、検索強化されたオールインワンのインテリジェントビデオ復元エージェントである。
一対の修復結果の劣化や微妙な違いを正確に知覚するように設計されている。
VQ-Jarvisは、複雑な劣化したビデオの既存の手法を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:40:50 GMT)
PLACID: Privacy-preserving Large language models for Acronym Clinical Inference and Disambiguation [36.9] 大規模言語モデル(LLM)は、多くのドメインにわたるトランスフォーメーションソリューションを提供するが、医療の統合は、厳格なデータプライバシの制約によって妨げられる。
本研究は,プライバシ保護を確保するため,デバイス上に展開した小型パラメータモデルの評価を先導するものである。
本稿では、汎用的なローカルモデルを利用して、臨床の頭字語を検出し、コンテキスト関連拡張のためにドメイン固有の生体医学モデルにルーティングするプライバシー保護パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:33:44 GMT)
Zero-Shot Personalization of Objects via Textual Inversion [36.8] 本稿では、学習ネットワークを用いて、オブジェクト固有のテキスト埋め込みを予測する新しいフレームワークを提案する。
この設計により、1つのフォワードパスで広範囲のオブジェクトを高速でゼロショットでパーソナライズすることができる。
我々の知る限り、この研究は拡散モデルにおけるそのような汎用的、トレーニング不要なパーソナライゼーションを達成するための最初の試みである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:54:30 GMT)
MVPBench: A Multi-Video Perception Evaluation Benchmark for Multi-Modal Video Understanding [36.6] 既存のベンチマークは、静的画像やシングルビデオに限られており、複数のビデオにわたる複雑なインタラクションを見下ろしている。
MVPBenchは、ビデオシーケンスから関連情報を抽出して情報決定を行うモデルを評価するために設計された、14のサブタスクを備えた、新しいベンチマークである。
MVPBenchには、既存のデータセットと手動で注釈付きクリップから得られた2.7Kのビデオクリップを含む5Kの質問回答テストが含まれている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:33:07 GMT)
Grounding Vision and Language to 3D Masks for Long-Horizon Box Rearrangement [36.2] 本研究では,視覚的観察のみを用いて,未指定の自然言語目標から3次元環境における長期計画について検討する。
本稿では,2つの3次元マスクの逐次的反応予測として長期計画を定式化するリアクティブ・アクション・マスク・プランナ(RAMP-3D)を提案する。
RAMP-3Dは長距離再配置作業において79.5%の成功率を獲得し、2D VLMベースのベースラインを著しく上回っている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:31:13 GMT)
TreeTeaming: Autonomous Red-Teaming of Vision-Language Models via Hierarchical Strategy Exploration [36.1] TreeTeamingは、静的テストから動的で進化的な発見プロセスへの戦略探索を再構成する、自動化された赤いチーム編成フレームワークです。
TreeTeamingは11台のモデルで最先端の攻撃成功率を達成し、既存の手法を上回り、GPT-4oで87.60%に達する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:31:42 GMT)
Improving Safety Alignment via Balanced Direct Preference Optimization [36.1] 大規模言語モデル(LLM)の安全性向上のため,人間フィードバックからの強化学習(RLHF)が採用されている。
直接優先度最適化(DPO)は安全アライメントに広く用いられている。
本稿では,モデルのトレーニングデータの理解の観点から,オーバーフィッティング現象を再考する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:04:09 GMT)
Bi-CRCL: Bidirectional Conservative-Radical Complementary Learning with Pre-trained Foundation Models for Class-incremental Medical Image Analysis [35.9] 医用画像誘導診断におけるクラスインクリメンタルラーニング(CIL)は、新たに出現する疾患のカテゴリに適応しつつ、事前診断知識を維持する必要がある。
補完学習システムにインスパイアされた二重学習フレームワークBi-CRCLを提案する。
5つの医用画像データセットの実験では、様々な条件下での最先端の手法に対する一貫した改善が示されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:25:05 GMT)
PaperVoyager : Building Interactive Web with Visual Language Models [35.7] 本稿では,研究論文を対話型Webシステムに変換するPaper-to-Interactive-System Agentを提案する。
PDFの論文が与えられた場合、エージェントは人間の介入なしにエンドツーエンドの処理を行う。
実験の結果,PaperVoyagerは生成した対話システムの品質を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:42:27 GMT)
From Feature Learning to Spectral Basis Learning: A Unifying and Flexible Framework for Efficient and Robust Shape Matching [35.3] 本稿では,固定基底関数を学習可能な関数に置き換えることで,標準的な関数マップを一般化するフレームワークであるAdvanced Functional Mapを紹介する。
頑健な3次元形状マッチングのための非教師なしスペクトルベース学習法を提案する。
提案手法は,新しい熱拡散モジュールと教師なし損失関数と,高価な解法と補助損失を回避した合理化アーキテクチャを組み込んだものである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:13:02 GMT)
It Takes Two: A Duet of Periodicity and Directionality for Burst Flicker Removal [33.4] 不安定な照明と行単位での露光の不整合から生じるフレッカ・アーティファクトは、短い露光撮影において大きな課題となる。
ゴースト化を導入することなく、効果的にフリックを除去するトランスフォーマーベースのアーキテクチャであるFlickerformerを提案する。
Flickerformerは、定量的メトリクスと視覚的品質の両方において最先端のアプローチより優れている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:32:16 GMT)
Manifold Generalization Provably Proceeds Memorization in Diffusion Models [33.2] 拡散モデルは、学習したスコアがエンフカースである場合でも、しばしば新しいサンプルを生成する。
粗いスコアで訓練された拡散モデルは、多様体支持の語彙性を利用することができることを証明した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:50:09 GMT)
Design and implementation of a modular laser system for AMO experiments [32.5] レーザーは、量子コンピューティングのような原子ベースの量子技術の主要な構成要素である。
レーザー源からイオントラップまでの効率は21~28%、レーザー安定化線幅は1MHz以下である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:28:40 GMT)
Describe-Then-Act: Proactive Agent Steering via Distilled Language-Action World Models [31.8] 我々は、訓練された政策の潜伏状態と計画された行動が組み合わさって、すでに行動結果を予測する十分な情報を符号化していることを示す。
DILLOは、"simulate-then-act"から"describe-then-act"にパラダイムをシフトする高速なステアリング層である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:49:25 GMT)
Post-Selection Distributional Model Evaluation [31.0] 選択後分布モデル評価(PS-DME)
PS-DMEは任意のデータ依存モデル選択後に統計的に有効な分布モデル評価のためのフレームワークである。
結果:PS-DMEは,様々な信頼性レベルの候補構成の信頼性比較を可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:51:30 GMT)
ABot-PhysWorld: Interactive World Foundation Model for Robotic Manipulation with Physics Alignment [31.0] ABot-PhysWorldは14B Diffusion Transformerモデルで、視覚的にリアルで、物理的に可視で、アクション制御可能なビデオを生成する。
視覚的品質を維持しながら、非物理的行動を抑制するために、分離された識別器を備えた新しいDPOベースのポストトレーニングフレームワークを使用する。
PBenchとEZSbenchはVeo 3.1とSora v2 Proを上回り、物理的妥当性と軌道整合性を実現している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:07:09 GMT)
ViBe: Ultra-High-Resolution Video Synthesis Born from Pure Images [30.6] トランスフォーマーに基づくビデオ拡散モデルは、空間的および時間的トークンに対する3次元の注意に依存している。
我々は,高解像度映像を合成するために,ネイティブスケールで事前学習したビデオ拡散変換器をアップグレードする純粋な画像適応フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:27:22 GMT)
Uncertainty-guided Compositional Alignment with Part-to-Whole Semantic Representativeness in Hyperbolic Vision-Language Models [30.2] 双曲型視覚ランゲージモデル(VLM)の高機能化のための不確実性誘導型構成的双曲アライメント(UNCHA)を提案する。
UNCHAは、より代表的な部分に低い不確実性を割り当て、全体の代表的な部分に低い不確実性を割り当てることによって、双曲的不確実性を伴う部分対全体的な意味的代表性をモデル化する。
UNCHAはゼロショット分類、検索、マルチラベル分類のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:22:50 GMT)
When Models Judge Themselves: Unsupervised Self-Evolution for Multimodal Reasoning [30.2] マルチモーダル推論のための教師なし自己進化学習フレームワークを提案する。
ヒューマンアノテートされた回答や外部報酬モデルを用いることなく、安定したパフォーマンス向上を実現する。
提案手法は5つの数学的推論ベンチマークにおける推論性能と一般化を一貫して改善する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:52:19 GMT)
TRACE: A Multi-Agent System for Autonomous Physical Reasoning in Seismological [29.7] TRACEは,大規模言語モデルと形式的地震学制約を組み合わせたマルチエージェントシステムである。
TRACEはストレスによって引き起こされる遅延伝播を自律的に同定し、Mw 6.4とMw 7.1の主ショックの間のカスケード相互作用を解消する。
また、連続的なカスケードイベントからの断層チャネルのエピソード移動を区別し、構造的にガイドされた侵入モデルを特定する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:48:22 GMT)
Steering LLMs for Culturally Localized Generation [29.2] 文化的に健全な情報をエンコードし、それらを文化埋め込み(CuE)に集約する解釈可能な特徴を同定する。
CuEをベースとしたステアリングは、文化的忠実度を高め、単独で進めるよりも極めて稀で、長い尾の文化概念を引き出す。
これはまた、モデルがより良い導入戦略の恩恵を受けており、必ずしもロングテールな知識表現を欠いているわけではないことを示唆している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:04:01 GMT)
Few-Shot Generative Model Adaption via Identity Injection and Preservation [28.8] 限られたデータで生成モデルを訓練することは、モード崩壊の深刻な課題を示す。
一般的なアプローチは、少数ショット生成モデル適応として知られる非常に少数のサンプルを持つターゲット領域に、大きな事前訓練された生成モデルを適用することである。
我々は、アイデンティティ注入と整合性アライメントを活用して、ソースのアイデンティティ知識を保存するアイデンティティ注入と保存(I$2$P)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:59:29 GMT)
GeoSANE: Learning Geospatial Representations from Models, Not Data [28.6] 既存の基礎モデルとタスク固有モデルの重みから統一されたニューラル表現を学習するモデルファウンダリーであるGeoSANEを紹介する。
ターゲットアーキテクチャが与えられた場合、GeoSANEは複数のモードにわたる分類、セグメンテーション、検出タスクの微調整が可能な重みを生成する。
GeoSANEによって生成されたモデルは、スクラッチからトレーニングされたモデル、最先端のリモートセンシング基盤モデル、プルーニングや知識蒸留によって得られたモデルより一貫して優れています。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:40:36 GMT)
EVA: Efficient Reinforcement Learning for End-to-End Video Agent [28.6] マルチモーダル大言語モデル(MLLM)によるビデオ理解は、ビデオの長いトークンシーケンスのため、依然として困難である。
エンド・ツー・エンド・ビデオ・エージェントのための効率的な強化学習フレームワークであるEVAを提案する。
EVAは、何を見るか、いつ見るか、どのように見るかを自律的に決定し、クエリ駆動で効率的なビデオ理解を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:06:29 GMT)
Ran Score: a LLM-based Evaluation Score for Radiology Report Generation [28.6] 我々は,ヒトの専門知識と大規模言語モデルを組み合わせた臨床用ガイドフレームワークを開発した。
臨床医が指導するプロンプト最適化は,放射線技師による基準基準との整合性を向上することを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:29:26 GMT)
Beyond Preset Identities: How Agents Form Stances and Boundaries in Generative Societies [28.4] 本稿では,計算仮想エスノグラフィーと定量的社会認知プロファイリングを組み合わせた新しい混合メソドックスフレームワークを提案する。
Innate Value Bias (IVB)、Persuasion Sensitivity、Trust-Action Decoupling (TAD)の3つの新しいメトリクスを形式化する。
発見は静的なプロンプトエンジニアリングの脆弱さを明らかにし、人間とエージェントのハイブリッド社会における動的アライメントの方法論的かつ定量的基盤を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:38:46 GMT)
Safe Reinforcement Learning with Preference-based Constraint Inference [28.4] 安全RLにおける制約推論のための規範に基づく制約付き強化学習(PbCRL)を提案する。
PbCRLは真の安全要件との整合性を向上し、安全性と報酬の点で最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:54:03 GMT)
Autoregressive Guidance of Deep Spatially Selective Filters using Bayesian Tracking for Efficient Extraction of Moving Speakers [28.3] 本研究では,拡張信号を軽量な追跡アルゴリズムに組み込む戦略について検討し,深部空間フィルタを自己回帰的に誘導する手法を提案する。
その結果, 自動回帰化はベイジアントラッカーの精度を著しく向上させ, 計算オーバーヘッドの増大を伴わずとも, 優れた向上をもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:19:45 GMT)
LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset [27.9] このデータセットは、ロングテール駆動イベントに焦点を当てたエンドツーエンド駆動用に設計されている。
マルチビュービデオデータ、トラジェクトリ、ハイレベルな命令、詳細な推論トレースを提供する。
英語、スペイン語、中国語の多言語推論の痕跡は、様々な文化的背景を持つドメインの専門家から来ている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:08 GMT)
LoD-Loc v3: Generalized Aerial Localization in Dense Cities using Instance Silhouette Alignment [27.9] 本稿では,高密度都市環境における空間的局所化を一般化する新しい手法であるLoD-Loc v3を提案する。
InsLoD-Loc - 航空画像のための最大インスタンスセグメンテーションデータセット。
局所化パラダイムをセマンティックからインスタンスシルエットアライメントにシフトすることで再構築し、密集したシーンにおけるポーズ推定のあいまいさを著しく低減する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:24:58 GMT)
Designing to Forget: Deep Semi-parametric Models for Unlearning [27.5] 学習中に非パラメトリックな振る舞いを示す深層半パラメトリックモデル(SPM)のファミリーを紹介する。
SPMは、画像分類と生成においてパラメトリックモデルと競合するタスク性能を達成し、未学習でははるかに効率的である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:13:45 GMT)
Uncertainty Quantification for Distribution-to-Distribution Flow Matching in Scientific Imaging [27.2] 分布から分布への生成モデルは、細胞摂動応答のモデル化から、条件を越えた医療画像の翻訳まで、科学的イメージングタスクをサポートする。
不確実性(UQ)に基づくアプローチは、これらのタスクの有望な候補として機能するが、分配分配生成モデルのUQはまだ未定である。
本稿では,Aleatoricおよび不確実性を解消する統一UQフレームワークBayesian Flow Matching(BSFM)を提案する。このFlow Matchingコンポーネントは,拡散項による決定論的フローを拡張し,モデル一般化を未知のシナリオに改善する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:25:41 GMT)
HalDec-Bench: Benchmarking Hallucination Detector in Image Captioning [27.1] 字幕中の幻覚検出(HalDec)は、画像内容とテキストを正しく整列する視覚言語モデルの能力を評価する。
HalDec-Benchは、幻覚検出器を原理的かつ解釈可能な方法で評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:48:00 GMT)
VLA-IAP: Training-Free Visual Token Pruning via Interaction Alignment for Vision-Language-Action Models [27.1] VLA(Vision-Language-Action)モデルは、ロボットが複雑な命令駆動タスクを実行できるように、急速に高度なインボディードインテリジェンスを備えている。
現在のアプローチはしばしば、操作をサポートする視覚的にスパースで構造的に重要な領域を創り出し、初期のタスクフェーズの不安定な振る舞いを引き起こす。
提案手法であるVLA-IAP(Interaction-Aligned Pruning)では,構造的アンカーを保存するための幾何学的事前メカニズムと動的スケジューリング戦略を導入する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:33:05 GMT)
mSFT: Addressing Dataset Mixtures Overfitting Heterogeneously in Multi-task SFT [27.1] mSFT(mSFT)は、マルチタスクデータ混合のための反復的、過度に適合する検索アルゴリズムである。
10のベンチマークと6のベースモデルで、4つのベースラインを一貫して上回る。
低い計算予算では、mSFTは訓練用FLOPを低下させながら性能を向上させることができる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:53:32 GMT)
Planning over MAPF Agent Dependencies via Multi-Dependency PIBT [26.7] MAPF(Multi-Agent Path Finding)アルゴリズムは、密集した環境で数百から数千のエージェントを1秒以内に計画する必要がある。
PIBTはそのような状況下で効果的に計画できる一般的なアルゴリズムである。
エージェント依存を検索する多依存PIBT(MD-PIBT)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:38:12 GMT)
PiLoT: Neural Pixel-to-3D Registration for UAV-based Ego and Target Geo-localization [26.4] 我々は、UAVベースのエゴに取り組み、地理的ローカライゼーションをターゲットとする統合フレームワークPiLoTを提案する。
1)コアローカライゼーションスレッドからマップレンダリングを分離し、低レイテンシとドリフトフリーの精度を保証するデュアルスレッドエンジン。
このデータセットは、シミュレーションから実データへのゼロショット方式で一般化する軽量ネットワークのトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:44:45 GMT)
Grounding Sim-to-Real Generalization in Dexterous Manipulation: An Empirical Study with Vision-Language-Action Models [26.2] 実世界のデータ収集のコストを考えると、実用的な代替手段はシミュレーションによって合成データを生成することである。
4次元にわたるSim-to-Real一般化の主行列式を実験的に検討する。
実世界の10万件以上の試験を含む実験を通して、シム・トゥ・リアルの移動に関する批判的な洞察を得る。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:21:29 GMT)
A Schrödinger Eigenfunction Method for Long-Horizon Stochastic Optimal Control [26.0] 高次元最適制御(SOC)は、より長い計画的地平線で困難になる。
勾配ドリフト仮定の下では、$mathcalL$ は純粋に離散スペクトルを持つシュルディンガー作用素 $mathcalS = -+ 数学カルV$ と同値であることが証明される。
提案手法を複数の長軸ベンチマークで評価し,最先端手法と比較して制御精度が向上した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:15:48 GMT)
Off-Policy Value-Based Reinforcement Learning for Large Language Models [26.0] ReValはベルマン更新に基づく手法で、内部の一貫性を捉える段階的な信号と、結果検証から導出される軌道レベルの信号を組み合わせる。
DeepSeek-R1-Distill-1.5Bでは、ReValはトレーニング効率を改善し、AIME24の2.7%、GRPOのGPQAの4.5%の改善を実現している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:55:02 GMT)
Generative Event Pretraining with Foundation Model Alignment [25.9] イベントカメラは、高速な動きと難解な照明条件下で、堅牢な視覚信号を提供する。
ユニークなセンシング特性とラベル付きデータの制限により、イベントベースのビジュアルファンデーションモデルのトレーニングが困難になる。
GEP(Generative Event Pretraining)は,インターネット規模の画像データセットから学習したセマンティック知識をイベントデータに転送する2段階のフレームワークである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:10:34 GMT)
Morphology-Consistent Humanoid Interaction through Robot-Centric Video Synthesis [25.2] Dream2Actは、生成ビデオによるゼロショットインタラクションを可能にするロボット中心のフレームワークである。
Dream2Actは、ロボットネイティブ空間内で厳密に動作し、エラーを回避し、タスク固有のポリシートレーニングを取り除く。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:42:32 GMT)
TimeWeaver: Age-Consistent Reference-Based Face Restoration with Identity Preservation [24.4] TimeWeaverは、クロスエイジ参照をサポートする参照ベースの顔復元フレームワークである。
トレーニングと推論でアイデンティティと年齢条件を分離します。
大規模な実験により、TimeWeaverは、視覚的品質、アイデンティティの保存、年齢の一貫性において、既存の手法を超越していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:48:27 GMT)
UniFunc3D: Unified Active Spatial-Temporal Grounding for 3D Functionality Segmentation [24.2] 既存の方法は、初期タスク解析中に視覚障害に悩まされる断片化されたパイプラインに依存している。
マルチモーダルな大規模言語モデルをアクティブオブザーバとして扱う,統一的でトレーニングのないフレームワークUniFunc3Dを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:42:31 GMT)
Ethio-ASR: Joint Multilingual Speech Recognition and Language Identification for Ethiopian Languages [24.1] Ethio-ASRは5つのエチオピア語で共同で訓練された多言語CTCに基づく自動音声認識(ASR)モデルである。
これらの言語は、アフロアシア語族のセム語族、クシ語族、オマティック語族に属する。
我々は、最近リリースされたWAXALコーパス上で、事前訓練された音声エンコーダを用いてモデルを訓練し、強い多言語ベースラインに対して評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:55:45 GMT)
SARE: Sample-wise Adaptive Reasoning for Training-free Fine-grained Visual Recognition [24.0] 学習不要なファイングラインド視覚認識のためのサンプルワイド適応型textbfREasoning フレームワーク SARE を提案する。
SAREは高速な候補検索ときめ細かい推論を組み合わせ、必要なときにのみ後者を呼び出す。
推論プロセスでは、SAREは、過去の失敗を活用して、転送可能な差別的ガイダンスを提供する自己反射的な体験メカニズムを取り入れている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:19:21 GMT)
When AVSR Meets Video Conferencing: Dataset, Degradation, and the Hidden Mechanism Behind Performance Collapse [23.1] 音声強調アルゴリズムは、音声の第1および第2フォルマントを変更する分散シフトの主源である。
音声の第1フォルマントと第2フォルマントを変化させる分散シフトの主源は音声強調アルゴリズムであることがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:03:58 GMT)
3DCity-LLM: Empowering Multi-modality Large Language Models for 3D City-scale Perception and Understanding [23.0] 3DCity-LLMは3次元都市規模の視覚言語認識と理解のために設計された統合フレームワークである。
このデータセットは、7つの代表的なタスクカテゴリにわたる約120万の高品質なサンプルで構成されている。
2つのベンチマーク実験により、3DCity-LLM が既存の最先端手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:18:44 GMT)
2Xplat: Two Experts Are Better Than One Generalist [22.8] 本稿では,ポーズフリーフィードフォワード3DGSフレームワークである2Xplatを紹介する。
専用の幾何学の専門家が最初にカメラのポーズを予測し、3Dガウスを合成する強力な外見の専門家に明示的に渡される。
その概念的単純さは先行研究で大半が過小評価されているにもかかわらず、提案手法は極めて効果的であることが証明されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:31:56 GMT)
Does Teaming-Up LLMs Improve Secure Code Generation? A Comprehensive Evaluation with Multi-LLMSecCodeEval [22.8] Multi-LLMSECCODEEVALは、脆弱性管理ライフサイクル全体にわたるセキュリティの評価と強化のためのフレームワークである。
シングルモデル、アンサンブル、コラボレーティブ、ハイブリッドデザインにまたがる10のパイプラインをベンチマークします。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:13:31 GMT)
An Adapter-free Fine-tuning Approach for Tuning 3D Foundation Models [22.6] 本稿では,完全かつパラメータ効率の良いファインチューニングのギャップを埋めるために,MCFT(Momentum-Consistency Fine-Tuning)を提案する。
MCFTは、運動量ベースの一貫性制約を強制しながら、事前訓練されたエンコーダの一部を選択的に微調整する。
我々はMCFTを2つの変種で拡張する: 豊富なラベル付きデータを活用する半教師付きフレームワークと、計算効率を向上させるプルーニングベースの変種。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:28:37 GMT)
KARMA: Knowledge-Action Regularized Multimodal Alignment for Personalized Search at Taobao [22.6] 大規模言語モデル(LLM)には深い意味知識が備わっている。
LLMはパーソナライズされた検索システムに意味一般化を注入するための自然な選択である。
列車のみの正規化として意味的再構成を扱うフレームワークであるKARMAを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:13:30 GMT)
Synthetic or Authentic? Building Mental Patient Simulators from Longitudinal Evidence [22.5] 統合されたマルチソース患者プロファイルを構築するデータ基底型患者シミュレーションフレームワークを提案する。
複数の大規模言語モデル(LLM)のバックボーンを用いた実験では、DEPROFILEによって構築されたより包括的なプロファイルにより、対話リアリズム、振る舞いの多様性、イベントリッチネスは一貫して改善され、最先端のベースラインを超えている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:56:33 GMT)
The Diminishing Returns of Early-Exit Decoding in Modern LLMs [22.4] 我々は,現代のLarge Language Model (LLM) 推論において,レイヤワイド・アーリーエグジットを再評価する。
モデルの本質的な適合性を早期に定量化する指標を提案する。
密度変換器は一般的に、Mixture-of-ExpertsやState Space Modelsよりも早期のポテンシャルが大きい。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:38:17 GMT)
Pose-Free Omnidirectional Gaussian Splatting for 360-Degree Videos with Consistent Depth Priors [22.3] PFGS360は、ポーズのない全方位ビデオから3Dガウスを再構築する、一方向全方位3DGS法である。
実世界と合成360度ビデオの両方において、既存のポーズレスおよびポーズ対応の3DGS法よりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:25:24 GMT)
Planning as Goal Recognition: Deriving Heuristics from Intention Models -- Extended Version [22.3] 従来の計画問題に対する解を求めるためのGR由来の手法の採用と特性について検討する。
そこで本稿では,目的の意図を評価するための分散型フレームワークを提案し,効率よく計算可能な新しいクラスを提示する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:15:22 GMT)
A training-free framework for high-fidelity appearance transfer via diffusion transformers [22.1] Diffusion Transformer (DiTs) は世代ごとに優れているが、そのグローバルな自己注意は、制御可能な参照イメージベースの編集を困難にしている。
本研究では,高忠実度な外見伝達を実現するために,DiTをテーマとしたトレーニングフリーフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:53:50 GMT)
CRoCoDiL: Continuous and Robust Conditioned Diffusion for Language [21.8] Masked Diffusion Models (MDMs) は自己回帰生成の効率的な非因果的代替手段を提供する。
拡散過程を連続的な文レベルの意味空間にシフトすることで、これらの制限に対処する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:55:11 GMT)
Exploring the Agentic Frontier of Verilog Code Generation [21.7] 本稿では,Verilog 生成のためのエージェント LLM を初めて体系的に評価する。
構造化プロンプトとツール設計がパフォーマンスに与える影響について検討する。
オープンソースモデルとクローズドソースモデルのパフォーマンスギャップは、より高いクラッシュ率とより弱いツール出力の解釈によって引き起こされる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:20:05 GMT)
CIPL: A Target-Independent Framework for Channel-Inversion Privacy Leakage in Agents [21.4] エージェントシステムにおけるプライバシリークを,チャネル逆転問題として定式化する。
このような攻撃を対象としないフレームワークであるCIPL(Channel Inversion for Privacy Leakage)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:29:39 GMT)
REALITrees: Rashomon Ensemble Active Learning for Interpretable Trees [21.3] Rashomon Ensembled Active Learning (REAL) は、すべてのほぼ最適モデルのRashomon Setを徹底的に列挙して委員会を構成する。
雑音の多い環境下では,REALはランダム化アンサンブルよりも優れていた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:27:44 GMT)
Not All Tokens Are Created Equal: Query-Efficient Jailbreak Fuzzing for LLMs [21.1] 大規模言語モデル(LLM)は広くデプロイされているが、ポリシー違反の出力を誘発するジェイルブレイクプロンプトに対して脆弱である。
本稿では,トークン対応のジェイルブレイクファジィフレームワークであるTriageFuzzを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:33:36 GMT)
Chain-of-Authorization: Internalizing Authorization into Large Language Models via Reasoning Trajectories [21.1] Chain-of-Authorization (CoA)フレームワークは、認証ロジックを大規模言語モデルのコア機能に内部化する。
CoAはポリシー実行とタスク応答を統合し、承認を実体的応答の因果的前提とする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:13:01 GMT)
AgentFoX: LLM Agent-Guided Fusion with eXplainability for AI-Generated Image Detection [21.0] 動的多相解析プロセスとしてAIGI検出を再定義するフレームワークである textbfAgentFoX を提案する。
本手法では,キュレートされた知識ベースによって誘導される高速積分融合機構を用いる。
AgentFoXは、その判断を裏付ける詳細な人間可読な法医学レポートを作成している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:10:21 GMT)
Spiking Personalized Federated Learning for Brain-Computer Interface-Enabled Immersive Communication [20.9] 本研究は,脳-コンピュータインタフェース(BCI)を利用して脳信号を取得し,ユーザ中心の状態の推測を行う新しい没入型通信フレームワークを提案する。
収集した脳信号を分析し処理するためのパーソナライズド・フェデレーション・ラーニング(PFL)モデルを開発した。
提案手法は,従来のニューラルネットワークを用いたパーソナライズされたベースラインと比較して,推論エネルギーを6.46$times$に抑えながら,全体の識別精度を最大化する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:46:47 GMT)
MedObvious: Exposing the Medical Moravec's Paradox in VLMs via Clinical Triage [20.8] ビジョン言語モデル(VLM)は、医療報告生成や視覚的質問応答といったタスクにますます使われています。
臨床実践では、解釈は診断前の衛生検査から始まる。
既存のベンチマークでは、このステップが解決されたと仮定しており、致命的な障害モードを見逃している。
我々は1,880タスクのベンチマークであるMedObviousを導入し、入力検証をセットレベルの一貫性機能として分離する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:59:54 GMT)
Concept-based explanations of Segmentation and Detection models in Natural Disaster Management [20.8] 本稿では,PIDNetおよびYOLOアーキテクチャ上での洪水セグメンテーションと車検出予測を理解するための説明可能性フレームワークを提案する。
我々のフレームワークは、ほぼリアルタイムな推論能力を維持しながら、信頼性と解釈可能な説明を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:03:36 GMT)
InterDyad: Interactive Dyadic Speech-to-Video Generation by Querying Intermediate Visual Guidance [20.7] 対話型ダイアディック力学の合成フレームワークであるInterDyadを提案する。
我々はまず、参照ビデオから抽出されたアイデンティティ非依存の動作先に基づいて、ビデオの再現を実現するInteractiveを設計する。
MLLM(Multimodal Large Language Model)を利用して,音声から言語意図を抽出し,反応の正確なタイミングと適切性を決定する。
包括的実験により、InterDyadは、自然と文脈的に基底付けられた2人のインタラクションを生成において、最先端の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:27:52 GMT)
A Sobering Look at Tabular Data Generation via Probabilistic Circuits [20.7] タブラルデータはテキストや画像よりも生成が難しい。
拡散ベースのモデルは現在の最先端(SotA)モデルクラスである。
ディープ確率回路(PC)は、コストのごく一部でSotAモデルに競争力または優れた性能を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:01:28 GMT)
PopResume: Causal Fairness Evaluation of LLM/VLM Resume Screeners with Population-Representative Dataset [20.6] PopResume は LLM および VLM ベースの履歴検査システムの因果フェアネス監査のための人口適応型履歴検定データセットである。
我々は,保護された属性が履歴書に与える影響を,職業関連資格を介するビジネス必要パスと,人口統計学を介するリライニングパスの2つの経路に分解する。
以上の結果から,PSEに基づく評価は,AIを活用した採用において,因果的な監査フレームワークの必要性を浮き彫りにした結果,結果レベルによって隠蔽される公平性の問題を明らかにした。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:08:13 GMT)
How Far Should We Need to Go : Evaluate Provenance-based Intrusion Detection Systems in Industrial Scenarios [20.6] 産業シナリオにおけるPIDSの最初の体系的評価と分析を行う。
我々は、異種マルチソース入力、より強力な攻撃者、良質なアクティビティの複雑さの増加という、業界における3つの大きな特徴を識別する。
評価結果は、ホストやプラットフォーム間でのポータビリティの低下、実世界の攻撃に対する検出性能の低さ、常に変化する良性活動を伴う偽陽性率など、既存のPIDSの課題を明らかにした。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:20:33 GMT)
PersonalQ: Select, Quantize, and Serve Personalized Diffusion Models for Efficient Inference [20.5] PersonalQは、チェックポイントのトリガートークンである共有信号を通じて、チェックポイントの選択と量子化を接続する。
Check-inは、意図認識型ハイブリッド検索とLLMベースのチェックポイントコンテキスト上のランク付けを組み合わせることで、意図整合の選択を行う。
Trigger-Aware Quantization (TAQ) は、トリガー・アウェアの混合精度をクロスアテンションに適用する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:39:35 GMT)
PRISM: Demystifying Retention and Interaction in Mid-Training [20.2] PRISMは、大規模言語モデルにおける中級学習設計の選択に関する総合的な実証的研究である。
約27Bの高品位トークンの中間トレーニングでは, 数学では+15から+40点, コードでは+5から+12点, 科学ベンチマークでは+6から+13点, 一般性能は+6から+13点となる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:53:46 GMT)
BadminSense: Enabling Fine-Grained Badminton Stroke Evaluation on a Single Smartwatch [19.8] BadminSenseは、ウェアラブルセンサーを用いたきめ細かいバドミントンパフォーマンス分析のためのスマートウォッチベースのシステムである。
BadminSenseは、ストロークをセグメントし、分類し、ストロークの品質を予測し、オフザシェルフスマートウォッチの振動信号を使ってシャトルの衝突位置を推定する。
評価の結果,BadminSenseの脳卒中分類精度は91.43%,平均品質評価誤差は0.438,平均衝撃位置推定誤差は12.9%であった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:00:44 GMT)
Learning Actuator-Aware Spectral Submanifolds for Precise Control of Continuum Robots [19.6] スペクトルサブマニフォールド(SSM)の低減は高次元非線形力学系を減少させる主要な方法として浮上している。
提案する制御拡張SSM(caSSM)は,制御入力を状態表現に明示的に組み込むことにより,この方法論を拡張した。
テンポン駆動トランクロボットのための小型caSSMモデルを学習し、リアルタイム制御を可能にし、オープンループ予測誤差を40%削減する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:30:29 GMT)
LLM Olympiad: Why Model Evaluation Needs a Sealed Exam [19.6] 我々は、オリンピアド式評価イベントにおいて、評価まで問題が封じ込められ、提出が事前に凍結され、全てのエントリが標準化されたハーネスを介して実行されることを論じる。
スコアリング後、全タスクセットと評価コードをリリースし、結果を再生して監査することができる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:55:12 GMT)
Non-Adversarial Imitation Learning Provably Free of Compounding Errors: The Role of Bellman Constraints [19.4] AIL(Adversarial mimicion Learning)は,行動クローニング(BC)における複合的誤りを軽減し,高品質な模倣を実現する
本稿では IQ-Learn を再検討し、それが BC に顕著に減少し、地平線上の二次的依存の低い模擬ギャップに苦しむことを示した。
そこで本研究では,新しいQ-based IL法であるDual Q-DM(Dual Q-DM)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:06:31 GMT)
A Feature Shuffling and Restoration Strategy for Universal Unsupervised Anomaly Detection [19.3] 産業分野では、教師なしの異常検出が不可欠であり、その単純さと有効性のために再構築に基づく手法が好まれている。
UlineFeature ulineShuffling and ulineRestoration (FSR)
FSRは、画像ピクセルではなく、再構成ターゲットとしてリッチなセマンティック情報を備えたマルチスケール機能を採用している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:04:20 GMT)
MultiCam: On-the-fly Multi-Camera Pose Estimation Using Spatiotemporal Overlaps of Known Objects [19.3] マルチカメラダイナミック拡張現実(AR)アプリケーションは、カメラの個々の情報を1つの共通システムで活用するために、カメラのポーズ推定を必要とする。
一般的にカメラは初期段階で校正されるか、マーカーの定期的な使用によって更新されるが、別の選択肢は、既知のオブジェクトのようなシーンに存在する情報を活用することである。
本研究では,FotemporalV重なり合いを利用した静止ダイナミックカメラのポーズ推定手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:26:28 GMT)
SIGMA: A Physics-Based Benchmark for Gas Chimney Understanding in Seismic Images [19.0] ガス煙突(英: gas chimneys)は、地下の流体移動によって引き起こされる垂直な異常である。
従来の物理学に基づく手法は計算コストが高く、モデルエラーに敏感である。
ディープラーニングは効率的な代替手段を提供するが、ラベル付きデータセットはない。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:12:45 GMT)
Shape-Adaptive Conditional Calibration for Conformal Prediction via Minimax Optimization [19.0] ミニマックス最適化予測推論(minimax Optimization Predictive Inference、MOPI)は、キャリブレーションフェーズにおいて、フレキシブルなセット値マッピングのクラスを最適化することにより、事前処理を一般化するフレームワークである。
我々はMOPIが既存のベースラインよりも効率的な予測セットを生成することを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:05:43 GMT)
AgentRAE: Remote Action Execution through Notification-based Visual Backdoors against Screenshots-based Mobile GUI Agents [18.8] モバイルグラフィカルユーザインタフェース(GUI)エージェントは、アプリケーションとオペレーティングシステム(OS)を自律的に制御する
本稿では,視覚的に自然なトリガを用いたモバイルGUIエージェントにおけるリモートアクション実行を誘導する新しいバックドアアタックであるAgentRAEを提案する。
評価の結果,提案したバックドアは10個のモバイル操作に対して90%以上の攻撃成功率でクリーンな性能を保っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:51:43 GMT)
UAV-DETR: DETR for Anti-Drone Target Detection [18.8] UAV-DETRは、小型のターゲットフレンドリーなアーキテクチャとリアルタイム検出機能を統合した新しいフレームワークである。
特にUAV-DETRはWTConv強化バックボーンとSliding Window Self-Attention (SWSA-IFI)エンコーダを備えている。
精度をさらに高めるため、UAV-DETRはインナーCIoUとNWDの損失戦略を統合し、標準IoUメトリクスの極端感度を小さな位置ずれに緩和する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:29:51 GMT)
From Prediction to Diagnosis: Reasoning-Aware AI for Photovoltaic Defect Inspection [18.4] REVL-PVは、ドメイン固有の診断推論をマルチモーダル学習に組み込むビジョン言語フレームワークである。
8つの欠陥カテゴリにまたがる1,927個の実世界のモジュールについて評価した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:30:04 GMT)
DAK-UCB: Diversity-Aware Prompt Routing for LLMs and Generative Models [18.2] 本稿では,多様性を考慮した生成モデルのオンライン選択のための文脈的帯域幅アルゴリズムとして,ダイバーシティ・アウェア・カーネル化アッパー信頼境界(DAK-UCB)を導入する。
DAK-UCBは,一連のプロンプトに対して世代間の忠実さを維持しつつ,多様性を考慮したモデル選択を促進する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:38:26 GMT)
Rethinking Machine Unlearning: Models Designed to Forget via Key Deletion [18.2] モデルを直接訓練して、忘れることを支援する新しいパラダイムである、設計によるアンラーニングを提案する。
我々はこのアイデアを、モデルウェイトからインスタンス固有の記憶を分離するメモリ拡張トランスフォーマーであるKEY deletion (MUNKEY)を介して、Machine UNlearningでインスタンス化する。
その結果、設計によるアンラーニングは、予測性能を維持しながら、高速でデプロイ指向のアンラーニングを可能にすることが判明した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:06:34 GMT)
Generalizing Dynamics Modeling More Easily from Representation Perspective [18.0] 我々はPDEDER(Generalized Pre-trained Dynamics EncoDER)を行う。
PDEDERは、元の状態の観測結果をより容易に取得できる潜在空間に埋め込む。
ドメイン内設定とクロスドメイン設定の両方で,PDEDERを短時間・長期の予測によって評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:15:47 GMT)
Connection-topology--dependent energy transport and ergotropy in quantum battery networks with reciprocal and nonreciprocal couplings [17.9] 本稿では, 相互結合と非相互結合を両立させた量子電池ネットワークについて検討する。
相互カスケードネットワークでは、パリティに依存したスペクトル応答は奇数に均一な輸送効果をもたらす。
また, サーマルノイズが受動エネルギーを主に増加させることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:52:37 GMT)
Caption Generation for Dongba Paintings via Prompt Learning and Semantic Fusion [17.7] 本稿では,コンテントプロンプトモジュールと視覚的セマンティック・ジェネレーション・フュージョン・ロスを統合したエンコーダ・デコーダ・フレームワークを提案する。
本研究は,7つの主題カテゴリにまたがる文化的接地アノテーションを用いた9408枚の拡張画像からなるドンバ絵画キャプションデータセットを構築した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:42:53 GMT)
ViKey: Enhancing Temporal Understanding in Videos via Visual Prompting [17.6] Video Large Language Models (VideoLLMs) は多様なマルチモーダルビデオタスクで高いパフォーマンスを実現している。
高精細ビデオフレーム処理の計算コストを低減するため,フレーム選択などの効率指向手法が広く採用されている。
本稿では、VPとKFM(Keyword-Frame Mapping)モジュールを組み合わせたトレーニングフリーフレームワークであるViKeyを紹介する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:32:52 GMT)
DALDALL: Data Augmentation for Lexical and Semantic Diverse in Legal Domain by leveraging LLM-Persona [17.5] 我々は、法情報検索(IR)に適したペルソナベースのデータ拡張フレームワークであるDALDALLを紹介する。
本手法では, 弁護士, 検察官, 裁判官など, ドメイン固有の専門的なペルソナを用いて, バニラのアプローチよりも語彙的, 意味的な多様性を著しく向上させる合成クエリを生成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:49:09 GMT)
Can LLM Agents Generate Real-World Evidence? Evaluating Observational Studies in Medical Databases [17.4] 我々は、MIMIC-IVをベースとしたRWE-benchについて、ピアレビューによる観察研究から紹介する。
各タスクは対応する研究プロトコルを基準として提供し、エージェントは実際のデータベースで実験を行う必要がある。
162タスク全体では、タスク成功率は低く、最高のエージェントが39.9%、最高のオープンソースモデルが30.4%に達する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:50:34 GMT)
OmniDiT: Extending Diffusion Transformer to Omni-VTON Framework [16.9] 拡散変換器に基づくオムニ仮想トライオンフレームワークであるOmniDiTを提案する。
まず,データを連続的に生成するための自己進化型データキュレーションパイプラインを構築し,大規模なVTONデータセットOmni-TryOnを構築した。
拡散モデルにShifted Window Attentionを導入し、線形複雑化を実現しました。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:23:30 GMT)
Privacy-Preserving EHR Data Transformation via Geometric Operators: A Human-AI Co-Design Technical Report [16.6] 構造化された臨床記録のプライバシー保護のためのリアルタイムデータ変換フレームワークを提案する。
我々のアプローチは、医学的意味論と主要な統計的性質を保存する数値的な見解を変容させるものである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:49:22 GMT)
MemCollab: Cross-Agent Memory Collaboration via Contrastive Trajectory Distillation [16.6] 大規模言語モデル(LLM)ベースのエージェントは、過去の問題解決経験から知識を再利用するためのメモリメカニズムに依存している。
既存のアプローチは、通常、エージェントごとの方法でメモリを構築し、格納された知識を単一のモデルの推論スタイルに密結合する。
その結果,エージェント間でのメモリ転送は,タスク関連知識をエージェント固有のバイアスと結び付けるなど,パフォーマンスを低下させることがわかった。
我々は,同一タスク上で異なるエージェントが生成する軌道の推論を対比することにより,エージェント非依存メモリを構成する協調メモリフレームワークであるMemCollabを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:05:47 GMT)
TRAP: Hijacking VLA CoT-Reasoning via Adversarial Patches [16.5] CoT(Chain-of-Thought)推論は、ロボット操作において強力な能力を示している。
我々は、CoT推論がターゲット制御ハイジャックのための新しい攻撃ベクトルを導入することを示す。
我々は, CoT-reasoning Vision-Language-Actionモデルに対する最初の対向攻撃フレームワークであるTRAPを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:14:12 GMT)
Instrument-Splatting++: Towards Controllable Surgical Instrument Digital Twin Using Gaussian Splatting [16.5] 手術器具を高忠実度で制御可能なガウス資産として再構築するフレームワークであるInstrument-Splatting++を提案する。
本研究では, フレームごとの6-DoFのポーズと関節角を無作為な内視鏡的ビデオから再現する意味的ポーズ推定・追跡法を提案する。
本研究では,EndoVis17/18,SAR-RARP,および社内データセットから抽出した配列について検証を行った。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:31:09 GMT)
Unleashing Spatial Reasoning in Multimodal Large Language Models via Textual Representation Guided Reasoning [16.4] 既存の多言語大言語モデル(MLLM)は3次元空間推論に苦慮している。
Egocentric Video (TRACE) は,MLLMを誘導して3D環境のテキストベース表現を生成するプロンプト手法である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:38:09 GMT)
Conformal Cross-Modal Active Learning [16.4] Active Learningは、ラベル付けのための最も有益なサンプルを戦略的に選択することで、アノテーションコストを最小限にすることを目的としている。
本稿では,教師-学生アーキテクチャを通じて視覚と言語モダリティを橋渡しする新しいALフレームワークであるConformal Cross-Modal Acquisition (CCMA)を紹介する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:59:47 GMT)
Estimating Individual Tree Height and Species from UAV Imagery [16.4] BIRCH-Treesは,樹高を推定する最初のベンチマークであり,樹木中心のUAV画像から種を推定する。
また,視覚基礎モデル(VFM)のバックボーンとタスク固有の頭部を併用した統合的アプローチとしてDINOvTreeを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:16:24 GMT)
Policy-based Tuning of Autoregressive Image Models with Instance- and Distribution-Level Rewards [16.1] 自己回帰モデル(AR)は画像生成に非常に効果的であるが、標準の最大形推定トレーニングではサンプルの品質と多様性を直接最適化することができない。
本稿では,トークンベースのAR推論をマルコフ決定プロセスとして,グループ相対ポリシー最適化によって最適化した軽量なRLフレームワークを提案する。
私たちの中核的な貢献は、新しい流通レベルのLeave-One-Out FID(LOO-FID)の報酬の導入です。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:28:36 GMT)
AdvSplat: Adversarial Attacks on Feed-Forward Gaussian Splatting Models [16.1] 3D Gaussian Splatting (3DGS) はリアルタイム・高忠実な3D再構成のための強力なパラダイムとしてますます認識されている。
最近出現したフィードフォワード3DGSモデルは、大規模な事前訓練後の入力ビューからの高速な再構築を可能にすることで、これらの制限に対処している。
フィードフォワード3DGSに対する敵攻撃に関する最初の体系的研究であるAdvSplatを紹介する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:48:23 GMT)
PRISM: A Dual View of LLM Reasoning through Semantic Flow and Latent Computation [15.9] PRISM(Probabilistic Reasoning Inspection through Semantic and Implicit Modeling)は、両方のレベルを共同で分析するためのフレームワークおよび診断ツールである。
これは、推論過程における系統的なパターンを明らかにし、失敗した軌道は非生産的な検証ループに閉じ込められる傾向にあることを示した。
PRISMは、最終タスクの精度にのみ依存するのではなく、これらの振る舞いを観測し分析可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:31:53 GMT)
A Practical Framework for Flaky Failure Triage in Distributed Database Continuous Integration [15.8] 分散データベース継続的インテグレーション(CI)を効率的かつ信頼性に維持するためには、不安定な障害トリアージが不可欠だ。
SCOUTは、分散データベースCIのための、状態認識型オンライン不確実性を校正したトリアージフレームワークである。
SCOUTは、障害前のテレメトリや厳密な歴史的データなど、厳格な因果関係のみを使用して、ルックアヘッドなしでオンライン決定を行う。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:50:25 GMT)
Traffic Sign Recognition in Autonomous Driving: Dataset, Benchmark, and Field Experiment [15.8] 交通信号認識(TSR)は、自動運転における中核的な認識能力である。
本稿では,大規模かつグローバルなトラフィックサインデータセットTS-1Mを提案する。
3つの代表的な学習パラダイムにまたがって統一されたベンチマークを実施します。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:11:27 GMT)
Off-Policy Evaluation and Learning for Survival Outcomes under Censoring [15.7] オフ・ポリティ・アセスメント(OPE)はそのような意思決定ポリシーを評価するための強力なフレームワークを提供する。
OPEとOPL(Off-Policy Learning)のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:50:38 GMT)
FDIF: Formula-Driven supervised Learning with Implicit Functions for 3D Medical Image Segmentation [15.6] ディープラーニングに基づく3D医療画像セグメンテーション手法は、大規模ラベル付きデータセットに依存している。
フォーミュラ駆動型スーパービジョン学習法は, 数式から直接トレーニングデータとラベルを生成することで, 魅力的な代替手段を提供する。
実データや医療専門家のアノテーションを使わずに、スケーラブルな事前学習を可能にするフレームワークである、Implicit Functions (FDIF) を用いたフォーミュラ駆動型教師あり学習を紹介する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:45:39 GMT)
Can Large Language Models Reason and Optimize Under Constraints? [15.4] 我々は、推論、構造化された入力処理、算術、制約付き最適化といった基本的なスキルのセットを必要とする、挑戦的な評価設定を導入する。
評価の結果, SoTA LLM はほとんどのタスクで失敗し, 推論 LLM は依然として最も複雑な設定で失敗していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:50:17 GMT)
ENC-Bench: A Benchmark for Evaluating Multimodal Large Language Models in Electronic Navigational Chart Understanding [15.4] ENC-Benchは、プロのEMC理解に特化した最初のベンチマークである。
ENC-Benchは840個のNOAA ENCから20,490個の専門家検証されたサンプルを含んでいる。
我々は、ゼロショットプロトコルを統一した10の最先端MLLMを評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:47:39 GMT)
AeroScene: Progressive Scene Synthesis for Aerial Robotics [15.4] 本研究では,プログレッシブ3次元シーン合成のための階層的拡散モデルであるAeroSceneを紹介する。
提案手法は階層型トークン化とマルチブランチ機能抽出を利用して,グローバルレイアウトとローカル詳細の両方を推論する。
これによりAeroSceneは、ナビゲーション、着陸、パーチといった航空ロボティクスのタスクの現実的なシーンを生成するのに特に適している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:59:45 GMT)
Focus, Don't Prune: Identifying Instruction-Relevant Regions for Information-Rich Image Understanding [15.3] PinPointは、まず命令関連の画像領域を特定し、それを洗練して、きめ細かい視覚的特徴を抽出するフレームワークである。
新しいアノテーションは、挑戦的なVQAベンチマークにまたがる命令関連領域に対して、よりリッチな地味な監視を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:37:01 GMT)
Permutation-Symmetrized Diffusion for Unconditional Molecular Generation [15.3] 商多様体 $tildecalX=sRdtimes N/S_N$ 上で直接拡散をモデル化することを提案する。
我々は、$tildecalX$上の熱核が置換上のユークリッド熱核の和として明示的な表現を持つことを示し、商の拡散が秩序粒子拡散とどのように異なるかを明らかにする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:20:42 GMT)
Kronecker-Structured Nonparametric Spatiotemporal Point Processes [15.1] イベントテンポラルドメインは、正確な予測が課題となる多くの現実世界のアプリケーションで発生する。
KSTPP(Kronecker-Structuredpatio Stemporal Point)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:13:24 GMT)
Emergent Dexterity via Diverse Resets and Large-Scale Reinforcement Learning [14.9] 我々はOmniResetを紹介した。OmniResetはシンプルでスケーラブルなフレームワークで、オンデマンドの強化学習を可能にする。
我々は,OmniResetが,既存のアプローチの能力を超えた,長時間のデクサラスな操作タスクにスケール可能であることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:21:28 GMT)
Beyond Theoretical Bounds: Empirical Privacy Loss Calibration for Text Rewriting Under Local Differential Privacy [14.9] 局所微分プライバシー(LDP)に基づくテキスト書き換え機構の校正方法について検討する。
本稿では,テキストの識別可能性監査を表面および埋め込み空間の両方で行うTeDAを提案する。
このキャリブレーションをいくつかの代表的なメカニズムに適用することにより、同様の名目$varepsilon$boundsは、非常に異なるレベルの識別可能性を示すことを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:05:16 GMT)
InverFill: One-Step Inversion for Enhanced Few-Step Diffusion Inpainting [14.8] InverFillは、インペイント用に調整されたワンステップのインバージョンメソッドである。
入力されたマスク画像から初期ノイズに意味情報を注入し、高忠実度な数ステップの塗装を可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:32:55 GMT)
Aesthetic Assessment of Chinese Handwritings Based on Vision Language Models [14.7] 我々は視覚言語モデル(VLM)を活用し、手書き漢字の質を分析し、マルチレベルフィードバックを生成する。
本稿では,ローランク適応(LoRA)に基づく微調整手法と,美的評価知識をVLMに統合するためのコンテキスト内学習手法について検討する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:57:26 GMT)
In-orbit Test of the Weak Equivalence Principle with Atom Interferometry [14.7] 二重種原子干渉計が中国宇宙ステーションで実現されている。
WEP試験データの280日から2.8*10-8のテスト不確実性が得られる。
この研究は、宇宙で動く量子慣性センサーの道のりと、宇宙における将来の基礎物理学への応用を開拓する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:18:29 GMT)
StateLinFormer: Stateful Training Enhancing Long-term Memory in Navigation [14.7] 我々はステートフルメモリ機構でトレーニングされた線形アテンションナビゲーションモデルであるStateLinFormerを紹介する。
この訓練パラダイムは、無限に長いシーケンスでの学習を効果的に近似し、モデルが長期記憶保持を達成することを可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:04:50 GMT)
Exponential Separation of Quantum and Classical One-Way Numbers-on-Forehead Communication [14.6] NoF(Numbers-on-Forehead)通信モデルは、通信複雑性の中心的なモデルである。
本論文では,一方通行NOFモデルにおいて,量子とランダム化通信の複雑性を指数関数的に分離する最初の方法を確立する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:38:22 GMT)
Algorithmic warm starts for Hamiltonian Monte Carlo [14.5] Hamiltonian Monte Carloは、主要なソフトウェアパッケージにまたがるデフォルトのアルゴリズムである。
したがって、温かいスタートを見つけることは、HMCの計算ボトルネックである。
エンフェノンメトロゾル化 HMC は $tildeO(d1/4)$ iterations の温かいスタートを生じることを証明している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:06:48 GMT)
SIMART: Decomposing Monolithic Meshes into Sim-ready Articulated Assets via MLLM [14.4] 本稿では,部分レベルの分解と運動予測を共同で行う統合MLLMフレームワークであるSIMARTを提案する。
Sparse 3D VQ-VAEを導入することで、SIMARTは、密度の高いボクセルトークンに対してトークン数を70%削減し、高忠実なマルチパーツアセンブリを可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:16:52 GMT)
On the Vulnerability of FHE Computation to Silent Data Corruption [14.3] FHE(Fully Homomorphic Encryption)は、プライバシ保護クラウドサービスの有望な基盤として浮上している。
実ハードウェア上でのFHE計算はどの程度信頼性が高いか?
FHE暗号文計算におけるSDCの包括的評価を行う。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:18:05 GMT)
Sparser, Faster, Lighter Transformer Language Models [14.1] 自己回帰型大規模言語モデル(LLM)のスケーリングは前例のない進歩を遂げているが、膨大な計算コストが伴う。
LLMのフィードフォワード層内の非構造的空間性を活用することで、これらのコストに対処する。
すべてのコードとカーネルをオープンソースライセンスでリリースし、採用を促進するとともに、スパーシティを実践的な軸として確立するための研究を加速します。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:43:27 GMT)
AscendOptimizer: Episodic Agent for Ascend NPU Operator Optimization [14.0] 私たちは、この不足した専門知識を、実行を経験に変えることでブートストラップする、エピソードエージェントであるAscendrを紹介します。
Ascendrは、オープンソースのベースライン上での1.19倍の幾何平均スピードアップを実現し、オペレーターの49.61%が参照し、強力なエージェントと検索ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:54:53 GMT)
Leveraging Large Language Models for Trustworthiness Assessment of Web Applications [13.9] 本研究では,大規模言語モデル(LLM)を活用したWebアプリケーションの信頼性評価を自動化する実証的手法を提案する。
本稿では,LSP(Logic Score of Preference)に基づく階層品質モデルの拡張を提案する。
実験結果から,過度な構造的コンテキストがノイズを発生させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:33:54 GMT)
Avoiding Over-smoothing in Social Media Rumor Detection with Pre-trained Propagation Tree Transformer [13.8] 噂検出のためのディープラーニング技術は、一般的にグラフニューラルネットワーク(GNN)を用いてポスト関係を分析する。
オーバー・スムーシングは、ほとんどのノードが1レベルノードである噂の伝搬木の構造的特性と本質的に結びついている。
そこで本研究では,純粋トランスアーキテクチャに基づく事前学習型伝搬木変換器(P2T3)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:45:02 GMT)
FHAvatar: Fast and High-Fidelity Reconstruction of Face-and-Hair Composable 3D Head Avatar from Few Casual Captures [13.8] 任意の視点から顔と髪の成分を合成可能な3次元ガウスアバターを再構成するための新しいフレームワークであるFHAvatarについて述べる。
実験により、FHAvatarは数分で新しいアイデンティティを数回だけ観察することで、最先端の再構築品質を達成することが示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:43:54 GMT)
MoCHA: Denoising Caption Supervision for Motion-Text Retrieval [13.7] テキスト移動検索システムは、コントラッシブな目的を通じて、モーションキャプチャーペアから共有埋め込み空間を学習する。
標準的なコントラストトレーニングは、各キャプションを単一正のターゲットとして扱い、この分布構造を見渡す。
符号化に先立って各キャプションを再生可能なコンテンツに投影することにより,この分散を低減させるテキスト標準化フレームワークであるMoCHAを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:47:00 GMT)
JND-Guided Neural Watermarking with Spatial Transformer Decoding for Screen-Capture Robustness [13.7] 画面撮影のための透かし埋め込みと抽出を協調的に最適化するエンド・ツー・エンドのディープラーニングフレームワークを提案する。
筆者らのフレームワークには, 現実的な画面撮影歪みを忠実にモデル化する包括的ノイズシミュレーション層, (ii) 透かし埋め込み強度を適応的に調節するジャスト・ノーティケータブル・ディストーション (JND) パーセプチュアル・ロス関数, (iii) 補足的な自動位置決めモジュールの3つが組み込まれている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:38:42 GMT)
Stochastic Ray Tracing for the Reconstruction of 3D Gaussian Splatting [13.6] レイトレーシング3DGSの識別可能なソートフリーな定式化について述べる。
標準的な3DGSでは,ソートに基づく3DGSの再現品質と高速化が一致している。
3DGSでは、同じ推定器が、完全に光線を照射したシャドウ線で、ガウスあたりのシェーディングを駆動する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:23:12 GMT)
PA-LVIO: Real-Time LiDAR-Visual-Inertial Odometry and Mapping with Pose-Only Bundle Adjustment [13.5] リアルタイムLiDAR-visual-inertial odometry and mappingはインテリジェント交通システムにおけるナビゲーションおよび計画作業に不可欠である。
本研究では,リアルタイムナビゲーションとマッピングの緊急ニーズを満たすために,ポーズ専用バンドル調整 (PA) LiDAR-visual-inertial odometry (LVIO) を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:22:49 GMT)
Efficient Hallucination Detection: Adaptive Bayesian Estimation of Semantic Entropy with Guided Semantic Exploration [13.3] 本稿では,セマンティック・エントロピーをガイドとした適応ベイズ推定フレームワークを提案する。
提案手法では,階層型ベイズフレームワークを用いて意味分布をモデル化し,サンプリング繰り返しの動的制御を可能にする。
低予算のシナリオでは、既存の手法に匹敵する検出性能を達成するために、我々の手法はサンプルを約50%削減する必要がある。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:21:19 GMT)
WaveSFNet: A Wavelet-Based Codec and Spatial--Frequency Dual-Domain Gating Network for Spatiotemporal Prediction [13.2] 鍵となる課題は、急激な多段階予測のために高周波の詳細を保持しながら、長距離力学をモデル化することである。
本稿では、ウェーブレットベースのトランスレータと空間周波数デュアルドメイントランスレータを結合した効率的なフレームワークであるWaveSFNetを提案する。
WaveSFNetは、計算複雑性を低く保ちながら、移動Mtemporal、TaxiBJ、WeatherBenchの競合精度を達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:48:59 GMT)
Digital Twin Enabled Simultaneous Learning and Modeling for UAV-assisted Secure Communications with Eavesdropping Attacks [13.0] 本稿では,UAV支援無線ネットワークにおけるセキュア通信に着目した。
複数の正統なUAV(LE-UAV)とインテリジェントなEavesdropping UAV(EA-UAV)から構成される。
LE-UAVがデータ転送とジャミングモードを動的に切り替えることのできるモード切替方式を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:31:08 GMT)
Learning What Can Be Picked: Active Reachability Estimation for Efficient Robotic Fruit Harvesting [13.0] 農業は世界の健康と経済の持続可能性の基盤であり続けているが、高価値作物の収穫などの労働集約的な作業は、労働力不足に直面し続けている。
提案手法は,RGB-D認識とアクティブラーニングを組み合わせることで,二項決定問題として到達可能性を直接学習する。
本フレームワークは,ラベル付きサンプルの精度を著しく低くし,ランダムサンプリングよりも約6~8%高い精度を実現し,新しい果樹園構成へのラベル効率の適応を可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:35:22 GMT)
PHANTOM Hand [12.9] 腱駆動不動手は適応的握力では優れるが、運動的不予測性や非作動力伝達に悩まされることが多い。
PHANTOM Hand (Hybrid Precision-Augmented Compliance) は6つのアクチュエータと15自由度(DoF)を備えたモジュラー・ヒューマンスケールシステムである。
本稿では,正確な解析的形状と頑健な整合性把握のギャップを埋める統一的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:52:18 GMT)
Elastic Weight Consolidation Done Right for Continual Learning [12.2] EWC(Elastic Weight Consolidation)は、勾配に基づいて重みを推定する。
EWCのFiher Information Matrix (FIM)への依存は、勾配の消失と不正確な重要度推定をもたらす。
本稿では,EWC の重要度推定を補正する簡易かつ効果的な修正である Logits Reversal (LR) 演算を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:51:25 GMT)
Template-Based Feature Aggregation Network for Industrial Anomaly Detection [12.1] 本稿ではテンプレートベースの特徴集約による異常検出のための新しい異常検出モデルTFA-Netを提案する。
TFA-Netは、固定テンプレート画像と入力画像のための事前訓練された畳み込みニューラルネットワークから複数の階層的特徴を集約する。
シンプルだが効率的であるTFA-Netは、様々な実世界の産業データセットに対して最先端の検知性能を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:17:57 GMT)
Detecting Non-Membership in LLM Training Data via Rank Correlations [12.0] モデルロジットへのグレーボックスアクセスのみを使用してデータセットレベルの非メンバシップを検出するテストであるPRISMを紹介する。
我々の重要な洞察は、データセットを見たことのない2つのモデルが、正規化トークンログの確率において、1つのモデルがそのデータに基づいてトレーニングされた時よりも高いランク相関を示すことである。
PRISMは、偽陽性を避けながら、テストされたすべてのデータセットにわたるトレーニングデータのメンバシップを確実に除外する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:59:18 GMT)
OccAny: Generalized Unconstrained Urban 3D Occupancy [11.9] オックアニー(OccAny)は、最初の非拘束型都市3D占有モデルである。
OccAnyは、シーケンシャル、モノクラー、サラウンドビューの画像から占有率を予測するために多用途である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:59:58 GMT)
Set-Valued Prediction for Large Language Models with Feasibility-Aware Coverage Guarantees [11.9] 本稿では,設定値予測のための原則的フレームワークを提案する。
LLM生成の有限サンプリングの性質を考えると、カバレッジは必ずしも達成可能であるとは限らない。
次に,サンプル応答から予測セットを構成するデータ駆動キャリブレーション手法を開発した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:00:07 GMT)
Learning Safe-Stoppability Monitors for Humanoid Robots [11.9] 我々は,ヒューマノイドの緊急停止を政策依存型安全性問題として定式化する。
我々はPRISMを紹介した。PRISMはシミュレーション駆動のフレームワークで、状態レベルのストッパビリティのための神経予測器を学習する。
以上の結果から,政策依存的停止性としての安全性のモデル化により,積極的な安全監視が可能であり,ヒューマノイドロボットのフェールセーフ動作のスケーラブルな認証を支援することが示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:51:32 GMT)
Quality Over Clicks: Intrinsic Quality-Driven Iterative Reinforcement Learning for Cold-Start E-Commerce Query Suggestion [11.7] コールドスタートE-Commerce Query Suggestion(EQS)のための反復的強化学習フレームワークであるCold-EQSを提案する。
我々は、回答可能性、事実性、情報ゲインを報酬として活用し、提案されたクエリの品質を継続的に最適化する。
オフラインとオンラインの両方の実験結果から、私たちのCold-EQSの優位性が示され、オンラインチャットUVの6.81%が大幅に改善された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:11:39 GMT)
Customized User Plane Processing via Code Generating AI Agents for Next Generation Mobile Networks [11.7] ジェネレーティブAIは、次世代のモバイルネットワーキングに決定的な影響を与えると期待されている。
本研究では,このようなカスタマイズされた処理ブロックをオンデマンドで生成するコード生成問題について検討する。
以上の結果から,AIエージェントが所望の振る舞いをオンデマンドで生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:19:05 GMT)
SynForceNet: A Force-Driven Global-Local Latent Representation Framework for Lithium-Ion Battery Fault Diagnosis [11.6] 提案手法は,20台のEVから収集した860万個の有効なデータポイントを用いて検証した。
TPRでは7.59%、PVでは27.92%、F1では18.28%、AUCでは23.68%の平均的な改善が達成されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:27:27 GMT)
PiCo: Active Manifold Canonicalization for Robust Robotic Visual Anomaly Detection [11.5] PiCoは、条件不変な正準多様体に観測を積極的に投影する統合フレームワークとして導入された。
第1段階であるActive Physical Canonicalizationでは、ロボットエージェントがオブジェクトを並べ替えることで、そのソースにおける幾何的不確実性を減らすことができる。
第2段階であるNeural Latent Canonicalizationでは、入力レベルでの光度処理、特徴レベルでの潜時改善、意味レベルでの文脈推論からなる3段階の認知階層が採用されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:18:09 GMT)
GateSID: Adaptive Gating for Semantic-Collaborative Alignment in Cold-Start Recommendation [11.5] GateSIDは適応的なゲーティングネットワークを使用して、アイテムの成熟度に応じて意味的および協調的な信号のバランスをとる。
オンラインA/Bテストはその実用的価値を確認し、+2.6%のGMV、+1.1%のCTR、+1.6%の注文で5ミリ秒未満の遅延を発生させる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:04:41 GMT)
PhySe-RPO: Physics and Semantics Guided Relative Policy Optimization for Diffusion-Based Surgical Smoke Removal [11.4] 外科的煙は、術中ビデオ品質を著しく低下させ、解剖学的構造を覆い、外科的知覚を制限する。
我々はPhySe-RPOを提案する。PhySe-RPOは物理およびセマンティックス誘導相対ポリシー最適化によって最適化された拡散復元フレームワークである。
物理学誘導報酬は照明と色の一貫性を課し、CLIPに基づく外科的概念から学んだ視覚概念のセマンティック報酬は無煙で解剖学的に一貫性のある修復を促進する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:32:12 GMT)
RadTimeline: Timeline Summarization for Longitudinal Radiological Lung Findings [11.2] 時系列レポートの要約を時系列生成タスクとして,時系列レポートを列に整理し,時系列レポートを行に分類した。
この構造化された要約フォーマットは、時間にわたって結果の直接比較を可能にし、関連するレポートに対するファクトチェックを容易にする。
このようなシステムを評価するために,胸部画像診断における肺関連放射線学的所見の追跡を目的とした時系列データセットRadTimelineを開発した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:48:44 GMT)
RelayS2S: A Dual-Path Speculative Generation for Real-Time Dialogue [11.2] RelayS2Sは、ターン検出時に並列に2つのパスを実行するハイブリッドアーキテクチャである。
ライトウェイト学習検証器は、ハンドオフをゲートし、適切な場合にはプレフィックスをコミットし、遅路のみに優雅に後退する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:43:58 GMT)
Echoes: A semantically-aligned music deepfake detection dataset [11.0] Echoesは、ディテクターのトレーニングとベンチマークのために設計された音楽のディープフェイク検出のための新しいデータセットである。
楽曲は3,577曲(110時間のオーディオ)で、複数のジャンル(ポップ、ロック、エレクトロニック)にまたがる。
我々は、最先端のWav2Vec2 XLS-R 2B表現を用いて、既存の3つのAI生成音楽データセットに対して、Echoをクロスデータセットで評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:10:42 GMT)
ConceptCoder: Improve Code Reasoning via Concept Learning [10.7] ConceptCoderは、人間のコード検査をシミュレートする微調整方法である。
モデルはまずコードの概念を認識し、これらの概念の上に推論を実行するように訓練される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:37:32 GMT)
GO-Renderer: Generative Object Rendering with 3D-aware Controllable Video Diffusion Models [10.7] GO-Rendererは、任意の照明条件下で高品質なオブジェクトレンダリングを実現するために、ビデオ生成モデルをガイドするフレームワークである。
新しい視点でのイメージの合成、新しい照明環境におけるオブジェクトのレンダリング、既存のビデオへのオブジェクト挿入など、オブジェクトレンダリングタスクにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:14:21 GMT)
Weak-PDE-Net: Discovering Open-Form PDEs via Differentiable Symbolic Networks and Weak Formulation [10.6] Weak-PDE-Netは、オープンフォームPDEを堅牢に識別できるエンドツーエンドの差別化可能なフレームワークである。
いくつかの挑戦的なPDEベンチマークの実験では、Weak-PDE-Netは、非常にスパースでノイズの多い観測の下でも、正確に支配方程式を復元することを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:47:01 GMT)
One View Is Enough! Monocular Training for In-the-Wild Novel View Generation [10.5] 我々は、未完成のインターネット画像で完全に訓練されたOVIEを提示する。
推定では、OVIEは幾何学的自由であり、深さ推定器や3D表現を必要としない。
フィールド内でのみ訓練されたOVIEは、ゼロショット設定で以前のメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:54:25 GMT)
Steering Code LLMs with Activation Directions for Language and Library Control [10.5] コードLLMは、中立的なプロンプトの下で特定のプログラミング言語やライブラリにデフォルトとなることが多い。
本研究では,これらの嗜好が,推定時間で操作できる活性化空間において,ほぼ線形な方向として符号化されているかどうかを検討する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:12:05 GMT)
MedCausalX: Adaptive Causal Reasoning with Self-Reflection for Trustworthy Medical Vision-Language Models [10.5] 既存の医療連鎖モデルには因果推論を表現・強制するための明確なメカニズムが欠如している。
MedCausalXは医療用VLMの因果推論チェーンを明示的にモデル化したエンドツーエンドフレームワークである。
我々は,MedCausalXが常に最先端の手法より優れ,診断の整合性は+5.4ポイント向上し,幻覚は10ポイント以上減少し,最上位の空間接地IoUに達することを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:28:15 GMT)
PhotoAgent: A Robotic Photographer with Spatial and Aesthetic Understanding [10.4] PhotoAgentは、主観的な美的目標を解決可能な幾何学的制約に変換する。
この最初のポーズは、フォトリアリスティックな内部世界モデル内の視覚的反射によって反復的に洗練される。
評価により、PhotoAgentは空間的推論に優れ、最終的な画質が優れていることが確認された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:40:33 GMT)
Separating Diagnosis from Control: Auditable Policy Adaptation in Agent-Based Simulations with LLM-Based Diagnostics [10.3] 高齢者の孤独を緩和するには、適応性と監査性の両方を達成するための政策介入が必要である。
本研究は,両特性を同時に達成するために,診断を制御から分離する3層フレームワークを提案する。
その結果、明示的な制御規則は、完全な監査性を維持しながら、エンドツーエンドのLCMアプローチを11.7%上回る結果となった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:52:10 GMT)
Multitask-Informed Prior for In-Context Learning on Tabular Data: Application to Steel Property Prediction [10.2] 本研究では,TabPFNの先行にマルチタスク認識を注入するマルチタスク学習フレームワークを提案する。
本手法は,タスク固有の微調整に比べて予測精度と計算効率を両立させる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:03:54 GMT)
Revisiting Real-Time Digging-In Effects: No Evidence from NP/Z Garden-Paths [10.2] 英語のNP/Z園芸パス文について,Mazeとセルフペースト読解を用いた実験を行った。
リアルタイムな掘り込み効果の証拠は見つからない。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:07:46 GMT)
Detect--Repair--Verify for LLM-Generated Code: A Multi-Language, Multi-Granularity Empirical Study [10.2] 大規模な言語モデルは実行可能なソフトウェアアーチファクトを生成することができるが、そのセキュリティはエンドツーエンドの評価が難しいままである。
本研究では、脆弱性を検出し、修復し、セキュリティおよび機能テストで再チェックするDRVワークフローを通じて、その問題を調査する。
現在の証拠の4つのギャップに対処する: LLMの生成したアーティファクトの試験的なベンチマークの欠如、パイプラインレベルの有効性に関する限られた証拠、修正ガイダンスとしての検出レポートの不確実な信頼性、検証中の不確実な修復信頼性。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:18:30 GMT)
CCF: Complementary Collaborative Fusion for Domain Generalized Multi-Modal 3D Object Detection [10.1] マルチモーダル融合は正確な3次元物体検出のための有望なパラダイムとして登場してきた。
しかし、トレーニングとは異なるターゲットドメインにデプロイされた場合、パフォーマンスは大幅に低下する。
本研究では、堅牢なクロスドメイン一般化を制限する2つの要因を同定する。
これらの課題に対処するための3つのコンポーネントを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:39:51 GMT)
Predictive Photometric Uncertainty in Gaussian Splatting for Novel View Synthesis [9.9] 本稿では,画素単位,ビュー依存型予測不確実性推定のための軽量なプラグアンドプレイフレームワークを提案する。
本手法は,復元残差に対するベイズ正規化線形最小二乗最適化として不確かさを定式化する。
このアーキテクチャに依存しないアプローチは、下層のシーン表現を変更することなく、プリミティブごとの不確実性チャネルを抽出する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:21:42 GMT)
Occupation-selective topological pumping from Floquet gauge fields [9.9] 動的変動へのトンネルの促進は, 職業選択型トポロジカルポンピングに繋がることを示す。
極低温原子を用いたフロッケの実現により, このような職業選択型ポンプの実現が期待できる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:12:57 GMT)
PoiCGAN: A Targeted Poisoning Based on Feature-Label Joint Perturbation in Federated Learning [9.9] 産業画像分類には、フェデレートラーニング(FL)が適用される。
既存の毒殺方法の大きな制限は、モデル性能試験をバイパスすることの難しさである。
我々は,特徴ラベル協調摂動に基づく標的的中毒発作であるPoiCGANを提案する。
本手法は, ベースライン法よりも83.97%高い攻撃成功率を示し, メインタスクの精度は8.87%未満である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:08:53 GMT)
WiFi2Cap: Semantic Action Captioning from Wi-Fi CSI via Limb-Level Semantic Alignment [9.8] WiFi2Capは、Wi-Fi CSIから直接アクションキャプションを生成するためのフレームワークである。
視覚言語教師は、同期されたビデオテキストペアから転送可能な監督を学習する。
CSIの学生は、教師の視覚空間とテキストの埋め込みに整列しています。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:30:46 GMT)
Similarity-Aware Mixture-of-Experts for Data-Efficient Continual Learning [9.8] 機械学習モデルは、デプロイ後に新しいデータに適応する必要があることが多い。
既存のアプローチのほとんどは、各タスクに十分な数のデータサンプルが含まれていると仮定するか、学習タスクが重複していないと仮定する。
本稿では,タスク間の類似性認識を確立するための,事前学習モデルに対する適応型ミックス・オブ・エキスパート・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:10:47 GMT)
Conditionally Identifiable Latent Representation for Multivariate Time Series with Structural Dynamics [9.7] 因子は置換や成分ワイドアフィン変換(モノトン可逆変換)まで同定可能であることを示す。
我々は,合成データに対する因子回収の改善,合成SCMに対する安定した介入精度,および実世界のベンチマークにおける競合確率予測を実証した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:35:27 GMT)
Co-Designing a Peer Social Robot for Young Newcomers' Language and Cultural Learning [9.7] カナダの若者を支援するコミュニティリテラシープログラムは、スタッフが限られ、1対1の時間が不足している。
本報告では,テーブルトップ型社会支援ロボット(SAR)であるMapleに,United for Literacy Tutorsとの共同設計研究について報告する。
シャドーイングと共同設計によるインタビューから,新参者特有の要件を導出し,短いストーリーベースの活動,マルチモーダルな足場,組込みクイズを取り入れたプロトタイプを試作した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:51:57 GMT)
Operator-Theoretic Foundations and Policy Gradient Methods for General MDPs with Unbounded Costs [9.6] 一般のMDPにおける最適政策の存在を前提として,新たな結果が確立された。
一般化MDPのための新しい偏極最小化型ポリシー勾配アルゴリズムを導出する。
MM-RKHSと呼ばれる新しいアルゴリズムは、計算の複雑さが低く、サンプルの複雑さが低く、収束が速いため、PPOアルゴリズムよりも優れているように見える。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:52:47 GMT)
Persistence-based topological optimization: a survey [9.6] 計算トポロジーは、構造化対象から定量的記述子を抽出するツール、永続ホモロジーを提供する。
これらの記述子は最適化問題(典型的にはトポロジカルな事前を組み込んだり、機械学習モデルを正規化するための方法)に関与することができる。
勾配降下スキームを用いたパーシステンスに基づく損失関数の最適化を実現するため,様々な手法が開発されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:14:46 GMT)
Task-Aware Positioning for Improvisational Tasks in Mobile Construction Robots via an AI Agent with Multi-LMM Modules [9.5] 本稿では,自然言語で与えられた即興的なタスクを理解し,タスク要求位置を特定し,それ自身を位置決めするエージェントを提案する。
このエージェントは四足歩行ロボットで実装され、タスク要求位置の特定と位置決めで92.2%の成功率を達成した。
本研究では,モバイル建設ロボットが非既定タスクを自律的に実行できるようにする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:51:32 GMT)
AirSimAG: A High-Fidelity Simulation Platform for Air-Ground Collaborative Robotics [9.5] 広範にカスタマイズされたAirSimフレームワーク上に構築された高忠実な空地協調シミュレーションプラットフォームであるAirsimAGを紹介する。
このプラットフォームは、同期マルチエージェントシミュレーションを可能にし、UAV-UGVシステムの異種センシングおよび制御インタフェースをサポートする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:17:53 GMT)
Knowledge Access Beats Model Size: Memory Augmented Routing for Persistent AI Agents [9.5] プロダクションAIエージェントは、非常に反復的なユーザ固有のクエリを頻繁に受信する。
この冗長性は会話記憶によって利用でき、コスト負担から効率上の利点へと繰り返し変換される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:55:11 GMT)
SLARM: Streaming and Language-Aligned Reconstruction Model for Dynamic Scenes [9.4] SLARMは動的シーン再構成、セマンティック理解、リアルタイムストリーミング推論を統合するフィードフォワードモデルである。
高次モーションモデリングによって複雑な、一様でない動きをキャプチャし、フローの監督なしに、微分可能なレンダリングのみを訓練する。
SLARMは、ウィンドウベースの因果注意を用いて画像シーケンスを処理し、メモリコストを蓄積することなく、安定した低レイテンシのストリーミング推論を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:42:05 GMT)
Bitboard version of Tetris AI [9.2] 既存のテトリス実装は、シミュレーション速度の低下、準最適状態評価、非効率なトレーニングパラダイムに悩まされている。
本稿では,ビットボード最適化と改良されたRLアルゴリズムに基づく高性能テトリスAIフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:35:09 GMT)
Learning What Matters Now: Dynamic Preference Inference under Contextual Shifts [9.0] 本研究は,文脈とともにドリフトする未観測潜伏変数が優先重みを持つ場合の逐次決定問題について検討する。
本稿では,エージェントが嗜好重みに対する確率論的信念を維持する枠組みである動的選好推論(DPI)を提案する。
DPIはその推論された嗜好を新しいレシエーションに適応させ、固定ウェイトや封筒ベースラインよりも高いポストシフト性能を達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:22:04 GMT)
NeuroSeg Meets DINOv3: Transferring 2D Self-Supervised Visual Priors to 3D Neuron Segmentation via DINOv3 Initialization [8.9] 本稿では,DINOv3が学習した2次元視覚表現を3次元バイオメディカルセグメンテーションモデルに適用することを提案する。
具体的には,2次元フィルタを3次元演算子に膨らませ,DINOv3からのセマンティックな事前情報を保存するインフレーションに基づく適応戦略を設計する。
さらに, トポロジを意識した骨格損失を導入し, グラフベース神経アーバー再構築の構造的忠実度を明示する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:52:31 GMT)
BlindMarket: Enabling Verifiable, Confidential, and Traceable IP Core Distribution in Zero-Trust Settings [8.9] 我々はハードウェアIPコアのためのエンドツーエンドのゼロトラスト配信フレームワークであるBlindMarketを紹介する。
BlindMarketは、IPユーザとIPベンダの2社に対して、信頼性と機密性の保証が強いIPトレーディングプロセスを完了させる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:23:45 GMT)
Vision-based Deep Learning Analysis of Unordered Biomedical Tabular Datasets via Optimal Spatial Cartography [8.9] データから直接特徴のタスク最適化空間トポロジを学習するエンドツーエンドのディープラーニングフレームワークである動的特徴マッピング(Dynomap)を導入する。
ダイノマプは古典的な機械学習、現代の深い表層モデル、既存のベクトル対イメージアプローチを一貫して上回った。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:49:55 GMT)
Can Graph Foundation Models Generalize Over Architecture? [8.7] グラフ基礎モデル(GFM)は任意のスケール、特徴次元、ドメインのグラフをまたいだゼロショットを一般化することができる。
既存のGFMは固定されたアーキテクチャのバックボーンに依存しており、単一のメッセージパス方式がタスク間で十分であると暗黙的に仮定している。
本稿では,タスク固有の線形グラフ演算子を発見し,混合することにより,効率的なGNNアーキテクチャを推論時に適応するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:22:25 GMT)
Rectify, Don't Regret: Avoiding Pitfalls of Differentiable Simulation in Trajectory Prediction [8.7] 現在のオープンループ軌道モデルは、小さな初期偏差が複雑なエラーを発生させるため、現実の自動運転に苦慮している。
シミュレーションステップ間のグラフを明示的に除去するために、分離された後退水平方向のロールアウトを導入する。
我々の手法はより堅牢な回復戦略をもたらし、目標衝突を最大33.24%削減する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:28:09 GMT)
TorR: Towards Brain-Inspired Task-Oriented Reasoning via Cache-Oriented Algorithm-Architecture Co-design [8.7] CLIP上のタスク指向オブジェクト検出は、オープンボキャブラリ、プロンプト駆動型セマンティクス、ウィンドウごとの高密度な計算、重メモリトラフィックにより、リアルタイムで電力制限のあるエッジデプロイメントを妨げている。
EmphTorRは脳にインスパイアされたtextbfalgorithm-architecture の共設計で,CLIP スタイルの高次アライメントを高次元(HDC)アソシエーション推論器に置き換え,時間的コヒーレンスを再利用する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:50:32 GMT)
When Language Models Lose Their Mind: The Consequences of Brain Misalignment [8.7] 脳不整合型大言語モデル(LLM)を導入し,脳活動の予測能力の低下を訓練した。
我々はこれらのモデルを,意味論,構文論,談話,推論,形態学など多種多様な言語領域を含む200以上の下流タスクで評価する。
実験の結果,脳の不適応は下流での演奏を著しく損なうことが判明し,脳のアライメントが頑健な言語能力を達成する上で重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:39:54 GMT)
A One-Inclusion Graph Approach to Multi-Group Learning [8.4] 我々は、二部グラフの$b$-matchingの一般化を用いて、一括グラフ予測戦略を拡張した。
グループ実現可能な設定では、アルゴリズムの$log n / n$収束率が一般に最適であることを示す下界を与える。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:52:25 GMT)
Multi-Modal Image Fusion via Intervention-Stable Feature Learning [8.4] 本稿では、ロバストな相互依存を特定するために、因果原理に着想を得た介入に基づくフレームワークを提案する。
提案手法は,公開ベンチマークと下流高レベル視覚タスクの両方でSOTA性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:36:24 GMT)
Agile-VLA: Few-Shot Industrial Pose Rectification via Implicit Affordance Anchoring [8.3] 本稿では,資源制約のあるエッジプラットフォーム上での高遅延意味推論と高レイテンシ意味推論の基本的な対立について述べる。
NVIDIA Agile-AVLAアーキテクチャは、5ショットのデモだけで複雑な不規則な操作タスクの階層的なコア修正を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:48:08 GMT)
Robust Safety Monitoring of Language Models via Activation Watermarking [8.3] 大型言語モデル(LLM)は、武器製造指示やマルウェアの書き方などの機密情報を明らかにするために誤用されることがある。
LLMプロバイダは、推論中に安全でない振る舞いを検出し、フラグを付けるために$emphmonitoring$に依存している。
LLMプロバイダはセキュリティメカニズムをパッチできないため、アダプティブアタッカーは大きな懸念事項である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:13:23 GMT)
Block Coordinate Descent for Dynamic Portfolio Optimization on Finite-Precision Coherent Ising Machines [8.3] 一部のプラットフォームは有限精度の入力のみをサポートし、必要なスケーリングと量子化はソリューションの品質を低下させる。
本稿では,DPOモデルを時間次元に沿って分解し,コンパクトな時間ブロックサブプロブレムを反復的に解くブロック座標降下法を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:47:01 GMT)
Multi-User Multi-Key Image Steganography with Key Isolation [8.2] ステガノグラフィーは、視覚的忠実性を維持しながら、無害キャリア内の秘密情報を隠蔽し、信頼性の高い回復を可能にする。
最近の統合ネットワークは通常、未処理の状態で運用されるが、トリガー時に隠れたステガノグラフィータスクに切り替える。
PUSNet-MKは、ミスマッチキー分離損失によって厳密な鍵分離を強制するマルチキー拡張である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:50:27 GMT)
LLM-Powered Workflow Optimization for Multidisciplinary Software Development: An Automotive Industry Case Study [8.2] マルチディシプリナ・ソフトウェア・デベロップメント(MSD)では、ドメインの専門家や開発者は互換性のないフォーマリズムと別々のアーティファクトセットをまたいで協力する必要がある。
我々は,Volvo Groupの車両内APIシステムである textttspapi について,192のエンドポイント,420のプロパティ,76のCAN信号を含むアプローチを評価した。
自動ワークフローは、API開発時間を約5時間から7分以内に短縮し、93.7%のF1スコアを達成した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:42:09 GMT)
Agent Audit: A Security Analysis System for LLM Agent Applications [8.1] Agent Auditは、LLMエージェントアプリケーションのセキュリティ分析システムである。
Pythonエージェントのコードとデプロイアーティファクトをエージェント認識パイプラインを通じて分析する。
6つの偽陽性を持つ40の脆弱性を検出し、一般的なSASTベースラインに対するリコールを大幅に改善する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:44:51 GMT)
Cross-Slice Knowledge Transfer via Masked Multi-Modal Heterogeneous Graph Contrastive Learning for Spatial Gene Expression Inference [7.8] SpaHGCは、組織像からスライス内とスライス間スポットの関係をキャプチャするグラフベースのモデルである。
対象スライド内の局所的空間コンテキストと,病理基盤モデルから抽出した画像埋め込みから計算したクロススライド類似性を統合する。
SpaHGCは、すべての評価指標で既存の9つの最先端メソッドを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:49:00 GMT)
Fault-Tolerant Design and Multi-Objective Model Checking for Real-Time Deep Reinforcement Learning Systems [7.8] 深層強化学習(DRL)は、複雑な意思決定問題を解決するための強力なパラダイムとして登場した。
DRLベースのシステムは、シミュレーションと現実のギャップ、アウト・オブ・ディストリビューション・オブ・ディストリビューションの観察、遅延の重大な影響により、依然として重大な信頼性の問題に直面している。
本稿では,DRLエージェントと代替コントローラ間のリアルタイムスイッチング機構の設計と解析を行うための公式なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:08:06 GMT)
Sub-nanometer resolution of the nitrogen-vacancy center by Fourier magnetic imaging [7.7] ダイヤモンドの固体スピンは、量子コンピューティングと量子センシングのためのビルディングブロックを約束している。
本研究では, ダイヤモンド中の窒素空孔中心を, 最先端条件下でのFourier磁気イメージングを実演する。
この技術は、タンパク質や細胞内のスピンの局在化のような応用の可能性を秘めている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:19:17 GMT)
From Synthetic to Native: Benchmarking Multilingual Intent Classification in Logistics Customer Service [7.6] 実物流顧客サービスログから構築した階層型多言語意図分類のためのベンチマークを提案する。
データセットには、600Kの履歴から算出された約30Kの非識別、スタンドアロンのユーザクエリが含まれている。
その結果、翻訳されたテストセットは、ノイズの多いネイティブクエリのパフォーマンスを大幅に過大評価していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:14:50 GMT)
MetaKube: An Experience-Aware LLM Framework for Kubernetes Failure Diagnosis [7.5] 本稿では,3つのシナジスティックなイノベーションを通じて,経験を意識したLLMフレームワークであるMetaKubeを紹介する。
EPMNは、歴史的解決から診断パターンを抽象化し、信頼性の校正された検索を提供する。
Kubernetes-Diagnosisは、ドメイン固有のポストトレーニングを通じて強化された、ローカルにデプロイ可能な8Bモデルである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:21:01 GMT)
Empirical Characterization of Logging Smells in Machine Learning Code [7.5] 機械学習(ML)プロジェクトにおけるログの臭いに関する実証的研究について述べる。
セキュリティ,メトリクス管理,構成,冗長性,コンテキストに関連する12種類のログの臭いを識別する。
以上の結果から,ログの臭いはMLシステムに広まっており,プロジェクトの頻度や出現頻度が多様であることがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:01:40 GMT)
A Dynamic Bayesian and Machine Learning Framework for Quantitative Evaluation and Prediction of Operator Situation Awareness in Nuclear Power Plants [7.4] 本研究では,状況認識のための動的ベイズ機械学習フレームワーク(DBML SA)を紹介する。
DBML SAは確率論的推論とデータ駆動インテリジェンスを融合させ、定量的、解釈可能、予測的な状況認識モデリングを実現する。
その結果、状況認識の劣化の主要な要因として、トレーニングの品質とストレスダイナミクスが強調された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:06:51 GMT)
VoDaSuRe: A Large-Scale Dataset Revealing Domain Shift in Volumetric Super-Resolution [7.4] ボリューム超解像の最近の進歩は、医用および科学的な画像に強い性能を示している。
この性能の多くは、実際の低解像度スキャンではなく、サンプルデータのトレーニングに由来する。
本稿では,2組の高分解能スキャンと低分解能スキャンを含む大規模ボリュームデータセットであるVoDaSuReを紹介する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:54:05 GMT)
Gaze-Regularized Vision-Language-Action Models for Robotic Manipulation [7.3] 本稿では、VLAモデルの内部の注意を人間の視覚パターンと一致させる、視線規則化されたトレーニングフレームワークを提案する。
既存のVLAアーキテクチャに組み込むと、ベンチマークによって4-12%の改善が得られます。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:50:28 GMT)
Gaze-Regularized VLMs for Ego-Centric Behavior Understanding [7.3] 眼球は固定やササードを包含しており、人間の意図や将来の行動に対する重要な洞察を提供する。
本研究では、自我中心の行動理解のための視覚言語モデル(VLM)を強化する、視線規則化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:37:28 GMT)
CATNAV: Cached Vision-Language Traversability for Efficient Zero-Shot Robot Navigation [7.2] CATNAVはコスト対応のトラバーサビリティナビゲーションフレームワークである。
シーンの新規性を検知し、セマンティックに類似したフレームに対する事前リスクアセスメントを再利用するビジュセマンティックキャッシング機構を導入する。
室内および屋外の非構造環境における四足歩行ロボットのCATNAVの評価を行った。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:47:33 GMT)
GEM: Guided Expectation-Maximization for Behavior-Normalized Candidate Action Selection in Offline RL [7.2] GEM(Guided expectation-Maximization)は,マルチモーダルかつ制御可能なアクション選択を実現する分析フレームワークである。
推測中、GEMは、行動正規化サポートと結びついた保守的なアンサンブルの低信頼を用いて、候補ベースの選択を行う。
実証的には、GEMはD4RLベンチマークで競合し、計算を再トレーニングせずに意思決定品質と交換する単純な推論時予算ノブ(候補数)を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:04:43 GMT)
Analysing LLM Persona Generation and Fairness Interpretation in Polarised Geopolitical Contexts [7.2] パレスチナ語とイスラエル語で生成されたペルソナを5つのポピュラーな大言語モデル(LLM)で分析する。
戦争状況におけるパレスチナ人のプロファイルは、社会経済的地位の低下と生存志向の役割と結びついていることが多いが、イスラエルのプロファイルは、主に中流階級のステータスと専門の専門的属性を保持している。
推論トレースの解析は、モデル推論と生成の間の興味深いダイナミクスを明らかにする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:19:48 GMT)
Evaluating LLM-Based Test Generation Under Software Evolution [7.1] 大規模言語モデル(LLM)は、ユニットテストの自動生成にますます使われています。
プログラム変更によるLCMベースのテスト生成に関する大規模な実証的研究について述べる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:14:18 GMT)
Boundary-sensitive non-Hermiticity of Floquet Hamiltonian: spectral transition and scale-free localization [7.1] 一次元フロケ系における境界感応性PT対称性の破壊機構について報告する。
我々は、準エネルギー帯域が拡大してブリュアン帯域全体をカバーすると、PT対称性の破壊遷移が生じることを確証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:18:11 GMT)
Mind the Hitch: Dynamic Calibration and Articulated Perception for Autonomous Trucks [7.1] dCAPは、トラクタとトレーラーカメラの間の6自由度(自由度)の相対的なポーズを継続的に推定するビジョンベースのフレームワークである。
BEVFormerと統合されたdCAPは、静的キャリブレーションを動的に予測外在物に置き換えることで、3Dオブジェクトの検出を改善する。
実験では、自律トラックにおける静的キャリブレーションの限界に対処しながら、dCAPが安定かつ正確な知覚を達成することを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:55:16 GMT)
Asymptotic Learning Curves for Diffusion Models with Random Features Score and Manifold Data [7.0] 本研究では,デノナイジングスコアマッチングの理論的挙動について検討する。
高次元の限界におけるテスト、トレーニング、スコアの正確な表現を導出します。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:58:12 GMT)
Rethinking Quantum Networking with Advances in Fiber Technology [7.0] 反共鳴中空コアファイバは、量子リピータネットワークにおいて従来のシリカ単一モードファイバよりも優れる。
HCFはチャネル使用当たりの秘密鍵レートを大幅に改善する。
HCFは、最適なリピータ間隔の拡大、レートコストのトレードオフの改善、リピータ要件の削減を可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:07:08 GMT)
100x Cost & Latency Reduction: Performance Analysis of AI Query Approximation using Lightweight Proxy Models [7.0] 我々は、低コストな分析とデータベースアプリケーションがAIクエリの恩恵を受けることができるAIクエリ近似手法を提案する。
このアプローチは、セマンティックフィルタ演算子に対して、100倍のコストとレイテンシ低減を提供すると同時に、セマンティックランキングの重要なメリットも提供する。
レイテンシとコストの大幅な増加にもかかわらず、これらのプロキシモデルは精度を保ち、さまざまなベンチマークデータセットの精度を時折向上させる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:09:39 GMT)
L-UNet: An LSTM Network for Remote Sensing Image Change Detection [7.0] 現在のディープラーニングに基づく検出法は主に従来の長期記憶(v-LSTM)に基づいている
これを実現するために、Conv-LSTM構造の拡張であるConv-LSTMを導入する。
2つのデータセットの実験を行い、提案手法は、他の手法と比較して、量と品質の両方の利点を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:30:32 GMT)
MuQ-Eval: An Open-Source Per-Sample Quality Metric for AI Music Generation Evaluation [7.0] 我々は,凍結した MuQ-310M 上の予測ヘッドをトレーニングすることによって構築された,AI 音楽のサンプルごとの品質指標であるMUQ-EVAL を紹介する。
MuQ-EVALは完全にオープンソースで、既存のサンプル単位のメトリクスよりも優れており、単一のコンシューマ上でリアルタイムに実行される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:57:03 GMT)
Explanation Generation for Contradiction Reconciliation with LLMs [6.9] 人間の推論の重要な側面は、矛盾を和らげる説明を仮説化する能力である。
大きな言語モデルの推論能力の増大にもかかわらず、そのような和解的な説明を仮説化できる能力は、まだほとんど解明されていない。
本稿では,既存の自然言語推論(NLI)データセットを再取得する新しい手法を提案し,スケーラブルな自動評価を可能にする品質指標を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:00:17 GMT)
Elucidating the Synergetic Interplay between Average Intermolecular Coupling and Coupling Disorder in Short-Time Exciton Transfer [6.9] 分子集合体におけるエクシトン輸送は、有機光学と光ハーベスティングシステムの性能を管理する基本的なプロセスである。
超高速分光法の最近の進歩は、フェムト秒からピコ秒までの時間スケールでエキシトン運動が弾道的な短周期状態に焦点を合わせている。
本研究では,オンサイトエネルギー(対角)障害と分子間結合変動の双方を対象とする1次元格子における短時間励起子ダイナミクスの解析フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:57:00 GMT)
IslamicMMLU: A Benchmark for Evaluating LLMs on Islamic Knowledge [6.9] 私たちは、Quran、Hadith、Fiqhの3つのトラックにまたがる10,013の多重選択質問のベンチマークであるIslamMMLUを紹介します。
各トラックは、イスラム知識の異なる側面を扱うLLMの機能を調べるために、複数の種類の質問で構成されている。
このベンチマークは、ILMを評価するためのIslamMMLUパブリックリーダーボードを作成するために使用される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:18:16 GMT)
Kinetic Langevin Splitting Schemes for Constrained Sampling [6.7] 本稿では,ランゲヴィン動力学に基づく新しいサンプリングアルゴリズムを提案する。
その利点は、強い順序(バイアス)と計算効率が好ましいという事実にある。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:34:38 GMT)
A Learning Method with Gap-Aware Generation for Heterogeneous DAG Scheduling [6.7] 異種有向非巡回グラフ(DAG)のためのエンドツーエンド強化学習フレームワークを提案する。
WeCANはタスクプール互換性係数と生成誘起最適性ギャップに対処する。
グラフと実世界のTPC-H DAGの実験は、古典に匹敵する推論時間で、強いベースラインよりも改善されたメイスパンを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:16:08 GMT)
Learning Multi-Agent Local Collision-Avoidance for Collaborative Carrying tasks with Coupled Quadrupedal Robots [6.4] 本研究は、搬送対象物に機械的に接続された2つの四足歩行ロボットに焦点を当てる。
本稿では,近くの障害物との衝突を回避しつつ,命令された速度方向の追跡を可能にする強化学習に基づくポリシーを提案する。
球状接合によりバーに接続された2つの四足歩行ロボットに対するアプローチを検証し,最適化ベースおよび分散RLベースラインに対してベンチマークを行った。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:42:20 GMT)
3rd Place of MeViS-Audio Track of the 5th PVUW: VIRST-Audio [6.4] VIRST-Audioは、事前訓練されたOSモデルと視覚言語アーキテクチャを統合したフレームワークである。
入力音声をASRモジュールを用いてテキストに変換し,テキストベースでセグメンテーションを行う。
VIRST-Audioが3位となる第5回PVUWチャレンジのMeViS-Audioトラックに対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:23:10 GMT)
The Geometric Price of Discrete Logic: Context-driven Manifold Dynamics of Number Representations [6.4] 大規模言語モデル(LLM)は連続的な意味空間をスムーズに一般化するが、厳密な論理的推論は決定境界の形成を要求する。
我々は、タスクコンテキストが、必要な「トポロジ的歪み」を強制する非等方的力学演算子として機能すると主張している。
この幾何学的進化は、単純な写像から複雑な原始性テストまで、タスクの勾配を越えて検証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:41:57 GMT)
Information-Theoretic Scaling Laws of Neural Quantum States [6.4] 量子状態の正確な自己回帰表現は、振幅相互情報とスケールするために仮想結合次元を必要とすることを示す。
安定化状態の族に対しては、この法則が明示的で分析的な階数式をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:34:26 GMT)
Gaussian mixtures and non-parametric likelihoods through the lens of statistical mechanics [6.2] 統計力学の観点から,非パラメトリック最大推定法(abrv NPMLE)の問題点を考察する。
我々はNPMLEプロシージャの安定性を保証する。
我々は、NPMLE と $minbigfrac(log n)d+2n, fraclog nsqrt nbig$ の順序である真の密度の間の KL の分岐に関する高い確率上界を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:42:57 GMT)
Lightweight Fairness for LLM-Based Recommendations via Kernelized Projection and Gated Adapters [6.2] 大規模言語モデル(LLM)は、動的、コンテキスト認識、会話的レコメンデーションを可能にする、レコメンデーションシステムのための新しい機能を導入した。
LLMは、特に人口統計学的手がかりが存在する場合、トレーニング前のデータに埋め込まれた社会的バイアスを増幅する。
本稿では,カーネル化された反復核空間投影(INLP)とゲート型Mixture-of-Experts(MoE)アダプタを組み合わせた軽量でスケーラブルなバイアス軽減手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:26:04 GMT)
Leveraging LLMs and Social Media to Understand User Perception of Smartphone-Based Earthquake Early Warnings [6.2] アンドロイドの地震警報システム(AEA)は、2025年4月23日のマルマラ・エレグリシ地震(Mw 6.2 Marmara Ereglisi, Trkiye Earthquake)において、早期に警告を行った。
この研究は、Large Language Models (LLMs) を利用して、Xプラットフォームから500以上の公開ソーシャルメディア投稿を分析した。
統計分析の結果、特にユーザ信頼とアラートのタイムラインとの間には大きな相関関係がみられた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:24:33 GMT)
Combinatorial Privacy: Private Multi-Party Bitstream Grand Sum by Hiding in Birkhoff Polytopes [6.2] PolyVeilは、Birkhoff polytopeでプライベートビットを置換行列としてエンコードする、$k$クライアント間の総和プロトコルである。
P-hardnessは完全な行列ビューを必要とするが、非空のDPはスカラービューを必要とする。
プロトコルはPKIを必要とせず、$O(k)$通信を持ち、正確な集約を出力する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:08:38 GMT)
BHCast: Unlocking Black Hole Plasma Dynamics from a Single Blurry Image with Long-Term Forecasting [6.1] BHCastは、ブラックホールプラズマ力学を1つのぼやけたスナップショットから予測するフレームワークである。
コアとなるBHCastは、予測された静的イメージを将来のフレームに変換するニューラルネットワークで、ひとつのスナップショット内に隠されたダイナミクスを明らかにする。
本研究では,M87*のEHT解像度にぼかされた模擬フレームと実EHT画像を用いて,BHCastが2つの異なるブラックホール蓄積系,Sagittarius A* と M87* のシミュレーションに与える影響を実証した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:47:55 GMT)
λSplit: Self-Supervised Content-Aware Spectral Unmixing for Fluorescence Microscopy [6.1] 蛍光顕微鏡では、スペクトルアンミキシングは、混合蛍光の放射を捉えたスペクトル画像から、個々の蛍光の濃度を回収することを目的としている。
Splitは、階層的変分オートエンコーダを用いて濃度マップ上の条件分布を学習する物理インフォームド深部生成モデルである。
Splitは、標準共焦点顕微鏡によって生成されたスペクトルデータと互換性があり、特別なハードウェア修正なしにすぐに採用することができる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:42:27 GMT)
Mecha-nudges for Machines [6.0] AIエージェントが人間と同じ環境で意思決定をする傾向にあるため、選択の提示は機械だけでなく人にも最適化される可能性がある。
私たちは、AIエージェントが人間の意思決定環境を劣化させることなく、体系的に影響を及ぼす選択がどのように提示されるかを変えるメカ・ナッジを紹介します。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:02:21 GMT)
Safe Decentralized Operation of EV Virtual Power Plant with Limited Network Visibility via Multi-Agent Reinforcement Learning [6.0] 分散型エネルギー資源(DER)の急激な成長を加速させる再生可能エネルギー
本研究では、現実的な情報制約下で複数のEVCSを協調する安全強化されたVPPフレームワークを提案する。
現実的な33バスPDN実験により,提案手法は電圧違反を約45%削減し,運転コストを約10%削減することを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:27:56 GMT)
HGNet: Scalable Foundation Model for Automated Knowledge Graph Generation from Scientific Literature [6.0] 本稿では,スケーラブルでゼロショットの科学知識グラフ構築のための2段階フレームワークを提案する。
階層的関係抽出のためのベンチマークSPHEREをリリースする。
ゼロショット設定では、NERが10.76%、REが26.2%に達する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:35:10 GMT)
Entanglement transference and non-inertial quantum reference frames [5.9] パースペクショナル・ピクチャーにおける量子的性質が、その大域的、非パースペクショナル・ピクチャーとどのように関連しているかを問う。
大域的絡み合いが外見的絡み合いとコヒーレンスの組み合わせに分解される十分な条件を見つける。
我々は,コヒーレンス資源の増加により,遠近点画像の絡み合い劣化が相殺できることを見出した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:04 GMT)
ProGRank: Probe-Gradient Reranking to Defend Dense-Retriever RAG from Corpus Poisoning [5.7] Retrieval-Augmented Generation (RAG) は、検索された証拠に生成を基礎づけることで、大規模言語モデルの信頼性を向上させる。
相手がパスを注入または編集して、ターゲットクエリのTop-K$結果にランク付けし、下流生成に影響を与えるようにします。
本稿では,高密度レトリバーRAGのためのポストホック,トレーニングフリーレトリバーサイドディフェンスであるProGRankを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:29:15 GMT)
Chinese Essay Rhetoric Recognition Using LoRA, In-context Learning and Model Ensemble [5.6] 修辞的認識は自動エッセイ評価において重要な要素である。
我々は中国語の修辞的認識タスクにLarge Language Models(LLM)を利用する。
提案手法は,CCL 2025中国語エッセイレトリック認識評価タスクの3トラックすべてにおいて,最高のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:58:05 GMT)
Foundation Model Embeddings Meet Blended Emotions: A Multimodal Fusion Approach for the BLEMORE Challenge [5.5] 本稿では,FG 2026におけるBLEMOREチャレンジのシステムについて,相対的サリエンス予測と混合感情認識について紹介する。
我々の12エンコーダシステムはテストセット上でScore = 0.279 (ACCP = 0.391, ACCS = 0.168) を達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:49:49 GMT)
ManiDreams: An Open-Source Library for Robust Object Manipulation via Uncertainty-aware Task-specific Intuitive Physics [5.5] 直感的な物理モデルを用いた不確実性認識操作計画のためのモジュラーフレームワークであるManiDreamsを,オープンソースとして公開した。
ManiDreamsは知覚、パラメトリック、構造という3つの不確実性の原因に対処している。
これは、分布結果に対する候補行動を評価するサンプル予測制約ループで、基本方針をラップする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:49:17 GMT)
Edge Radar Material Classification Under Geometry Shifts [5.5] 超低消費電力エッジデバイスのための軽量ミリ波レーダ材料分類パイプラインを提案する。
現実的な幾何学的シフトの下で、顕著な性能低下を観察する。
これらの摂動は、系統的な強度スケーリングと角度依存のレーダー断面効果を誘導する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:41:43 GMT)
Agentic Automation of BT-RADS Scoring: End-to-End Multi-Agent System for Standardized Brain Tumor Follow-up Assessment [5.4] 脳腫瘍報告・データシステム(BT-RADS)は、びまん性グリオーマ患者のMRI後反応評価を標準化する。
本研究では、BT-RADSの自動分類のためのエンドツーエンドのマルチエージェント・大規模言語モデル(LLM)と畳み込みニューラルネットワーク(CNN)システムについて検討する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:58:03 GMT)
A Multimodal Framework for Human-Multi-Agent Interaction [5.4] 本稿では,ロボットが自律認知エージェントとして機能するマルチエージェントインタラクションのためのマルチモーダルフレームワークを提案する。
チームレベルでは、集中的な調整機構がターンテイクとエージェントの参加を規制し、重複するスピーチを防ぐ。
今後の研究は、大規模ユーザ研究と、社会的基盤を持つマルチエージェントインタラクションダイナミクスのより深い探索に焦点を当てる予定である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:35:40 GMT)
Systemic Gendered Citation Imbalance in Computer Science: Evidence from Conferences and Journals [5.2] コンピュータ科学における会議論文と雑誌論文の引用における男女不均衡について検討する。
女性を1人または最後の著者としてリストアップした論文は、予想よりも少ない引用を受け取っていることがわかった。
我々は、最初の著者や最後の著者の卓越性と、彼らのローカルな共著者ネットワークの構造が、これらの不均衡の潜在的な要因であることを見出した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:37:34 GMT)
AI Generalisation Gap In Comorbid Sleep Disorder Staging [5.1] iSLEEPS (iSLEEPS) を新たに導入した。
単一チャネル脳波睡眠ステージリングのためのSE-ResNet+双方向LSTMモデルの評価を行った。
健常者と疾患者のクロスドメインパフォーマンスは貧弱である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:02:35 GMT)
Imprecise quantum steering inequalities in tripartite systems [5.1] 小さな測定誤差でさえ、量子ステアビリティの認定を著しく損なう可能性がある。
この結果から,実験用量子ステアリングにおける測定不完全性を考慮する必要性が示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:23:44 GMT)
DecompGrind: A Decomposition Framework for Robotic Grinding via Cutting-Surface Planning and Contact-Force Adaptation [5.0] Decompは、Global Cutting-Surface-Planning (CFAG)とLocal Contact-Force Adaptation (L GCSP)を組み合わせたロボット研削システムである。
CFAGは電流およびターゲット形状の計画解析により除去形状を決定する一方、Lは学習せずに接触力適応を学習する。
実験では、安全な接触レベルを維持しながら、異なる形状と材料硬度を用いて効率的なロボット研削を実証した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:52:09 GMT)
Generative Inversion of Spectroscopic Data for Amorphous Structure Elucidation [4.9] 本稿では,多モード分光計測を現実的な原子構造に変換する生成フレームワークであるGLASSを紹介する。
スコアベースモデルは、低忠実度データから事前構造を学習し、微分可能なスペクトルターゲットに条件付けられた分布外構造をサンプリングする。
我々はGLASSを用いて,アモルファスシリコンのパラ結晶性,硫黄の液液相転移,球状アモルファス氷の3つの実験問題を合理化している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:53:40 GMT)
APreQEL: Adaptive Mixed Precision Quantization For Edge LLMs [4.8] 本稿では,エッジ配置におけるメモリ,レイテンシ,精度のバランスをとる適応型混合精度量子化機構を提案する。
我々の研究は、均一な量子化が達成できない新しい構成設計を解き、資源制約されたデバイスにLLMを効率的にデプロイするために、ソリューション空間を拡張します。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:27:13 GMT)
Machine Learning Models for the Early Detection of Burnout in Software Engineering: a Systematic Literature Review [4.8] 燃え尽き症候群は、多くのソフトウェアエンジニアに影響を与える職業症候群です。
過去の研究では、燃え尽き症候群の早期発見を可能にする機械学習技術の利用が増加していることが示されている。
本論文は機械学習(ML)アプローチを提案する研究論文の体系的な文献レビューである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:58:34 GMT)
Quadrature Oscillation System for Coordinated Motion in Crawling Origami Robot [4.7] 位相から1/4の周期で4つの2乗波信号を発生できる4次発振システムを開発した。
折り紙クローリングロボットの設計と構築により,この振動システムの実用性と価値を実証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:10:19 GMT)
Residual Attention Physics-Informed Neural Networks for Robust Multiphysics Simulation of Steady-State Electrothermal Energy Systems [4.6] 本研究では, 連成速度, 圧力, 電位, 温度場の統一解のための残留注意物理情報ニューラルネットワーク(RA-PINN)フレームワークを提案する。
RA-PINNは, 定数係数結合, 間接圧力ゲージ制約, 温度依存性輸送, インターフェース整合性の4つの代表的なエネルギー関連ベンチマークで評価した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:44:46 GMT)
Online library learning in human visual puzzle solving [4.6] 人々はしばしば、未来に対する不確実性にもかかわらず、将来の作業を簡単にする効率的な再利用可能な抽象化を形成します。
参加者がヘルパーを定義して再利用する視覚パズルタスクにおいて,このプロセスを研究する。
オンラインライブラリ学習は、人間の問題解決における中核的なメカニズムであり、タスク要求が大きくなるにつれて、人々が柔軟に抽象化を構築し、洗練し、再利用することができる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:12:28 GMT)
Typography-Based Monocular Distance Estimation Framework for Vehicle Safety Systems [4.6] 本稿では,タイポグラフィに基づく単分子距離推定フレームワークを提案する。
これは、メートル法距離推定のためのパッシブ・フィデューシャル・マーカーとして、ナンバープレートの標準化されたタイポグラフィを利用する。
プレート幅法を総合的に比較すると,文字ベースの測度は推定値の標準偏差を35%減少させる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:18:19 GMT)
Prompt Amplification and Zero-Shot Late Fusion in Audio-Language Models for Speech Emotion Recognition [4.6] ZS-Fuseは、デュアルエンコーダALMからのゼロショット感情推定とスペシャリストFMを組み合わせたレイトフュージョン方式である。
3つのデュアルエンコーダALMと2つのFMでZS-Fuseを評価し,SOTAベースラインに対する改善点を報告する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:55:55 GMT)
From Overload to Convergence: Supporting Multi-Issue Human-AI Negotiation with Bayesian Visualization [4.5] 我々は現実的な不動産レンタルシナリオにおける人間とAIの交渉ケーススタディを設計する。
経験的所見では、パフォーマンスは3つの問題まで安定しているが、追加の問題が認知負荷を増加させるにつれて低下する。
本稿では,ベイズ推定による新たな不確実性に基づく可視化手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:49:21 GMT)
From Questions to Trust Reports: A LLM-IR Framework for the TREC 2025 DRAGUN Track [4.5] TREC 2025のDRAGUN Trackは、ユーザーがオンラインニュースの信頼性を評価するのに役立つ効果的なサポートツールの必要性が高まっていることを目標としている。
第1タスク(クリティカル質問生成)と第2タスク(検索強化信頼度レポート)の両方で提出されたUR_Treckingシステムについて述べる。
提案手法は,LLMに基づく質問生成とセマンティックフィルタリング,クラスタリングを用いた多様性強化,およびクエリ拡張戦略を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:22:27 GMT)
Optimal filtering for a giant cavity in waveguide QED systems [4.4] 導波管型量子電磁力学(QED)システムでは、巨大な空洞は、複数の離れた結合点によって量子場と相互作用するように設計することができる。
本稿では, 連続量子測定による状態変化を推定するために, ジャイアントキャビティシステムのための最適フィルタを設計する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:02:41 GMT)
Mamba-driven MRI-to-CT Synthesis for MRI-only Radiotherapy Planning [4.4] マンバ (Mamba) は、モダリティ間翻訳のための状態空間モデルである。
We adapt the U-Mamba and the SegMamba architecture, originally proposed for segmentation, to perform cross-modality image generation。
私たちの3D Mambaアーキテクチャは、複雑な特徴と長距離ボリューム依存を効果的に捉え、正確なCT合成を可能にします。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:56:39 GMT)
Balancing Safety and Efficiency in Aircraft Health Diagnosis: A Task Decomposition Framework with Heterogeneous Long-Micro Scale Cascading and Knowledge Distillation-based Interpretability [4.3] 本研究では,診断分解フレームワーク(DDF)を提案する。診断を異常検出(AD)と障害分類(FC)サブタスクに明示的に分離する。
分離されたトレーニングは"大規模サンプル軽量"と"小サンプル複合"の最適化パスを分離し、計算オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:35:23 GMT)
Agent-Sentry: Bounding LLM Agents via Execution Provenance [4.3] 自然言語命令に基づく新しい機能を自律的に生成するエージェントコンピューティングシステムは、ますます普及しつつある。
非常に有能だが、これらのシステムは深刻なセキュリティ、プライバシー、安全上の懸念を提起する。
本稿では,エージェントシステムにこの問題に対処するためのフレームワークであるAgent-Sentryを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:12:53 GMT)
Double Coupling Architecture and Training Method for Optimization Problems of Differential Algebraic Equations with Parameters [4.2] 制約と目的関数を分離するために、二重物理インフォームドニューラルネットワークアーキテクチャが提案されている。
物理インフォームドニューラルネットワークのための遺伝的アルゴリズム強化トレーニングフレームワークは、トレーニングの精度と効率を改善する。
このアプローチは、製品要求に対するリアルタイム応答性を維持する訓練を単一で行うことで、マルチタスク目的の一般化を可能にする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:43:39 GMT)
Bio-Inspired Event-Based Visual Servoing for Ground Robots [4.2] 地上ロボットのための新しいイベントベースビジュアルサーボフレームワークを提案する。
そこで本研究では,生物にインスパイアされたアクティブ・センシング・リミットサイクル・コントローラを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:20:20 GMT)
CDMT-EHR: A Continuous-Time Diffusion Framework for Generating Mixed-Type Time-Series Electronic Health Records [4.2] 混合型時間サンプリング EHR を生成するための連続時間拡散フレームワークを提案する。
提案手法は,ダウンストリームタスク性能,分散忠実度,識別可能性において,既存の手法よりも優れる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:09:04 GMT)
Beyond Binary Correctness: Scaling Evaluation of Long-Horizon Agents on Subjective Enterprise Tasks [4.1] 大規模言語モデルは、数学やプログラミングのような客観的に検証可能なタスクに優れており、評価は単体テストや一つの正しい答えに還元される。
LH-Benchは、二項正当性を超えて、主観的エンタープライズタスクにおける自律的長期実行をスコアする3ピラー評価設計である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:16:32 GMT)
LLMLOOP: Improving LLM-Generated Code and Tests through Automated Iterative Feedback Loops [4.1] 大きな言語モデル(LLM)は、ソースコードの生成において顕著なパフォーマンスを示している。
しかし、生成されたコードは、しばしばコンパイルエラーや間違ったコードのような問題を起こします。
本稿では,ソースコードとテストケースの両方の洗練を自動化するフレームワークであるLLMLOOPについて述べる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:01:14 GMT)
An In-Depth Study of Filter-Agnostic Vector Search on a PostgreSQL Database System: [Experiments and Analysis] [4.1] Filtered Vector Search (FVS) は、現代のデータベースシステムにおけるセマンティック検索とGenAIアプリケーションをサポートするために重要である。
本稿では,本システムにおけるフィルタ非依存型FVSアルゴリズムの奥行き解析について述べる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:53:28 GMT)
Emergence of Fragility in LLM-based Social Networks: the Case of Moltbook [3.9] LLMをベースとしたエージェントで構成されたソーシャルプラットフォームであるMoltbookのインタラクションネットワークを分析した。
データセットは39,924人のユーザー、235,572の投稿と、Webスクレイピングを通じて収集された1,540,238のコメントで構成されている。
本分析により, 重み付き次数および活動分布を特徴とするヘテロジニアス接続パターンが明らかにされた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:42:45 GMT)
Single-letter one-way distillable entanglement for non-degradable states [3.9] 片道蒸留可能な絡み合いは、バイパルタイトの絡み合いの中心的な操作手段である。
多くのコピーと適応的な片道プロトコルに対して正規化された最適化によって定義されるため、計算が難しいことが知られている。
1つの成分がアリスのシステムと0つの一方向蒸留可能な絡み合いを担っている場合、混合液はシングルレターのままであることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:50:48 GMT)
AetherWeave: Sybil-Resistant Robust Peer Discovery with Stake [3.9] 私たちはAetherWeaveを紹介します。AetherWeaveは、ネットワークへの参加と預金を結び付けるピアディスカバリプロトコルです。
高い確率で、正直なオーバーレイが接続されているか、小さなコンポーネントの全てのノードの$(ssqrtn)$-fractionがアタック検出フラグを掲げていることを証明します。
AetherWeaveはSybilの抵抗性とプライバシを同時に提供する最初のピアディスカバリプロトコルである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:50:17 GMT)
Where Experts Disagree, Models Fail: Detecting Implicit Legal Citations in French Court Decisions [3.8] 我々は,第一審裁判所の決定において,フランス民法典の暗黙の引用に焦点をあてる。
専門家の不一致がモデル失敗を予測することを示す。
これらの制限にもかかわらず、タスクをトップkランキングとして再検討し、マルチモデルコンセンサスを活用することで、教師なしの環境でk = 200で76%の精度が得られる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:10:57 GMT)
Reciprocal Co-Training (RCT): Coupling Gradient-Based and Non-Differentiable Models via Reinforcement Learning [3.8] 大規模言語モデル(LLM)と古典的な機械学習手法は、予測モデリングに補完的な長所を提供する。
LLMはテキストデータに対する勾配に基づく最適化に依存しているが、Random Forests (RF) のようなモデルは微分不可能な特徴分割を採用している。
本研究では,LLMとRF分類器を併用した相互協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:21:31 GMT)
Caterpillar of Thoughts: The Optimal Test-Time Algorithm for Large Language Models [3.8] マルコフ連鎖と相互作用するアルゴリズムとしてテスト時間計算をモデル化する。
バックトラックは指数関数的に世代数を減少させることができるが、理論的にはバックトラックの非常に限られた形態が十分であることを示す。
最適アルゴリズムの特性から,新しいテスト時間計算アルゴリズムであるCaterpillar of Thoughts (CaT)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:19:26 GMT)
LLMs Do Not Grade Essays Like Humans [3.7] 自動エッセイ評価のためのツールとして大規模な言語モデルが提案されているが、人間の評価との合意はいまだに不明である。
我々は,LLM生成スコアがヒトの成績とどのように比較され,GPTおよびLlamaファミリーから得られるいくつかのモデルの格付け挙動を,アウト・オブ・ザ・ボックス設定で解析する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:02:53 GMT)
Beyond Hate: Differentiating Uncivil and Intolerant Speech in Multimodal Content Moderation [3.6] 我々は,2つの分離可能な次元,非公害と不寛容を区別する微粒なアノテーションスキームを導入する。
このスキームをHateful Memesデータセットから2,030のミームに適用する。
この結果から,詳細なアノテーションが既存の粗いラベルを補完し,共同で使用すると全体のモデル性能が向上することがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:22:36 GMT)
A Critical Review on the Effectiveness and Privacy Threats of Membership Inference Attacks [3.5] メンバシップ推論攻撃(MIA)は、データサンプルが機械学習(ML)モデルのトレーニングセットに含まれているかどうかを判断することを目的としている。
我々は、MIAsが真のプライバシーの脅威となる条件を定義する評価フレームワークを提案する。
私たちのフレームワークで定義された現実的な条件の下では、MIAは弱いプライバシーの脅威を表す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:23:57 GMT)
Multi-Agent Training-free Urban Food Delivery System using Resilient UMST Network [3.5] 配達システムは都市生活の中核となり、食料、医薬品、その他の商品の需要を支えている。
伝統的な物流網は脆弱であり、道路閉鎖や事故、需要の変化に適応するのに苦労することが多い。
我々は,最小スパンニング木群 (UMST) のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:40:54 GMT)
Towards The Implicit Bias on Multiclass Separable Data Under Norm Constraints [3.4] 核ノルム制約を通した低階構造を強制するために設計された幾何認識幾何学であるNucGDを紹介する。
スケーラブルなトレーニングを実現するため、非同期電力繰り返しによる効率的なSVDフリー更新ルールを導出する。
我々は、最小バッチサンプリングと運動量によって誘導される勾配ノイズの変動レベルが、期待される最大マージン解に対する収束をどう変調するかを特徴付ける、勾配最適化のダイナミクスの影響を実験的に分析する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:51:50 GMT)
LineMVGNN: Anti-Money Laundering with Line-Graph-Assisted Multi-View Graph Neural Networks [3.4] LineMVGNNは、支払いとレシートトランザクションを考慮に入れた新しい空間的手法である。
LineMVGNNは、元のトランザクショングラフの行グラフビューを組み込んで、トランザクション情報の伝播を強化する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:17:21 GMT)
Improving LLM Predictions via Inter-Layer Structural Encoders [3.4] 層間構造学(ILSE)は、内部層表現から1つの効果的な表現を学ぶための強力な構造的アプローチである。
ケイリーエンコーダ(Cayley-Encoder)は、拡張子ケイリーグラフを有効活用し、層間情報伝達を行う数学的基底を持つ幾何学的エンコーダである。
ILSEはベースラインと既存のアプローチを一貫して上回り、正確性は最大44%向上し、類似度は25%向上した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:37:44 GMT)
SoK: The Attack Surface of Agentic AI -- Tools, and Autonomy [3.3] 最近のAIシステムは、大規模な言語モデルとツール、検索強化生成(RAG)による外部知識を組み合わせている。
このエージェントAIパラダイムは、能力を大幅に拡張すると同時に、攻撃面を大きく拡大する。
我々は、即時レベルの注射、知識ベース中毒、ツール/プラグインエクスプロイト、マルチエージェント緊急脅威にまたがる攻撃の包括的分類を開発する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:21:51 GMT)
Universal and efficient graph neural networks with dynamic attention for machine learning interatomic potentials [3.2] 機械学習の原子間ポテンシャル(MLIP)は線形コストでほぼ量子精度を約束するが、既存のモデルは効率と安定性の課題に直面している。
我々は、効率的で堅牢なグラフニューラルネットワークフレームワークである機械学習アドバンスニューラルネットワーク(MLANet)を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:14:33 GMT)
KALAVAI: Predicting When Independent Specialist Fusion Works -- A Quantitative Model for Post-Hoc Cooperative LLM Training [3.2] 独立した訓練を受けたドメインスペシャリストは、個々のスペシャリストを上回るパフォーマンスを持つ単一のモデルに、ポストホックに融合することができる。
KALAVAIプロトコルでは、コントリビュータが個別に共有チェックポイントの微調整を行い、軽量なMoEルーティング(500ステップ)を提出する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:32:04 GMT)
PinPoint: Monocular Needle Pose Estimation for Robotic Suturing via Stein Variational Newton and Geometric Residuals [3.1] PinPointは手術針の位置と向きを推定するための確率的変動推論フレームワークである。
実際の針追跡シーケンスでは、PinPointは平均翻訳誤差を80%(1.00 mmまで)、回転誤差を78%(13.80まで)削減する。
単分子の曖昧さが最も重い誘導回転配列では、ピンポイントは2モーダル後部84%を維持している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:59:28 GMT)
AI Lifecycle-Aware Feasibility Framework for Split-RIC Orchestration in NTN O-RAN [3.1] スプリット-RICアーキテクチャを用いて,O-RAN制御階層をグラウンド,LEO,GEOセグメントに分散する可能性を検討した。
我々は、トレーニングデータ転送、モデル拡散、ほぼリアルタイム推論を考慮に入れた、ライフサイクルエネルギーとライフサイクル遅延のためのクローズドフォーム式を導出する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:18:03 GMT)
Wafer-Level Etch Spatial Profiling for Process Monitoring from Time-Series with Time-LLM [3.1] 本稿では,マルチチャネルプロセス時系列からウェーハレベルのエッチング深さ分布を直接予測する空間回帰モデルを提案する。
BOSCHプラズマエッチングデータセットを用いて,データ制限条件下での安定した性能を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:38:19 GMT)
The Power of Power Codes: New Classes of Easy Instances for the Linear Equivalence Problem [3.0] 2つの線形符号が与えられたとき、線形同値問題 (LEP) はそれらの間に線形等距離を求める。
PEPとLEPは、最近、いくつかのポストクォータムスキームのセキュリティ基盤として、新たな関心を集めている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:03:45 GMT)
Task-Space Singularity Avoidance for Control Affine Systems Using Control Barrier Functions [3.0] ロボットと力学系の特異性は、制御入力からタスク空間運動へのマッピングがランクを失うときに生じる。
本稿では,制御ファインシステムにおけるそのような特異性を回避するための制御バリア関数フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:25:28 GMT)
Trends in Equal-Contribution Authorship: A Large-Scale Bibliometric Analysis of Biomedical Literature [2.9] 平等貢献の著作は、科学出版においてますます一般的になっている。
本研究では,同貢献作家の時間的傾向,ジャーナルレベルのパターン,地理的分布,直列位置について検討する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:33:54 GMT)
Continuous Optimization for Satisfiability Modulo Theories on Linear Real Arithmetic [2.8] 本稿では,FourierSMTを拡張性と並列性の高い連続変数最適化フレームワークとして導入する。
このフレームワークは、最大10,000変数と70万の制約で大規模なスケジューリングと配置の問題に対してベンチマークされており、8倍のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:22:30 GMT)
A Synchronized Audio-Visual Multi-View Capture System [2.7] 本稿では,同期音声と同期映像を一級信号として扱うマルチビューキャプチャシステムについて述べる。
得られた記録は、微粒な分析と会話行動のデータ駆動モデリングをサポートするのに十分な時間的一貫性を持つ。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:32:49 GMT)
CoRe: Joint Optimization with Contrastive Learning for Medical Image Registration [2.7] 本稿では,コントラスト学習を直接登録モデルに統合する新しいフレームワークを提案する。
コントラストと登録の目的を協調的に最適化することにより、学習された表現が情報だけでなく、登録作業にも適していることを保証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:08:34 GMT)
CodeT5-RNN: Reinforcing Contextual Embeddings for Enhanced Code Comprehension [2.6] 本稿では,連続的なRNNアーキテクチャを用いてコンテキスト埋め込みを強化するハイブリッドLLM-RNNフレームワークを提案する。
提案したハイブリッドモデルを,ベンチマークと実世界の符号化データセットの両方で評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:49:23 GMT)
Minibal: Balanced Game-Playing Without Opponent Modeling [2.6] Minibalは、バランスの取れたプレイ用に特別に設計されたMinimaxの派生型である。
7つのボードゲームで行われた実験は、1つの変種が常に最もバランスの取れたプレーを達成することを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:56:52 GMT)
General Machine Learning: Theory for Learning Under Variable Regimes [2.5] 本研究では,学習者,記憶状態,評価条件が時間とともに変化しうる状況下での学習について検討する。
本稿では, 許容輸送, 保護コア保存, 評価者対応学習の進化を主眼とした, 体制的変化の枠組みを開発する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:58:31 GMT)
Can Language Models Pass Software Testing Certification Exams? a case study [2.5] 本研究では,商用ベンダとオープンソースコミュニティの両方から60のマルチモーダル言語モデルを評価する。
評価は、International Software Testing Qualifications Boardの30のサンプル試験(コアファウンデーション、コアアドバンスト、スペシャリスト、エキスパート)によって行われる。
2つのモデルが認定試験に合格し、30の認定試験で少なくとも65%を獲得した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:38:37 GMT)
Inverting Neural Networks: New Methods to Generate Neural Network Inputs from Prescribed Outputs [2.5] 本稿では,特定のニューラルネットワーククラスにマッピングされる入力画像を決定する際の逆問題について検討する。
フォワードパス法では、入力画像に対するルートフィンディングアルゴリズムとヤコビアンに基づく逆法を開発する。
提案手法は,全ての場合において,ほぼ完全な分類スコアが得られるランダムな入力画像を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:50:12 GMT)
Contextual Graph Matching with Correlated Gaussian Features [2.5] エッジ重みとノード特徴が2つのネットワークで相関するガウス的設定における文脈グラフマッチングについて検討する。
我々は、正確な回復のための正確な情報理論しきい値を導き、ほぼ正確な回復が可能であるか不可能である条件を特定する。
本研究は, グラフマッチングにおける構造的・文脈的情報がどのように相互作用するかを, より厳密に評価し, 効率的なアルゴリズム設計のためのベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:11:04 GMT)
Learning to Select Visual In-Context Demonstrations [2.5] インコンテキスト学習(ICL)は、実演品質によって視覚的なタスクに適応する。
主要なデモ選択戦略は、教師なしk-Nearest Neighbor(kNN)探索である。
本稿では,Learning to Select Demonstrations (LSD)を導入し,最適な実演セットを構築するために強化学習エージェントを訓練する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:07:40 GMT)
Evidence of political bias in search engines and language models before major elections [2.5] 4つの検索エンジン(SE)と2つの大言語モデル(LLM)を監査する。
我々は、EU5か国と15の郡で選挙に関連する約4,360の質問に対する回答を収集した。
欧州では、世論調査や過去の選挙、メディアのサリエンスから予想されるレベルを超える極右団体について、SEの結果が不公平に言及されている。
米国では、Googleは共和党の有権者にとってより重要なトピックを強く支持し、他の検索エンジンは民主党にもっと関係のある問題を好んだ。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:39:34 GMT)
Assessing the Robustness of Climate Foundation Models under No-Analog Distribution Shifts [2.4] アナログのない」将来の気候状態は、歴史的トレーニングデータの実証範囲外の条件に、外部の強制がシステムを駆動する体制である。
我々は、U-Net、ConvLSTM、ClimaXファンデーションモデルという3つの最先端アーキテクチャの堅牢性を評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:29:54 GMT)
Multilingual KokoroChat: A Multi-LLM Ensemble Translation Method for Creating a Multilingual Counseling Dialogue Dataset [2.4] 我々は,日本語の大規模共用コーパスであるkokoroChatを英語と中国語の両方に翻訳し,多言語ココロチャットを開発した。
このプロセスにおける重要な課題は、最適翻訳モデルが入力によって異なることである。
我々は,この課題を克服するために,新しいマルチLLMアンサンブル法を開発した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:02:24 GMT)
Dark Matter Detection through Rydberg Atom Transducer [2.4] 本研究では,ハロスコープ,Rydberg-atom Transducer,超伝導ナノワイヤ単光子検出を統合したハイブリッド検出アーキテクチャを提案する。
我々は, アクチオン-光子結合$g_a sim 10-13, mathrmGeV-1$ at $m_a sim 0.4,textmeV$に対して感度を予測し, QCDアクチオンバンドに到達した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:39:27 GMT)
STAR-Magic Mutation: Even More Efficient Analog Rotation Gates for Early Fault-Tolerant Quantum Computer [2.4] 本稿では,フォールトトレラント量子コンピュータ上で論理回転ゲートを実装するための効率的なプロトコルSTAR-magic mutationを紹介する。
また,STAR ver.3 と呼ばれる早期フォールトトレラント量子コンピュータ向けに設計された新しい量子コンピューティングアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:39:39 GMT)
Natural Language Interfaces for Spatial and Temporal Databases: A Comprehensive Overview of Methods, Taxonomy, and Future Directions [2.3] NLIDBとして知られるデータベースへの自然言語インターフェースの構築は、最近大きな注目を集めている。
本稿では,地理空間データベースと時間データベースを対象としたNLIDBの研究を包括的に調査する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:06:10 GMT)
LLMORPH: Automated Metamorphic Testing of Large Language Models [2.2] LLMORPHは大規模言語モデル(LLM)に特化した自動テストツールである。
MTはメタモルフィックリレーショナル(MR)を使用してソーステスト入力からフォローアップインプットを生成し、高価なラベル付きデータを必要としないモデル出力の不整合の検出を可能にする。
GPT-4, LLAMA3, HERMES 2 の 3 つの最先端 LLM を試験し, NLP ベンチマークで36 MR を適用した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:01:02 GMT)
Human-in-the-Loop Pareto Optimization: Trade-off Characterization for Assist-as-Needed Training and Performance Evaluation [2.2] 本稿では,タスク性能と認識される課題レベルのトレードオフを特徴付ける新しいHuman-in-the-loop(HiL)最適化手法を提案する。
筆者らのHL最適化は,定量的な測定値で性能を計測するハイブリッドモデルを用いており,評価された課題レベルは定性的な測定値で捉えていることを示す。
本稿では,触覚フィードバックを伴う手動スキルトレーニングタスクの文脈における3つのユースケースを通して,フレームワークの有用性を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:19:35 GMT)
On the use of Aggregation Operators to improve Human Identification using Dental Records [2.1] 本研究では,データ駆動型語彙順に基づく集約,ファジィ論理集約法,機械学習技術の性能を集約機構として検討する。
その結果、集約モデルとしてホワイトボックス機械学習技術を用いることで、その説明可能性や解釈性を損なうことなく、最先端(平均3.91のランク)を改善することができることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:48:42 GMT)
Environment Maps: Structured Environmental Representations for Long-Horizon Agents [2.1] 環境マップは、カスケードエラーと環境を緩和する永続的でエージェントに依存しない表現である。
環境地図を備えたエージェントは28.2%の成功率を達成する。
モデルと環境の間の構造化されたインターフェースを提供することにより、環境マップは長期計画のための永続的な基盤を確立する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:56 GMT)
An Experimental Study of Machine Learning-Based Intrusion Detection for OPC UA over Industrial Private 5G Networks [2.1] 産業展開は、安全でプラットフォームに依存しない通信プロトコルとして、Open Platform Communications Unified Architecture (OPC UA) に依存している。
プライベート第5世代(5G)ネットワークは、現代の自動化システムに低レイテンシで信頼性の高い接続を提供する。
本稿では,オペレーティングプライベート5Gネットワーク上で動作しているOPC UAアプリケーションに対するサイバー攻撃を検出する実験を行った。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:50:41 GMT)
Metastability, chaos and spectrum tomography for Bose-Hubbard rings and chains [2.0] 有限次元一次元環格子および開鎖に対するボース・ハッバード凝縮体の転移性について解析する。
これは量子エルゴード性および局在性の検査のためのアリーナを構成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:01:00 GMT)
Wasserstein Parallel Transport for Predicting the Dynamics of Statistical Systems [2.0] 分布レベルでの並列力学の一般概念を導入する。
古典的手法のベクトル部分トラクションを測地的並列輸送に置き換えることで、分布力学の反実的比較を提供することができる。
本手法を合成データと2つの単細胞RNAシークエンシングデータセット上に展開し,生物系全体にわたる遺伝子発現動態をインプットする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:45:37 GMT)
Causal AI For AMS Circuit Design: Interpretable Parameter Effects Analysis [2.0] 本研究では,SPICEシミュレーションデータから有向非巡回グラフ(DAG)を最初に検出する因果推論フレームワークを提案する。
このアプローチは、設計ノブの人間解釈可能なランク付けと明示的な「What-if」予測をもたらす。
すべての回路にわたって、因果モデルは平均的な絶対誤差が25%未満のシミュレーションベースのATEを再現するが、ニューラルネットワークは80%以上ずれ、しばしば間違った符号を予測する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:10:58 GMT)
Sparse Autoencoders for Interpretable Medical Image Representation Learning [2.0] FM(Vision foundation model)は、医療画像における最先端のパフォーマンスを実現する。
彼らは、臨床医が尋問や検証をできない抽象的な潜伏表現に情報をエンコードする。
本研究の目的は,不透明なFM画像表現を人間の解釈可能なスパース特徴に置き換えるためのスパースオートエンコーダ(SAE)を検討することである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:54:24 GMT)
GHOST: Ground-projected Hypotheses from Observed Structure-from-Motion Trajectories [1.9] 本稿では,モノクル画像から車両軌道を分割して自律走行する,スケーラブルな自己教師型アプローチを提案する。
記録した自走車の動きを暗黙の監視として扱い,モノクラー構造によるカメラ軌跡の復元を行った。
以上の結果から, 大規模エゴモーション蒸留は構造と一般化可能な経路の提案をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:38:04 GMT)
Neural ODE and SDE Models for Adaptation and Planning in Model-Based Reinforcement Learning [1.9] 完全かつ部分的に観察された環境での力学をモデル化するために,ニューラル常微分方程式(ニューラルODE,SDE)について検討する。
神経SDEがトランジッションダイナミクスの本質をより効果的に捉えていることを示す。
本研究は, 遷移を伴う環境下でのRL計画における動作条件付き潜伏SDEの適用性を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:12:41 GMT)
Space Fabric: A Satellite-Enhanced Trusted Execution Architecture [1.9] 分散衛星ネットワークは、ハードウェアへの物理的アクセスなしに運用される信頼アーキテクチャーに対するプレッシャーを発生させる。
信頼性の高い計算スタックを衛星インフラに移動させるアーキテクチャであるSpace Fabricを紹介する。
すべての暗号シークレットは打ち上げ後、同じ場所にあるセキュアな要素内で生成される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:13:02 GMT)
Towards Leveraging LLMs to Generate Abstract Penetration Test Cases from Software Architecture [1.8] 本稿では,アーキテクチャレベルのセキュリティ評価を支援するインプットとして,ソフトウェアアーキテクチャモデルから抽象貫入テストケース(APTC)を生成することを提案する。
i)ソフトウェアアーキテクチャからの導出可能性と,(ii)アーキテクチャのセキュリティ評価とその後の浸透テストの両方に対するユーザビリティの2つの基準を用いて,関連する標準と技術の現状を分析した。
評価の結果,93%の有用性と86%の正確性を達成し,提案したAPTCがアーキテクトと浸透テストの両方を効果的に支援できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:32:18 GMT)
Rethinking Self-Sovereign Identity Principles: An Actor-Oriented Categorization of Requirements [1.8] この作業は、DI/SSIシステムの要求工学プロセスにユーザ視点を埋め込むことによって、ギャップに対処する。
アクター間の関係を形式化するために依存性モデルが導入される。
ユーザ中心の要件、責任割り当て、オーナシップ仕様、依存性のモデリングを統合することで、この作業はDI/SSIシステムアーキテクチャのための最初の構造化モデルを提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:24:37 GMT)
Designing Agentic AI-Based Screening for Portfolio Investment [1.7] ポートフォリオ管理のための新しいエージェント人工知能(AI)プラットフォームを導入する。
まず、2つの大きな言語モデル(LLM)エージェントが割り当てられた特別なタスクである。
第2に、これらのエージェントは、大規模なポートフォリオからの信号の売買と購入に意図的に同意し、候補資産のプールを著しく狭める。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:03:40 GMT)
n-VM: A Multi-VM Layer-1 Architecture with Shared Identity and Token State [1.7] 共有コンセンサスと共有状態に対して,n個の異種仮想マシンを共等な実行環境としてホストするレイヤ-1アーキテクチャであるn-VMを提案する。
設計は、オプコードプレフィックスでトランザクションをルーティングするディスパッチ、32バイトのコミットがVM固有のアドレスをアンカーする統一ID層、ECC-20やSPLなどのVMネイティブインターフェースを共通のバランスストア上で公開する統一トークン台帳の3つのコンポーネントを組み合わせている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:19:25 GMT)
Enhanced Dark Matter Quantum Sensing via Geometric Phase [1.7] 本稿では,標準量子限界を超える結合量子ビットオシレータシステムに対する量子センシングプロトコルを提案する。
クォービットを弱い暗黒物質背景下で自由に進化させる代わりに、我々は大きなコヒーレントな変位と、進化プロトコル内でのスクイーズ操作を組み合わせる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:02 GMT)
FixationFormer: Direct Utilization of Expert Gaze Trajectories for Chest X-Ray Classification [1.7] 我々は、専門家の視線軌跡をトークンのシーケンスとして表現するトランスフォーマーベースのアーキテクチャであるFixationFormerを紹介した。
画像特徴と連動して視線シーケンスをモデル化することにより、視線データの空間性と変動性に対処する。
提案手法を3つのベンチマーク胸部X線データセット上で評価し,最先端の分類性能が得られたことを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:35:01 GMT)
From Content to Audience: A Multimodal Annotation Framework for Broadcast Television Analytics [1.7] マルチモーダル大言語モデル(MLLM)は、強力な汎用ビデオ理解能力を示している。
本稿では,イタリアにおけるテレビ放送におけるマルチモーダル・アノテーション・パイプラインの体系的評価について述べる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:46:51 GMT)
Bounding Box Anomaly Scoring for simple and efficient Out-of-Distribution detection [1.6] Out-of-distribution (OOD) 検出は、深層ニューラルネットワークによる信頼できない予測を減らすために、トレーニングディストリビューションとは異なる入力を識別することを目的としている。
本稿では,バウンディングボックス抽象化を利用したポストホックOOD検出手法であるバウンディングボックス異常検査(BBAS)を紹介する。
BBASは、バウンディングボックスアプローチの単純さ、コンパクト性、および更新性を保ちながら、分布内と分布外サンプルの堅牢な分離を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:25:26 GMT)
A multi-ion optical clock with $\mathbf{5 \times 10^{-19}}$ uncertainty [1.6] 我々は、5.3times10-19$、最大10Srイオンの周波数不確実性を有するマルチイオン光原子時計について報告する。
これらの結果は、平均時間と最先端精度を低減した頑健なマルチイオンクロック動作を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:18:28 GMT)
Active Robotic Perception for Disease Detection and Mapping in Apple Trees [1.6] 大規模な果樹園生産には、時間と正確な病気のモニタリングが必要である。
ルーティン・マニュアル・スカウトは労働集約的であり、近代的な作戦の規模では経済的に非現実的である。
本研究は,リンゴの休眠木における標的疾患の検出とマッピングのための自律移動能動認識システムを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:05:46 GMT)
A Study of Scientific Computational Notebook Quality [1.5] あまり書かれていないコードは誤った発見をもたらし、科学的進歩が遅くなる可能性がある。
我々は,レポジトリ,可読性,再利用性という3次元の科学的コード品質を評価した。
その結果、科学的コード品質に大きな課題が浮かび上がっている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:44:57 GMT)
Solving Nonlinear Partial Differential Equations via a Hybrid Newton Method Using Quantum Linear System Solver [1.4] 新しい量子線型系解法は、非線形偏微分方程式を解くニュートンの古典的な方法をサポートする。
我々はHHLアルゴリズムの新しい変種を提案し、対応する行列の固有値に関するアプリオリ情報の少ない情報を要求する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:22:24 GMT)
Event-Driven Neuromorphic Vision Enables Energy-Efficient Visual Place Recognition [1.4] バイオインスパイアされたニューロモルフィックなアプローチであるSpikeVPRを導入し、コンパクトで不変な場所記述子を生成する。
SpikeVPRは、代理勾配学習を使用してエンドツーエンドでトレーニングされ、新しい拡張戦略であるEventDilationが組み込まれている。
SpikeVPRは、50倍のパラメータを使用し、30~250倍のエネルギーを消費しながら、最先端のディープネットワークに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:26:20 GMT)
Design Guidelines for Nonlinear Kalman Filters via Covariance Compensation [1.4] カルマンフィルタ(KF)の拡張は、複雑なシステムの状態推定には不可欠である。
非線形KFがロバストで正確な推定を行う条件は、まだよく分かっていない。
この研究は、ある種の非線形KFにおける失敗と成功の原因を特定する理論的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:34:36 GMT)
Regulating AI Agents [1.4] 我々は、欧州連合のAI法が、AI技術から生じるガバナンスの課題に直面する大きな障害に直面していると論じる。
これには、自律的なタスク実行におけるパフォーマンスの失敗、悪意のあるアクターによるエージェントの誤使用のリスク、AIエージェントによる経済的機会の不正アクセスなどが含まれる。
EU以降の政策立案者は、次の世代のAI技術を効果的に支配するためには、コースを変更する必要がある、と我々は主張する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:38:27 GMT)
Encoded Quantum Signal Processing for Heisenberg-Limited Metrology [1.3] 絡み合った量子プローブはハイゼンベルクに制限された測定精度を達成することができるが、この利点は通常ノイズによって破壊される。
我々は、符号化量子信号処理と呼ばれるフレームワークを導入することでこの問題に対処する。
本稿では,センサキュービットを繰り返し符号に符号化し,信号処理プリミティブとしてシンドローム計測を用いることで,現実的な雑音下でのハイゼンベルクのスケーリングを実現することを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:43:10 GMT)
A transformer architecture alteration to incentivise externalised reasoning [1.3] 我々は,中間層で早期終了機構を備えた既存のトランスフォーマーアーキテクチャを拡張し,次のトークンを深層計算なしで予測できる場合に,より浅い層でモデルを出力するように訓練する。
この効果を小さな推論モデルに適用し、トークン間の計算を適応的に削減することを学ぶことを示す。
適切なスケールで適用すれば、推論モデルが非ミオピック計画を実行するために処理する過剰な計算量を最小化できると予測する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:21:38 GMT)
What a Mesh: Formal Security Analysis of WPA3 SAE Wireless Authentication [1.2] IEEE 802.11にはSAEと呼ばれるセキュアな認証プロトコルが含まれており、このプロトコルはWPA3-Personalネットワークに必須である。
プロトコルは、ネットワークデバイス間の通信ロジックの従来の暗号記述と、各デバイスで前者を実現するステートマシン記述である。
両レベルでプロトコルの詳細な形式モデルを示し、そのセキュリティ特性の正確な仕様を提供し、ProVerifとTAでマシンチェックされた証明を解析する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:54:05 GMT)
Path Planning and Reinforcement Learning-Driven Control of On-Orbit Free-Flying Multi-Arm Robots [1.1] 本稿では,軌道上における自由飛行型マルチアームロボットの動作計画と制御のための軌道最適化(TO)と強化学習(RL)を統合したハイブリッドアプローチを提案する。
高精度な身体制御のためのスラスタを備えたマルチアームロボット設計は、複雑な宇宙操作における冗長性と安定性を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:31:32 GMT)
PerturbationDrive: A Framework for Perturbation-Based Testing of ADAS [1.0] PerturbationDriveは、高度なドライバアシストシステムの堅牢性と一般化テストを実行するためのテストフレームワークである。
天気、照明、センサーの品質の変化を模倣した30以上の画像の摂動を特徴としている。
静的データセットのオフライン評価と、異なるシミュレータでのオンラインクローズドループテストの両方をサポートする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:05:01 GMT)
Polaris: A Gödel Agent Framework for Small Language Models through Experience-Abstracted Policy Repair [1.0] 経験抽象化によるポリシー修復を行うコンパクトモデルのためのGdelエージェントであるPolarisを紹介する。
応答レベルの自己修正やパラメータチューニングとは異なり、Polarisはポリシーに持続する小さな監査可能なパッチでポリシーレベルの変更を行う。
ループの一部として、エージェントはメタ推論を行い、エラーを説明し、独自のポリシーを具体的に修正し、ポリシーを更新する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:25:32 GMT)
A PAC-Bayesian approach to generalization for quantum models [1.0] 我々は、幅広い量子モデルのクラスに対して、最初のPAC-ベイジアン一般化境界を提供する。
この研究は実行可能なモデル設計の洞察を提供し、量子機械学習における一般化のより微妙な理解のための基礎的なツールを確立する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:58:54 GMT)
Why AI-Generated Text Detection Fails: Evidence from Explainable AI Beyond Benchmark Accuracy [0.9] 本稿では,言語機能工学,機械学習,説明可能なAI技術を統合するフレームワークを提案する。
SHAPに基づく説明を用いて、最も影響力のある特徴がデータセットによって著しく異なることを示す。
この知識は、さまざまな設定で堅牢なAI検出器を構築するのに役立ちます。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:46:15 GMT)
Exponential Family Discriminant Analysis: Generalizing LDA-Style Generative Classification to Non-Gaussian Models [0.9] EFDA(Exponential Family Discriminant Analysis)は、線形識別分析(LDA)を拡張した統合的生成フレームワークである。
EFDAは、全ての自然パラメータに対する閉形式最大線量推定器を導出し、十分な統計量で線形な決定規則を導出する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:40:22 GMT)
MuSe: a Mutation Testing Plugin for the Remix IDE [0.9] 本稿では,Remix-IDE の変異検査プラグイン MuSe を提案する。
MuSeには、従来の、Solidity固有の、セキュリティ指向の突然変異演算子が含まれている。
その結果、開発者と研究者は、直ちに突然変異テストを活用して、テストスイートの有効性を評価し、スマートコントラクトにおける潜在的な問題を特定することができる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:13:23 GMT)
Strain-Parameterized Coupled Dynamics and Dual-Camera Visual Servoing for Aerial Continuum Manipulators [0.9] テンドン駆動連続型空中マニピュレータ(TD-ACM)は、無人航空機(UAV)の操縦性と軽量ロボット(CR)のコンプライアンスを組み合わせる
TD-ACMに対する既存の連続結合動的モデリング手法は計算コストが高い。
本稿では,不活性化基底を持つ結合型TD-ACMの一般化された動的定式化について述べる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:33:22 GMT)
Labeled Compression Schemes for Concept Classes of Finite Functions [0.8] 有限関数の任意の概念クラスに対して、そのVC次元 d に等しい大きさのラベル付きサンプル圧縮スキームを示す。
長期間のオープンサンプル圧縮予想は解決される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:08:32 GMT)
Prototype Fusion: A Training-Free Multi-Layer Approach to OOD Detection [0.8] 中間層がOOD検出に等しくリッチで差別的な情報を符号化していることを示す。
複数の層にまたがる内部表現を利用するモデルに依存しない手法を提案する。
本手法は,画像分類における頑健でアーキテクチャに依存しない性能と強力な一般化を実現する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:32:13 GMT)
Can an LLM Detect Instances of Microservice Infrastructure Patterns? [0.8] MicroPADは、あらゆる言語で書かれたソフトウェアアーチファクトのアーキテクチャパターンを特定するツールである。
複数の言語やアーティファクトタイプにわたるパターンインスタンスを検出することができる。
認識可能な支配的なアーティファクトに関連するパターンが、より確実に検出された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:08:59 GMT)
Encoding Numerical Data for Generative Quantum Machine Learning [0.8] 実世界のデータは、しばしば数値であり、モデルがバイナリと連続表現を変換する必要がある。
我々は、データそのものとは無関係に、データのエンコード方法のアーチファクトである相関を学習するためにモデルが必要であることを示した。
本稿では,基本的にオーバーヘッドを伴わずに実装可能なグレイコードに基づく戦略を提案し,データ構造を保存し,標準アプローチが生成する状況において,人工的相関を回避する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:39:58 GMT)
An Agentic Multi-Agent Architecture for Cybersecurity Risk Management [0.8] ほとんどの中小企業は、サイバーセキュリティのリスク評価を完全に省略している。
我々は6エージェントのAIシステムを構築し、各エージェントが1つの分析段階を処理する。
エージェントは、評価が進むにつれて成長する永続的なコンテキストを共有する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:50:01 GMT)
Dual-Criterion Curriculum Learning: Application to Temporal Data [0.7] Curriculum Learning(CL)は、データインスタンスをスケジュールに応じて漸進的に供給することによってモデルをトレーニングするメタラーニングパラダイムである。
本稿では,インスタンスの難易度を評価するための2つの視点を組み合わせたDual-Criterion Curriculum Learningフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:06:40 GMT)
Span Modeling for Idiomaticity and Figurative Language Detection with Span Contrastive Loss [0.7] 比喩言語のカテゴリーには多くの種類があり、そのうちのいくつかは本質的に非構成的である。
言語モデルでは、トークン化と隣接したコンテキスト埋め込みが原因で、ユニークな問題が発生する。
スロット損失とコントラスト損失を組み合わせたBERTモデルとRoBERTaモデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:45:52 GMT)
The Economics of Builder Saturation in Digital Markets [0.7] 生産規模を弾性的に拡大するが、人間の注意が有限であるモデルを定式化するビルダー飽和効果を導入する。
均衡結果は, 平均賃金の減少, 集中度の増加を示すが, パワーロー様分布と一致している。
結果として、AI対応で民主化されたプロダクションは、広く分散した起業家的成功を生み出すよりも、競争を激化させ、最も獲得した結果を生み出す可能性が高いことが示唆されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:47:44 GMT)
Ukrainian Visual Word Sense Disambiguation Benchmark [0.7] 本研究では,ウクライナ語における視覚的単語センス曖昧化(Visual Word Sense Disambiguation, Visual-WSD)タスクを評価するためのベンチマークを提案する。
Visual-WSDタスクの主目的は、最小限の文脈情報を用いて、与えられた曖昧な単語の最も適切な表現を特定することである。
分析の結果,ウクライナ語と英語の視覚-WSD課題において,有意な性能差が認められた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:09:24 GMT)
Engagement-Zone-Aware Input-Constrained Guidance for Safe Target Interception in Contested Environments [0.7] 我々はディフェンダーが引き起こすエンゲージメントゾーンを用いて安全制約を定式化する。
log-sum-exp演算子を用いてスムーズな集合安全関数を構築する。
次に、インターセプションと安全目標を協調するスムーズな切り替え誘導戦略を開発する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:49:13 GMT)
Human vs. NAO: A Computational-Behavioral Framework for Quantifying Social Orienting in Autism and Typical Development [0.7] 自閉症スペクトラム障害(ASD)の検出における最も顕著な側面の1つである。
ASDの小児は、頻度の低下、遅延の増加、あるいは非定型的な反応パターンを示すことが多い。
この研究は、社会的な手がかりの源泉とモダリティが、名前呼び出しの文脈における注意のダイナミクスにどのように影響するかを理解することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:37:28 GMT)
A Theory of LLM Information Susceptibility [0.7] 大規模言語モデル(LLM)はエージェントシステムにおける最適化モジュールとしてますます多くデプロイされている。
本稿では,計算資源が十分に大きい場合,固定LDMの介入は予算に対して設定された戦略の性能感受性を高めないという仮説に基づいて,情報受容可能性の理論を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:08:43 GMT)
From Arithmetic to Logic: The Resilience of Logic and Lookup-Based Neural Networks Under Parameter Bit-Flips [0.7] 本研究では,ニューラルネットワークの構造特性としてのレジリエンスについて検討する。
その結果,低い精度,高い間隔,有界活性化,浅い深度が常に好まれていることが判明した。
論理ベースのアーキテクチャに特有の新しい偶数層リカバリ効果を同定する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:53:04 GMT)
Between Rules and Reality: On the Context Sensitivity of LLM Moral Judgment [0.7] 本稿では,文脈変化を伴う道徳的ジレンマのデータセットであるContextual MoralChoiceを紹介する。
ほぼすべてのモデルが文脈に敏感で、判断をルール違反の行動にシフトしていることが分かりました。
これは、アクティベーションステアリングアプローチで対処する文脈感度を制御するという問題を引き起こす。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:08:16 GMT)
Basis dependence of eigenstate thermalization [0.7] 固有状態熱化(英: Eigenstate thermalization)とは、多体系のエネルギー固有状態が同じエネルギーでの熱平衡アンサンブルと区別できない性質である。
退化系では、エネルギー固有基底の選択はユニークではなく、固有状態の熱化を示す基底状態の分数が異なる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:56:44 GMT)
Global control via quantum actuators [0.7] 補助量子系は、過渡的に相互作用エネルギーを保存して解放する制御可能な要素として機能する。
コンパイル中は受動的であり、微粒な局所制御を必要としないが、操作中は相互作用の活性化と量子情報の方向の流れを制御できる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:58:00 GMT)
An Explainable AI-Driven Framework for Automated Brain Tumor Segmentation Using an Attention-Enhanced U-Net [0.6] 本稿では,実行中の注意ゲートを付加したU-Netモデルに基づく新たなセグメンテーション手法を提案する。
クラス不均衡に対応するために、標準的な分類的クロスエントロピーとともに、Dice LossやCategorical Dice Lossのような手動設計の損失関数を用いる。
提案手法は精度0.9919,Dice係数0.9901,IoU0.9873,感度0.9908,特異度0.9974で優れた性能を示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:42:49 GMT)
Understanding Bugs in Quantum Simulators: An Empirical Study [0.6] 量子シミュレータは、量子ソフトウェアエコシステムの基本コンポーネントである。
量子プログラムの開発とデバッグ、コンパイラ変換の検証、正確性とパフォーマンスに関する実証的な主張のサポートに使用される。
しかし、量子シミュレーターにおける障害の大規模かつ詳細な研究はいまだに欠けている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:24:25 GMT)
Laser-induced creation of coherent V2 centers in bulk-grown silicon carbide [0.6] 固体スピン欠陥は量子ネットワークノードにとって有望な量子ビットである。
大規模ネットワークに対する大きな課題は、ナノフォトニックデバイスに高い収率で欠陥を発生させることだ。
市販のバルクグレード4H-SiCで作製したナノピラーにおけるV2中心の生成を実証した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:04 GMT)
An Industrial-Scale Retrieval-Augmented Generation Framework for Requirements Engineering: Empirical Evaluation with Automotive Manufacturing Data [0.5] Retrieval-augmented Generation (RAG) は知識集約的なタスクを約束するが、産業用REのRAGを評価する以前の研究は行われていない。
本稿では,産業要求自動化のためのRAGの総合的実証評価について,自動車製造文書を用いた総合評価を行った。
RAGは、完全なトレーサビリティを持つ98.2%の抽出精度を達成し、それぞれ24.4%、19.6%のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:44:26 GMT)
Agent Control Protocol: Admission Control for Agent Actions [0.5] エージェントコントロールプロトコル(エージェントコントロールプロトコル、ACP)は、B2Bの機関環境における自律エージェントの受け入れ制御管理のための正式な技術仕様である。
ACPは暗号ID(Ed25519, JCS標準化)、能力ベースの認証、決定論的リスク評価のメカニズムを定義している。
ACPはRBACとZero Trustを置き換えることなく運用している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:11:17 GMT)
Towards Intelligent Geospatial Data Discovery: a knowledge graph-driven multi-agent framework powered by large language models [0.5] 本研究では,知的地理空間データ探索のための知識グラフ駆動型マルチエージェントフレームワークを提案する。
その結果,従来のシステムと比較して,意図マッチングの精度,ランキング品質,リコール,発見の透明性が大幅に向上していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:03:39 GMT)
Energy Efficient Software Hardware CoDesign for Machine Learning: From TinyML to Large Language Models [0.5] 本研究は,エッジ推論とトレーニングを対象とするエネルギー効率のよいソフトウェアハードウェア設計手法を,データセンター規模のLCMサービスにレビューする。
共通設計レバーとトレードオフを蒸留し、クロスプラットフォームの一般化、大規模でコストのかかる共同設計の検索スペース、ワークロードとデプロイメント設定間の一貫性のないベンチマークなど、繰り返し発生するギャップを強調します。
最後に、最適化戦略を計算的役割にマッピングし、漸進的適応をサポートし、エネルギーと炭素を意識したMLシステムを構築するための実践的なガイダンスを提供する階層的な分解の観点を概説する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:10:42 GMT)
HUydra: Full-Range Lung CT Synthesis via Multiple HU Interval Generative Modelling [0.5] 本稿では,HU領域全体を一度にモデル化するのではなく,CT画像を一度に1つのHU間隔で合成する新しい分解手法を提案する。
提案手法は従来の2次元フルレンジベースラインよりも優れており,FIDと優れたMDD,精度,リコールの6.2%向上を実現している。
本研究は, 構造認識型医用画像合成の新しいパラダイムを確立し, 生成的モデリングと臨床解釈を整合させる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:27:31 GMT)
Optimal pure state cloning and transposition are complementary channels [0.5] 最適なqudit (N!to!K) 転置写像は、純状態上の最適普遍対称(N!to!K)量子クローンマシンの相補チャネルであることを示す。
また、最適な(N!to!K)変換と(N!to!N!+!K)クローニングを同時に行う明示的な量子回路を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:11:29 GMT)
ReqFusion: A Multi-Provider Framework for Automated PEGS Analysis Across Software Domains [0.5] ReqFusionは、ソフトウェア要件の抽出、分類、分析を自動化するAI強化システムである。
アーキテクチャはOpenAI GPT、Anthhropic Claude、Groqモデルを統合し、機能的および非機能的要件を抽出する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:45:40 GMT)
Adaptive Gaussian Process Search for Simulation-Based Sample Size Estimation in Clinical Prediction Models: Validation of the pmsims R Package [0.5] サンプルサイズ決定のためのフレキシブルなシミュレーションベースのフレームワークを提供するために,ガウス過程シュロゲートモデリングを用いたRパッケージpmsimsを提示し,検証する。
既存の解析手法(pmsampsize)とシミュレーション手法(samplesizedev)とを比較した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:53:37 GMT)
ROSCell: A ROS2-Based Framework for Automated Formation and Orchestration of Multi-Robot Systems [0.4] ROSCellは、様々なデバイスにまたがるコンピューティング連続体の形成と管理を可能にするフレームワークである。
動的生産環境における適応型マルチロボットコンピューティングのためのスケーラブルで低オーバーヘッドな基盤を提供する。
ROSCellは、エッジデバイス上のK3sベースのソリューションに比べてCPU、メモリ、ネットワークオーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:56:32 GMT)
PRETTINESS -- Privacy pResErving aTTrIbute maNagEment SyStem [0.4] European Digital Identity (EUDI) Walletは、エンドユーザに対して、発行者から認証証明書を取得する方法を提供することを目的としている。
本稿では,単一サーバとパーティ間のセキュアな通信路に依存した汎用的なクレデンシャル・リコールシステムを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:59:00 GMT)
Hierarchical Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text [0.4] H-TechniqueRAGは、この戦術的技術的分類を強力な帰納バイアスとして注入し、高度に効率的かつ正確なアノテーションを実現する新しい階層的RAGフレームワークである。
H-TechniqueRAGは、最先端のTechnicalRAGを3.8%のF1スコアで上回るだけでなく、推論遅延の62.4%、LLM API呼び出しの60%の削減を実現している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:21:46 GMT)
Large-Scale Avalanche Mapping from SAR Images with Deep Learning-based Change Detection [0.4] 本研究では,Sentinel-1 レーダ画像を用いた経時変化検出による大規模雪崩マッピングの系統的研究を行った。
手動で検証した雪崩在庫を用いた複数のアルプスエコリージョンでの実験では、作業はSAR前と後の画像にのみ依存して、一貫したパフォーマンスを達成するという、一貫した変化検出問題として扱われている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:22:48 GMT)
Characterization and Comparison of Energy Relaxation in Fluxonium Qubits [0.4] フラクソニウム超伝導量子ビットは、長いコヒーレンス時間と高い単一および2量子ゲート密度を示す。
本研究では, フラキソニウム量子ビットエネルギー緩和時間$T_$に対する支配的制約について, 8つのプラナー, アルミニウムオンシリコン量子ビットの集合を用いて検討した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:21:42 GMT)
Reliable Classroom AI via Neuro-Symbolic Multimodal Reasoning [0.3] NSCRは,授業分析を知覚的接地,象徴的抽象,実行可能推論,ガバナンスの4つの層に分解する,神経象徴的フレームワークである。
我々は,教室の状態推定,談話接地イベントリンク,時間的早期警告,協調分析,多言語教室推論の5つのタスクに,ベンチマークと評価プロトコルを投入した。
この論文は、新しい経験的成果を報告していない。その貢献は、より解釈しやすく、プライバシーに配慮し、教育的に基礎を置いている教室用マルチモーダルAIをサポートするための具体的なフレームワークと評価アジェンダである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:31:32 GMT)
Network Analysis of the Egyptian Reddit Community [0.3] 23,185人のユーザと105人のエジプト人サブレディットからなる包括的データセットを収集し,構築した。
この発見は、コミュニティのダイナミクス、影響力のあるユーザ、およびネットワーク内の情報フローに関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:57:52 GMT)
RC-HEOM Hybrid Method for Non-Perturbative Open System Dynamics [0.3] 両手法の強度を統一するハイブリッド手法であるRC-HEOMを導入する。
RC-HEOMは、正確な非マルコフメモリとRCモードへのアクセスを同時に保持する。
これらの結果は、RC-HEOMがオープン量子系を特徴づけるための有望な方法であることを示している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:11:12 GMT)
Beyond Explanation: Evidentiary Rights for Algorithmic Accountability [0.3] アルゴリズムのアカウンタビリティ奨学金は説明に重点を置いており、決定が下された理由を理解するのに役立っている。
我々は、この焦点が不十分であると主張する。明示的なアクセスのない説明は、有意義な競争を可能にしない。
手続き的要素の欠如として顕在的権利を提案し,反実的尋問権を開発する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:12:20 GMT)
myMNIST: Benchmark of PETNN, KAN, and Classical Deep Learning Models for Burmese Handwritten Digit Recognition [0.3] 公開されているビルマ手書きDigitデータセット(BHDD)の標準化進化に関する最初の体系的ベンチマークを示す。
BHDDはミャンマーのNLP/AIの基礎的なリソースとして機能するが、現代のアーキテクチャ全体にわたって包括的な再現可能なパフォーマンスベースラインは欠如している。
我々は、古典的なディープラーニングモデル、エネルギーベースモデル、物理に触発されたPETNNの変種にまたがる11のアーキテクチャを評価した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:26:51 GMT)
TimeTox: An LLM-Based Pipeline for Automated Extraction of Time Toxicity from Clinical Trial Protocols [0.3] 時間毒性(英: Time toxicity)とは、臨床治験への参加から生じる累積的な医療接触日であり、重要なが労働集約的な指標である。
We developed TimeTox, a LLM-based pipeline for automated extract of time toxicity from Schedule of Assessments table。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:56:50 GMT)
RTS-ABAC: Real-Time Server-Aided Attribute-Based Authorization & Access Control for Substation Automation Systems [0.3] 本稿では,RTS-ABAC と呼ばれる時間クリティカルなアプリケーションに対して,新しいリアルタイムサーバ支援属性ベースの認証とアクセス制御を提案する。
RTS-ABACは、SAS通信の正当性、完全性、非正当性を保護するため、任意の種類のSAS通信に対して、強制的な認証、認可、アクセス制御を採用する。
RTS-ABACは、交換パケットの99.82パーセントが6ミリ秒未満のラウンドトリップ時間を達成するため、SASデバイス間の低遅延通信を確保できることが示されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:55:10 GMT)
Optimizing Small Language Models for NL2SQL via Chain-of-Thought Fine-Tuning [0.3] 本稿では,NL2タスクにおける大小言語モデルと小言語モデルの両方の微調整の有効性について検討する。
我々の研究は反直感的なスケーリング現象を明らかにしている。
微調整により、小型モデルのベースラインが36%から45%に改善され、明示的なチェーン・オブ・ソート推論によるデータセットが54.5%に向上した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:39:06 GMT)
Scalable quantum circuit generation for iterative ground state approximation using Majorana Propagation [0.2] ADAPT-VMPEは分子ハミルトニアンの基底状態を近似する回路を生成する。
がん治療のためのヒト臨床治験において, 強い相関性を有する感光剤として最大100量子アンスターゼを構築した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:14:37 GMT)
CSTS: A Canonical Security Telemetry Substrate for AI-Native Cyber Detection [0.2] 我々はCSTS(Canonical Security Telemetry Substrate)を紹介した。
CSTSは、アイデンティティ中心の検出のためのクロストポロジー転送を改善し、スキーマの摂動による崩壊を防ぐ。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:30:03 GMT)
Targeted Adversarial Traffic Generation : Black-box Approach to Evade Intrusion Detection Systems in IoT Networks [0.2] この研究は、理論上の脆弱性を現実の応用性でブリッジし、現代のIoTエコシステムにおける脅威に対する理解と防御を強化することを目的としている。
本稿では,回避攻撃の影響を軽減し,MLベースのIDSの弾力性を強化するための防御策を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:11:44 GMT)
Parametric Knowledge and Retrieval Behavior in RAG Fine-Tuning for Electronic Design Automation [0.2] 電子設計自動化における長文テキスト生成のためのRAGファインチューニングの評価を行った。
評価パイプラインTriFEXを紹介する。
ROUGEとBERTScoreは3つの評価結果が示す事実差を検出できないことを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:33:57 GMT)
Security Barriers to Trustworthy AI-Driven Cyber Threat Intelligence in Finance: Evidence from Practitioners [0.2] 金融機関は厳格な規制監督下にある間、サイバーリスクの増大に直面している。
このリスクを管理するため、彼らはサイバー脅威インテリジェンス(CTI)に大きく依存し、検出、応答、戦略的セキュリティ決定を通知する。
しかし、金融における信用に値する生産利用の証拠は依然として限られている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:10:58 GMT)
Failure of contextual invariance in gender inference with large language models [0.1] 最小で理論上は非形式的な言論コンテキストを導入し、モデル出力の大規模かつ体系的な変化を引き起こすことを発見した。
文化性ステレオタイプとの相関関係は、文脈が導入されたら、文脈が弱まるか、あるいは消える。
コンテキスト・バイ・Default分析により、モデル全体で19~52%のケースにおいて、この依存が持続することが明らかとなった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:52:22 GMT)
Initial State Memory in Finite Random Brickwork Circuits [0.1] 2つの任意の初期状態の進化によって得られる還元状態間の平均フロベニウス距離を測定する。
この距離を常に正確に特徴づけることで、環境がシステムの半分以下であれば、情報が保持されることが分かる。
十分な境界散逸を導入することで、メモリ保存相と情報が完全に失われる相転移を観測できることが示される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:35:35 GMT)
Coordinate Encoding on Linear Grids for Physics-Informed Neural Networks [0.1] 線形グリッドセル上に座標符号化層を備えたPINN方式を提案する。
提案手法は, グリッドセルを用いて局所領域を分離することにより, トレーニング収束速度を向上する。
これにより、軸非依存の線形グリッドセルを使用することで、全体的な計算コストを削減できる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:45:46 GMT)
Voice Privacy from an Attribute-based Perspective [0.1] 我々は属性に基づく視点を導入し、話者属性の集合の比較の観点からプライバシ保護を測定する。
本研究は, 話者の真理属性, 原音声に推定される属性, 標準匿名化で保護された音声に推定される属性について, 話者の独特性を計算することによって, プライバシへの影響を解析する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:13:32 GMT)
High-yield integration design of fixed-frequency superconducting qubit systems using siZZle-CZ gates [0.1] 固定周波数トランスモン量子ビットは、大規模量子コンピューティングのための有望なプラットフォームである。
siZle-CZゲートはクロス共振(CR)ゲートに代えて,スケーラブルで高速な衝突特性を有することを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:21:09 GMT)
Quantum-classical dynamics of Rashba spin-orbit coupling [0.1] 混合量子古典モデルは完全量子シミュレーションの計算コストを削減するために広く用いられている。
Rashbaナノワイヤの1次元モデルにおける量子スピン1/2と古典軌道運動量の相互作用ダイナミクスについて検討する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:33:00 GMT)
A Theory of Nonparametric Covariance Function Estimation for Discretely Observed Data [0.0] 我々は,$d$次元領域上の離散的な位置における雑音で観測された関数データの非パラメトリック共分散関数推定について検討した。
深層学習推定器は、最小値の確率を多対数因子に到達させる。
しかし、構造化関数クラスでは、深層学習推定器はポリ対数因子までミニマックス速度を達成できる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:04:13 GMT)
Evaluating a Multi-Agent Voice-Enabled Smart Speaker for Care Homes: A Safety-Focused Framework [0.0] 本稿では,介護施設における日常生活支援を目的とした音声対応ホームスマートスピーカーについて検討する。
本稿では,Whisperに基づく音声認識と検索拡張生成手法を組み合わせた,システムエンドツーエンドの安全性評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:08:06 GMT)
ABSTRAL: Automatic Design of Multi-Agent Systems Through Iterative Refinement and Topology Optimization [0.0] 本稿では,MASアーキテクチャを自然言語文書として扱うフレームワークであるABSTRALを紹介する。
固定的なターン予算の下では、アンサンブルは26%のターン効率しか達成せず、66%のタスクが限界を乗り越えている。
対照的なトレース分析は 初期設計に欠如している 専門的な役割を発見します
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:28:07 GMT)
Unilateral Relationship Revision Power in Human-AI Companion Interaction [0.0] 私は、人間とAIの協力的相互作用は、提供者がAIの制御を行う三進的構造である、と論じます。
この分析は、リレーショナルAI倫理における中心的かつ未解明の問題は、人間とAIの相互作用そのものに対する権力の構造的配置であることを示している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:18:48 GMT)
Zero-Uncertainty States Relative to Observable Algebras [0.0] 演算子-代数的観点から量子メモリを用いたゼロ不確かさ状態について検討する。
我々は、純度と最大エンタングルメントの剛性定理を証明する。
量子ステアリング(quantum steering)の例を示し、我々のフレームワークが具体的な物理的問題の解決にどのように役立つかを説明する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:13:17 GMT)
YOLOv10 with Kolmogorov-Arnold networks and vision-language foundation models for interpretable object detection and trustworthy multimodal AI in computer vision perception [0.0] Kolmogorov-Arnoldネットワークは、You Only Look Once (Yolov10)検出の信頼性をモデル化するために、解釈可能なポストホックサロゲートとして使用される。
コモン・オブジェクト・イン・コンテクスト(COCO)とバス大学キャンパスの画像の両方の実験では、このフレームワークが信頼度の低い予測を正確に識別していることが示されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:13:43 GMT)
When AI Shows Its Work, Is It Actually Working? Step-Level Evaluation Reveals Frontier Language Models Frequently Bypass Their Own Reasoning [0.0] 言語モデルは、答える前にステップバイステップの推論を書くことで、ますます"彼らの仕事を示す"。
しかし、これらの推論ステップは真に使われているのか、あるいはモデルがすでに決定した後に生成された装飾的な物語なのか?
ステップレベルの評価を導入する: 一度に1つの推論文を取り除き、答えが変わるかどうかを確認する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:38:13 GMT)
WISTERIA: Weak Implicit Signal-based Temporal Relation Extraction with Attention [0.0] 時間関係抽出(TRE)では、時間内の2つの事象や時間的表現がどのように関連しているかを特定する必要がある。
本稿では,各イベントペアに設定されたトップKアテンションコンポーネントが,時間的分類の解釈可能な証拠を真にエンコードするかどうかを調べるフレームワークであるWISTERIAを提案する。
TimeBank-Dense、MATRES、TDDMan、TDDAutoにおいて、トップKトークンの言語分析を含む広範な実験を行います。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:20:54 GMT)
Votiverse: A Configurable Governance Platform for Democratic Decision-Making [0.0] Votiverseは民主主義の他の構成を探求するためのプラットフォームである。
あらゆる規模の組織、コミュニティ、機関にガバナンスエンジンを提供する。
本稿は、ガバナンスモデルを形式化し、流動民主主義と参加型意思決定に関する既存の研究に含め、既知の障害モードに対処し、プラットフォームのアーキテクチャを説明する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:38:08 GMT)
Very sensitive vapor-cell quasi-DC atomic E-field sensor [0.0] 準DC周波数領域で動作する蒸気セル原子電気計。
電界(Eフィールド)感度のためのノイズフロアは0.2から7.7mV/m$sqrtrm Hz$で周波数帯域は1-100Hzである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:18:42 GMT)
Two-parameter Family-Vicsek scaling in a dissipative XXZ spin chain [0.0] FV(Family-Vicsek)スケーリングは、古典システムにおけるゆらぎの成長と有限サイズ飽和の理解を提供する。
ここでは、均一なゲインとロスを有する散逸型XXZスピンチェーンにおいて、量子クエンチ後の移動セグメント磁化にFV粗さを拡大する。
相互作用鎖について、テンソル-ネットワークシミュレーションは、有限磁化における非散逸性弾道的成長が堅牢であることを示し、一方リンドブラッドの完全な進化は散逸緩和時間によって総称的に制御され、散逸支配的な崩壊を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:19:10 GMT)
Traveling Salesman Problem with a preprocessing method for classical and quantum optimization [0.0] トラベリングセールスマン問題(Traveing Salesman Problem)は、オペレーション研究において広く研究されている基本的な最適化問題である。
単純な定式化にもかかわらず、探索空間の指数的な成長と多くの制約のために計算的に困難である。
本稿では,最適化モデルのサイズを大幅に削減する前処理戦略を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:54:14 GMT)
Transformation of the Talbot effect in response to phase disorder [0.0] ボース=アインシュタイン凝縮は当初長鎖に配置され、自由に膨張し干渉する。
凝縮体の初期位相が同一であれば、初期密度分布は周期的に復元される。
初期段階のわずかな障害でさえ、干渉パターンの変換につながる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:08:03 GMT)
The quantum harmonic oscillator on a circle -- fragmentation of the algebraic method [0.0] 二次ポテンシャルの円上の量子粒子は調和ではないスペクトルを示す。
これにより、通常の代数的引数 -- 整数ギャップを暗示する -- がどこで失敗するのかという疑問が持ち上がる。
答えは照らされ、このような単純なモデルのための驚くほど豊富な物理現象をカバーしている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:13:17 GMT)
The Order Is The Message [0.0] 2つの固定順序戦略は、入力空間の0.3%からなるトレーニングセットからエポック487、659で99.5%のテスト精度を達成する。
本稿では、学習効率の向上、グルーキングの再解釈、およびコンテンツレベルの監査を回避したチャンネルの安全性リスクについて論じる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:14:33 GMT)
The Mass Agreement Score: A Point-centric Measure of Cluster Size Consistency [0.0] 本稿では,各クラスタのポイントの観点から,期待されるクラスタサイズの整合性を評価する点中心のメトリクスを紹介する。
その構造は設計によって断片となり、類似のスコアを類似のバルク構造を持つパーティションに割り当てる一方で、真のクラスター質量の再分配に敏感なままである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:22:52 GMT)
The Imbalanced User-AI Relationships as an Ethical Failure of Front-End Design in Healthcare AI [0.0] データ推論によって、患者がどのようにAIシステムに高度に可視化されているかを示すが、どのように表現されているかを理解したり、質問したり、影響を与えることはない。
医療におけるよりバランスのとれた参加型ユーザ・AI関係のための介入を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:15:57 GMT)
The EU AI Act and the Rights-based Approach to Technological Governance [0.0] 記事は、AI法がAIに対する人間中心のアプローチをどのように導入するかを検証している。
基本的権利は単なる願望的目標ではなく、法的しきい値と手続き的引き金として機能する、と論じている。
これは、AI法が人権保護のAIシステムのモデルとして機能する可能性を持っていることを示唆している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:07:23 GMT)
The Coordinate System Problem in Persistent Structural Memory for Neural Architectures [0.0] そこで我々はDual-View Pheromone Pathway Network (DPPN)を紹介した。
永続メモリは安定した座標系を必要とする。
コントラスト的な更新,マルチソース蒸留,ハンガリーのアライメント,セマンティックな分解は,スクラッチから埋め込みが学習された場合の不安定性を解消しないことを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:51:59 GMT)
The Cognitive Firewall:Securing Browser Based AI Agents Against Indirect Prompt Injection Via Hybrid Edge Cloud Defense [0.0] Cognitive Firewallは3段階の分割計算アーキテクチャで、クライアントとクラウドにセキュリティチェックを分散する。
システムは、ローカルビジュアルセンチネル、クラウドベースのDeep Planner、実行時ポリシーを強制する決定論的ガードで構成される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:49:15 GMT)
The Born Rule as the Unique Refinement-Stable Induced Weight on Robust Record Sectors [0.0] 本稿では,ヒルベルト記録層内のロバストなレコードセクター上での重み付けに関する条件付き構造的一意性定理を証明した。
その定理的対象と加法的キャリアは、標準的なボルン・ルール経路のそれとは異なる: 加法性は全射影格子上に置かれるのではなく、広範なバンドルのバリュエーションを通じて可約連続バンドル上に置かれる。
結果は異なる言語におけるグリーソン型表現定理ではなく、帰納的連続構造上のバンドル加法性から受け継がれた帰納セクター重みに関する独特な一意性定理である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:13:44 GMT)
The Algebraic Landscape of Kochen-Specker Sets in Dimension Three [0.0] 2シンボル座標アルファベットの3次元ヒルベルト空間におけるKochen-Speckerの不色性に関する計算的調査を示す。
テストされた全てのアルファベットにおいて、KS集合は、$x$が2つのキャンセル機構のうちの1つをサポートする場合にのみ生じる。
2つの新しいKSグラフ型を出力する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:01:09 GMT)
Tensor network influence functionals for open quantum systems with general Gaussian bosonic baths [0.0] 本稿では,複数の非交換演算子を介してシステムと単一の貯水池が結合された場合の一般化を提案する。
有限進化時間ステップから生じるトロッター誤差を適切に処理するガウスの影響関数を構築する。
実演として、異なる格子のボソニック格子に結合した駆動二段エミッタの時間発展をシミュレートする。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:00:07 GMT)
TALUS: Threshold ML-DSA with One-Round Online Signing via Boundary Clearance and Carry Elimination [0.0] 我々は,ML-DSAの最初のしきい値構築であるTALUSを,99%のオンライン成功で1ラウンドのオンライン署名を実現した。
これをLattice 204 Threshold Trilemmaとして定式化し、ML-DSAノセ空間から任意のアーベル群への群準同型が同時に隠れ、結合できないことを証明した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:42:26 GMT)
Swiss-Bench SBP-002: A Frontier Model Comparison on Swiss Legal and Regulatory Tasks [0.0] 既存のベンチマークでは、適用されたスイスの規制タスクにおけるフロンティアモデルのパフォーマンスを評価していない。
スイス・ベンチ(Swiss-Bench)は、スイスの3つの規制ドメインにまたがる395のエキスパート工芸品のトリンガルベンチマークである。
私は、構造化された3次元スコアリングフレームワークを使用して、2026年3月からの10つのフロンティアモデルを評価します。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:41:07 GMT)
Stepwise Variational Inference with Vine Copulas [0.0] そこで本研究では,Vine copulasと変分パラメータの段階的推定を併用したユニバーサルVIプロシージャを提案する。
そこで本研究では,通常の後方方向のKulback-Leibler分散が,Vine copulaモデルにおいて正しいパラメータを復元できないことを示す。
本手法は平均場VI(MFVI)と完全潜伏依存性を補間する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:55:47 GMT)
StepCache: Step-Level Reuse with Lightweight Verification and Selective Patching for LLM Serving [0.0] StepCacheはバックエンドに依存しないステップレベルの再利用レイヤで、出力を順序付けられたステップに分割します。
StepCacheは、選択的パッチによって失敗したリージョンのみを再生する。
平均レイテンシは2.13秒から0.67秒、中央レイテンシは2.42秒から0.01秒、p95レイテンシは3.38秒から3.30秒に減少する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:19:26 GMT)
Sparse Weak-Form Discovery of Stochastic Generators [0.0] 提案フレームワークは,SDE識別問題を2つのSINDyベース線形スパース識別問題に変換する。
このアルゴリズムは,4%未満の係数誤差,0.01未満の定常全変分距離,および3つのベンチマークの真の緩和を忠実に再現する自己相関関数を含む,全ての非線形項を復元する3つのSDEの時間尺度で検証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:03:23 GMT)
Secure Two-Party Matrix Multiplication from Lattices and Its Application to Encrypted Control [0.0] 提案プロトコルは、標準格子ベースの暗号仮定の下では確実に安全である。
線形制御則のセキュアな実装に適用することで,プロトコルの実現可能性を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:51:51 GMT)
Robustness Quantification for Discriminative Models: a New Robustness Metric and its Application to Dynamic Classifier Selection [0.0] 本稿では,任意の確率的識別分類器や特徴量に適用可能な新しいロバスト性指標を提案する。
この新指標は信頼できない予測と信頼できない予測を区別できることを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:20:39 GMT)
Robustness Quantification and Uncertainty Quantification: Comparing Two Methods for Assessing the Reliability of Classifier Predictions [0.0] 分類器の個人予測の信頼性を評価するために,ロバストネス量化(RQ)と不確実性量化(UQ)の2つのアプローチを検討する。
RQは、標準設定と分布シフトの有無の両方において、UQを上回り得ることを示す。
また、RQとUQの相補性を実証し、両方のアプローチの組み合わせがより優れた信頼性評価につながることを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:31:13 GMT)
Robot Arm Control via Cognitive Map Learners [0.0] 本研究は,多関節ロボットアームの動作制御に本手法を適用した。
各アームセグメントの角位置は独立に訓練されたCMLによって管理される。
本研究は、任意の数のアームセグメントを持つ2次元ロボットアームに対する一般的な解と、単一の回転ベースを持つ3次元アームに対する特定の解の両方を提示する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:39:07 GMT)
Retinal Disease Classification from Fundus Images using CNN Transfer Learning [0.0] 我々は、ベースライン畳み込みニューラルネットワークと、事前訓練されたVGG16バックボーンを用いたトランスファーラーニングアプローチを実装し、比較する。
VGG16転送学習モデルは、重み付きF1スコアの0.90で90.8%のテスト精度を達成し、ベースラインCNNを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:40:48 GMT)
Reaching states below the threshold energy in spin glasses via quantum annealing [0.0] 正準平均場スピングラスモデルにおける近似最適化における量子アニールの挙動について検討する。
量子アニールは、この効果を利用してサブスレッショルド状態の位置を$O(1)$時間で見つけることができることを示す。
熱力学的限界を保った閉積分微分方程式の導出と数値解法により, 有限サイズ効果は得られない。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:04 GMT)
Reaching for the performance limit of hybrid density functional theory for molecular chemistry [0.0] 選択されたアプリケーションドメイン内で確実に最も正確な機能を開発するには、体系的なプロトコルが必要である。
本稿では,制約強制,フレキシブルな機能形式,現代的な最適化を組み合わせたプロトコルを提案する。
幅広い分子ベンチマークにおいて、COACHはRSHメタGGAと比較して精度と転送性の両方を改善している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:33:43 GMT)
QuickQudits: A Framework for Efficient Simulation of Noisy Qudit Clifford Circuits via an Extended Stabilizer Tableau Formalism [0.0] 本稿では,$d$-dimensional qudits に作用する回路の高速古典シミュレーションの枠組みを提案する。
このフレームワークは、ノイズを含むスケーラブルでオープンソースのSong+Weak安定化シミュレータの基盤となる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:28:49 GMT)
Quantum speedup from nonclassical polarization [0.0] 量子コヒーレンスを発生させることなく達成可能な状態の変化率を束縛する速度制限を計算する。
制限のない量子スピード限界との比較により、偏極非古典性に起因するスピードアップの定量的同定が可能となる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:18:42 GMT)
Quantum simulation of Motzkin spin chain with Rydberg atoms [0.0] モツキンスピンチェイン(Motzkin spin chain)は、対称性が保護された位相位相に接続するよく知られた数学的モデルである。
彼らは地域法に違反する非常に絡み合った土地国家を誇示している。
本稿では,モツキンスピンを効果的に実現したRydberg-atomベースの量子シミュレーション手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:54:35 GMT)
Quantum correlations in prepare-and-measure scenarios and their semi-device-independent applications [0.0] 量子情報における重要な側面は、通信タスクにおいて古典的なものよりも量子システムがもたらす利点を理解することである。
ベル非局所性とデバイス非依存の情報処理の発展に触発されたこの研究は、通信における量子システムの可能性と限界を特徴づけることを目的としている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:05 GMT)
Quantum Random Forest for the Regression Problem [0.0] 本稿では、回帰問題に対するランダムフォレスト機械学習モデルの(予測)過程をテストするための量子アルゴリズムを提案する。
提示されたアルゴリズムは、古典的なアルゴリズムよりも効率的(クエリの複雑さや実行時間の観点から)である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:27:17 GMT)
Quantum Graph Theory by Example [0.0] 離散項で考えることができる非自明な量子グラフの集合を提示する。
この例は、より小さな古典行列群によって作用される量子グラフとして生じる。
量子グラフパラメータの正確な公式を与えるか、境界を確立する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:51:14 GMT)
Quantized Vision-Language Models for Damage Assessment: A Comparative Study of LLaVA-1.5-7B Quantization Levels [0.0] 本稿では,自動橋梁損傷評価のためのVLM(Quantized Vision-Language Models)の総合的研究について述べる。
我々は、説明品質、推論速度、そしてリソース要求の間のトレードオフに焦点を当てます。
視覚的損傷解析,構造化抽出,ルールに基づく優先スコアリングのためのLLaVA-1.5-7Bを組み合わせたエンドツーエンドパイプラインを開発した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:33:18 GMT)
Propagation of optical vector vortices of slow light in a coherently prepared tripod configuration [0.0] 連続的に調製された4レベル三脚原子系における低速光の光ベクトル渦の伝播について検討した。
渦OAMを媒体上にマッピングし、対称な方位構造を持つ吸収パターンを生成する。
偏光遷移の速度は制御場強度によって調整可能であり、緩やかなベクトル渦力学に対する柔軟な制御を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:45:41 GMT)
Probabilistic Geometric Alignment via Bayesian Latent Transport for Domain-Adaptive Foundation Models [0.0] 大規模なファンデーションモデルを、監督が限定された新しいドメインに適応させることは、依然として根本的な課題である。
本稿では、幾何学的アライメント問題としてドメイン適応を定式化する不確実性を考慮した確率的潜在輸送フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:35:08 GMT)
Privacy-Aware Smart Cameras: View Coverage via Socially Responsible Coordination [0.0] プライバシーを意識したスマートカメラによる視界の調整は、より社会的に責任を負う都市知能の鍵となる。
本稿では,対話型スマートカメラが自律的に方向を選択するための分散フレームワークを提案する。
我々は18.42%のカバレッジ効率と85.53%のプライバシー侵害がベースラインや他の最先端のアプローチよりも低いことを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:43:01 GMT)
PhyUnfold-Net: Advancing Remote Sensing Change Detection with Physics-Guided Deep Unfolding [0.0] 両時間変化検出は、照度、季節、大気などの取得不一致に敏感である。
本稿では,変化検出を明示的な分解問題として定式化する物理誘導型深部展開フレームワークであるPhyUnfold-Netを提案する。
4つのベンチマークの実験では、最先端の手法よりも改善され、挑戦的な条件下での利得が示されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:47:47 GMT)
Out-of-Domain Stress Test for Temporal Braid Group Privilege Escalation Detection [0.0] 我々は,ブラウ・リャプノフ LE指数がクラウドIAMグラフにおける分散特権エスカレーションラチェットから注目されていることを証明した。
この主張を合成検証コーパスを超えて強化するため、太陽磁場にゼロパラメータを調整した同一のパイプラインを適用した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:03:13 GMT)
On single-frequency asymptotics for the Maxwell-Bloch equations: pure states [0.0] 2レベル分子に結合した単一モードのマクスウェル場に対する減衰駆動マクスウェル・ブロッホ方程式を考える。
対称性はBogolyubov-Eckhaus--Sanchez-Palenciaの力学系への平均化理論の拡張に続く。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:31:42 GMT)
On Sub-Sevenfold Symmetries in LH2 Stacked Ring Scaffolds: A Quantum Optical Perspective [0.0] 紫色光合成細菌における光ハーベスティング2 (LH2) 錯体の重なり足場に, サブセブンフォールド対称性が欠落する原因について検討した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:05:09 GMT)
Observer-Dependent Entropy and Diagonal Rényi Invariants in Quantum Reference Frames [0.0] 任意の部分系に対するフレーム独立な対角線レニーエントロピーの族を研究する。
理想的なフレームに対しては、サブシステムエントロピーのオブザーバ依存は、単一フレームコヒーレンスとフレーム間相関の和への正確な分解を許容する。
我々の結果は、量子オブザーバがサブシステムエントロピーに対してどの程度の意見が一致しないかに量的制限を課し、重力環境におけるオブザーバ依存エントロピーの割り当てに潜在的に影響する可能性がある。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:01 GMT)
Non-Hermitian skin effect in periodic, random, and quasiperiodic systems [0.0] 非エルミティアスキンエフェクト(NHSE)は、システムの境界に向かってバルクステートを駆動する。
我々は1次元非エルミート量子ウォークモデルを用いて周期的・ランダム・準周期的(フィボナッチ)システムについて検討する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:07:17 GMT)
Neural Networks as Local-to-Global Computations [0.0] エッジ上の制約マップとして各計算ステップを符号化することにより,任意のReLUニューラルネットワークからシーフを構築する。
フォワードパスとは異なり、熱方程式は層間で情報を双方向に伝播し、両方の方向に制約を課すピン付きニューロンを可能にする。
我々は, この枠組みを小さな合成問題に対して実験的に検証し, 収束定理を検証し, せん断に基づくトレーニングがまだ勾配降下と競合していないものの, 理論によって予測される定量的なスケーリング法則に従うことを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:50:39 GMT)
NLP Occupational Emergence Analysis: How Occupations Form and Evolve in Real Time -- A Zero-Assumption Method Demonstrated on AI in the US Technology Workforce, 2022-2026 [0.0] 作業は、分類システムが追跡できるものよりも早く形成され、進化します。
真の職業とは,共有された専門用語が実践者をグループとして結束させる自己強化構造(二部構造共役体)である。
この共トラクタの概念により、履歴データから職業発生を検出するゼロ推定法が実現される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:30:16 GMT)
Modeling the Disjunction Effect within Classical Probability: A New Decision Process Model and Comparison with Quantum-like Models [0.0] 我々は、囚人のジレンマ判決効果の主張を再検討する。
量子的イベントセマンティクスでは、あいまいな純粋な状態はジェネリックである。
我々は、同じ実験の標準的な量子的モデルによって生成されるようなトリプルに対して、それを正確に再現する古典的なインスタンスが存在することを証明している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:05:25 GMT)
Mi:dm K 2.5 Pro [0.0] Mi:dm K 2.5 Proはエンタープライズグレードの複雑さに対応するために設計されたフラッグシップLDMです。
我々の方法論は、品質中心のキュレーションパイプラインを通じて堅牢なデータ基盤を構築します。
Mi:dm K 2.5 Proは、主要なグローバルモデルと国内モデルとの競争性能を達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:00:29 GMT)
Low Dose CT for Stroke Diagnosis: A Dual Pipeline Deep Learning Framework for Portable Neuroimaging [0.0] モバイル臨床環境におけるAI支援トリアージのための低用量CT(LDCT)脳スキャンによる脳卒中分類のためのディープラーニングフレームワークを提案する。
1)うるさいLDCT画像の直接分類と,(2)難聴化と分類の2つのパイプラインを比較した。
最高の音階分類パイプラインは、適度な線量レベルで0.94 AUCと0.91の精度を達成し、特定のケースでは6%の直接分類を達成している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:18:21 GMT)
LogicDiff: Logic-Guided Denoising Improves Reasoning in Masked Diffusion Language Models [0.0] 本稿では,信頼に基づくアンマスキーを論理ロール誘導アンマスキーに置き換える推論時間手法であるLogicDiffを紹介する。
依存関係順序付きスケジューラは、論理的依存関係順序でトークンをアンマスクする。
LogicDiffは、GSM8Kでは22.0%から60.7%に、MATH-500では23.6%から23.6%に改善した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:08:10 GMT)
Local and Global Master Equations through the Lens of Non-Hermitian Physics [0.0] 非エルミート的ハミルトニアンと非平衡開量子系におけるリンドブラッド力学の関係について検討する。
この結果は、非平衡開量子系における量子ジャンプと例外点の役割の理解に寄与する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:54:45 GMT)
LiZIP: An Auto-Regressive Compression Framework for LiDAR Point Clouds [0.0] LiZIPは、ニューラルネットワークの予測符号化に基づく軽量で、ほぼロスレスなゼロドリフト圧縮フレームワークである。
コンパクトなMulti-Layer Perceptronを用いてスパース残差のみを符号化する。
様々な環境にまたがる優れた圧縮比を一貫して達成する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:03:49 GMT)
Latent Algorithmic Structure Precedes Grokking: A Mechanistic Study of ReLU MLPs on Modular Arithmetic [0.0] グロキングは、トレーニングデータが記憶された後、モジュラー2整数上のニューラルネットワークの検証精度が上昇する場所である。
その結果,ReLUは2値近傍の2乗波入力重みを学習することがわかった。
このことは、グラッキングが正しいアルゴリズムを発見するのではなく、暗記中に実質的に符号化されたアルゴリズムを研ぎ澄ますことを示唆している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:36:26 GMT)
LLM Inference at the Edge: Mobile, NPU, and GPU Performance Efficiency Trade-offs Under Sustained Load [0.0] Qwen 2.5 1.5Bを、Hairo-10H NPUを搭載したRaspberry Pi 5、Samsung Galaxy S24 Ultra、iPhone 16 Proの4つのプラットフォームでベンチマークしました。
固定された258トークンのプロンプトをデバイス毎に20以上のウォームコンディションイテレーションを使用して、スループット、レイテンシ、パワー、熱的振る舞いを測定します。
結果は、単一のモデルとプロンプト型のプラットフォームレベルのデプロイメント特性として解釈されるべきであり、ハードウェアとソフトウェアの組み合わせを反映している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:28:38 GMT)
Knot-10:A Tightness-Stratified Benchmark for Real-World Knot Classification with Topological Difficulty Analysis [0.0] 我々はKnots-10ベンチマークを導入し、配置指向の分割で1,440枚の画像で構成され、ゆるく結びついた結び目でトレーニングし、タイトな服装でテストする。
Swin-T と TransFG はどちらも平均97.2%の精度であり、PMG は94.5%であり、ジグソーシャッフルが連続性を阻害するという仮説と一致している。
分類精度を向上することなく埋め込みトポロジーアライメントを改善するTACA正則化を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:50:34 GMT)
Is AI Catching Up to Human Expression? Exploring Emotion, Personality, Authorship, and Linguistic Style in English and Arabic with Six Large Language Models [0.0] 私たちはJais、Mistral、LLaMA、GPT-4o、Gemini、DeepSeekの6つのモデルで2つのタスクを実行します。
機械分類器が、人間が書いたテキストとAI生成したテキストとを確実に区別できるかどうかを評価する。
これらの結果から,AI生成したテキストは,パラフレーズ標本の分類性能は低下するものの,人間によるテキストと区別可能であることが示された(F1>0.95)。
AI生成データによるトレーニングの強化は、アラビア人格分類タスクのパフォーマンスを高め、アンダーリソース言語における課題に対処する合成データの可能性を強調している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:17:02 GMT)
Interference-induced state engineering and Hamiltonian control for noisy collective-spin metrology [0.0] 干渉は、多体量子系における絡み合いの生成と操作の基本的なメカニズムを提供する。
我々は,局所的および集合的放射,ポンプ,デファスティングなど,現実的なマルコフ雑音下での気象特性を解析した。
その結果, 非線形力学, 絡み合い生成, メロジカル性能を結合する統一原理として干渉が確立された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:58:35 GMT)
Integrating GenAI in Filmmaking: From Co-Creativity to Distributed Creativity [0.0] Generative AIのオーディオ・ビジュアル・プロダクションへの統合は、しばしば過去の伝統から急進的なブレークとして提示される。
本稿では,創造的労働力と技術的可能性の長期的交渉において,GenAIが新たな発展をみせていることを論じる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:49:09 GMT)
Information-Geometric Quantum Process Tomography of Single Qubit Systems [0.0] 基礎となる力学によらず、正確な情報幾何学的不等式を確立する。
単一量子ビットに対して、密度行列は量子指数族に属するため、この不等式は厳密な等式に飽和することを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:59:59 GMT)
How Utilitarian Are OpenAI's Models Really? Replicating and Reinterpreting Pfeffer, Krügel, and Uhl (2025) [0.0] OpenAIの推論モデルo1-miniは、非推論モデルGPT-4oよりも実用的な応答を生成する。
私は4つの現在のOpenAIモデルで彼らの研究を再現し、すぐに変種テストで拡張します。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:52:06 GMT)
Geometry-tunable magnetic edge contrast in Bi2Te3 Corbino nanoplates [0.0] 2次元トポロジカル絶縁体は、非常に障害に耐性のあるヘリカルエッジを特徴とする。
本研究では, コービノ形状のBi2Te3ナノプレートを作製するためのTe-rod-templated Solution Growth法を開発した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:01:09 GMT)
From the AI Act to a European AI Agency: Completing the Union's Regulatory Architecture [0.0] EU AI法の採用は、この方向への重要なステップである。
本稿は、AI専門のより堅牢な超国家機関が依然として保証されているかどうかという問題を再考する。
また、強化されたEUレベルの機関は、デジタルおよび技術的主権を確保するという欧州連合の戦略的目的にも貢献するだろうと論じている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:01:23 GMT)
From Technical Debt to Cognitive and Intent Debt: Rethinking Software Health in the Age of AI [0.0] ジェネレーティブAIはソフトウェア開発を加速していますが、本当のリスクがどこにあるのかを静かにシフトするかも知れません。
AIはチームよりも早くコードを生成するため、認知的負債、チーム間での共通理解の侵食、意図的負債という、評価の低い2つの負債が蓄積されます。
この記事では、3つの相互作用する負債タイプを中心に構築されたソフトウェアの健全性を推論するトリプル負債モデルを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:25:26 GMT)
From Pixels to Semantics: A Multi-Stage AI Framework for Structural Damage Detection in Satellite Imagery [0.0] 本稿では,AIに基づく超解像,深層学習オブジェクト検出,視覚言語モデル(VLM)を統合し,建築被害の包括的評価を行う新しいフレームワークを提案する。
まず, 映像再生変換器(VRT)を用いて, 1024x1024 から 4096x4096 への高解像度化を行う。
参照不要なセマンティックアライメントのためにCLIPScoreを使用し、安全クリティカルな意思決定における個人のモデルバイアスを低減するためのマルチモデルVLM-as-a-Jury戦略を導入する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:50:41 GMT)
Foundational Study on Authorship Attribution of Japanese Web Reviews for Actor Analysis [0.0] 本研究では,脅威知能におけるアクター分析を支援するためのスタイリスティックな特徴に基づく著者属性の適用性について検討した。
ダークウェブフォーラムへの将来的な応用に向けた基礎的なステップとして,透明なWebソースからの日本語レビューデータを用いた実験を行った。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:22:47 GMT)
Fast elementwise operations on tensor trains with alternating cross interpolation [0.0] 列車(TT)は高次元データの圧縮表現であり、効率的に操作してデータの計算を行うことができる。
非線形偏微分方程式に対するTTベースの解法など、多くの応用において、最も高価なステップは、複数のTT上の要素乗算または同様の要素演算である。
我々は,エラー制御を維持しつつ,$O(3)$でそのような操作を行う交互クロス(ACI)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:23:00 GMT)
Fading ergodicity and quantum dynamics in random matrix ensembles [0.0] 近年の研究では、多体エルゴディニティ破壊のメカニズムとして、フェード・エルゴディニティが提案されている。
2つのパラダイム的ランダム行列アンサンブルが、エルゴード性破壊の同じ普遍性クラスに該当することを示す。
本研究により, 局所観測物はハイゼンベルク時間よりも短い時間スケールで, フェード・エルゴディディティ・レシエーション内で熱分解することが明らかとなった。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:04:43 GMT)
Exposure-Normalized Bed and Chair Fall Rates via Continuous AI Monitoring [0.0] この振り返りコホート研究は、連続したAIモニタリングを使用して、占有された就寝日よりも露光時間による転倒率を見積もった。
2024年8月から2025年12月まで、3,980基の監視ユニットが292,914行の時間列を提供し、1000時間当たり17.8フォール、1,000時間当たり4.3フォールを発生させた。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:20:48 GMT)
Exploring Spectral Singularities in Dirac Semimetals: The Role of Non-Hermitian Physics and Dichroism [0.0] 今回,二色性DSMが12種類のトポロジカルレーザーを発生することを初めて報告した。
本研究は, この用語のトポロジカルな役割をこれまで以上に明らかにしている。
以上の結果から,DSMの位相特性は外的影響下で安定であることが確認された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:47:03 GMT)
Explainable Threat Attribution for IoT Networks Using Conditional SHAP and Flow Behavior Modelling [0.0] この研究は、CICIoT2023データセットを使用して、IoT環境におけるマルチクラスの脅威属性を研究する。
グラデーションブースティングモデルとSHAP(SHapley Additive exPlanations)を組み合わせることで,グローバルおよびクラス固有の説明を提供する。
本研究は,より正確かつ説明可能な侵入検知システムの開発に寄与する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:55:48 GMT)
Evaluating Factor-Wise Auxiliary Dynamics Supervision for Latent Structure and Robustness in Simulated Humanoid Locomotion [0.0] DynaMITEは、因子単位の補助損失によって訓練された24d遅延剤を備えたトランスフォーマーエンコーダである。
監督された潜伏剤は、分解性または機能的に分離可能な因子構造を示す証拠を示さない。
移動実践者にとって:補助力学の監督は解釈可能な推定器を作らない。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:43:50 GMT)
Estimating Flow Velocity and Vehicle Angle-of-Attack from Non-invasive Piezoelectric Structural Measurements Using Deep Learning [0.0] 空力負荷予測,飛行制御,モデル検証には,自由流速度や攻撃角度などの空力状態変数の正確な推定が重要である。
本研究は, ピボット管などの直接流量計ではなく, 構造振動測定から車両速度とAoAを推定する非侵襲的手法を提案する。
概念実証は、ゼロと非ゼロのAoA構成、マッハ5とマッハ8条件、一定かつ連続的なトンネル操作にまたがるサンディアの超音速風洞の制御実験を通じて実証される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:58:23 GMT)
Enabling Chemically Accurate Quantum Phase Estimation in the Early Fault-Tolerant Regime [0.0] 分子電子構造の量子シミュレーションは、量子コンピューティングの最も有望な応用の1つである。
フォールトトレラント量子コンピューティング(FTQC)デバイス上の量子位相推定(QPE)は、数百万の物理量子ビットを必要とする。
本稿では,FTQC初期における化学関連分子系におけるQPEの実現可能性について検討する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:12:25 GMT)
Empirical Comparison of Agent Communication Protocols for Task Orchestration [0.0] 2つの競合する通信プロトコルが登場し、エージェントが外部ツールを呼び出す方法を標準化するツール統合プロトコルと、自律的なエージェントがタスクを発見して互いに委譲することを可能にするエージェント間デリゲートプロトコルが登場した。
この研究の目的は、ツール統合のみ、マルチエージェントデリゲート、および3つの複雑さレベルで標準化されたクエリ間のハイブリッドアーキテクチャを比較した最初の体系的なベンチマークを開発することである。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 05:50:58 GMT)
Efficient Benchmarking of AI Agents [0.0] 小型タスクサブセットがエージェントランキングを極めて低コストで維持できるかどうかを検討する。
絶対スコア予測は足場駆動の分布シフトで低下することがわかった。
本稿では,中間的履歴パス率を持つタスクに対してのみ,新しいエージェントを評価できる最適化フリープロトコルを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:17:11 GMT)
Effect of the Atomic Dipole-Dipole Interaction on the Phase Diagrams of Field-Matter Interactions [0.0] 量子相転移は原子集団のゆらぎにおいて観測可能であることを示す。
また、ゼロ光子による励起状態の集団の条件確率分布は、量子相転移の情報を伝達することを示した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:19:14 GMT)
Edge Reliability Gap in Vision-Language Models: Quantifying Failure Modes of Compressed VLMs Under Visual Corruption [0.0] エッジデプロイメントのための大規模視覚言語モデルの迅速な圧縮は、未解決の問題を引き起こす: コンパクトモデルは、単に頻繁にではなく、異なるフェールするのだろうか?
本研究では, VQAv2 および COCO キャプションから 4,000 個のサンプルに対して, 7-ビリオンパラメータ定量 VLM (Qwen2.5-VL-7B, 4-bit NF4) と500 万パラメータFP16モデル (SmolVLM2-500M) を比較した。
平均トークン確率を用いて3カテゴリーの誤り分類法(対象盲点, セマンティックドリフト, 先行バイアス)を診断の枠組みとして適用し, 信頼度校正を期待誤差(ECE)を用いて測定する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:14:40 GMT)
Dynamical Systems Theory Behind a Hierarchical Reasoning Model [0.0] 契約マッピングモデル(CMM)は、離散的推論を連続的ニューラル正規および微分方程式(NODE/NSDE)に変換する新しいアーキテクチャである。
CMMは最先端の精度93.7%に達し、27M-Extremeベンチマークと85.4%のSudooku-Extremeベンチマークを上回っている。
結果は、数学的に厳密な潜在力学が、人工推論におけるブルートフォーススケーリングを効果的に置き換えることができることを証明し、極端なパラメータ効率のための新たなフロンティアを確立する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 07:14:22 GMT)
Dynamical Evolution of Quantum Correlations and Decoherence in Coupled Oscillators Interacting with a Thermal Reservoir [0.0] 量子不協和と絡み合いは、一般に、時間とともに非単調な減少を示す。
量子不協和と絡み合いは、一般に、時間とともに非単調な減少を示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:36:48 GMT)
Deterministic quantum master equation for non-Markovian signal processing [0.0] 我々は、一般、おそらく非マルコフ的フィードバックをモデル化する決定論的マスター方程式を導出する。
本稿では、メモリフィードバックと非自明な周波数依存性を持つシステムのモデル化に、そのようなマスター方程式をどのように利用できるかを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 01:26:38 GMT)
Detection and Classification of (Pre)Cancerous Cells in Pap Smears: An Ensemble Strategy for the RIVA Cervical Cytology Challenge [0.0] 本研究は,8種類のBethesda細胞を複数クラスで検出するRIVA細胞診査(Cervical Cytology Challenge)へのアプローチを提案する。
我々は,損失再重み付け,データ再サンプリング,伝達学習という,検出性能を改善するための3つの戦略を体系的に評価した。
アンサンブルは、予備テストセットで0.201mAP50-95、最終テストセットで0.147のmAP50-95を達成し、最終テストセットで最高の個別モデルよりも29%改善されている。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 22:03:14 GMT)
DeepXplain: XAI-Guided Autonomous Defense Against Multi-Stage APT Campaigns [0.0] 本稿では,段階認識型APT防御のためのDRLフレームワークであるDeepXplainについて述べる。
DeepXplainは、プロファイランスベースのグラフ学習、時間的ステージ推定、構造的、時間的、ポリシーレベルの説明を提供する統一されたXAIパイプラインを統合する。
現実的なエンタープライズテストベッドの実験では、ステージ重み付きF1スコア(0.887から0.915)と成功率(84.7%から89.6%)の改善、説明信頼度(0.86)、改善された忠実度(0.79)、よりコンパクトな説明が示された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:02:49 GMT)
Deep Adaptive Model-Based Design of Experiments [0.0] 非線形力学系に対する実験モデルに基づく新しい設計法(MBDOE)を提案する。
我々は,実時間適用を前提として,各実験段階間のコストのかかる後部推論と設計最適化に対処する。
本研究は, モノドキネティクスを付加したフィードバッチバイオリアクター, 基質阻害が不確実なハルダンバイオリアクター, ニュアンスクリアランスパラメータを持つ2成分系薬物動態モデル, リアルタイム展開のためのDCモータを含む, 複雑さの増大する4つのシステムに対するアプローチを実証する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:20:48 GMT)
Decorrelation, Diversity, and Emergent Intelligence: The Isomorphism Between Social Insect Colonies and Ensemble Machine Learning [0.0] 社会昆虫コロニーとアンサンブル機械学習の手法は、それぞれ自然と計算における分散情報処理の最も成功した例の2つを表している。
我々は,アントコロニーの意思決定とランダムな森林学習が,テキストbfstochastic アンサンブルインテリジェンス(textbfstochastic angmble Intelligence)の共通形式の下で創発されることを実証する厳密な枠組みを開発する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:17:15 GMT)
Decoding AI Authorship: Can LLMs Truly Mimic Human Style Across Literature and Politics? [0.0] 本研究では,現在最先端の大規模言語モデル(LLM)が,著名な文学的・政治的人物の著作的署名をエミュレートする能力について検討する。
我々は、変換器に基づく分類(BERT)と解釈可能な機械学習(XGBoost)を組み合わせた補完的枠組みを用いて評価した合成コーパスを作成した。
提案手法は,AI生成テキストと人間認証テキストの相違を評価するために,言語問合せ,単語数マーカー,難易度,可読性指標を統合した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:58:09 GMT)
DariMis: Harm-Aware Modeling for Dari Misinformation Detection on YouTube [0.0] アフガニスタンの主要言語であるダリ語は、何千万人もの人々が話しているが、誤報検出の文献はほとんど欠落している。
DariMisは9,224のDari言語ビデオを手動でアノテートした最初のデータセットで、インフォメーションタイプ(誤情報、一部真、真)とハームレベル(低、中、高)の2つの次元にラベル付けしている。
本稿では,ビデオタイトルと記述を個別のBERTセグメント入力として表現し,見出しクレームと身体内容のセマンティックな関係を明示的にモデル化するペアインプット符号化手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:13:40 GMT)
DBAutoDoc: Automated Discovery and Documentation of Undocumented Database Schemas via Statistical Analysis and Iterative LLM Refinement [0.0] 膨大な数の重要なデータベースシステムには十分なドキュメントがない。
文書化されていないリレーショナルデータベーススキーマの発見とドキュメンテーションを自動化するDBAutoDocを提案する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 10:42:10 GMT)
Curriculum-Driven 3D CT Report Generation via Language-Free Visual Grafting and Zone-Constrained Compression [0.0] 胸部CTボリュームから自由テキストレポートを生成するための4段階のカリキュラム学習フレームワークであるKer-VLJEPA-3Bを提案する。
フェーズドトレーニングカリキュラムは、Llama 3.2 3Bデコーダに適応し、凍結した自己監督型エンコーダの視覚的特徴を出力する。
我々の視覚バックボーン(LeJEPA ViT-Large)は、テキスト監督なしで、ラベルなしCTの自己監督共同埋め込み予測によって訓練される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:13:30 GMT)
Contrastive Metric Learning for Point Cloud Segmentation in Highly Granular Detectors [0.0] 教師付きコントラッシブ・メトリック・ラーニング(CML)に基づくポイントクラウドセグメンテーションのための新しいクラスタリング手法を提案する。
クラスタ割り当てやオブジェクト中心変数を予測するのではなく、同じオブジェクトに属するポイントが近くに埋め込まれた潜在表現を学習する。
クラスタは、学習された計量空間における密度ベースの読み出しを用いて再構成される。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:55:36 GMT)
Charging efficiency bursts in a quantum battery with cyclic indefinite causal order [0.0] 循環不定因数順序を利用する新しい充電プロトコルを提案する。
我々は、周期的不定充電プロトコルを実装する際に、充電効率のバーストを観察する。
その結果, 理論解析および数値シミュレーションで示すように, 帯電効率バーストの存在が検証された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:44:55 GMT)
Central Dogma Transformer III: Interpretable AI Across DNA, RNA, and Protein [0.0] 本報告では,DNA,RNA,タンパク質の全中心ドグマに対して,機構指向のAIを拡張するCDT-IIIを提案する。
2段階のVirtual Cell Embedderアーキテクチャは、細胞の空間的区画化を反映している。
Alemtuzumabを近似したシリコCD52のノックダウンに応用すると、このモデルは29/29タンパク質の正確な変化を予測する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:57:23 GMT)
Causal Reconstruction of Sentiment Signals from Sparse News Data [0.0] スパースニュースに由来する感度信号は、金融分析や技術監視によく用いられる。
記事レベルスコアを正規時間グリッドに集約する3段階パイプラインを提案する。
我々は,AI関連ニュースタイトルのデータセットに対して,株価データに対する再構成信号の整合性を評価する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 09:13:33 GMT)
Cascade-Aware Multi-Agent Routing: Spatio-Temporal Sidecars and Geometry-Switching [0.0] スケジューラは負荷とフィットネスを最適化するが、木のようなグラフとサイクリックグラフで障害がどのように伝搬するかのモデルがない。
我々は、この観測可能性ギャップをオンライン幾何学制御問題として定式化する。
時空サイドカーは、どの幾何学が現在のトポロジーに適合するかを予測する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:10:58 GMT)
Canonical Byte-String Encoding for Finite-Ring Cryptosystems [0.0] リングマッピングプロトコルは、任意の暗号化ステップを開始する前に、標準的なバイト・ツー・レジデント層を必要とする。
本稿では,264 未満の長さのバイト列から modulo m の残基リストへの標準写像であるbase-m 長を示す。
エンコーダは、Dudaによって提案されたrANSベースのシステムの上に構築され、適応する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 15:58:20 GMT)
CLiGNet: Clinical Label-Interaction Graph Network for Medical Specialty Classification from Clinical Transcriptions [0.0] われわれはまず、この方法論上の欠陥を文書化し、40の専門分野にまたがるリークフリーベンチマーク(4966レコード)を確立する。
次に、Bio ClinicalBERTテキストエンコーダと2層グラフ畳み込みネットワークを組み合わせたニューラルネットワークであるCLiGNetを紹介します。
本報告では,一対の専門的混乱,希少なクラス行動,文書長効果,トークンレベルの統合的グラディエント属性を包括的に解析し,臨床NLPシステム展開に対する実用的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 03:30:06 GMT)
Breaking Hard Isomorphism Benchmarks with DRESS [0.0] $$-DRESSは構造グラフの洗練のためのフレームワークです。
$-DRESSは、グラフ指紋のDRESSファミリーのメンバーです。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 20:18:58 GMT)
Boost Like a (Var)Pro: Trust-Region Gradient Boosting via Variable Projection [0.0] textttVPBoostは、分離可能なモデルのトレーニングパラダイムである可変プロジェクションと、2階の弱い学習戦略を融合する。
VPBoostは、勾配に基づくブースティングと比較して、評価指標が改善されたアンサンブルを学習する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:01:07 GMT)
Biased Error Attribution in Multi-Agent Human-AI Systems Under Delayed Feedback [0.0] マルチエージェント型ヒューマンAIタスクにおいて、遅延結果が意思決定や責任帰属を形作るかを検討する。
非対称な反応の利得と損失を観察し, 負の結果の補正がより強くなった。
我々は,この現象を帰属バイアスの一形態として言及し,遅延フィードバック下での誤り帰属として現れる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 16:52:14 GMT)
Between Resolution Collapse and Variance Inflation: Weighted Conformal Anomaly Detection in Low-Data Regimes [0.0] 実世界のデータは、しばしば分布シフトを示し、局所的な非定常性に適応するために重み付けされた共形的アプローチを必要とする。
この適応は、到達可能な最小p値と安定性の間に重要なトレードオフをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 13:51:59 GMT)
Benchmarking Multi-Agent LLM Architectures for Financial Document Processing: A Comparative Study of Orchestration Patterns, Cost-Accuracy Tradeoffs and Production Scaling Strategies [0.0] 財務文書から構造化情報を抽出するための4つのマルチエージェントオーケストレーションアーキテクチャを比較した。
反射的アーキテクチャは、最高フィールドレベルF1(0.943)を達成するが、シーケンシャルベースラインのコストは2.3倍である。
本稿では, セマンティックキャッシング, モデルルーティング, 適応再試行戦略に関するアブレーション研究を行い, ハイブリッド構成により, 反射型アーキテクチャの精度の89%を1.15倍のコストで回収できることを実証した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 00:02:47 GMT)
Bell Experiments Revisited: A Numerical Approach Based on De Broglie--Bohm Theory [0.0] De Broglie-Bohm理論の枠組みの中で、EPR-ベル型実験の完全かつ厳密なモデルを提案する。
決定論的隠れ変数理論は、ベルの不等式違反を含む全ての量子力学的予測を再現できることを示す。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:02:12 GMT)
Behavioral Heterogeneity as Quantum-Inspired Representation [0.0] 本稿では,各ドライバを,構造的数学的特性を持つ密度行列として提示した遅延状態としてモデル化する量子インスピレーションド表現を提案する。
実験的な運転データである第3世代データについて,運転プロファイルの抽出と分析を行った。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 02:48:18 GMT)
Automatic Segmentation of 3D CT scans with SAM2 using a zero-shot approach [0.0] 本研究では,容積CTデータの自動区分けにSegment Anything Model 2 (SAM2) のゼロショット使用について検討する。
SAM2の映像ベースのメモリ機構をCTスライスを順序付きシーケンスとして扱うことで3次元データに適応させる,推論アローンのアーキテクチャおよび手続き的な修正セットを提案する。
これらの結果から, SAM2は凍結重量であっても, 推論パイプラインが慎重に構成されている場合, コヒーレントな3次元セグメンテーションを生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:10:52 GMT)
Aumann's theorem beyond ontology: quantum, postquantum, and indefinite causal order [0.0] 我々は、世界の客観的な状態を仮定することなく、オーマンの合意定理の運用版を導出する。
これにより、量子論や不明確な因果順序や仮説的な後量子現象を含む状況においても、定理の妥当性を確立することができる。
我々は、文学における一見矛盾した結果についてコメントし、定理が失敗するかもしれない一箇所を指摘する: ウィグナーの友人型状況。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 18:00:00 GMT)
Assessment Design in the AI Era: A Method for Identifying Items Functioning Differentially for Humans and Chatbots [0.0] 教育における大規模言語モデル(LLM)の急速な採用は、アセスメント設計に重大な課題をもたらす。
我々は,人間とLLMが体系的な応答差を示す項目を特定するために,統計的に原則化されたアプローチを導入する。
この方法は、差分アイテム機能解析(DIF)に基づく。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 19:39:39 GMT)
Artificial General Intelligence Forecasting and Scenario Analysis: State of the Field, Methodological Gaps, and Strategic Implications [0.0] 報告書は特定の予測やシナリオを支持していないが、深い不確実性の条件下で予測を解釈するための枠組みを提供する。
テキストの最初のドラフトは大きな言語モデル(GPT 5.1、Gemini 3 Pro、Claude 4.5 Opus)によって行われ、人間の研究者が指示、ピアレビュー、ファクトチェック、リビジョンを提供した。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 17:08:31 GMT)
Are Flat Minima an Illusion? [0.0] 実際のドライバは弱点であり、学習者の具体化言語における学習機能と互換性のある完了量の量であることを示す。
交換可能な要求の下では、弱みは最小最大値であり、PAC-Bayes境界はそれらがそれと相関しているため機能することを証明します。
予測力を持つ量とは、どれだけのデータを持っているかではなく、共同創設者であることです。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 06:14:05 GMT)
Algorithmic Administration and the EU AI Act: Legal Principles for Public Sector Use of AI [0.0] EUのAI法が行政法の基本原則とどのように相互作用するかを論じる。
ハイリスクシステムの公共セクター展開に関するAI法が課す規制義務を分析します。
公共部門におけるAIの倫理的かつ合法的な展開を保証するための安全と解釈戦略を提案している。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 08:12:05 GMT)
AgriPestDatabase-v1.0: A Structured Insect Dataset for Training Agricultural Large Language Model [0.0] 農業害虫管理は、専門家の知識へのタイムリーかつ正確なアクセスにますます依存しているが、高品質なラベル付きデータと継続的な専門家のサポートは限られている。
この研究は、(i)構造化された昆虫情報データセットを生成し、(ii)農業害虫管理に使用するエッジデバイスに微調整して軽量LLMモデルを適応させることに対処する。
専門的な組織データ、よく構造化されたQ/Aペア、セマンティックな品質管理、効率的なモデル適応を組み合わせることで、農業意思決定支援ツールに直面する農家への支援に貢献する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 04:11:27 GMT)
AgentWall: A Runtime Safety Layer for Local AI Agents [0.0] AgentWallは、ローカルAIエージェントのランタイム安全性と可観測性レイヤである。
ホスト環境に到達する前に提案されたすべてのエージェントアクションをインターセプトし、明示的な宣言的なポリシーで評価し、機密性の高い操作に対して人間の承認を必要とし、監査と再生のための完全な実行パスを記録します。
本稿では,AgentWallの設計,アーキテクチャ,脅威モデル,およびポリシーモデルについて述べる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:39:35 GMT)
ARC-AGI-3: A New Challenge for Frontier Agentic Intelligence [0.0] ARC-AGI-3は、新しい抽象的なターンベースの環境を通じてエージェントインテリジェンスを研究するためのインタラクティブなベンチマークである。
本稿では,ヒトの行動ベースラインを基盤としたベンチマーク設計,効率に基づく評価フレームワーク,環境の構築,検証,校正に使用される方法論について述べる。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 21:58:16 GMT)
AI-driven Intent-Based Networking Approach for Self-configuration of Next Generation Networks [0.0] 本稿では,自然言語に対する構造化バリデーションを用いた大規模言語モデルを用いたエンドツーエンドクローズドループISNパイプラインを提案する。
期待される結果は、実行可能な早期警告、解釈可能な説明、修正のための測定可能なリードタイムを提供する、オペレータ信頼できる自動化である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 23:11:03 GMT)
A Phase-Space Geometric Measure of Magic in Qubit Systems [0.0] 状態の離散ウィグナー関数から安定化ウィグナー関数の凸包までの l1 距離 C(rho) を導入する。
我々は、その安定化度Gamma(rho)との関係を、Kappa(rho) := (Gamma(rho)-1)/C(rho)を介して研究する。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 11:36:48 GMT)
A Comparative Study of Machine Learning Models for Hourly Forecasting of Air Temperature and Relative Humidity [0.0] 本研究は,中国重慶市の大気温度と相対湿度を予測する機械学習モデル7つを比較した。
XGBoostは、テスト平均絶対誤差(MAE)が0.302Cで、相対湿度が1.271%である。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 14:47:52 GMT)
A Bayesian Learning Approach for Drone Coverage Network: A Case Study on Cardiac Arrest in Scotland [0.0] 我々は、ドローン支援のアカッドデリバリーネットワークを設計するための信頼性インフォームドベイズ学習フレームワークを定式化した。
遠隔地における応答信頼性を向上させるため,既存のアセムインフラの網羅性を検討する。
以上の結果から,ドローン支援の黙示録配達は費用対効果が期待でき,農村部や都市部における緊急対応範囲を大幅に改善する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 24 Mar 2026 12:32:53 GMT)