AI Can Learn Scientific Taste [123.0] 偉大な科学者は、私たちが科学的な趣味と呼ぶものと密接に結びついている、強い判断と先見性を持っている。
ここでは、この用語を用いて、潜在的な影響の高い研究アイデアを判断し、提案する能力を指す。
我々の研究結果は、AIが科学的嗜好を学習できることを示し、人間レベルのAI科学者に到達するための重要なステップをマークしている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:31:51 GMT)
Show Me When and Where: Towards Referring Video Object Segmentation in the Wild [98.9] そこで本研究では,次世代RVOSに向けた新たな設定について紹介する。
我々の新しいベンチマークでは、RVOSメソッドに挑戦して、ビデオにオブジェクトが現れる場所だけでなく、いつ現れるかを示す。
われわれのYoURVOSデータセットは命令型ベンチマークを提供しており、実用化のためのRVOSメソッドの進歩を推し進める。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:30:33 GMT)
Towards One-for-All Anomaly Detection for Tabular Data [87.6] タブラル異常検出(TAD)は多くの実世界の応用において重要である。
複数のソースデータセットに対して1回のトレーニングのみを必要とするフレームワークであるOFA-TADを提案する。
14ドメインの34のデータセットに対する実験により、OFA-TADはより優れた異常検出性能が得られることが示された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:42:05 GMT)
LatSearch: Latent Reward-Guided Search for Faster Inference-Time Scaling in Video Diffusion [87.4] 本稿では,Reward-Guided Resampling and Pruningを実行する新しい推論時間探索機構を提案する。
LatSearchは、ベースラインのWan2.1モデルと比較して、複数の評価次元にわたるビデオ生成を一貫して改善する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:07:29 GMT)
OCRA: Object-Centric Learning with 3D and Tactile Priors for Human-to-Robot Action Transfer [84.2] OCRAはビデオベースのヒューマン・ロボット・アクション転送のためのフレームワークである。
人間のデモビデオから直接学習し、堅牢な操作を可能にする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:31:03 GMT)
End-to-End Spatial-Temporal Transformer for Real-time 4D HOI Reconstruction [74.3] THOは、ビデオと3Dテンプレートから、人間の動きと調整された物体の動きを前方に予測する、エンドツーエンドの空間-時間変換器である。
実験により、THOは1つの4090 GPU上で31.5 FPSの推論速度で動作し、以前の最適化ベースの手法よりも600倍のスピードアップを達成した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:21:36 GMT)
Fine-tuning MLLMs Without Forgetting Is Easier Than You Think [72.6] 分布内および分布外画像およびテキスト入力のモデル性能を評価するための2x2実験フレームワークを設計する。
その結果、トレーニング可能なパラメータの数を制限したり、低学習率を採用するなど、適切な正規化が、アウト・オブ・ディストリビューション・イメージを扱う際の忘れを効果的に防止できることが示唆された。
我々は、このことをタスク固有のオーバーフィッティングとみなし、データハイブリッドトレーニング戦略を導入することでこの問題に対処する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:16:19 GMT)
CausalEvolve: Towards Open-Ended Discovery with Causal Scratchpad [72.2] 本研究では,Large Language Models (LLMs) を利用した因果スクラッチパッドを備えたCausalEvolveを開発した。
CaulEvolveはまず、目標目標を改善するための補完的なインスピレーションを提供する結果レベルの要因を特定します。
進化の過程では、CausalEvolveは進化中の驚きのパターンを検査し、新たな要因を仮説化することで、新たな方向性を提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:53:31 GMT)
RegFormer++: An Efficient Large-Scale 3D LiDAR Point Registration Network with Projection-Aware 2D Transformer [71.6] 本稿では,大規模クラウドアライメントを実現するために,RegFormer++と呼ばれる新しいエンド・ツー・エンド差動トランスフォーマネットワークを提案する。
元の3D座標を2次元投影位置に充填するため、設計したトランスフォーマーは2次元処理における高効率と3次元幾何情報からの精度の両面から恩恵を受けることができる。
KITTI、NuScenes、Argoverseのデータセットを用いた実験により、我々のモデルは精度と効率の両面で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:03:10 GMT)
State-Dependent Safety Failures in Multi-Turn Language Model Interaction [70.5] 我々は、状態空間の観点から安全性障害を研究し、多くのマルチターン障害が構造化状態の進化から生じることを示す。
本稿では,対話履歴を状態遷移演算子として扱う状態指向診断フレームワークSTARを紹介する。
静的な評価の下で頑健なように見えるシステムは、構造化されたマルチターン相互作用の下で、迅速かつ再現可能な安全破壊を受けることができる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:13:01 GMT)
Selective Noise Suppression and Discriminative Mutual Interaction for Robust Audio-Visual Segmentation [59.1] 本稿では,SNRPモジュールとDAMF戦略を備えたSDAVSを提案する。
実験により,提案手法はベンチマークAVSデータセットの最先端性能を実現することを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:22:24 GMT)
VisionCoach: Reinforcing Grounded Video Reasoning via Visual-Perception Prompting [58.5] VisonCoach は,(1) ビデオと質問に対して適切なプロンプト型を予測する Visual Prompt Selector と,(2) 視覚的プロンプトガイダンスとオブジェクトグラウンド報酬の下で RL で最適化された Spatio-Reasoner の2つのコンポーネントから構成される。
この結果から,トレーニング中の視覚的プロンプトが映像推論を改善するのに対し,注意散布センスは推論時にプロンプトを必要とせず,この能力を実現することが示唆された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:32:02 GMT)
Excited Pfaffians: Generalized Neural Wave Functions Across Structure and State [57.7] 1つのニューラルネットワーク内で多くの状態を表すExcited Pfaffianを紹介します。
私たちは、ベリリウム原子の全ての異なるエネルギーレベルを見つけるためにニューラルネットワークを使った最初の人です。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:51:16 GMT)
S2GS: Streaming Semantic Gaussian Splatting for Online Scene Understanding and Reconstruction [57.1] Streaming Semantic Gaussian Splatting (S2GS) は厳密に因果的かつ漸進的な3D Gaussianセマンティックフィールドフレームワークである。
将来のフレームを活用せず、歴史的フレームを再処理することなく、シーンの幾何学、外観、インスタンスレベルのセマンティクスを継続的に更新する。
S2GSは、ジョイントリコンストラクションとアンダーホールドのベンチマークにおいて、強いオフラインベースラインをマッチまたは上回る。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 05:48:55 GMT)
MistExit: Learning to Exit for Early Mistake Detection in Procedural Videos [53.5] ビデオにおける早期誤り検出の課題について紹介する。
本研究の目的は,プロシージャ活動におけるキーステップが,ストリーミング映像を可能な限り少なく観察しながら正しく実行されるかどうかを判断することである。
本稿では,誤り検出と強化学習ポリシを組み合わせた手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:14:49 GMT)
M$^2$RNN: Non-Linear RNNs with Matrix-Valued States for Scalable Language Modeling [53.4] 本稿では,行列値の隠蔽状態と表現的非線形状態遷移を持つアーキテクチャであるMatrix-to-Matrix RNNを紹介する。
非線形RNNの言語モデリング性能は,その状態サイズによって制限されていることを示す。
また、状態サイズ拡大機構がテンソルコアの効率的な利用を可能にすることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:53:09 GMT)
DualTSR: Unified Dual-Diffusion Transformer for Scene Text Image Super-Resolution [53.0] Scene Text Image Super-Resolutionは、低解像度のテキスト画像における高解像度の詳細を復元することを目的としている。
しかし、既存の手法は、しばしば外部光学文字認識(OCR)モデルに依存している。
両問題に対処する統合エンドツーエンドフレームワークであるDualTSRを紹介する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:50:47 GMT)
ES-Merging: Biological MLLM Merging via Embedding Space Signals [52.8] 埋め込み空間信号からマージ係数を推定する表現対応マージフレームワークを提案する。
提案手法は既存のマージ手法よりも優れており,タスク固有の微調整モデルを超えている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:38:32 GMT)
One-Policy-Fits-All: Geometry-Aware Action Latents for Cross-Embodiment Manipulation [51.7] ロボット操作のスケーラビリティ向上には,クロス・エボディメント操作が不可欠である。
我々は,複数の実施形態をまたいだ多目的政策を学習可能なフレームワークであるOneFits-All(OPFA)を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:59:08 GMT)
MorFiC: Fixing Value Miscalibration for Zero-Shot Quadruped Transfer [50.5] 異なる形態を持つ四足歩行ロボット間で学習された移動ポリシーを一般化することは、依然として課題である。
単一共有ポリシを用いたゼロショットクロスモルフォロジーロコモーションのための強化学習手法であるMorFiCを提案する。
また,MorFiCは,形態素間の値予測誤差の分散を低減し,有利な推定値を安定化することを示した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:03:34 GMT)
AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents [50.5] 我々はAgentProcessBenchを紹介した。AgentProcessBenchは、現実的なツール拡張トラジェクトリにおけるステップレベルの有効性を評価するための最初のベンチマークである。
ベンチマークは、1,000の多様な軌跡と8,509の人間ラベル付きステップアノテーションと89.1%のアノテーション間合意で構成されている。
探索をキャプチャする3つのラベリングスキームと、ラベルのあいまいさを減らすためのエラー伝搬ルールを備えている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:13:58 GMT)
MBD: A Model-Based Debiasing Framework Across User, Content, and Model Dimensions [50.0] この課題に対処する一般モデルベースデバイアス(MBD)フレームワークを提案する。
任意のコホートに対するエンゲージメント分布の文脈平均と分散を明示的に推定する。
この統合により、フレームワークはバイアス付き生信号からバイアスなしの表現に変換することができる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:07:01 GMT)
OAHuman: Occlusion-Aware 3D Human Reconstruction from Monocular Images [49.9] OAHumanは、単一のRGB画像から堅牢な3次元モデリングのための幾何学的再構成とテクスチャ合成を明示的に分離するフレームワークである。
テクスチャ干渉から切り離すため, 閉鎖領域においても幾何再構成が知覚的に強化されることを保証する。
並行して、テクスチャ合成は目に見える領域からのみ学習され、テクスチャエラーが隠された領域に転送されるのを防ぐ。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:57:26 GMT)
Learning Image-Text Matching with Optimal Partial Transport [49.7] 視覚と言語をブリッジする基本的なタスクであるクロスモーダルマッチングは、最近、かなりの研究の関心を集めている。
本稿では,crOss-Modal sInkhorn Matchingネットワークを有効解として提案する。
我々は、Flickr30KとMS-COCOという2つのベンチマーク画像テキスト検索データセット上で、OMITを広範囲に評価する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:31:19 GMT)
Seeing Where to Deploy: Metric RGB-Based Traversability Analysis for Aerial-to-Ground Hidden Space Inspection [48.1] 本稿では,RGBを用いた幾何学的意味的再構成と,空中から地上への隠れ空間検査のためのトラベル可能性解析フレームワークを提案する。
テザリングされたUAV-UGVプラットフォームでの実験では、隠れた空間シナリオにおける信頼性の高いデプロイメントゾーンの識別が示されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:20:59 GMT)
Trust-Region Noise Search for Black-Box Alignment of Diffusion and Flow Models [47.0] 信頼領域に基づく検索アルゴリズム(TRS)は、事前訓練された生成モデルと報酬モデルをブラックボックスとして扱う。
我々は,テキスト・ツー・イメージ,分子・タンパク質設計タスクにおけるTRSを評価し,出力サンプルを著しく改善した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:37:38 GMT)
V-JEPA 2.1: Unlocking Dense Features in Video Self-Supervised Learning [46.9] V-JEPA 2.1は、画像とビデオの両方の濃密で高品質な視覚表現を学習する自己教師型モデルのファミリーである。
V-JEPA 2.1は、密集した視覚的理解と世界モデリングにおける最先端の進歩を示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:02:40 GMT)
R3DP: Real-Time 3D-Aware Policy for Embodied Manipulation [45.4] 本稿では,実時間性能を犠牲にすることなく,強力な3Dプリエントを操作ポリシーに統合するリアルタイム3D対応ポリシー(R3DP)を提案する。
R3DPは、より優れた結果を得るために、大規模な3Dプリエントを効果的に活用し、シングルビューとマルチビューDPを32.9%、平均成功率51.4%で上回っている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:30:49 GMT)
Uni-MDTrack: Learning Decoupled Memory and Dynamic States for Parameter-Efficient Visual Tracking in All Modality [44.1] メモリ・アウェア圧縮プロンプト(MCP)モジュールと動的状態融合(DSF)モジュールの2つのコアコンポーネントからなるUni-MDTrackを提案する。
MCPは、豊富なメモリ機能をメモリ対応プロンプトトークンに効果的に圧縮し、バックボーン全体の入力と深く相互作用する。
DSFはまた、浅い層から深い層へと更新された動的状態機能を導入し、高い効率を保っている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:56:41 GMT)
HomeGuard: VLM-based Embodied Safeguard for Identifying Contextual Risk in Household Task [42.7] CG-CoT(Context-Guided Chain-of-Thought)を特徴とするアーキテクチャ非依存型セーフガードを提案する。
CG-CoTは、リスクアセスメントをアクティブな知覚に分解し、相互作用対象や関連する空間近傍への注意を順次固定する。
実験により、我々のモデルであるHomeGuardは安全性を大幅に向上し、ベースモデルと比較してリスクマッチ率を30%以上改善することが示された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:09:43 GMT)
BiT-MCTS: A Theme-based Bidirectional MCTS Approach to Chinese Fiction Generation [42.4] BiT-MCTSは「クライマックスファースト、双方向拡張」戦略を運用するテーマ駆動フレームワークである。
BiT-MCTSは,強いベースラインに対して,物語のコヒーレンス,プロット構造,テーマの深さを改善する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:52:20 GMT)
Controllable Accent Normalization via Discrete Diffusion [42.3] DLM-ANは、自己教師付き音声トークン上の離散拡散に基づく制御可能なアクセント正規化システムである。
Common Token Predictorは、ネイティブ発音をエンコードする可能性のあるソーストークンを識別する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:17:25 GMT)
Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models [42.2] チェーン・オブ・シンクレット(CoT)のプロンプトは、推論を引き出すために大規模な音声言語モデル(LALM)に拡張されている。
我々は、LALM推論を改善するためのトレーニング不要アプローチとして、推論時モデルステアリングについて検討した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:12:36 GMT)
QiMeng-CodeV-SVA: Training Specialized LLMs for Hardware Assertion Generation via RTL-Grounded Bidirectional Data Synthesis [41.1] 我々は,高品質な実世界のSVAコーパスの不足と,NL-SVAセマンティック等価性を決定するための信頼性の高い手法の欠如という,2つの課題に対処するデータ合成フレームワークを提案する。
我々は,一連のSVA生成モデルであるCodeV-SVAを訓練する。特に,CodeV-SVAはNL2SVA-Humanで75.8%,NL2SVA-Machineで84.0%を達成した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:25:09 GMT)
Zoom to Essence: Trainless GUI Grounding by Inferring upon Interface Elements [40.2] マルチモーダル大言語モデル (MLLM) ベースのグラフィカルユーザインタフェース (GUI) エージェントは急速に発達する。
既存のGUIエージェントは、命令やUIインターフェースを理解する際の課題を処理するために、大規模なデータセット上でMLLMを微調整するのが一般的である。
本稿では,推論スケーリングを活用して,命令要素を段階的にアンカーする共通MLLMを,より詳細なインターフェース要素に誘導するZoomUIを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:47:47 GMT)
VLA-Thinker: Boosting Vision-Language-Action Models through Thinking-with-Image Reasoning [40.1] VLA(Vision-Language-Action)モデルは、インテリジェンスを具現化する有望な能力を示している。
動的に起動可能な推論行動として知覚をモデル化する思考とイメージの推論フレームワークであるVLA-Thinkerを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:59:51 GMT)
From Scanning Guidelines to Action: A Robotic Ultrasound Agent with LLM-Based Reasoning [40.0] ロボット超音波は、オペレータ依存の改善や縮小を含む、フリーハンドスキャンよりも利点がある。
臨床実践において、米国の買収はソノグラフィーの経験と状況判断に大きく依存している。
本研究では,自律型ロボットUSスキャンのための統合フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:18:56 GMT)
World In Your Hands: A Large-Scale and Open-Source Ecosystem for Learning Human-Centric Manipulation in the Wild [39.8] We introduced World In Your Hands (WIYH), a large-scale open-source ecosystem which are over 1,000 hours of human manipulate data collected in the-the-wild with mm-scale motion accuracy。
WIYHには,(1)正確なモーションキャプチャのための自動ラベルパイプラインを備えたウェアラブルデータ収集キットであるOracle Suite,(2)現実世界のさまざまなシナリオにおいて,数百のスキルにわたる1,000時間以上のマルチモーダル操作データを備えたWIYHデータセット,(3)知覚から行動までのタスクをサポートする広範なアノテーションとベンチマークが含まれている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 11:02:21 GMT)
OmniClone: Engineering a Robust, All-Rounder Whole-Body Humanoid Teleoperation System [39.7] 全身のヒューマノイド遠隔操作により、人間が遠隔操作でヒューマノイドロボットを操作でき、リアルタイムの操作ツールと、自律学習のためのデモを収集するためのスケーラブルなエンジンの両方を提供する。
ここでは,データ要求の少ない単一コンシューマに対して,高忠実でマルチスキルの制御を実現する,全身型ヒューマノイド遠隔操作システムであるOmniCloneを紹介する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 11:13:04 GMT)
BROTHER: Behavioral Recognition Optimized Through Heterogeneous Ensemble Regularization for Ambivalence and Hesitancy [39.4] 自然主義的なビデオ設定におけるA/H(Ambivalence and Hesitancy)は、感情コンピューティングにおいて重要な課題である。
ビデオレベルでのA/H予測のために,高度に正規化されたマルチモーダル融合パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:53:41 GMT)
Physically Accurate Rigid-Body Dynamics in Particle-Based Simulation [38.4] 粒子ベースのシミュレータは、現在のシミュレータに代わる魅力的な代替手段を提供する。
位置ベース力学(PBD)は、その計算効率と視覚的可視性で有名な解法である。
物理的に正確な剛体力学を強制する PBD-R を改訂した PBD-R を導入する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:09:42 GMT)
On the Nature of Attention Sink that Shapes Decoding Strategy in MLLMs [38.1] OutRoはシンクトークンを利用してコンテキスト表現を強化する軽量な推論時間戦略である。
実験に基づいて、OutRoは7つのビデオQAベンチマークで代表MLLMのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:05:35 GMT)
Relationship-Aware Safety Unlearning for Multimodal LLMs [36.9] マルチモーダルモデルは、特定のアクションや関係によってリンクされた場合に本質的に安全でない安全障害を示すことができる。
我々は、安全でないオブジェクト(O-ROtext)を明示的に表現するフレームワーク、関係認識型安全学習を提案する。
パラフレーズによるCLIPに基づく実験と評価,文脈的ロバスト性,アウト・オブ・ディストリビューション・イメージ・アタックを含む。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:22:26 GMT)
Not All Directions Matter: Toward Structured and Task-Aware Low-Rank Adaptation [36.5] 低ランク適応(LoRA)はパラメータ効率微調整(PEFT)の基盤となっている
我々は、原則付きデュアルコンポーネント設計により、両方の制限に対処するフレームワークであるStructLoRAを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 05:16:50 GMT)
Balancing Multimodal Domain Generalization via Gradient Modulation and Projection [36.3] マルチモーダルドメイン一般化(MMDG)は、複数のモダリティの相補的な強みを利用して、目に見えないドメインのモデル一般化を強化する。
我々はMDGのバランス最適化を促進する統一戦略であるGMP(Gradient Modulation Projection)を提案する。
GMPは最先端の性能を達成し、多様なMDDGメソッドと柔軟に統合し、複数のベンチマークでの一般化を大幅に改善する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 01:28:26 GMT)
Inclusion-of-Thoughts: Mitigating Preference Instability via Purifying the Decision Space [36.2] 大規模言語モデル(LLM)を評価するために、MCQ(Multiple-choice Question)が広く使われている。
我々は、この認知負荷を軽減するために設計されたプログレッシブな自己フィルタリング戦略であるInclusion-of-Thoughts(IoT)を提案する。
IoTは、算術、常識推論、教育ベンチマークなど、さまざまな分野において、チェーンオブ思想のパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:13:55 GMT)
Continual Few-shot Adaptation for Synthetic Fingerprint Detection [35.9] 合成された指紋画像は、生成人工知能(GenAI)の進歩によって、過去10年間で著しく増加してきた。
これにより、指紋認証システムのデータインジェクション攻撃に対する脆弱性が悪化した。
指紋画像が本物か合成されているかを検出する方法が緊急に必要である。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:06:25 GMT)
SmallSatSim: A High-Fidelity Simulation and Training Toolkit for Microgravity Robotic Close Proximity Operations [35.6] SmallSatSimは、微小重力ロボット自由飛行設定のための高忠実度シミュレーションツールキットである。
最先端のフリーフライングコントロール技術が組み込まれている。
オープンソースのツールキットは、自律的でアジャイルな小型衛星運用の研究を加速することを目的としている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:45:05 GMT)
Mitigating Overthinking in Large Reasoning Language Models via Reasoning Path Deviation Monitoring [35.6] LRLMにおける過剰思考を緩和する早期退避法を提案する。
本手法は,既存手法に比べてバニラCoTよりも高い性能向上を実現している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:00:47 GMT)
Architecting Autonomy for Safe Microgravity Free-Flyer Inspection [35.4] 小型のフリーフライング宇宙船は、ルナーゲートウェイのような将来の軌道前進基地の検査や修理のような重要な船外活動(EVA)サービスを提供することができる。
これらの宇宙船は、フリー・フライア・インスペクション・ミッションが提供しなければならない自律性を記述するために形式化を必要とする。
この研究は、このクラスのフリーフライアに対する一般的なミッション要件を、自律アーキテクチャの計画と制御のための具体的な決定のセットに変換することを検討する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:03:04 GMT)
Domain-Skewed Federated Learning with Feature Decoupling and Calibration [35.1] フェデレートラーニング(FL)は、分散クライアントがプライバシー保護の方法でグローバルモデルを協調的にトレーニングすることを可能にする。
ドメインスキュー(Domain skew)は、多様なドメインから派生したクライアントのデータが、一貫した表現空間を学習することから集約されたグローバルモデルを妨げる可能性がある。
我々は、ドメイン固有のバイアスのある特徴を校正することで、貴重なクラス関連情報を解放するFederated Feature Decoupling andrimi(F2$DC)を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:20:22 GMT)
CamLit: Unified Video Diffusion with Explicit Camera and Lighting Control [34.4] CamLitは、新しいビュー合成(NVS)を共同で実行し、単一の入力画像からリライトする最初の統合ビデオ拡散モデルである。
一つの生成モデルが、カメラと照明制御を効果的に統合し、ビデオ生成パイプラインを簡素化できることが示される。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:28:46 GMT)
The Voice Behind the Words: Quantifying Intersectional Bias in SpeechLLMs [34.4] 音声大言語モデル(SpeechLLMs)は音声入力を直接処理し、アクセントや知覚性などの手がかりを保持する。
我々は,2,880の対話を用いた3つのSpeechLLMにおけるアクセントと性差の大規模交叉評価を行った。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:54:36 GMT)
Direct Object-Level Reconstruction via Probabilistic Gaussian Splatting [33.1] 2次元ガウススプラッティングに基づく効率的な1オブジェクト3D再構成法を提案する。
本手法はマスク誤差の存在下では強力な自己補正能力を示し,標準的な3DGS手法に匹敵する再現性を実現する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:17:14 GMT)
HandelBot: Real-World Piano Playing via Fast Adaptation of Dexterous Robot Policies [32.8] HandelBotは、シミュレーションポリシと、2段階のパイプラインによる迅速な適応を組み合わせたフレームワークである。
我々はHandelBotが正確にバイマニュアルピアノを演奏できることを実証した。
本システムでは, 直接シミュレーションの展開を1.8倍に向上させ, 30分間の物理的相互作用データを必要とする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:16:45 GMT)
Fundamental Limits of CSI Compression in FDD Massive MIMO [32.3] 状態推論と状態適応型TCを組み合わせた実用的なCSIフィードバックアーキテクチャを提案する。
鍵となる構造的結果は、全ての混合成分をまたいだ最適なビット割り当てが、単一の大域的な逆給水レベルによって制御されることである。
その結果,大容量のニューラルエンコーダを使わずに準最適CSI圧縮を状態適応TCにより達成できることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 11:03:22 GMT)
FIND: A Simple yet Effective Baseline for Diffusion-Generated Image Detection [32.1] 実際の画像は合成画像よりもガウス分布に適合することが難しい。
本稿では,単純なバイナリ分類器のみを必要とする新しい手法であるFIND(Forgery Identification via Noise disturbance)を提案する。
FINDはGenImageベンチマークで11.7%向上し、既存のメソッドよりも126倍高速である。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:49:30 GMT)
WestWorld: A Knowledge-Encoded Scalable Trajectory World Model for Diverse Robotic Systems [30.5] 軌道世界モデルは、ロボット力学の学習、計画、制御において重要な役割を果たす。
多様なロボットシステムのためのknoWledge-Encoded Scalable Trajectory WorldモデルであるWestWorldを紹介する。
WestWorldは、ゼロおよび少数ショットの軌道予測において、競争ベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:12:43 GMT)
Deconfounded Lifelong Learning for Autonomous Driving via Dynamic Knowledge Spaces [30.2] 本稿では,Dirichlet Process Mixed Model(DPMM)と正面調整機構を因果推論から統合したDecon founded Lifelong Learningフレームワークを提案する。
我々のフレームワークは、クラスタ数を事前に定義することなく、適応的な拡張とインクリメンタルな知識更新を可能にします。
E2E-ADの生涯学習性能を評価するため,Bench2Driveに基づく新しい評価プロトコルとメトリクスを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:45:17 GMT)
Beyond Distance: Quantifying Point Cloud Dynamics with Persistent Homology and Dynamic Optimal Transport [30.0] 本稿では,最近提案されたトポロジカル・オプティカル・トランスポート(TpOT)距離を拡張して,時間進化点雲のトポロジカル・ティッピングを解析するためのフレームワークを提案する。
この制限を克服するために、新しいトポロジとハイパーグラフ再構成戦略によって駆動される階層的動的評価フレームワークを提案する。
この測地線とともに、グローバルシフトを捉えるためのマクロメトリクス(トポロジカル歪みとパーシスタンスエントロピー)と、高感度で非同期な局所的な変更を検出するための新しいメソスコピック双対パースペクティブハイパーグラフエントロピーを導入する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:56:56 GMT)
ZOTTA: Test-Time Adaptation with Gradient-Free Zeroth-Order Optimization [29.7] テストタイム適応は、分散シフトの下でモデルの堅牢性を改善することを目的としている。
既存の手法の多くはバックプロパゲーション(BP)に依存しており、計算コストが高く、微分不可能なモデルと互換性がない。
完全BPフリーなTTAフレームワークであるZOTTAを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:21:01 GMT)
A Single-Sample Polylogarithmic Regret Bound for Nonstationary Online Linear Programming [29.5] 非定常オンライン線形計画法(OLP)について検討する。
OLPでは、$n$の注文は、独立だが必ずしも同一に分散されたランダムベクトルの列を形成する報酬と資源の消費のペアと共に順次届く。
本稿では,動的プログラミングの観点を,従来の静止環境において採用されていたデュアルベースフレームワークと統合した新しい再解法を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:59:30 GMT)
RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks [28.8] データ収集、ポリシー学習、タスク実行を単一のVLM駆動コントローラで統合するエージェントロボットフレームワークであるRoboClawを提案する。
ポリシーレベルでは、RoboClaw氏はEntangled Action Pairs(EAP)を紹介している。
デプロイ中、同じエージェントが高レベルの推論を行い、学習されたポリシープリミティブを動的にオーケストレーションして長期のタスクを遂行する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:15:01 GMT)
Enhancing LLM Training via Spectral Clipping [28.3] SPECTRAは、スペクトル-ノルム制約を強制する更新のスペクトル後クリッピングのためのフレームワークである。
我々は、SPECTRAがAdamW、Signum、AdEMAMixなどの様々なバリデーションの損失を均一に改善することを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:16:40 GMT)
Walking Further: Semantic-aware Multimodal Gait Recognition Under Long-Range Conditions [27.6] We present textbfLRGait, the first LiDAR-Camera multimodal benchmark for robust long-range gait recognition。
また,長距離マルチモーダル歩行認識に適したエンドツーエンドフレームワークである textbfEMGaitNet を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:32:27 GMT)
High-Probability Bounds for SGD under the Polyak-Lojasiewicz Condition with Markovian Noise [27.4] PL条件下でのSGDの1次均一時間高確率結合について検討し, 勾配雑音はマルコフ差成分とマルティンゲール差成分の両方を含むことを示した。
これはPL条件が多くの機械学習モデルやディープラーニングモデルで生じるため、有限時間保証の範囲を大幅に広げる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:50:03 GMT)
ASAP: Attention-Shift-Aware Pruning for Efficient LVLM Inference [26.7] 本稿では,新しいトレーニングフリーなKVキャッシュ対応プルーニングレシピであるASAPを提案する。
ダイナミックな双方向ソフトアテンションマスクを利用することで、アテンションシフトを緩和する。
また、トークンセット内の高い意味的冗長性は性能を低下させると仮定する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:51:31 GMT)
EviATTA: Evidential Active Test-Time Adaptation for Medical Segment Anything Models [26.6] Evidential Active Test-Time Adaptation (EviATTA, Evidential Active Test-Time Adaptation) を提案する。
具体的には,ディリクレに基づくエビデンシャル・モデリングを用いて,分布の不確実性とデータの不確実性に全体的予測の不確実性を分解する。
EviATTAはバッチワイドとインスタンスワイドの両方のテスト時間適応設定の下で,最小限のエキスパートフィードバックで適応信頼性を継続的に向上することを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:46:31 GMT)
Early Failure Detection and Intervention in Video Diffusion Models [26.5] 遅延T2V拡散モデルに対する早期故障検出と診断介入パイプラインを提案する。
検出のために,リアルタイム検査(RI)モジュールを設計し,ラテントを中間映像プレビューに変換する。
CogVideoX-5BとWan2.1-1.3Bの実験では、VBenchでは最大2.64倍の時間オーバーヘッドで一貫性が向上した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:32:41 GMT)
Seamless Deception: Larger Language Models Are Better Knowledge Concealers [26.4] 言語モデル(LM)は有害な知識を取得し、監査中はこれらのトピックを無視することができる。
近年, 誤認関連行動パターンの発見に触発されて, LMが知識を積極的に隠蔽していることを検知する分類器を訓練することを目指している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:55:21 GMT)
BluRef: Unsupervised Image Deblurring with Dense-Matching References [26.3] 本稿では,画像の劣化に対する教師なしの新たなアプローチを提案する。
類似シーンのぼやけた鮮明な画像を使って、擬似的な地上真実データを生成する。
トレーニングデータ収集プロセスの単純さのため,既存のペアトレーニングデータや事前トレーニングネットワークに依存しない。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 01:31:31 GMT)
Evidential Domain Adaptation for Remaining Useful Life Prediction with Incomplete Degradation [25.7] ドメイン適応(DA)は、正確な残留有用生命(RUL)予測に対処するために広く採用されている。
その成功にもかかわらず、既存のDAメソッドは、対象ドメインで不完全な劣化軌跡に直面したときに苦労する。
本稿では,エビアダプティブ(EviAdapt,EviAdapt,EviAdapt,EviAdapt,EviAdapt,EviAdapt,EviAdapt,EviAdapt,EviAdapt,EviAdapt,EviAdapt, EviAdapt,EviAdapt,EviAdapt,Evi
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:57:39 GMT)
Representation Alignment for Just Image Transformers is not Easier than You Think [25.7] Representation Alignment (REPA) は、潜時空間における拡散変換器の訓練を加速する簡単な方法として登場した。
本稿では、Just Image Transformers (JiT) に対してREPAがフェール可能であることを示す。
我々は,Masked Transformer Adapter を用いてアライメントターゲットと制約アライメントを変換する PixelREPA を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:08:31 GMT)
Joint Segmentation and Grading with Iterative Optimization for Multimodal Glaucoma Diagnosis [24.9] 共同セグメント化とグレーディングのための反復的マルチモーダル最適化モデル(IMO)を提案する。
本手法はマルチモーダルな特徴を効果的に統合し,緑内障評価に対する包括的かつ臨床的に重要なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:25:24 GMT)
Unlocking the Latent Canvas: Eliciting and Benchmarking Symbolic Visual Expression in LLMs [24.7] 現在のアプローチでは、画像生成を外部プロセスとして扱い、ピクセルレンダリングやコード実行に依存している。
この作業では、コンパクトで効率的でテキストネイティブな視覚フォーマットであるASCIIアートを通じて、この可能性を解き放つ。
SVE-ASCIIは、純粋テキスト空間内で直接Visual Expressionを抽出し、ベンチマークするために設計された統合フレームワークである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:38:10 GMT)
FOCUS: Bridging Fine-Grained Recognition and Open-World Discovery across Domains [23.5] Fine-Grained Domain-Generalized Generalized Category Discovery (FG-DG-GCD) のための最初の統合フレームワークを紹介する。
FG-GCDはラベル付きソースデータからのみ学習し、既知のクラスを認識し、未知の未ラベルのターゲットドメインで新しいクラスを発見する必要がある。
本稿では,不確実性を考慮した特徴正規化のための機能拡張* (UFA) と幾何安定部分推論のための *Domain-Consistent Parts Discovery* (DCPD) を併用した単一ステージフレームワークFoCUSを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:25:18 GMT)
On the (Generative) Linear Sketching Problem [23.4] FLOREは、全ての世界のベストを達成するためにこれらの分析を取り入れた、新しい生成的スケッチフレームワークである。
総合的な評価では、FLOREが高品質なリカバリを提供する能力を示し、計算オーバーヘッドの少ないサマリをサポートする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:39:58 GMT)
Navigation beyond Wayfinding: Robots Collaborating with Visually Impaired Users for Environmental Interactions [23.1] 我々は,ロボットガイド犬の精密なセンシングと位置決め機能と,物理的な操作を行うユーザの能力を組み合わせた,協調的な人間ロボットアプローチを提案する。
評価の結果,従来の白杖や非適応案内システムよりも安全でスムーズで効率の良いナビゲーションが可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:21:46 GMT)
GoldenStart: Q-Guided Priors and Entropy Control for Distilling Flow Policies [22.8] フローマッチング政策は強化学習(RL)を大いに約束する
彼らの実践的応用は、しばしば禁止的な遅延推論と効果の低いオンライン探索によって妨げられる。
我々は,Q誘導前処理と明示的エントロピー制御を備えた政策蒸留法であるGoldenStart(GSFlow)を提案する。
統合されたフレームワークは、生成開始点を設計し、ポリシーエントロピーを明示的に制御することにより、効率的かつ探索的なポリシーを達成できることを実証する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:39:09 GMT)
Tactile Modality Fusion for Vision-Language-Action Models [22.8] 本稿では,視覚触覚信号と視覚言語アクション(VLA)モデルを統合する軽量なモーダルフュージョンアプローチであるTacFiLMを提案する。
その結果, 成功率, 直接挿入性能, 完了時間, 負荷安定性の両面において一貫した改善が見られた。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:57:51 GMT)
eNavi: Event-based Imitation Policies for Low-Light Indoor Mobile Robot Navigation [22.3] 本稿では,TurtleBot 2ロボットを用いて収集した屋内人物追跡データセットについて紹介する。
イベントとRGB観測を時間的に整合させるマルチモーダルデータ前処理パイプラインを構築します。
本稿では,デュアルMobileNetエンコーダとトランスフォーマーベース融合モジュールを併用した遅延融合RGBイベントナビゲーションポリシーを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:25:40 GMT)
AgroNVILA: Perception-Reasoning Decoupling for Multi-view Agricultural Multimodal Large Language Models [22.2] 農業マルチモーダル推論は、様々なスケールにわたる堅牢な空間的理解を必要とする。
既存のMulti-modal Large Language Models (MLLM) は「地球中心」のバイアスに悩まされている。
現代精密農業における多様な空間的トポロジと規模を捉えた多視点学習コーパスであるAgro Omniを紹介する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:24:03 GMT)
Learning to Order: Task Sequencing as In-Context Optimization [22.0] 深層ニューラルネットワークは、合成されたTS問題に先立って無限にメタ学習し、数ショットの一般化を実現することができることを示す。
大規模な実験では、メタ学習モデルが非メタ学習ベースラインよりもはるかに高速に最適なタスクシーケンスを発見できるという経験的証拠が得られた。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:56:54 GMT)
Data Darwinism Part II: DataEvolve -- AI can Autonomously Evolve Pretraining Data Curation [21.9] 我々は,手作業による設計よりも反復的な最適化を通じて戦略の進化を可能にするフレームワークであるDataEvolveを紹介した。
データカテゴリごとに、DataEvolveはクローズドな進化ループで動作し、品質問題を特定し、候補戦略を生成し、サンプルデータ上でそれらを実行し、結果を評価し、世代にわたってアプローチを洗練する。
Nemotron-CCから672Bトークンにまたがる8つのカテゴリに適用して、DataEvolveは、504BのデータセットであるDarwin-CCを生成する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:05:00 GMT)
A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic [21.4] アーティキュレート・メディカル・インテリジェンス・エクスプローラー(AMIE)
100人の成人患者が任命の5日前にAMIEテキストチャットのやりとりを完了した。
ヒューマン・セーフティ・スーパーバイザーは、患者とAMIEのインタラクションをリアルタイムで監視した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:38:14 GMT)
Spectrum Matching: a Unified Perspective for Superior Diffusability in Latent Diffusion [20.7] MSEの目的によって訓練された画素空間拡散は、本質的に低周波と中周波の学習に偏っていることを示す。
この結果から,emphSpectrum Matching hypothesisを提案する。
スペクトルマッチングは,CelebA と ImageNet のデータセット上での拡散生成に優れることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:47:43 GMT)
MorphSNN: Adaptive Graph Diffusion and Structural Plasticity for Spiking Neural Networks [20.2] スパイキングニューラルネットワーク(SNN)は現在、重大なボトルネックに直面している。
個々のニューロンは動的生物学的性質を示すが、マクロな構造は従来の接続パターンに限られている。
生体内非シナプス拡散と構造塑性にインスパイアされたバックボーンフレームワークであるMorphSNNを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:52:57 GMT)
AerialVLA: A Vision-Language-Action Model for UAV Navigation via Minimalist End-to-End Control [20.2] 無人航空機(UAV)のための視覚言語ナビゲーション(VLN)は複雑な視覚的解釈と3D環境の連続的な制御を必要とする。
AerialVLAは、生の視覚観察とファジィ言語指示を直接連続的な物理制御信号にマッピングする、最小限のエンドツーエンドビジョン・ランゲージ・アクション・フレームワークである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:02:13 GMT)
An Industrial-Scale Insurance LLM Achieving Verifiable Domain Mastery and Hallucination Control without Competence Trade-offs [20.2] INS-S1は、新しいエンドツーエンドアライメントパラダイムによってトレーニングされた保険特有なLarge Language Modelsファミリーである。
INS-S1はドメインタスクでのSOTAパフォーマンスを実現し、DeepSeek-R1とGemini-2.5-Proを大きく上回っている。
本結果は,汎用知能を損なうことなく,厳密な領域の特殊化を実現することができることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:13:37 GMT)
Disentangling Tensor Network States with Deep Neural Network [20.1] 本稿では、ディープニューラルネットワークとテンソルネットワークアーキテクチャを統合する可変波動関数アンサッツを提案する。
$TNSフレームワークでは、ニューラルネットワークは波動関数のアンタングルとして機能し、物理的自由度をはるかに少ないエンタングルメントで再正規化変数に変換する。
この構成により、強い相関の量子状態のコンパクトで高表現力の表現が得られる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:09:00 GMT)
Interp3R: Continuous-time 3D Geometry Estimation with Frames and Events [19.9] Interp3Rを導入し、任意のタイミングで奥行きとカメラのポーズを推定するために、ポイントマップベースのモデルを強化する。
我々は、Interp3Rを合成データセットにのみトレーニングするが、広範囲の合成および実世界のベンチマークで強力な一般化を実証する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:10:05 GMT)
Load-Aware Locomotion Control for Humanoid Robots in Industrial Transportation Tasks [19.6] 本稿では、疎結合で協調的なロコ操作アーキテクチャに基づく産業用ヒューマノイドの負荷対応ロコモーションフレームワークを提案する。
下半身移動は、運動学的に派生した名目構成に残留的な関節動作を生じる強化学習ポリシーを介して制御される。
このフレームワークは完全にシミュレーションで訓練され、微調整なしでフルサイズのヒューマノイドロボットにデプロイされる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:57:32 GMT)
Multi-Period Texture Contrast Enhancement for Low-Contrast Wafer Defect Detection and Segmentation [19.2] TexWDSは、マルチスケールの機能保持と周波数領域モデリングを調和させるテクスチャ対応フレームワークである。
周波数領域におけるテクスチャの破壊をモデル化することにより、MPTCEは構造化背景から非周期的異常を明示的に分離する。
TexWDSは新たな最先端を実現し、mAP50-95では8.3%、リコールでは7.7%を上回り、偽陽性率は約8.6%減少する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:35:49 GMT)
G-ZAP: A Generalizable Zero-Shot Framework for Arbitrary-Scale Pansharpening [18.8] 任意のスケールのパンシャーピングのための一般化可能なゼロショットフレームワークを提案する。
G-ZAPはクロスレゾリューション、クロスシーン、クロスセンサーの一般化を扱う。
Pan-scale fusion の下で、視覚的品質と定量的メトリクスの両面で、最先端の結果を達成する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:55:46 GMT)
UniFusion: A Unified Image Fusion Framework with Robust Representation and Source-Aware Preservation [18.4] We propose UniFusion, a unified image fusion framework to achieve cross-task generalization。
融合出力と入力の整合性を維持するために再構成調整損失を導入する。
複数の融合タスクにわたる実験は、UniFusionの優れた視覚的品質、一般化能力、現実のシナリオへの適応性を示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:07:06 GMT)
The Pulse of Motion: Measuring Physical Frame Rate from Visual Dynamics [18.3] 入力ビデオの視覚力学から秒間物理フレームを直接復元する予測器であるビジュアルクロノメーターを提案する。
我々の評価では、最先端のビデオジェネレータが深刻なPhyFPSのミスアライメントと時間的不安定に悩まされているという厳しい現実が明らかになっている。
PhyFPS補正を適用することで、AI生成ビデオの人間の知覚する自然さが大幅に向上する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:29:31 GMT)
Creative Convergence or Imitation? Genre-Specific Homogeneity in LLM-Generated Chinese Literature [18.0] 本稿では,Proppian narratologyとナラトロジー関数を取り入れた分析のための新しい理論フレームワークを提案する。
我々はProppの物語理論を拡張し、現代のウェブ物語構造に適した34の物語機能を定義した。
実験の結果、生成したテキストにおける特異な物語論理と厳密な同質化の主な理由は、現在のLLMが物語関数の意味を正しく理解できないことであることがわかった。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:15:48 GMT)
LoCAtion: Long-time Collaborative Attention Framework for High Dynamic Range Video Reconstruction [17.9] 本稿では,脆弱な空間ワープタスクからHDR映像を生成するフレームワークであるLoCAtionを,頑健でアライメントのない協調的特徴ルーティング問題に再構成する。
Locationは最先端の視覚的品質と時間的安定性を実現し、精度と計算効率の非常に競争力のあるバランスを提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:34:46 GMT)
Refining 3D Medical Segmentation with Verbal Instruction [17.8] 本稿では, 3次元形状をベクトル集合として表現し, 対象形状を段階的に更新する反復改良モデルを提案する。
実験結果から,提案手法は劣化した入力と競合するベースラインに対して,大幅な改善を達成できることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:25:34 GMT)
Refold: Refining Protein Inverse Folding with Efficient Structural Matching and Fusion [17.5] 逆フォールディングは、特定のバックボーン構造に折り畳むアミノ酸配列を設計することを目的としている。
データベースに基づく構造的事前の強みとディープラーニング予測を統合した,新たなフレームワークであるRefoldを紹介する。
我々はRefoldが標準ベンチマークで0.63の最先端のネイティブシークエンスリカバリを実現することを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:36:18 GMT)
Emergent giant topological Hall effect in twisted Fe3GeTe2 metallic system [17.2] ねじれたFe3GeTe2金属系における創発的巨大トポロジカルホール効果の発見を報告する。
この効果は、0.45から0.75までの「魔法の」ねじれ角の狭い窓にのみ現れるが、その範囲の外側には全く存在しない。
マイクロ磁気シミュレーションにより、このトポロジカルホール効果は、平面内と層対のジアラロシンスキイ-モリヤ相互作用の交互に誘起されるスカイミオン格子に由来することが判明した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:01:37 GMT)
Exposing Long-Tail Safety Failures in Large Language Models through Efficient Diverse Response Sampling [16.9] 本研究は, 各種応答生成(アウトプット空間探索)によって安全障害を系統的に暴露し, 固定された安全クリティカルプロンプトを提案する。
本稿では,トークンレベルのサンプリングと多様性を意識した選択を組み合わせたプログレッシブ・ディバース・ポピュレーション・サンプリングを提案する。
大規模IIDサンプリングに匹敵する攻撃成功率を実現し、計算コストの8%から29%しか使用していない。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:45:29 GMT)
Argumentation for Explainable and Globally Contestable Decision Support with LLMs [16.8] ArgEvalは、インスタンス固有の推論から一般的な決定オプションの構造化評価に移行するフレームワークである。
これらのフレームワークは、グローバルな競争性をサポートしながら、特定のケースについて説明可能なレコメンデーションを提供する。
本稿では,ArgEvalが臨床実践に合わせて説明可能なガイダンスを作成できることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:37:14 GMT)
Top-b: Entropic Regulation of Relative Probability Bands in Autoregressive Language Processes [16.6] Top-bは、動的帯域幅係数によって候補セットを制御するデコード戦略である。
また,Top-bは競合推論精度を維持しつつ,生成エントロピーと復号間分散を著しく低減することを示した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:39:51 GMT)
Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness [16.5] 視覚変換器(ViT)は、しばしば急激な相関に依存するため、分布シフトによって劣化する。
概念レベルのセマンティクスに対する推論をモデル化する,新たなファインタニングフレームワークを提案する。
提案手法は,複数のViTモデル間のロバスト性を向上する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 05:03:19 GMT)
How Do Medical MLLMs Fail? A Study on Visual Grounding in Medical Images [16.4] MLLM(Generalist Multimodal Large Language Model)は、様々な視覚言語タスクにおいて、優れたパフォーマンスを実現している。
しかし、特に一般化が重要となるゼロショット環境での医療タスクにおけるパフォーマンスは、依然として最適以下である。
本稿では,最先端医療MLLMの視覚的基盤機能に関する先駆的な研究について述べる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:46:27 GMT)
DiFlowDubber: Discrete Flow Matching for Automated Video Dubbing via Cross-Modal Alignment and Synchronization [16.2] ビデオダビングは、映画製作、マルチメディア制作、補助音声技術に広く応用されている。
既存のアプローチでは、限られたダビングデータセットを直接トレーニングするか、事前トレーニングされたテキスト音声(TTS)モデルに適応する2段階のパイプラインを採用する。
本稿では,事前学習したTSモデルからビデオ駆動ダビングへの知識伝達を効果的に行う,新しい2段階トレーニングフレームワークであるDiFlowDubberを提案する。
2つの主要なベンチマークデータセットの実験では、DiFlowDubberは、複数のメトリクスで過去のメソッドより優れていることが示されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:53:23 GMT)
Deeper Thought, Weaker Aim: Understanding and Mitigating Perceptual Impairment during Reasoning in Multimodal Large Language Models [15.9] MLLM(Multimodal large language model)はしばしば、拡張推論モードの下で知覚障害に悩まされる。
多段階の推論において、モデルの視覚的注意が散らばり、疑問関連領域から遠ざかって、視覚的入力に効果的に焦点をあてる。
本研究では,エントロピー・フォーカス基準に基づいて視覚的頭部を選択する学習自由な視覚領域誘導注意(VRGA)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:21:05 GMT)
AvatarForcing: One-Step Streaming Talking Avatars via Local-Future Sliding-Window Denoising [15.8] AvatarForcingは、一段階のストリーミング拡散フレームワークで、不均一なノイズレベルを持つ固定されたローカルフューチャーウィンドウを識別する。
標準ベンチマークと400ビデオのロングフォームベンチマークの実験では、強い視覚的品質と34ms/frameでの唇の同期が示されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 11:42:07 GMT)
MedPriv-Bench: Benchmarking the Privacy-Utility Trade-off of Large Language Models in Medical Open-End Question Answering [15.5] オープンエンド質問応答におけるプライバシ臨床的有用性を評価するために設計された最初のベンチマークであるMed-Benchを紹介する。
われわれのフレームワークは、マルチエージェントのヒューマン・イン・ザ・ループパイプラインを使用して、繊細な医療状況と、リアルなプライバシー圧力を生み出す臨床的に関連するクエリを合成する。
本研究は,プライバシに敏感な環境下での医療AIシステムの安全性と有効性を評価するための,ドメイン固有のベンチマークの必要性を明らかにするものである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:47:35 GMT)
Interleaved Resampling and Refitting: Data and Compute-Efficient Evaluation of Black-Box Predictors [15.4] 本研究では,2乗損失下での大規模実証的リスク最小化の余剰リスクを評価することの課題について検討する。
トレーニングアルゴリズムへのブラックボックスアクセスのみを仮定し、過剰リスクを推定するための効率的な手順を開発する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:41:20 GMT)
MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices? [15.4] 大規模言語モデル(LLM)は、コード生成において顕著な能力を示してきたが、モバイルデバイス専用のカーネルを生成する可能性はほとんど調査されていない。
リポジトリ認識推論と計画・実行パラダイムを備えたマルチエージェントシステムであるMobile Kernel Agent (MoKA)を提案する。
MoKAは最先端のパフォーマンスを実現し、コンパイル成功率は93.7%に向上し、生成されたカーネルの27.4%がネイティブライブラリ上で測定可能なスピードアップを実現している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:45:48 GMT)
OxyGen: Unified KV Cache Management for Vision-Language-Action Models under Multi-Task Parallelism [15.3] 我々は,KVキャッシュをタスクや時間とともに共有する第1級のリソースとして扱う推論パラダイムであるKVキャッシュ管理を統一的に提案する。
OxyGenは、孤立実行よりも最大3.7$timesのスピードアップを実現し、200トークン/秒の言語スループットと70Hzのアクション周波数をアクション品質の劣化なしに同時に提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:23:56 GMT)
GenState-AI: State-Aware Dataset for Text-to-Video Retrieval on AI-Generated Videos [15.0] 既存のテキストとビデオの検索ベンチマークは、現実世界の映像に支配されている。
我々は制御状態遷移を中心としたAI生成ベンチマークであるGenState-AIを紹介する。
位置,量,対象関係の正確な変化に依存した短いクリップを生成する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:09:57 GMT)
Motivation in Large Language Models [15.0] モチベーションは人間の行動の中心的な要因であり、意思決定、ゴール、タスクパフォーマンスを形作る。
大規模言語モデル(LLM)が人間の嗜好に適合するようになるにつれて、モチベーションに類似するものが現れるかどうかを問う。
私たちの実験では、人間の心理学を反映する一貫性のある、構造的なパターンが明らかになりました。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:30:36 GMT)
Why Do LLM-based Web Agents Fail? A Hierarchical Planning Perspective [15.0] 大規模言語モデル(LLM)ウェブエージェントは、Webナビゲーションにますます使われているが、現実的で長期のタスクに対する人間の信頼性には程遠い。
3層にわたるWebエージェント(ハイレベルプランニング、低レベル実行、リプランニング)を分析する階層的プランニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:52:06 GMT)
SemantiCache: Efficient KV Cache Compression via Semantic Chunking and Clustered Merging [14.8] SemantiCacheはセマンティックな整合性を維持する新しい圧縮フレームワークである。
まず、キャッシュを意味的に一貫性のあるチャンクに分割します。
各チャンク内には,トークンをセマンティッククラスタにグループ化するGreedy Seed-Based Clustering (GSC)アルゴリズムが導入されている。
これらのクラスタはさらにセマンティックコアにマージされ、Proportional Attentionメカニズムによって強化される。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:36:25 GMT)
Rigorous Asymptotics for First-Order Algorithms Through the Dynamical Cavity Method [14.7] 本稿では, 動的空洞法を定式化し, 一般一階法におけるDMFT方程式の新たな証明を与える。
DMFTは、ある種の無秩序な系におけるマクロ可観測物の力学を記述している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:51:41 GMT)
Artificial intelligence-enabled single-lead ECG for non-invasive hyperkalemia detection: development, multicenter validation, and proof-of-concept deployment [14.7] 高カルシウム血症(Hyperkalemia)は、慢性腎臓病や心不全の患者によく見られる、生命を脅かす電解質障害である。
非侵襲性高カルシウム血症スクリーニングとハンドヘルドデプロイメントのためのシングルリードAI-ECGシステムであるPocket-Kを開発した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 01:51:01 GMT)
Mapping Dark-Matter Clusters via Physics-Guided Diffusion Models [14.6] 銀河団は重力レンズによる天体物理学と宇宙論の強力なプローブである。
光度測定と重力レンズ観測からクラスター表面の質量密度を再構築する完全自動手法を提案する。
提案手法では,専門家によるチューニングを必要とせず,時間ではなく数分で実行し,精度を向上し,MACS 1206クラスタの熟練した再構築と一致させる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:36:56 GMT)
SensorPersona: An LLM-Empowered System for Continual Persona Extraction from Longitudinal Mobile Sensor Streams [14.4] SensorPersonaは,ユーザのモバイルデバイスから収集された縦長のセンサストリームから,安定したユーザペルソナを継続的に推論する。
ペルソナ抽出では最大31.4%のリコール、ペルソナ対応エージェントの反応では85.7%の勝利率、ユーザの満足度向上を実現している。
SensorPersonaは、20の参加者から1,580時間のセンサデータを収集し、3大陸17都市で最大3ヶ月にわたって収集した自己収集データセットで評価した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:21:21 GMT)
Localizing and Editing Knowledge in Large Audio-Language Models [14.3] LALM(Large Audio-Language Models)は、音声理解において高い性能を示し、事実情報にアクセスするための自然なインタフェースとなっている。
既存のモデル編集手法は、テキストのみのLLMで事実をローカライズし、更新するが、連続した音声表現は考慮しない。
LALMにおける知識ローカライズと編集のための最初の音声ベンチマークを構築し,音声認識による位置対応フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:24:12 GMT)
ECG-Reasoning-Benchmark: A Benchmark for Evaluating Clinical Reasoning Capabilities in ECG Interpretation [14.3] 我々は,17コア心電図診断におけるステップバイステップ推論を評価するために,6,400以上のサンプルからなる新しいマルチターン評価フレームワークを提案する。
最先端モデルに対する包括的評価では,多段階論理推論の実行に重大な障害があることが判明した。
これらの結果は、現在のMLLMが実際の視覚的解釈を回避し、既存の訓練パラダイムに重大な欠陥を露呈し、堅牢で推論中心の医療AIの必要性を強調していることを示している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 11:09:38 GMT)
Disentangling Dynamical Systems: Causal Representation Learning Meets Local Sparse Attention [14.2] 本稿では,因果表現学習を利用した新たな識別可能性定理を開発し,システムパラメータの不整合表現を明らかにする。
システムのパラメータ同定を変分推論問題としてインスタンス化し、スパーシリティ規則化変換器を用いて状態依存因果構造を解明する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:03:34 GMT)
Multimodal Belief-Space Covariance Steering with Active Probing and Influence for Interactive Driving [14.2] 我々は、粗い離散意図と微妙な動きモードにまたがって人間の行動を構造化する階層的信念モデルを導入する。
人間の予測におけるマルチモーダルなあいまいさが安全を損なう可能性があることを識別するアクティブな探索戦略を開発する。
最後に、Conditional Value-at-Riskに基づく実行時リスク評価レイヤは、すべての調査アクションが影響の間、人間のリスク許容範囲内に留まることを保証します。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:59:29 GMT)
TopoCL: Topological Contrastive Learning for Medical Imaging [13.9] TopoCLは、医用画像のコントラスト学習において、トポロジカルな構造を明示的に活用する。
TopoCLは、統計学的に重要な線形プローブ分類の精度で+3.26%の平均的な向上を達成している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:03:53 GMT)
TrajPred: Trajectory-Conditioned Joint Embedding Prediction for Surgical Instrument-Tissue Interaction Recognition in Vision-Language Models [13.9] 時間的動きの手がかりを組み込むための楽器軌道を符号化するフレームワークであるTrajPredを提案する。
また,楽器間相互作用認識タスクへのスムーズな適応を実現するために,プロンプトチューニングと動詞言い換え手法を取り入れた。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:05:17 GMT)
Mind the Shift: Decoding Monetary Policy Stance from FOMC Statements with Large Language Models [12.9] 連邦公開市場委員会(FOMC)の声明は金融政治情報の主要な源であり、その言葉の微妙な変更さえもグローバル金融市場を動かす可能性がある。
既存のアプローチは通常、スタンス検出を標準分類問題として扱い、それぞれのステートメントを個別にラベル付けする。
我々は,凍結した大言語モデル(LLM)表現を連続的なスタンススコアにマッピングするアノテーションのないフレームワークであるDelta-Consistent Scoring (DCS)を紹介した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:07:28 GMT)
Visualizing Critic Match Loss Landscapes for Interpretation of Online Reinforcement Learning Control Algorithms [12.9] 本研究は,オンライン強化学習のための批評家マッチング損失ランドスケープ可視化手法を提案する。
記録された批判パラメータの軌跡を低次元線形部分空間に投影することにより、損失景観を構築する。
批判的学習行動を特徴付ける2次元最適化パスとともに、3次元の損失面を生成する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:20:12 GMT)
Adapting Critic Match Loss Landscape Visualization to Off-policy Reinforcement Learning [12.9] 本研究は、オンラインから外部強化学習(RL)まで、確立された批評家一致損失景観可視化手法を拡張した。
Off-policy RLは、リプレイベースのデータフローとターゲット計算において、段階的にオンラインアクター批判学習とは異なる。
その結果、適応型批評家マッチング損失可視化フレームワークは、批評家最適化力学を解析するための幾何学的診断ツールとして機能することを示した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:21:22 GMT)
A Loss Landscape Visualization Framework for Interpreting Reinforcement Learning: An ADHDP Case Study [12.9] 強化学習アルゴリズムは、動的および制御システムで広く使われている。
本研究では,この手法を学習力学の多視点ビューを提供するフレームワークに拡張する。
このフレームワークは、ADHDPのバリエーションを比較するために適用され、トレーニングスタビライザとターゲット更新が最適化の状況をどのように変えるかを示している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:47:30 GMT)
CyboRacket: A Perception-to-Action Framework for Humanoid Racket Sports [12.6] CyboRacketはヒューマノイドラケットスポーツのための階層的な知覚と行動のフレームワークである。
搭載されている視覚認識、物理に基づく軌道予測、大規模で事前訓練された全身制御を統合している。
視覚に基づくヒューマノイドテニスハイティングの課題について述べる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:01:14 GMT)
Deep EM with Hierarchical Latent Label Modelling for Multi-Site Prostate Lesion Segmentation [12.5] 本稿では,隠れマスク上でのボクセル方向の後方分布の推測と,この後方をソフトターゲットとするCNNの訓練を交互に行う階層的予測最大化(HierEM)フレームワークを提案する。
3つのコホートの実験は、提案された階層的EMフレームワークがクロスサイト一般化を促進することを示した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:03:20 GMT)
Structure-Dependent Regret and Constraint Violation Bounds for Online Convex Optimization with Time-Varying Constraints [12.4] 本稿では,ネットワーク現象に対する制約変動の構造的特徴について紹介する。
制約過程が規則性を示すとき、逆数率を厳密に改善する構造に依存した結合境界を導出する。
合成ベンチマークと実世界のデータセットの実験により、SA-PDは累積制約違反を最大53%削減することを示した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:30:35 GMT)
Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice [12.2] 自由主義的民主主義理論は、市民の能力は生まれつきではなく、実践を通じて発達していることを示唆している。
私たちは、LSMを使って政策問題に関する本物の人間の声を整理する、AIを活用したアーリーステージプラットフォームであるAgoraを紹介します。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:18:56 GMT)
Wi-Spike: A Low-power WiFi Human Multi-action Recognition Model with Spiking Neural Networks [11.9] Wi-Spikeは、バイオインスパイアされた、効率的かつ正確な行動認識のためのニューラルネットワークフレームワークである。
我々は,Wi-Spikeがシングルアクション認識において競合精度を達成し,マルチアクション認識タスクにおいて優れた性能を発揮することを示す。
エネルギー消費に関しては、Wi-Spikeは他の方法と比べてエネルギーコストを少なくとも半分削減するが、人間の活動認識では95.83%の精度で認識できる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:40:24 GMT)
A Physically-Grounded Attack and Adaptive Defense Framework for Real-World Low-Light Image Enhancement [11.9] 限られた照明は、しばしば画像の厳しい物理的ノイズと細部劣化を引き起こす。
既存の低光画像強調法(LLIE)は、拡張プロセスをブラインドブラックボックスマッピングとして扱う。
本稿では,物理に基づく攻撃とディスプレイ適応防衛のパラダイムとして概念的に定式化された新しいLLIE手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:44:54 GMT)
To LLM, or Not to LLM: How Designers and Developers Navigate LLMs as Tools or Teammates [11.7] 大規模言語モデル(LLM)は、設計と開発にますます統合されているが、それらの使用に関する決定は、まれにバイナリまたは純粋に技術的である。
本稿では,33名の設計者と3大技術系企業の開発者へのインタビューをもとに,建設論に基づく理論研究の成果を報告する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:58:08 GMT)
PGcGAN: Pathological Gait-Conditioned GAN for Human Gait Synthesis [11.4] 本稿では,3次元ポーズ・キーポイント・トラジェクトリデータから直接,病理特異的な歩行シーケンスを合成するPGcGAN(Pathological Gait- Conditioned Generative Adversarial Network)を提案する。
このフレームワークは、ジェネレータと識別器の両方に1ホットエンコードされた病理ラベルを組み込み、6つの歩行カテゴリで制御された合成を可能にする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:50:23 GMT)
Power-Law Spectrum of the Random Feature Model [11.3] 集団ランダムな特徴を持つ共分散 $mathbbE_x [frac1df(Wtop x )otimes 2]$ の固有値を特徴づける。
すべての$leq j leq d log-(p+1)(d)$に対して、$j$-th 固有値は次数$left(logp-1(j+1)/jright)$である。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:54:34 GMT)
RobustSCI: Beyond Reconstruction to Restoration for Snapshot Compressive Imaging under Real-World Degradations [11.0] Snapshot Compressive Imaging (SCI)のディープラーニングアルゴリズムは大きな成功を収めているが、彼らはクリーンな測定から再構築することに集中している。
キャプチャーされた信号は、しばしば動きのぼやけと低い光によってひどく劣化する。
我々は「再建」から「復元」にゴールを移し、ロバストビデオSCI復元の最初の研究を開拓した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:34:02 GMT)
Seeking Physics in Diffusion Noise [10.8] 我々は、事前訓練された拡散変換器(DiT)の中間雑音表現を探索する。
物理的に可視で不明瞭なビデオは、ノイズレベルを越えて中間層の特徴空間で部分的に分離可能である。
この分離性は、視覚的品質やジェネレータの同一性によるものではない。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:13:23 GMT)
Parameter-Efficient Quality Estimation via Frozen Recursive Models [10.7] 低リソース言語に対して,Tiny Recursive Models (TRM) は品質評価 (QE) に移行しないことを示す。
Hindi と Tamil では、凍った TRM-QE が MonoTransQuest (560M のパラメータ) より優れており、80$times$ のトレーニング可能なパラメータが少ない。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:35:58 GMT)
Expanding mmWave Datasets for Human Pose Estimation with Unlabeled Data and LiDAR Datasets [10.6] 人間のポーズ推定(HPE)のための現在のmmWaveデータセットは乏しく、ポイントクラウド(PC)属性と人間のポーズの両方に多様性がない。
未ラベルのmmWaveデータとLiDARデータセットを用いて既存のmmWaveデータセットのボリュームと多様性を拡大する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:40:53 GMT)
BIT: Matching-based Bi-directional Interaction Transformation Network for Visible-Infrared Person Re-Identification [10.5] 双方向相互作用変換(BIT)と呼ばれる新しいネットワークを提案する。
BITは、可視光対と赤外線対の相互作用を明示的にモデル化するマッチングベースの戦略を採用している。
我々の知る限りでは、VI-ReIDにこのようなペアワイズマッチング駆動インタラクションを導入するのはBITが初めてである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:33:00 GMT)
On the Degrees of Freedom of Gridded Control Points in Learning-Based Medical Image Registration [10.3] 本研究では,学習ベース登録ネットワーク開発に必要な制御ポイントについて検討する。
本稿では,厳密なボクセル単位のデコーディングを,制御点の粗いグリッドでの変位予測に置き換える学習ベースの登録フレームワークであるGridRegを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:54:56 GMT)
CangjieBench: Benchmarking LLMs on a Low-Resource General-Purpose Programming Language [10.2] 我々は,低リソース汎用言語であるCangjieの汚染のないベンチマークであるCangjieBenchを紹介する。
ベンチマークは、HumanEvalとClassEvalから手作業で翻訳された248の高品質なサンプルで構成されている。
実験の結果、ダイレクトジェネレーションは性能が悪く、シンタクス制約ジェネレーションは精度と計算コストの最良のトレードオフを提供することがわかった。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:35:03 GMT)
Bringing Model Editing to Generative Recommendation in Cold-Start Scenarios [10.0] 生成レコメンデーション(GR)は、エンドツーエンド生成パラダイムにおいて、シーケンシャルなレコメンデーションの強い可能性を示している。
既存のGRモデルは深刻なコールドスタート崩壊に悩まされており、コールドスタートアイテムに対する推奨精度はゼロに近い程度に低下する可能性がある。
我々は生成的推薦に適したモデル編集フレームワークであるGenRecEditを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:31:28 GMT)
I'm Not Reading All of That: Understanding Software Engineers' Level of Cognitive Engagement with Agentic Coding Assistants [9.7] AIシステムへの過度な依存は、ユーザの批判的思考を損なう可能性がある。
ソフトウェア工学では、エージェント型コーディングアシスタントが日々の開発に急速に組み込まれつつある。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 05:03:20 GMT)
DC-ViT: Modulating Spatial and Channel Interactions for Multi-Channel Images [9.5] マルチチャネルイメージング(MCI)のトレーニングと評価は、異種チャネル構成のため、依然として困難である。
最近のMulti-Channel Vision Transformers (MC-ViTs)は、フレキシブルなチャネル入力を可能にすることでこの問題に対処している。
Decoupled Self-Attention (DSA)を用いて情報共有を明示的に制御するDecoupled Vision Transformer (DC-ViT)を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:31:34 GMT)
DeepOFW: Deep Learning-Driven OFDM-Flexible Waveform Modulation for Peak-to-Average Power Ratio Reduction [9.4] ピーク・ツー・平均電力比(PAPR)はマルチキャリア変調スキームの主要な制限である。
ディープラーニング駆動型OFDMフレキシブル波形変調フレームワークDeepOFWを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:31:15 GMT)
Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution [9.2] We present Verified Multi-Agent Orchestration (VMAO) a framework that coordinates special LLM-based agent through a verification-driven iterative loop。
専門家による25の市場調査クエリでは、VMAOは回答完全性を3.1から4.2に改善し、ソース品質はシングルエージェントベースラインに比べて2.6から4.1(5スケール)に改善した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 05:39:42 GMT)
LUMINA: A Multi-Vendor Mammography Benchmark with Energy Harmonization Protocol [9.1] 文献は、病理診断結果、BI-RADSアセスメント、乳房密度アノテーションを有する468人の患者の1824枚の画像からなる。
LUMINAは6つの買収システムと、高エネルギーと低エネルギーの両方のスタイルにまたがっており、ベンダー主導とエネルギー駆動の外観シフトを露呈している。
ハーモナイゼーションは背骨をまたいだAUC/ACCを改善し、不審領域の周囲により局所的なGrad-CAM局在をもたらす。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:41:40 GMT)
ChArtist: Generating Pictorial Charts with Unified Spatial and Subject Control [9.1] 図表は視覚的ストーリーテリングに有効な媒体であり、視覚的要素とデータチャートをシームレスに統合する。
自然画像から高密度構造的手がかりを抽出する現在の方法は、図表生成のための条件付け信号として不適である。
画像チャートを自動生成するドメイン固有拡散モデルであるChArtistを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:55:44 GMT)
Latent Dynamics-Aware OOD Monitoring for Trajectory Prediction with Provable Guarantees [8.9] 安全クリティカルなサイバー物理システムでは、正確な軌道予測が下流の計画と制御に不可欠なガイダンスを提供する。
このようなOODイベントの検出は、トラフィック条件の進化とインタラクションパターンの変化によって困難である。
我々は,変化後分布の明示的な知識を必要とせずに,累積最大離散性アプローチを拡張して検出を可能にする。
3つの実世界の運転データセットの実験では、重み付きエラーや未知のポストチェンジ条件に対する検出遅延と堅牢性の低減が示されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:56:57 GMT)
Contests with Spillovers: Incentivizing Content Creation with GenAI [8.8] GenAIは、ポジティブな流出の経済現象を増幅する。
本稿では,Spillovers (CCS) モデルを用いたコンテンツ作成について紹介する。
我々は,広い種類の流出構造に適用可能な近似アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:24:57 GMT)
In-Field 3D Wheat Head Instance Segmentation From TLS Point Clouds Using Deep Learning Without Manual Labels [8.6] 本研究では,地上レーザー走査(TLS)点群から直接,フィールド内小麦頭部のインスタンス・セグメンテーションの課題に取り組む。
そこで本研究では,新しい2段階パイプラインを提案する。
最初のステージでは、3Dから2Dのマルチビュープロジェクション、ゼロショット2Dオブジェクト中心のセグメンテーションのためのグラウンドドSAMパイプライン、マルチビューラベル融合を使用する。
第2段階では、これらの最初の提案をノイズの多い擬似ラベルとして使用し、教師付き3Dパノプティカルスタイルのセグメンテーションニューラルネットワークをトレーニングする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:58:20 GMT)
Non-Resonant Boundary Time Crystals from Quantum Synchronization Breakdown [8.5] 我々は、非駆動散逸背景の構造によって、駆動散逸力学を分類するLiouvillianフレームワークを導入する。
ホップ型動的相転移によりQSが崩壊して境界時間結晶(BTC)となることを示す。
我々はQS-BTC遷移の鋭い動的およびスペクトル的シグネチャを同定し、単一のコヒーレントトーンによって駆動されるU(1)対称集団スピンリンドブレディアン内に確立する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:05:13 GMT)
Membership Inference for Contrastive Pre-training Models with Text-only PII Queries [8.5] UMID(Unimodal Membership Inference Detector)は、テキストのみの監査フレームワークである。
多様なCLIPおよびCLAPアーキテクチャによる実験により、UMIDは以前のMIAよりも有効性と効率を著しく向上することが示された。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:53:39 GMT)
JobMatchAI An Intelligent Job Matching Platform Using Knowledge Graphs, Semantic Search and Explainable AI [8.5] JobMatchAIは、Transformerの埋め込み、スキル知識グラフ、解釈可能なリランクを統合したプロダクション対応システムである。
ジョブSearch-XSベンチマークと、BM25、知識グラフ、セマンティックコンポーネントを組み合わせたハイブリッド検索スタックにより、スキルの一般化を評価する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:13:41 GMT)
A Novel Framework using Intuitionistic Fuzzy Logic with U-Net and U-Net++ Architecture: A case Study of MRI Bain Image Segmentation [8.5] IFS U-Net と IFS U-Net++ は画像の不確実性を扱うために提案されている。
これらのモデルは、曖昧さや不正確なデータから生じる不確実性を管理するために、直観的ファジィ表現の入力データを受け入れる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:45:25 GMT)
Efficient Embedding-based Synthetic Data Generation for Complex Reasoning Tasks [8.2] 埋め込み空間における生成データの多様性と分布を解析する。
本稿では,データの多様性を向上し,継続的に性能を向上する埋込み型サンプリング用パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 00:19:03 GMT)
Scaling the Explanation of Multi-Class Bayesian Network Classifiers [7.9] 本稿では,ベイジアンネットワーク分類器(BNC)をクラス式にコンパイルするアルゴリズムを提案する。
BNCのクラス式をコンパイルする以前の研究と比較して,提案アルゴリズムはコンパイル時間を大幅に改善した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:38:06 GMT)
Human-AI Ensembles Improve Deepfake Detection in Low-to-Medium Quality Videos [7.9] ディープフェイク検出は機械学習の問題として広く考えられているが、人間とAI検出器が現実的な条件下でどのように比較するかは理解されていない。
我々は、標準的なベンチマークであるDF40と、日々の活動のビデオの新しいデータセットであるCharadesDFの2つのデータセットにわたって、200人の参加者と95人の最先端AI検出器を評価した。
人間は両方のデータセットでAI検出器よりも優れており、AIの精度がほぼ確実に崩壊するCharadesDFの場合、ギャップが広がる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:25:34 GMT)
An End-to-end Architecture for Collider Physics and Beyond [7.8] エンド・ツー・エンドの現象学タスクを実行することができる最初の言語駆動型エージェントシステムを提案する。
このシステムは、自律的な高エネルギー物理衝突論のための分離されたドメインに依存しないアーキテクチャの中でインスタンス化される。
本研究では,レプトクォークおよびアクチオン様粒子シナリオ,高言語実効演算子,パルトンレベルおよび検出器レベル解析,大規模パラメータスキャンにまたがる代表的な文献複製システムについて検証した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:00:52 GMT)
MALicious INTent Dataset and Inoculating LLMs for Enhanced Disinformation Detection [7.8] この研究は、偽情報とその悪質な意図を捉えるために専門家のファクトチェッカーと共同で開発された、人手による最初の英語コーパスであるMALINTを提示する。
心理学・コミュニケーション研究の接種理論に触発されて、悪意のある意図の知識を取り入れることで、偽情報の検出が向上するかどうかを検討する。
我々は,意図分析を統合し,情報伝達の持続的影響を緩和する意図的推論法であるインテントベース接種を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:07:12 GMT)
Windowed Fourier Propagator: A Frequency-Local Neural Operator for Wave Equations in Inhomogeneous Media [7.8] Windowed Fourier Propagator (WFP) は、解演算子を効率的に学習する新しいニューラル演算子である。
WFPは、複雑なメディアにおけるデータ駆動波動モデリングのための説明可能な、効率的で正確なフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:58:31 GMT)
Machine Learning-Driven Intelligent Memory System Design: From On-Chip Caches to Storage [7.7] 本稿では,軽量かつ実用的な機械学習(ML)手法を用いて,根本的に異なる設計手法を提案する。
Pythia、Hermes、Sibylの3つのML誘導アーキテクチャポリシーを提示します。
我々の評価は、Pythia、Hermes、Sibylが、最も優れた人間設計ポリシーを著しく上回っていることを示している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:02:05 GMT)
Make it SING: Analyzing Semantic Invariants in Classifiers [7.4] 本稿では,ネットワークに関して等価な画像を構築し,利用可能なバリエーションに意味論的解釈を割り当てる手法を提案する。
これにより、帰納的意味変化の自然言語記述と視覚的例を得ることができる。
例えば、ResNet50はnull空間に関連セマンティック属性をリークするのに対して、自己教師付きDINOで事前訓練されたViTであるDinoViTは、不変空間全体のクラスセマンティクスを維持するのに優れている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:13:14 GMT)
Unlearning-based sliding window for continual learning under concept drift [7.2] タスクのない連続学習では、モデルは明示的なタスクの同一性やタスク境界なしに逐次適応しなければなりません。
一般的な解決策はスライディングウィンドウに基づいているが、このアプローチは計算的に要求されることが多い。
我々は,機械学習に基づく異なる視点を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:03:41 GMT)
LongVidSearch: An Agentic Benchmark for Multi-hop Evidence Retrieval Planning in Long Videos [7.1] LongVidSearchは、ロングビデオにおけるエージェント的マルチホップエビデンス検索計画を評価するためのベンチマークである。
Hop-k の質問は、正確に k 個のエビデンス・クリップを必要とする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:20:23 GMT)
A comprehensive multimodal dataset and benchmark for ulcerative colitis scoring in endoscopy [6.8] 潰瘍性大腸炎(英: Ulcerative colitis, UC)は、大腸癌のリスクが高くなる慢性粘膜炎症である。
最も広く使用されている内視鏡スコアは、マヨ内視鏡スコア(MES)と潰瘍性大腸炎重症度指数(UCEIS)である。
我々は、専門家検証されたMESとUCEISラベルと詳細な臨床記述を含む、キュレートされたマルチセント・マルチレゾリューションデータセットを導入する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:15:02 GMT)
A Multi-Scale Graph Learning Framework with Temporal Consistency Constraints for Financial Fraud Detection in Transaction Networks under Non-Stationary Conditions [6.8] STC-MixHopは空間的多分解能伝搬と軽量時間整合性モデリングを組み合わせたグラフベースのフレームワークである。
このフレームワークは,厳密な時間分割の下でPaySimデータセット上で評価する。
その結果, STC-MixHopはグラフ手法間で競合し, 高い不均衡条件下で強いスクリーニング指向のリコールを実現することがわかった。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:30:02 GMT)
Distilling Latent Manifolds: Resolution Extrapolation by Variational Autoencoders [6.6] 変分オートエンコーダ(VAE)エンコーダは、現代の生成モデルにおいて重要な役割を果たす。
VAEエンコーダ蒸留において,低分解能でのみ蒸留された小型エンコーダは,そのネイティブ分解能において再構成性能が劣っている。
この蒸留エンコーダは、2,562ドル(約2,600円)以上の解像度で訓練されることはないが、効率よく5122ドル(約5,500円)の解像度の入力に一般化される。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:20:50 GMT)
Medical Image Spatial Grounding with Semantic Sampling [6.6] 視覚言語モデル(VLM)は、画像やビデオの視覚的グラウンド化において大きな可能性を示している。
本研究では,視覚成分の識別因子として,画像のモダリティ,スライス方向,座標系について検討する。
空間接地性能を向上させるために,低コスト,推論時間,モデルに依存しないVLMの最適化である textbfMIS-SemSam を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:54:46 GMT)
From Specification to Architecture: A Theory Compiler for Knowledge-Guided Machine Learning [6.4] 理論誘導型機械学習は、モデル設計に直接ドメイン知識を組み込むことで、性能が向上することを示した。
しかし、形式的ドメイン理論がアーキテクチャ上の制約に変換されるプロセスは完全に手作業のままである。
本稿では,型付き機械可読なドメイン理論を入力として受け入れ,アーキテクチャを自動生成するシステムである理論コンパイラを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:15:31 GMT)
Learning-to-Defer with Expert-Conditioned Advice [6.3] Learning-to-Deferは、各入力を予測コストを最小限にする専門家にルーティングするが、すべての専門家に利用可能な情報が決定時に固定されていると仮定する。
異なる頭部を持つ経路やアドバイスを学習する自然分離サロゲートの広いファミリーが、最小限の非自明な設定でも矛盾していることを示す。
本稿では,複合専門家のアクション空間で動作する拡張サロゲートを導入し,$mathcalH$-consistencyの保証を証明した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:52:58 GMT)
Frequency-resolved N-photon correlations in the ultra-strong coupling regime [6.3] 超強結合キャビティQEDシステムにおける周波数分解N-フォトン相関について検討した。
パリティ対称性がこれらの相関を形作る上で決定的な役割を果たすことを示す。
我々の研究は、超強結合系に対する周波数分解相関を拡張し、光-物質相互作用系における対称性の感度プローブとしての可能性を示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:20:21 GMT)
Tool-MCoT: Tool Augmented Multimodal Chain-of-Thought for Content Safety Moderation [6.2] 大規模言語モデル(LLM)は有効であるが、その高い計算コストとレイテンシは、スケーラブルなデプロイメントの課題である。
外部フレームワークを活用したコンテンツ安全モデレーションのための小型言語モデル(SLM)であるTool-MCoTを紹介する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:08:04 GMT)
From $\boldsymbol{\logπ}$ to $\boldsymbolπ$: Taming Divergence in Soft Clipping via Bilateral Decoupled Decay of Probability Gradient Weight [6.1] Reinforcement Learning with Verifiable Rewards (RLVR)は、Large Language Model (LLM)推論の飛躍を触媒しているが、その最適化のダイナミクスは脆弱である。
GRPOのような標準的なアルゴリズムはハードクリッピングを通じて安定性を強制する。
本稿では,重要サンプリング比に基づくデカップリング崩壊機構を用いたデカップリング・グラディエント・ポリシー・最適化(DGPO)を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:00:48 GMT)
Single Image Super-Resolution via Bivariate `A Trous Wavelet Diffusion [5.9] 超解像(SR)モデルは、人工物を導入することなく高周波構造を復元できる必要がある。
生成過程において,構造化されたクロススケールガイダンスを提供するBATDiffを紹介する。
既存の拡散ベースラインや非拡散ベースラインよりも鋭く、構造的に一貫した再構築をもたらす。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:08:56 GMT)
Physics-Informed Policy Optimization via Analytic Dynamics Regularization [5.5] 強化学習(RL)はロボット制御において高い性能を発揮している。
アクター批判法のような最先端の政策学習法は、依然として高いサンプルの複雑さに悩まされている。
我々は、物理制約を直接ニューラルネットワークの最適化にシームレスに統合する、PIPERと呼ばれる新しい物理インフォームドRLフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:20:45 GMT)
Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers [5.5] 我々は,MoE層における不確かさをモデル化するためのベイズ的構造化手法であるVMoER(Sariformal Mixture-of-Experts Routing)を導入する。
VMoERは、一般的に決定論的ルーティングネットワークによって行われるエキスパート選択ステージへの推論を限定する。
試験された基礎モデル全体で、VMoERはノイズ下でのルーティングを38%改善し、配布外AUROCを12%向上させた。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:47:04 GMT)
Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes [5.3] Agentic DAG-Orchestrated Transformer (A.DOT) Plannerはマルチモーダル・マルチホップ質問応答のためのフレームワークである。
A.DOTは、ユーザNLクエリを構造化および非構造化の両方にまたがる有向非巡回グラフ(DAG)実行計画にコンパイルする。
System Decomposes query into parallelizable sub-queries, includess schema-aware reasoning, and applied both structure and semantic validation。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 05:34:16 GMT)
Coordinate-Independent Robot Model Identification [5.1] 本稿では,逆力学残差を重み付けする座標独立同定法を提案する。
双対計量は、一般化された力の物理的に意味のある正規化を与える。
Inertia-dominated Crazyflie-pendulum system と drag-dominated LandSalp Robot の実験により,識別精度が向上した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:20:45 GMT)
UAVBench and UAVIT-1M: Benchmarking and Enhancing MLLMs for Low-Altitude UAV Vision-Language Understanding [4.8] UAVBenchとUAVIT-1Mは低高度視覚言語タスクにおけるMLLMの能力の評価と改善を目的としている。
UAVBenchは、43の試験ユニットと、画像レベルと領域レベルの10タスクにわたる966kの高品質なデータサンプルで構成されている。
UAVIT-1Mは、約124万の多様な命令で構成され、789万のマルチシーン画像と、11の異なるタスクを持つ約2,000種類の空間解像度をカバーしている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:04:23 GMT)
Fair Benchmarking of Emerging One-Step Generative Models Against Multistep Diffusion and Flow Models [4.8] 最先端のテキスト画像モデルは高品質な画像を生成するが、推論は高価である。
1ステップモデルは、1ステップで画像にノイズをマッピングすることで、このコストを削減することを目的としている。
FIDに焦点を当てたモデル開発とCFGの選択は、いくつかの段階において誤解を招く可能性があることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:22:27 GMT)
Oblivis: A Framework for Delegated and Efficient Oblivious Transfer [4.6] 我々は、デリゲートされたプライバシ保護クエリ実行を可能にする新しいOTプロトコルのモジュールフレームワークであるOblivisを紹介する。
Oblivisは、クライアントが直接アクセスすることなくデータベースレコードを検索でき、データベースとプロキシの両方へのリークを防ぎ、実用的な効率を念頭に設計されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:16:02 GMT)
Open, to What End? A Capability-Theoretic Perspective on Open Search [4.6] オープン検索の推進は、必然的に同様の紛争に遭遇するだろう、と私たちは主張する。
オープンの概念は、オープン化されているものだけでなく、能力理論的なレンズを通して理解されるべきである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:02:09 GMT)
Kernel Tests of Equivalence [4.5] 既存の等価性テストはパラメトリック分布に限定されるか、完全な分布ではなく特定の瞬間のみに焦点を当てる。
Emph kernel Stein discrepancy と emphMaximum Mean Discrepancy の2つのカーネルに基づく統計的相違を用いてこれらの制限に対処する。
提案した試験の無効仮説は、これらの相違によって測定される少なくとも定義済みのマージンによって、候補分布が名目分布と異なると仮定する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:47:48 GMT)
High-Fidelity Compression of Seismic Velocity Models via SIREN Auto-Decoders [4.4] Inlicit Neural Representations (INR) は、グリッド解像度とは独立に連続的な信号を表現するための強力なパラダイムとして登場した。
SIREN(Sinusoidal Networks)自動デコーダに基づく多構造地震波速度モデルを表現する高忠実度ニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:43:39 GMT)
PARSA-Bench: A Comprehensive Persian Audio-Language Model Benchmark [4.4] PARSA-Benchはペルシア語と文化に関する大規模なオーディオ言語モデルを評価するための最初のベンチマークである。
16のタスクと8000以上のサンプルで構成されており、音声理解、パラ言語分析、文化的な音声理解にまたがっている。
詩のメーターやスタイル検出、ペルシア音楽の伝統的な理解、コードスイッチング検出など、新たに10のタスクが導入されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:06:24 GMT)
Vavanagi: a Community-run Platform for Documentation of the Hula Language in Papua New Guinea [4.3] 我々は,パプアニューギニアのオーストロネシア語であるフラ(ヴラヤ)のコミュニティ運営プラットフォームであるヴァヴァナギについて紹介する。
Vavanagiはクラウドソースの英語とHulaのテキストの翻訳と音声の録音をサポートしており、古参のレビューとコミュニティが管理するデータ基盤がある。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:57:43 GMT)
Toward Clinically Ready Foundation Models in Medical Image Analysis: Adaptation Mechanisms and Deployment Trade-offs [4.3] 医療画像分析(MIA)におけるFM適応のための戦略中心のフレームワークについて紹介する。
我々は、適応を事前訓練後の介入として概念化し、既存のアプローチを5つのメカニズムにまとめる。
各メカニズムについて、適応深さ、ラベル効率、ドメインの堅牢性、計算コスト、監査可能性、規制負担のトレードオフを分析する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:04:58 GMT)
Rethinking Evaluation in Retrieval-Augmented Personalized Dialogue: A Cognitive and Linguistic Perspective [4.3] 認知科学と言語理論では、対話は独立した発話の連鎖ではなく、一貫性、一貫性、共通理解によって維持される共同活動である。
評価手法としてパーソナライズされた対話のための顕著な検索強化フレームワークであるLAPDOGを再検討する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:36:16 GMT)
ITKIT: Feasible CT Image Analysis based on SimpleITK and MMEngine [4.2] IT KITはDICOMから3Dセグメンテーション推論までの完全なパイプラインを提供する。
OneDL-MMEngineフレームワークはフレキシブルなモデル構成とデプロイメントエントリを提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:25:06 GMT)
Personalized Cell Segmentation: Benchmark and Framework for Reference-Guided Cell Type Segmentation [4.2] 我々は、参照セルが与えられた特定のタイプの全ての細胞をセグメント化することを目的としたパーソナライズされたセルタスクを導入する。
先駆的なソリューションとして,DINOv2のバックボーン上に構築されたPerCS-DINOを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 10:39:47 GMT)
Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI [3.9] ChatGPT Healthは緊急事態の51.6%を減らし、消費者が直面するAIトリアージは安全リスクをもたらすと結論付けた。
5つのフロンティア LLM (GPT-5.2, Claude Sonnet 4.6, Claude Opus 4.6, Gemini 3 Flash, Gemini 3.1 Pro) を17-scenario部分レプリケーションバンク上でテストした。
見出しのアンダートリアージレートは評価形式に強く依存しており、デプロイされたトリアージの挙動を安定的に見積もってはならない。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:43:26 GMT)
When Scanners Lie: Evaluator Instability in LLM Red-Teaming [3.8] 脆弱性スキャナーは、異なる攻撃型成功率(ASR)を測定することにより、セキュリティリスクを評価するためにますます使用される。
しかし、これらの測定の妥当性は、しばしば見過ごされるコンポーネント、すなわち攻撃が成功したかどうかを判断する評価者に依存します。
本研究では,一般に使用されているオープンソーススキャナが,評価器の部品に依存する測定不安定性を示すことを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:08:16 GMT)
RenderMem: Rendering as Spatial Memory Retrieval [3.8] 身体的推論は本質的に視点に依存している。
本稿では3次元世界表現と空間推論のインターフェースとしてレンダリングを扱う空間記憶フレームワークRenderMemを紹介する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:53:40 GMT)
Quantum-limited traveling-wave parametric amplifier based on DUV lithography-defined planar structures [3.8] 大規模超伝導量子プロセッサは、同様にスケーラブルな製造経路を辿る低温マイクロ波成分を必要とする。
移動波パラメトリック増幅器(TWPA)のような高回路密度デバイスにとって、このニーズは特に緊急である。
我々は、DUVで定義された平面回路素子と電子ビームパターンのジョセフソン接合を組み合わせたハイブリッドスキームにより作製された4波長混合TWPAを実証する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:04:52 GMT)
Label Noise Cleaning for Supervised Classification via Bernoulli Random Sampling [3.7] 本論文では,Bernoulliランダムサンプリングに基づくラベルノイズ除去手法を提案する。
本研究では,Bernolliランダムサンプリングによって生成されたサブセットの平均ラベルノイズレベルが,すべてのクリーンな観測に対して同一に分布していることを示す。
平均ラベルノイズレベルは観測全体では独立ではないが、独立結合を導入することにより、2つのよく分離された分布の混合に収束することがさらに証明される。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:54:55 GMT)
Towards Equitable Robotic Furnishing Agents for Aging-in-Place: ADL-Grounded Design Exploration [3.4] このポジションペーパーでは、高齢者福祉のためのロボティクスは「便宜的特徴」とセンターエクイティ、正義、責任を超えて進まなければならないと論じている。
本稿では,自然言語インタラクションにコンピュータビジョンと生成AIとLLMを活用する,家庭内ロボットファニッシングエージェントの概念を提案する。
実家における公平なロボットウェルビーイングシステムの評価と展開に関するオープンな質問で締めくくった。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:05:21 GMT)
Safety-Potential Pruning for Enhancing Safety Prompts Against VLM Jailbreaking Without Retraining [3.3] 安全プロンプトは、視覚言語モデルにおけるジェイルブレイク攻撃に対する解釈可能な防御層を構成する。
安全関連アクティベーションを増幅するワンショットプルーニングフレームワークであるSafety-Potential Pruningを紹介する。
本手法は,攻撃成功率を単独で最大22%削減すると同時に,強靭な性能を維持しながら,単独で攻撃成功率を22%削減する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:45:08 GMT)
ResearchPilot: A Local-First Multi-Agent System for Literature Synthesis and Related Work Drafting [3.3] ResearchPilotは、文献レビュー支援のためのオープンソースのセルフホスト可能なマルチエージェントシステムである。
自然言語研究の質問を受けて、Semantic ScholarとarXivから論文を検索する。
紙抽象物から構造化された結果を抽出し、クロスペーパーパターンを合成し、引用・認識作業部を起草する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:02:59 GMT)
VIP-Loco: A Visually Guided Infinite Horizon Planning Framework for Legged Locomotion [2.9] VIP-Locoは、視覚に基づくシーン理解とRLと計画を統合するフレームワークである。
我々は、VIP-Locoが計画と認識を統一し、多様な環境における堅牢で解釈可能な移動を可能にすることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:29:53 GMT)
Data-Driven Physics Embedded Dynamics with Predictive Control and Reinforcement Learning for Quadrupeds [2.9] モデル予測制御(MPC)と強化学習(RL)を統合した4次手法の現状
ラグランジアンニューラルネットワーク(LNN)をRL MPCフレームワークに統合することで、これらの問題に対処する。
サンプル効率の向上,長軸誤差の低減,非構造的ニューラルダイナミクスよりも高速なリアルタイム計画法を示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 11:52:14 GMT)
Inclusive AI for Group Interactions: Predicting Gaze-Direction Behaviors in People with Intellectual and Developmental Disabilities [2.8] この研究は、アイコンタクト検出の課題に対処することで、包括的AIへの一歩を踏み出す。
まず、新しいデータセット、MIDD(Multi-party Interaction with Intellectual and Developmental Disabilities)を導入し、非定型的な視線とエンゲージメントパターンをキャプチャする。
第2に,クラス不均衡,発話活動,視線分布,相互作用ダイナミクスの相違に着目し,ニューロタイプデータセットとの比較分析の結果を示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:10:31 GMT)
Generation of Human Comprehensible Access Control Policies from Audit Logs [2.8] 我々は、ログから人間の理解可能な自然言語アクセス制御ポリシーを生成するフレームワークを開発する。
LANTERN (LLM-based ABAC Natural Translation and Explanation for Rule Navigation) と名付けられたこのフレームワークは,我々の研究成果のために,一般公開されたWebベースアプリケーションとしてインスタンス化されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:21:27 GMT)
STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching [2.6] 本研究では、保守的な剛体力学を不確実かつ効果的に非保守的な相互作用効果から分離する動的学習フレームワークSTRIDEを提案する。
本研究は,ペンデュラム,Unitree Go1ruped,Unitree G1 humanoidなど複雑度の高いシステム上でのSTRIDEの評価である。
その結果, 長軸予測誤差が20%減少し, 接触力予測誤差が30%減少した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:35:08 GMT)
Deep Learning From Routine Histology Improves Risk Stratification for Biochemical Recurrence in Prostate Cancer [2.5] 根治的前立腺切除術後の生体化学的再発の持続的, 患者特異的リスクを予測できる深層学習型バイオマーカーを提案する。
CAPRA-S臨床リスクスコアと統合すると、深層学習リスクスコアはBCRの差別を一貫して改善する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:22:38 GMT)
$K-$means with leraned metrics [2.3] 我々は測度空間のフレシェ it k-平均について、測度と距離が未知であるときに研究する。
我々は、k-平均が測定されたグロモフ・ハウスドルフ位相に関して連続であることを示す一般的な結果を証明する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:50:59 GMT)
SPARQ: Spiking Early-Exit Neural Networks for Energy-Efficient Edge AI [2.3] スパイキングニューラルネットワーク(SNN)は、イベント駆動型計算モデルにより、固有のエネルギー効率を提供する。
この研究は、スパイキング、量子化対応トレーニング、強化学習誘導早期出口を統合し、効率的で適応的な推論を行う統合フレームワークであるSPARQを提示する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:38:39 GMT)
4D Synchronized Fields: Motion-Language Gaussian Splatting for Temporal Scene Understanding [2.3] 現在の4D表現は、幾何学、運動、意味を分離する。
本研究では、4Dシンクロナイズド・フィールズを提案する。
HyperNeRFでは、4Dシンクロナイズド・フィールズが28.52dBのPSNRを達成している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:32:58 GMT)
EcoFair-CH-MARL: Scalable Constrained Hierarchical Multi-Agent RL with Real-Time Emission Budgets and Fairness Guarantees [2.3] EcoFair-CH-MARLは制約付き階層型マルチエージェント強化学習フレームワークである。
i) 気象と需要の下で高い累積排出量を確実に束縛する原始的二元的予算層、(ii) 不均一艦隊間の最大コスト株式を強制する動的にスケジュールされた罰則を持つ公正な報酬トランスフォーマー、(iii) リアルタイム船舶制御から戦略的ルーティングを分離し、エージェントカウントの線形スケーリングを可能にする2段階の政策アーキテクチャである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:40:40 GMT)
Predicting Stress-strain Behaviors of Additively Manufactured Materials via Loss-based and Activation-based Physics-informed Machine Learning [2.2] 本稿では, 物理インフォームド・機械学習(PIML)フレームワークを提案し, 加法的に作製した材料の応力-ひずみ曲線を予測するための予測性能と物理的整合性を向上する。
回帰モデルを用いてAMプロセスパラメータから降伏点を予測し、応力-ひずみ曲線を弾性領域と塑性領域に分割する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:13:36 GMT)
GroundSet: A Cadastral-Grounded Dataset for Spatial Understanding with Vector Data [2.2] 検証可能なカダストラルベクトルデータに基づく大規模データセットを提案する。
7つの空間的推論タスクにまたがる包括的インストラクションチューニングベンチマークにより、このリソースを検証する。
現在のRS特化および商用モデル(例:Gemini)がゼロショット設定に苦戦している一方で、高忠実度監視がこのギャップを効果的に橋渡ししていることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:11:40 GMT)
Design of a Bio-Inspired Miniature Submarine for Low-Cost Water Quality Monitoring [2.1] バイオインスパイアされた小型潜水艦の低コスト水質モニタリングのための設計と実験的検討を行った。
イカのジェット推進機構に触発され,ポンプ駆動型水ジェットを用いて推進・操舵を行う。
完全なシステムは、約122.5ドルのハードウェアコストで構築でき、教育および環境モニタリングアプリケーションに適している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 06:37:45 GMT)
Towards Versatile Opti-Acoustic Sensor Fusion and Volumetric Mapping [2.1] 自動水中車両にはボリュームマッピングが不可欠である。
視覚に基づく知覚は高解像度のデータを提供するが、濁った状況では失敗する。
ソナーは光と濁りに強いが 解像度が低く 高さの曖昧さに悩まされている
本稿では,ステレオソナー対とモノクラーカメラを融合させて,様々な視認性条件下での安全なナビゲーションを実現するフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:06:28 GMT)
Compute Allocation for Reasoning-Intensive Retrieval Agents [2.0] LLM拡張パイプラインは、クエリ拡張と候補の再ランクによってこの問題に対処するが、かなりの推論コストが伴う。
モデルキャパシティ、推論時思考、クエリ拡張と再ランクステージの深度が異なります。
推論時の思考は、どちらの段階でも最小限の改善をもたらす。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:12:17 GMT)
Bots and Blocks: Presenting a project-based approach for robotics education [1.9] 学生は、ロボットの扱い方について、アジャイルで学期制のプロジェクトで教えられている。
本稿では,ハードウェアロボットのための分解型ソフトウェアエコシステムの開発を特徴とする,このフレームワークと例示的プロジェクトについて述べる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:14:36 GMT)
Parrondo-type enhancement of quantum-state transfer in spin chains [1.9] 周期スイッチング時の有限$XX$スピン鎖における単一量子状態とベル状態の移動について検討する。
周期駆動は静的な構成よりも優れ、より高い転送特性が得られることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:20:59 GMT)
Canonical LST: A Protocol-Native Liquid Staking Solution for Tezos [1.9] カノニカル LST (Canonical LST) は、液体抽出中間体に関連する中央集権リスクを軽減するために設計されたプロトコルネイティブな機構である。
これにより、任意のテズホルダーが、サードパーティのオペレータに頼らずに集約された取り決めに参加することができる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:44:37 GMT)
LuxBorrow: From Pompier to Pompjee, Tracing Borrowing in Luxembourgish [1.8] LuxBorrowは、Luxembourgish(LU)ニュースを27年間(1999-2025年)にわたって借用し、259,305のRTL記事と43.7Mトークンをカバーしている。
我々のパイプラインは、文レベルの言語識別と、LU文に制限されたトークンレベルの借用レゾルバを組み合わせる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:00:17 GMT)
Activation Surgery: Jailbreaking White-box LLMs without Touching the Prompt [1.7] 大規模言語モデル(LLM)に対するジェイルブレイク手法を提案する。
モデルの内部のアクティベーションを操作して、プロンプトを変更することなく生成軌道を変更する。
この活性化手術法は, 拒絶信号の発生場所と発生方法を明らかにし, 拒絶信号が層間を伝播するのを防止している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:24:38 GMT)
The Twin-World road to reality in quantum mechanics [1.6] 最近提案されたグラジット形式(citebraun_stochastic_2022)を2つのツインワールドに拡張することで、量子力学に新しい現実的で現実的なアプローチを導入する。
発達した図によると、私たちは同じ進化の法則を持つ2つの世界の交差点に住んでいます。
任意の相互作用を持つ任意の数の粒子に対してシュルディンガー方程式を完全に再現するツインワールドの進化方程式を導出する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:13:46 GMT)
Bridging the Gap in the Responsible AI Divides [1.5] AI安全(AIS)とAI倫理(AIE)の緊張は、AIガバナンスとAIに関する公的な議論でますます表面化している。
我々は,過激な対立,離脱,包括的共存,批判的ブリッジングという,緊張関係の4つのモードを分類するモデルを導入する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:19:30 GMT)
Learning in Function Spaces: An Unified Functional Analytic View of Supervised and Unsupervised Learning [1.5] 多くの機械学習アルゴリズムは、データ分布で定義された関数を推定するための手順として解釈することができる。
データ分散によって誘導される関数空間に対する変動最適化として、幅広い学習問題を定式化する概念的枠組みを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:06:31 GMT)
AR-Flow VAE: A Structured Autoregressive Flow Prior Variational Autoencoder for Unsupervised Blind Source Separation [1.4] 盲点分離のための新しいVAEベースのフレームワークであるAR-Flow VAEを提案する。
この研究は、AR-Flow VAEの識別可能性と解釈可能性に関する今後の研究の基礎を提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:35:51 GMT)
Infinite Problem Generator: Verifiably Scaling Physics Reasoning Data with Agentic Workflows [1.4] Infinite Problem Generator (IPG) は,物理問題に保証された可解性で合成するエージェントフレームワークである。
IPGは実行可能Pythonプログラムとしてソリューションを構築し、厳密な数学的一貫性を強制する。
我々は165個の専門種から拡張された1,335個の古典力学問題の高忠実度コーパスであるClassicalMechanicsV1をリリースした。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:08:50 GMT)
Deep probabilistic model synthesis enables unified modeling of whole-brain neural activity across individual subjects [1.4] 本稿では、モデルに補助的なシステム特性を活用し、システムインスタンス間でデータを結合する機械学習フレームワーク、deep probabilistic model synthesis (DPMS)を導入する。
DPMSは回帰、分類、次元減少などの様々なモデルクラスを合成することができる。
幼魚ゼブラフィッシュの合成データと全脳神経活動データに基づいて単一インスタンスモデルを改善する能力を示した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 00:37:18 GMT)
AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs [1.0] AEXはリクエスト、レスポンス、ツールコール、ストリーミング、エラーセマンティクスを保持し、代わりに署名されたトップレベルの認証オブジェクトを追加する。
本稿では,プロトコル設計,脅威モデル,検証状態マシン,セキュリティとプライバシ分析,OpenAI互換のチャット補完プロファイルを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:42:39 GMT)
Memory as Asset: From Agent-centric to Human-centric Memory Management [0.9] メモリ・アズ・アセットは人中心人工知能(AGI)に向けた新しいメモリパラダイムである
本稿では,既存の大規模言語モデル(LLM)の集合的知識を補完する上で,人間中心の個人記憶管理が前提条件であることを強調する。
メモリ・アズ・アセット(Memory-as-Asset)パラダイム,高速なパーソナルメモリストレージ,インテリジェントな進化層,分散メモリ交換ネットワークを備えた,潜在的な3層メモリインフラストラクチャを提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:03:50 GMT)
Dynamic Theory of Mind as a Temporal Memory Problem: Evidence from Large Language Models [0.9] 心の理論 (ToM) は社会的認知と人間とAIの相互作用の中心である。
大規模言語モデル(LLM)はToMの理解と表現に役立つ。
我々はDTOM-Trackを導入し、制御されたマルチターン会話における時間的信念推論について検討する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:54:03 GMT)
Texel Splatting: Perspective-Stable 3D Pixel Art [0.8] シーン幾何学は世界の定点から立方体写像に変換される。
それぞれのテクセルは、世界空間のクワッドとしてスクリーンに固定される。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:18:43 GMT)
See, Learn, Assist: Safe and Self-Paced Robotic Rehabilitation via Video-Based Learning from Demonstration [0.8] 本稿では,ロボット支援型リハビリテーション演習を遠隔でRGB-Dビデオで教える新しい枠組みを提案する。
カルテシアン運動プリミティブ(DMP)を用いた6-DoF体中心軌道の実証を符号化する。
空間的に整合した仮想トンネルを構成する疎結合ハイブリッド制御アーキテクチャを用いて,これらのトラジェクトリを実行する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 00:30:36 GMT)
Separable neural architectures as a primitive for unified predictive and generative intelligence [0.7] 我々は、加法モデル、二次モデル、テンソル分解モデルを統合する表現クラスを定式化する。
SNAは、高次元の高分解成分への写像を分解する構造的帰納バイアスを課す。
これらの結果は、予測および生成知能のドメインに依存しないプリミティブとして分離可能なニューラルアーキテクチャを確立する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:39:13 GMT)
Covariance-Guided Resource Adaptive Learning for Efficient Edge Inference [0.7] 同じスループットを達成するディープラーニングデバイスは、消費電力の2倍の違いがある。
オペレータは、徹底的なプロファイリングなしで効率的なものを見つけるのに苦労することが多い。
私たちは、最小限の探索で適切な設定をオンラインで見つけるオンライン推論であるCORALを紹介します。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:54:08 GMT)
Risk-Aware Obstacle Avoidance Algorithm for Real-Time Applications [0.6] 本研究は,車両経路に沿った障害物の確率論的モデリングと,自律表面容器のスムーズな軌道最適化を統合したハイブリッド型リスク対応ナビゲーションアーキテクチャを提案する。
提案手法は、運転安全性と自律性の向上を示し、不確実かつダイナミックな環境下でのリスク対応型自動運転車のミッションのための有望なソリューションとして確立する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:06:04 GMT)
Proactive Routing to Interpretable Surrogates with Distribution-Free Safety Guarantees [0.6] 動作前に,ライトウェイトゲートがモデルを選択するプロアクティブ(インプットベース)ルーティングについて検討する。
安全なルーティングをベースセーフレートとリスク予算にリンクする実現可能性条件と、実行可能なルーティングが存在することを保証する十分なAUCしきい値とを導出する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:38:43 GMT)
Adaptive Sliding Mode Control for Vehicle Platoons with State-Dependent Friction Uncertainty [0.5] 本論文では、車輪付き移動ロボットを用いた車両プラトンのための適応型スライディングモードコントローラを提案する。
摩擦力の未知の複雑な挙動を、そのパラメータや構造を事前に知ることなく扱える。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:07:11 GMT)
s2n-bignum-bench: A practical benchmark for evaluating low-level code reasoning of LLMs [0.5] s2n-bignumは、暗号化の高速なアセンブリルーチンを提供するためにAWSで使用されるライブラリである。
textits2n-bignum-bench では、正式な仕様を提供し、HOL Light で受け入れられる証明スクリプトを生成するよう LLM に依頼する。
このベンチマークは、競争数学を超えて証明された LLM ベースの定理を評価する上で、挑戦的で実用的なテストベッドを提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:55:59 GMT)
Life cycle assessment for all organic chemicals [0.4] 本稿ではCRYSTAL(Chemical RetrosYnthesiS for Transparent Assessment of Life-cycles)フレームワークについて紹介する。
CRYSTALは、その分子構造に基づいて、有機化学の一貫性と透明なLCIデータを自動的に生成する。
我々は70000以上の有機化学物質を一貫したデータベースを作成し、110000以上の透明なLCIデータセットで構成されています。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:53:29 GMT)
A Heterogeneous Ensemble for Multi-Center COVID-19 Classification from Chest CT Scans [0.4] 3つの推論パラダイムにまたがる9つのモデルの異種アンサンブルを示す。
アンサンブルは4つの病院センターで平均0.9280のマクロF1を達成し、最高のシングルモデルを上回っている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:34:59 GMT)
Semi-Automatic Flute Robot and Its Acoustic Sensing [0.4] 我々は,自動指操作機構を備えたセミオートマチックフルートロボットを開発した。
14のサーボモーターはMIDI入力に応じて、ワイヤベースおよびラック・アンド・ピニオン・ドライブを介して全てのキーを作動させる。
頭部関節回転は40.00ms以内で完了した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:02:36 GMT)
Geometric and Topological Deep Learning for Predicting Thermo-mechanical Performance in Cold Spray Deposition Process Modeling [0.3] 本研究では,有限要素シミュレーションデータを用いた寒冷噴霧粒子衝突応答予測のための幾何学的深層学習フレームワークを提案する。
パラメトリックデータセットは、粒子速度、粒子温度、摩擦係数の体系的な範囲にまたがる自動Abaqusシミュレーションによって生成された。
グラフSAGE型インダクティブグラフニューラルネットワーク,チェビシェフスペクトルグラフ畳み込みネットワーク,トポロジカルデータ解析拡張多層パーセプトロン,幾何学的アテンションネットワークの4つの新しいアルゴリズムを実装し,評価した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:46:05 GMT)
Mining the YARA Ecosystem: From Ad-Hoc Sharing to Data-Driven Threat Intelligence [0.3] YARAは「コードとしての判断」のデファクトスタンダードとして自らを確立している。
広く使われているにもかかわらず、オープンソースのYARAエコシステムはアドホックな共有と不透明な品質が特徴である。
我々は,1,853のGitHubリポジトリから抽出した840万のルールについて,大規模な混合メソッド調査を行った。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:01:13 GMT)
WorldVLM: Combining World Model Forecasting and Vision-Language Reasoning [0.3] 視覚言語モデル (VLM) と世界モデル (WM) を統合するハイブリッドアーキテクチャ WorldVLM を提案する。
我々の設計では、高レベルなVLMは駆動WMを誘導する動作コマンドを生成し、解釈可能かつコンテキスト対応な動作を可能にする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:26:59 GMT)
How to find expressible and trainable parameterized quantum circuits? [0.2] トレーニング性と表現性を組み合わせた回路を同定するための特性に基づくアンザッツ探索フレームワークを提案する。
実量子コンピュータ上での実用可能性を示し、変分量子アルゴリズムに適用する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:54:30 GMT)
Flood Risk Follows Valleys, Not Grids: Graph Neural Networks for Flash Flood Susceptibility Mapping in Himachal Pradesh with Conformal Uncertainty Quantification [0.2] 洪水はインドのヒマハル・プラデーシュで最も破壊的な自然災害であり、2023年のモンスーンシーズンだけで400人以上が死亡し、12億ドルの損失を出した。
既存のリスクマップはすべてのピクセルを独立して扱う。
我々は、流域接続グラフに基づいて訓練されたグラフニューラルネットワーク(GraphSAGE)でこの問題に対処する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:54:24 GMT)
Ternary Gamma Semirings: From Neural Implementation to Categorical Foundations [0.1] 本稿では,ニューラルネットワーク学習と抽象代数構造を結合する理論的枠組みを確立する。
まず、標準ニューラルネットワークが合成一般化タスクで完全に失敗することを示す最小限の反例を示す。
この学習された特徴空間が有限可換3次3次3次$-semiringを構成することを証明し、その3次演算は多数決ルールを実装している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:56:33 GMT)
Sampling Boltzmann distributions via normalizing flow approximation of transport maps [0.1] 基準測度と真のボルツマン分布の間の正規化フローの存在をワッサーシュタイン距離における任意の小さな誤差まで証明する。
我々は、RealNVPアーキテクチャが平衡ボルツマン分布だけでなく、メタスタブルダイナミクスをうまく捉えていることを観察する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:28:10 GMT)
Learning to Forget: Sleep-Inspired Memory Consolidation for Resolving Proactive Interference in Large Language Models [0.1] 大規模言語モデル (LLM) はプロアクティブ干渉 (PI) に悩まされ、コンテキストウィンドウの古い情報が現在の値の検索を妨害する。
キー値(KV)キャッシュ上で学習した睡眠サイクルでトランスフォーマーベースのLCMを増強するフレームワークであるSleepGateを提案する。
SleepGateは深さ5で99.5%、深さ10で97.0%、全ベースライン(フルKVキャッシュ、スライディングウインドウ、H2O、StreamingLLM、崩壊専用アブレーション)は18%以下である。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:54:43 GMT)
Anterior's Approach to Fairness Evaluation of Automated Prior Authorization System [0.1] 本稿では,承認結果ではなく,モデル誤り率に基づく事前承認モデルの公平性評価フレームワークを提案する。
7,166症例を対象に, 性別, 年齢, 人種・民族, 社会経済的地位の整合性を検討した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:05:24 GMT)
GPU-Accelerated Quantum Simulation of Stabilizer Circuits [0.1] 我々はGPU上の安定化回路(クリフォード回路)を効率的にシミュレートするための新しい並列アルゴリズムを提案する。
提案手法は,大規模な量子ビット数とマルチショットサンプリングのためのGPUアクセラレーション安定化シミュレータであるQuaSARQで実装されている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 22:34:36 GMT)
On aggregation-quantization permutability problem for discrete-time Markov chains [0.1] グラフ上のランダムウォークが与えられた場合、対応する離散時間量子ウォークは、Szegedyによって提案された手法を用いて構築することができる。
集約手法を量子マルコフ連鎖のレベルまで拡張する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:01:47 GMT)
Drift and selection in LLM text ecosystems [0.0] 公開のテキスト記録は、そのアウトプットによってますます形づくられている。
可変次$n$-gramのエージェントをベースとした,このプロセスのためのフレームワークを開発する。
出版物が公開テキストを圧縮し、選択的なフィルタリングがよりリッチな構造を維持するかどうかを識別する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:28:38 GMT)
Phase-preserving control of Floquet-engineered cavity quantum electrodynamics [0.0] 時間変調キャビティ内の2レベルシステムにおける光-物質相互作用のコヒーレント制御のためのフロケットエンジニアリングフレームワーク
この結果は、駆動量子システムの基本物理に関する新たな知見を提供し、コヒーレントな量子情報処理のための強力なツールとしてフロッケ工学を確立した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 08:25:19 GMT)
Whether, Not Which: Mechanistic Interpretability Reveals Dissociable Affect Reception and Emotion Categorization in LLMs [0.0] 臨床心理学を基礎とした機械的解釈可能性法による感情回路クレームの臨床的妥当性試験を初めて行った。
我々は2つの解離可能な感情処理機構を発見する。
我々は,大規模言語モデルにおける感情処理のクレームをテストするための厳格な基準として,臨床刺激法を紹介した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:11:45 GMT)
Variance reduction for forces and pressure in variational Monte Carlo [0.0] 基礎となるアイデアは、ペア相関や角分布関数など、他の観測可能量に対してより広く適用されることを示す。
標準モンテカルロ符号で実装し易い周期系に対するコンパクトな分散還元推定器を導出する。
このアプローチは、100以上の原子を持つ高圧の金属水素に対して、神経量子状態によって説明される。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:58:19 GMT)
Trust Over Fear: How Motivation Framing in System Prompts Affects AI Agent Debugging Depth [0.0] システムにおける信頼ベースと恐怖ベースのモチベーションフレーミングがAIエージェントのパフォーマンスにどのように影響するかを検討する。
信頼関係のエージェントは、さらに59%の隠れた問題を発見し、さらに83%の捜査措置を講じた。
Fear-framed (PUA) エージェントは, 基準値よりも有意な改善は認められなかった。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:25:52 GMT)
Toward Secure Web to ERP Payment Flows: A Case Study of HTTP Header Trust Failures in SAP Based Systems [0.0] 本稿では、SAPに基づく支払いフローの匿名化事例を振り返りとして提示する。
私たちは、HTTPレベルのバリデーションの弱点を示し、フロントエンドアプリケーションが未払いのトランザクションを完了時に誤って処理できるようにしました。
本稿では,ERP支払い処理にセキュアなWebを実現するための具体的な設計と検証手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:02:52 GMT)
The Scenic Route to Deception: Dark Patterns and Explainability Pitfalls in Conversational Navigation [0.0] 我々は,会話インターフェースが操作のリスクと不適切な信頼をもたらすことを論じる。
意図と起源に基づいた2x2フレームワークを使用して、これらのリスクを分類します。
信頼性の高い対話ナビゲーションを運用する方法の1つは、ニューロシンボリックアーキテクチャによるものであることを示唆する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:10:00 GMT)
The Provenance Paradox in Multi-Agent LLM Routing: Delegation Contracts and Attested Identity in LDP [0.0] デリゲートが自己報告された品質スコアをインフレーションできる場合、品質ベースのルーティングは証明されたパラドックスを生成する。
LLM Delegate Protocol(LDP)を拡張し、明確な目的、予算、障害ポリシを通じて権限を束縛する委譲契約を締結します。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:36:58 GMT)
The Human Condition as Reflected in Contemporary Large Language Models [0.0] 我々は,文化テーマの限定的なセットにおいて,堅牢なクロスモデルコンセンサスを同定する。
テーマには、物語的意味形成、感情第一認知、連帯心理学、ステータス・コンペティション、脅威感受性、道徳的合理化などがある。
我々は、LLMは文化的凝縮体として機能し、人間がどのように自らの社会生活を表現し、正当化し、争うかを圧縮した表現であると主張している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:34:39 GMT)
TACTIC for Navigating the Unknown: Tabular Anomaly deteCTion via In-Context inference [0.0] インコンテキスト学習は、タスク固有の最適化から大規模事前学習へと取り組みを移す新しいパラダイムとして登場した。
本稿では,異常検出のためのコンテキスト内モデルについて検討し,TabPFNの教師なし拡張が不安定な動作を示すことを示す。
本稿では,異常中心の合成前駆体を用いた事前学習に基づくコンテキスト内異常検出手法であるTACTICを紹介する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 01:06:24 GMT)
SuperLocalMemory V3: Information-Geometric Foundations for Zero-LLM Enterprise Agent Memory [0.0] 永続メモリはAIエージェントの中心的な能力である。
現在のシステムでは、検索にはコサイン類似性、塩分分解にはコサイン類似性を使用し、公式な矛盾検出は行わない。
我々は3つのコントリビューションを通じて情報幾何学の基礎を確立する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:20:54 GMT)
Solution for 10th Competition on Ambivalence/Hesitancy (AH) Video Recognition Challenge using Divergence-Based Multimodal Fusion [0.0] 第10回ABAWコンペティション(CVPR 2026)におけるA/Hビデオ認識チャレンジへの取り組み
本稿では,視覚的,音声的,テキスト的チャネル間の相互競合を明示的に測定する分散型マルチモーダル融合を提案する。
提案手法は, 検証テストセットにおいて0.6808のマクロF1を達成し, 課題ベースラインの0.2827を上回った。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:37:25 GMT)
Selective Fine-Tuning of GPT Architectures for Parameter-Efficient Clinical Text Classification [0.0] 本研究は,GPT-2を臨床テキスト分類タスクに適用するためのパラメータ効率の選択的微調整フレームワークを提案する。
事前訓練されたモデル全体を更新する代わりに、ほとんどのネットワークパラメータは凍結され、トレーニング中に最終トランスフォーマーブロック、最終層正規化モジュール、軽量分類ヘッドのみが更新される。
5万件の実験では、選択的な微調整がおよそ91%の分類精度を達成し、モデルパラメータの6%未満を更新している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 02:16:06 GMT)
STAG-CN: Spatio-Temporal Apiary Graph Convolutional Network for Disease Onset Prediction in Beehive Sensor Networks [0.0] ハチのコロニーの被害は世界の受粉サービスを脅かすが、現在の監視システムはそれぞれの巣を孤立した単位として扱う。
本稿では,病気発生予測のための階層間関係をモデル化するグラフニューラルネットワークである,時空間グラフ畳み込みネットワーク(STAG-CN)を紹介する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:13:01 GMT)
Reversible Lifetime Semantics for Quantum Programs [0.0] 本稿では,emphScope-Bunded Liveness-Guided Uncomputationの形式モデルを提案する。
ネストしたスコープにおける構成的正しさを証明し,臨界パスオーバーヘッドを回避し,早期再生により回路深度を低減できることを示す。
自動計算を制限しなければならない制約(可逆性、永続的絡み合い、エイリアス)を特徴付ける。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:25:59 GMT)
Questionnaire Responses Do not Capture the Safety of AI Agents [0.0] 急速に成長するAI研究の分野は、このようなアセスメントの開発に費やされている。
標準手法は、仮説的なシナリオでそれらの値や振る舞いを記述するために、アンケート形式で大きな言語モデル(LLM)を誘導する。
構造的に同一の問題は、現在のAIアライメントアプローチに当てはまる、と私たちは主張する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:01:09 GMT)
Quantum Enhanced Pauli Propagation [0.0] 本稿では,量子資源を用いた近似古典パウリパスシミュレーションの精度向上のためのハイブリッドアルゴリズムを提案する。
ノイズ量子期待値は、ターゲット回路の量子実行を補正する大域的再スケーリング因子を推論するために使用される。
QuEPPは、単純でスケーラブルでモデルなしのフレームワークを提供し、フォールトトレラント時代の正確な量子計算を可能にする。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:04:36 GMT)
Punctuated Equilibria in Artificial Intelligence: The Institutional Scaling Law and the Speciation of Sovereign AI [0.0] AI開発はスムーズな進歩ではなく、急激な位相遷移によって中断された長期の停滞を経て進行することを示す。
我々は、能力、制度的信頼、可買性、主権コンプライアンスの4つの側面に沿ってAIシステムを評価する数学的枠組みを開発する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:36:01 GMT)
PulmoVec: A Two-Stage Stacking Meta-Learning Architecture Built on the HeAR Foundation Model for Multi-Task Classification of Pediatric Respiratory Sounds [0.0] PulmoVecは、小児呼吸音の分類のためのマルチタスクフレームワークである。
事象レベルの音響表現型と患者レベルの臨床分類を結びつける。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:13:47 GMT)
OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions [0.0] シーケンシャルなモデリングにおいて優れたトランスフォーマーアーキテクチャは、相関学習によって基本的に制限される。
そこで我々はOrthoFormerを提案する。OrthoFormerは機械的変数推定をニューラル制御機能を介してTransformerブロックに直接組み込む因果的基底アーキテクチャである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:16:51 GMT)
Multilingual TinyStories: A Synthetic Combinatorial Corpus of Indic Children's Stories for Training Small Language Models [0.0] TinyStoriesデータセット(TinyStories data)は、17のインド語を含む子供向け物語の大規模で合成的に生成された集合体である。
私たちはリリースで132,942のストーリーと939万のトークンをコンパイルしました。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:31:47 GMT)
Multi-qubit controlled gate with optimal T-count [0.0] 許容エラー$varepsilon$, $3log (1/varepsilon)$T$ゲートは、ほとんどのマルチキュービット制御SU(2)を近似するのに十分であることを示す。
また、このTカウントは、ほぼ制御されたゲートの使用が禁止されている場合に、下界と一致することを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 03:22:15 GMT)
Mixed-State Entanglement in a Minimal Model of Quantum Chaos [0.0] 量子カオスの最小モデルであるキックフィールドイジングモデルにおける混合状態絡みの拡散について検討する。
レプリカのトリックとモデルの時空双対性を組み合わせることで、部分転置された還元密度行列の正確なスペクトルを決定する。
結果として生じる平坦スペクトルは、初期における絡み合いの負性、奇妙なエントロピー、レニイの相互情報の間に正確な関係をもたらす。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:09:01 GMT)
Microwave spin resonance in epitaxial thin films of spin liquid candidate TbInO3 [0.0] 量子スピン状態は、結晶格子接続が順序付けされる局所的な磁気モーメントのモデルに現れる。
本研究では,スピン液体候補TbInO3のエピタキシャル成長薄膜における磁気励起の探索にコプラナー超伝導共振器を用いる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:39:13 GMT)
LLM-Augmented Release Intelligence: Automated Change Summarization and Impact Analysis in Cloud-Native CI/CD Pipelines [0.0] クラウドネイティブなソフトウェアデリバリプラットフォームは、数十の独立したバージョン管理タスクで構成される複雑なマルチステージパイプラインを通じて、リリースをオーケストレーションする。
このようなリリースコミュニケーションのマニュアル準備は遅く、一貫性がなく、特にリポジトリではエラーが発生します。
1) 自動コミット収集とセマンティックフィルタリングを併用して,定期的なメンテナンスを抑えながら実体的変化を表面化する,(2) 階層化された大規模言語モデル要約による分類,利害関係者指向のプロモーションレポートの生成,(3) 修正タスクを参加者が参加するパイプライン毎にマップする静的タスク-パイプライン依存性分析, そして各変更のブラスト半径を定量化する,という3つの機能を組み合わせたAI強化リリースインテリジェンスのためのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:30:52 GMT)
ISTQB Certifications Under the Lens: Their Contributions to the Software-Testing Profession; and AI-assisted Synthesis of Practitioners' Endorsements and Criticisms [0.0] 我々は,AI支援型多言語文学レビュー(MLR)を実施し,実践者の支持と批判を総合した。
我々は、4人の独立した専門家のパネルに、支持の正確さと批判の公正さを評価するよう依頼した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:51:20 GMT)
IQP Born Machines under Data-dependent and Agnostic Initialization Strategies [0.0] 量子回路 瞬時量子時間(IQP)回路に基づくマシンは、量子生成モデリングの自然な候補である。
最近の提案では,低ボディのPauli-$Z$orsで構築した平均最大離散性(MMD)損失を用いたIQP-QCBMのトレーニングに重点を置いている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 19:54:04 GMT)
Hydrodynamic Performance Enhancement of Unmanned Underwater Gliders with Soft Robotic Morphing Wings for Agility Improvement [0.0] 本研究は, 軟式変圧翼を備えた水中無人車両の流体力学的効率を評価するものである。
その結果、UUVが軟翼を採用すれば、従来の剛翼と同等の車両よりも、全体的な効率が9.75パーセント向上することがわかった。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:21:17 GMT)
Histo-MExNet: A Unified Framework for Real-World, Cross-Magnification, and Trustworthy Breast Cancer Histopathology [0.0] Histo-MExNetは、スケール不変性と不確実性を認識した分類のために設計された統一フレームワークである。
Modelは、DenseNet、ConvNeXt、EfficientNetのバックボーンを、ゲート付きマルチエキスパートアーキテクチャに統合する。
BreaKHisデータセットでは、Histo-MExNetが96.97%の精度を達成している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:01:00 GMT)
Graph-Based Deep Learning for Intelligent Detection of Energy Losses, Theft, and Operational Inefficiencies in Oil & Gas Production Networks [0.0] エネルギー損失、盗難、運用不効率の早期発見は、石油・ガス生産システムにおいて重要な課題である。
伝統的な機械学習アプローチは、生産単位を独立して扱い、時間分布シフトの下で苦労することが多い。
本研究では,石油・ガス生産ネットワークにおける異常検出のためのグラフベースディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:40:37 GMT)
Gradient Boosting for Spatial Panel Models with Random and Fixed Effects [0.0] 本稿では,低次元および高次元の設定において,解釈可能な結果による推定が可能なモデルベース勾配向上アルゴリズムを提案する。
モジュラー性のため、フレキシブルなモデルベース勾配促進アルゴリズムは様々な空間パネルモデルに適している。
現実の応用としては、イタリア地区における非生命保険、インドネシアの農場での稲作、ドイツ地区での寿命などが挙げられる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:33:56 GMT)
Gradient Atoms: Unsupervised Discovery, Attribution and Steering of Model Behaviors via Sparse Decomposition of Training Gradients [0.0] トレーニングデータ属性(TDA)メソッドは、モデルの振る舞いにどのトレーニングドキュメントが責任を持つかを問う。
この文書単位のフレーミングは、微調整が実際にどのように機能するかと根本的には一致していない、と私たちは主張する。
ドキュメントごとのトレーニング勾配をスパースコンポーネントに分解する、教師なしの方法であるGradient Atomsを提案する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:39:36 GMT)
Governing Dynamic Capabilities: Cryptographic Binding and Reproducibility Verification for AI Agent Tool Use [0.0] AIエージェントは、MPPとA2Aを介して実行時に機能を動的に取得する。
サイレントな能力エスカレーションを可能にし、EU AI Actトレーサビリティ要件に違反します。
能力バウンドエージェント証明書は、スキルマニフェストハッシュでX.509 v3を拡張する。
検証可能な相互作用台帳は、複数エージェントの法医学的再構築のためにハッシュリンクされた署名された記録を提供する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 11:46:57 GMT)
Geometry-Aware Set-Membership Multilateration: Directional Bounds and Anchor Selection [0.0] 本研究では、未知だが有界な測定誤差の下で、レンジに基づく局所化のためのアンカー選択について検討する。
幾何学に基づく部分集合選択はオラクル探索に近く、Dスコアが領域指向計量のEスコアを支配しており、新しい$Hset$-aware証明書は選択された局所化集合の実現されたサイズを密に追跡していることを示す。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 07:47:24 GMT)
From Natural Language to PromQL: A Catalog-Driven Framework with Dynamic Temporal Resolution for Cloud-Native Observability [0.0] 本稿では、自然言語質問を実行可能なPromQLクエリに変換するカタログ駆動フレームワークを提案する。
システムはAIワークロードを管理する運用クラスタにデプロイされている。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:48:15 GMT)
FlashHead: Efficient Drop-In Replacement for the Classification Head in Language Model Inference [0.0] 我々はFlashHeadを紹介します。これは、トレーニング不要でハードウェアフレンドリーな、高密度な分類ヘッドの代替品です。
FlashHeadは、情報検索の原則に基づいて、出力ヘッドでの計算を検索問題として再定義する。
我々は、FlashHeadがモデルレベルの推論スピードアップを textbf1.75x まで提供し、元のヘッドと比較して出力精度を維持することを示した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 20:26:42 GMT)
FactorSmith: Agentic Simulation Generation via Markov Decision Process Decomposition with Planner-Designer-Critic Refinement [0.0] FactorSmithは、テキスト記述からコードでプレイ可能なゲームシミュレーションを合成するフレームワークである。
提案手法はシミュレーション仕様をモジュラーステップに分解し,各ステップは関連する状態変数の最小サブセットでのみ動作する。
PyGame Learning Environmentベンチマークの実験では、FacterSmithは、プロンプトアライメントの改善、ランタイムエラーの低減、コード品質の向上によるシミュレーションを生成する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 09:42:20 GMT)
Extending Minimal Pairs with Ordinal Surprisal Curves and Entropy Across Applied Domains [0.0] 本研究は,二項文法から順序スケールの分類とスコアリングタスクまで,素性に基づく評価を拡張した。
モデルに回答を求めるのではなく、情報理論の「サプライズ」を測る。
この枠組みは, 社会・生態・技術系の分類, 因果文の識別(バイナリとスケール), 図形言語検出, 帰納的定性的符号化の4分野にまたがる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 14:31:00 GMT)
Expert Mind: A Retrieval-Augmented Architecture for Expert Knowledge Preservation in the Energy Sector [0.0] Expert Mindは、Retrieval-Augmented Generation (RAG)、大規模言語モデル(LLM)、マルチモーダルキャプチャ技術を活用する実験システムである。
提案システムは,構造化インタビュー,シンク・アラウドセッション,テキスト・コーパスの取り込みを通じて,知識の活用問題に対処する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:32:12 GMT)
Exact characterizations for quantum conditional mutual information and some other entropies [0.0] リーブとルスカイの和定理は条件付き相互情報は非負でなければならないことを示している。
我々は、他のエントロピーの特徴とともに、相互情報の要約特性を提供することで、この問題を変換する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:08:57 GMT)
Evaluating Calibration-Based Digital Twins for IBM Quantum Hardware Simulation [0.0] キャリブレーションに基づくIBM Quantumハードウェアのディジタルツインの評価を行った。
ダウンロード可能なキャリブレーションCSVファイルから双子を構築します。
我々は、共通の実行および検証プロトコルの下で、4つの2つの変種を比較した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 21:03:23 GMT)
Estimating condition number with Graph Neural Networks [0.0] グラフニューラルネットワーク(GNN)を用いたスパース行列の条件数推定法を提案する。
GNNを用いて行列条件数を推定するための2つの予測スキームを提案する。1つは条件番号を分解し、より計算集約的な部分$|mathbfA-1|$を予測し、もう1つは条件番号$を予測する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:37:03 GMT)
Emotional Cost Functions for AI Safety: Teaching Agents to Feel the Weight of Irreversible Consequences [0.0] 人間は、数値的な罰ではなく、自分が誰であるかを想起する質的な苦しみを通して破滅的な間違いから学ぶ。
現在のAIの安全性アプローチは、これらを複製しない。
金融取引、危機支援、コンテンツに関する10の実験は、質的な苦しみが麻痺を一般化するよりも特定の知恵を生み出すことを示している。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 18:16:49 GMT)
Echoes Across Centuries: Phonetic Signatures of Persian Poets [0.0] この研究は、83人の詩人によって書かれた31,988首の詩から、1,116,306首のメスラスの大規模なコーパスを描いている。
各行は、グラフから音素への表現に変換され、6つの音韻指標を用いて分析される。
この研究はペルシャ詩における音声分析のためのコーパススケールの枠組みを確立する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 15:41:21 GMT)
EARCP: Self-Regulating Coherence-Aware Ensemble Architecture for Sequential Decision Making -- Ensemble Auto-Regule par Coherence et Performance [0.0] 本稿では,個々の性能とモデル間コヒーレンスに基づいて,専門家モデルを動的に重み付けする新しいアンサンブルアーキテクチャEARCPを提案する。
静的またはオフライン学習の組み合わせに依存する従来のアンサンブル法とは異なり、EARCPは原則化されたオンライン学習メカニズムを通じてモデルの重みを継続的に適用する。
このアーキテクチャは、乗法的重み更新アルゴリズムの理論的基礎と、新しいコヒーレンスベースの正規化項を組み合わせる。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:09:32 GMT)
Distilling Reasoning Without Knowledge: A Framework for Reliable LLMs [0.0] 本稿では,実際の検索と回答の合成からプランニングを分離するモジュラーフレームワークを提案する。
ライトウェイトな学生プランナーは、教師-学生フレームワークを介して訓練され、構造化された分解を生成する。
提案手法をSEAL-0(SEAL-0)で評価した。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 16:06:54 GMT)
Detecting Privilege Escalation with Temporal Braid Groups [0.0] ブラウ・リャプノフ指数LEを代数的プローブとして、2つのリスク状態の境界を求める。
分散と集中と呼ばれる2つの際立ったリスク体制を識別するために、それを活用する方法を示します。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 12:05:22 GMT)
Cryptographic Runtime Governance for Autonomous AI Systems: The Aegis Architecture for Verifiable Policy Enforcement [0.0] 本稿では,自律型AIシステムのためのランタイムガバナンスアーキテクチャであるAegisについて述べる。
エージスは政策と法的制約を諮問の原則よりも実行条件として扱う。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:04:57 GMT)
Convergence of Two Time-Scale Stochastic Approximation: A Martingale Approach [0.0] ボルカール (1997) で導入された2つの時間スケール近似 (TTSSA) アルゴリズムを, マーチンゲール法を用いて解析した。
我々の理論は非線形方程式に適用できるが、TSSAの文献では方程式が線型であると仮定する多くの論文とは対照的である。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:00:28 GMT)
Computing logical error thresholds with the Pauli Frame Sparse Representation [0.0] 本稿では,クリフォード演算やパウリ誤差以外の量子誤差補正しきい値の古典的予測を推し進めるために,スパース古典表現,トランケーション戦略,ショット効率サンプリング手法を導入する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:54:37 GMT)
Computational Analysis of Semantic Connections Between Herman Melville Reading and Writing [0.0] 本研究では,Herman Melville 読解が自身の著作に与える影響について,計算意味的類似性分析を通じて検討した。
我々は、彼の作品から選ばれた節を彼の図書館のテキストと比較する。
この手法はテキストを文レベルと非重なり合う5-gramレベルの両方で分割し、続いてBERTScoreを用いて類似性計算を行う。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:59:35 GMT)
Comparative Analysis of 3D Convolutional and 2.5D Slice-Conditioned U-Net Architectures for MRI Super-Resolution via Elucidated Diffusion Models [0.0] 脳MRI SRのためのEDM(Elucidated diffusion model)フレームワークについて検討した。
2つのU-Netバックボーンアーキテクチャを比較する: 3次元畳み込みとマルチヘッド自己アテンションを備えたボリュームパッチを処理するフル3次元畳み込みU-Netと、隣り合うスライスに条件付けしながら各スライスを独立して解決する2.5Dスライス条件付きU-Netである。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:48:29 GMT)
Beyond Means: Topological Causal Effects under Persistent-Homology Ignorability [0.0] 標準的な障害モードは、制御結果が一様であり、処理結果が二様になり、両方の分布が同じ平均を持つときに発生する。
本稿では, 永続的ホモロジーに基づくトポロジ的因果関係の枠組みを開発する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 01:03:32 GMT)
A Systematic Comparison and Evaluation of Building Ontologies for Deploying Data-Driven Analytics in Smart Buildings [0.0] オントロジは、データ交換、情報統合、セマンティックな再利用、知識共有において重要な役割を果たす。
しかし、ビルディングの違いは、データの相互運用性をもたらすという目的を妨げ、現実世界のアプリケーションでビルディングを再利用する能力を制限します。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 13:26:37 GMT)
A Survey of Reinforcement Learning For Economics [0.0] 強化学習アルゴリズムは、動的プログラミングの自然なサンプルベースの拡張を提供する。
私は古典的計画と近代的な学習アルゴリズムを結びつける理論をレビューする。
これらのアルゴリズムの実用的脆弱性について検討する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 17:49:37 GMT)
A Real-Time Neuro-Symbolic Ethical Governor for Safe Decision Control in Autonomous Robotic Manipulation [0.0] 本稿では,自律型ロボット操作作業におけるリスク認識型監督制御を実現するために,リアルタイムな神経象徴的倫理的知事を提案する。
提案フレームワークは、トランスフォーマーに基づく倫理的推論と確率論的倫理的リスクフィールドの定式化を統合する。
提案手法の有効性は,シミュレーションされた自律型ロボットアームタスクシナリオを用いて検証する。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 04:50:45 GMT)
A Methodology for Thermal Limit Bias Predictability Through Artificial Intelligence [0.0] 原子力発電所の運用者は、オフラインとオンラインの熱の限界が予測できないほどずれているため、課題に直面している。
この研究は、ボイリングウォーターリアクタに対して、このバイアスを予測し、修正するためのディープラーニングベースの方法論を提示します。
このモデルでは、平均結節配列誤差を74%減らし、制限値の平均絶対偏差を72%減らし、最大偏差を52%減らした。
論文参考訳(メタデータ) (Sun, 15 Mar 2026 23:06:13 GMT)