Fugu-MT: arxivの論文翻訳(概要)

Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey [171.7]
3D再構成とビュー合成は、拡張現実(AR)、仮想現実(VR)、デジタルツインといった没入型技術における基礎的な問題である。深層学習によるフィードフォワードアプローチの最近の進歩は、高速で一般化可能な3次元再構成とビュー合成を可能にして、この分野に革命をもたらした。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:51:24 GMT)
Discrete Audio Tokens: More Than a Survey! [137.4]
本稿では,離散型音声トークンの体系的レビューとベンチマークを行う。音声、音楽、一般的なオーディオドメインをカバーしている。本稿では,エンコーダデコーダ,量子化技術,トレーニングパラダイム,ストリーム性,アプリケーションドメインに基づくトークン化アプローチの分類法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:26:57 GMT)
Continual Learning for Generative Retrieval over Dynamic Corpora [115.8]
生成検索(GR)はパラメトリックモデルに基づいて関連文書の識別子(ドシデクス)を直接予測する。クエリに応答する能力を保ちながら、新しいドキュメントをインクリメンタルにインデックスする能力は、GRモデルを適用する上で不可欠である。我々は,CLEVERモデルのための新しい連続学習モデルを提案し,GRのための連続学習に2つの大きな貢献をした。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:20:11 GMT)
Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR [110.9]
RLVRトレーニングのためのオンライン変分問題合成(SvS)戦略を提案する。この戦略は、トレーニング中のポリシーのエントロピーを効果的に維持し、標準のRLVRと比較してPass@kを大幅に改善する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:50:53 GMT)
Advancing Marine Research: UWSAM Framework and UIIS10K Dataset for Precise Underwater Instance Segmentation [110.0]
大規模な水中インスタンスセグメンテーションデータセットであるUIIS10Kを提案する。次に,水中インスタンスの自動・高精度セグメンテーションのための効率的なモデルであるUWSAMを紹介する。複数の水中インスタンスデータセット上での最先端手法よりも優れた性能向上を実現し,本モデルの有効性を示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:10:30 GMT)
CoDA: Coding LM via Diffusion Adaptation [102.6]
CoDAは、コード中心のミッドトレーニングとインストラクションチューニングによる大規模な拡散事前トレーニングをペアリングする。 Humaneval、MBPP、EvalPlusでは、CoDA-1.7B-Instructは最大7Bパラメータの拡散モデルに一致するか、超える。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:41:55 GMT)
OmniGen2: Exploration to Advanced Multimodal Generation [102.6]
我々はOmniGen2を紹介した。OmniGen2は多種多様な生成タスクに統一されたソリューションを提供するために設計された汎用的でオープンソースな生成モデルである。 OmniGen v1とは異なり、OmniGen2はテキストと画像のモダリティのための2つの異なるデコードパスを備えており、未共有のパラメータと分離された画像トークンを使用する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:42:28 GMT)
Power Battery Detection [92.0]
電力電池は、内部構造欠陥が深刻な安全リスクを生じさせる電気自動車において必須の部品である。我々は,X線画像から陰極および陽極板の密集端を局所化し,品質検査を行うことを目的として,電力電池検出(PBD)に関する総合的研究を行った。 PBD5Kは,9種類のバッテリタイプから5,000枚のX線画像と8種類の実世界の視覚的干渉を含む,このタスクのための最初の大規模ベンチマークである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:32:54 GMT)
Spiking Meets Attention: Efficient Remote Sensing Image Super-Resolution with Attention Spiking Neural Networks [86.3]
従来の人工ニューラルネットワーク(ANN)の代替手段としてスパイキングニューラルネットワーク(SNN)が登場本稿では,AID,DOTA,DIORなどのリモートセンシングベンチマークにおいて,最先端の性能を実現するSpikeSRを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:18:19 GMT)
How to Make Large Language Models Generate 100% Valid Molecules? [82.9]
大規模言語モデル(LLM)は、いくつかの例から幅広いタスクを実行することを学べる。 SMILESのような表現を使って有効な分子を生成することは、数ショット設定でLLMにとって難しい。無効なSMILES訂正のためのクロスケミカル言語フレームワークであるSmiSelfを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:14:19 GMT)
Beyond Outliers: A Study of Optimizers Under Quantization [82.8]
量子化下でのモデルロバスト性に対する選択の影響について検討する。モデルの性能が、異なるベースラインでトレーニングした場合にどのように低下するかを評価する。異なるパラメータによる量子化対応トレーニングのスケーリング法則を導出する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:15:22 GMT)
What Makes a Reward Model a Good Teacher? An Optimization Perspective [82.7]
報酬モデルがどの程度正確であるかに関わらず、低報酬分散を誘導した場合、RLHFの目的は平坦な景観に悩まされる。さらに、ある言語モデルでうまく機能する報酬モデルが、低い報酬分散を誘発し、したがって、別の言語モデルに対して平坦な客観的景観をもたらすことを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:06:18 GMT)
Discrete Diffusion Trajectory Alignment via Stepwise Decomposition [80.7]
離散拡散モデルに対する軌道アライメントにアプローチするオフライン選好最適化法を提案する。問題をステップ毎の後部をマッチングすることにより、段階的にアライメントする目的の集合に分解する。 DNA配列設計、タンパク質の逆フォールディング、言語モデリングを含む複数の領域にわたる実験は、我々のアプローチの優位性を一貫して示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:22:59 GMT)
Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.8]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。 Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:48:15 GMT)
Object-AVEdit: An Object-level Audio-Visual Editing Model [79.6]
インバージョン再生パラダイムに基づくオブジェクトレベルの音声視覚編集を実現するtextbfObject-AVEditを提案する。編集中のオブジェクトレベルの制御性を実現するために,単語から音声へのオブジェクトの一致した音声生成モデルを開発した。より優れた構造情報保存とオブジェクトレベルの編集効果を実現するため,本アルゴリズムでは,倒立再生に最適化された編集アルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:12:13 GMT)
Multiplayer Nash Preference Optimization [79.2]
人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM)と人間の嗜好を整合させる標準パラダイムとして登場した。最近の研究は、2人プレイのナッシュゲームとしてアライメントを再構築し、ナッシュの学習を人間のフィードバック(NLHF)から引き起こした。マルチプレイヤーシステムにNLHFを一般化する新しいフレームワークであるMultiplayer Nash Preference Optimization (MNPO)を導入する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:18:33 GMT)
OracleGS: Grounding Generative Priors for Sparse-View Gaussian Splatting [78.7]
OracleGSは、Gaussian Splattingのスパースビューのために、生成的完全性と回帰的忠実性を調整している。提案手法は,多視点幾何学的証拠に先立って強力な生成条件を定め,幻覚的アーティファクトをフィルタリングし,非拘束領域における可塑性完備を保存している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:19:32 GMT)
Bridging the Gap Between Promise and Performance for Microscaling FP4 Quantization [77.7]
本研究は,MXFP4とNVFP4の学習後量子化に関する総合的研究である。本稿では,従来のGPTQ量子化アルゴリズムの変種であるMicro-Rotated-GPTQ(MR-GPTQ)を紹介する。 MR-GPTQは最先端の精度で一致または性能が向上することを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:22:21 GMT)
Diagnose, Localize, Align: A Full-Stack Framework for Reliable LLM Multi-Agent Systems under Instruction Conflicts [75.2]
LLM(Large Language Model)を利用したマルチエージェントシステム(MAS)は、複雑なタスクにおける協調推論、ツールの使用、役割特化調整を急速に進めている。しかし、信頼性クリティカルなデプロイメントは、体系的な障害モード、すなわち命令の競合による階層的コンプライアンスによって妨げられている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:43:34 GMT)
Revisiting Multivariate Time Series Forecasting with Missing Values [74.6]
現実の時系列では欠落値が一般的である。現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:57:48 GMT)
Agentic AI Reasoning for Mobile Edge General Intelligence: Fundamentals, Approaches, and Directions [74.4]
大規模言語モデル(LLM)は、強力な推論と自律的な意思決定能力を備えたエージェント人工知能(AI)の出現を可能にした。 Mobile Edge General Intelligence (MEGI)は、リアルタイムでプライバシ保護の推論をネットワークエッジにもたらす。本稿では,MEGIにおけるLLM推論の効率的な展開のための共同最適化フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:53:48 GMT)
Self-Consistency as a Free Lunch: Reducing Hallucinations in Vision-Language Models via Self-Reflection [71.8]
視覚言語モデルは、しばしば詳細を幻覚させ、既存のオブジェクトを生成するか、出力信頼性を損なう不正確な属性を生成する。本稿では、長文応答と短文応答の自己整合性を利用して、学習のための選好ペアを生成する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:37:11 GMT)
DentVLM: A Multimodal Vision-Language Model for Comprehensive Dental Diagnosis and Enhanced Clinical Practice [71.6]
本稿では,専門レベルの口腔疾患診断のために設計された視覚言語モデルであるDentVLMを紹介する。このモデルは、36の診断タスクで7つの2D経口画像モダリティを解釈できる。若年者歯科医師13名(36名中21名)の診断成績を上回り,12名中12名(36名中12名)の診断成績を上回りました。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:47:37 GMT)
Liaozhai through the Looking-Glass: On Paratextual Explicitation of Culture-Bound Terms in Machine Translation [70.4]
我々は、文学・翻訳研究からジェネットのパラテキスト論(1987年)を定式化し、機械翻訳におけるパラテキスト明示の課題を紹介した。古典中国語の短編集集Liaozhaiの4つの英訳から560の専門家対応パラテキストのデータセットを構築した。本研究は,言語的等価性を超えた機械翻訳におけるパラテクスト的明示の可能性を示すものである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:27:36 GMT)
Light of Normals: Unified Feature Representation for Universal Photometric Stereo [70.0]
現在のエンコーダは、照明と通常の情報が切り離されていることを保証できない。 i) 点、方向、環境光を集約する光アライメント監督機能を備えた光レジスタトークン。また,PS-Verseも導入した。PS-Verseは,幾何学的複雑性と照明の多様性を指標とした大規模合成データセットである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:00:35 GMT)
On the Same Wavelength? Evaluating Pragmatic Reasoning in Language Models across Broad Concepts [69.7]
本研究では,言語理解と言語生産の両面で,多種多様なLMについて検討する。最先端のLMは小さくはないが,言語理解において高い性能を発揮する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:48:29 GMT)
ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search [69.6]
本稿では,検索した文書の信頼性情報を明確に活用する,敵対的堅牢性のためのフレームワークであるReliabilityRAGを提案する。我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:36:42 GMT)
ReCalKV: Low-Rank KV Cache Compression via Head Reordering and Offline Calibration [69.6]
ReCalKVは,キーと値の調整を施した低ランクKVキャッシュ圧縮手法である。キーズでは、構造的に類似した頭部をグループにクラスタリングし、より正確な低ランク近似を可能にするSimisity aware Recontext (HSR)を提案する。本稿では,オフラインヘッドワイド値(OVC)を提案する。これはトレーニングなしでキャリブレーションデータを用いて,効率的に値予測行列を校正する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:37:40 GMT)
Toward Effective Tool-Integrated Reasoning via Self-Evolved Preference Learning [68.9]
Tool-Integrated Reasoning (TIR)により、大きな言語モデル(LLM)は、外部ツールを統合することで、内部推論能力を改善することができる。提案するTool-Lightは,LDMがTIRを効率的にかつ正確に実行できるようにするためのフレームワークである。 10個のデータセットの実験結果は、ツールライトの有効性を示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:53:37 GMT)
XL-Suite: Cross-Lingual Synthetic Training and Evaluation Data for Open-Ended Generation [68.0]
XL-Instructは高品質な合成データを生成する新しい技術である。 XL-AlpacaEvalは、大規模言語モデルの言語間生成能力を評価するための新しいベンチマークである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:42:25 GMT)
Understanding Catastrophic Interference On the Identifibility of Latent Representations [67.1]
破滅的な干渉、あるいは破滅的な忘れ(Caastrophic forgetting)は、機械学習の根本的な課題である。本稿では,破滅的干渉を識別問題として定式化する新しい理論枠組みを提案する。我々のアプローチは、合成データセットとベンチマークデータセットの両方で理論的保証と実用的なパフォーマンスの改善を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:53:32 GMT)
LogReasoner: Empowering LLMs with Expert-like Coarse-to-Fine Reasoning for Automated Log Analysis [66.8]
汎用大規模言語モデル(LLM)は、専門家の認識と整合した構造化推論を定式化し、推論ステップの正確な詳細を提供するのに苦労する。我々は,LLMが専門家のようなログ解析タスクを推論できるように設計された粗粒度拡張フレームワークであるLogReasonerを提案する。我々は,Qwen-2.5 や Llama-3 といったオープンソースの LLM を用いて,ログ解析の4つのタスクについてLogReasoner の評価を行った。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:42:42 GMT)
UniUGG: Unified 3D Understanding and Generation via Geometric-Semantic Encoding [65.6]
3Dモダリティのための最初の統一的理解・生成フレームワークUniUGGを紹介する。本フレームワークでは,LLMを用いて文や3次元表現の理解とデコードを行う。遅延拡散モデルを利用して高品質な3次元表現を生成する空間デコーダを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:04:09 GMT)
TreeRPO: Tree Relative Policy Optimization [65.5]
nameは、ツリーサンプリングを用いて、様々な推論ステップで報酬の数学的期待を推定する新しい方法である。 GRPOの集団相対的な報酬訓練機構に基づいて、木サンプリング時に生成されたステップレベルグループに基づいて報酬を革新的に計算する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:27:33 GMT)
Emergence of Superposition: Unveiling the Training Dynamics of Chain of Continuous Thought [64.4]
有向グラフ到達性問題に対する簡易な2層変圧器のトレーニング力学を理論的に解析する。分析の結果,連続的思考を用いたトレーニングでは,まずインデックスマッチングロジットが増加し,その後は軽度な仮定の下で拘束されることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:23:46 GMT)
Critique to Verify: Accurate and Honest Test-Time Scaling with RL-Trained Verifiers [64.0]
ミラー・クリティク(Mirror-Critique)は、情報的批評で検証者を訓練する枠組みである。我々は、高品質な批判データを合成するために、小さな命令調整モデルを展開する。結果として得られるミラー検証は、ソリューション毎に複数の批判を生成することで、候補ソリューションを評価するためにデプロイされる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:50:24 GMT)
In-2-4D: Inbetweening from Two Single-View Images to 4D Generation [63.7]
Inbetween-2-4Dという,2枚のシングルビュー画像を補間する4次元(つまり3D + モーション)の生成問題を提案する。テキストや1つの画像のみからの映像/4D生成とは対照的に、補間タスクはより正確なモーション制御を利用して生成をよりよく制約することができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:04:11 GMT)
DiffTex: Differentiable Texturing for Architectural Proxy Models [63.4]
非秩序な写真からテクセルレベルでアーキテクチャプロキシモデルのための現実的なテクスチャマップを自動生成する手法を提案する。提案手法は,UVマップ上のテックセルと入力画像中のピクセルとの対応性を確立し,各テクセルの色を関連するピクセル値の重み付けとして計算する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:39:53 GMT)
Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.5]
本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:43:04 GMT)
Depth-Breadth Synergy in RLVR: Unlocking LLM Reasoning Gains with Adaptive Exploration [61.4]
Reinforcement Learning with Verifiable Reward (RLVR)は、大規模言語モデルにおける推論能力をアンロックするための強力なパラダイムとして登場した。 RLVRの完全なポテンシャルは、モデルがサンプリングできる最も難しい深さと、単一のイテレーションで消費されるインスタンスの数という2つの未探索の次元によって妨げられていることを示す。本稿では,多段ロールアウトによる難易度再重み付けを行うDARS(Difficulty Adaptive Rollout Smpling)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:40:44 GMT)
Deep Time Series Models: A Comprehensive Survey and Benchmark [60.7]
時系列は、その複雑でダイナミックな性質のために固有の課題を提示する。近年、時系列コミュニティで顕著なブレークスルーが見られた。多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:57:17 GMT)
SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer [60.2]
悲観的領域ランダム化によるSim-to-realの略称であるSPiDRを提案する。 SPiDRは、安全なsim-to-real転送を保証するスケーラブルなアルゴリズムである。我々は,SPiDRが性能を維持しつつ,シミュレートとリアルのギャップを保ちながら,安全性を効果的に確保できることを実証した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:26:53 GMT)
FusionFactory: Fusing LLM Capabilities with Multi-LLM Log Data [60.1]
大規模言語モデル(LLM)は、さまざまなモデルのランドスケープを持ち、それぞれが異なるタスクで優れています。この多様性は、研究者に複数のLLMを実際に採用させ、貴重なマルチLLMログデータを残します。 1)実世界のサービスシナリオ(例えば、ローカルおよびAPIベースのサービス)との互換性と、(2)様々なユーザニーズを満たすためにLLMパイプラインの異なる段階での運用の柔軟性である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:59:32 GMT)
CoT-RVS: Zero-Shot Chain-of-Thought Reasoning Segmentation for Videos [59.4]
本稿では,MLLMのゼロショット・チェーン・オブ・ソート(CoT)機能を利用して,時間-意味的推論による複雑な問題に対処する新しいフレームワークであるCoT-RVSを提案する。 CoT-RVSは、言語クエリ(セマンティック)にマッチする可能性のある特定のフレーム内の可視オブジェクトを分析し、すべてのフレーム(一時)の中で、懸命に観察できる各オブジェクトに対して対応するオブジェクトを選択する。当社のフレームワークのトレーニングフリー機能は,テスト時にCoTを使用して,よりよいターゲットが出現し始めると関心の対象を更新するオンラインビデオストリーム処理の拡張も可能にしています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:09:32 GMT)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [58.4]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。属性(例えば、テキストの長さと書き込みスタイル)に基づいてデータをサブグループに分割し、FairOPTを実装して、各グループに対する決定しきい値の学習を行い、不一致を低減しました。我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:10:52 GMT)
From Harm to Help: Turning Reasoning In-Context Demos into Assets for Reasoning LMs [58.0]
デモとしてDeepSeek-R1の高品質なトレースを使って、このパラドックスを再検討する。デモが最適であっても、より多くの例を加えることで、常に精度が低下することがわかった。デモを明示的で再利用可能な洞察に変換するシーケンシャルなテストタイム手順であるInsight-to-solve(I2S)を紹介します。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:59:31 GMT)
ExeCoder: Empowering Large Language Models with Executability Representation for Code Translation [57.6]
既存の大きな言語モデル(LLM)は、事前トレーニング中にのみコードのコンテキスト意味を学習する。機能的セマンティクスや構文構造,変数依存性といった実行可能性表現を活用するために,ExeCoderを提案する。 ExeCoderは、既存のオープンソースコードLLMを10.88%以上、38.78%以上、27.44%以上、42.97%以上という、2つのメトリクスで、最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:45:10 GMT)
Mod-Adapter: Tuning-Free and Versatile Multi-concept Personalization via Modulation Adapter [57.5]
テストタイムの微調整なしにオブジェクトと抽象概念を効果的にカスタマイズできるマルチコンセプトパーソナライズのためのチューニング不要な手法を提案する。本手法は, 定量的, 質的, 人的評価によって支援された多概念パーソナライゼーションにおける最先端性能を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:56:17 GMT)
Delta-Triplane Transformers as Occupancy World Models [57.2]
Occupancy World Models (OWMs) は、知的運動計画を支援するために、環境の3次元ボキセル化表現を通して将来のシーンを予測することを目的としている。本稿では,自律運転のための新しい4DOWMであるDelta-Triplane Transformers (DTT)を提案する。 DTTは1.44$times$ speedup (26 FPS)を最先端に提供し、平均IoUを30.85に改善し、平均絶対計画誤差を1.0mに下げる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:26:34 GMT)
Emergent Hierarchical Reasoning in LLMs through Reinforcement Learning [56.5]
強化学習(RL)は,大規模言語モデル(LLM)の複雑な推論能力の向上に有効であることが証明された。解析の結果,アハモーメント,長さスケーリング,エントロピーのダイナミクスといったファズリング現象は異なる現象ではなく,創発的推論階層の目印であることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:07:24 GMT)
Efficient LLM Collaboration via Planning [56.1]
小規模で大規模なモデルでは、プランナーと実行担当者として交代で行動し、タスクを協調的に解決するために、多段階のカスケードでプランを交換する。私たちはCOPEが大規模プロプライエタリモデルに匹敵するパフォーマンスを実現し,推論APIのコストを大幅に削減できることを実証した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:19:07 GMT)
Open-Vocabulary Spatio-Temporal Scene Graph for Robot Perception and Teleoperation Planning [55.9]
動的リモートシーンでは、双方向通信における伝送遅延は、リモート認識状態とオペレータ意図の間のギャップを生じさせる。本稿では,時間的ダイナミクスと軽量遅延アノテーションを用いて,オープン語彙認識を充実させる表現を提案する。提案手法はReplicaベンチマークで74%のノード精度を実現し,Concept.Graphよりも優れていた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:31:24 GMT)
fVDB: A Deep-Learning Framework for Sparse, Large-Scale, and High-Performance Spatial Intelligence [55.6]
fVDBは、大規模な3Dデータのディープラーニングのための新しいフレームワークである。私たちのフレームワークは、既存のパイプラインとの相互運用性を可能にするPyTorchと完全に統合されています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:44:45 GMT)
PARL-MT: Learning to Call Functions in Multi-Turn Conversation with Progress Awareness [55.1]
マルチターン関数呼び出しのためのLLMトレーニングに進捗認識を明示的に組み込むフレームワークであるPARL-MTを導入する。 PARL-MTは既存の手法よりも優れており、堅牢で効率的なマルチターン関数呼び出しの実現における進捗認識の有効性を強調している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:32:27 GMT)
C$^2$GSPG: Confidence-calibrated Group Sequence Policy Gradient towards Self-aware Reasoning [54.7]
推論モデル学習のためのグループシーケンスポリシーグラディエント(GSPG)フレームワーク。 C$2$GSPGは、自信過剰を抑えながら推論性能を同時に向上させる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:24:51 GMT)
LRPO: Enhancing Blind Face Restoration through Online Reinforcement Learning [54.5]
Blind Face Restoration (BFR)は、その大規模なソリューション空間を探索する上で、固有の課題に直面している。本稿では,オンライン強化学習(RL)をBFRタスクに適用した最初のLRPO(Likelihood-Regularized Policy Optimization)フレームワークを提案する。提案するLRPOは,ベースライン法よりも顔の復元精度が向上し,最先端の性能が向上する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:42:29 GMT)
ProstaTD: Bridging Surgical Triplet from Classification to Fully Supervised Detection [54.3]
ProstaTDは、ロボット補助前立腺切除術の技術的要求領域から開発された、外科的三重項検出のための大規模なデータセットである。このデータセットは、71,775の動画フレームと196,490の注釈付きトリプルトインスタンスで構成され、複数の機関で実施された21の手術から収集された。 ProstaTDは、これまでで最大かつ最も多様な3重項データセットであり、単純な分類から正確な空間的境界と時間的境界を持つ完全な検出へとフィールドを移動している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:37:02 GMT)
Model Collapse Is Not a Bug but a Feature in Machine Unlearning for LLMs [54.2]
LLMの現在のアンラーニング方法は、それらを微調整データに組み込むことで、削除しようとしているプライベート情報に基づいて最適化されている。本研究では,未学習目標を学習対象に含まない新しい非学習手法-部分的モデル崩壊(PMC)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:05:38 GMT)
ReDDiT: Rehashing Noise for Discrete Visual Generation [53.8]
離散拡散変圧器(終端型ReDDiT)のためのリハッシングノイズアプローチを提案する。我々は、吸収状態を拡張し、離散拡散モデルの表現能力を向上させることを目的としている。実験の結果、ReDDiTはベースラインモデルよりも大幅に優れていた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:26:03 GMT)
Training Deep Normalization-Free Spiking Neural Networks with Lateral Inhibition [52.6]
深層ニューラルネットワーク(SNN)のトレーニングは、バッチ正規化のような明示的な正規化スキームに依存している。本研究では,皮質回路にインスパイアされた側方抑制を取り入れた正規化自由学習フレームワークを提案する。本稿では,生物リアリズムを持つ深層SNNの安定的学習を可能にするとともに,明示的な正規化に頼らずに競争性能を達成できることを述べる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:11:30 GMT)
PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.5]
大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。 PT$2$-LLMを提案する。その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:01:48 GMT)
Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model [52.4]
本稿では,高品質な映像再構成を実現するために,意味情報を抽出し,送信するスケーラブルなビデオ意味コミュニケーションフレームワークを提案する。具体的には、送信機では、それぞれテキストと構造的意味論として機能するソースビデオから記述と他の条件信号を抽出する。受信機では、拡散に基づくGenAI大モデルを用いて、ビデオの再構成のために複数のモーダルのセマンティクスを融合させる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:38:35 GMT)
Unsupervised Online 3D Instance Segmentation with Synthetic Sequences and Dynamic Loss [52.3]
教師なしのオンライン3Dインスタンスのセグメンテーションは、基本的だが難しい課題だ。 UNITのような既存の手法はこの方向に進んできたが、訓練の多様性が制限されているままである。本稿では,合成点雲列生成によるトレーニング分布の強化を目的とした新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:53:27 GMT)
Function Induction and Task Generalization: An Interpretability Study with Off-by-One Addition [51.3]
関数誘導機構は,標準加算からオフバイワン加算までのモデルの一般化を説明する。このメカニズムは、以前の作業で見いだされた誘導ヘッド機構の構造に似ており、より高度な抽象レベルまで上昇する。この関数誘導機構は、シフトした複数選択QAのような合成タスクや、ベース8の追加のようなアルゴリズムタスクなど、幅広いタスクで再利用されている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:24:21 GMT)
Unveiling Impact of Frequency Components on Membership Inference Attacks for Diffusion Models [51.2]
メンバーシップ推論アタック(MIA)は、モデルのトレーニングフェーズで特定のデータが使用されたかどうかを確認するように設計されている。我々はそれらを、会員識別のための会員スコアを計算する統一的な汎用パラダイムに定式化する。このパラダイムの下では、拡散モデルが高周波情報を処理する方法において、既存の攻撃が固有の欠陥を見落としていることを実証的に見出す。本稿では, プラグアンドプレイ方式の高周波フィルタモジュールを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:52:38 GMT)
WirelessMathLM: Teaching Mathematical Reasoning for LLMs in Wireless Communications with Reinforcement Learning [51.1]
大規模言語モデル(LLM)は、一般的な数学的推論では優れているが、専門的な技術的数学では破滅的に失敗する。無線通信では、問題は情報理論的境界の正確な操作を必要とするが、最先端のモデルでさえ有能な性能を達成するのに苦労する。本稿では、コンパクトモデル(0.5B-7Bパラメータ)がドメイン固有強化学習により、より大きなモデルに適合または超えることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:58:03 GMT)
Your Models Have Thought Enough: Training Large Reasoning Models to Stop Overthinking [51.0]
大規模推論モデル(LRM)は、困難なタスクにおいて顕著なパフォーマンスを達成したが、その深い推論はしばしばかなりの計算コストを発生させる。 Evidence Accumulation Modelsにインスパイアされて、LEMは推論の初期段階で十分な情報を蓄積し、さらなる推論ステップを冗長にすることがわかった。不要な推論を積極的に終了させるためにモデルを訓練するJust-Enough Thinking (JET)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:25:06 GMT)
Imaging-Based Mortality Prediction in Patients with Systemic Sclerosis [50.5]
全身性硬化症(SSc)における間質性肺疾患(ILD)の死因本研究は,放射能と深層学習を利用して死亡率を予測する,新しい大規模胸部CT解析フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:46:57 GMT)
Scalable Graph Generative Modeling via Substructure Sequences [50.3]
本稿では,グラフ生成用トランスフォーマー事前学習フレームワークである生成グラフパターンマシン(G$2$PM)を紹介する。 G$2$PMはグラフインスタンス(ノード、エッジ、グラフ全体)をサブ構造のシーケンスとして表現する。それは、一般化可能かつ伝達可能な表現を学ぶために、シーケンスに関する生成的事前学習を採用する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:51:26 GMT)
Earth-Agent: Unlocking the Full Landscape of Earth Observation with Agents [49.3]
Earth-Agentは、CPベースのツールエコシステム内でRGBとスペクトルEOデータを統一する最初のエージェントフレームワークである。 Earth-Agentは、物理パラメータの探索や観測による定量的時間解析のような複雑な科学的タスクをサポートする。我々は,様々なLLM,汎用エージェントフレームワークとの比較,リモートセンシングベンチマークにおけるMLLMとの比較など,総合的な実験を行った。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:04:28 GMT)
A Proximal Gradient Method With Probabilistic Multi-Gossip Communications for Decentralized Composite Optimization [49.2]
本稿では,分散合成(平滑+非平滑)最適化のための通信効率の良いMG-Skipを提案する。直接接続されていないネットワークでは、MG-Skipはマルチゴシップ通信を強い凸設定でほとんどのイテレーションでスキップすることができる。 MG-Skipは、証明可能な通信加速を実現し、非滑らかな設定におけるローカル更新の利点を検証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:40:42 GMT)
Angles Don't Lie: Unlocking Training-Efficient RL Through the Model's Own Signals [49.2]
大規模言語モデル(LLM)のためのRFTパラダイムは、均一なデータサンプリングの下で同じクエリが冗長に露出するため、効率が悪い。グラディエント駆動型アングルインフォームドナビゲーションRLフレームワークを提案する。モデル固有の角度集中信号を利用することで、GAIN-RLは各エポックにおけるトレーニングデータを動的に選択し、一貫したインパクトのある勾配更新を確実にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:07:11 GMT)
Generative Modeling of Shape-Dependent Self-Contact Human Poses [48.3]
その関連性にもかかわらず、既存の自己接触データセットには多様な自己接触のポーズと正確な身体形状がない。本研究は,130名の被験者を対象とした383Kの自己接触ポーズからなる,身体形状を正確に登録した最初の大規模自己接触データセットであるGoliath-SCを紹介する。本稿では, 自己注意を伴う身体的部分的潜伏拡散に基づく, 身体形状パラメータによる自己接触先行条件の生成モデルを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:26:38 GMT)
Quantum error correction beyond $SU(2)$: spin, bosonic, and permutation-invariant codes from convex geometry [48.3]
本研究では,3種類の空間に対して,量子誤り訂正符号と論理ゲートを構築するためのフレームワークを開発する。我々は、SU(q)$の多くの符号とそのゲートが、3つの状態空間の間で相互変換可能であることを証明した。そこで本研究では, 類似したパラメータを持つ既知符号よりも短い長さまたは低い全スピン/励起を持つ符号の明示的な構成について述べる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:48:49 GMT)
Learning to Infer Unseen Single-/Multi-Attribute-Object Compositions with Graph Networks [47.4]
本稿では,複雑な関係を学習するための属性オブジェクト意味関連グラフモデルを提案する。属性とオブジェクトを表すノードでは、グラフは柔軟に構築でき、単一の属性と複数属性オブジェクトの合成認識を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:39:34 GMT)
Quant-dLLM: Post-Training Extreme Low-Bit Quantization for Diffusion Large Language Models [47.4]
拡散大言語モデル (dLLMs) は双方向のコンテキストと柔軟なマスマスキングデノジング生成を提供する。我々は,dLLMに適した超低ビットPTQフレームワークであるQuant-dLLMを提案する。 Quant-dLLMは、dLLM上での最先端(SOTA)AR-transfer PTQ法よりも高い精度を達成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:50:42 GMT)
From Evidence to Trajectory: Abductive Reasoning Path Synthesis for Training Retrieval-Augmented Generation Agents [47.1]
我々は,RAGエージェント開発のためのエビアンコール推論経路合成パラダイムであるEviPathを提案する。 EviPath は、 (i) 問題をサブクエストに分解し、それら間の依存関係に基づいて最適なソリューションパスを反復的に計画する、 (i) サブクエストの各サブクエストに対する推論思考と回答を生成するためのプロキシ環境を構築するための証拠を裏付ける、忠実なサブクエスト回答、 (iii) 完全なエージェント-環境相互作用の軌跡を監督されたファインタニングに適した対話形式にフォーマットする会話ファインタニングを含む。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:53:09 GMT)
Cooking Up Creativity: Enhancing LLM Creativity through Structured Recombination [46.8]
本稿では,LLM(Large Language Models)の創造性を高める新しいアプローチを提案する。自然言語と構造化表現の翻訳にLLMを適用し,その中心となる創造的飛躍を行う。我々は、創造的なレシピを生成するモデルであるDishCOVERを用いて、料理分野における我々のアプローチを実証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:06:34 GMT)
Few-shot Personalized Saliency Prediction Based on Interpersonal Gaze Patterns [46.5]
本研究では、対人的な視線パターンを利用した、パーソナライズされた個人性予測手法を提案する。限られたデータからPSMを予測する効果的な戦略は、他人の視線追跡データを使用することである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:23:06 GMT)
Entering the Era of Discrete Diffusion Models: A Benchmark for Schrödinger Bridges and Entropic Optimal Transport [46.3]
離散空間上のシュリンガーブリッジ(SB)問題に対するベンチマークを導入する。我々の構成では解析的に知られているSB解と確率分布のペアが得られ、厳密な評価が可能となった。この研究は、離散空間上のSB法を適切に評価する第一歩となる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:51:07 GMT)
Learning to Reason in Structured In-context Environments with Reinforcement Learning [46.0]
大規模言語モデル(LLM)は、強化学習(RL)を通して推論能力を大幅に向上させた。 textbfStructured textbfIn-context textbfEnvironment (SIE) フレームワークを紹介した。 SIEは大規模構造化データから推論環境を自動的に構築することでスケーラビリティを実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:34:19 GMT)
Real-World Transferable Adversarial Attack on Face-Recognition Systems [45.7]
我々は、厳密なブラックボックス設定の下で、普遍的で物理的に転送可能な対向パッチを生成する新しい方法であるGaP(Gaussian Patch)を紹介する。私たちの研究は実用的で深刻な脆弱性を強調しており、堅牢で移動可能な攻撃はターゲットシステムに関する限られた知識で実現可能であることを証明しています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:09:06 GMT)
ZeroSiam: An Efficient Siamese for Test-Time Entropy Optimization without Collapse [45.0]
我々は、テスト時間エントロピー最小化に適した効率的な非対称なシームズアーキテクチャであるZeroSiamを紹介する。 ZeroSiamは非対称な分散アライメントによる崩壊を防止し、学習可能な予測器と停止勾配演算子によって効率的に達成される。我々は、ZeroSiamが崩壊解を予防するだけでなく、バイアス学習信号の吸収と正則化を図り、崩壊が起こらない場合でも性能を向上させるという実証的および理論的証拠を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:37:47 GMT)
Planner Aware Path Learning in Diffusion Language Models Training [44.8]
Planner Aware Path Learning (PAPL)は、標準的なマスク付き離散拡散損失の簡易かつ効果的な修正である。 PAPLは、タンパク質配列モデリングにおける40%の相対的なゲインを含む、ドメイン間で一貫した改善を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:51:07 GMT)
Why Masking Diffusion Works: Condition on the Jump Schedule for Improved Discrete Diffusion [44.5]
マルコフ過程は不連続なジャンプによって一定の速度で進化する。他の離散拡散モデルとは異なり、マスク拡散はジャンプ時間の既知の分布に構築され、どこにジャンプするかしか学ばない。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:25:23 GMT)
Graph Your Own Prompt [44.4]
グラフ一貫性規則化(GCR)は、モデル予測から派生した関係グラフ構造を学習プロセスに注入するフレームワークである。 GCRは、よりクリーンな特徴構造、より強力なクラス内凝集、一般化を促進し、予測構造から学習する新しい視点を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:45:07 GMT)
Pretraining LLM with Latent Thoughts in Continuous Space [44.2]
本稿では,言語モデルと潜在思考の事前学習手法を提案する。我々のアプローチは言語モデル(LM)を事前訓練し、まず現在位置の最後の隠れ状態である中間潜在思考を生成する。同一の推論コストで、トークンごとに1つの追加の潜在思考を生成するLMが、パラメータの2倍の標準モデルより優れていることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:38:08 GMT)
GeLoc3r: Enhancing Relative Camera Pose Regression with Geometric Consistency Regularization [44.0]
ReLoc3Rは、高速な25msの推論と最先端のレグレッション精度でブレークスルー性能を達成する。 GeLoc3rは、幾何整合正則化によるポーズ回帰手法を強化する、相対カメラポーズ推定の新しいアプローチである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:21:38 GMT)
Enhancing Stability of Physics-Informed Neural Network Training Through Saddle-Point Reformulation [43.9]
近年,物理インフォームドニューラルネットワーク (PIN) が注目されている。この問題に対処するため、我々は、彼らのランドスケープを非強固な凹点問題として再考する。提案手法は現在の最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:44:02 GMT)
Temporal Generalization: A Reality Check [43.8]
本研究では,過去のデータにのみ依存する場合に,モデルがそのような一般化を実現するための条件と条件について検討する。本稿では,言語モデリング,ニュース要約,ニュースタグ予測,学術論文分類,衛星画像に基づく土地利用分類など,多様な時間的タスクのセットについて,これらのカテゴリ内のいくつかの手法をベンチマークする。実験の結果,評価された手法のいずれも,最新のモデルパラメータをすべてのシナリオで使用した場合の単純なベースラインを一貫して上回りません。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:20:44 GMT)
DRIFT: Learning from Abundant User Dissatisfaction in Real-World Preference Learning [43.7]
textbfDRIFT (textbfDis-textbfRefined textbfFerence textbfTraining) を導入する。実世界のテキストでトレーニングされたDRIFTモデルWildFeedbackデータセットはWildBench Task Score上で最大+6.23% (7B) / +7.61% (14B)、最大+8.95% (7B) / +を達成している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:06:27 GMT)
Curse of Slicing: Why Sliced Mutual Information is a Deceptive Measure of Statistical Dependence [43.5]
スライデッド・ミューチュアル・インフォメーション(SMI)は、非線形統計依存を測定するための相互情報に代わるスケーラブルな代替手段として広く利用されている。我々はSMIが飽和しやすく、統計的依存の増大を検知できず、情報的内容よりも冗長性を優先し、場合によっては相関係数のような単純な依存度よりも悪化することを示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:18:02 GMT)
Beyond Jailbreaking: Auditing Contextual Privacy in LLM Agents [43.3]
本研究では,リスクに対するエージェントの感受性を定量的に評価する,会話プライバシのための監査フレームワークを提案する。 CMPL(Conversational Manipulation for Privacy Leakage)フレームワークは、厳格なプライバシー命令を強制するエージェントをストレステストするために設計されている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:28:18 GMT)
C-Evolve: Consensus-based Evolution for Prompt Groups [43.3]
本稿では,集約された出力が最適性能を達成するプロンプト群を探索する進化的アルゴリズムであるConsensus-Evolve(C-Evolve)を紹介する。 C-Evolveは個体数の多様性を維持するために島を基盤とした進化的アルゴリズムを採用しており、異なる島々からのプロンプトはグループを形成するために選択される。本手法は,HotpotQAのようなオープンエンドタスクとMATHのようなクローズドエンドタスクの両方を含む,幅広いタスクにおける最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:35:49 GMT)
Kimi-Dev: Agentless Training as Skill Prior for SWE-Agents [43.2]
大規模言語モデル(LLM)は、ソフトウェア工学(SWE)にますます適用されつつある我々はまず、Agentlessトレーニングレシピをキュレートし、SWE-bench Verified上で60.4%を達成したオープンソースのSWE LLMであるKim-Devを提示する。 5kの公用軌道にSFTを付加することで、Kim-DevはClaude 3.5 Sonnetと同等の48.6%のpass@1にSWE-Agentsをパワーアップする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:49:13 GMT)
Balanced Diffusion-Guided Fusion for Multimodal Remote Sensing Classification [43.1]
本稿では,土地被覆分類のためのマルチブランチネットワークを誘導する拡散誘導型融合フレームワークを提案する。 4つのマルチモーダルリモートセンシングデータセットの実験により,提案手法が優れた分類性能を実現することを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:55:32 GMT)
Shuffling Heuristic in Variational Inequalities: Establishing New Convergence Guarantees [43.0]
シャッフル戦略は変分不等式問題を解決するのに有効であることを示す。この文脈におけるシャッフル法に対する最初の理論的収束推定を提供する。多様なベンチマーク変動不等式問題に関する広範な実験により,本研究の成果を検証した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:37:24 GMT)
Deep Learning for Subspace Regression [42.9]
そのようなスキームを適用する実践的な方法は、計算的に要求されるオフラインステージにおいて、選択されたパラメータセットのサブスペースを計算することである。現実的な問題に対して、パラメータの空間は高次元であり、古典的な戦略は実現不可能か信頼できない。本稿では, 回帰問題を緩和し, 部分空間データに適したいくつかの損失関数を導入し, ニューラルネットワークを高次元目標関数の近似として用いることを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:56:03 GMT)
AltLoRA: Towards Better Gradient Approximation in Low-Rank Adaptation with Alternating Projections [42.9]
Low-Rank Adaptation (LoRA) は、微調整された大規模言語モデルにおいて、メモリオーバーヘッドを低減する効果的な手法として登場した。低ランク空間で更新が制限されているため、完全な微調整に比べて、しばしば準最適パフォーマンスに悩まされる。共同更新設計による勾配近似の難しさを回避するための交互投影法AltLoRAを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:08:04 GMT)
Culture In a Frame: C$^3$B as a Comic-Based Benchmark for Multimodal Culturally Awareness [42.1]
C$3$B(textbfC$omics $textbfC$ultural $textbfB$enchmark)を提案する。 C$3$Bは2000枚以上の画像と18000組のQAペアで構成され、3つのタスクで構築される。 11個のオープンソースMLLMに対して評価を行い,MLLMと人為的性能の差を顕著に示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:16:50 GMT)
Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional [40.1]
マルチモーダル大言語モデル(MLLM)を用いた23の視覚的質問応答ベンチマークにおける依存性の定量化のための大規模実験的検討を行った。その結果,視力,質問 (テキスト) およびそれらの相互作用への依存度は,ベンチマーク内とベンチマーク内の両方で大きく異なることがわかった。テキストのみのバイアスを軽減するための多くのベンチマークが、必然的に画像のみの依存関係を増幅していることがわかった。この特徴はモデルのサイズにまたがって持続し、より大規模なモデルはこれらのモダリティ内依存を使い、マルチモーダル推論の欠如を隠蔽する高い性能を達成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:13:29 GMT)
QVGen: Pushing the Limit of Quantized Video Generative Models [39.5]
ビデオ拡散モデル(DM)により高品質なビデオ合成が可能となったが、その膨大な計算とメモリ要求は現実の展開に重大な課題をもたらす。提案するQVGenは,高速かつ推論効率の高いビデオDMに適した,QAT(quantization-aware training)フレームワークである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:46:05 GMT)
BuildBench: Benchmarking LLM Agents on Compiling Real-World Open-Source Software [39.4]
既存のメソッドは手動でキュレートされたルールに依存しており、カスタマイズされた設定や環境設定を必要とするOSSに適応できない。近年、Large Language Models (LLMs) を用いた試みでは、高度に評価されたOSSのサブセットを選択的に評価した。より困難で現実的なベンチマークであるBUILD-BENCHを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:02:46 GMT)
IML-Spikeformer: Input-aware Multi-Level Spiking Transformer for Speech Processing [38.6]
IML-Spikeformerは大規模音声処理用に設計されたスパイクトランスフォーマーアーキテクチャである。 IML-SpikeformerはAiShell-1では6.0%、Libri-960では3.4%というワードエラー率を達成した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:10:40 GMT)
Semantic Voting: A Self-Evaluation-Free Approach for Efficient LLM Self-Improvement on Unverifiable Open-ended Tasks [38.1]
大規模言語モデル(LLM)の自己評価は高い計算オーバーヘッドをもたらし、本質的なバイアスによる過信問題を引き起こす。本稿では、軽量で効果的な自己改善を目的とした、検証不能なタスクに対する新しい自己評価自由アプローチを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:44:05 GMT)
Automotive-ENV: Benchmarking Multimodal Agents in Vehicle Interface Systems [38.0]
ドライバーの注意不足、厳格な安全要件、複雑な位置ベースのインタラクションパターンなどである。本稿では,車載GUIに適した,最初の高忠実度ベンチマークおよびインタラクション環境であるAutomotive-ENVを紹介する。位置, 環境条件, 地域運転規範に基づいて動的に行動を調整するために, GPSインフォームドコンテキストを統合した地理認識型マルチモーダルエージェントASURADAを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:53:51 GMT)
DDP: Dual-Decoupled Prompting for Multi-Label Class-Incremental Learning [37.8]
本稿では、クラス増分学習のためのリプレイフリーでパラメータ効率の高いフレームワークとして、DDP(Dual-Decoupled Prompting)を提案する。 DDPは、部分的なラベル付けによる共起カテゴリと真負の偽陽性の混乱からのセマンティックな混乱に対処する。これはMS-COCO B40-C10ベンチマークで80% mAP と 70% F1 を超える最初のリプレイフリー MLCIL アプローチである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:39:43 GMT)
CATMark: A Context-Aware Thresholding Framework for Robust Cross-Task Watermarking in Large Language Models [37.7]
本研究では,リアルタイムな意味的文脈に基づく透かし強度を動的に調整する新しいフレームワークを提案する。 $myalgo$は、ロジットクラスタリングを使用してテキスト生成をセマンティックステートに分割し、コンテキスト対応のエントロピーしきい値を確立する。実験によると、$myalgo$は、検出精度を犠牲にすることなく、クロスタスクのテキスト品質を改善する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:43:52 GMT)
Solving Systems of Linear Equations: HHL from a Tensor Networks Perspective [37.6]
本研究では、テンソルネットワークを用いた方程式解法アルゴリズムのHHL線形系をシミュレーションするための新しいアプローチを提案する。立方体形式論における新しい HHL、すなわち qubits の一般化が発展し、その操作は等価な古典的 HHL に変換される。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:41:54 GMT)
AudioRole: An Audio Dataset for Character Role-Playing in Large Language Models [37.1]
AudioRoleは、13のテレビシリーズから1K以上の時間と1M以上の文字による対話を正確に収集したデータセットだ。話者識別とコンテキストメタデータを付加した同期オーディオテキストペアを提供する。データセットの有効性を示すために,デュアルアスペクト評価フレームワークであるARP-Evalを導入した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:08:51 GMT)
Communication-Efficient Desire Alignment for Embodied Agent-Human Adaptation [37.1]
LLM駆動のプロキシ・ヒューマン・ユーザを統合したホーム・アシスト・シミュレーション環境HA-Desireを開発した。本稿では、欲求に基づく心的推論機構を導入した、迅速な欲求整合のための新しいフレームワークFAMERを提案する。本フレームワークは,タスク実行とコミュニケーション効率を大幅に向上させ,具体的エージェントがユーザ固有の欲求に迅速に適応できるようにする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:05:48 GMT)
DOoM: Difficult Olympiads of Math [36.9]
本稿では,ロシア語の数学や物理問題を解く際の言語モデルの能力を評価するために設計された,新たなオープンソースベンチマークであるDOoMを紹介する。このベンチマークには、学校レベルのタスクからオリンピアード大学や入学試験の質問まで、さまざまな難易度の問題が含まれている。結果から, モデル性能と使用するトークン数との相関関係が示され, 数学と物理のタスク間の性能差が強調される。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:37:19 GMT)
Progressive Binarization with Semi-Structured Pruning for LLMs [36.9]
半構造化プルーニング(PBS$2$P)によるプログレッシブバイナリ化を提案し,バイナライゼーションと半構造化プルーニングをシームレスに統合する新しいポストトレーニングフレームワークを提案する。 PBS$2$P は,2進法(SOTA) の2進法を複雑度と下流精度の両方で一貫して上回っていることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:38:26 GMT)
Stochastic Interpolants via Conditional Dependent Coupling [36.8]
既存の画像生成モデルは、計算と忠実性のトレードオフに関して重要な課題に直面している。提案した条件依存結合戦略に基づく統合型多段階生成フレームワークを提案する。生成過程を複数の段階で補間軌道に分解し、エンドツーエンドの最適化を可能にしながら正確な分布学習を保証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:03:08 GMT)
Towards Comprehensive Interactive Change Understanding in Remote Sensing: A Large-scale Dataset and Dual-granularity Enhanced VLM [36.8]
ChangeIMTIは、変更キャプション、バイナリ変更分類、変更カウント、変更ローカライゼーションのための大規模な対話型マルチタスク命令データセットである。両時間リモートセンシング画像に対して、二重粒度認識を用いた視覚誘導型視覚言語モデル(ChangeVG)を提案する。本手法は, 総合的なS*m測定値において, セマンティックCCを1.39ポイント上回る最強の手法である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:28:42 GMT)
Causally-Enhanced Reinforcement Policy Optimization [36.5]
Causally-Enhanced Policy Optimization (CE-PO)は、因果一貫性のための異なるプロキシでポリシー最適化を強化する、ドロップイン報酬形成フレームワークである。 CE-POは、ヤコビアンに基づく感性によるモデル内部の影響を推定し、これらのシグナルを反実的に硬化させてニュアンスを抑えるとともに、結果のコヒーレンススコアをタスク精度フィードバックと融合させる。 4つのデータセットにわたる実験結果から、CE-POは平均で5.49%の精度(最大9.58%)を向上し、相関因果フリップや光対実編集による堅牢性を改善した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:10:16 GMT)
Learning When to Think: Shaping Adaptive Reasoning in R1-Style Models via Multi-Stage RL [36.4]
大規模推論モデル(LRM)は、最終的な答えを生成する前に、明示的でステップバイステップの推論シーケンスを生成するのに熟練している。この過度に考える問題に対処するため、適応的思考能力を備えたLEMの装備方法について検討する。推論ポリシーを段階的に最適化する多段階強化学習フレームワークであるAutoThinkを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:35:52 GMT)
Beyond Synthetic Replays: Turning Diffusion Features into Few-Shot Class-Incremental Learning Knowledge [36.2]
FSCIL(Few-shot class-incremental Learning)は、非常に限られたトレーニングデータのために困難である。最近の研究は、これらの課題に対処するために、生成モデル、特に安定拡散(SD)を調査している。そこで,Diffusion-FSCILを導入し,実画像の特徴を捉え,SDから4つの相乗的特徴型を抽出する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:31:59 GMT)
Leave No Observation Behind: Real-time Correction for VLA Action Chunks [36.1]
非同期アクションチャンク補正(A2C2)は、制御ステップ毎に実行される軽量なリアルタイムチャンク補正ヘッドである。 A2C2は,高容量チャンキングポリシーをリアルタイム制御に展開するための効果的なプラグイン機構であることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:07:49 GMT)
SPEC-RL: Accelerating On-Policy Reinforcement Learning via Speculative Rollouts [35.8]
SPEC-RLは、SPECulativeデコーディングとRLロールアウトプロセスを統合するフレームワークである。政策品質を損なうことなく、ロールアウト時間を2～3倍に短縮する。純粋にロールアウトステージの強化として、SPEC-RLはメインストリームのアルゴリズムとシームレスに統合される。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:32:34 GMT)
AdaSTaR: Adaptive Data Sampling for Training Self-Taught Reasoners [35.7]
Self-Taughters (STaR)は、自己改善推論言語モデル(LM)のトレーニングパイプラインの不可欠な部分である。本稿では,2つの適応サンプリング原理を組み込んだ新しいアルゴリズムであるAdaptive STaR(AdaSTaR)を紹介する。 AdaSTaRは全てのインスタンスで最高のテスト精度を達成し、幅広いベースラインリストに対して平均58.6%のトレーニングFLOPを削減している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:52:41 GMT)
Vid2World: Crafting Video Diffusion Models to Interactive World Models [35.4]
我々は、トレーニング済みの動画拡散モデルをインタラクティブな世界モデルに活用し、転送するための一般的なアプローチであるVid2Worldを紹介する。本手法は,高機能な映像拡散モデルをインタラクティブな世界モデルに再利用するための,スケーラブルで効果的な経路を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:19:18 GMT)
R1-Ranker: Teaching LLM Rankers to Reason [35.4]
R1-Rankerは強化学習に基づく推論インセンティブフレームワークである。 IRankerは、より深い推論を促進するために、段階的な報酬でランク付けを反復的排除プロセスに分解する。我々は、レコメンデーション、ルーティング、通過ランキングにまたがる9つのデータセットに基づいて、統一されたR1-Rankerを評価した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:05:38 GMT)
Reshaping Reasoning in LLMs: A Theoretical Analysis of RL Training Dynamics through Pattern Selection [35.3]
本稿では,実験解析と厳密な理論的モデリングによるRL学習プロセスの説明を行う。我々は、報酬(RLVR)とモデルの内部フィードバック(RLIF)という2つの典型的な報酬を用いて、RLのトレーニングダイナミクスを理解するための理論的枠組みを開発する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:07:28 GMT)
Last iterate convergence in no-regret learning: constrained min-max optimization for convex-concave landscapes [35.0]
オンライン学習フレームワーク「OMWU(Optimistic Multiplicative-Weights Update)」は,凸凹型ゲームにおいて,最後の反復収束を示す。提案手法の高速収束を示す実験により,実験結果を補完する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:12:02 GMT)
Decoupling Reasoning and Perception: An LLM-LMM Framework for Faithful Visual Reasoning [34.9]
大規模言語モデル(LLM)のための学習不要なビジュアル推論パイプラインを導入する。強力なLLMは、LMMを戦略的に尋問して、論理的連鎖に必要な特定の視覚情報を抽出する高レベルの推論をオーケストレーションする。この枠組みは視覚的推論過程を効果的に制御し, 視覚的根拠のない推論ステップの大幅な削減と, 忠実さの大幅な改善に繋がる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:13:41 GMT)
SPIKE-RL: Video-LLMs meet Bayesian Surprise [34.8]
本稿では,映像ストリームにおける新たな視覚的証拠によって引き起こされる信念更新として,ベイジアンサプライズを定量化する推論時フレームワークSPIKEを紹介する。 SPIKEはビデオのサプライズを効果的にローカライズし、正(FunQA)と負(Oops!)のサプライズベンチマークで人間と強く相関する。ビデオキャプションからの報酬信号に基づいて,GRPOを利用して信念仮説を最適化するSPIKE-RLを開発した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:02:23 GMT)
Advanced Architectures Integrated with Agentic AI for Next-Generation Wireless Networks [34.7]
本稿では,ネットワーク運用の簡素化,運用費の削減(OpEx),新サービスモデルの展開を目的とした最先端技術について検討する。 i) 長期6Gネットワークの進化に対処しながら、サービスのシームレスな拡張を可能にするコントロールプレーンとユーザプレーンを備えた、新しい、より効率的な6Gアーキテクチャの提供に重点を置いている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:01:13 GMT)
LiTEx: A Linguistic Taxonomy of Explanations for Understanding Within-Label Variation in Natural Language Inference [34.6]
自由文の説明を英語で分類するための言語情報を用いた分類法であるLITEXを紹介する。この分類を用いて、e-SNLIデータセットのサブセットに注釈を付け、分類の信頼性を評価し、NLIラベル、ハイライト、説明とどのように一致しているかを分析する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:40:54 GMT)
C3-OWD: A Curriculum Cross-modal Contrastive Learning Framework for Open-World Detection [34.6]
オブジェクト検出は大幅に進歩しているが、現実の展開は、未確認のカテゴリへの一般化の貧弱さと、悪条件下でのロバスト性という2つの課題によって制限されている。両強みを統一するクロスモーダル・コントラスト学習のカリキュラムである textbfC3-OWD を提案する。 FLIR,OV-COCO,OV-LVISによる実験により,本手法の有効性が示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:04:15 GMT)
GeoBS: Information-Theoretic Quantification of Geographic Bias in AI Models [34.6]
我々はGeo-Biasスコア(Geo-Biasスコア)と呼ばれるジオバイアス評価のための情報理論の枠組みを確立する。複雑な空間要因を考慮に入れた3つの新しい測地バイアススコアを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:07:21 GMT)
URS: A Unified Neural Routing Solver for Cross-Problem Zero-Shot Generalization [34.5]
URSは、広範囲の見えないVRPにわたってゼロショットの一般化が可能な統一されたニューラルネットワークルーティング解決器である。 URSは、単一のモデルで100以上のVRP変種を扱うことができる最初のニューラルソルバである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:11:09 GMT)
Look Back to Reason Forward: Revisitable Memory for Long-Context LLM Agents [33.6]
本稿では、メモリ履歴全体からの選択的検索を可能にするコールバック強化メモリを備えたメモリ拡張エージェントReMemR1を提案する。また,RLMLR(Reinforcement Learning with Multi-Level Rewards)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:36:46 GMT)
Data Imputation by Pursuing Better Classification: A Supervised Kernel-Based Method [33.6]
本稿では, 監視情報を効果的に活用し, 欠落したデータを分類する手法を提案する。我々のアルゴリズムは、データの60%以上が欠落している場合、他の手法よりもはるかに優れています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:35:54 GMT)
Mitigating Watermark Forgery in Generative Models via Randomized Key Selection [33.1]
主要なセキュリティ脅威は、敵がプロバイダの透かしをコンテンツに挿入する偽造攻撃である。既存の防御は、複数のキーを持つ多くの透かしを同じコンテンツに埋め込むことによって偽造に抵抗する。本稿では,攻撃者が収集した透かし付きコンテンツの数に対して,確実に偽造に抵抗する防御法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:12:29 GMT)
Alignment through Meta-Weighted Online Sampling: Bridging the Gap between Data Generation and Preference Optimization [32.8]
大きな言語モデルと人間の価値観と意図を整合させるためには、優先度最適化が不可欠である。既存の手法では、静的または分離されたオンラインサンプリング戦略を用いて、このギャップを減らそうとしている。モデル学習とデータ生成を動的に結合する新しいフレームワークMetaAPO(Meta-Weighted Adaptive Preference Optimization)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:38:24 GMT)
CREPE: Controlling Diffusion with Replica Exchange [32.4]
拡散モデルの推論時間制御は、モデル出力を操り、再学習せずに新しい制約を満たすことを目的としている。レプリカ交換に基づくフレキシブルな代替案を提案する。 CREPE:(1) 粒子を逐次生成し,(2) 燃焼後の試料の多様性を高く維持し,(3) オンライン精製や早期終了を可能にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:45:37 GMT)
Democratizing AI scientists using ToolUniverse [32.3]
ToolUniverseは、任意の言語や推論モデルからAI科学者を構築するためのエコシステムです。 ToolUniverseは、AI科学者がツールを特定して呼び出す方法を標準化し、600以上の機械学習モデル、データセット、API、科学パッケージを統合する。高コレステロール血症のケーススタディにおいて、ToolUniverseは、予測された特性を持つ薬物の強力なアナログを特定するために、AI科学者を作成するために使用された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:38:53 GMT)
AICrypto: A Comprehensive Benchmark for Evaluating Cryptography Capabilities of Large Language Models [32.0]
AICryptoは、大規模言語モデルの暗号能力を評価するために設計された最初の包括的なベンチマークである。ベンチマークは135の多重選択質問、150のキャプチャー・ザ・フラッグ課題、18の証明問題で構成されている。 LLMをリードする17のモデルの評価は、最先端のモデルが暗号概念を記憶する上で、人間の専門家と一致しているか、さらに上回っていることを示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:27:25 GMT)
Entropy-Memorization Law: Evaluating Memorization Difficulty of Data in LLMs [31.8]
LLM(Large Language Models)は、トレーニングデータの一部を記憶することが知られており、適切な指示を下すと、時には冗長な内容が再現される。本稿では,データエントロピーが記憶スコアと線形に相関していることを示すエントロピー記憶法を提案する。エントロピー記憶法(Entropy-Memorization Law)の発見と同じ戦略を採用することで、トレーニングとテストデータの区別をシンプルかつ効果的に行うことができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:00:09 GMT)
Seeing the Unseen in Low-light Spike Streams [31.6]
スパイクカメラは、高時間分解能のニューロモルフィックセンサーの一種で、高速な視覚タスクに非常に有望である。独自のデータモダリティのため、スパイクストリームは人間の目に知覚されるように再構築方法を必要とする。スパイクカメラの最初の拡散型再構成法であるDiff-SPKを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:33:03 GMT)
Graph Alignment via Dual-Pass Spectral Encoding and Latent Space Communication [31.4]
本稿では,ノードの特異性を同時に強化し,潜在空間間の幾何的整合性を実現する新しいグラフアライメントフレームワークを提案する。提案手法では,低域通過スペクトルフィルタと高域通過スペクトルフィルタを組み合わせたデュアルパスエンコーダを導入し,構造認識と高判別の両方が可能な埋め込みを生成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:11:41 GMT)
Last-Iterate Convergence: Zero-Sum Games and Constrained Min-Max Optimization [31.2]
広く使われているグラディエント・ディキセント/アセンセント法は凸問題におけるサドル点への最終点収束を示す。我々は、非回帰乗算重み更新法の変則の下で、エム制約最小値最適化のより一般的な問題において、同じことが成り立つことを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:38:57 GMT)
Peacemaker or Troublemaker: How Sycophancy Shapes Multi-Agent Debate [30.7]
大規模言語モデル (LLM) はしばしば、過剰な一致性を示す傾向がある。 LLMs固有の薬理は、議論を早めの合意に崩壊させる可能性がある。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:27:13 GMT)
WeatherCycle: Unpaired Multi-Weather Restoration via Color Space Decoupled Cycle Learning [30.6]
マルチウェザー条件下での教師なし画像復元は根本的だが未発見の課題である。気象の回復を双方向の劣化コンテンツ翻訳サイクルとして再構成する統合フレームワークである textbfWeatherCycle を提案する。本手法は, 複雑な気象劣化に対する強い一般化を図りながら, 教師なしアプローチの最先端性能を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:44:27 GMT)
Accelerated Parallel Tempering via Neural Transports [30.3]
ニューラルサンプリングを応用してPTを高速化するフレームワークを導入し,オーバーラップを低減する。提案手法は, サンプル品質の向上, 古典的PTに比べて計算コストの低減, 効率的な自由エネルギー・正規化定数推定を可能にする, 様々なマルチモーダルサンプリング問題を理論的, 実証的に実証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:33:45 GMT)
FoR-SALE: Frame of Reference-guided Spatial Adjustment in LLM-based Diffusion Editing [30.1]
テキスト・トゥ・イメージ(T2I)生成では、カメラ以外の視点から空間記述が提供される場合、最先端モデルでさえ大きな性能差を示す。本フレームワークは,1ラウンドの補正のみを用いて,最先端T2Iモデルの性能を最大5.3%向上させる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:42:04 GMT)
Signals, Concepts, and Laws: Toward Universal, Explainable Time-Series Forecasting [29.8]
時系列予測のためのドメイン・ユニバーサル・ODE正規化・解釈可能・概念変換器であるDORICを提案する。我々は、第一原理制約を基礎とした微分可能残差を強制しながら、5つの自己監督的ドメインに依存しない概念を通して予測を生成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:22:22 GMT)
From Noise to Laws: Regularized Time-Series Forecasting via Denoised Dynamic Graphs [29.8]
本稿では,スコアベース拡散プリコンディショナと動的相関閾値グラフエンコーダを結合したPRISMを提案する。 6つの標準ベンチマークで、PRISMは強力なMSEとMAEゲインを持つSOTAを達成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:35:23 GMT)
Training Vision-Language Process Reward Models for Test-Time Scaling in Multimodal Reasoning: Key Insights and Lessons Learned [29.4]
プロセス・リワード・モデル (Process Reward Models, PRM) は、大規模言語モデルにおける推論の信頼性を向上させる。既存のVision-Language PRMはデータ構築にMCTS(Monte Carlo Tree Search)に依存している。我々は,MCTSと強力なVLMの判断を組み合わせるハイブリッドデータフレームワークを導入し,より正確なステップレベルラベルを生成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:56:58 GMT)
SynDoc: A Hybrid Discriminative-Generative Framework for Enhancing Synthetic Domain-Adaptive Document Key Information Extraction [29.2]
ドメイン固有のビジュアルリッチ文書理解(VRDU)は、医学、金融、物質科学といった分野における文書の複雑さと感度が原因で大きな課題を呈している。既存のLarge (Multimodal) Language Models (LLMs/MLLMs) は有望な結果を達成するが、幻覚、不十分なドメイン適応、広範囲な微調整データセットへの依存といった制限に直面している。本稿では,これらの課題に対処するための識別モデルと生成モデルを組み合わせた新しいフレームワークであるSynDocを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:01:52 GMT)
Tagging the Thought: Unlocking Personalization Reasoning via Reinforcement Learning [28.9]
個人化推論のための言語モデルの本質的な能力を高める新しいトレーニングフレームワークであるTagPRを紹介する。我々の手法は最先端の結果を達成し、すべてのタスクでベースモデルに対して平均32.65%の改善を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:03:44 GMT)
MagicTryOn: Harnessing Diffusion Transformer for Garment-Preserving Video Virtual Try-on [28.7]
VVT(Virtual Try-On)は、連続するフレームにわたって自然に現れる衣服を合成し、それらのダイナミクスと人間の手がかりとの相互作用の両方をキャプチャすることを目的としている。既存のVVT法はまだ不適切な衣服の忠実さと時間的整合性に悩まされている。 MagicTryOnは、衣料制約付き仮想試着のための拡散変換器ベースのフレームワークである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:43:45 GMT)
F-Adapter: Frequency-Adaptive Parameter-Efficient Fine-Tuning in Scientific Machine Learning [28.6]
プレトレーニング大型演算子モデル(LOM)のためのPEFTの最初の系統的研究を行う。また,LoRA(Lo-Rank Adaptation)により,LOMの性能はアダプタチューニングよりも著しく低下することがわかった。アダプタのロバストな経験的ゲインとスペクトルスパースとしてのPDE解の理論的特徴により、周波数適応アダプタ(F-Adapter)を導入する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:05:28 GMT)
Landing with the Score: Riemannian Optimization through Denoising [28.6]
本稿では,データ分布を最適化に必要な幾何演算に接続するリンク関数を提案する。この関数が本質多様体演算の回復を可能にすることを示す。本稿では,2つの効率的な推論時間アルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:10:54 GMT)
Dual-Space Smoothness for Robust and Balanced LLM Unlearning [28.6]
PRISMは、非学習メトリクスを改善しバランスをとるために、表現空間とパラメータ空間の二重空間の滑らかさを強制する統合フレームワークである。 PRISMは2つのスムーズな最適化段階から構成される: (i) 堅牢に訓練されたプローブを用いてジェイルブレイク攻撃を防御する表現空間ステージ、 (ii) 保持と忘れられた勾配の衝突を分離し、不均衡を減らし、再学習攻撃を軽減するためにパラメータ空間を滑らかにするパラメータ空間ステージ。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:20:37 GMT)
Cognition-of-Thought Elicits Social-Aligned Reasoning in Large Language Models [28.2]
大きな言語モデル(LLM)は複雑な推論において優れているが、それでも有害な振る舞いを示すことができる。本稿では,認知的自己監視ループにLCMを組み込んだ新しい復号時間フレームワークCooTを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:16:57 GMT)
Sparse2Dense: A Keypoint-driven Generative Framework for Human Video Compression and Vertex Prediction [27.9]
超低速映像圧縮のためのキーポイント駆動生成フレームワークであるSparse2Denseを提案する。鍵となるイノベーションは、複雑な人間の動きをエンコードするマルチタスク学習とキーポイント認識の深層生成モデルである。 Sparse2Denseは、リアルタイムモーション分析、仮想人間アニメーション、没入型エンターテイメントなど、帯域幅効率の高い人中心メディアの伝送を容易にすることが期待されている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:54:56 GMT)
CrediBench: Building Web-Scale Network Datasets for Information Integrity [27.6]
CrediBenchは、時間的Webグラフを構築するための大規模データ処理パイプラインである。我々のアプローチは、一般的な誤情報領域の動的進化を捉えている。本稿では,このグラフスナップショットを用いた実験から,信頼度を学習するための構造的およびWebページコンテンツ信号の強度を実証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:42:48 GMT)
Planning with Unified Multimodal Models [27.2]
我々は、統一マルチモーダルモデル(UMM)は、生成した視覚的コンテンツを通して推論を行うことにより、意思決定により大きな可能性を秘めていると論じる。このフレームワーク内では、単一のモデルがポリシー、ダイナミクスモデル、バリュー関数として同時に機能します。そこで本研究では, 生成モデルを自己判別器として機能し, 無効な力学予測をフィルタリングする手法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:13:13 GMT)
Seeing Through the Blur: Unlocking Defocus Maps for Deepfake Detection [27.1]
生成AIは、フォトリアリスティックな合成画像の大量生成を可能にし、本物と制作されたビジュアルコンテンツの境界を曖昧にした。本稿では,物理的に解釈可能なディープフェイク検出フレームワークを提案する。我々は,デフォーカスに基づく検出パイプラインと解釈可能性ツールを,メディア法医学における現在進行中の研究に有意義に貢献することを目的としている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:02:53 GMT)
Uncovering Intrinsic Capabilities: A Paradigm for Data Curation in Vision-Language Models [26.9]
本稿では,タスク固有のキュレーションから本質的な能力分析へ移行するフレームワークであるCapability-Attributed Data Curation(CADC)を紹介する。 CADCは、勾配に基づく学習軌跡から教師なしの方法で本質的な能力を発見する。オリジナルのデータの5%に過ぎず、CADCはマルチモーダルベンチマークでのフルデータトレーニングを超越している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:57:37 GMT)
CoPatch: Zero-Shot Referring Image Segmentation by Leveraging Untapped Spatial Knowledge in CLIP [26.8]
textscCoPatchはゼロショットRISフレームワークで、テキストと画像の両方の空間表現を強化する。また,textscCoPatchは, RefCOCO, RefCOCO+, RefCOCOg, PhraseCut (+ 2--7 mIoU) のゼロショットRISにおける空間接地を,追加の訓練を必要とせずに大幅に改善することを示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:12:10 GMT)
Orientation-anchored Hyper-Gaussian for 4D Reconstruction from Casual Videos [26.6]
OriGSは、カジュアルにキャプチャされたモノクロビデオから高品質な4D再構成を行うための新しいフレームワークだ。まず、空間と時間にまたがる主要な前方方向を伝播するグローバルオリエンテーション場を推定する。これに基づいて、時間、空間、幾何学、配向をコヒーレントな確率的状態に埋め込む統一的な定式化である、配向を意識したハイパーガウス的(Hyper-Gaussian)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:43:43 GMT)
A Systematic Survey on Large Language Models for Evolutionary Optimization: From Modeling to Solving [26.5]
大規模言語モデル(LLM)は、最適化問題に対処するためにますます研究されている。急速な進歩にもかかわらず、この分野は依然として統一的な合成と体系的な分類を欠いている。この調査は、最近の開発を包括的にレビューし、構造化されたフレームワーク内でそれらを整理することで、このギャップに対処する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:42:17 GMT)
TabularGSM: Understanding the Limitations of LLMs in Tabular Math Reasoning [26.2]
本稿では,算術語問題をスケーラブルかつ検証可能な表型推論タスクに変換する,ニューロシンボリックなフレームワークであるAutoT2Tを提案する。 3つの段階的に複雑なサブセットと2つの相補的な評価設定を持つトラップサブセットからなるベンチマークであるTabularを開発した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:13:03 GMT)
HiMat: DiT-based Ultra-High Resolution SVBRDF Generation [26.1]
HiMatは、効率的な4K SVBRDF生成に適した拡散ベースのフレームワークである。 CrossStitchは軽量な畳み込みモジュールで、グローバルな注目を集めるコストを伴わずに、クロスマップの一貫性を強制する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:16:05 GMT)
General Exploratory Bonus for Optimistic Exploration in RLHF [25.7]
現在の定式化は、参照モデルの高確率領域に対する意図しない偏見探索である。我々は,楽観主義の原理を確実に満足する理論的枠組みであるGEB(General Exploratory Bonus)を紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:54:59 GMT)
From Specificity to Generality: Revisiting Generalizable Artifacts in Detecting Face Deepfakes [25.7]
顔の不整合アーチファクト(FIA)とアップサンプリングアーティファクト(USA) FIAは、すべての複雑な詳細を生成するという課題から生じる。アメリカは発電機のデコーダが残した避けられない痕跡です。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:20:14 GMT)
ProtoTS: Learning Hierarchical Prototypes for Explainable Time Series Forecasting [25.2]
本稿では,高精度かつ透明な意思決定を実現する新しい解釈可能な予測フレームワークであるProtoTSを提案する。 ProtoTSは、豊富な異種情報を保存する識別表現に基づいて、インスタンス-プロトタイプの類似性を計算する。新たにリリースされたLOFデータセットを含む、複数の現実的なベンチマークの実験は、ProtoTSが予測精度の既存のメソッドを超えるだけでなく、専門家が選択可能な解釈を提供することを示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:10:21 GMT)
GUI-PRA: Process Reward Agent for GUI Tasks [25.2]
プロセスリワードモデル(Process Reward Models, PRM)は、推論中に重要なプロセス信号でこれらのエージェントをガイドできる、有望なソリューションである。 PRMは「中間の失われた」現象に悩まされ、歴史的に圧倒的な状況が現在の段階の評価を損なう。 GUI-PRA(Process Reward Agent for GUI Tasks)は,標準的なPRMよりも優れたプロセス報酬の提供を目的とした判定エージェントである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:42:36 GMT)
Spatial-Spectral Binarized Neural Network for Panchromatic and Multi-spectral Images Fusion [25.2]
ディープラーニングモデルは優れたパフォーマンスを達成したが、しばしば計算の複雑さが伴う。本稿では,2次ニューラルネットワーク(BNN)をパンシャーピングに適用する可能性について検討する。一連のS2B-Convは、S2BNetと呼ばれるパンシャーピングのための新しいバイナリネットワークを形成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:10:51 GMT)
VPNeXt -- Rethinking Dense Decoding for Plain Vision Transformer [24.9]
我々は、Plain Vision Transformer(ViT)の新しいシンプルモデルであるVPNeXtを紹介する。同じ均一なパラダイムを共有する多くの関連研究とは異なり、VPNeXt は ViT に基づく密度表現の新しい視点を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:53:31 GMT)
AI-Enhanced Distributed Channel Access for Collision Avoidance in Future Wi-Fi 8 [24.8]
バイナリ指数バックオフ(BEB)に依存している現在のWi-Fiシステムは、密集配置における最適下衝突の解決に悩まされている。本稿では,AI最適化とレガシデバイス共存を統合したマルチエージェント強化学習フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:00:04 GMT)
LLM Watermark Evasion via Bias Inversion [24.5]
本稿では,理論的動機付けとモデルに依存しないemphBias-Inversion Rewriting Attack (BIRA)を提案する。 BIRAは、下層の透かし方式を知らずに書き直し中に、おそらく透かしのトークンのロジットを抑えることで透かし信号を弱める。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:24:57 GMT)
Virus Infection Attack on LLMs: Your Poisoning Can Spread "VIA" Synthetic Data [24.2]
本稿では,大規模言語モデルに対する合成データ統合学習のレジリエンスを定量的に評価する。本稿では,ウイルス感染攻撃(VIA)という,新規で普遍的な攻撃枠組みを導入する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:39:41 GMT)
PAFT: Prompt-Agnostic Fine-Tuning [24.2]
微調整された大きな言語モデル(LLM)は、しばしば特定のプロンプト語に過剰な適合を引き起こす。本稿では,トレーニング中の動的プロンプト変動によるロバスト性向上手法であるPrompt-Agnostic Fine-Tuning(PAFT)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:46:24 GMT)
Trust Region Reward Optimization and Proximal Inverse Reward Optimization Algorithm [24.1]
逆強化学習(IRL)は、専門家によるデモンストレーションを説明するための報酬関数を学習する。現代のIRL法は報酬と政策最適化を交互に行う逆数式(minimax)を用いることが多い。最近の非敵対的IRLアプローチは、エネルギーベースの定式化を通じて報酬と政策を共同学習することで安定性を向上させる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:36:13 GMT)
Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search [24.0]
自動入札は、広告主が広告パフォーマンスを改善するための重要なツールとなる。近年の進歩により、AIGB(AI-Generated Bidding)は、通常のオフライン強化学習(RL)ベースの自動入札法と比較して優れた性能を発揮することが示されている。生成計画とポリシー最適化を統合した新しい手法であるAIGB-Pearlを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:44:12 GMT)
Data-Efficient Training by Evolved Sampling [23.9]
トレーニングプロセスに沿ってエファンダイナミックサンプリングを行うフレームワークであるtextbfEvolved Sampling (textbfES) を提案する。 ES(WP)は、様々な事前訓練および訓練後のタスクにおいて、損失のないトレーニングアクセラレーションを一貫して達成し、最大45%のウォールタイムを節約できる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:19:16 GMT)
HSACNet: Hierarchical Scale-Aware Consistency Regularized Semi-Supervised Change Detection [23.8]
半教師付き変化検出(SSCD)は,限られたラベル付きデータと豊富なラベル付きデータを用いて,両時間的リモートセンシング画像間の変化を検出することを目的としている。本稿では,SSCDのための階層型スケール・アウェア・一貫性正規化ネットワークHSACNetを提案する。 HSACNetは,パラメータと計算コストを削減し,最先端の性能を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:45:43 GMT)
DPFNAS: Differential Privacy-Enhanced Federated Neural Architecture Search for 6G Edge Intelligence [23.8]
本稿では,パーソナライズド・ディファレンシャル・プライバシ(DP)と適応モデル設計を統合した新しいフェデレーション学習フレームワークを提案する。提案手法は,トレーニングデータに対する強力なプライバシ保証を実現すると同時に,モデル性能における最先端手法を大幅に上回る。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:03:26 GMT)
ProxyThinker: Test-Time Guidance through Small Visual Reasoners [23.4]
ProxyThinkerは、大規模なモデルで、訓練なしに、小さく、ゆっくりと考えられた視覚的推論能力を継承できる推論時手法である。 RFTの推論者からベースモデルの出力を減じることで、プロクシーティンカーは自己検証や自己補正のような出現した振る舞いによって証明される緩やかな思考的推論を導き出す。本実装では,複数の言語モデルを並列化手法で効率的にコーディネートし,従来の復号時間法と比較して最大38$timesの高速推論を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:58:54 GMT)
CCD: Mitigating Hallucinations in Radiology MLLMs via Clinical Contrastive Decoding [23.4]
マルチモーダル大規模言語モデル(MLLM)は近年,視覚認識と自然言語理解を統合することで,放射線学において顕著な進歩を遂げている。医学的幻覚と呼ばれる臨床的に欠かせない記述をしばしば生成し、正確さと画像的アウトプットを要求される医学的応用に重大なリスクをもたらす。我々は,タスク固有の放射線学の専門家モデルから構造化された臨床信号を統合する,訓練不要で検索不要な推論フレームワークであるCCDを紹介した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:01:09 GMT)
Copyright Infringement Detection in Text-to-Image Diffusion Models via Differential Privacy [23.3]
我々は、著作権侵害の概念を定式化し、差分プライバシー(DP)の観点からその検出を行う。テキストから画像への拡散モデルにおける著作権侵害を識別する新しいポストホック検出フレームワークであるD-Plus-Minus(DPM)を提案する。以上の結果から,DPMは元のトレーニングデータセットやテキストプロンプトへのアクセスを必要とせず,確実に侵害内容を検出することが示唆された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:38:12 GMT)
$\textit{New News}$: System-2 Fine-tuning for Robust Integration of New Knowledge [23.1]
我々は,複数のドメインにまたがる仮説的かつ妥当なニュースからなるデータセットであるNew Newsを紹介する。我々は,モデルによって処理された知識を,コンテキストでモデルの重みに抽出するために設計された,セルフプレイデータ生成プロトコルのスイートを探索する。以上の結果から,Sys2-FTの自己QAプロトコルは,汎用性を保ちながら,モデルによるニュースの重み付け学習を大幅に改善することが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:44:18 GMT)
Vision-EKIPL: External Knowledge-Infused Policy Learning for Visual Reasoning [23.0]
本稿では,textbfVision-EKIPLと呼ばれる新しいRLフレームワークを提案する。 RLトレーニングプロセス中に外部補助モデルによって生成された高品質なアクションを導入し、ポリシーモデルの最適化を導く。最先端(SOTA)と比較して、Reason-RFT-CoTベンチマークで最大5%の性能改善を実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:49:29 GMT)
AutoEP: LLMs-Driven Automation of Hyperparameter Evolution for Metaheuristic Algorithms [23.0]
アルゴリズム制御のためのゼロショット推論エンジンとしてLarge Language Models (LLM)を活用することで、トレーニングを完全に回避する新しいフレームワークであるAutoEPを紹介する。 AutoEPは一貫して最先端のチューニング方法より優れています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:45:21 GMT)
Understanding Language Prior of LVLMs by Contrasting Chain-of-Embedding [22.8]
大規模視覚言語モデル(LVLM)における言語の最初の体系的解析について述べる。それぞれのモデルが視覚統合ポイント(VIP)を示しており、視覚情報が隠れた表現を意味的に再形成し、デコードに影響を与える重要な層である。 9つの現代のLVLMと6つのベンチマークにまたがる54のモデル-データセットの組み合わせにおいて、VIPは一貫して出現し、TVIは言語の強さを確実に予測することを示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:12:05 GMT)
Limit Analysis for Symbolic Multi-step Reasoning Tasks with Information Propagation Rules Based on Transformers [22.5]
単一パスの注意層が$L$であるモデルに対して、推論ステップの極限数は$O(2L-1)$と$O(2L-1)$の間であることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:13:39 GMT)
MedCritical: Enhancing Medical Reasoning in Small Language Models via Self-Collaborative Correction [22.4]
小さな言語モデルは、GPT-4やDeepseekのような大きな言語モデルに比べて性能が劣ることが多い。近年の知識蒸留法は,教師指導による誤り訂正によってこれらの問題に対処することを目的としている。そこで我々は,大規模教師モデルによって微調整された小言語モデルを用いた2段階のフレームワーク,MedCriticalを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:30:20 GMT)
Tracing the Representation Geometry of Language Models from Pretraining to Post-training [22.2]
本研究では,事前学習と後学習にまたがる学習表現の幾何学をスペクトル的に検討する。自己回帰事前学習中に3つの幾何位相の一貫した非単調列が発見された。 SFTとDPOは、特定の命令データや優先データを統合するために「エントロピー探索」ダイナミクスを駆動します。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:46:29 GMT)
Local Success Does Not Compose: Benchmarking Large Language Models for Compositional Formal Verification [22.0]
DafnyCOMPは、Dafnyにおける構成仕様生成において、大きな言語モデル(LLM)を評価するためのベンチマークである。現状のLLMファミリーを複数評価し, 単機能検証では良好に機能するが, 構成タスクでは顕著に低下することがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:33:08 GMT)
WorldSplat: Gaussian-Centric Feed-Forward 4D Scene Generation for Autonomous Driving [21.8]
4次元駆動シーン生成のための新しいフィードフォワードフレームワークである textbfWorldSplat を提案する。提案手法は,2つのステップで一貫したマルチトラック映像を効果的に生成する。ベンチマークデータセットを用いて行った実験は、textbfWorldSplatが高忠実で時間的に空間的に一貫した新しいビュー駆動ビデオを効果的に生成することを示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:47:44 GMT)
LOTFormer: Doubly-Stochastic Linear Attention via Low-Rank Optimal Transport [21.5]
線形時間と二重確率を同時に行う原理的注意機構を提案する。 LotFormerはLong Range Arenaベンチマークで最先端の結果を達成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:11:09 GMT)
CrystalGym: A New Benchmark for Materials Discovery Using Reinforcement Learning [21.5]
新しい材料の設計と最適化は、主に密度汎関数理論計算を行う高精度な原子シミュレータに依存している。オンライン強化学習(RL)による材料設計ループにおける直接DFT信号の導入を支援するため,CrystalGymを提案する。ターゲット特性に条件付けされた結晶を設計するための共通値およびポリシーに基づく強化学習アルゴリズムをベンチマークする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:02:14 GMT)
Long-Context Generalization with Sparse Attention [21.4]
トランスフォーマーベースのアーキテクチャは、伝統的に注意重みを計算するためにソフトマックスを使用している。シーケンス長が増加するにつれて、非情報的トークンは注意確率の質量を蓄積し、分散と表現的崩壊をもたらす。我々は、$alpha$-entmaxを使って動的にスパースな注意機構がこれらの問題を回避できることを示し、これは、無関係トークンに正確なゼロを割り当てる能力のためである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:15:13 GMT)
PARROT: A Benchmark for Evaluating LLMs in Cross-System SQL Translation [21.0]
本稿では CrOss-System SQL Translation のための実践的で現実的なベンチマック PARROT を紹介する。 PARROTは38のオープンソースベンチマークと実世界のビジネスサービスから598の翻訳ペアで構成されている。 28,003 の PARROT-Diverse や 5,306 のサンプルを持つ PARROT-Simple など,複数のベンチマーク版も提供しています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:41:13 GMT)
Test-Time Policy Adaptation for Enhanced Multi-Turn Interactions with LLMs [20.9]
T2PAM(Test-Time Policy Adaptation for Multi-Turn Interactions)について紹介する。まず,ユーザのフィードバックを報奨信号として利用し,ユーザの嗜好に合致した潜在最適ポリシーを推定する,新しいパラダイムT2PAMを提案する。次に,T2PAM を演算する軽量アルゴリズムであるOptimum-Referenced One-Step Adaptation (ROSA) を導入する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:46:15 GMT)
TalkPlayData 2: An Agentic Synthetic Data Pipeline for Multimodal Conversational Music Recommendation [20.9]
TalkPlayData 2は、エージェントデータパイプラインによって生成されるマルチモーダルな会話音楽レコメンデーションのための合成データセットである。提案するパイプラインでは,複数の大規模言語モデル (LLM) エージェントを,特殊なプロンプトで様々な役割で生成する。すべてのLLMは音声と画像でマルチモーダルであり、マルチモーダルレコメンデーションと会話のシミュレーションを可能にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:44:46 GMT)
PiERN: Token-Level Routing for Integrating High-Precision Computation and Reasoning [20.6]
計算と推論を統合するための物理ルーティング型エキスパートネットワーク(PiERN)を提案する。 PiERNは、専門家とテキストから計算モジュール、ルータを個別にトレーニングした後、計算機能をニューラルネットワークに不均一に統合する。その結果,PierNアーキテクチャは大規模言語モデルを直接微調整するよりも精度が高いことがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:44:30 GMT)
Action2Dialogue: Generating Character-Centric Narratives from Scene-Level Prompts [20.6]
本稿では,アクションレベルのプロンプトを視覚的,聴覚的に基礎付けられた物語対話に変換するモジュールパイプラインを提案する。提案手法はシーン毎に一対のプロンプトを入力し,第1に設定を定義し,第2にキャラクタの動作を指定する。我々は、各発話を表現的、文字条件付き音声として表現し、その結果、完全に音声化されたマルチモーダルなビデオ物語を生み出す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:31:31 GMT)
A Generative Model for Controllable Feature Heterophily in Graphs [20.5]
本稿では,特徴ヘテロフィリーの明示的な制御を可能にするグラフ信号生成フレームワークを提案する。グラフファミリとスペクトルフィルタ間のホモフィリーの精密制御を実験により検証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:31:19 GMT)
Entanglement signatures of gapless topological phases in a $p$-wave superconductor [20.4]
我々は、$p$波超伝導体のギャップのない位相位相を探索する。フルバルクギャップがなくても, 絡み合いスペクトルにおけるバルク境界対応を確認した。これらの結果は、隙間のない系における対称性、絡み合い、トポロジーの間の微妙な相互作用を明らかにしている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:25:17 GMT)
Cross-Domain Multi-Person Human Activity Recognition via Near-Field Wi-Fi Sensing [20.1]
不完全な活動カテゴリの存在下で、効率的なドメイン間適応のための新しいトレーニングフレームワークWiAnchorを提案する。我々は、WiAnchorを徹底的に評価するための包括的なデータセットを構築し、アクティビティのカテゴリが欠如している場合に、90%以上のクロスドメイン精度を達成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:22:15 GMT)
Precise Asymptotics of Bagging Regularized M-estimators [20.1]
我々は,アンサンブル推定器の正方形予測リスクを,正規化M値推定器のサブタグ化(サブサンプルブートストラップ集約)により特徴付ける。我々の分析の鍵は、重なり合うサブサンプル上の推定値と残差との相関関係の結合挙動に関する新しい結果である。サブサンプルサイズ,アンサンブルサイズ,正規化の併用最適化は,全データに対してのみ,正規化器の最適化を著しく上回る。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:20:40 GMT)
One-Shot Multi-Label Causal Discovery in High-Dimensional Event Sequences [20.1]
提案するOSCARは1ショットの因果自己回帰法であり,連続するマルコフ境界を推定する。 29,100のイベントと474のラベルを持つ現実世界の自動車データセットでは、OSCARは数分で解釈可能な因果構造を復元する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:49:26 GMT)
Text2Story: Advancing Video Storytelling with Text Guidance [19.9]
本研究では、シーンとアクションプロンプトを統合し、動的にインスパイアされたプロンプトミキシングによってこれを実現できる新しいストーリーテリングフレームワークを提案する。本研究では,各拡散時間におけるシーンおよびアクションプロンプトの影響を適応的にバランスさせる動的インフォームドプロンプト重み付け機構を提案する。動きの連続性をさらに向上するために、ハイレベルなアクション意味論をブレンディングプロセスにエンコードするために、セマンティックアクション表現を組み込む。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:12:45 GMT)
Transferring Vision-Language-Action Models to Industry Applications: Architectures, Performance, and Challenges [19.8]
視覚言語アクション(VLA)モデルは、認識、推論、制御を統一するためのAIの重要なパラダイムである。産業シナリオにおける既存のVLAモデルの性能を比較し,実世界の産業展開におけるVLAモデルの限界を分析する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:02:57 GMT)
GRAPE: Let GPRO Supervise Query Rewriting by Ranking for Retrieval [19.7]
CLIPモデルは,テキストと画像データを統合埋め込み空間に整列させることにより,大規模検索システムの基盤となっている。コストのかかるリトレーニングを避けるため、既存のメソッドは主に大規模言語モデル(LLM)によるクエリ書き換え戦略を採用している。 GRAPEは,検索誘導型クエリ書き換えにランキング信号を組み込むプラグイン・アンド・プレイ拡張手法である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:36:59 GMT)
Factor Decorrelation Enhanced Data Removal from Deep Predictive Models [19.4]
ユーザのプライバシ保護と規制コンプライアンスの義務は、モデルトレーニングにおける機密データ削除を必要とする。本稿では,係数のデコレーションと損失摂動による深部予測モデルを強化する新しいデータ除去手法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:23:21 GMT)
Two-Scale Latent Dynamics for Recurrent-Depth Transformers [18.9]
トークンを出力する前に遅延計算を繰り返すことにより、電流深度変換器の幾何学がテスト時間計算をスケールする。チェックポイント全体では、ループステップがより小さくなり、互いに直交する傾向が増している。これらのダイナミクスは、ステップサイズにおけるモデルの2階差に基づく早期退避機構を動機付けている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:01:40 GMT)
Evaluating Bias in Spoken Dialogue LLMs for Real-World Decisions and Recommendations [18.7]
年齢、性別、アクセントなどのパラ言語的特徴は、モデル出力に影響を与える可能性がある。オープンソースモデルは年齢や性別に敏感であり、推奨タスクはグループ間の格差を増幅する傾向がある。この研究は、エンドツーエンドの音声対話モデルにおけるバイアスに関する最初の体系的な研究を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:21:22 GMT)
Towards Monotonic Improvement in In-Context Reinforcement Learning [18.7]
In-Context Reinforcement Learning (ICRL)は、新しいタスクに迅速に適応できるエージェントを開発するための有望なパラダイムとして登場した。最近のアプローチでは、オンラインRLからモノトニックポリシー改善データに関する大規模なシーケンスモデルをトレーニングしており、テスト時間のパフォーマンスを継続的に改善することを目指している。学習時間とテスト時間の両方でコンテキスト値を推定する2つの手法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:42:19 GMT)
LLM Interpretability with Identifiable Temporal-Instantaneous Representation [18.7]
本稿では,大規模言語モデルに特化して設計された時間的因果表現学習フレームワークを提案する。提案手法は,実世界の複雑性に合わせてスケールした合成データセットに対して,理論的保証と有効性を示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:14:41 GMT)
Solve Smart, Not Often: Policy Learning for Costly MILP Re-solving [18.6]
リアルタイム操作における一般的な課題は、最適化問題を再解決するか、既存のソリューションを使い続けるかを決定することである。本稿では,変化点検出を用いた近似政策最適化というフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:47:15 GMT)
Scaling LLM Test-Time Compute with Mobile NPU on Smartphones [18.5]
本稿では,移動型ニューラルプロセッシングユニット (NPU) が計算資源を過小評価していることを示す。そこで本研究では,モバイルNPUに並列テスト時間スケーリング手法を適用し,小型LLMの性能を向上させることを提案する。混合精度GEMMは19.0、ソフトマックスは2.2である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:17:46 GMT)
SimpleFold: Folding Proteins is Simpler than You Think [18.4]
フローマッチングベースのタンパク質折り畳みモデルであるSimpleFoldを紹介する。 SimpleFoldは適応層を持つ標準のトランスフォーマーブロックを採用しており、生成フローマッチングの目的を通じてトレーニングされている。標準的な折りたたみベンチマークでは、SimpleFold-3Bは最先端のベースラインに比べて競争力がある。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:34:06 GMT)
Text-Based Approaches to Item Difficulty Modeling in Large-Scale Assessments: A Systematic Review [18.0]
アイテムの難しさは、テストパフォーマンス、スコアの解釈可能性、そして、特に大規模な評価において、すべてのテストテイカーにとって重要な役割を担います。アイテム困難モデリングへの伝統的なアプローチは、フィールドテストと古典的テスト理論(CTT)に基づくアイテム分析またはアイテム応答理論(IRT)キャリブレーションに依存している。本稿では,2025年5月までの大規模評価設定において,自動項目難易度予測に関する37項目をレビューし,合成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:19:39 GMT)
Enhancing Delta Compression in LLMs via SVD-based Quantization Error Minimization [18.0]
我々は、特異値分解空間における量子化誤差を最小限に抑えるための適応型混合精度デルタ圧縮フレームワークであるDeltaMixを紹介する。 DeltaMixは、AIME2024やGQAといったタスクのベースラインメソッドを一貫して上回っている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:06:19 GMT)
FMC-DETR: Frequency-Decoupled Multi-Domain Coordination for Aerial-View Object Detection [18.0]
本研究では,FMC-DETRを提案する。FMC-DETR,FMC-DETR,FMC-DETR,FMC-DETR,FMC-DETR,FMC-DETR,FMC-DETR,FMC-DETR,FMC-DETR。まず、大域的低周波文脈知覚を高めるために、カスケードウェーブレット変換を適用したWavelet Kolmogorov-Arnold Transformer (WeKat) のバックボーンを導入する。次に、軽量なクロスステージ部分核融合(CPF)モジュールは冗長性を低減し、マルチスケールの機能相互作用を改善する。最後に,Multi-Domain Feature Coordination (MDFC)モジュールについて述べる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:28:22 GMT)
Beyond Model Ranking: Predictability-Aligned Evaluation for Time Series Forecasting [18.0]
スペクトルコヒーレンスに基づく予測可能性整合診断フレームワークを提案する。予測可能性ドリフト(predictability drift, 予測可能性ドリフト)の最初の体系的な証拠として, タスクの予測困難度が時間とともに急激に変化することを示す。複雑なモデルは予測可能性の低いデータより優れているのに対し、線形モデルは予測可能なタスクに非常に効果的である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:56:06 GMT)
Liaohe-CobotMagic-PnP: an Imitation Learning Dataset of Intelligent Robot for Industrial Applications [17.9]
産業 4.0 の応用においては、動的環境干渉は環境状態とロボット行動の間の非常に非線形で強く結合した相互作用を誘導する。マルチモーダルセンサデータ融合による動的環境状態を効果的に表現することは、現在のロボットデータセットにおいて重要な課題である。データセットはサイズ、色、照明のバリエーションを含む多次元干渉を統合し、高精度センサーを使用して視覚、トルク、関節状態の測定を同期的に収集する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:50:31 GMT)
MoE-PHDS: One MoE checkpoint for flexible runtime sparsity [17.9]
Sparse Mixtures of Experts (MoEs) は通常、固定間隔レベルでの操作を訓練される。プレトレーニングされたMoEは、一般的に想定されるよりも実行時空間変化に対して堅牢であることを示し、MoE-PHDSを導入する。 PHDSは、疎度レベルとアンカーのトレーニングを、高い疎度で短いカリキュラムと混在させ、アーキテクチャの変更を必要としない。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:06:46 GMT)
SemaMIL: Semantic-Aware Multiple Instance Learning with Retrieval-Guided State Space Modeling for Whole Slide Images [17.7]
SemaMILは,スライド画像全体から識別特徴を抽出する適応的手法である。セマンティックに類似したパッチを、可逆的な置換によってシーケンスでクラスタ化する。 FLOPやパラメータを少なくして最先端のサブタイプ精度を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:50:57 GMT)
Follow-Your-Preference: Towards Preference-Aligned Image Inpainting [17.6]
我々は、アライメントトレーニングに顕著な直接選好最適化アプローチを活用する。プライオリティトレーニングデータセットを構築するために、パブリック報酬モデルを使用します。私たちの仕事はシンプルだがしっかりとしたベースラインを設定することができ、この有望なフロンティアを推し進めることができます。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:32:30 GMT)
Understanding and Enhancing the Planning Capability of Language Models via Multi-Token Prediction [17.6]
理論的には、Transformerアーキテクチャを用いてMulti-Token Prediction(MTP)パラダイムを解析する。本研究では,Next-Token Injection (NTI) と Transformer-based transfer layer (Transformer-based transfer layer) の2つの手法を提案する。合成グラフとBlocksworld計画ベンチマークの両方に関する実験により、理論的な結果が検証され、改善によってモデルの経路計画能力が大幅に向上することが実証された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:40:15 GMT)
CasPoinTr: Point Cloud Completion with Cascaded Networks and Knowledge Distillation [17.5]
本稿では,カスケードネットワークと知識蒸留を用いた新しいポイントクラウド補完フレームワークCasPoinTrを紹介する。 CasPoinTrは、完了タスクを2つの相乗的なステージ、Shape ReconstructionとFused Completionに分解する。 CasPoinTrは, 形状回復と細部保存において, 既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:49:24 GMT)
Multilingual Prompting for Improving LLM Generation Diversity [17.3]
大きな言語モデル(LLM)は、その世代における文化的表現と全体的な多様性が欠如していることが知られている。多言語プロンプト(multilingual prompting) - 複数の文化からの文化的・言語的手がかりを付加したベースプロンプトの様々なバリエーションを生成するプロンプト手法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:36:13 GMT)
WorldForge: Unlocking Emergent 3D/4D Generation in Video Diffusion Model via Training-Free Guidance [17.3]
WorldForgeは3つの密結合モジュールからなるトレーニング不要の推論時間フレームワークである。我々のフレームワークはプラグアンドプレイとモデル非依存であり、様々な3D/4Dタスクに適用可能である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:42:58 GMT)
ASTGI: Adaptive Spatio-Temporal Graph Interactions for Irregular Multivariate Time Series Forecasting [17.0]
IMTS固有の不規則区間は、既存の方法に2つの主要な課題をもたらす。本稿では,これらの課題に対処するための適応時空間グラフインタラクション(ASTGI)フレームワークを提案する。複数のベンチマークデータセットの実験では、ASTGIが様々な最先端メソッドより優れていることが示されている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:00:27 GMT)
Space Robotics Bench: Robot Learning Beyond Earth [16.9]
Space Robotics Benchは、宇宙でのロボット学習のためのオープンソースのシミュレーションフレームワークである。オンデマンドの手続き生成と非常に並列なシミュレーション環境を統合している。幅広いミッション関連シナリオにまたがるベンチマークタスクの包括的なスイートが含まれている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:28:31 GMT)
Robust Fine-Tuning from Non-Robust Pretrained Models: Mitigating Suboptimal Transfer With Adversarial Scheduling [16.8]
頑健な目的を持った微調整された非ローバストモデルでは性能が低下する可能性があることを示す。本稿では,最適な移動を促進するトレーニングで使用される摂動強度のスケジュールであるemphEpsilon-Schedulingを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:20:57 GMT)
Memory-Efficient Fine-Tuning via Low-Rank Activation Compression [16.4]
Low-Rank Activation Compression (LoRAct) はメモリ効率の良い微調整方式である。 LoRActは広く採用されているLoRA法と比較して、アクティベーションメモリを約80%削減する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:48:32 GMT)
CGI: Identifying Conditional Generative Models with Example Images [16.2]
生成モデルは近年顕著なパフォーマンスを達成しており、モデルハブが出現している。ユーザがモデル記述やサンプルイメージをレビューするのは簡単ではない。本稿では,ユーザが提供するサンプル画像を用いて,最も適切なモデルを特定することを目的とした生成モデル同定(CGI)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:47:07 GMT)
LexSemBridge: Fine-Grained Dense Representation Enhancement through Token-Aware Embedding Augmentation [16.2]
本稿では,細粒度で入力対応のベクトル変調により高密度なクエリ表現を向上する統合フレームワークを提案する。 LexSemBridgeはバックボーンエンコーダを変更することなくプラグインとして動作する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:22:10 GMT)
Sparse Deep Additive Model with Interactions: Enhancing Interpretability and Predictability [16.1]
Sparse Deep Model with Interactions (SDAMI) は、疎性駆動型特徴選択と、柔軟な関数近似のためのDeepworksを組み合わせたフレームワークである。 SDAMIの中心はエフェクト・フットプリント(英語版)の概念であり、これは高次相互作用が主効果に極端に近づくことを前提としている。選択された各主効果に対して、SDAMIは専用のサブネットワークを構築し、解釈可能性を維持しながら非線形関数近似を可能にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:44:57 GMT)
Beyond Aggregation: Guiding Clients in Heterogeneous Federated Learning [16.1]
本論文は, 医療のシナリオを動機として, 中央サーバがモデルを構築するだけでなく, 患者を病院に誘導し, 特定の状態に最も適した患者を病院に案内できるか? 本稿では,各クライアント上で効率的なローカルモデルを学ぶこと,新しいクエリに最適なクライアントを見つけること,という2つの目標に同時に対処する実証的可能性ベースのフレームワークを提案する。実験的な結果は、ベンチマークデータセットにおけるフレームワークの有効性を示し、標準的なFLアプローチと比較して、モデル精度とクライアントガイダンスの精度の両方の改善を示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:07:55 GMT)
Collaborative Deterministic-Probabilistic Forecasting for Diverse Spatiotemporal Systems [16.0]
CoSTは最先端のベースラインを25%上回り、計算コストを大幅に削減する。気候、エネルギー通信、都市システムに対する試行は、最先端のベースラインよりも25%向上している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:50:48 GMT)
Grouped Satisficing Paths in Pure Strategy Games: a Topological Perspective [15.8]
MARLアルゴリズムで広く採用されている原則は「ウィンステイ、負けシフト」であり、エージェントが最高の応答を達成すれば現在の戦略を維持することを指示する。本稿では,そのような特性に対して十分な条件を確立し,任意の有限状態マルコフゲーム,および任意の$N$-playerゲームが有限長充足パスの存在を保証することを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:07:27 GMT)
No Loss, No Gain: Gated Refinement and Adaptive Compression for Prompt Optimization [15.6]
GRACEは、Gated RefinementとAdaptive Compressionの2つの相乗的戦略を統合するフレームワークである。 GRACEは、それぞれ最先端の手法に対して4.7%、4.4%、および2.7%の大幅な平均相対的な性能向上を実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:13:26 GMT)
FM-SIREN & FM-FINER: Nyquist-Informed Frequency Multiplier for Implicit Neural Representation with Periodic Activation [15.5]
我々はNyquist-informed, neuron-specific frequency multipliersを周期的活性化に割り当てるFM-SIRENとFM-FINERを提案する。この単純だが原則化された修正は特徴の冗長性を50%近く低減し、多様なINRタスク間の信号再構成を一貫して改善する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:14:47 GMT)
Privy: Envisioning and Mitigating Privacy Risks for Consumer-facing AI Product Concepts [15.4]
AIはプライバシーのリスクを創造し、悪化させるが、実践者はこれらのリスクを特定し、緩和するための効果的なリソースを欠いている。私たちはPrivを紹介します。Privは、構造化されたプライバシー影響評価を通じて実践者をガイドするツールです。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:08:24 GMT)
From Conversation to Query Execution: Benchmarking User and Tool Interactions for EHR Database Agents [15.3]
EHR-ChatQAはデータベースエージェントのエンドツーエンドワークフローを評価する対話型データベース質問応答ベンチマークである。エージェントはIncreQAで90-95%(少なくとも5つのトライアルのうちの1つ)、AdaptQAで60-80%、Pass5で35-60%、高いPass@5を達成する。これらの結果は、パフォーマンスだけでなく、安全クリティカルなEHRドメインにも堅牢なエージェントを構築する必要性を浮き彫りにしている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:13:51 GMT)
Modeling the language cortex with form-independent and enriched representations of sentence meaning reveals remarkable semantic abstractness [15.3]
文に対する神経応答をモデル化することにより,言語大脳皮質における意味の抽象表現を探索する。複数の生成画像にまたがるアグリゲーションにより,言語野の反応の精度が向上することがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:01:06 GMT)
Unleashing Flow Policies with Distributional Critics [15.1]
本稿では、状態-動作の戻りの完全な分布を学習する新しい批判的アーキテクチャであるDis Distributional Flow Critic (DFC)を紹介する。 DFCは、より安定的で情報的な学習信号を提供する、豊かで分散的なベルマンターゲットを備えた表現力のあるフローベースのポリシーを提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:51:06 GMT)
Sculptor: Empowering LLMs with Cognitive Agency via Active Context Management [15.1]
大規模言語モデル(LLM)は、プロアクティブな干渉による長いコンテキストの処理において、大幅な性能劣化に悩まされる。 Sculptorは、LLMにコンテキストの断片化、要約、隠蔽、復元、正確な検索という3つのカテゴリのツールを装備するフレームワークである。各種長文ベンチマークの実験的評価により、Sculptorは特定の訓練をしなくても性能を大幅に向上することが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:36:52 GMT)
Geometry-Aware Losses for Structure-Preserving Text-to-Sign Language Generation [14.9]
手話翻訳は、難聴者や難聴者に対して効果的なコミュニケーションを可能にする上で重要な役割を担っている。以前の手法では、人間の骨格運動の解剖学的制約や調整パターンを無視することが多かった。骨格関節間の関係を明示的にモデル化する新しいアプローチを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:06:17 GMT)
AI-Assisted Music Production: A User Study on Text-to-Music Models [14.8]
本稿では,TTMモデルが音楽制作にどう影響するかのケーススタディを提案する。参加者はTTMとソース分離モデルを組み合わせたカスタムツールを使用してトラックを生成する。この発見は、音楽制作におけるTTMの変革の可能性や、実際の統合における課題に関する洞察を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:23:40 GMT)
Train Once, Answer All: Many Pretraining Experiments for the Cost of One [14.7]
210Bトークン上の1.5Bパラメータモデルのトレーニング中に10つの実験を行った。注目すべきは、モデルのトレーニングダイナミクスと全体的なパフォーマンスに対する10の実験の影響が最小限であることだ。その結果,1回のトレーニングで複数の事前学習実験を行うことで,計算予算による大規模モデルによる厳密な科学的実験が可能になることが示唆された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:07:09 GMT)
UniPose: Unified Cross-modality Pose Prior Propagation towards RGB-D data for Weakly Supervised 3D Human Pose Estimation [14.5]
We present UniPose, a unified cross-modality pose before propagation method for weak supervised 3D human pose Estimation。 UniPoseは、大規模RGBデータセットから自己教師付き学習を通じて3Dドメインに2Dアノテーションを転送する。 CMU PanopticとITOPデータセットの実験は、UniPoseが完全に教師されたメソッドと同等のパフォーマンスを達成していることを示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:49:30 GMT)
PHASE: Physics-Integrated, Heterogeneity-Aware Surrogates for Scientific Simulations [14.5]
科学シミュレーションにおける物理統合・異質性認識サロゲートのためのモジュール型ディープラーニングフレームワークPHASEを紹介する。位相は、異種入力のためのデータ型認識エンコーダと、局所力学からグローバルシステム動作への一貫性を促進する多レベル物理ベースの制約を組み合わせる。我々は,米国エネルギー省のE3SMランドモデル(Energy Exascale Earth System Model)の生物地球化学(BGC)スピンアップワークフロー上でPHASEを検証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:50:40 GMT)
Can General-Purpose Omnimodels Compete with Specialists? A Case Study in Medical Image Segmentation [14.4]
多様なデータモダリティを処理できる汎用オムニモデルは、知識集約ドメインの高度に専門化されたモデルと同等に機能する。本研究では、ドメイン固有のディープラーニングモデルに対して、最先端のオムニモデルのゼロショット性能を解析する比較研究を行う。以上の結果から,現在のオムニモデルはまだスペシャリストの普遍的な代替にはなっていないが,その特異な強みはスペシャリストモデルとの相補的な役割を示唆している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:38:02 GMT)
No Concept Left Behind: Test-Time Optimization for Compositional Text-to-Image Generation [14.4]
本稿では,テキスト・トゥ・イメージ(T2I)生成における構成忠実度を高めるための,きめ細かいテスト時間最適化フレームワークを提案する。提案手法は,入力プロンプトを意味概念に分解し,グローバルレベルと概念レベルの両方でアライメントを評価する。 DrawBench と CompBench の実験により,提案手法は概念カバレッジと人間に対する信頼度を大幅に向上させることが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:59:49 GMT)
Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling [14.4]
本研究では,木構造による雑音強度の深さに沿って,スライディング・ウインドウ・サンプリング・ストラテジーを実装したDynamic-TreeRPOを提案する。木層ごとによく設計されたノイズ強度により、Dynamic-TreeRPOは余分な計算コストを伴わずに探索のばらつきを高めることができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:59:31 GMT)
Breaking the MoE LLM Trilemma: Dynamic Expert Clustering with Structured Compression [14.1]
Mixture-of-Experts (MoE) Large Language Models (LLM) は負荷不均衡、パラメータの冗長性、通信オーバーヘッドのトリレンマに直面している。動的専門家クラスタリングと構造化圧縮に基づいて統合されたフレームワークを導入し,これらの問題に協調的に対処する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:45:58 GMT)
Demystifying Network Foundation Models [14.1]
本研究は,ネットワークファウンデーションモデル (NFM) に符号化された潜伏知識の体系的研究である。 4種類のNFMを評価し,それぞれに有意な異方性,不整合性特徴感度パターンが認められた。私たちの研究は、すべてのモデルにまたがる多くの制限を特定し、それらに対処することで、モデルのパフォーマンスが大幅に改善できることを示します。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:53:46 GMT)
Remote Sensing-Oriented World Model [14.0]
世界モデルは、直接観測を超えた世界状態の予測と推論によって、人工知能のポテンシャルを示してきた。既存のアプローチは、主に合成環境や制約されたシーン設定で評価される。本稿では、リモートセンシングにおける世界モデリングのための最初のフレームワークを導入することにより、これらのギャップを埋める。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:53:26 GMT)
Risk Profiling and Modulation for LLMs [13.8]
大規模言語モデル(LLM)は、不確実性の下で意思決定タスクにますます使われている。既存の研究では、主にパーソナリティ・プロンプトやマルチエージェントの相互作用について研究されている。我々は,ポストトレーニングがリスク嗜好の最も安定かつ効果的な調整を提供することを示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:28:40 GMT)
Generalizable Process Reward Models via Formally Verified Training Data [13.8]
FoVerは、正式な検証ツールによって自動的に注釈付けされた正確なステップレベルのエラーラベルでPRMトレーニングデータを合成するアプローチである。実験により、FoVerでトレーニングされたPRMはクロスタスクの一般化を示し、単一のPRMが様々な推論タスクの検証を効果的に行えることを示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:15:03 GMT)
Decision Potential Surface: A Theoretical and Practical Approximation of LLM's Decision Boundary [13.7]
決定境界(Decision boundary)は、機械学習モデルが2つのクラスに等しい分類確率を割り当てる入力のサブ空間であり、コアモデルの性質を明らかにし、振る舞いを解釈する上で重要である。近年,大規模言語モデル (LLM) の決定境界を解析する手法が注目されているが,LLM を主流として構築することは計算的に不可能である。 LLM決定境界を解析するための新しい概念であるDPS(Decision Potential Surface)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:42:54 GMT)
Tree Reward-Aligned Search for TReASURe in Masked Diffusion Language Models [13.4]
ツリー検索は、生成モデルとタスク固有の報酬をテスト時に整合させる強力なフレームワークとして登場した。これらの問題に対処する木探索テスト時間アライメント手法であるTReASUReを提案する。 TReASUReは、パープレキシティ、言語受容性、感情と毒性の制御に関する最先端の結果を達成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:22:45 GMT)
ViSpec: Accelerating Vision-Language Models with Vision-Aware Speculative Decoding [13.3]
視覚言語モデル(VLM)に適した新しいフレームワークViSpec(ViSpec)を紹介する。 ViSpecは画像トークンをコンパクトな表現に圧縮するために軽量な視覚適応モジュールを使用している。我々のトレーニング戦略は、ターゲットモデルの隠れた状態への直接アクセスを利用するドラフトモデルのリスクを軽減する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:39:48 GMT)
The Sandbox Configurator: A Framework to Support Technical Assessment in AI Regulatory Sandboxes [13.1]
EUの人工知能法は、AI規制サンドボックス(AIRS)を導入している。評価メソッドは断片化され、テストは標準化が欠如し、開発者と規制当局の間のフィードバックループは弱い。共有ライブラリからドメイン関連テストを選択し、ダッシュボードを統合したカスタマイズされたサンドボックス環境を生成することができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:37:46 GMT)
Robust Multi-Modal Face Anti-Spoofing with Domain Adaptation: Tackling Missing Modalities, Noisy Pseudo-Labels, and Model Degradation [13.0]
マルチモーダル・フェイス・アンチ・スプーフィングにおける3つの課題に対処する新しいフレームワーク MFAS-DANet を提案する。まず、欠落したモダリティの問題に対処するため、他のモダリティから補完的な特徴を抽出し、欠落したモダリティの特徴を置き換えたり、既存のモダリティを強化したりすることを提案する。次に、モデル適応におけるノイズの多い擬似ラベルの影響を低減するために、異なるモーダル間の予測不確実性を活用することにより、信頼性の高い擬似ラベルを導出することを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:52:31 GMT)
PropXplain: Can LLMs Enable Explainable Propaganda Detection? [13.0]
本稿では,多言語(アラビア語と英語)によるプロパガンダ的コンテンツ検出のための説明強調データセットを提案する。また,ラベル検出と合理化に基づく説明生成のための説明強調LLMも導入した。本研究は,モデルが相補的に動作し,説明文も生成できることを示唆する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:59:10 GMT)
Constrained Decoding for Robotics Foundation Models [12.9]
本稿では,自動回帰ロボット基盤モデルのための制約付き復号化フレームワークであるSafeDecを紹介する。タスク固有の安全ルールはSignal Temporal Logic (STL) 公式として表現され、最小限のオーバーヘッドで推論時に強制される。提案手法は,実行時に仮定された動的条件下でのSTL仕様を,再トレーニングなしで確実に満たすものである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:28:05 GMT)
On the Sheafification of Higher-Order Message Passing [12.7]
トポロジカルディープラーニング(TDL)における最近の研究は、グラフ学習の卓越した$message passing$パラダイムをより複雑な構造に一般化しようとしている。そのような高次メッセージパッシング(HOMP)に対する多くのアプローチは、ホッジ・ラプラシアンの非線形拡散という観点からの定式化を認めている。しかし、高い階調では、ホッジ・ラプラシアンの偏見はより不透明であり、さらに退化する可能性がある。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:33:29 GMT)
Scaling Policy Compliance Assessment in Language Models with Policy Reasoning Traces [12.7]
ポリシー推論トレース(英: Policy Reasoning Traces、PRT)は、LLMのポリシーコンプライアンスアセスメント能力を改善するための推論ブリッジとして機能する、特殊化された推論チェーンの一形態である。実験により, PRTを推論時間とトレーニング時間の両方のシナリオに使用することにより, オープンウェイトモデルと商用モデルの性能が著しく向上することが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:10:21 GMT)
Non-Collaborative User Simulators for Tool Agents [12.3]
本研究では,非協調行動の4つのカテゴリをシミュレートする新しいユーザシミュレータアーキテクチャを提案する。我々のMultiWOZおよび$tau$-benchに関する実験は、最先端ツールエージェントの大幅な性能劣化を示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:06:17 GMT)
Comprehensive Review of Neural Differential Equations for Time Series Analysis [12.3]
本稿では,NDEに基づく時系列解析手法について概説する。 NDEは、ニューラルネットワークの柔軟性と微分方程式の数学的厳密さを組み合わせたパラダイムシフトを表している。本稿では, それらの数学的定式化, 数値計算法, 応用に関する詳細な議論を行い, 連続時間力学をモデル化する能力を強調した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:45:49 GMT)
Learning Randomized Reductions [12.3]
自己修正子は、ランダムに自己認識可能な任意の関数に対して存在する。本稿では,数式関数に対するランダム化自己推論の自動学習手法であるBitweenを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:41:27 GMT)
SysMoBench: Evaluating AI on Formally Modeling Complex Real-World Systems [12.2]
我々は、AIが大規模で複雑なシステムを正式にモデル化する能力を評価するベンチマークであるSysMoBenchを紹介する。私たちは、今日の重要なコンピューティングインフラストラクチャのキーストーンである、並列および分散システムに重点を置いています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:24:54 GMT)
Explicit modelling of subject dependency in BCI decoding [12.2]
Brain-Computer Interfaces (BCI) は、高いオブジェクト間の変動とラベル付きデータに悩まされる。被験者の身元を条件とした軽量畳み込みニューラルネットワーク(CNN)を用いて、対象の依存関係を明示的にモデル化するエンド・ツー・エンドのアプローチを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:51:42 GMT)
No Black Boxes: Interpretable and Interactable Predictive Healthcare with Knowledge-Enhanced Agentic Causal Discovery [12.1]
知識に富んだエージェント駆動因果発見フレームワークであるII-KEAを提案する。 II-KEAは明確な推論と因果解析を通じて解釈可能性を高める。また、臨床医がカスタマイズされた知識ベースとプロンプトを通じて知識や経験を注入することで、対話性も向上する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:04:45 GMT)
TGRPO :Fine-tuning Vision-Language-Action Model via Trajectory-wise Group Relative Policy Optimization [12.1]
Trajectory-based Group Relative Policy Optimization (TGRPO)は、Visual-Language-Action(VLA)モデルのためのオンラインRLベースのトレーニングフレームワークである。 TGRPOの平均成功率は80.7%で、これはスーパーバイザードファインチューニング(SFT)よりも4.2%高く、他の代表的RLベースのポストトレーニング手法よりも優れていた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:37:00 GMT)
Better Safe Than Sorry? Overreaction Problem of Vision Language Models in Visual Emergency Recognition [12.1]
VLM(Vision-Language Models)は、視覚的コンテンツを解釈する能力を示しているが、安全クリティカルなシナリオにおける信頼性はまだ十分に調査されていない。本稿では,200枚の合成画像(100対)と50枚の実世界の画像(25対)からなる診断ベンチマークVERIを紹介する。各緊急シーンは、人間の検証によって視覚的に似ているが安全なものとペアリングされる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:26:41 GMT)
Adaptive Token-Weighted Differential Privacy for LLMs: Not All Tokens Require Equal Protection [12.0]
我々は、適応トークン重み付き微分プライバシー(ATDP)を通して、この知見を運用する。 ATDPは、異なる勾配重みを感度および非感度トークンに適応的に割り当てる。既存のDPベースの微調整パイプラインにシームレスに統合できる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:51:07 GMT)
Sensitivity Analysis for Diffusion Models [12.0]
拡散モデルのトレーニングは、データ分散$rho$から最適なスコア関数$s_t$に近似する。私たちは、スコア、そして最終的にモデルのサンプルが、コストのかかる再トレーニングにコミットする前に、小さな摂動の下でトレーニングセットにどのように変化するかを予測します。本手法は, 数値および近似誤差に対して頑健であり, 得られた感度は, 再トレーニングおよび微調整後の画像拡散モデルサンプルの変化と相関する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:59:00 GMT)
Flow Matching for Efficient and Scalable Data Assimilation [11.6]
データ同化は、ノイズ観測から力学系の状態を推定する。アンサンブルスコアフィルタ(EnSF)のような最近の生成モデルは、高次元非線形設定においてDAを改善するが、計算コストが高い。本研究では,アンサンブルフローフィルタ(EnFF)を導入した。これはFMベースのフレームワークで,サンプリングを高速化し,フロー設計の柔軟性を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:59:08 GMT)
Test-time Uncertainty Estimation for Medical Image Registration via Transformation Equivariance [11.6]
現在のディープ登録ネットワークは、予測が信頼できるかどうかの限られた表示を提供する。本稿では、事前訓練されたネットワークと互換性のあるテスト時間不確実性推定フレームワークを提案する。我々のフレームワークは、事前訓練された登録ネットワークをテスト時にリスク認識ツールに変換し、医療画像登録を安全な配置に一歩近付けます。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:03:06 GMT)
TimeExpert: Boosting Long Time Series Forecasting with Temporal Mix of Experts [11.5]
本稿では,キー値(K-V)ペアを局所的な専門家として再認識する,新たな注目レベルメカニズムであるTMOEを提案する。 TMOEは、無関係なタイムスタンプの局所フィルタリングを通じて、クエリ毎に適応的な専門家選択を行う。次に、一般的な時系列トランスフォーマーフレームワーク(PatchTSTとTimer)のバニラアテンションメカニズムをTMOEに置き換える。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:22:09 GMT)
ARSS: Taming Decoder-only Autoregressive Visual Generation for View Synthesis From Single View [11.3]
textbfARSSは、カメラの軌跡に条件付けされた単一の画像から新しいビューを生成するフレームワークである。本手法は,拡散モデルに基づく最先端のビュー合成手法に比較可能か,あるいはそれ以上に機能する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:03:09 GMT)
DeepFRC: An End-to-End Deep Learning Model for Functional Registration and Classification [11.2]
DeepFRCは、ワープ機能と統一アーキテクチャ内の分類を共同で学習するエンドツーエンドのディープラーニングフレームワークである。このようなジョイントモデルに対する最初の理論的保証を提供し、最適なワープを近似する能力を証明する。合成および実世界のデータセットの実験により、DeepFRCは、アライメント品質と分類精度の両方において、最先端の手法を一貫して上回っていることが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:04:34 GMT)
Flow Matching for Robust Simulation-Based Inference under Model Misspecification [11.2]
Flow Matching Corrected Posterior Estimation(フローマッチング補正後推定)は、シミュレーションによって訓練された後部推定を、少数の実校正サンプルを用いて洗練するフレームワークである。提案手法は,従来のSBIベースラインと比較して,推論精度と不確実性を向上し,不特定性の影響を常に緩和することを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:10:53 GMT)
Detecting Corpus-Level Knowledge Inconsistencies in Wikipedia with Large Language Models [11.2]
不整合, 特定の事実的不整合に着目し, コーパスレベルの不整合検出の課題を導入する。本稿では,LLM推論と検索を組み合わせたエージェントシステムであるCLAIREについて述べる。経験豊富なウィキペディア編集者によるユーザスタディでは、87.5%がCLAIREを使用する際の信頼性が高く、参加者は同じ時間内に64.7%の矛盾が見つかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:32:41 GMT)
An Encoder-Decoder Network for Beamforming over Sparse Large-Scale MIMO Channels [10.9]
大規模分散MIMOチャネルにおけるダウンリンクビームフォーミングのためのエンドツーエンドのディープラーニングフレームワークを開発した。 i) 推定ダウンリンクチャネルを低次元遅延ベクトルに圧縮するエンコーダNN, (ii) ビームフォーマのビームフォーマデコーダNN, (iii) 受信した遅延ベクトルをビームフォーマにマッピングするチャネルデコーダNN, そして (iii) 受信した遅延ベクトルからダウンリンクチャネルを再構築してビームフォーマをさらに洗練するチャネルデコーダNNの3つのモジュールを使用する。 EDNビームフォーミングフレームワークは両遠距離場に拡張される
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:04:29 GMT)
Activation Matching for Explanation Generation [10.9]
我々は、任意の画像上の事前訓練された分類器の決定について、最小限の忠実な説明を生成する。我々は軽量オートエンコーダを訓練してバイナリマスク(m)を出力し、説明(e = m odot x)がモデルの予測と(x)の中間活性化の両方を保存する。 i) 画像と説明の両方においてトップ1ラベルを保持するために分布とクロスエントロピーを整列するKL発散と多層アクティベーションマッチングを組み合わせる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:12:09 GMT)
When Engineering Outruns Intelligence: Rethinking Instruction-Guided Navigation [10.8]
最近のObjectNavシステムは、大きなゼロショットゲインに対して大きな言語モデル(LLM)を信用している。我々は,インストラクション誘導パイプラインであるInstructNavを再評価することにより,この問題を再考する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:20:25 GMT)
Desensitizing for Improving Corruption Robustness in Point Cloud Classification through Adversarial Training [10.8]
入力機能の過度な信頼性は、DNN脆弱性の根本原因である。本稿では,デセンシタイズ・アドセンシタイズ・トレーニング(Desensitized Adsensitized Training, DesenAT)を提案する。 ModelNet-C と PointCloud-C の大規模な実験により,提案手法はクリーンデータセットの性能を低下させることなく,モデルの堅牢性を効果的に向上できることを示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:04:00 GMT)
Measuring Physical-World Privacy Awareness of Large Language Models: An Evaluation Benchmark [10.6]
EAPrivacyは、エンボディエージェントの物理世界のプライバシー意識を定量化するために設計された総合評価ベンチマークである。最高のパフォーマンスモデルであるGemini 2.5 Proは、物理的環境の変更を含むシナリオにおいて、わずか59%の精度しか達成していない。 GPT-4oやClaude-3.5-haikuのような主要なモデルは、社会規範を15%以上無視していた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:39:56 GMT)
$p$-less Sampling: A Robust Hyperparameter-Free Approach for LLM Decoding [10.6]
$p$-less サンプリングは、サンプリングに対する情報理論のアプローチであり、各デコードステップでトランケーション閾値を動的に設定する。 p$-lessが既存のサンプリング手法を一貫して上回りながら、より高い温度でテキスト品質の劣化がはるかに少ないことを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:33:41 GMT)
LLM-3D Print: Large Language Models To Monitor and Control 3D Printing [10.6]
産業4.0は、デジタル化を推進し、添加性製造(AM)へのパラダイムシフトによって製造に革命をもたらした。重要なAM技術であるFDMは、層間押出による最小限の材料廃棄物による、高度にカスタマイズされたコスト効率の高い製品の作成を可能にする。本稿では,3Dプリンタとともに学習済みのLarge Language Models(LLM)を利用して,印刷欠陥の検出と対処を行うプロセス監視・制御フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:10:20 GMT)
FedFDP: Fairness-Aware Federated Learning with Differential Privacy [9.9]
Federated Learning(FL)は、データサイロの課題に対処するために設計された、新興の機械学習パラダイムである。公平性とデータプライバシに関する永続的な問題に対処するため,FedFairというフェアネスを考慮したFLアルゴリズムを提案する。 FedFairをベースとした差分プライバシーを導入し、公正性、プライバシ保護、モデルパフォーマンスのトレードオフに対処するFedFDPアルゴリズムを作成します。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:10:32 GMT)
Minimax Regret Learning for Data with Heterogeneous Subgroups [9.8]
サブポピュレーションの不均一性の存在下では、堅牢で一般化可能な学習方法を開発することが不可欠である。本研究では,複数のトレーニング集団から目に見えないテスト集団への一般化を目的とした,分布のない頑健な階層モデルについて考察する。頑健な階層モデルの下では、経験的MMRは、トレーニング人口と目に見えないテスト人口のそれぞれについて、後悔の保証を享受することができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:57:14 GMT)
LiDAR-based Human Activity Recognition through Laplacian Spectral Analysis [9.7]
人間活動認識は、医療、製造、人間と機械の相互作用における応用をサポートする。グラフスペクトル分析に基づくHAR法を提案する。 40人の被験者と27のアクティビティからなるMM-Fiデータセットでは、厳密な主題に依存しないプロトコルの下では、13クラスのリハビリテーションセットで94.4%、27のアクティビティで90.3%の精度に達する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:16:53 GMT)
Deep Learning-Based Detection of Cognitive Impairment from Passive Smartphone Sensing with Routine-Aware Augmentation and Demographic Personalization [9.6]
認知障害の早期発見は、タイムリーな診断と介入に重要である。受動的スマートフォンセンシングは、自然主義的かつ継続的な認知モニタリングのための有望なアプローチとして登場した。日常的な行動特徴の連続から認知障害を検出するために,Long Short-Term Memory (LSTM) モデルを実装した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:08:25 GMT)
Sensor-Adaptive Flood Mapping with Pre-trained Multi-Modal Transformers across SAR and Multispectral Modalities [9.5]
本研究では, 微調整Prestoによる新しいセンサフレキシブル洪水検出手法を提案する。 Prestoは、SAR(Synthetic Aperture Radar)とMS(Multispectral)の両方をピクセルレベルで処理する軽量な($0.4Mパラメータ)マルチモーダル事前訓練トランスフォーマーである。本手法は,SARのみ,MSのみ,あるいはSAR+MSを併用したフラッドマッピングを単一モデルアーキテクチャで実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:09:30 GMT)
ODE-GS: Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting [9.4]
3次元ガウススプラッティングと潜在ニューラル常微分方程式(ODE)を統合する新しいアプローチODE-GSを導入する。提案手法はまず,観測ウィンドウ内で正確なガウス軌道を生成するモデルを学習し,その上でトランスフォーマーエンコーダを訓練して,過去の軌跡をニューラルODEを介して進化した潜時状態に集約する。数値積分はスムーズで物理的に妥当な未来のガウス軌道を生成し、任意の未来のタイムスタンプでのレンダリングを可能にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:57:17 GMT)
MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction [9.4]
大規模言語モデル(LLM)は推論を必要とするタスクに対して有望なパフォーマンスを示す。最先端のLCMもプロプライエタリであり、コストがかかり、リソース集約であり、ローカルなデプロイメントを非現実的にしている。プライバシー保護機構として抽象化を利用するテキスト・ツー・アクション・フレームワークであるMaskを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:07:50 GMT)
Mechanistic Fine-tuning for In-context Learning [9.3]
In-context Learning (ICL) は、本来ICLスタイルのデータに基づいて事前訓練されていない言語モデル (LM) 上の少数ショット学習を誘導する。 ICLと事前学習のギャップを埋めるために、計算コストの大きいエンドツーエンドパラダイムを用いて、大規模なICLスタイルのデータセット上での微調整LMにアプローチするものもある。本稿では,アテンション行動ファインタニング(ABFT)を提案し,アテンションスコアを最終的な出力ではなく,適切なラベルトークンに集中させる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:52:38 GMT)
Retrieval-Constrained Decoding Reveals Underestimated Parametric Knowledge in Language Models [9.3]
言語モデル(LM)は事実上の知識を符号化するが、しばしば誤った答えを導き出す。本稿では,モデル出力を一意な曲面形式に制限する復号法であるRetrieval-Constrained Decoding (RCD)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:17:01 GMT)
RHYTHM: Reasoning with Hierarchical Temporal Tokenization for Human Mobility [9.2]
本稿では,大規模言語モデル(LLM)を汎用軌道予測器および推論器として利用する統一フレームワークであるRHYTHMを紹介する。 RHYTHMは時間的トークン化を用いて、各軌跡を日々のセグメントに分割し、階層的な注意を払って個別のトークンとしてエンコードする。実世界のデータセットを用いた最先端手法に対して,本モデルの評価を行った。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:55:56 GMT)
Applications of Small Language Models in Medical Imaging Classification with a Focus on Prompt Strategies [9.2]
本研究では,医療画像分類作業における小言語モデル(SLM)の性能について検討する。 NIH Chest X-ray データセットを用いて胸部X線位置を分類する作業において,複数のSLMを評価した。以上の結果から,一部のSLMは良好なプロンプトで競合精度を達成できることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:41:09 GMT)
TATTOO: Training-free AesTheTic-aware Outfit recOmmendation [9.1]
TATTOOはトレーニング不要のAesTheTic-aware Outfitレコメンデーションアプローチである。 MLLMを用いてまずターゲットイテム記述を生成し、続いてイメージを構造化された審美プロファイルに蒸留するために使用される審美連鎖を生成する。実世界の評価セットであるAesthetic-100の実験では、TATTOOは既存のトレーニングベース手法と比較して最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:46:55 GMT)
A2D: Any-Order, Any-Step Safety Alignment for Diffusion Language Models [9.0]
A2D(Any-Order, Any-Step Defense)は、dLLMをアライメントして有害なコンテンツが発生するたびに(EOS)拒絶信号を出力するトークンレベルのアライメント手法である。様々な条件下で、任意のデコード順序と任意のステッププリフィル攻撃の両方に対して堅牢性を達成する。安全性ベンチマークでは、A2Dは有害な出力の発生を一貫して防止し、DIJAの成功率を80%以上からほぼゼロに削減する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:54:59 GMT)
Signal Preserving Weight Initialization for Odd-Sigmoid Activations [9.0]
非線形性は飽和、分散崩壊、学習速度の感度の向上を引き起こす。奇妙なシグモイド函数クラスを定義し、このクラス内の任意の活性化 f を与えられたとき、f に適した初期化法を提案する。このアプローチは、正規化レイヤなしで確実にトレーニングし、強力なデータ効率を示し、標準メソッドが確実に収束しないアクティベーションの学習を可能にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:44:37 GMT)
Evil Vizier: Vulnerabilities of LLM-Integrated XR Systems [9.0]
拡張現実(XR)アプリケーションは、ユーザエクスペリエンスの向上、シーン理解、さらには実行可能なXRコンテンツの生成のために、Large Language Models(LLM)を統合している。これらの潜在的な利点にもかかわらず、統合されたXR-LLMパイプラインにより、XRアプリケーションは新しいタイプの攻撃に対して脆弱になる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:10:45 GMT)
Statistical Learning Guarantees for Group-Invariant Barron Functions [8.9]
群不変構造は群依存因子 $delta_G,Gamma,sigma le 1$ を近似率に導入する。ニューラルネットワークにおける群不変構造を符号化することで、対称目標関数の統計的利点が明らかになることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:52:14 GMT)
If We May De-Presuppose: Robustly Verifying Claims through Presupposition-Free Question Decomposition [8.9]
本稿では,事前仮定のない分解された質問を理由として,構造化された頑健なクレーム検証フレームワークを提案する。我々の方法はこれらの問題を常に緩和し、最大2-5%の改善を実現します。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:54:30 GMT)
Beyond Heuristics: Globally Optimal Configuration of Implicit Neural Representations [8.9]
Inlicit Neural Representations (INR) は、信号処理とコンピュータビジョンにおいて、トランスフォーメーションパラダイムとして登場した。しかし、それらの有効性は最適構成のための原則化された戦略が欠如していることによって制限される。この研究は、厳密な最適化問題としてINR構成を定式化する最初の統一フレームワークであるOptiINRを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:45:51 GMT)
COMPACT: Common-token Optimized Model Pruning Across Channels and Tokens [8.8]
プルーニングは有望な手法であるが、既存のプルーニング手法は限られている。本研究では, (i) 埋め込み/LMヘッド層を縮小するために希少な語彙を併用し, (ii) 共通トケン重み付き活性化を用いたFFN中間チャネルをプルーするCompactを提案する。 Qwen、LLaMA、Gemmaファミリ(0.5B-70B)にわたる実験では、パラメータ、GPUメモリ、レイテンシを大幅に削減した最先端のダウンストリームのパフォーマンスが示されている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:27:33 GMT)
ABC-Eval: Benchmarking Large Language Models on Symbolic Music Understanding and Instruction Following [8.7]
我々は,テキストベースのABC表記スコアの理解と指示追従機能に特化した,最初のオープンソースベンチマークであるABC-Evalを提案する。 10のサブタスクにまたがる1,086のテストサンプルからなり、基本的な音楽構文理解から複雑なシーケンスレベルの推論まで、シナリオをカバーしている。 ABC-Eval 上での7つの最先端 LLM の評価を行い,既存のモデルのシンボリック音楽処理能力に顕著な限界が認められた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:56:20 GMT)
$\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training [8.6]
大規模言語モデル(LLM)は、大規模なソーシャルメディアのダイナミックスに有望な機能を提供する。本稿では,エージェントモデルの訓練に適した行動型ソーシャルメディアを構築するためのフレームワークであるSを紹介する。 BluePrintは、政治談話に焦点を当てた公開Blueskyデータから構築された大規模なデータセットです。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:02:38 GMT)
ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals [8.4]
本稿では,周波数位置埋め込みと高度なバンド分割アーキテクチャを組み合わせた新しい基礎モデルECHOを提案する。本手法は,様々な種類の機械信号データセットを用いて評価する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:05:10 GMT)
A learning-based approach to stochastic optimal control under reach-avoid constraint [8.4]
我々は,リーチアビド制約を受けるマルコフ系を最適に制御するためのモデルフリーアプローチを開発する。適切な仮定の下では、政策パラメータが最適パラメータに収束し、システム軌道が到達不能な制約を高い確率で満たすことが保証される。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:00:31 GMT)
Mapping Overlaps in Benchmarks through Perplexity in the Wild [8.3]
我々は,大規模言語モデル(LLM)ベンチマークとその意味的な重複を特徴付けるために,キャパシティ親しみやすさのシグネチャを開発する。本分析は,ベンチマーク質問の意味的類似性とモデル性能の相関性の両方に関して,シグネチャを定式化したものである。最終的には、論理、数学、言語、命令追従、世界モデリングにまたがるクロスファンクショナルオーバーラップを識別し、コーディングが最重複の少ないドメインとして現れます。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:23:13 GMT)
Hybrid Graph Embeddings and Louvain Algorithm for Unsupervised Community Detection [8.2]
本稿では,Louvainアルゴリズムとグラフニューラルネットワーク(GNN)を統合した新しいコミュニティ検出手法を提案する。 GNNが生成したノード埋め込みを使ってLouvainアルゴリズムを拡張し、よりリッチな構造情報と特徴情報をキャプチャする。拡張されたルーヴァンアルゴリズムの結果を洗練するためのマージングアルゴリズムを導入し、検出されたコミュニティの数を減らす。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:57:51 GMT)
Detecting YouTube Scam Videos via Multimodal Signals and Policy Reasoning [8.0]
本研究は,YouTubeスカム検出のためのマルチモーダル手法に関する最初の体系的な研究である。我々のデータセットは、確立された詐欺カテゴリを集約し、フル長のビデオコンテンツとポリシーに基づく推論アノテーションでそれらを強化します。本フレームワークは,コンテンツポリシーに根ざした解釈可能な推論を生成し,透過性を向上し,自動モデレーションにおける潜在的な応用を支援する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:24:55 GMT)
Disentangling Static and Dynamic Information for Reducing Static Bias in Action Recognition [7.9]
行動認識モデルは、動的な人間の動きよりも静的な手がかりに過度に依存している。このバイアスは、現実世界のアプリケーションにおけるパフォーマンスの低下とゼロショットアクション認識につながる。本研究では,静的シーン情報から時間的動的情報を分離することで,静的バイアスを低減する手法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:03:41 GMT)
3DPCNet: Pose Canonicalization for Robust Viewpoint-Invariant 3D Kinematic Analysis from Monocular RGB cameras [7.9]
3DPCNetは3Dジョイント座標で直接動作するコンパクトな推定器に依存しないモジュールである。本手法は,地中構造IMUセンサデータと強い視覚的対応を示すビデオから加速度信号を生成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:55:21 GMT)
Skill, Will, or Both? Understanding Digital Inaccessibility from Accessibility Professionals' Viewpoint [7.9]
世界の上位100万のウェブサイトの4.1%しかアクセスできない。検出可能なWebコンテンツアクセシビリティガイドライン(WCAG)の失敗によるWebページの割合は、過去5年間でわずか1.9%減少している。本研究の目的は、アクセシビリティの専門家の視点から、デジタルアクセシビリティの状況に関する最新の視点を提供することである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:00:25 GMT)
Vision Language Models are Biased [7.8]
大規模言語モデル(LLM)は、ダウンストリームタスクにおいて、インターネットから大量の事前知識を記憶する。一般的な主題に関する知識が視覚言語モデル(VLM)の標準的視覚的タスクにおける精度をいかに損なうかを検証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:57:13 GMT)
The Matthew Effect of AI Programming Assistants: A Hidden Bias in Software Evolution [7.8]
私たちは、AI支援プログラミングがソフトウェアエコシステムとどのように相互作用するかを調べるために、何千ものアルゴリズムプログラミングタスクと何百ものフレームワーク選択タスクで大規模な実験を行います。プログラミング言語やフレームワークが普及すればするほど、LLM生成コードの成功率が高くなります。この現象は、AIシステムが既存の人気階層を強化し、多様性とイノベーションを妨げる一方で、支配的なツールへの収束を加速する可能性を示唆している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:30:17 GMT)
ModelNet40-E: An Uncertainty-Aware Benchmark for Point Cloud Classification [7.7]
合成LiDARのような雑音下での点雲分類モデルのロバスト性および校正性を評価するための新しいベンチマークであるModelNet40-Eを紹介する。我々は、分類精度、校正基準、不確実性認識を用いて、PointNet、DGCNN、Point Transformer v3-across multiple noise levelsの評価を行った。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:35:24 GMT)
RestoRect: Degraded Image Restoration via Latent Rectified Flow & Feature Distillation [7.6]
本稿では, 劣化画像の復元のための新しい遅延整流特性蒸留法である「RestoRect」を提案する。本研究では, 学習可能な学習空間の軌跡を通して, 教師の質の高い特徴を合成することを学ぶための生成過程として, 特徴蒸留を再構築するための補正流れを適用した。 15のイメージ復元データセットに対して,4つのタスクをカバーする優れた結果を8つのメトリクスで示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:04:41 GMT)
Benchmarking DINOv3 for Multi-Task Stroke Analysis on Non-Contrast CT [7.6]
非コントラストCT(non-contrast Computed Tomography)は脳卒中診断に必須であるが,低画像コントラストと信号対雑音比によって制限される。我々は、最先端の自己監督型視覚変換器であるDINOv3を利用して、脳卒中解析タスクの包括的なセットに強力な特徴表現を生成することで、この問題に対処する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:33:46 GMT)
Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness [7.6]
本稿では,トランスフォーマーベースの予測フレームワークであるChannelTokenFormerを提案する。公開ベンチマークデータセットと1つのプライベートな実世界の産業データセットの実験は、ChannelTokenFormerの優れた堅牢性と正確性を示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:49:48 GMT)
DASICS White Paper: Enhancing Memory Protection with Dynamic Compartmentalization [7.6]
本稿では,DASICS (Dynamic in-Address-Space isolation by Code Segments) のセキュアプロセッサ設計について述べる。複数の特権レベルにわたる動的で柔軟なセキュリティ保護、データフロー保護、制御フロー保護、セキュアなシステムコールを提供する。我々は,DASICSをベースとしたハードウェアFPGAプロトタイプとソフトウェアQEMUシミュレータのプロトタイプを実装し,適応性のためのシステムソフトウェアを改良した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:44:41 GMT)
Runtime Adaptive Pruning for LLM Inference [7.5]
我々は、強化学習(RL)によって駆動される弾力的な刈り取りフレームワークであるRAPを提案する。 RAPは、実際の実行におけるモデルパラメータとKV-cacheの進化率を追跡する。 RAPは最先端のベースラインよりも優れており、モデル重量とKVcacheを同時に検討するのは初めてである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:41:38 GMT)
Assessing Quantum Extreme Learning Machines for Software Testing in Practice [7.4]
QELM(Quantum Extreme Learning Machines)は、最近、産業用エレベーターの古典的ソフトウェアをテストするために応用された。 3つの古典的ソフトウェアテストケーススタディにおいて,量子ノイズがQELMに与える影響について検討した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:15:48 GMT)
MemeIntel: Explainable Detection of Propagandistic and Hateful Memes [7.3]
本稿では,アラビア語およびヘイトフルミームにおけるプロパガンダ的ミームに対する説明強化データセットであるMemeXplainを紹介する。マルチステージ最適化手法を提案し,VLM(Vision-Language Models)を訓練する。以上の結果から,この手法はベースモデルよりもラベル検出と説明生成品質を著しく向上させることが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:06:47 GMT)
Faster Convergence of Riemannian Stochastic Gradient Descent with Increasing Batch Size [7.3]
バッチサイズの増加は、一定のバッチサイズを使用するよりも早く収束する。バッチサイズの増加はRSGDの複雑さを減少させることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:33:40 GMT)
d$^2$Cache: Accelerating Diffusion-Based LLMs via Dual Adaptive Caching [7.0]
拡散に基づく大規模言語モデル(dLLM)は推論効率が劣る。我々は、dLLM推論を高速化するためのトレーニング不要な近似KVキャッシュフレームワークであるd$2$Cacheを紹介した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:07:23 GMT)
Learning without Global Backpropagation via Synergistic Information Distillation [7.0]
SID(Synergistic Information Distillation)は、ディープラーニングを局所的な協調的精錬問題のカスケードとして再構成する新しいトレーニングフレームワークである。 SIDでは、深層ネットワークはモジュールのパイプラインとして構成され、それぞれに局所的な目的を課し、地上目標に対する確率論的信念を洗練させる。モジュール間の下位依存関係を分離することにより、SIDは並列トレーニングを可能にし、更新ロックを排除し、メモリ要求を大幅に削減する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:28:14 GMT)
Patch Rebirth: Toward Fast and Transferable Model Inversion of Vision Transformers [6.7]
パッチ再生インバージョン(Patch Re birth Inversion, PRI)は、インバージョンプロセスにおいて最も重要なパッチを段階的に切り離す新しいアプローチである。 PRIは標準のDense Model Inversionよりも最大10倍高速なインバージョンを実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:35:44 GMT)
MELCOT: A Hybrid Learning Architecture with Marginal Preservation for Matrix-Valued Regression [6.7]
本稿では,従来の機械学習に基づくMarginal Estimation(ME)ブロックと,ディープラーニングに基づくLearningable-Cost Optimal Transport(LCOT)ブロックを統合するハイブリッドモデルMELCOTを提案する。多様なデータセットやドメインにわたる実験では、MELCOTは高い効率を維持しながら、すべてのベースラインを一貫して上回る。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:02:52 GMT)
BEV-VLM: Trajectory Planning via Unified BEV Abstraction [6.6]
本稿では,VLM(Vision-Language Models)とBird's-Eye View(BEV)機能マップを視覚入力として活用する,自律走行における軌道計画のための新しいフレームワークを提案する。本手法では,マルチモーダルセンサデータ(カメラやLiDARなど)を融合し,それらをHDマップに整列させることにより,高度に圧縮された情報的BEV表現を利用する。 nuScenesデータセットの実験結果は、計画精度と完全な衝突回避の44.8%の改善を示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:13:55 GMT)
Socio-Economic Model of AI Agents [6.3]
資源制約下でのAIコラボレーションが社会的なアウトプットに及ぼす影響について検討する。 AIエージェントの導入は、社会全体のアウトプットを大幅に増加させる可能性がある。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:56:48 GMT)
UltraUNet: Real-Time Ultrasound Tongue Segmentation for Diverse Linguistic and Imaging Conditions [6.3]
UltraUNetは、リアルタイム舌輪郭分割に最適化された軽量エンコーダデコーダアーキテクチャである。毎秒250フレームを実現し、デノナイジングやブラーシミュレーションなどの超音波特有の拡張を統合している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:11:33 GMT)
PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [6.3]
本稿では,基本関数から発生する時間的カーネルを含むPLEIA(Lynomial Expansion In Adaptive Distributed Event Systems)というニューラルネットワークのクラスを紹介する。低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:46:38 GMT)
Decrypt Modality Gap in Multimodal Contrastive Learning: From Convergent Representation to Pair Alignment [6.3]
マルチモーダルコントラスト学習は、異なるモーダルからのデータを共有埋め込み空間に埋め込むことを目的としている。実験的な証拠は異なるモダリティの表現が埋め込み空間の完全に別々の領域を占めることを示している本稿では,MCLの収束最適表現とトレーニング最適化時のモーダリティアライメントを解析するための最初の理論的枠組みを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:21:00 GMT)
Effective Quantization of Muon Optimizer States [6.3]
ブロックワイド量子化を用いた8ビットミューオンを導入し,線形スキームと動的スキームの両方をサポートする。 8ビットのMuonは、両方の安定性を維持しつつ、フル精度のMuonに比べてメモリフットプリントが74%削減されていることを実証した。大規模な実験では、8ビットのMuonがMuonのパフォーマンスと密に一致し、AdamWと8ビットのAdamWが4B FineWebトークン上で1.6Bモデルの事前トレーニングを行う。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:31:11 GMT)
Learning single index model with gradient descent: spectral initialization and precise asymptotics [6.1]
十分なサンプルサイズを持つ学習問題に対して、良質なデータを持つ真の信号の周りには領域が存在することを示す。多くの変数によって動機付けられ、広く使われている戦略は、2段階のアルゴリズムであり、まずスペクトル勾配降下を適用する。我々は、検索のための正規化ウィチンガーフローの例で、我々の一般的な理論を実証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:27:24 GMT)
MoQE: Improve Quantization Model performance via Mixture of Quantization Experts [6.0]
Mixture of Quantization Experts(略称:MoQE)は、Mixture-of-Expertsアーキテクチャに基づく量子化推論フレームワークである。 MoQEは1つの完全精度モデルの複数の量子化変種を「量子化の専門家」として結合する我々は,MQEがSOTA量子化モデルに匹敵する性能を達成できることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:46:35 GMT)
Better Hessians Matter: Studying the Impact of Curvature Approximations in Influence Functions [5.9]
制御された分類環境におけるヘッセン近似品質が影響関数属性に及ぼす影響について検討した。実験の結果, ヘッセン近似の精度は一貫して, スコアの品質に優れた結果が得られた。さらに,近年のヘッセン近似法の近似ステップを分解し,各ステップが帰属精度に与える影響を評価する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:12:35 GMT)
EKF-Based Fusion of Wi-Fi/LiDAR/IMU for Indoor Localization and Navigation [5.9]
そこで我々は,Wi-Fi RSSI フィンガープリント,LiDAR を用いた同時ローカライゼーションとマッピング(SLAM),慣性計測ユニット(IMU)ナビゲーションを統合した新しいフレームワークを提案する。具体的には、ディープニューラルネットワーク(DNN)ベースのWi-Fi RSSIフィンガープリントによる粗い局所化をIMUベースの動的位置決めによって改善する。 Xi'an Jiaotong-Liverpool大学のIRビルで実施された実験により,提案したマルチセンサ融合フレームワークが個々のアプローチによる不安定性を抑制することが実証された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:59:04 GMT)
Reconstruct Anything Model: a lightweight foundation model for computational imaging [5.9]
本稿では,フォワード演算子(取得物理とノイズパラメータ)に関する知識を,アンローリングに頼ることなく組み込んだ非定性軽量アーキテクチャを提案する。本モデルは,デブロアリング,磁気共鳴イメージング,トモグラフィ,インパインティング,超解像といった,幅広い逆問題を解決するために訓練されている。提案したモデルは、いくつかの微調整ステップで見つからない逆問題やデータセットに容易に適応できる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:29:14 GMT)
Universal Gröbner Bases of (Universal) Multiview Ideals [5.9]
マルチビューイデアルはピンホールカメラにおける画像形成の幾何学から生まれ、ユニバーサル・マルチビューイデアルは未知のカメラのアナログである。我々は、イデアルの自然集合が、フアンとラーソンによって導入された基準を用いて、両種類のイデアルに対して普遍的なGr"オブナー基底を形成することを証明する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:58:55 GMT)
Protocode: Prototype-Driven Interpretability for Code Generation in LLMs [5.8]
大規模言語モデル(LLM)は、テキスト要約、質問応答、音声からテキストへの翻訳など、様々なタスクに広く採用されている。我々の研究は、モデルの性能を改善し、生成されたコードの解釈可能性を高めることができるインコンテキスト学習(ICL)のデモを自動的にサンプリングすることに焦点を当てている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:32:45 GMT)
InverseScope: Scalable Activation Inversion for Interpreting Large Language Models [5.7]
InverseScopeは、入力インバージョンを介して神経活性化を解釈するための仮定ライトでスケーラブルなフレームワークである。高次元空間におけるサンプリングの非効率性に対処するために,新しい条件生成アーキテクチャを提案する。また,サンプル入力上で計算された特徴整合率を用いて,解釈可能性仮説をテストする定量的評価プロトコルを導入する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:04:29 GMT)
PATCH: Learnable Tile-level Hybrid Sparsity for LLMs [5.6]
大規模言語モデル(LLM)は、優れたパフォーマンスを提供するが、デプロイ時のメモリと計算コストは禁じている。モデルプルーニングはこれらのオーバーヘッドを削減する効果的な方法であるが、既存のアプローチでは課題に直面している。我々は,0%から50%の連続スパシティ比を可能にするハイブリッド・スパシティ・フレームワークであるエレーションを紹介した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:57:28 GMT)
The Geometry of Creative Variability: How Credal Sets Expose Calibration Gaps in Language Models [5.6]
本稿では,ニューラルテキスト生成における不確実性を定量化し,分解するための幾何学的枠組みを提案する。私たちは、500のクリエイティブな文章のプロンプトを10の調整された人間の継続で分析し、10万のストーリーを生成します。我々のクレダルセット分析では、人間の創造性の変化を捉え、最良のモデルと人間のキャリブレーションはわずか0.434に達する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:52:03 GMT)
GuardNet: Graph-Attention Filtering for Jailbreak Defense in Large Language Models [5.6]
大規模言語モデル(LLM)は、ジェイルブレイク攻撃の影響を受けやすくなっている。これらの攻撃はLLM出力の安全性、信頼性、信頼性を損なう。推論に先立ってjailbreakプロンプトを検出しフィルタする階層的なフィルタリングフレームワークであるGuardNetを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:21:12 GMT)
Statistical Inference for Gradient Boosting Regression [5.5]
本稿では,勾配上昇回帰における統計的勾配推定のための統一的なフレームワークを提案する。このフレームワークは,最近提案された正規化手順とドロップアウトや並列トレーニングを統合して,強化のための中央極限定理(CLT)を実現する。提案アルゴリズムは, 組込み信頼区間, 予測区間, 厳密な仮説テストを構築し, 変数の重要度を評価する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:16:10 GMT)
ViTSP: A Vision Language Models Guided Framework for Large-Scale Traveling Salesman Problems [5.5]
トラベリングセールスマン問題の解決 (TSP) は、NP-hard でありながら、幅広い現実世界の応用に基本である。この研究は、事前学習された視覚言語モデル(VLM)を利用して、ソリューションプロセスを視覚的にガイドする新しいフレームワークであるViTSPを提案する。 ViTSPは、0.2%以下の平均最適性ギャップを持つソリューションを一貫して達成し、既存の学習ベースの手法より優れている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:27:24 GMT)
NanoFlux: Adversarial Dual-LLM Evaluation and Distillation For Multi-Domain Reasoning [5.5]
NanoFluxは、LLM推論を改善するために、ターゲットとするトレーニングデータを生成するための、新しい逆のフレームワークである。このフレームワークは、ツール強化された審査員が監督する、アタッカーとデフェンダーとを交互に使用するモデル間の競合ダイナミクスを採用している。 NanoFluxの生成したデータに対する4B-パラメータの微調整は、フルベンチマークの微調整と比較して、様々な領域におけるパフォーマンス向上をもたらす。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:05:46 GMT)
Coarse-to-Fine Personalized LLM Impressions for Streamlined Radiology Reports [5.4]
放射線学報告の「印象」セクションは、放射線学者の燃え尽きの第一の要因である。本稿では,オープンソースの大規模言語モデル(LLM)を活用し,臨床所見から印象を自動生成・パーソナライズする粗大なフレームワークを提案する。 LLaMAとMistralのモデルをシカゴ大学医学部からの大量のレポートのデータセットに微調整する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:19:12 GMT)
SDQ-LLM: Sigma-Delta Quantization for 1-bit LLMs of any size [5.2]
大規模言語モデル(LLM)は、計算とメモリの問題に直面する。 SDQ-LLM: Sigma-Delta Quantization for 1-bit LLMs of any size。 SDQ-LLMの特徴は、Over-Sampling Ratio (OSR) の連続層である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:49:58 GMT)
Increasing the Diversity in RGB-to-Thermal Image Translation for Automotive Applications [5.2]
RGB-to-thermal画像変換は潜在的な解決策を提供するが、既存の手法では1対1のマッピングに重点を置いている。コンポーネント認識適応インスタンス正規化(CoAdaIN)により強化されたマルチモーダル翻訳フレームワークを用いた一対多マッピングを提案する。その結果、より現実的で多様な熱画像の翻訳が可能になった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:49:56 GMT)
Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Learning [5.2]
本稿では,一組の潜伏アンカーと一組の無償却ジェネレータで明示的な集団を置き換えるサロゲートフリーフレームワークであるジェネレーション進化メタ(GEMS)を提案する。 GEMSは、不偏のモンテカルロロールアウト、乗法的重み付けメタ力学、およびポリシーセットを適応的に拡張するためのモデルのない経験的オラクルに依存している。 GEMSは最大6倍高速で、PSROより1.3倍少ないメモリ使用量で、同時に報酬を享受できる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:23:38 GMT)
Optimal and Provable Calibration in High-Dimensional Binary Classification: Angular Calibration and Platt Scaling [5.1]
テキスト重みは、推定器$hatw$と真の線形重み$w_star$との角度$hatw, w_star$に依存する。我々の研究は、高次元でのキャリブレーションと最適性の両方を満たすキャリブレーション戦略を初めて提供するものである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:56:20 GMT)
Perceptual Influence: Improving the Perceptual Loss Design for Low-Dose CT Enhancement [4.7]
低線量CT(Low-Dose Computed Tomography)画像を改善するためのトレーニングネットワークの強力なツールとして,知覚的損失が出現している。知覚的影響の概念(知覚的損失項の総損失に対する相対的寄与を定量化する計量)を導入する。以上の結果から, より優れた知覚的損失設計は, 再構成CT画像のノイズ低減と構造的忠実度を著しく向上させることが明らかとなった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:48:43 GMT)
WARBERT: A Hierarchical BERT-based Model for Web API Recommendation [4.6]
WARBERTは、Web APIレコメンデーションのための階層的なBERTベースのモデルである。 WARBERTはデュアルコンポーネント機能融合とアテンション比較を利用して、APIとマッシュアップ記述の正確な意味表現を抽出する。 WARBERTは既存のソリューションと比較して最大11.7%の改善を実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:09:41 GMT)
Seeing Symbols, Missing Cultures: Probing Vision-Language Models' Reasoning on Fire Imagery and Cultural Meaning [4.3]
VLM(Vision-Language Models)は、しばしば文化的に有能に見えるが、実際の文化的理解よりも表面的なパターンマッチングに依存している。本稿では,火災をテーマとした文化イメージに基づくVLM推論を,分類解析と説明解析の両方を通して探究するための診断枠組みを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:56:12 GMT)
UniPrototype: Humn-Robot Skill Learning with Uniform Prototypes [4.3]
UniPrototypeは、共有モーションプリミティブを介して人間からロボットドメインへの効果的な知識伝達を可能にする新しいフレームワークである。この結果から,UniPrototypeは人間の操作知識をロボットに伝達し,学習効率とタスク性能を大幅に向上させることができた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:33:39 GMT)
Estimating the strength and timing of syntactic structure building in naturalistic reading [4.3]
句構造がカテゴリー検出に先行し,語彙的影響を支配できることを示す。これらの知見は、理解の予測的「ツリー・スキャフォールディング」を裏付けるものである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:56:12 GMT)
CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems [4.3]
我々は,過去のタスクのパフォーマンスを犠牲にすることなく,ウェアラブルセンサモデルを継続的に更新できるフレームワークであるCLAD-Netを提案する。 CLAD-Netは、長期記憶として機能する自己教師型トランスフォーマーと、知識蒸留による活動分類を訓練した教師型畳み込みニューラルネットワーク(CNN)を統合する。 PAMAP2では、CLAD-Netの最終的な精度は91.36パーセント、リプレイは8.78パーセントで、メモリベースと正規化ベースのベースラインを上回っている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:15:44 GMT)
VeriGRAG: Enhancing LLM-Based Verilog Code Generation with Structure-Aware Soft Prompts [4.2]
グラフニューラルネットワーク(GNN)を用いたVerilogコードから構造グラフ埋め込みを抽出する新しいフレームワークを提案する。マルチモーダルレトリバーは、与えられた生成タスクに最も関係のあるグラフ埋め込みを選択する。実験により、VeriGRAGはVerilogコード生成の正確性を大幅に改善することが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:23:36 GMT)
Understanding Transformer Architecture through Continuous Dynamics: A Partial Differential Equation Perspective [4.2]
本稿では,変圧器の離散層構造をPDE(Master partial Differential Equation)が支配する連続の力学系として再認識する新しい解析フレームワークを提案する。 PDEシミュレータと標準トランスフォーマーを比較することで,本実験は本研究の中心的論文の説得力のある実証的証拠を提供する。我々の発見は、数学的基本安定化器は、実際には、他の方法では強力だが本質的に不安定な連続系をテームするのに必要となる数学的基本安定化器であることを示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:59:37 GMT)
PDE-Transformer: A Continuous Dynamical Systems Approach to Sequence Modeling [4.2]
本稿では,変圧器の離散層構造をPDE(Master partial Differential Equation)が支配する連続の力学系として再認識する新しい解析フレームワークを提案する。 PDEシミュレータと標準トランスフォーマーを比較することで,本実験は本研究の中心的論文の説得力のある実証的証拠を提供する。我々の発見は、数学的基本安定化器は、実際には、他の方法では強力だが本質的に不安定な連続系をテームするのに必要となる数学的基本安定化器であることを示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:58:47 GMT)
Do We Need Large VLMs for Spotting Soccer Actions? [4.2]
我々は、このビデオ中心のアプローチからテキストベースのタスクへのシフトを提案し、軽量でスケーラブルにする。我々は、リッチな説明や文脈的な手がかりを提供する専門家の注釈書には、マッチにおける重要なアクションを確実に見つけ出すのに十分な情報が含まれていると仮定する。実験の結果、この言語中心のアプローチは、最先端のビデオベースのスポッターに近づいた重要なマッチングイベントを検出するのに効果的であることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:21:30 GMT)
Flow-Attentional Graph Neural Networks [4.0]
フローアテンションは、Kirchhoff$text$s最初の法則を満たすために、既存のグラフアテンションメカニズムを適用する。フローアテンションは,グラフレベルの分類と回帰処理の両方において,注目に基づくグラフニューラルネットワーク(GNN)の性能を向上させることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:10:42 GMT)
Room-temperature quantum entanglement in a van der Waals material [4.0]
2D van der Waals (vdW) 材料中の量子ビットのエンタングは依然として解明されていない。我々は、光アドレス可能な電子スピンと13ドルC原子核スピンとの室温量子絡みをhBNで報告する。これらの結果は、2次元材料に基づく先進量子技術の堅牢なプラットフォームとしてhBNに絡み合ったスピン量子ビットを確立する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:02:06 GMT)
Dense associative memory on the Bures-Wasserstein space [4.0]
DAMを2-ワッサーシュタイン距離を備えた確率分布に拡張する。本フレームワークは,記憶された分布上の対数sum-expエネルギーと最適輸送マップを集約する検索ダイナミックスを定義する。この研究は、ベクトルから完全分布への連想記憶を高め、現代の生成モデルで古典的DAMをブリッジし、メモリ拡張学習における分布記憶と検索を可能にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:17:02 GMT)
Beyond Embeddings: Interpretable Feature Extraction for Binary Code Similarity [3.9]
言語モデルに基づくエージェントを用いて、アセンブリコードの構造化推論分析を行う。手作りの機能とは違って、よりリッチで適応性がある。埋め込みとは違い、人間可読性があり、保守性があり、逆あるいはリレーショナルインデックスで直接検索できる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:34:32 GMT)
ABConformer: Physics-inspired Sliding Attention for Antibody-Antigen Interface Prediction [3.9]
ABCONFORMERは,バイオシーケンスの局所的特徴とグローバル的特徴の両方をキャプチャする,Conformerのバックボーンに基づくモデルである。 ABCONFORMERは、抗体と配列が与えられたパラトープと抗原を正確に予測し、抗体情報なしで抗原上のパンエピトープを予測する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:12:04 GMT)
CE-Bench: Towards a Reliable Contrastive Evaluation Benchmark of Interpretability of Sparse Autoencoders [3.9]
本稿では,スパースオートエンコーダの新規かつ軽量なコントラスト評価ベンチマークであるCE-Benchを紹介する。その結果、CE-Benchはスパースオートエンコーダの解釈可能性を確実に測定し、既存のベンチマークとよく一致していることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:15:23 GMT)
AttAnchor: Guiding Cross-Modal Token Alignment in VLMs with Attention Anchors [3.9]
本研究では,意味論的に類似したトークンをモダリティ間で効率的にグループ化するパラメータフリーフレームワークであるAttention Anchorを提案する。関連する視覚的パッチの近くにテキストトークンを挿入することで、真のコンテンツベースのクロスモーダルアテンションスコアを示すセマンティックなサインポストを作成する。 AttAnchorは15のメトリクスとベンチマークのうち13の改善を実現している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:37:26 GMT)
Knowledge distillation through geometry-aware representational alignment [3.9]
既存の特徴蒸留法では, 損失ゼロであっても, 特徴構造を捕捉できないことを示す。次に、プロクリスト距離と特徴文法行列のフロベニウスノルムの使用を動機付け、すでに表現的アライメントの測定の文脈で一般的な距離である。本手法による特徴蒸留は,言語モデルファミリー間での蒸留性能の統計的に有意な改善を示すことを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:59:46 GMT)
FracDetNet: Advanced Fracture Detection via Dual-Focus Attention and Multi-scale Calibration in Medical X-ray Imaging [3.9]
FracDetNet - Dual-Focus Attention (DFA)とMulti-scale (MC)を統合したフラクチャー検出フレームワーク DFAは、グローバル・アテンション・メカニズムとローカル・アテンション・メカニズムを組み合わせて、詳細な地域特徴と包括的グローバル・コンテクストを捉えている。 MCは特徴表現を適応的に洗練し、検出性能を向上させる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:15:55 GMT)
Learning How to Use Tools, Not Just When: Pattern-Aware Tool-Integrated Reasoning [3.8]
我々は、直接計算にコードを使用する計算機パターンと、問題をプログラムとしてエンコードするアルゴリズムパターンの2つの共通パターンを識別する。まず、両方のパターンからコードコンピテンスを構築し、パターン選択と教師の好みを一致させる2段階のフレームワークを提案する。難解な数学データセット全体にわたって、パターン認識手法はコードの使用率と精度を大幅に改善する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:10:37 GMT)
mini-vec2vec: Scaling Universal Geometry Alignment with Linear Transformations [3.7]
我々は,テキスト埋め込み空間を並列データなしで整列する手法であるvec2vecを構築した。計算コストを大幅に削減し,より堅牢な,シンプルで効率的な代替手段である mini-vec2vec を提案する。本手法は, 擬並列埋め込みベクトルの仮マッチング, 変換フィッティング, 反復精製の3段階からなる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:25:33 GMT)
Spatiotemporal Radar Gesture Recognition with Hybrid Spiking Neural Networks: Balancing Accuracy and Efficiency [3.6]
本稿では,レーダに基づく人間活動認識(HAR)におけるスパイキングニューラルネットワーク(SNN)の利用について紹介する。我々の新しいハイブリッドアーキテクチャは、空間的特徴抽出のための畳み込みモジュールと時間的処理のためのLeaky Integrate-and-Fireニューロンを組み合わせる。レーダベースHARの効率的かつ競争力のあるソリューションとしてSNNを確立し, 精度, レイテンシ, メモリ, エネルギーの観点からスパイキング計算のトレードオフを実証する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:31:11 GMT)
Confidence-Calibrating Regularization for Robust Brain MRI Segmentation Under Domain Shift [3.6]
軽量適応フレームワークである textbfCalSAM を提案する。これは、EmphFeature Fisher Information Penalty (FIP)を介して、ドメインシフトに対するエンコーダの感度を低下させ、EmphConfidence Misalignment Penalty (CMP)を通して、自信過剰なVoxel-wiseエラーを罰する。クロスセンターとスキャナシフトの評価では、CalSAMは精度とキャリブレーションを大幅に改善する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:12:12 GMT)
Global Beats, Local Tongue: Studying Code Switching in K-pop Hits on Billboard Charts [3.5]
そこで本研究では,K-popの楽曲におけるコードスイッチングと英語の歌詞使用がグローバルチャートの成功に果たす役割について検討する。 2017年から2025年にかけて、Billboard Hot 100とGlobal 200チャートに登場したKポップ曲のデータセットがコンパイルされた。男性も女性も高いコードスイッチングと英語使用率を示しており、Kポップのグローバルなチャートリングの言語的景観は英語が支配的であることが判明した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:05:28 GMT)
A Structured Framework for Evaluating and Enhancing Interpretive Capabilities of Multimodal LLMs in Culturally Situated Tasks [3.5]
本研究では,現在主流となっているビジュアル言語モデル(VLM)の機能と特性を検証し,評価することを目的とする。われわれはまず中国絵画評論の定量的枠組みを考案した。この枠組みは, 評価的姿勢, 特徴焦点, 解説的品質を含む多次元的評価的特徴を, 人間の専門家の批判から抽出することによって構築された。実験的な設計は、様々な視点から批評を生成するVLMの能力を評価するためのペルソナ誘導のプロンプトを含んでいた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:41:51 GMT)
Enhanced Fracture Diagnosis Based on Critical Regional and Scale Aware in YOLO [3.4]
本研究では,新しいCRSelector(Critical-Region-Selector Attention)とScA(Scale-Aware)のヘッドを統合し,検出性能の向上を図る。実験により, ベースラインモデルと比較して, mAP50とmAP50-95が4と3に増加し, 最新技術(SOTA)の性能が向上した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:53:15 GMT)
A Neural ODE Approach to Aircraft Flight Dynamics Modelling [3.4]
本稿では、クイックアクセスレコーダ(QAR)データに基づいて訓練されたニューラル正規微分方程式に基づくFlight Dynamics ModelであるNODE-FDMを紹介する。解析的キネマティックな関係をデータ駆動コンポーネントと組み合わせることで、NODE-FDMは記録された軌道のより正確な再現を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:44:17 GMT)
Comparison of Scoring Rationales Between Large Language Models and Human Raters [3.4]
本研究では,評価の不整合性の原因を明らかにするために,人間とLLMラッカーの理性について検討した。大規模試験から得られたエッセイを用いて, GPT-4o, Geminiおよびその他のLLMの評価精度を検討した。コサイン類似性は、与えられた有理量の類似性を評価するために用いられる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:58:51 GMT)
Efficient Self-Supervised Adaptation for Medical Image Analysis [3.3]
自己監督適応(SSA)は、基礎モデルの医療領域への移行を改善するが、計算的に禁止されている。本研究では,パラメータ効率のよい微調整手法をSSAに適用した,効率的な自己教師付き適応(ESSA)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:13:56 GMT)
Impact of Environmental Factors on LoRa 2.4 GHz Time of Flight Ranging Outdoors [3.3]
LoRa 2.4 GHzと呼ばれるLoRaの新しい派生型がSemtechによって提案され、無線周波数(RF)の飛行時間(ToF)をメートルレベルのローカライゼーションの手法として提供する。簡単なディープニューラルネットワーク(DNN)モデルに基づく予備調査の結果、温度と湿度を含む環境要因が範囲の精度に大きく影響していることが示されている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:07:45 GMT)
Learning Regional Monsoon Patterns with a Multimodal Attention U-Net [3.1]
高分解能降水分類のための多モード深層学習フレームワークを提案する。インド5州に対する新しい1km解像度データセットをキュレートする。当社のフレームワークは,単調なベースラインや既存のディープラーニング手法よりも一貫して優れています。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:48:30 GMT)
An Investigation into the Performance of Non-Contrastive Self-Supervised Learning Methods for Network Intrusion Detection [3.0]
本稿では,3つのエンコーダアーキテクチャと6つの拡張戦略を用いて,5つの非コントラスト型自己教師学習手法の性能を比較した。各自己教師型モデルに対して、エンコーダアーキテクチャと拡張法の組み合わせにより、最大平均精度、リコール、F1スコア、AUCROCが得られた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:36:17 GMT)
Mask What Matters: Controllable Text-Guided Masking for Self-Supervised Medical Image Analysis [2.7]
Mask What Mattersは、自己監督型医療画像分析のためのコントロール可能なテキスト誘導マスキングフレームワークである。既存のMIM法を一貫して上回り、分類精度で最大3.1ポイントの利得を得る。これらの改善は、全体のマスキング比を著しく低くする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:26:56 GMT)
Network-Optimised Spiking Neural Network for Event-Driven Networking [2.6]
スパイキングニューラルネットワークは、異常検出、ローカルルーティング制御、エッジでの混雑管理など、時間クリティカルなネットワークタスクに適したイベント駆動型計算を提供する。本稿では,正規化された待ち行列の占有状態と回復資源を符号化したコンパクトな2変数ユニットであるNetwork-Optimized Spiking (NOS)を紹介する。我々は、データ駆動初期化、リセットシャープネスに基づくホモトピーによる代理段階トレーニング、リソース制約されたデプロイメントのための境界のトポロジによる明確な安定性チェックのガイダンスを提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:31:24 GMT)
Vid-Freeze: Protecting Images from Malicious Image-to-Video Generation via Temporal Freezing [2.5]
Vid-Freezeは、新しい注意を抑える敵攻撃であり、画像に慎重に敵の摂動を追加する。本手法は, 動作合成を完全に破壊するI2Vモデルの注意機構を目標とした。その結果、免疫された画像は、スタンスチールまたはニアスタティックなビデオを生成し、悪意のあるコンテンツ生成を効果的にブロックする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:26:34 GMT)
Tracking Quantum State Collapse/Decoherence in Real Time via a Superposition Trap [2.4]
重ね合わせトラップと呼ばれる機構を用いて,量子状態の崩壊とデコヒーレンスをリアルタイムで予測する新しい手法を提案する。このアプローチは、量子力学における連続性方程式を利用して、空間的にコヒーレントな重ね合わせのみを閉じ込める構成を設計する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:24:11 GMT)
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model [2.3]
本研究では、アクセス可能なオンラインデータを活用することで、小規模言語モデルにおける医療知識の強化について検討する。我々は、キュレートされたデータを用いてベースラインモデルを微調整し、その医療的知識を改善した。ベンチマーク評価により, 微調整モデルにより, 医療質問応答の精度が向上することが示された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:54:27 GMT)
Exploring LLM-based Frameworks for Fault Diagnosis [2.3]
大規模言語モデル(LLM)に基づくシステムは,センサリッチ産業環境における自律型健康モニタリングの新たな機会を提供する。本研究では,LLMがセンサデータから直接障害を検出し,分類すると同時に,自然言語の推論を通じて本質的に説明可能なアウトプットを生成する可能性について検討する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:53:15 GMT)
FedBit: Accelerating Privacy-Preserving Federated Learning via Bit-Interleaved Packing and Cross-Layer Co-Design [2.3]
完全同型暗号化(FHE)を備えたフェデレートラーニング(FL)は、モデルアグリゲーション中にデータプライバシを効果的に保護する。 FedBit は Brakerski-Fan-Vercauteren (BFV) スキームのためのハードウェア/ソフトウェアの共同設計フレームワークである。 FedBitは、ビットインターリーブデータパッキングを使用して、複数のモデルパラメータを単一の暗号係数に埋め込む。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:58:16 GMT)
Threshold Signatures for Central Bank Digital Currencies [2.2]
CBDCは、取引の真正性と整合性に関する署名に依存しており、秘密鍵の妥協の場合、大きな問題に繋がる。本研究は、CBDCの文脈におけるしきい値シグネチャスキーム(TSS)について検討する。 TSは分散キー管理と署名を可能にし、妥協されたキーのリスクを低減する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:48:30 GMT)
A Near-Cache Architectural Framework for Cryptographic Computing [2.2]
ポスト量子暗号アルゴリズムは、公開鍵と署名を使い、前量子暗号で使われるものよりも3〜9ドル長い。私たちの分析で明らかになった重要なボトルネックは、キャッシュ帯域幅です。この制限は、オンチップイン/ニアキャッシュコンピューティングの採用を動機付けている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:15:17 GMT)
AI Education in Higher Education: A Taxonomy for Curriculum Reform and the Mission of Knowledge [2.2]
我々は、最も簡潔な課題はカリキュラムと学際的な目的のレベルにあると主張している。我々は、研究、カリキュラム、教育、教員の専門知識の相互作用を通じて、規律がどのように進化していくかを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:22:58 GMT)
Localized Diffusion Models [2.1]
対象分布の低次元構造が拡散モデルにおいてどのように活用できるかを示す。このような局所化は拡散モデルによって次元の呪いを回避できることを証明している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:30:09 GMT)
Impute-MACFM: Imputation based on Mask-Aware Flow Matching [1.9]
Impute-MACFMは、表計算のための条件付きフローマッチングフレームワークである。無作為性、無作為性、無作為性、無作為性、無作為性に対処する。軌道は欠落したエントリのみに設定され、予測速度は観測されたエントリでほぼゼロに抑えられる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:15:09 GMT)
Dynamic Trust Calibration Using Contextual Bandits [1.9]
過剰な信頼は、AIが生成したアウトプットを疑わしいことなく受け入れることを可能にする。不十分な信頼は、AIシステムから価値のある洞察を無視してしまう可能性がある。現在、人間とAIの信頼度を測る決定的かつ客観的な方法は存在しない。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:06:17 GMT)
MimiTalk: Revolutionizing Qualitative Research with Dual-Agent AI [1.8]
我々は、社会科学研究におけるスケーラブルで倫理的な会話データ収集のために設計された、二重エージェントの立憲AIフレームワークであるMimiTalkを紹介する。研究1では,20名の被験者によるユーザビリティの評価を行い,研究2では121名のAIインタビューをメディアサムデータセットからの1271名の人間インタビューと比較した。その結果,MimiTalkはインタビューの不安を軽減し,会話のコヒーレンスを維持し,情報豊かさ,コヒーレンス,安定性において人間のインタビューを上回っていることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:02:50 GMT)
New Insights and Algorithms for Optimal Diagonal Preconditioning [1.8]
我々は,対角的プレコンディショニング問題を解決するために,保証付き競争力のある下位段階法を開発した。提案手法は,既存のSDP手法よりも線形システムの解法が優れていることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:16:21 GMT)
Transfer Learning and Machine Learning for Training Five Year Survival Prognostic Models in Early Breast Cancer [1.8]
機械学習、転送学習は、堅牢な予後フレームワークを構築する機会を提供する。乳がんにおける生存予後の改善には,de-novo MLとの比較,事前訓練した予後ツールからの移行学習,アンサンブル統合が有用である。本研究では,PreDICT v3の関連情報が不足している状況やデータセットシフトの可能性が低い状況において,トランスファーラーニング,デノボRSF,アンサンブル統合が予後を向上させることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:49:55 GMT)
GRAM: Spatial general-purpose audio representation models for real-world applications [1.6]
本稿では,マルチチャネルマスキング自動エンコーダを用いた汎用リアルワールドオーディオモデルGRAMを提案する。我々は,HEAR と Nat-HEAR の両モデルにおいて,GRAM が最先端の音声基礎モデルおよび音声基礎モデルを上回ることを示す。 GRAMは、2チャンネルのサウンドフォーマットまたは4チャンネルのアンビニクスフォーマットに柔軟に適用することができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:32:22 GMT)
BenchRL-QAS: Benchmarking reinforcement learning algorithms for quantum architecture search [1.6]
量子アーキテクチャ探索(QAS)における強化学習のための統合ベンチマークフレームワークであるBenchRL-QASを提案する。本研究は、量子問題において、値ベースおよびポリシーグレートな手法を含む9種類のRLエージェントを体系的に評価する。その結果,単一RL法が支配的ではなく,タスクタイプ,キュービット数,ノイズ条件に依存していることがわかった。副産物として、RLベースのVQCにおける慎重に選択されたRLアルゴリズムが、ベースラインVQCよりも優れていることを観察する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:44:30 GMT)
Targeted perturbations reveal brain-like local coding axes in robustified, but not standard, ANN-based brain models [1.6]
現代のANNベースの脳モデルのほとんどは、予期しないほど脆弱であることを示す。我々の研究は、局所的な表現幾何学が脳モデル評価に強い基準を与えることを示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:39:36 GMT)
From Human Annotation to Automation: LLM-in-the-Loop Active Learning for Arabic Sentiment Analysis [1.5]
注釈を補助し、その性能を人間のラベルと比較する大規模言語モデル(LLM)は、アラビア語の文脈ではいまだに探索されていない。ハイパフォーマンスを維持しつつアノテーションコストを削減するためにアラビア感情分析のための能動的学習フレームワークを提案する。 GPT-4o for Hunger Station、Claude 3 Sonnet for AJGT、DeepSeek Chat。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:23:46 GMT)
CoT-TL: Low-Resource Temporal Knowledge Representation of Planning Instructions Using Chain-of-Thought Reasoning [1.4]
我々は、自然言語仕様を表現に変換するためのデータ効率のよいインコンテキスト学習フレームワークであるCoT-TLを紹介した。 CoT-TLは、ローデータシナリオで3つの多様なデータセット間で最先端の精度を達成する。我々はCoT-TLの実用性を自然言語命令に基づく多段階ドローン計画のためのQuadCopterに組み込む。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:01:42 GMT)
ICS-SimLab: A Containerized Approach for Simulating Industrial Control Systems for Cyber Security Research [1.4]
ICS-SimLabは、Dockerコンテナ化技術を使用してICSシミュレーション環境を作成するエンドツーエンドソフトウェアスイートである。我々は、ソーラーパネルのスマートグリッド、水筒充填施設、インテリジェント電子機器システムという3つの仮想ICSシミュレーションを提示する。我々は、これらのシミュレーションでサイバー攻撃を行い、IDS開発に使用される悪意のある、良質なネットワークトラフィックのデータセットを構築した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:39:54 GMT)
JAX-MPM: A Learning-Augmented Differentiable Meshfree Framework for GPU-Accelerated Lagrangian Simulation and Geophysical Inverse Modeling [1.4]
本稿では,物質点法(MPM)に基づくメッシュフリー解法 JAX-MPM を提案する。この解法はユーレリア・ラグランジアン・ハイブリッドの枠組みを採用し、大きな変形、摩擦接触、材料挙動を捉える。 JAX-MPMは、そのタイムステッピングソルバを介して、効率的な勾配ベースの最適化を可能にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:33:27 GMT)
Don't Trust Generative Agents to Mimic Communication on Social Networks Unless You Benchmarked their Empirical Realism [1.4]
我々は,大規模言語モデルを用いて,ソーシャルネットワーク利用者の行動の再現に重点を置いている。我々は、英語とドイツ語でユーザ動作を模倣する様々なアプローチを経験的にテストした。本研究は, シミュレーション部品が装着された環境で測定された経験的現実性によって, 社会シミュレーションを検証すべきであることを示唆している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:46:26 GMT)
The Impact of Role Design in In-Context Learning for Large Language Models [1.3]
In-context Learning (ICL) により、Large Language Models (LLM) は、追加の微調整なしでプロンプトに基づいて予測を生成することができる。本研究では, OpenAI の GPT-3.5 と GPT-4o と Meta の Llama2-7b と Llama2-13b を用いたゼロショットおよび少数ショット学習シナリオにおける役割構成の影響について検討した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:15:30 GMT)
Evaluating point-light biological motion in multimodal large language models [1.2]
点灯ディスプレイ(PLD)が示すように、人間は最小限の視覚的手がかりから情報を抽出する本稿では,人間のPLDからMLLMのアクション処理を評価する最初のベンチマークであるActPLDを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:33:05 GMT)
Mind the Links: Cross-Layer Attention for Link Prediction in Multiplex Networks [1.2]
多重グラフは共有ノード間の多様な関係をキャプチャする。ほとんどの予測器は層を崩壊させるか、独立して扱う。マルチビューエッジ分類として多重化リンク予測を行う。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:55:15 GMT)
CoSIFL: Collaborative Secure and Incentivized Federated Learning with Differential Privacy [1.1]
CoSIFLは、堅牢なセキュリティとローカルディファレンシャルプライバシのためのプロアクティブアラームを統合するフレームワークである。 Tullockコンテストにインスパイアされたインセンティブモジュールは、データコントリビューションと信頼性の高いアラームトリガーの両方に対して、誠実なクライアントに報いる。サーバ・クライアント・ゲームはユニークな平衡性を認めており、クライアントの多次元属性(例えば、IIDの学位やプライバシー予算など)がシステム効率にどのように影響を与えるかを分析する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:45:40 GMT)
MMeViT: Multi-Modal ensemble ViT for Post-Stroke Rehabilitation Action Recognition [1.1]
遠隔監視システムの主要なコンポーネントは、アクションを分類するヒューマンアクション認識(HAR)技術である。脳卒中の研究は、ディープラーニングではなく機械学習を用いて比較的単純なアクションを分類することに集中してきた。本研究では,脳卒中患者の行動を監視するシステムを構築し,日常生活上肢活動(ADL)に着目した。その結果,脳卒中患者の行動データは,非障害者よりもクラスタリングが低いことがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:46:26 GMT)
AI-Based Stroke Rehabilitation Domiciliary Assessment System with ST_GCN Attention [1.1]
ホームベースのリハビリテーション・エクササイズ・フィードバックシステムを提案する。本システムは,(1)RGB-Dカメラとウェアラブルセンサを備えたハードウェア構成により,ストロークの動きを捉え,(2)運動指導用モバイルアプリケーション,(3)評価とフィードバックのためのAIサーバから構成される。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:45:56 GMT)
Streamline pathology foundation model by cross-magnification distillation [1.0]
ファンデーションモデル(FM)は、計算病理を変容させたが、臨床展開では計算が禁じられている。本稿では, コース磁化蒸留により開発された軽量FMであるXMAGを紹介する。 XMAGはコンパクトなバックボーンを採用しており、全スライド画像の11.3倍のパッチを必要とする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:11:53 GMT)
Controlling Sloppiness in Two-Phase Estimation with a Tunable Weak Measurement [0.9]
パラメータの小さなサブセットは、システム自体のダイナミクスを記述するのに十分です。残りの組み合わせはtextitsloppy と呼ばれ、システムの力学において小さな役割を果たすだけである。 2つの位相間の変動強度の弱い測定によって、完全に傾斜した設定から完全に決定された構成に切り替えることができることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:48:07 GMT)
U-generating system dynamics with a product state using local operations [0.9]
量子系は、大域的なユニタリ進化が起こる前に既に環境と相関している場合、望ましくない力学を行うことができる。我々は、これらの効果を緩和するために、グローバルな進化に先立って、興味あるシステムに局所的な操作を適用する。単一ユニタリ演算は、時間依存のグローバル進化を行うシステムと環境に対する全ての非完全正の量子力学を防止できることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:32:53 GMT)
Reinforcement Learning-Based Prompt Template Stealing for Text-to-Image Models [0.9]
少数のサンプル画像のみからテンプレートを復元する強化学習フレームワークであるLStealerを提案する。 RLStealerは最先端のパフォーマンスを得ると同時に、攻撃コストを既存のベースラインに必要な13%以下に削減する。我々の研究は、即時取引に固有の緊急のセキュリティ脅威を強調し、保護基準の策定の基礎となる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:29:50 GMT)
IsingFormer: Augmenting Parallel Tempering With Learned Proposals [0.9]
スピン構成全体を生成可能な平衡サンプルに基づいてトレーニングされた変換器であるIsingFormerを紹介した。 1つのプロポーザルを1つでも注入することで、数千のローカル更新を置き換える平衡時間が大幅に短縮される。 Ising問題として符号化された整数分解に適用されたIsingFormerは、限定されたセミプライム転送でトレーニングされた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:40:50 GMT)
StarveSpam: Mitigating Spam with Local Reputation in Permissionless Blockchains [0.9]
本稿では,取引中継層で処理することでスパムを緩和する評価ベースのプロトコルであるStarveSpamを紹介する。 StarveSpamは、ローカルな行動追跡、ピアスコアリング、アダプティブなレート制限を組み合わせることで、グローバルなコンセンサス、プロトコルの変更、信頼されたインフラストラクチャを必要とせずに、虐待的なアクターを抑制する。提案手法は既存の料金ベースの防御とルールベースの防御よりも優れており、各ノードが95%以上のスパムをブロックできる一方で、誠実なトラフィックのわずか3%を減らし、既存のルールベースの方法と比較してスパムにさらされるネットワークの割合を85%削減できることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:42:21 GMT)
Explanation-Driven Counterfactual Testing for Faithfulness in Vision-Language Model Explanations [0.9]
視覚言語モデル(VLM)はしばしば、説得力があるが予測を導く因果的要因を反映しない、流動的な自然言語説明(NLE)を生成する。この妥当性と忠実性のミスマッチは、技術的およびガバナンスのリスクを引き起こす。本稿では,対象VLMの完全自動検証手法であるExplaination-Driven Counterfactual Testing (EDCT)を紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:16:23 GMT)
Transfer-Based Strategies for Multi-Target Quantum Optimization [0.8]
マルチターゲット量子最適化の課題に対処する。目的は、同じ量子探索空間上で定義された複数のコスト関数を同時に最適化することである。本稿では,関連するタスク間の知識伝達を可能にする戦略について検討する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:48:08 GMT)
HTMA-Net: Towards Multiplication-Avoiding Neural Networks via Hadamard Transform and In-Memory Computing [0.8]
本稿では,Adamard Transformと乗算回避(MA)ベースのインメモリコンピューティングを統合したフレームワークであるHTMA-Netを紹介する。その結果、HTMA-NetはベースラインのResNet-18、ResNet-20、ResNet-50モデルと比較して最大52%の乗算を排除していることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:26:02 GMT)
RISE: Robust Imitation through Stochastic Encoding [0.8]
本稿では,環境パラメータの誤った測定をポリシー学習に明示的に対応させる,新しい模倣学習フレームワークを提案する。我々のフレームワークは、障害状態、向き、速度などのパラメータを潜在空間にエンコードし、テスト時間を改善する。我々は,2つのロボットプラットフォームに対するアプローチを検証するとともに,目標達成性能をベースライン法と比較し,安全性の向上を図っている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:47:07 GMT)
Implicit Bias-Like Patterns in Reasoning Models [0.6]
暗黙のバイアス(英語: Implicit bias)とは、知覚、判断、行動を形成する自動的な精神過程を指す。本稿では、推論モデルにおける暗黙的なバイアス様処理を研究するために、推論モデルインプシット・アソシエーション・テスト(RM-IAT)を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:50:13 GMT)
SPhyR: Spatial-Physical Reasoning Benchmark on Material Distribution [0.5]
データセットには、部分構造内のマスクされた領域を埋めることから、完全な物質分布を予測することまで、さまざまなタスクが含まれている。本データセットは2次元設定における空間的および物理的推論能力の評価を目標とし,従来の言語と論理的ベンチマークを補完する視点を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:50:46 GMT)
BioArtlas: Computational Clustering of Multi-Dimensional Complexity in Bioart [0.5]
バイオアートのハイブリッドな性質は、芸術、科学、技術、倫理、政治に及んでいる。 13の硬化した次元にわたる81のバイオアート作品を分析し、BioArtlasを紹介します。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:26:17 GMT)
Small Language Models for Curriculum-based Guidance [0.5]
教育における生成的AIと大規模言語モデル(LLM)の採用は、いまだに現れている。我々は、GPT-4oに対して、LLaMA 3.1、IBM Granite 3.3、Gemma 3 (7-17Bパラメータ)を含む8つのSLMをベンチマークした。以上の結果から, SLM は LLM と一致し, 正確な対応が可能であることが示唆された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:23:34 GMT)
i-LAVA: Insights on Low Latency Voice-2-Voice Architecture for Agents [0.4]
我々は,音声音声合成システム(V-2-V)に不可欠なコンポーネントを解析し,自動音声認識(ASR),テキスト音声合成(TTS),ダイアログ管理を行う。我々の研究は、自然停止や宣言を含む感情に満ちた生活に似た音声を生成するTTS成分がリアルタイムファクター(RTF)に最も影響を与えることを確認した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:00:25 GMT)
RANGER -- Repository-Level Agent for Graph-Enhanced Retrieval [0.4]
汎用自動化ソフトウェアエンジニアリング(ASE)には、コード補完、検索、修復、QA、要約といったタスクが含まれる。これらのタスクは、コードエンティティやコードエンティティクエリに関する特定のクエリを処理できるコード検索システムを必要とする。本稿では、両方のクエリタイプに対応するように設計されたリポジトリレベルのコード検索エージェントであるRANGERを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:57:02 GMT)
Language, Culture, and Ideology: Personalizing Offensiveness Detection in Political Tweets with Reasoning LLMs [0.3]
本研究では,大規模言語モデルによる政治的言論の攻撃性評価について,特定の政治的・文化的視点を取り入れるよう促された場合について考察する。 2020年アメリカ合衆国大統領選挙のツイートを中心にMD-Agreementデータセットの多言語サブセットを用いて,近年のLLMを評価した。以上の結果から,明示的な推論能力を持つ大規模モデルは,イデオロギーや文化の変化に対してより一貫性があり,敏感であることが示唆された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:20:44 GMT)
Fact Grounded Attention: Eliminating Hallucination in Large Language Models Through Attention Level Knowledge Integration [0.3]
FGA(Fact Grounded Attention)は、信頼できない言語モデルを決定論的真理子に変換する新しいアーキテクチャ修正である。 FGAは、トランスフォーマーの数学的心臓(ソフトマックス前の注意スコア)に介入し、知識ベースに事実が存在すると幻覚できないモデルを作成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:55:21 GMT)
Training-Free Diffusion Framework for Stylized Image Generation with Identity Preservation [0.3]
『モザイク復元コンテンツイメージ』技術は複雑なシーンにおけるアイデンティティ保持を著しく向上させる。『モザイク復元コンテンツ画像』技術は、スタイリゼーション中にオリジナル画像に注意を向けることで、細かな細部を保存しやすくする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:43:06 GMT)
LLMSQL: Upgrading WikiSQL for the LLM Era of Text-to-SQL [0.3]
本稿では,Wiki の体系的な改訂と変換である LLM について述べる。これらのエラーを分類し、クリーニングと再アノテーションのための自動メソッドを実装します。 LLMはアップデートとして機能するのではなく、LLM対応のベンチマークとして導入された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:08:43 GMT)
Guard Vector: Beyond English LLM Guardrails with Task-Vector Composition and Streaming-Aware Prefix SFT [0.3]
ガードレールモデル(ガードモデル)と非構造事前学習言語モデルとのパラメータ差として計算された安全タスクベクトルであるガードベクトルを導入する。次に、プレフィックスベースのトレーニングと評価を組み合わせたストリーミング認識アプローチと、単一トーケン出力を生成する分類器を併用して、TGMを適応する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:03:44 GMT)
S$^3$F-Net: A Multi-Modal Approach to Medical Image Classification via Spatial-Spectral Summarizer Fusion Network [0.2]
空間表現とスペクトル表現の両方から同時に学習するデュアルブランチフレームワークを提案する。異なるモダリティにまたがる4つの医用画像データセットに対して,S$3$F-Netを評価した。我々のフレームワークは、すべてのケースにおいて、その強い空間のみのベースラインを一貫して、著しく上回ります。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:18:39 GMT)
Spatio-temporal, multi-field deep learning of shock propagation in meso-structured media [0.2]
我々は,多分野深層学習モデル (MSTM) を導入し, 連続した7つの場圧, 密度, 温度, エネルギー, 物質分布, および2つの速度成分を1つの自己回帰的サロゲートに統一する。 MSTMは多孔質と建築構成の非線形ショック駆動力学を捉え、それぞれ1.4%と3.2%の平均誤差を達成し、3桁以上のスピードアップを達成している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:27:33 GMT)
Dynamics of Learning: Generative Schedules from Latent ODEs [0.1]
ニューラルネットワークのトレーニング性能を動的システムとしてモデル化する新しい学習率スケジューラを提案する。本手法は計算効率が高く,一般化に依存しないものであり,ML実験追跡プラットフォーム上に容易に階層化することができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 02:20:18 GMT)
Hard Examples Are All You Need: Maximizing GRPO Post-Training Under Annotation Budgets [0.1]
最も難しい例(ベースモデルが最も失敗する部分)の10%をトレーニングすると、劇的なパフォーマンスが最大47%向上する。ハードサンプルは、AIME2025ベンチマークで有意義な利得を達成しているのは、ハードトレーニングされたモデルのみである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:19:30 GMT)
Optimization Strategies for Variational Quantum Algorithms in Noisy Landscapes [0.1]
変分量子アルゴリズム(VQA)は、短期量子コンピューティングにおける主要なアプローチである。我々は変分量子ソルバ(VQE)のための50以上のメタヒューリスティックアルゴリズムをベンチマークした。その結果、ノイズの多いVQEのための小さなレジリエントアルゴリズムを特定し、短期量子デバイス上での最適化戦略のガイダンスを提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:39:45 GMT)
READER: Retrieval-Assisted Drafter for Efficient LLM Inference [0.0]
自己回帰言語モデルはトークンシーケンスよりも分解された確率をインスタンス化するが、その厳密なシーケンシャルなデコーディングプロセスは、遅延推論に固有の低いバウンドを課す。このボトルネックは、大規模生成モデルのスケーラブルなデプロイにおける中心的な障害として現れています。本稿では,補助的ドラフトモデルのトレーニングを回避した投機的復号化フレームワークREADERを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:13:25 GMT)
Beyond the Prompt: Gender Bias in Text-to-Image Models, with a Case Study on Hospital Professions [0.0]
本稿では,Hunyuan Image 2.1,HiDream-I1-dev,Qwen-Image,FLUX.1-dev,Stable-Diffusion 3.5 Large,Stable-Diffusion-XLの6つの最先端オープンウェイトモデルにおける性別表現について検討する。全てのモデルで女性や外科医が主に男性として看護婦を生産しています。この結果は、バイアス認識設計、バランスの取れたデフォルト、およびAI生成における作業ステレオタイプの強化を防ぐためのユーザガイダンスの必要性を浮き彫りにしている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:18:46 GMT)
Ultrafast Single-Qubit Gates in the Diabatic Regime [0.0]
本稿では,アダバティック・アダバティック・アダバティック・アダバティック・アダバティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アダラティック・アその結果, ダイアバト政権における超短パルスは, 標準RWA条件下で得られたものと同等の忠実性が得られることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:29:32 GMT)
Ultra-narrow homogeneous linewidths of erbium-doped silica glass fibers at millikelvin temperatures: magnetic field and temperature dependence [0.0]
エルビウムドープシリカファイバー(EDF)はその可用性、使いやすさ、既存の光ファイバーインフラとのシームレスな統合で際立っている。我々は,0.09Tの最適磁場で,約8kHzの有効均一線幅を約7mKで観測した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:40:41 GMT)
Trainable Reference-Based Evaluation Metric for Identifying Quality of English-Gujarati Machine Translation System [0.0]
我々はグジャラティの基準に基づくMT評価指標を導入した。トレーニングに25のフィーチャを使用する2つのバージョンのメトリックをトレーニングしました。その結果, 測定値の相関性は良好であることが判明した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:05:15 GMT)
Towards Quantum-Ready Blockchain Fraud Detection via Ensemble Graph Neural Networks [0.0]
グラフ畳み込みネットワーク(GCN)、グラフ注意ネットワーク(GAT)、グラフ同型ネットワーク(GIN)を統合したアンサンブルフレームワークを提案する。実世界の楕円型データセットを用いて、調整されたソフト投票アンサンブルは、1%未満の偽陽性率を維持しながら不正取引の高いリコールを実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:17:23 GMT)
TRAX: TRacking Axles for Accurate Axle Count Estimation [0.0]
我々は,高密度環境下での軸数計測のためのエンドツーエンドのビデオベースパイプラインを提案する。本システムでは、YOLO-OBBとYOLO-OBBの組み合わせで車両を検知・分類し、タイヤを検知する。フレーム間の軸関係の特徴を追尾するTRAX(Tire and Axle Tracking)アルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:04:06 GMT)
Steering Prepositional Phrases in Language Models: A Case of with-headed Adjectival and Adverbial Complements in Gemma-2 [0.0]
本研究の目的は,前置詞の生成を解明し,制御することである。単一アテンションヘッドの値ベクトルをスケールすることにより、補体の機能的役割の分布を33%に減らし、属性を36%に高めることができる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 09:27:40 GMT)
Stability and performance guarantees for misspecified multivariate score-driven filters [0.0]
対数的仮定された観測密度の勾配を用いてパラメータ予測を更新するスコア駆動フィルタ(ISD, ESD)について検討した。両方のフィルタタイプに対して、フィルタされたパラメータパスの指数的安定性を保証するための、新しい十分な条件を導出する。 ISDフィルタは精度と安定性の点でESDフィルタより優れていることを示すシミュレーション研究により理論的知見を検証した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:02:19 GMT)
Splines-Based Feature Importance in Kolmogorov-Arnold Networks: A Framework for Supervised Tabular Data Dimensionality Reduction [0.0]
我々は4つのkanベースのセレクタ(textitKAN-L1$, $textitKAN-L2$, $textitKAN-SI$, $textitKAN-KO$)を導入し、それらを古典的なベースラインと比較する。 F1 スコアと $R2$ スコアの結果から、kan ベースのセレクタ、特に $textitKAN-L2$, $textitKAN-L1$, $textitKAN-SI$, $textitKAN
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:24:17 GMT)
Single-Snapshot Gridless 2D-DoA Estimation for UCAs: A Joint Optimization Approach [0.0]
本稿では,1つのデータスナップショットから一様円配列(UCA)のグリッドレス2次元方向推定(DOA)の課題に対処する。本稿では、多様体変換行列とソース方位-昇降ペアを共同で推定することにより、これらの制限を克服する新しいフレームワークを提案する。この問題は、半定値プログラミングの必要性を完全に回避する不正確な拡張ラグランジアン法(iALM)を用いて効率よく解決される。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:36:53 GMT)
Optimizing the Network Topology of a Linear Reservoir Computer [0.0]
貯留層コンピューティング(Reservoir computing)は、予測および観測タスクのための時間データを処理する機械学習ツールである。伝統的に、貯水池コンピュータ(RC)の接続はランダムに発生し、基本設計を欠いている。本稿では,線形RCのトポロジを最適化し,その性能と解釈性を改善することに焦点を当てる。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:24:53 GMT)
Online Dynamic Goal Recognition in Gym Environments [0.0]
ゴール認識(Goal Recognition, GR)は、エージェントが意図する目的を、その行動の部分的な観察から推測するタスクである。モデルフリーGRの最近の進歩にもかかわらず、ベンチマーク、ドメイン、評価プロトコルの不整合により、この分野は断片化されている。本稿では,Gym互換環境におけるGRアルゴリズムの開発,評価,比較をサポートする2つの補完的なオープンソースフレームワークであるgr-libsとgr-envsを紹介する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:50:53 GMT)
Not All Explanations are Created Equal: Investigating the Pitfalls of Current XAI Evaluation [0.0]
XAIは、モデルの説明を人間ユーザに提供することによって、現代的なAIモデルに透明性を提供することを目指している。この分野で行われたほとんどの研究は、説明なしと提案されたソリューションが生み出すものの違いを分析するために、簡単なユーザサーベイを実施している。品質や正確性に関わらず、ほとんどの説明はユーザの満足度を高めるでしょう。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:30:38 GMT)
Nonperturbative Formulation of Resonances in Quantum Mechanics Based on Exact WKB Method [0.0]
量子力学における準定常状態について, Wentzel--Kramers--Brillouin (WKB) 解析を非摂動的枠組みとして用いた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:35:08 GMT)
Noisy Networks, Nosy Neighbors: Inferring Privacy Invasive Information from Encrypted Wireless Traffic [0.0]
この論文は、スマートホーム環境における無線トラフィックの受動的観測が、住民に関するプライバシー侵害情報を推測するのにどの程度有効であるかを考察する。デバイスを識別し,その動作状態を推定し,RSSIに基づく三元化を用いて位置を近似する。以上の結果から,スマートホームにおけるプライバシーリスクは,従来のデータ漏洩を超えて拡大していることがわかった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:36:11 GMT)
NeuroBridge: Using Generative AI to Bridge Cross-neurotype Communication Differences through Neurotypical Perspective-taking [0.0]
自閉症と神経型個人間のコミュニケーションの課題は、互いの異なるコミュニケーションスタイルの理解の欠如に起因する。我々は,大規模言語モデル(LLM)を利用したオンラインプラットフォームであるNeuroBridgeを構築し,(a)直接的かつリテラルなAIキャラクタ,多くの自閉症個人に共通するスタイル,(b)交叉型通信シナリオの4つをシミュレートした。 NeuroBridgeは、自閉症の人々が言語をどう解釈するかの理解を改善し、全ての自閉症を「他人の理解を必要とする」社会的差異と表現した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:05:41 GMT)
Multifractal features of multimodal cardiac signals: Nonlinear dynamics of exercise recovery [0.0]
心電図を用いたマルチモーダルバイオシグナーを用いた運動負荷後の健常心活動の回復動態について検討した。 5つの教師付き分類アルゴリズムが評価され、小さな不均衡なデータセットの回復状態を識別した。以上の結果から,マルチフラクタル解析とマルチモーダルセンシングを併用することにより,回復と非非線形診断法を特徴付ける信頼性の高い特徴が得られた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:04:30 GMT)
More Data or Better Algorithms: Latent Diffusion Augmentation for Deep Imbalanced Regression [0.0]
多くの実世界の回帰タスクでは、データ分布は著しく歪められ、モデルは大多数のサンプルから主に学習される。このフレームワークは、優先度ベース生成を用いた条件拡散モデルを用いて、遅延表現空間における高品質な特徴を合成する。 3つのDIRベンチマークの実験は、全体の精度を維持しながら少数地域の大幅な改善を示している。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:44:28 GMT)
Modeling Bias Evolution in Fashion Recommender Systems: A System Dynamics Approach [0.0]
推薦システムにおけるバイアスは、ユーザー体験を歪ませるだけでなく、既存の社会的ステレオタイプを永続し、増幅する。本研究は,Fashion Recommender Systemsにおけるバイアス活性化と強化のメカニズムを動的モデリングにより解明する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:16:29 GMT)
Model Consistency as a Cheap yet Predictive Proxy for LLM Elo Scores [0.0]
新しい大規模言語モデル(LLM)が毎日リリースされている。パラメータ数を考えると、予想よりもはるかにパフォーマンスが良いものや悪いものもある。モデルを評価するための現在の最良の方法は、一連のコンテストで他のモデルと比較することで、Eloのスコアを測定することです。 LLMがこのような競技の判定を依頼されたとき、マッチアップにおいて最高のモデルとしてモデルを選択する一貫性は、自作のエロスコアと91%の相関を持つ計量を生成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:00:30 GMT)
Methods for evaluating software accessibility [0.0]
より詳細で実用的なアクセシビリティ評価手法が提案されている。 Vasyl Stefanyk Precarpathian National Universityのウェブサイトのページのアクセシビリティの分析を行った。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:46:10 GMT)
Memory Management and Contextual Consistency for Long-Running Low-Code Agents [0.0]
本稿ではLCNCエージェントに特化して設計された新しいハイブリッドメモリシステムを提案する。認知科学にインスパイアされた私たちのアーキテクチャは、エピソードとセマンティックメモリコンポーネントと、積極的な「インテリジェント・デカイ」メカニズムを組み合わせています。鍵となるイノベーションは、LCNCパラダイムに沿ったユーザ中心の可視化インターフェースであり、非技術者のユーザがエージェントのメモリを直接管理できるようにする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:01:26 GMT)
MathBode: Frequency-Domain Fingerprints of LLM Mathematical Reasoning [0.0]
大規模言語モデル(LLM)における数学的推論のための動的診断法であるMathBodeを提案する。一つのパラメータを正弦波に駆動し、モデル出力と正確な解の第一高調波応答に適合する。 5つのクローズドフォームファミリにまたがって、診断面は系統的な低域通過挙動と位相ラグを呈し、精度のみを曖昧にしている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:06:36 GMT)
Linear Regression in p-adic metric spaces [0.0]
p進距離空間における機械学習の理論的基礎を示す。結果から,機械学習における階層的データ構造を適切に扱うためには,p進測度が基本であることが示唆された。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 08:48:19 GMT)
Leveraging Quantum Computing For Recourse-Based Energy Management Under PV Generation Uncertainty [0.0]
分散型エネルギー資源、特に太陽光発電(PV)システムと電気自動車(EV)の統合は、現代のエネルギーシステムに重大な不確実性をもたらす。本稿では、PV発電の不確かさと双方向EV充電の柔軟性をモデル化した複雑性と最適化問題を定式化することによって、これらの課題に対処する新しいアプローチについて検討する。量子アルゴリズムを用いてPVモデルを実装し,高次元および不確実性を考慮したエネルギー管理問題に対する量子化最適化の可能性を示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:34:23 GMT)
Learning quantum tomography from incomplete measurements [0.0]
量子トモグラフィーを情報的に不完全なシナリオで再検討し、ディープニューラルネットワークを用いた状態再構成手法を提案する。最初のアプローチでは、トレーニングされたネットワークは、(既に取られた)測定演算子の集合のみに依存する係数を持つ最適線形あるいは二次的な再構成子を予測する。 2つ目は、LSTMリカレントネットワークをベースとして、逐次状態再構成を行うため、スケーラブルである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:30:23 GMT)
Improving accuracy of tree-tensor network approach by optimization of network structure [0.0]
本研究では,関心状態における絡み合いの空間的プロファイルに応じて,TTNの構造を自動的に最適化する,ツリーテンソルネットワーク(TTN)に基づくアルゴリズムを提案する。本稿では,アルゴリズムの性能が構造最適化の詳細な更新方式にどのように依存するかを分析する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:45:03 GMT)
INTRODUCTION AUX SYSTEMES QUANTIQUES NON-HERMITIQUES: PT-symétrie et pseudo Hermiticité [0.0]
近年では、非エルミート量子力学の役割の増大とともに重要な変化が起こった。この枠組みを際立たせるのは、ハミルトニアンの固有値は、エルミートの場合と同様に、依然として実数であるということである。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:28:06 GMT)
Generating entangled pairs of vortex photons via induced emission [0.0]
絡み合った渦光子のペアは、量子コンピューティングと暗号への新たな応用を約束することができる。単一光子波パケットによって誘導される2レベル原子放出によりそのような状態を生成する可能性について検討する。我々は、誘起放出は、原子物理学実験、量子光学、量子情報科学に応用された絡み合った渦光子の源として利用できると結論付けた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:10:59 GMT)
From statistical dependence to the space of possible superdeterministic theories [0.0]
統計的独立を体系的に破る物理理論は、すべて超決定論として理解されるべきである。我々は、超決定論は自由意志とは相容れないと主張する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 01:52:48 GMT)
Fin-ExBERT: User Intent based Text Extraction in Financial Context using Graph-Augmented BERT and trainable Plugin [0.0]
Fin-ExBERTは、アノテーション付き金融サービスコールからユーザ意図関連文を抽出する軽量フレームワークである。我々は,下流の監査や質問応答に適した解釈可能な出力で,実世界の書き起こしに対して高い精度とF1性能を示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:20:07 GMT)
Fault-tolerant transformations of spacetime codes [0.0]
時空のコードや変換をモデル化するために,チェーンコンプレックスとチェーンマップに基づくフレームワークを導入する。安定化器符号,量子回路,復号化問題はすべて,チェーン錯体を用いて記述可能であることを示す。我々は、安定器符号から任意の時空符号への分離クラスタ状態構築を拡張し、任意のクリフォード回路を測定ベースのプロトコルに変換することができることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 11:39:54 GMT)
Enhancing Polyp Segmentation via Encoder Attention and Dynamic Kernel Update [0.0]
ポリープセグメンテーションは大腸癌検出における重要なステップであるが、多彩な形状、サイズ、低コントラスト境界のために依然として困難である。本稿では,動的カーネル(DK)機構をグローバルアテンションモジュールに統合することにより,セグメンテーションの精度と効率を向上させる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:16:09 GMT)
Enhancing Live Broadcast Engagement: A Multi-modal Approach to Short Video Recommendations Using MMGCN and User Preferences [0.0]
我々は,MMGCN(Multi-modal Graph Convolutional Networks)をユーザの好みに組み込んだ短いビデオレコメンデーションシステムを開発した。個人の関心に合わせたパーソナライズされたレコメンデーションを提供するために,提案システムはユーザインタラクションデータ,ビデオコンテンツ機能,コンテキスト情報などを検討する。システムの有効性を評価するために、Kwai、TikTok、MovieLensの3つのデータセットが使用されている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:20:44 GMT)
Enhancing Communication Efficiency in FL with Adaptive Gradient Quantization and Communication Frequency Optimization [0.0]
Federated Learning (FL)は、参加者がサーバや他のデバイスとデータを共有することなく、ディープラーニングモデルを協調的にトレーニングすることを可能にする。 FLは、デバイスとサーバ間の頻繁なモデル更新による通信オーバーヘッドが大きいため、大きなボトルネックに直面します。重要度を低く抑えつつ,高価値度を維持しつつ,より重要度の低い特徴を減らそうとする3つの戦略を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 17:25:44 GMT)
Efficient implementation of quantum signal processing via the adiabatic-impulse model [0.0]
量子信号処理(QSP)と断熱インパルスモデル(AIM)の類似性について検討する。 AIMは、強い外部駆動場下での2レベル量子システムの進化を効果的に記述する。パラメータをQSPからAIMにマッピングして,非断熱・高振幅外部ドライブを用いたQSPライクな進化を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:20:26 GMT)
Dynamic Josephson Junction Metasurfaces for Multiplexed Control of Superconducting Qubits [0.0]
ミリケルビン(mK)温度で直接マイクロ波制御信号を生成・多重化するための時空間変調ジョセフソン接合構造を提案する。その結果、制御パラメータによる多重周波数音の発生が示され、熱負荷と配線オーバーヘッドを最小限に抑えつつ、効率よくスケーラブルな量子ビット制御が可能となった。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:04:30 GMT)
Drift-Adapter: A Practical Approach to Near Zero-Downtime Embedding Model Upgrades in Vector Databases [0.0]
本稿では,モデルバージョン間の埋め込み空間をブリッジする軽量で学習可能な変換層であるDrift-Adapterを提案する。新しいクエリをレガシな埋め込みスペースにマッピングすることで、Drift-Adapterは既存のANNインデックスの継続的な使用を可能にする。フルインデクシングやデュアルインデクシングサービスといった運用戦略と比較して、Drift-Adapterは再計算コストを100倍以上削減し、ほぼゼロの運用中断によるアップグレードを容易にする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:47:19 GMT)
Do quantum linear solvers offer advantage for networks-based system of linear equations? [0.0]
ネットワークベースの線形システム問題では、まずグラフから始まり、線形方程式の系に到達する。指数関数的優位性(ベストグラフファミリ)を提供するグラフファミリと、サブ指数的ではあるが少なくとも優位性(グラフファミリ)を提供するグラフファミリを推奨する。分析の範囲内では,50のグラフファミリーのうち指数関数的優位性を示すのはわずか4%であり,約20%のグラフファミリーが優位性を示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 07:57:28 GMT)
Deep Learning for Oral Health: Benchmarking ViT, DeiT, BEiT, ConvNeXt, and Swin Transformer [0.0]
この研究は特に、データ不均衡のような現実世界の課題に対処することに焦点を当てた。 ConvNeXt、Swin Transformer、BEiTは信頼性の高い診断性能を示した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:17:04 GMT)
Deep Learning Approaches with Explainable AI for Differentiating Alzheimer Disease and Mild Cognitive Impairment [0.0]
アルツハイマー病の早期かつ正確な診断は、効果的な臨床介入に重要である。構造的磁気共鳴画像を用いたアルツハイマー病分類のためのハイブリッドディープラーニングアンサンブルフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 16:17:14 GMT)
Deceive, Detect, and Disclose: Large Language Models Play Mini-Mafia [0.0]
ミニ・マフィア (Mini-Mafia) は、マフィアが情報のない町民と競う社会的推論ゲームである。情報の非対称性と、実世界のマルチエージェントシナリオの理論に基づく推論への依存。ミニマフィア(Mini-Mafia)は、マフィオーソが1つ、探偵が1つ、村人が2つ、簡易な4人組である。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 00:40:19 GMT)
Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence [0.0]
コーディネート焦点として機能する最大効用を持つ解は、精度よりもエージェント間で発見可能な選択圧力がはるかに高いことを示す。この枠組みを熱力学的コーディネート理論 (TCT) と呼び、協調には急進的な情報損失が必要であることを示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 06:16:56 GMT)
Continuous-Time Reinforcement Learning for Asset-Liability Management [0.0]
本稿では,連続時間強化学習(RL)を用いたアセット・リバビリティ・マネジメント(ALM)の新しいアプローチを提案する。本研究では,アセットと負債を動的に同期する ALM に適した,モデルフリーでポリシー勾配に基づくソフトアクター批判アルゴリズムを開発した。本研究は,従来の2つの金融戦略,モデルベース連続時間RL法,最先端RLアルゴリズムに対するアプローチを実証的に評価する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:36:51 GMT)
Conditional Risk Minimization with Side Information: A Tractable, Universal Optimal Transport Framework [0.0]
条件付きリスク最小化は、リスクをサイド情報に基づいて評価する必要がある高リスクな決定に発生する。最適輸送における新しいユニオン・ボールの定式化に基づいて構築された,分布的に堅牢な条件付きリスク最小化のための普遍的枠組みを導入する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 05:22:53 GMT)
Complementarity relations for design-structured POVMs in terms of generalized entropies of order $α\in(0,2)$ [0.0]
情報エントロピーは、量子測定の不整合性を定量的に特徴づける真の方法を与える。量子設計は現在活発な研究の対象となっている。生成確率の制約を両側のエントロピー推定に変換する方法を示す。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 03:24:42 GMT)
Code Arcades: 3d Visualization of Classes, Dependencies and Software Metrics [0.0]
フレキシブルなコード要素の編成をサポートするグループ化メカニズムを導入します。きめ細かいソフトウェアメトリクスと粗いソフトウェアメトリクスを組み合わせて、システム特性の多面的な視点を提供します。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 13:19:56 GMT)
CRAUM-Net: Contextual Recursive Attention with Uncertainty Modeling for Salient Object Detection [0.0]
マルチスケールのコンテキストアグリゲーション、高度な注意機構、SOD性能向上のための不確実性認識モジュールを統合した新しいフレームワークを提案する。我々の適応的クロススケールコンテキストモジュールは、再帰的チャネル空間的注意と畳み込みブロック注意を利用して、機能を複数のレベルから効果的に融合する。ネットワークを堅牢にトレーニングするために,境界感応性とトポロジカル保存損失関数(Boundary IoU,Focal Tversky,Topological Saliency Los)を組み合わせて,ネットワークの信頼性を高める。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 12:03:27 GMT)
Bridging the Gap Between Theoretical and Practical Reinforcement Learning in Undergraduate Education [0.0]
提案手法は,従来の講義と対話型ラボベースの学習を統合している。このフレームワークは、OpenAI Gymnasiumのようなシミュレートされた環境を使って、リアルタイムのコーディング演習を通じて学生を巻き込む。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:31:34 GMT)
Boosting Open Set Recognition Performance through Modulated Representation Learning [0.0]
オープンセット認識問題は、トレーニングクラスの一部ではない新しいセマンティッククラスからテストサンプルを識別することを目的としている。既存のOSR法では、損失関数を適用する前に、ロジットに一定のスケーリング係数(温度)を使用する。本稿では,提案した一連の温度スケジュールを用いて,温度変調表現学習を可能にすることで,この問題に対処する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:30:06 GMT)
Bipartite and tripartite entanglement in pure dephasing relativistic spin-boson model [0.0]
本研究では,スピン-ボソンモデルの相対論的変種において,2と3のエミッタ間の絡み合いの発生を非摂動的に研究する。 2つのエミッタの絡み合い状態は、光円錐に非常に深い相互作用を必要とすることを示す。我々は、Fock空間において、よく定義された基底状態を持つために、$N$-エミッターモデルの正則性条件を提供する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:49:20 GMT)
Bayesian and geometric analyses of power spectral densities of spin qubits in Si/SiGe quantum dot devices [0.0]
パワーロースペクトルを持つ電荷ノイズは、半導体デバイスにおけるスピン量子ビットの高忠実度動作に重大な課題をもたらす。近年, 量子ビットを分光器として用いる実験が盛んに行われている。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:49:00 GMT)
BRIT: Bidirectional Retrieval over Unified Image-Text Graph [0.0]
Retrieval-Augmented Generation (RAG) は、大規模言語モデルによって生成された応答の品質と関連性を高めるための有望な手法として登場した。本稿では、文書内の様々なテキストイメージ接続をマルチモーダルグラフに統一する、新しいマルチモーダルRAGフレームワークBRITを提案する。 BRITは、画像からテキストへの経路とテキストへの経路の両方をグラフでトラバースすることにより、関連する画像やテキストを直接検索するだけでなく、関連するコンテンツも検索する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 14:48:45 GMT)
AudioFuse: Unified Spectral-Temporal Learning via a Hybrid ViT-1D CNN Architecture for Robust Phonocardiogram Classification [0.0]
そこで我々は,PCGを分類するために,相補的表現から学習するアーキテクチャであるAudioFuseを提案する。 PhysioNet 2016データセットでは、AudioFuseがゼロからトレーニングすると、最先端の競争力を持つROC-AUCの0.8608を達成する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 18:52:50 GMT)
Artificial Phantasia: Evidence for Propositional Reasoning-Based Mental Imagery in Large Language Models [0.0]
この研究は、人工システムにおける複雑な認知行動のベンチマークのための新しいアプローチを提供する。私たちは認知心理学から古典的な精神イメージタスクの新しいアイテムを何十個も作成しました。その結果,最高のLDMは平均的な人的パフォーマンスよりも有意に優れていた。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 04:36:12 GMT)
Artificial Intelligence-Powered Assessment Framework for Skill-Oriented Engineering Lab Education [0.0]
コンピュータ科学における実践的な実験室教育は、しばしば、盗作、適切な実験記録の欠如、構造化されていない実験室の伝導、不十分な実行と評価といった課題に直面している。私たちはAsseslyAIを導入し、オンラインラボアロケーション、学生毎のユニークなラボ問題、AIが推奨するビバ評価、ゲーミフィケーションシミュレータを通じてこれらの課題に対処する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:29:54 GMT)
AraS2P: Arabic Speech-to-Phonemes System [0.0]
AraS2P は Iqra'Eval 2025 Shared Task に提出された音声合成システムである。 Weapted Wav2Vec2-BERT via Two-Stage training strategy。制度は、公式のリーダーボードで第1位にランクインした。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:25:20 GMT)
Anticoherent $k$-planes and coding techniques for a 3-qubit scheme of universal quantum computing [0.0]
トポノミック量子コンピューティング(TQC)は、耐雑音性量子ゲートを構築するために、反コヒーレントな$k$平面の回転列を用いる。本稿では,符号化手法に基づく3量子ビット系の普遍的量子計算手法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:26:16 GMT)
An Senegalese Legal Texts Structuration Using LLM-augmented Knowledge Graph [0.0]
本研究では,セネガルの司法制度における法的テキストへのアクセスを改善するために,人工知能(AI)と大規模言語モデル(LLM)の適用について検討する。この研究は、様々な法的文書から7,967件の論文を抽出した。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 19:51:13 GMT)
An Accelerated Newton-GMRES Method for Multilinear PageRank [0.0]
マルチ線形ページランク問題は、高階マルコフ連鎖の研究において自然に生じるもので、そのような相互作用を捉えるための強力な枠組みである。ニュートン法はこの問題に対して局所的な二次収束を達成できるが、各反復で大きな線形系を解く必要がある。我々は、クリロフ部分空間技術を利用して、大きなヤコビ行列を明示的に形成せずにニュートンステップを近似する加速ニュートン-GMRES法を提案する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 15:45:57 GMT)
All you need is controlled-V: universality of a standard two-qubit gate by catalytic embedding [0.0]
不均等に強力な命令を含むゲート集合は、量子計算力の源を隠蔽する。制御されたV$ゲートは単純な2量子ビットの相互作用であり、普遍的な量子普遍性を実現するのに十分である。触媒の埋め込みと、必要な資源状態を生成する手順に基づいて、我々は標準の普遍ゲートセットを一定のオーバーヘッドでシミュレートする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 22:09:58 GMT)
Accurate Predictions in Education with Discrete Variational Inference [0.0]
有能で効果的なAI家庭教師は、スケーラブルなソリューションを提供する。適応学習に焦点をあて、学生が正しい質問に答えるかどうかを予測する。プロフェッショナルにマークされた形式的数学試験応答の最大オープンデータセットをリリースする。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 20:13:02 GMT)
AQuaMaM: An Autoregressive, Quaternion Manifold Model for Rapidly Estimating Complex SO(3) Distributions [0.0]
AQuaMaMは、回転多様体上の複素分布を学習し、単一の前方通過におけるクエリローテーションの正確な確率を計算することができるニューラルネットワークである。異なる回転で50,000のダイのデータセットでトレーニングされた場合、AQuaMaMはICPよりも14%高いテストログに到達する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 21:35:54 GMT)
A categorical embedding discontinuity-capturing shallow neural network for anisotropic elliptic interface problems [0.0]
異方性楕円型インタフェース問題に対する階層型埋め込み不連続保持型浅層ニューラルネットワークを提案する。不連続な埋め込みを自動的に学習することにより、提案手法は明示的なドメインラベリングの必要性を回避することができる。提案手法は,浅く単純な構造であるにもかかわらず,従来の格子型数値法に匹敵する精度と効率を実現する。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 10:23:17 GMT)
'Partisan Bias' is Like 'Cancer' [0.0]
パルチザンバイアス」は、パルチザンの優位性、パッキングとクラッキング、パルチザン対称性など、複数の偏見の概念を含んでいる。異なる測度は、しばしば、計画の再限定のためのバイアスの方向を一貫して示します。例えば、あるメートル法では、ある地図は民主党に偏っているが、別のメートル法では、同じ地図は共和党に偏っていると言う。
論文参考訳（メタデータ） (Sat, 27 Sep 2025 23:59:47 GMT)