Fugu-MT: arxivの論文翻訳(概要)

InfoAgent: Advancing Autonomous Information-Seeking Agents [143.2]
本稿では,革新的なデータ合成パイプラインとWeb検索ツールを駆使したディープリサーチエージェントInfoAgentを紹介する。我々の方法では、InfoAgentはBrowseCompで15.3%、BrowseComp-ZHで29.2%、Xbench-DSで40.4%の精度を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:57 GMT)
Experience-guided reflective co-evolution of prompts and heuristics for automatic algorithm design [124.5]
組合せ最適化問題は伝統的に手作りのアルゴリズムで取り組まれている。最近の進歩は、大規模言語モデルによる自動設計の可能性を強調している。本稿では,自動アルゴリズム設計のためのPmpt and Heuristics (EvoPH) を用いた経験進化的リフレクティブ・ガイドを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:24:09 GMT)
MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing [117.6]
MinerU2.5は、例外的な計算効率を維持しつつ、最先端の認識精度を実現する文書解析モデルである。提案手法では,局所的なコンテンツ認識からグローバルなレイアウト解析を分離する,粗大な2段階解析戦略を採用している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:41:28 GMT)
SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer [116.2]
SANA-Videoは、720×1280の解像度と分長のビデオを効率よく生成できる小さな拡散モデルである。 2つのコア設計により、効率的な、効果的で、長いビデオ生成が保証されます。コストの安いSANA-Videoは、現代の最先端の小さな拡散モデルと比較して、競争性能を達成している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:28:09 GMT)
Position: Towards Bidirectional Human-AI Alignment [109.6]
我々は、人間とAIの双方向的・動的関係を説明するために、研究コミュニティは「調整」を明確に定義し、批判的に反映すべきであると主張する。このフレームワークは、AIと人間の価値を整合させる従来の取り組みを取り入れているだけでなく、人間とAIを整合させるという、重要で未解明の次元も導入しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:11:24 GMT)
TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models [105.5]
時系列を推論する3つの基本的な機能にまたがる4つのアトミックタスクを形式化した時系列推論スイート(TSR-Suite)を紹介する。また,時系列推論を必要とする多種多様な実世界の問題に対処するために設計された最初の統一推論モデルであるTime Omni-1を紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:54:34 GMT)
A Culturally-diverse Multilingual Multimodal Video Benchmark & Model [105.1]
我々は,14言語にわたるビデオLMMを評価するために,ViMUL-Benchという多言語ビデオLMMベンチマークを導入した。私たちのViMUL-Benchは、文化的に多様な8つのカテゴリを含む15のカテゴリにわたるビデオLMMを厳格にテストするために設計されています。また、120万のサンプルからなる機械翻訳多言語ビデオトレーニングセットを導入し、ViMULというシンプルな多言語ビデオLMMを開発した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:03:33 GMT)
DiffusionGuard: A Robust Defense Against Malicious Diffusion-based Image Editing [103.4]
DiffusionGuardは、拡散ベースの画像編集モデルによる不正な編集に対する堅牢で効果的な防御方法である。拡散過程の初期段階をターゲットとした対向雑音を発生させる新しい目的を提案する。また,テスト期間中の各種マスクに対するロバスト性を高めるマスク強化手法も導入した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:05:53 GMT)
Collaborating Vision, Depth, and Thermal Signals for Multi-Modal Tracking: Dataset and Algorithm [103.4]
本研究は、可視RGB、深度(D)、熱赤外(TIR)を含む3つの相補的なモードを利用する、新しいマルチモーダルトラッキングタスクを導入する。我々はRDTTrackと呼ばれる新しいマルチモーダルトラッカーを提案する。これは、事前訓練されたRGBのみの追跡モデルと迅速な学習技術を活用して、ロバストなトラッキングのためのトリモーダル情報を統合する。実験の結果,提案手法の有効性と利点を実証し,既存のデュアルモーダル手法に対して有意な改善が認められた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:05:15 GMT)
RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance [101.3]
プロセス報酬を明示せずにdLLMの推論軌道を導出するためのRFGを提案する。 RFGは、すべてのタスクとモデルタイプに一貫して大きな改善をもたらし、最大9.2%の精度向上を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:59:16 GMT)
UniLat3D: Geometry-Appearance Unified Latents for Single-Stage 3D Generation [98.4]
UniLat3Dは、単一の潜在空間における幾何学と外観を符号化する統一されたフレームワークである。我々の重要な貢献は、高分解能スパース特徴をコンパクトな潜在表現に圧縮する幾何学的外観統一VAEである。 UniLat3Dは、1枚の画像から数秒で高品質な3Dアセットを生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:21:23 GMT)
GTA1: GUI Test-time Scaling Agent [97.6]
グラフィカルユーザインタフェース(GUI)は、ユーザ命令をアクションプロポーザルに順次分解することで、プラットフォーム(例えばLinux)間で自律的にタスクを完了させる。本稿では,前述の textbfGUI textbfTest-time Scaling textbfAgent,すなわち GTA1 の課題について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:05:15 GMT)
SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [97.3]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning)は、トレーニングと評価のための137K命令フォローインスタンスのデータセットで、54のタスクをカバーする。これらのタスクは、情報抽出、要約、質問応答、クレーム検証、分類の5つの中核的な科学文献理解能力にまたがる。 SciRIFFは、さまざまな科学分野にわたる研究文献から情報を抽出し、合成するための、完全に専門家によって書かれた高品質な命令追跡データセットである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:35:23 GMT)
ThanoRA: Task Heterogeneity-Aware Multi-Task Low-Rank Adaptation [96.9]
Low-Rank Adaptation (LoRA) は、基礎モデルの下流の微調整に広く採用されている。タスク不均一性を考慮したマルチタスク低ランク適応フレームワークであるTanoRAを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:43:39 GMT)
When Does Multimodality Lead to Better Time Series Forecasting? [96.3]
このようなマルチモーダルな統合が常に利益をもたらすかどうか、どのような条件で検討する。その結果,マルチモーダリティの利点は条件に依存していることが判明した。我々の研究は、マルチモーダリティが予測タスクに役立つことをいつ予測できるかを理解するための厳密で定量的な基礎を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:03:31 GMT)
Scaling Generalist Data-Analytic Agents [95.1]
DataMindは、汎用データ分析エージェントを構築するために設計されたスケーラブルなデータ合成およびエージェントトレーニングレシピである。 DataMindは、オープンソースのデータ分析エージェントを構築する上で重要な3つの課題に取り組む。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:23:08 GMT)
AutoCode: LLMs as Problem Setters for Competitive Programming [94.7]
競合グレードの問題ステートメントやテストケースを生成するために,複数の検証ラウンドを使用するAutoCodeを紹介します。ホールドアウト問題では、AutoCodeテストスイートが99%の一貫性と公式判断にアプローチしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:03 GMT)
Trinity-RFT: A General-Purpose and Unified Framework for Reinforcement Fine-Tuning of Large Language Models [92.2]
Trinity-RFTは、大規模言語モデルの強化微調整(RFT)のために設計された汎用的で統一的で使いやすいフレームワークである。 RFT-coreは、同期/非同期、オンライン/オフライン、RTTのオンライン/オフラインモードを統一・一般化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:04:54 GMT)
Learning Goal-Oriented Language-Guided Navigation with Self-Improving Demonstrations at Scale [90.9]
本稿では,自己改善デモを用いた目標言語誘導ナビゲーション学習手法であるSIDを提案する。具体的には、SIDは環境からサンプリングされた最短経路データの初期エージェントを学習し、このエージェントを利用して新しい探索軌道を生成する。この反復的な自己改善パイプラインは、新しい環境に容易に拡張できることを示し、その結果、様々な言語誘導ナビゲーションタスク間で実演を行うことができることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:15:54 GMT)
Lost in Translation? Vocabulary Alignment for Source-Free Adaptation in Open-Vocabulary Semantic Segmentation [90.6]
VocAlignは、セマンティックセグメンテーションにおいてVLM用に特別に設計された、ソースフリーのドメイン適応フレームワークである。提案手法は,CityScapesデータセットの6.11mIoU改善を実現し,ゼロショットセグメンテーションベンチマークにおいて優れた性能を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:25:06 GMT)
LLaDA-MoE: A Sparse MoE Diffusion Language Model [89.0]
LLaDA-MoEはMixture-of-Experts (MoE)アーキテクチャを持つ大規模言語拡散モデルである。 LLaDA-MoEは計算オーバーヘッドを大幅に削減して競合性能を達成する。この結果から,マスク拡散言語モデルの学習目標に疎結合したMoEアーキテクチャを組み込むことで,MoEの強みがもたらされることが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:38:59 GMT)
G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge [88.8]
大規模言語モデル(LLM)は複雑な推論において優れているが、静的かつ不完全なパラメトリック知識によって制限される。最近のグラフ強化RAG (GraphRAG) は、このギャップを補足したグラフを構築し、LLMがそれらを推論できるようにする。 G-reasonerは、様々なグラフ構造化知識を推論するためにグラフと言語基盤モデルを統合した統合フレームワークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:38:12 GMT)
PanoWorld-X: Generating Explorable Panoramic Worlds via Sphere-Aware Video Diffusion [87.1]
PanoWorld-Xは、多彩なカメラ軌道を持つ高忠実で制御可能なパノラマビデオ生成のための新しいフレームワークである。動作範囲,制御精度,視覚的品質など,様々な面で優れた性能を示す実験を行った。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:22:00 GMT)
Rolling Forcing: Autoregressive Long Video Diffusion in Real Time [86.4]
Rolling Forcingは、エラーの最小限の蓄積で長いビデオをストリーミングできる、新しいビデオ生成技術である。転がり強制力には3つの新しい設計が伴う。第一に、エラー伝播を加速する個別のフレームを反復的にサンプリングする代わりに、共同演示方式を設計する。第2に,アテンションシンク機構を長軸ストリームビデオ生成タスクに導入し,初期フレームのキー値状態をグローバルなコンテキストアンカーとして保持する。第3に,大半が拡張された遮音窓上での無段蒸留を可能にする効率的な訓練アルゴリズムを設計する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:57:14 GMT)
Composable Score-based Graph Diffusion Model for Multi-Conditional Molecular Generation [85.6]
本研究では,具体的スコアを用いてスコアマッチングを離散グラフに拡張するComposable Score-based Graph Diffusion Model (CSGD)を提案する。 CSGDは従来の手法よりも平均15.3%の制御性向上を実現していることを示す。本研究は, 離散グラフ生成におけるスコアベースモデリングの実用的利点と, フレキシブルでマルチプロパタイトな分子設計のためのキャパシティを強調した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:50:08 GMT)
LoRACLR: Contrastive Adaptation for Customization of Diffusion Models [84.0]
LoRACLRは、複数のLoRAモデルを単一の統一モデルにマージする、マルチコンセプト画像生成の新しいアプローチである。 LoRACLRは、これらのモデルの重み空間を整列し、マージするために対照的な目的を使い、干渉を最小限にしながら互換性を確保する。本結果は,複数の概念を正確にマージし,パーソナライズされた画像生成能力を向上する上で,LoRACLRの有効性を強調した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:22:31 GMT)
Fine-tuning Done Right in Model Editing [83.8]
大規模な言語モデルを適応するための基礎的な手法であるファインチューニングは、長い間モデル編集には有効ではないと考えられてきた。ミニバッチ最適化により、標準的な幅優先パイプライン(エポックベース)に微調整を復元する。我々は、復元された微調整フレームワーク上に構築された、シンプルで効果的なローカライズド編集手法であるLocFT-BFを導出する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:24:21 GMT)
Re-Densification Meets Cross-Scale Propagation: Real-Time Neural Compression of LiDAR Point Clouds [83.4]
LiDARポイントクラウドは、様々なアプリケーションに基本的だが、高精度スキャンは、かなりのストレージと送信オーバーヘッドを発生させる。既存の手法では、非順序の点を階層的なオクツリーやボクセル構造に変換して、密度から疎い予測符号化を行うのが一般的である。筆者らのフレームワークは2つの軽量モジュールから構成されている。まず、Geometry Re-Densification Moduleがエンコードされたスパース幾何を再認識し、より密なスケールで特徴を抽出し、予測符号化のための特徴を再分離する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:51:26 GMT)
MARCOS: Deep Thinking by Markov Chain of Continuous Thoughts [82.5]
大規模言語モデル(LLM)における推論のための新しいパラダイムを提案する。自己回帰的にトークンを生成する代わりに、連続的で高次元の「思考」のマルコフ連鎖として推論をモデル化する。 MARCOSはトークンベースのCoTに匹敵する性能を初めて達成し、GSM8Kでは4.7%、推論では15.7倍のスピードアップを達成している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:44:22 GMT)
Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.6]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:04:01 GMT)
CoSteer: Collaborative Decoding-Time Personalization via Local Delta Steering [80.5]
CoSteerは、ローカライズされたデルタステアリングを通じてデコード時のパーソナライズを可能にする、新しいコラボレーティブフレームワークである。トークンレベルの最適化をオンライン学習問題として定式化し、ローカルデルタベクトルがリモートLLMのロジットを動的に調整する。このアプローチは、生のデータや中間ベクトルではなく、最後のステアリングトークンのみを送信することで、プライバシを保護します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:12:58 GMT)
T-MLP: Tailed Multi-Layer Perceptron for Level-of-Detail Signal Representation [79.9]
レベル・オブ・ディーテール(LoD)表現は、画像や3次元形状などの様々な種類の信号を効率的にモデル化し、伝達するために重要である。本研究では,LoD信号の表現が可能な新しいネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:33:20 GMT)
From Single to Multi-Granularity: Toward Long-Term Memory Association and Selection of Conversational Agents [79.9]
大言語モデル(LLM)は会話エージェントで広く採用されている。 MemGASは、多粒度アソシエーション、適応選択、検索を構築することにより、メモリ統合を強化するフレームワークである。 4つの長期メモリベンチマークの実験により、MemGASは質問応答と検索タスクの両方において最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:51:22 GMT)
Beyond Prompt-Induced Lies: Investigating LLM Deception on Benign Prompts [79.1]
大規模言語モデル(LLM)は、推論、計画、意思決定のタスクに広くデプロイされている。そこで我々は, 接触探索質問(CSQ)に基づく枠組みを提案し, 騙しの可能性を定量化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:05:19 GMT)
Vintix: Action Model via In-Context Reinforcement Learning [78.1]
In-context reinforcement learning を通じて振る舞いを学習できる固定されたクロスドメインモデルを導入することで ICRL のスケールアップに向けた第一歩を提示する。 ICRLを促進するために設計されたフレームワークであるアルゴリズム蒸留は、多目的な作用モデルを構築するために、専門家蒸留に代わる魅力的な、競争力のある代替手段を提供することを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:43:15 GMT)
GaussianLens: Localized High-Resolution Reconstruction via On-Demand Gaussian Densification [77.4]
そこで本研究では,ユーザの関心領域の詳細な情報を取得するために,初期3DGSを高密度化するための一般化可能なネットワークを提案する。提案手法の局所的な細部再構築における優れた性能と,最大1024時間1024ドルの解像度の画像に対するスケーラビリティを示す実験を行った。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:58:49 GMT)
Where Fact Ends and Fairness Begins: Redefining AI Bias Evaluation through Cognitive Biases [77.3]
事実と公正の境界を識別することは有意義な公正性評価に不可欠である,と我々は主張する。 Fact-or-Fair は (i) 客観的なクエリを記述的, 事実に基づく判断, (ii) 主観的クエリを規範的, 公平性に基づく判断に整合させたベンチマークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:18:33 GMT)
CMT: Mid-Training for Efficient Learning of Consistency, Mean Flow, and Flow Map Models [75.8]
Consistency Models (CM) や Mean Flow (MF) のようなフローマップモデルは、拡散モデルのODE解の長い跳躍を学習することで、少数のステップ生成を可能にする。本研究では,(拡散)事前学習と最終フローマップトレーニングの間に,軽量な中間段階を挿入する最初の概念と実践的手法であるミドルトレーニングを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:42:08 GMT)
FlashEdit: Decoupling Speed, Structure, and Semantics for Precise Image Editing [75.3]
FlashEditは、高忠実でリアルタイムな画像編集を可能にするように設計された新しいフレームワークである。その効率性は,(1)コストのかかる反復プロセスをバイパスするワンステップ・インバージョン・アンド・編集(OSIE)パイプライン,(2)編集領域内でのみ特徴を選択的に修正することで背景保存を保証するバックグラウンドシールド(BG-Shield)技術,(3)背景への意味的漏洩を抑えることで正確な局所的編集を保証するスカラー化空間横断認識(SSCA)機構の3つの重要なイノベーションに由来する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:04:02 GMT)
Identifying and Evaluating Inactive Heads in Pretrained LLMs [74.9]
本研究では,頭部の不活性度を計測する13のスコア関数の分類法を提案する。平均して12%以上の注意頭は活動せず、特定の文脈で改善することができる。スコア分布を測定することで、注意行動に対する洞察が得られることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:10:25 GMT)
PIPer: On-Device Environment Setup via Online Reinforcement Learning [74.5]
自動化された環境設定メソッドは、任意のリポジトリに対して、手作業なしで完全に構成された環境を提供することで、開発者を支援することができる。近年の研究では、最先端のLarge Language Models (LLMs) でさえ、このタスクの自動化に限られた成功をおさめていることが明らかになっている。我々は、正しいスクリプトを生成するための教師付き微調整と、環境設定のタスクに適応するために、Reinforcement Learning with Verifiable Rewards(RLVR)を組み合わせる。 EnvBench-Python では,より大型の Qwen3-32B や GPT-4 と同等に動作可能な Qwen3-8B (コンシューマハードウェア上で動作可能なモデル) を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:03:05 GMT)
LOVE-R1: Advancing Long Video Understanding with an Adaptive Zoom-in Mechanism via Multi-Step Reasoning [73.9]
ビデオクリップに適応的にズームイン可能なモデルであるLOVE-R1を提案する。モデルはまず、密度の高いサンプルフレームが提供されるが、小さな解像度で提供される。空間的詳細が必要な場合、大きなフレーム解像度で興味のあるクリップを拡大することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:43:55 GMT)
WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.6]
本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:27:58 GMT)
Efficient Reasoning Models: A Survey [73.0]
本調査は,近年の効率的な推論の進歩を包括的に概観することを目的としている。 1)短い圧縮CoTを簡潔で効果的な推論チェーンに、(2)より小さい - 強力な推論能力を持つコンパクトな言語モデルを開発する、(3)より高速に、という3つの重要な方向性に分類する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:26:56 GMT)
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.8]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:54:38 GMT)
RealUnify: Do Unified Models Truly Benefit from Unification? A Comprehensive Benchmark [71.4]
本稿では,双方向機能相乗効果を評価するためのベンチマークであるRealUnifyを紹介する。 RealUnifyは、10のカテゴリと32のサブタスクにまたがる、細心の注意を払ってアノテートされた1000のインスタンスで構成されている。現在の統一モデルは、効果的な相乗効果を達成するのに依然として苦労しており、アーキテクチャの統一だけでは不十分であることを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:07:28 GMT)
Can Large Language Models Express Uncertainty Like Human? [71.3]
我々は,人間に注釈を付けた信頼スコアを持つヘッジ式の最初の多種多様な大規模データセットをリリースする。現代大言語モデルにまたがる言語信頼に関する最初の体系的研究を行う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:34:30 GMT)
Explicit Second-Order Min-Max Optimization: Practical Algorithms and Complexity Analysis [71.1]
本研究では,非制約問題に対するグローバルなサドル点を求めるために,不正確なNewton型手法をいくつか提案し,解析する。提案手法は,Sur分解の必要回数の$O(log(1/eps)$因子をシェービングすることで,既存のライン検索に基づくmin-max最適化を改善する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:16:15 GMT)
DPFlow: Adaptive Optical Flow Estimation with a Dual-Pyramid Framework [71.0]
最大8Kの解像度入力を一般化できる適応型光フローアーキテクチャDPFlowを提案する。また,1Kから8Kまでの入力解像度を持つ光フロー評価のための新しいベンチマークであるKubric-NKを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:03:52 GMT)
InfoBridge: Mutual Information estimation via Bridge Matching [70.7]
拡散ブリッジモデルは、最近、生成モデリングの分野で強力なツールとなっている。我々は2つの確率変数間の相互情報(MI)の推定にそれらの力を利用する。従来のMI推定器では,データポーズが困難であった場合の非バイアス推定器を構築した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:44:24 GMT)
Conda: Column-Normalized Adam for Training Large Language Models Faster [70.7]
大規模言語モデル(LLM)は、目覚ましい一般化と創発的能力を示しているが、事前学習は計算コストが高く、最適化のダイナミクスに敏感である。両アプローチの長所を橋渡しする小説として,textbfColumn-Normalized Adam (Conda) を提案する。 LLaMAとGPT-2シリーズの実験では、コンダはトレーニング前のAdamW、Muon、その他のベースラインを一貫して上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:58:19 GMT)
Vision Function Layer in Multimodal LLMs [70.4]
本研究では,マルチモーダル大言語モデル(MLLM)において,視覚関連関数デコーディングが異なるデコーダ層に分散していることを明らかにする。 Visual Token Swappingは、ターゲットのKVキャッシュエントリを変更して、デコード中の層固有の機能を正確に解明する。本研究は、MLLM視覚処理をより深く理解し、より効率的で解釈可能で堅牢なモデルの作成を促進する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:45:35 GMT)
PredNext: Explicit Cross-View Temporal Prediction for Unsupervised Learning in Spiking Neural Networks [70.1]
Spiking Neural Networks (SNN)は、教師なし表現学習のための自然なプラットフォームを提供する。現在の監視されていないSNNは、浅いアーキテクチャや局所的な可塑性ルールを採用しており、長期の時間的依存関係をモデル化する能力を制限する。我々は,横断的なステップ予測とクリップ予測を通じて時間的関係を明示的にモデル化するPredNextを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:27:58 GMT)
VideoAnchor: Reinforcing Subspace-Structured Visual Cues for Coherent Visual-Spatial Reasoning [69.6]
VideoAnchorは、サブスペース親和性を活用してフレーム間の視覚的手がかりを強化するプラグイン・アンド・プレイモジュールである。 InternVL2-8BとQ2.5VL-72Bのベンチマークで一貫した性能向上を示した。私たちのコードはhttps://github.com/feufhd/VideoAnchor.comで公開されます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:54:04 GMT)
Unified Multimodal Model as Auto-Encoder [69.4]
本稿では,テキストに画像を圧縮するエンコーダ(I2T)と,そのテキストから画像を再構成するデコーダ(T2I)の理解に関するパラダイムを紹介する。我々の経験的結果は、理解は生成を大幅に促進し(GenEvalで検証されている)、生成は、特にきめ細かい視覚知覚を強化することを示唆している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:35:25 GMT)
VisCoder: Fine-Tuning LLMs for Executable Python Visualization Code Generation [69.4]
提案するVisCode-200Kは,Pythonによる可視化と自己補正のための大規模インストラクションチューニングデータセットである。 1)オープンソースリポジトリからの検証済みプロットコードと自然言語命令と描画プロットのペア,(2)Code-Feedbackからの45Kのマルチターン補正ダイアログ。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:45:05 GMT)
The Ever-Evolving Science Exam [69.2]
本研究では,基礎モデルの科学的能力を確実に評価するための動的ベンチマークであるEver-Evolving Science Exam (EESE)を紹介する。 1)5つの分野と500以上のサブフィールドにまたがる専門的な科学インスタンス(問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ)から構成される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:55:14 GMT)
From $f(x)$ and $g(x)$ to $f(g(x))$: LLMs Learn New Skills in RL by Composing Old Ones [68.7]
LLMは、既存のスキルを組み込むことで、RL中に真に新しいスキルを身につけることができることを示す。実験により、ソースタスクで得られた構成スキルが、異なるターゲットタスクに転送されることを示す。この転送は、ターゲットに対する構成的なトレーニングなしでも行われ、ターゲットの原子スキルに関する事前の知識のみを必要とする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:44:27 GMT)
Interpretable 3D Neural Object Volumes for Robust Conceptual Reasoning [68.3]
CAVE(Concept Aware Volumes for Explanations)は、画像分類における解釈可能性と堅牢性を統一する新しい方向である。本稿では,概念の空間的整合性を測定する尺度である3次元整合性(3D-C)を提案する。 CAVEは、様々なOOD設定における画像間の一貫性と意味のある概念を発見しながら、競争力のある分類性能を達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:24:06 GMT)
Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration [68.3]
本稿では,多エージェント協調のための新しいフレームワークを提案する。これは,効率的な自己調整のための強化アドバンテージフィードバック(Reinforced Advantage feedback, ReAd)を導入する。 Over-AIと難解なRoCoBenchの実験は、ReAdが成功率のベースラインを超え、エージェントの相互作用ステップを著しく減少させることを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:44:00 GMT)
Score Distillation of Flow Matching Models [67.9]
我々は、Score Identity Distillation (SiD) を事前訓練されたテキスト対画像フローマッチングモデルに拡張する。 SiDは、データフリーとデータアシストの両方の設定で、これらのモデルですぐに使える。これは、スコア蒸留がテキストと画像のフローマッチングモデルに広く適用されるという最初の体系的な証拠を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:45:48 GMT)
Scaling Synthetic Task Generation for Agents via Exploration [67.7]
対話型エージェントを構築するための訓練後のマルチモーダル大言語モデル(MLLM)は、コンピュータ利用、Webナビゲーション、ロボット工学といった分野にまたがる約束を守る。タスク生成のための既存のアプローチは、ダウンストリーム環境情報に制限のある人間のアノテーションやMLLMのプロンプトに大きく依存している。本稿では,タスク生成のためのスケーラブルなパイプラインであるAutoPlayについて紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:00:02 GMT)
Generalized Correctness Models: Learning Calibrated and Model-Agnostic Correctness Predictors from Historical Patterns [67.2]
本稿では,正確で校正された信頼度を推定する一般化精度モデル(GCM)を提案する。まず,多くのLCMの正当性データに基づいてGCMをトレーニングできることを示す。次に,CMをレンズとして,補正予測能力の源泉とその一般化について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:19:01 GMT)
PoseDiff: A Unified Diffusion Model Bridging Robot Pose Estimation and Video-to-Action Control [67.2]
本稿では,ロボットの状態推定と制御を単一のフレームワーク内で統一する条件拡散モデルPoseDiffを提案する。中心となるPoseDiffは、生の視覚を3Dキーポイントや関節角などの構造化されたロボットの状態にマッピングする。この基盤の上に構築されたPoseDiffは、ビデオからアクションへの逆ダイナミクスに自然に拡張する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:55:48 GMT)
LatentEvolve: Self-Evolving Test-Time Scaling in Latent Space [66.7]
Test-timeScaling (TTS) は、モデルパラメータを変更することなく、推論フェーズにおけるLarge Language Models (LLM) の推論能力を著しく向上することが実証されている。本稿では,補完学習システム理論に触発された自己進化型潜在TSフレームワークであるLatentEvolveを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:37:39 GMT)
Convergence of Clipped-SGD for Convex $(L_0,L_1)$-Smooth Optimization with Heavy-Tailed Noise [65.4]
Clip-SGDのようなクリッピングを持つ一階法は、$(L_$1)$-smoothnessの仮定の下でSGDよりも強い収束保証を示す。 Clip-SGD の高確率収束バウンダリを凸 $(L_$1)$-smooth の重み付き雑音による最適化に適用した最初の高確率収束バウンダリを確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:31:12 GMT)
Prediction-Powered Communication with Distortion Guarantees [65.4]
本研究では,デバイスが厳密な歪み保証付きゼロ遅延制約の下で通信する,予測駆動型通信環境について検討する。本稿では,オンラインコンフォメーション予測を利用した2つのゼロ遅延圧縮アルゴリズムを提案する。セマンティックテキスト圧縮の実験は、そのアプローチを検証し、ビットレートの大幅な削減を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:19:39 GMT)
PhysicsMinions: Winning Gold Medals in the Latest Physics Olympiads with a Coevolutionary Multimodal Multi-Agent System [65.0]
物理は現実世界の理解と形成の中心であり、物理問題を解く能力は現実世界の物理知能の重要な指標である。既存のアプローチは主にシングルモデルベースであり、オープンソースのMLLMはゴールドメディカルレベルのパフォーマンスに達することは滅多にない。我々は,物理オリンピアードの共進化的マルチエージェントシステムであるPhysorMinionsを提案する。アーキテクチャには、ダイアグラムを解釈するVisual Studio、ソリューションを定式化するLogic Studio、デュアルステージ検証を実行するReview Studioの3つのシナジスティックスタジオがある。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:40:53 GMT)
MGM-Omni: Scaling Omni LLMs to Personalized Long-Horizon Speech [64.9]
MGM-オムニ (MGM-Omni) は、Omni-modalな理解と表現力のある長距離音声生成のための統一オムニLLMである。 MGM-Omniは、リアルタイム音声生成からマルチモーダル推論をきれいに分離するデュアルトラックのトークンベースのアーキテクチャを採用している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:48:28 GMT)
Group-Relative REINFORCE Is Secretly an Off-Policy Algorithm: Demystifying Some Myths About GRPO and Its Friends [64.7]
大規模言語モデル(LLM)の非政治強化学習が注目されている。本稿では,特定のトレーニングデータ分布を仮定することなく,グループ化型REINFORCEの第一原理導出について述べる。この観点は、REINFORCEを非政治的な設定に適応するための2つの一般的な原則をもたらす。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:34:54 GMT)
UniTraj: Learning a Universal Trajectory Foundation Model from Billion-Scale Worldwide Traces [64.2]
ユニバーサルな軌跡基礎モデルを構築することは、既存の軌跡モデリングアプローチの限界に対処するための有望な解決策である。以下、UniTrajを紹介します。UniTrajは3つの重要なイノベーションを通じてこれらの制限に対処することを目的としています。まず、70か国にまたがる数十億のGPSポイントを持つ、前例のない245万のトラジェクトリのデータセットであるWorldTraceを構築します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:43:00 GMT)
Specialization after Generalization: Towards Understanding Test-Time Training in Foundation Models [64.0]
最近の研究は、テストタイムトレーニング(TTT)として知られる特定のタスクに対して、テストタイムでモデルをトレーニングし続けるというアイデアを探求している。本稿では,TTTがグローバルトレーニングよりもはるかに小さな分布内テスト誤差を達成できるモデルを提案する。我々は、ImageNet上でスパースオートエンコーダをトレーニングすることで、モデルの主要な仮定を実証的に検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:24:52 GMT)
Asymmetric VAE for One-Step Video Super-Resolution Acceleration [63.4]
本稿では,高圧縮VAEを実装することにより,計算コストを大幅に削減するFastVSRを提案する。 FastVSRは、マルチステップモデルに比べて111.9倍、既存のワンステップモデルより3.92倍のスピードアップを実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:36:14 GMT)
Polychromic Objectives for Reinforcement Learning [63.4]
強化学習微調整(Reinforcement Learning fine-tuning, RLFT)は、下流タスクの事前訓練されたポリシーを改善するための主要なパラダイムである。多様な世代の探索・改良を明示的に実施する政策手法の目的について紹介する。この目的を最適化するために、PPO(Pximal Policy Optimization)をどのように適用できるかを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:32:11 GMT)
KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model [63.1]
KaLM-Embedding-V2は、汎用的でコンパクトな埋め込みモデルである。 0.5Bのコンパクトなサイズでモデルを実装し,固定長埋め込みを実現する。トレーニングデータでは, プレトレーニング用20種, 微調整用100種, コントラスト蒸留用100種をキュレートする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:52:44 GMT)
PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.0]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。 Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:36:45 GMT)
Personalized Vision via Visual In-Context Learning [62.9]
パーソナライズされた視覚のためのビジュアル・イン・コンテキスト・ラーニング・フレームワークを提案する。 PICOは基盤となる変換を推測し、再トレーニングせずに新しい入力に適用する。また,効率的な推論スケーリングによる信頼性向上を目的とした注意誘導型シードスコアラを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:58:45 GMT)
AdvChain: Adversarial Chain-of-Thought Tuning for Robust Safety Alignment of Large Reasoning Models [62.7]
本稿では,逆CoTチューニングによる動的自己補正をモデルに教えるアライメントパラダイムであるAdvChainを提案する。私たちの仕事は、より堅牢で信頼性の高い推論モデルを構築するための新しい方向性を確立します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:27:23 GMT)
UniF$^2$ace: A Unified Fine-grained Face Understanding and Generation Model [62.7]
本稿では,2次元離散拡散(D3Diff)損失を伴う新しい理論枠組みを導入し,離散的なスコアマッチング拡散を伴うマスク付き生成モデルを統一する。このD3Diffは、テキスト入力に沿った高忠実度顔の詳細を合成するモデルの能力を大幅に向上させる。提案するUniF$2$aceD-1Mは,130Kの微細な画像キャプチャ対と100Mの視覚的質問応答対からなる大規模データセットである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:12:48 GMT)
AnesSuite: A Comprehensive Benchmark and Dataset Suite for Anesthesiology Reasoning in LLMs [62.6]
AnesSuiteは、LSMの麻酔学推論用に特別に設計された最初のデータセットスイートである。 Morpheusは麻酔学の推論のための最初のベースラインモデルコレクションである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:08:42 GMT)
FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting [62.3]
本稿では,長編ビデオによる思考の概念を紹介し,新しいフレームワークFrameThinkerを提案する。 FrameThinkerは,処理フレーム数を劇的に削減しつつ,ベースラインよりも+10.4%の大幅な平均改善を実現していることを示す。最も注目すべきは、7BモデルであるFrameThinkerがLongVideo-Reason上で新しい最先端技術を確立し、平均20.6フレームで76.1%の精度を実現したことです。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:36:58 GMT)
Where LLM Agents Fail and How They can Learn From Failures [62.2]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。 AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:20:27 GMT)
Adaptive Test-Time Reasoning via Reward-Guided Dual-Phase Search [62.2]
本稿では、推論を計画と実行に分離する二相テストタイムスケーリングフレームワークを提案する。具体的には、推論軌跡を分解し、各フェーズの報酬モデルを構築し、探索者が個別に計画と実行を探索、実行できるようにする。数学的推論とコード生成ベンチマークの両方の実験により、我々の手法は計算の冗長性を低減しつつ、常に精度を向上することを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:27:23 GMT)
Model Correlation Detection via Random Selection Probing [62.1]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。 RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:40:26 GMT)
GHOST: Hallucination-Inducing Image Generation for Multimodal LLMs [61.8]
本稿では,幻覚を誘発する画像を積極的に生成することにより,MLLMをストレステストする手法であるGHOSTを紹介する。 GHOSTは完全に自動化されており、人間の監督や事前の知識を必要としない。 GLM-4.1V-Thinkingのような推論モデルを含む様々なモデルにおいて本手法の評価を行い,従来のデータ駆動探索法と比較して28%以上の幻覚成功率を達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:23 GMT)
Beyond Softmax: A Natural Parameterization for Categorical Random Variables [61.7]
階層的なバイナリ分割のシーケンスで構成される関数である$textitcatnat$関数を紹介します。実験により,提案した関数は学習効率を向上し,一貫した試験性能を特徴とするモデルが得られることを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:55:50 GMT)
Reasoning to Learn from Latent Thoughts [61.2]
本研究では,テキスト生成プロセスの根底にある表現的思考を明示的にモデル化し,推論することにより,事前学習データの効率を大幅に向上させることができることを示す。 1B LMは、少なくとも3回の反復でその性能をブートストラップし、生データに基づいてトレーニングされたベースラインを大幅に上回ることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:57:54 GMT)
Scaling Diffusion Transformers Efficiently via $μ$P [61.1]
最小更新パラメトリゼーション(mu$P)は、小さな言語モデルから大規模な言語モデルへの安定したHP転送を可能にするバニラトランスフォーマーに対して提案された。拡散変換器に標準の$mu$Pを一般化し、大規模実験によりその有効性を検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:15:04 GMT)
Beyond Losses Reweighting: Empowering Multi-Task Learning via the Generalization Perspective [61.1]
マルチタスク学習(MTL)は、共有バックボーンを使用して複数の目的を同時に最適化するために、ディープニューラルネットワークを訓練する。本稿では,重み摂動を利用して勾配ノルムを規制し,一般化を改善する新しいMTLフレームワークを提案する。本手法は,タスク性能とモデル全体のロバスト性の観点から,既存の勾配に基づくMTL技術よりも大幅に優れる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:14:15 GMT)
The Open Syndrome Definition [61.1]
ケースとシンドロームの定義を表現するための,最初のオープンな機械可読フォーマットを提案する。我々は、既存の人間可読定義を機械可読形式に変換するための、標準化されたケース定義とツールの最初の包括的なデータセットを紹介する。オープンシンドローム定義フォーマットは、システム間のケース定義の一貫性とスケーラブルな使用を可能にし、公衆衛生の準備と対応を強化するAIの可能性を解放する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:41:54 GMT)
OrthAlign: Orthogonal Subspace Decomposition for Non-Interfering Multi-Objective Alignment [61.0]
大規模言語モデル(LLM)のアライメントは、複数の人間の好みに対処する際に重要なジレンマに直面します。我々は、優先順位調整における勾配レベルの対立を解決する革新的なアプローチであるOrthAlignを提案する。我々はOrthAlignが多重目的アライメント後の34.61%から50.89%の最大単一参照改善を実現していることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:16:30 GMT)
Light-SQ: Structure-aware Shape Abstraction with Superquadrics for Generated Meshes [60.9]
我々は、新しいスーパークワッドリックベースの最適化フレームワークLight-SQを提案する。本稿では,構造対応ボリューム分解によるブロック再配置戦略を提案する。実験によると、Light-SQはスーパークワッドリックで効率よく、高忠実で、編集可能な形状の抽象化を可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:18:32 GMT)
ExGS: Extreme 3D Gaussian Compression with Diffusion Priors [60.7]
我々はtextbfExtreme 3DtextbfGS 圧縮のための textbfGaussPainter と textbfUniversal Gaussian Compression (UGC) を統合した新しいフィードフォワードフレームワーク textbfExGS を紹介する。我々のフレームワークは100ドル以上の圧縮(典型的な354.77 MBモデルを約3.31 MBに還元する)を達成できる一方で、忠実さを保ち、挑戦的な条件下で画像品質を著しく向上させることができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:23:06 GMT)
GSPR: Aligning LLM Safeguards as Generalizable Safety Policy Reasoners [60.5]
大規模言語モデル(LLM)は、様々な領域にわたる多くのアプリケーションに統合されつつある。本稿では,安全でない入力プロンプトとLLMの出力を不正に検出する汎用安全推論器GSPRを提案する。我々のGSPRは、安全とカテゴリー予測の両方のタスクにおいて、既存の安全ガードレールの推論能力を大幅に改善する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:07:45 GMT)
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [60.1]
本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:40:36 GMT)
Q-Mirror: Unlocking the Multi-Modal Potential of Scientific Text-Only QA Pairs [60.1]
テキストオンリーQAペア(TQA)を高品質マルチモーダルQAペア(MMQA)に変換する可能性を探る。我々は、TQA-to-MMQAフレームワークを開発し、変換の原則を提供する包括的で多次元のMMQA品質を確立する。我々は,MMQA生成と評価を反復精製のためのクローズドループに統合することにより,我々のフレームワークを運用するエージェントシステム(Q-Mirror)を開発した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:22:10 GMT)
Perceive, Reflect and Understand Long Video: Progressive Multi-Granular Clue Exploration with Interactive Agents [60.1]
時間的およびスパースなタスク関連情報を特徴とするロングビデオは、AIシステムに重大な推論課題を生じさせる。人間のプログレッシブな視覚認知にインスパイアされ、我々はCogniGPTを効率的で信頼性の高い長時間ビデオ理解のために提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:42:55 GMT)
LLMs4All: A Review on Large Language Models for Research and Applications in Academic Disciplines [60.0]
ChatGPTのようなLLM(Large Language Models)ベースのアプリケーションは、人間のような会話を生成する能力を示している。本稿では,最先端のLDMの概要と,幅広い学術分野への統合について述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:13:52 GMT)
Pyramid Token Pruning for High-Resolution Large Vision-Language Models via Region, Token, and Instruction-Guided Importance [60.0]
Pyramid Token Pruning (PTP) は、階層的にボトムアップの視覚的サリエンスとトークンレベルをトップダウンの指導誘導の関連性と統合する、トレーニング不要の戦略である。 PTPは計算コスト、メモリ使用量、推論遅延を大幅に削減し、性能劣化を無視できることを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:29:36 GMT)
HERO: Rethinking Visual Token Early Dropping in High-Resolution Large Vision-Language Models [60.0]
本稿では,コンテンツ適応型トークン予算配分と関数対応トークン選択を統合したフレームワークHEROを提案する。本研究は、HR-LVLMにおける効率的な推論に対する経験的洞察と実践的解決策の両方を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:44:42 GMT)
From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [59.9]
MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:25:40 GMT)
Visualizing Thought: Conceptual Diagrams Enable Robust Planning in LMMs [59.7]
概念図はメンタルモデルを外部化し、関係のない詳細を抽象化して、エンティティの相互作用を効率的に捉える。大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、主にテキストを通して推論される。我々は、LMMが複数の自己生成概念図を通した推論を可能にする、一般化可能なフレームワークであるVisual Thinkingを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:11:45 GMT)
GSM8K-V: Can Vision Language Models Solve Grade School Math Word Problems in Visual Contexts [59.5]
GSM8K-Vは、純粋に視覚的なマルチイメージの数学的推論ベンチマークである。 GSM8K-Vは、広く使われているテキストベースのGSM8Kからサンプルを視覚的にマッピングすることで構築される。我々は,GSM8K-V上で,幅広いオープンソースおよびクローズドソースモデルを評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:57:05 GMT)
Pushing LLMs to Their Logical Reasoning Bound: The Role of Data Reasoning Intensity [59.3]
データ推論強度 (Data Reasoning Intensity, DRI) は, サンプルの潜在論理的推論複雑性を定量化する新しい指標である。次に、学習データの論理的推論強度を体系的に強化する再認識最適化戦略を導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:20:04 GMT)
Federated Learning Resilient to Byzantine Attacks and Data Heterogeneity [59.2]
本稿では、データに対する悪意ある攻撃の文脈におけるグラディエント学習(FL)について述べる。本稿では,収束解析と損失関数の中央値を用いた新しい平均ロバストアルゴリズム(RAGA)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:52:22 GMT)
Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation [59.2]
CATE推定のための最先端の手法は、しばしば低い重なり合いの存在下では性能が良くない。重み付け重み付けに比例して対象モデルを正規化するオーバーラップ適応正規化(OAR)を導入する。我々のOARは定値化に比べて低オーバーラップ設定でのCATE推定を大幅に改善する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:56:24 GMT)
ProxyAttn: Guided Sparse Attention via Representative Heads [59.0]
より正確なブロック推定を実現する訓練不要なスパースアテンションアルゴリズムであるProxyAttnを提案する。本稿では,ProxyAttnが最大10.3倍の注意加速度と2.4倍の事前充足加速度を実現できることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:10:39 GMT)
Seeing Before Reasoning: A Unified Framework for Generalizable and Explainable Fake Image Detection [58.8]
この失敗の根源は、根本的なミスマッチにある、と私たちは主張する。本稿では,偽画像検出のための汎用的で説明可能な,会話型アシスタントであるForensic-Chatを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:59:19 GMT)
PixelCraft: A Multi-Agent System for High-Fidelity Visual Reasoning on Structured Images [58.7]
PixelCraftは、高忠実度画像処理と、構造化画像に対する柔軟な視覚的推論のための、新しいマルチエージェントシステムである。この基盤の上に構築されたPixelCraftは、ツールの選択、エージェントの議論、自己批判といった3段階の動的なワークフローを通じて、視覚的推論を容易にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:49 GMT)
MobileLLM-R1: Exploring the Limits of Sub-Billion Language Model Reasoners with Open Training Recipes [58.7]
強い推論能力は、はるかに少ないデータで実現可能であることを示す。 MobileLLM-R50MのAIMEスコアは15.5であり、OLMo-2-1.48Bは0.6、SmolLM-2-1.7Bは0.3である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:43:59 GMT)
Neural Optimal Transport Meets Multivariate Conformal Prediction [58.4]
条件付きベクトル回帰(CVQR)のためのフレームワークを提案する。 CVQRは、ニューラルネットワークの最適輸送と量子化された最適化を組み合わせて、予測に適用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:50:19 GMT)
NAIPv2: Debiased Pairwise Learning for Efficient Paper Quality Estimation [58.3]
本稿では,紙の品質評価のための非バイアスで効率的なフレームワークであるNAIPv2を提案する。 NAIPv2は、レビューアレーティングの不整合を低減するために、ドメイン年グループ内でペアワイズ学習を採用している。最先端のパフォーマンス(78.2% AUC、0.432 Spearman)を達成し、拡張性、線形時間効率を推論で維持する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:23 GMT)
Visual Jigsaw Post-Training Improves MLLMs [58.3]
大規模言語モデル(MLLM)における視覚的理解を強化するために設計された,汎用的な自己教師型ポストトレーニングフレームワークであるVisual Jigsawを紹介する。視覚的な入力は分割され、シャッフルされ、モデルは自然言語で正しい置換を生成することで視覚情報を再構築する必要がある。広範囲な実験により、微粒な知覚、時間的推論、空間的理解が大幅に改善された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:57 GMT)
A Double Machine Learning Approach to Combining Experimental and Observational Data [58.1]
実験と観測を組み合わせた二重機械学習手法を提案する。本フレームワークは, より軽度な仮定の下で, 外部の妥当性と無知性に対するファルシフィケーションテストを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:11:39 GMT)
MoVa: Towards Generalizable Classification of Human Morals and Values [57.9]
MoVaは、人間の道徳と価値観の一般化可能な分類のための、文書化されたリソーススイートである。 MoVaのデータと手法は、人間と機械のコミュニケーションを細かく解釈するのに役立つ。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:56:27 GMT)
Can Language Models Discover Scaling Laws? [57.8]
本稿では,拡張法則モデルとパラメータを協調的に最適化し,変数間の複雑な関係を自律的に探索する進化型エージェントSLDAgentを紹介する。 SLDAgentが、確立された人間由来の法則よりも、一貫して正確な外挿を示す法則を自動的に発見できることを、初めて実証した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:57:00 GMT)
Streaming Sequence-to-Sequence Learning with Delayed Streams Modeling [57.7]
遅延ストリームモデリングはシーケンス対シーケンス学習のための柔軟な定式化である。任意の入力の組み合わせから任意の出力シーケンスのストリーミング推論を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:17:12 GMT)
G-CUT3R: Guided 3D Reconstruction with Camera and Depth Prior Integration [57.7]
G-CUT3Rは,ガイド付き3次元シーン再構成のための新しいフィードフォワード手法である。入力画像のみに依存する既存のフィードフォワード法とは異なり,本手法では奥行き,カメラキャリブレーション,カメラ位置などの補助的データを活用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:37:18 GMT)
Diffusion Bridge or Flow Matching? A Unifying Framework and Comparative Analysis [57.6]
拡散ブリッジとフローマッチングは、任意の分布間の変換において魅力的な経験的性能を示した。我々は,これらのフレームワークを最適制御のレンズを通して再キャストし,拡散橋のコスト関数が低いことを証明した。これらの理論的主張を裏付けるために,潜伏変圧器上に構築された拡散橋の新しい強力なアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:45:22 GMT)
ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory [57.5]
ReasoningBankは、エージェントの自己判断の成功と失敗の経験から一般化可能な推論戦略を抽出するメモリフレームワークである。テスト時には、エージェントがReasoningBankから関連する記憶を取得してそのインタラクションを知らせ、新しい学習を統合することで、時間が経つにつれてより有能になる。本稿では,エージェントのインタラクションエクスペリエンスをスケールアップすることにより,学習プロセスの高速化と多様化を図るメモリ対応テストタイムスケーリング(MaTTS)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:51:03 GMT)
Understanding Generative Recommendation with Semantic IDs from a Model-scaling View [57.5]
Generative Recommendation (GR)は、リッチアイテムのセマンティクスと協調フィルタリング信号を統合する。一般的なアプローチの1つは、セマンティックID(SID)を使用して、自動回帰ユーザーインタラクションシーケンスモデリングのセットアップでアイテムを表現することである。 SIDをベースとしたGRは,モデルをスケールアップしながら大きなボトルネックを示す。我々は、大規模言語モデル(LLM)を直接レコメンデーションとして使用する別のGRパラダイムを再考する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:24:17 GMT)
RapidMV: Leveraging Spatio-Angular Representations for Efficient and Consistent Text-to-Multi-View Synthesis [57.3]
ラピッドMV(Rapid-to-multi-view Generative model)は,32枚の多視点合成画像を約5秒で生成できる新しいテキスト・ツー・マルチビュー生成モデルである。 RapidMVは、競合する品質とテキストイメージのアライメントで、一貫性とレイテンシの点で既存のメソッドよりも優れています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:57:11 GMT)
TokenSwap: Backdoor Attack on the Compositional Understanding of Large Vision-Language Models [57.3]
大規模視覚言語モデル(LVLM)に対するより回避的でステルス的なバックドア攻撃であるTokenSwapを紹介する。固定されたターゲットコンテンツを強制するのではなく、TokenSwapはテキスト内のオブジェクト関係の理解を微妙に妨害する。 TokenSwapは、優れた回避性とステルス性を維持しながら、高い攻撃成功率を達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:19:22 GMT)
BranchGRPO: Stable and Efficient GRPO with Structured Branching in Diffusion Models [57.3]
BranchGRPOは、ロールアウトプロセスを分岐木に再構成する手法である。 HPDv2.1イメージアライメントでは、BranchGRPOはDanceGRPOよりも最大でtextbf16%のアライメントスコアを改善する。ハイブリッド版であるBranchGRPO-MixはDanceGRPOよりも4.7倍の速度でトレーニングを加速する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:20:45 GMT)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.3]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:36:13 GMT)
MemGen: Weaving Generative Latent Memory for Self-Evolving Agents [57.2]
本稿では,エージェントに人間的な認知機能を持たせる動的生成記憶フレームワークであるMemGenを提案する。 MemGenは、エージェントが推論を通して潜在記憶をリコールし、増大させ、記憶と認知の密接なサイクルを生み出すことを可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:33:13 GMT)
Brain Tumor Classification on MRI in Light of Molecular Markers [57.0]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:43:34 GMT)
InfLLM-V2: Dense-Sparse Switchable Attention for Seamless Short-to-Long Adaptation [56.7]
ロングシーケンス処理は、現代の大規模言語モデルにとって重要な機能である。 InfLLM-V2は、ショートシーケンスからロングシーケンスまでのモデルをシームレスに適応する訓練可能なスパースアテンションフレームワークである。実験では、InfLLM-V2は高密度の注意より4$times$速いが、98.1%と99.7%のパフォーマンスを維持している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:08:33 GMT)
Towards Personalized Deep Research: Benchmarks and Evaluations [56.6]
我々は、Deep Research Agents(DRA)におけるパーソナライズ評価のための最初のベンチマークであるPersonalized Deep Research Benchを紹介する。さまざまな研究タスク50と、構造化されたペルソナ属性と動的現実世界のコンテキストを組み合わせた25のユーザプロファイルを組み合わせ、250のリアルなユーザタスククエリを生成する。さまざまなシステムの実験は、パーソナライズされたディープリサーチを扱う際の現在の能力と限界を強調します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:39:17 GMT)
IWR-Bench: Can LVLMs reconstruct interactive webpage from a user interaction video? [56.0]
本稿では,ビデオからのインタラクティブWebページ再構築におけるLVLM(Large Vision-Language Models)の能力を評価するための新しいベンチマークであるIWR-Benchを紹介する。 IWR-Benchは100の現実世界のウェブサイトから、1,001のアクションを持ち、多様な相互作用の複雑さを特徴とする1,3の精巧にキュレートされたタスクで構成されている。このベンチマークは、ビデオとアセットからインタラクションロジックを推論する包括的なマルチモーダル推論と、このロジックを関数コードに変換するための高度なコード生成という、2つの基本的な課題に関するモデルを評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:38:06 GMT)
GRAF: Multi-turn Jailbreaking via Global Refinement and Active Fabrication [55.6]
大規模言語モデルは、悪意のある目的のために誤用される可能性があるため、顕著な安全性のリスクを生じさせる。そこで本研究では,各インタラクションにおける攻撃経路をグローバルに洗練する,新しいマルチターンジェイルブレーキング手法を提案する。さらに、モデル応答を積極的に作成し、安全性に関する警告を抑えることにより、有害な出力を誘発する可能性を高める。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:39:26 GMT)
EasySteer: A Unified Framework for High-Performance and Extensible LLM Steering [55.6]
大規模言語モデル(LLM)のステアリングは、推論時にモデル動作を制御するための有望なパラダイムとして登場した。我々は,vLLM上に構築された高性能LLMステアリングのための統合フレームワークであるEasySteerを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:07 GMT)
Asynchronous Policy Gradient Aggregation for Efficient Distributed Reinforcement Learning [55.5]
本稿では非同期ポリシー勾配アグリゲーションを実装したRennala NIGTとMalenia NIGTという2つの新しいアルゴリズムを紹介する。同質な設定では、Rennala NIGTはAllReduce操作をサポートしながら、計算と通信の合計複雑性を良好に改善する。不均質な環境では、Malenia NIGTは非同期計算と不均質な環境を厳密な理論上の保証で同時に扱う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:38:42 GMT)
METok: Multi-Stage Event-based Token Compression for Efficient Long Video Understanding [55.4]
トレーニング不要なマルチステージイベントベースのToken圧縮フレームワークであるMETokを提案する。我々はMETokが情報的視覚トークンを動的に選択することで効率と精度の最適なトレードオフを実現することを示す。例えば、LongVA-7BをMETokに装備すると、80.6%のFLOPが削減され、93.5%のKVキャッシュメモリが節約される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:20:29 GMT)
DC-VideoGen: Efficient Video Generation with Deep Compression Video Autoencoder [55.3]
DC-VideoGenは、事前訓練されたビデオ拡散モデルに適用することができる。軽量な微調整を施した深部圧縮潜伏空間に適応することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:31 GMT)
Similarity-Aware Selective State-Space Modeling for Semantic Correspondence [54.9]
MambaMatcherは選択的状態空間モデル(SSM)を用いて高次元相関を効率的にモデル化する MambaMatcherは特徴マップの解像度や受容場を損なうことなく、4D相関マップを効果的に洗練する。標準的な意味対応ベンチマークの実験は、MambaMatcherが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:56:57 GMT)
Accessible, Realistic, and Fair Evaluation of Positive-Unlabeled Learning Algorithms [54.6]
本稿では,PU学習アルゴリズムを体系的に比較する最初のPU学習ベンチマークを提案する。 PU学習アルゴリズムの現実的かつ公正な評価に影響を及ぼす微妙で重要な要因を同定する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:13:00 GMT)
TemMed-Bench: Evaluating Temporal Medical Image Reasoning in Vision-Language Models [54.5]
既存の医学推論ベンチマークは、主に1回の訪問からの画像に基づいて患者の状態を分析することに焦点を当てている。臨床訪問における患者の状態の変化を分析するための最初のベンチマークであるTemMed-Benchを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:51:26 GMT)
SVeritas: Benchmark for Robust Speaker Verification under Diverse Conditions [54.3]
話者検証(SV)モデルは、セキュリティ、パーソナライゼーション、アクセス制御システムにますます統合されている。既存のベンチマークでは、これらの条件のサブセットのみを評価しており、他は完全に欠落している。 SVeritasは、録音時間、自発性、コンテンツ、ノイズ、マイクロホン距離、残響、チャンネルミスマッチ、オーディオ帯域幅、コーデック、話者年齢、スプーフィングおよび敵攻撃に対する感受性などのストレス下でのSVシステムの評価を行う総合的な話者検証タスクベンチマークスイートである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:46:37 GMT)
From Mean to Extreme: Formal Differential Privacy Bounds on the Success of Real-World Data Reconstruction Attacks [54.3]
機械学習における微分プライバシーは、しばしばメンバーシップ推論に対する保証として解釈される。 DP予算を定量的な保護に翻訳することで、データ再構築の脅威を悪化させることは、依然として困難な課題である。本稿では、実証された"ゼロスクラッチ"攻撃のメカニズムに合わせた、最初の公式なプライバシー境界を導出することで、臨界ギャップを埋める。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:05:04 GMT)
Can Molecular Foundation Models Know What They Don't Know? A Simple Remedy with Preference Optimization [54.2]
既存の基盤モデルと柔軟に統合可能なプラグイン・アンド・プレイモジュールである,分子適応型参照インスタンスランキング(Mole-PAIR)を導入する。本手法は既存の分子基盤モデルのOOD検出能力を著しく向上することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:06:52 GMT)
SecInfer: Preventing Prompt Injection via Inference-time Scaling [54.2]
emphSecInferは,インセンジェンス時間スケーリングに基づくインジェクション攻撃に対する新しい防御法である。 SecInferは、既存のインジェクション攻撃と適応的なインジェクション攻撃の両方を効果的に軽減し、最先端の防御と既存の推論時間スケーリングアプローチより優れていることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:00:41 GMT)
Triangle Splatting+: Differentiable Rendering with Opaque Triangles [54.2]
微分可能なスティングフレームワーク内での三角形を直接最適化するTriangle Splatting+を導入する。本手法は, 視覚的忠実度において, より効率的かつ高速なトレーニングを継続しながら, 従来のスプレイティング手法を超越した手法である。結果として生じるセミコネクテッドメッシュは、物理ベースのシミュレーションやインタラクティブなウォークスルーのような下流のアプリケーションをサポートする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:43:46 GMT)
Learning to Interact in World Latent for Team Coordination [53.5]
本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:13:39 GMT)
Reference-Free Rating of LLM Responses via Latent Information [53.5]
本研究では,判断モデルに対して,自由テキスト応答にQuattスケールのスコアを割り当てるよう依頼する一般的な実践について検討する。次に、内部モデル信号からスカラー評価を導出する潜在裁判官を提案し、評価する。ペアとシングルレーティングのベンチマークの幅広いスイートの中で、潜在メソッドは標準のプロンプトにマッチするか、超えている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:15:52 GMT)
CEDex: Cross-Embodiment Dexterous Grasp Generation at Scale from Human-like Contact Representations [53.4]
クロス・エボディメント・デキスタラス・グリップ合成(Cross-Embodiment dexterous grasp synthesis)とは、様々なロボットハンドのグリップを適応的に生成し、最適化することである。そこで我々は,CEDexを提案する。これまでで最大のクロス・エボディメント・グラウンド・データセットを構築し、合計20万のグリップを持つ4つのタイプにまたがる500万のオブジェクトからなる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:08:04 GMT)
DAM: Dual Active Learning with Multimodal Foundation Model for Source-Free Domain Adaptation [53.3]
ソースフリーアクティブドメイン適応(SFADA)は、アクティブラーニングによって選択された限られた手動ラベルを用いて、ソースモデルから未ラベルのターゲットドメインへの知識伝達を強化する。マルチモーダル・ファンデーション・モデルを用いたデュアルアクティブ・ラーニング(DAM)を提案する。大規模な実験では、DAMは既存のメソッドを一貫して上回り、複数のSFADAベンチマークとアクティブな学習戦略で新しい最先端の手法を設定できる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:06:56 GMT)
End-to-End On-Device Quantization-Aware Training for LLMs at Inference Cost [53.3]
量子化対応トレーニング(QAT)は、より原則化されたソリューションを提供するが、バックプロパゲーションに依存しているため、メモリコストは禁じられている。重み付けとアクティベーション量子化の両方をサポートするゼロオーダー最適化ベースのQATフレームワークであるZeroQATを提案する。実験の結果、ZeroQATはPTQとQATのベースラインを一貫して上回り、メモリは大幅に削減された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:45:41 GMT)
Towards Safe Reasoning in Large Reasoning Models via Corrective Intervention [53.3]
既存の手法は、安全推論の独特な重要性を軽視し、信頼性を損なうとともに、悪質なユーザに対して安全でない推論がアクセス可能で、悪質なユーザによって悪用された場合、アプリケーションに潜在的なリスクを生じさせることを示す。我々は、安全トリガー付きコンプライアンスステップを代入し、強い信号による優先学習のためのペアを構築することで、安全推論を強制するアライメント手法であるIntervened Preference Optimization (IPO)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:41:09 GMT)
Pretraining Large Language Models with NVFP4 [53.2]
我々は,NVFP4フォーマットを用いた大規模言語モデル(LLM)の安定かつ高精度な学習手法を提案する。本手法は,前方と後方の両方で一貫した表現のための2次元量子化方式を統合する。以上の結果から,NVFP4をベースとしたプレトレーニング技術を用いてトレーニングしたモデルは,FP8ベースラインに匹敵するトレーニング損失とダウンストリームタスクアキュラシーを達成できることが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:53:17 GMT)
IPBench: Benchmarking the Knowledge of Large Language Models in Intellectual Property [53.2]
IPBenchはIPタスクの最初の包括的な分類であり、8つのIPメカニズムと20の異なるタスクを含む大規模なベンチマークである。一般的な目的からドメイン特化まで,チャット指向モデルや推論中心モデルを含む17の主要なLCMをベンチマークする。以上の結果から,トップパフォーマンスモデルであるDeepSeek-V3の精度は75.8%に過ぎず,改善の余地が大きかったことが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:57:32 GMT)
Generalist Scanner Meets Specialist Locator: A Synergistic Coarse-to-Fine Framework for Robust GUI Grounding [53.1]
GMS: Generalist Scanner Meets Specialist LocatorはGUIグラウンディングのパフォーマンスを効果的に改善する相乗的粗大なフレームワークです。このデザインは、人間がGUIグラウンドを実行する方法にインスパイアされ、目がインターフェイスをスキャンし、脳が解釈と局所化に焦点を当てる。 ScreenSpot-Proデータセットの実験結果によると、'Scanner'モデルと'Locator'モデルは、それぞれ独立して使用する場合、それぞれ2.0%$と3.7%$の精度しか達成していないが、GMSフレームワークへの統合により、全体的な精度は35.7%$である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:06:31 GMT)
S$^2$NN: Sub-bit Spiking Neural Networks [53.1]
スパイキングニューラルネットワーク(SNN)は、マシンインテリジェンスにエネルギー効率のよいパラダイムを提供する。最近のバイナリSNNの進歩にもかかわらず、大規模ネットワークではストレージと計算の要求が相当に大きい。 1ビット未満の重みを表すサブビットスパイキングニューラルネットワーク(S$2$NNs)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:17:44 GMT)
ATLAS: Constraints-Aware Multi-Agent Collaboration for Real-World Travel Planning [53.1]
ATLASは、現実世界の旅行計画タスクにおける制約意識の複雑な性質を扱うために設計された汎用マルチエージェントフレームワークである。我々はTravelPlannerベンチマークで最先端のパフォーマンスを示し、最終パスレートを23.3%から44.4%に改善した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:23:52 GMT)
VTPerception-R1: Enhancing Multimodal Reasoning via Explicit Visual and Textual Perceptual Grounding [53.0]
MLLM(Multimodal large language model)は、しばしば知覚的証拠の根拠となる推論に苦しむ。本稿では,4つのマルチモーダル・ベンチマークと2つのMLLMの知覚戦略,暗黙的,視覚的,テキスト的,系統的な研究を行う。本稿では,認識を推論から切り離す2段階統合フレームワークであるVTPerception-R1を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:40:34 GMT)
One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning [53.0]
本稿では,タスク固有戦略と共有プロンプト戦略の両方の利点を統合する新しいフレームワークであるSMoPEを提案する。 SMoPEはタスク固有のプロンプトメソッドを一貫して上回り、最先端のアプローチと競合する性能を達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:54:58 GMT)
Intra-request branch orchestration for efficient LLM reasoning [52.7]
大規模言語モデル(LLM)は、複雑なタスクの正確性を改善するために、推論時推論アルゴリズムにますます依存している。それまでの作業は、トークンの使用を減らすことを中心に、多くの場合、正確さを犠牲にしつつ、他のレイテンシ要因を見越すことに重点を置いていた。本稿では,LLMサービスシステムであるDUCHESSについて,予測によって導かれるリクエスト内ブランチオーケストレーションにより,精度を犠牲にすることなく,コストとレイテンシを低減できるシステムを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:52:08 GMT)
Causal Attention with Lookahead Keys [52.6]
標準的な因果的注意では、各トークンのクエリ、キー、値(QKV)は静的であり、先行するコンテキストのみをエンコードする。本研究では,Lookahead kEys (CASTLE) を用いたCAuSal aTtentionを導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:24:02 GMT)
Sotopia-RL: Reward Design for Social Intelligence [52.6]
強化学習(Reinforcement Learning, RL)は、社会的に知的なエージェントの訓練に適している。社会的相互作用には、RLトレーニングの障壁となる2つの重要な特徴がある。粗いエピソードレベルのフィードバックを発話レベルの多次元報酬に緩和する新しいフレームワークであるSotopia-RLを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:05:05 GMT)
FMIP: Joint Continuous-Integer Flow For Mixed-Integer Linear Programming [52.5]
Mixed-Integer Linear Programming (MILP)は、複雑な意思決定問題の基本的なツールである。混合整数線形計画法(FMIP)のための連立連続整数フローを提案する。これはMILPソリューションにおける整数変数と連続変数の共分散をモデル化する最初の生成フレームワークである。 FMIPは任意のバックボーンネットワークや様々なダウンストリームソルバと完全に互換性があり、現実世界のMILPアプリケーションにも適している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:41:12 GMT)
DyMoDreamer: World Modeling with Dynamic Modulation [52.3]
深層強化学習(DRL)における重要なボトルネックはサンプル非効率である。動的変調機構を組み込んだ新しいアルゴリズムDyMoDreamerを導入し,動的特徴抽出の改善と時間情報の充実を図る。実験によると、DyMoDreamer は Atari 100$k ベンチマークに新しい最先端のスコアをセットし、平均156.6$% の人間正規化スコアを設定できる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:54:42 GMT)
From Score Distributions to Balance: Plug-and-Play Mixture-of-Experts Routing [52.0]
Mixture-of-Experts (MoE)モデルは、各トークンを専門家のサブセットにルーティングすることで、パラメータキャパシティをスケールすることができる。条件付きルーティングは、推論メモリの負荷をシフトし、デバイスごとに専門家の数を制限する。本稿では,精度を保ちながら負荷のバランスをとるプラグイン・アンド・プレイ型推論時ルーティングアルゴリズムLASERを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:29:17 GMT)
RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs [51.9]
本稿では、軽量で解釈可能でスケーラブルなルーティングフレームワークRADAR(Reasoning-Ability and Difficulty-Aware Routing)を提案する。心理測定にインスパイアされたRADARは、さまざまな予算を持つモデル応答から異なるクエリへのアイテム応答モデルを学ぶ。我々は8つの広く使われている推論ベンチマークについて広範な実験を行い、最先端のルーティング手法と比較してRADARの優れた性能を実証した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:33:44 GMT)
On the Shape of Latent Variables in a Denoising VAE-MoG: A Posterior Sampling-Based Study [51.6]
ガウス前駆体 (VAE-MoG) を用いた変分オートエンコーダの潜時空間を探索する。モデルが基盤構造をどれだけうまく捉えているかを評価するために、ハミルトンモンテカルロ (HMC) を用いて、クリーンな入力で条件付けられた後続サンプルを描画し、ノイズの多いデータからエンコーダの出力と比較する。モデルは正確に信号を再構成するが、統計的比較により、潜在空間における明らかなミスマッチが明らかになる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:33:09 GMT)
Agentic Services Computing [51.5]
Agentic Service Computingは、サービスをインテリジェントで自己適応的で社会的に組み込まれたエンティティとして再定義する新しいパラダイムである。この調査では、設計、デプロイ、運用、進化の4つのコアフェーズを中心に構成された、ASCのライフサイクル駆動フレームワークを紹介します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:29:18 GMT)
Evaluating Spatiotemporal Consistency in Automatically Generated Sewing Instructions [51.4]
本稿では,縫製指示の音質を評価するための指標を提案する。提案手法は,手動によるアノテートエラー数と人間の品質評価との相関関係が良好であることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:46:27 GMT)
ArtifactsBench: Bridging the Visual-Interactive Gap in LLM Code Generation Evaluation [51.3]
ArtifactsBenchは自動ビジュアルコード生成評価のためのフレームワークである。我々のフレームワークは、生成した各アーティファクトをレンダリングし、時間的スクリーンショットを通してその動的な振る舞いをキャプチャする。我々は1,825の多様なタスクの新しいベンチマークを構築し、30以上の主要な大規模言語モデルを評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:55:28 GMT)
Exploring Reprensentation Invariance in Finetuning [51.2]
大規模自然画像に事前訓練された基礎モデルは、様々なクロスドメインの低リソースダウンストリームタスクに広く適応している。我々は、事前訓練された表現の利点を犠牲にすることなく、このようなタスクを効果的に適用できると主張している。我々は、事前訓練されたモデルと微調整されたモデルとの表現類似性を最大化する正規化であるtextitRepresentation Invariance FineTuning (RIFT) を導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:15:01 GMT)
Wavelet-Induced Rotary Encodings: RoPE Meets Graphs [51.1]
WIREはRotary Position sをグラフ構造化データに拡張する。我々は、WIRE が RoPE よりも一般的であることを示し、グリッドグラフの特別な場合において後者を復元する。 WIREは、様々な合成および実世界のアルゴリズムタスクでテストする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:41:25 GMT)
The Quest for the Right Mediator: Surveying Mechanistic Interpretability Through the Lens of Causal Mediation Analysis [51.0]
本稿では,因果媒介分析に基づく解釈可能性研究の視点を提案する。本稿では, 原因単位(メディエーター)の種類に応じて分類された解釈可能性の歴史と現状について述べる。我々は,各メディエータの長所と短所について論じ,特定の種類のメディエータや検索手法が最適であるかどうかについての洞察を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:25:09 GMT)
Proxy-GS: Efficient 3D Gaussian Splatting via Proxy Mesh [51.0]
3Dガウススプラッティングは、レンダリングを実現するための効率的なアプローチとして登場した。近年の変種は、視覚的忠実度をさらに向上するが、レンダリング中にかなりのデコードオーバーヘッドをもたらす。コストを軽減するため、いくつかのプルーニング戦略とレベル・オブ・ディーテール(LOD)技術が導入されている。本稿では,プロキシを利用した新しいパイプラインであるProxy-GSを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:10:07 GMT)
Certified Neural Approximations of Nonlinear Dynamics [51.0]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:56:28 GMT)
Discovering "Words" in Music: Unsupervised Learning of Compositional Sparse Code for Symbolic Music [50.9]
本稿では,記号的音楽データから「音楽単語」と呼ばれる繰り返しパターンを識別する教師なし機械学習アルゴリズムを提案する。本稿では,音楽単語発見の課題を統計的最適化問題として定式化し,二段階予測最大化(EM)に基づく学習フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:10:57 GMT)
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [50.7]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:38:59 GMT)
Understanding the Dilemma of Unlearning for Large Language Models [50.5]
Unlearningは、大きな言語モデル(LLM)から特定の知識を取り除こうとしている。提案するunPactは,帰納的帰属とコントリビューショントラッキングによるアンラーニングのための解釈可能なフレームワークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:15:19 GMT)
FreeAction: Training-Free Techniques for Enhanced Fidelity of Trajectory-to-Video Generation [50.4]
本稿では,ロボットビデオ生成における明示的な動作パラメータを完全に活用する2つのトレーニング不要な推論時間手法を提案する。第一に、アクションスケールの分類器フリーガイダンスは、動作の大きさに比例して誘導強度を動的に調整し、運動強度に対する制御性を高める。第二に、アクションスケールノイズトランケーションは、初期サンプルノイズの分布を調整し、所望の運動力学とよりよく一致させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:30:40 GMT)
VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning [50.3]
本稿では,RFT(Reinforcement Fine-temporalning)による映像知覚の向上を目的とする。我々は,チャット機能を犠牲にすることなく,最先端のリアルタイムタスクを実現する強力なビデオMLLMであるVideoChat-R1を開発した。ビデオMLLMのタスク強化におけるRTTの可能性について検討した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:09:23 GMT)
DiffuGuard: How Intrinsic Safety is Lost and Found in Diffusion Large Language Models [50.2]
我々は、ステップ内およびステップ間ダイナミクスという2つの異なる次元にわたるジェイルブレイク攻撃に対して、dLLM脆弱性の詳細な分析を行う。デュアルステージアプローチによる脆弱性に対処する,トレーニング不要な防御フレームワークであるDiffuGuardを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:17:10 GMT)
Plan before Solving: Problem-Aware Strategy Routing for Mathematical Reasoning with LLMs [50.0]
既存の手法は通常、数学的推論を行うためにLLM(Large Language Models)をガイドするための固定戦略を利用する。分析の結果,単一戦略は問題固有の要件に適応できず,有効性と効率性のトレードオフを見落としていることが明らかとなった。本稿では,PRISM(Planning and Routing through Instance-Specific Modeling)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:22:41 GMT)
MCPDepth: Omnidirectional Depth Estimation via Stereo Matching from Multi-Cylindrical Panoramas [49.9]
マルチシリンダパノラマ深さ推定(MCPDepth)を導入する。 MCPDepthは、全方位深度推定を強化するために設計された2段階のフレームワークである。本手法は,屋外データセットのDeep360では平均絶対誤差(MAE)が18.8%,実データセットの3D60では19.9%向上する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:37:27 GMT)
VITA: Zero-Shot Value Functions via Test-Time Adaptation of Vision-Language Models [49.8]
VITAはゼロショット値関数学習法であり、テスト時間適応によって両方の能力を増強する。オフライン強化学習において,VITAのゼロショット値推定が報酬形成に有効であることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:07:30 GMT)
From Static to Dynamic: Adaptive Monte Carlo Search for Mathematical Process Supervision [49.6]
既存手法は, 定予算サンプリング戦略に基づいて, 推論ステップの質を推定する。本稿では,データ生成を静的から適応に変換するフレームワークであるAdaptive Monte Carlo Search (AMCS)を提案する。 AMCSは、より多くのサンプルを不確実な推論ステップに割り当てることによって、予測を適応的に洗練し、予測しやすくする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:52:35 GMT)
VT-FSL: Bridging Vision and Text with LLMs for Few-Shot Learning [49.3]
少数のラベル付きサポートサンプルから新しい概念を認識することを目的としている。近年の研究では、追加の意味情報を組み込んだり、複雑な意味融合モジュールを設計することでサポート機能を強化している。本稿では,Few-Shot Learningのための大規模言語モデルを用いた視覚とテキストをブリッジする新しいフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:52:47 GMT)
DC-Gen: Post-Training Diffusion Acceleration with Deeply Compressed Latent Space [49.3]
既存のテキストと画像の拡散モデルは高品質な画像を生成するのに優れていますが、高解像度にスケールすると大きな効率上の課題に直面します。本稿では、深く圧縮された潜在空間を活用することで、テキストから画像への拡散を加速するフレームワークであるDC-Genを紹介する。具体的には、DC-Gen-FLUXはNVIDIA H100 GPU上で4K画像生成のレイテンシを53倍削減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:25 GMT)
CDT: A Comprehensive Capability Framework for Large Language Models Across Cognition, Domain, and Task [49.3]
LLM(Large Language Models)の最近の進歩は、その能力を大幅に強化している。既存のベンチマークでは、LLM能力を評価するための総合的なフレームワークが欠如しているため、孤立した能力に重点を置いていることが多い。本稿では,3次元にまたがるモデルの性能を包括的に測定するコグニション・ドメイン・タスク(CDT)フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:10:29 GMT)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning [49.2]
二段階強化学習(BRL)は、生成モデルを調整するための強力なフレームワークとして登場した。連続状態-作用複雑性において$mathcalO(epsilon)$の最初のサンプルを示す。我々の分析は、既存の$mathcalO(epsilon)$のバウンダリで、複雑さを改善します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:26:00 GMT)
FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.2]
本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:23:44 GMT)
SpinBench: Perspective and Rotation as a Lens on Spatial Reasoning in VLMs [49.1]
視覚言語モデル(VLM)における空間推論評価のための診断ベンチマークであるSpinBenchを提案する。パースペクティブ・テイクは複数の認知機能を必要とするため、SpinBenchは一連のきめ細かい診断カテゴリを導入している。結果は、強い自我中心バイアス、低い自我的理解、対称的・統語的改革の下での不整合など、体系的な弱点を明らかにしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:48:16 GMT)
IRIS: Intrinsic Reward Image Synthesis [49.1]
自己回帰的T2Iモデルが外部報酬やラベル付きデータに頼ることなく内部信号からどのように学習できるかを示す。自己回帰型T2Iモデルを改善するためのフレームワークとして,本質的な報酬のみを用いて強化学習を行うIRISを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:38:25 GMT)
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.1]
ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:21:41 GMT)
RIFLE: Removal of Image Flicker-Banding via Latent Diffusion Enhancement [49.0]
FB(Flicker-banding)は、カメラのローリングシャッター読み出しとディスプレイの明るさ変調との間の時間的エイリアスから生じる明るさ%u2013darkストライプを交互に変化させる。我々は、FB除去を専用修復タスクとして定式化し、遅延拡散拡張(RIFLE)による画像フリッカバンディングの除去を導入する。我々の知る限りでは、FBのシミュレーションと除去の研究は初めてである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:53:13 GMT)
Deepfake Detection that Generalizes Across Benchmarks [48.9]
ディープフェイク検出器の非表示操作技術への一般化は、実用的展開の課題である。この研究は、基礎となる事前学習された視覚エンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:25:32 GMT)
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution [48.8]
Flash-Searcherは、新しい並列エージェント推論フレームワークである。複雑なタスクを明示的な依存関係でサブタスクに分解し、独立した推論パスの同時実行を可能にする。 BrowseCompでは67.7%の精度で、xbench-DeepSearchでは83%、エージェントの実行手順は現在のフレームワークに比べて最大35%削減されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:39:30 GMT)
GLEAM: Learning Generalizable Exploration Policy for Active Mapping in Complex 3D Indoor Scenes [48.7]
複雑な未知環境における一般化可能なアクティブマッピングは、移動ロボットにとって重要な課題である。我々は、アクティブマッピングのための統一的な一般化可能な探索ポリシーであるGLEAMを紹介する。最先端の手法を大きく上回り、66.50%のカバレッジ(+9.49%)を効率の良い軌道で達成し、128の複雑なシーンでのマッピング精度を改善した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:57:24 GMT)
Recent Advances in Large Langauge Model Benchmarks against Data Contamination: From Static to Dynamic Evaluation [48.4]
データ汚染リスクの低減を目的とした静的・動的ベンチマーク手法の詳細な分析を行う。本稿では、動的ベンチマークのための最適設計原則のシリーズを提案し、既存の動的ベンチマークの限界を解析する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:26:23 GMT)
NeRV-Diffusion: Diffuse Implicit Neural Representations for Video Synthesis [48.4]
NeRV-Diffusionは暗黙の潜伏ビデオ拡散モデルであり、ニューラルネットワークの重みを生成することによってビデオを合成する。フレームワイドな特徴マップにビデオをエンコードする従来のビデオトークンとは対照的に、NEV-Diffusionは圧縮して、統一されたニューラルネットワークとしてビデオを生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:53:08 GMT)
LLM DNA: Tracing Model Evolution via Functional Representations [48.3]
生物DNAを用いてLLMDNAを機能行動の低次元バイリプシッツ表現として定義する。大規模言語モデルからDNAを抽出するための、汎用的でスケーラブルで、トレーニング不要なパイプラインを導出する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:09:57 GMT)
NeMo: Needle in a Montage for Video-Language Understanding [48.2]
ビデオ大言語モデル(VideoLLM)の最近の進歩は、ビデオ言語理解における複雑な時間的推論のための新しい評価プロトコルとベンチマークを求めている。我々は,ビデオLLMの批判的推論能力を評価するために,NeMo(Needle in a Montage)という新しいタスクを導入した。タスクを中心としたビデオ言語ベンチマークであるNeMoBenchを紹介します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:16:05 GMT)
Medical Red Teaming Protocol of Language Models: On the Importance of User Perspectives in Healthcare Settings [48.1]
本稿では,患者と臨床医の両方の視点で医療領域に適した安全評価プロトコルを提案する。医療用LLMの安全性評価基準を3つの異なる視点を取り入れたレッドチームで定義した最初の研究である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:53:08 GMT)
SIRI: Scaling Iterative Reinforcement Learning with Interleaved Compression [48.0]
大規模共振モデル(LRM)のための簡易かつ効果的なRLアプローチであるInterleaved Compressionを用いたSIRI(Scaling Iterative Reinforcement Learning)を導入する。このトレードオフは、推理予算の圧縮と拡大を反復的に交互に交互に行う訓練体制によって克服できることを示す。また, 各圧縮膨張サイクルの後に, 出力長が減少しても, モデルの性能が向上することがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:08 GMT)
MCIP: Protecting MCP Safety via Model Contextual Integrity Protocol [48.0]
本稿では,モデルコンテキストプロトコルの安全性を高めるための新しいフレームワークを提案する。 MAESTRO フレームワークをベースとして,まず MCP に欠落する安全機構を解析する。次に、MPPシナリオで観察されるさまざまな安全でない振る舞いをキャプチャする、きめ細かい分類法を開発する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:26:17 GMT)
Improved Sample Complexity For Diffusion Model Training Without Empirical Risk Minimizer Access [48.0]
拡散モデルを解析し、$widetildemathcalO(epsilon-4)$に束縛された最先端のサンプル複雑性を提供する。スコア推定誤差の統計的および最適化成分への構造化分解は、拡散モデルを効率的に訓練する方法に関する重要な洞察を与える。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:21:38 GMT)
GLANCE: Graph Logic Attention Network with Cluster Enhancement for Heterophilous Graph Representation Learning [47.7]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習する上で大きな成功を収めている。本稿では,論理誘導推論,動的グラフ改善,適応クラスタリングを統合し,グラフ表現学習を強化する新しいフレームワークであるGLANCEを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:26:08 GMT)
PartSAM: A Scalable Promptable Part Segmentation Model Trained on Native 3D Data [47.6]
大規模3次元データに基づいてトレーニングされた最初のプロンプト可能なパートセグメンテーションモデルであるPartSAMを提案する。 PartSAMはエンコーダ・デコーダアーキテクチャを採用しており、三面体をベースとしたデュアルブランチ・エンコーダが空間的に構造化されたトークンを生成する。大規模監視を実現するために,500万以上の3次元形状部品対をキュレートしたループ型アノテーションパイプラインを導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:34:25 GMT)
Random Policy Valuation is Enough for LLM Reasoning with Verifiable Rewards [47.6]
逆推論のためのランダムポリシー評価(ROVER)について紹介する。 ROVERは、一様政体Q値上のソフトマックスから作用をサンプリングする最小限だが高効率なRL法である。 textbfquality(textbf+8.2 on pass@1, textbf+16.8 on pass@256)と textbfdiversity(textbf+17.6%)の両方で優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:09:07 GMT)
Towards Evaluting Fake Reasoning Bias in Language Models [47.5]
論理に欠陥がある場合でも、モデルが推論の表面構造を好むことを示す。我々は、Fake Reasoning Bias(FRB)を体系的に調査するベンチマークTheATERを紹介する。我々は、主観的DPOと実データの両方で17の高度な大言語モデル(LRM)を評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:56:13 GMT)
SVGThinker: Instruction-Aligned and Reasoning-Driven Text-to-SVG Generation [47.4]
本稿では,SVGコードの生成を可視化プロセスと整合させる推論駆動型フレームワークであるSVGThinkerを紹介する。パイプラインはまず各プリミティブをシーケンスでレンダリングし、マルチモーダルモデルを使用して画像とコードを注釈付けします。最先端のベースラインに対する実験では、SVGThinkerはより安定し、編集可能で、高品質なSVGを生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:25:00 GMT)
Beyond Classification: Towards Speech Emotion Reasoning with Multitask AudioLLMs [47.3]
我々は,意味的に整合したエビデンスに基づく説明を行うことで,感情認識を強化する戦略を開発する。本稿では、推論強化データ監視、デュアルエンコーダアーキテクチャ、タスク代替トレーニングを組み合わせた統合フレームワークを提案する。 IEMOCAPとMELDの実験により、我々のアプローチは感情予測精度を向上するだけでなく、生成した応答のコヒーレンスと明解なグラウンド化も向上することが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:56:15 GMT)
A Large Scale Analysis of Gender Biases in Text-to-Image Generative Models [47.2]
本稿では,テキスト・トゥ・イメージ(T2I)モデルにおけるジェンダーバイアスに関する大規模研究を行い,日常の状況に着目した。我々は3,217のジェンダーニュートラルプロンプトのデータセットを作成し、5つの主要なT2Iモデルからのプロンプト毎に5つのプロンプトに対して200の画像を生成する。生成した画像中の知覚された人物の性別を自動的に検出し、性別の異なる人物や複数の人物の像をフィルタリングする。分析の結果、T2Iモデルは伝統的なジェンダーの役割を強化し、家庭の役割における一般的なジェンダーステレオタイプを反映していることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:02 GMT)
GeoVLM-R1: Reinforcement Fine-Tuning for Improved Remote Sensing Reasoning [47.1]
多様な地球観測タスクへの推論に基づくRLモデルの効果的な適応を可能にするために,タスク意識報酬を取り入れた新しいポストトレーニングフレームワークを提案する。このトレーニング戦略は、リモートセンシング画像の推論機能を強化し、最適化を安定化し、堅牢性を向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:48:54 GMT)
Chance-constrained Flow Matching for High-Fidelity Constraint-aware Generation [46.9]
Chance-Constrained Flow Matchingは、最適化をサンプリングプロセスに統合し、ハード制約の効果的な適用を可能にする。実験により、CCFMは複雑な物理系のモデリングにおいて、現在の最先端の制約付き生成モデルよりも優れていることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:56:52 GMT)
AlignX: Advancing Multilingual Large Language Models with Multilingual Representation Alignment [46.9]
多言語大言語モデル(LLM)には、印象的な多言語理解と生成能力がある。 LLMのパフォーマンスと言語間アライメントは、非支配言語ではしばしば遅れる。 2段階の表現レベルフレームワークである多言語のパフォーマンスギャップを橋渡しするために,AlignXを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:37:46 GMT)
NeoWorld: Neural Simulation of Explorable Virtual Worlds via Progressive 3D Unfolding [46.8]
単一入力画像からインタラクティブな3D仮想世界を生成するためのフレームワークであるNeoWorldを紹介する。 SF小説『Simulacron-3』(1964年)のオンデマンド・ワールドビルディングの概念に触発され、我々のシステムは広大な環境を構築する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:24:28 GMT)
On the Self-awareness of Large Reasoning Models' Capability Boundaries [46.7]
本稿では,Large Reasoning Models (LRM) が機能境界の自己認識性を持っているかを検討する。ブラックボックスモデルでは、推論式は境界信号を明らかにし、解決不可能な問題に対する信頼軌道は加速するが、解決不可能な問題に対する収束不確実軌道は加速する。ホワイトボックスモデルでは,最後の入力トークンの隠れ状態が境界情報を符号化し,解答可能かつ解答不能な問題を推論開始前に線形分離可能であることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:40:47 GMT)
Signal in the Noise: Polysemantic Interference Transfers and Predicts Cross-Model Influence [46.5]
多意味性は言語モデルに広く浸透しており、解釈とモデル行動制御の大きな課題である。 2つの小さなモデルの多意味的トポロジをマッピングし、意味的に無関係だがモデル内の干渉を示す特徴対を同定する。我々は4つのloci(prompt, token, feature, neuron)に介入し、次のトーケン予測分布における変化を計測し、これらのモデルに体系的な脆弱性を露呈する多意味構造を明らかにする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:04:15 GMT)
Visual Planning: Let's Think Only with Images [46.5]
我々は、特に空間的情報や幾何学的情報を含むタスクにおいて、言語が推論において最も自然で効果的なモダリティであるとは限らないと論じる。そこで我々は,これらの「ビジョンファースト」タスクを純粋に視覚的に表現して計画できる新しいパラダイム「ビジュアルプランニング」を提案する。このパラダイムでは、計画は視覚領域におけるステップバイステップの推論を符号化する一連の画像を通して実行される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:21:01 GMT)
A Survey on Stereotype Detection in Natural Language Processing [46.3]
ステレオタイプは社会的知覚に影響を与え、差別や暴力へとエスカレートする。この研究は、心理学、社会学、哲学からの定義を分析し、既存の研究を調査する。発見は、偏見のエスカレーションやヘイトスピーチの台頭を防ぐための早期監視ツールとしてステレオタイプ検出を強調している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:08:35 GMT)
SemGuard: Real-Time Semantic Evaluator for Correcting LLM-Generated Code [46.2]
ポストホック修復パイプラインは、実行後にのみそのような障害を検出する。本稿では,実時間で行レベルのセマンティック監視を行うセマンティック評価フレームワークSemGuardを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:21:32 GMT)
UniPruning: Unifying Local Metric and Global Feedback for Scalable Sparse LLMs [46.1]
大規模言語モデル (LLM) は様々なタスクにまたがって高いパフォーマンスを達成するが、計算とメモリのコストは禁じられている。 We present UniPruning, a unified post-training pruning framework that with the speed of local saliency metrics and the stability of global coordinate。 UniPruningは、競争力または優れたパープレクティリティとゼロショットの精度を一貫して提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:38:28 GMT)
TDRM: Smooth Reward Models with Temporal Difference for LLM RL and Inference [46.0]
我々は、よりスムーズで信頼性の高い報酬モデルを学ぶ方法であるTDRMを紹介する。実験の結果、TD訓練プロセス報酬モデル(PRM)はBest-of-N(最大6.6%)とツリーサーチ(最大23.7%)でのパフォーマンスを向上させることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:46:05 GMT)
General detectability measure [45.9]
資源のない状態から資源状態を排除することは、量子情報の基本課題である。我々は、与えられた$n$-tensorの積状態を検出するために、故障確率の最適指数減衰率を導出した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:30:00 GMT)
Retrieval-augmented GUI Agents with Generative Guidelines [45.8]
本稿では,推論時にWebチュートリアルを利用する軽量なVLMであるRAG-GUIを提案する。 RAG-GUIは、まず教師付き微調整(SFT)によりウォームスタートし、さらに自己誘導型リジェクションサンプリング微調整(RSF)により改良される。一貫してベースラインエージェントを上回り、2つのモデルサイズで他の推論ベースラインを2.6%から13.3%上回る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:04:20 GMT)
Not All Models Suit Expert Offloading: On Local Routing Consistency of Mixture-of-Expert Models [45.7]
Mixture-of-Experts (MoE) は、推論中に専門家がわずかに活性化された大きな言語モデルの効率的なスケーリングを可能にする。多くのシステムでは,専門家のサブセットを高速メモリにキャッシュする*専門家オフロード*を導入している。各層にMoEを適用し、共有専門家を使用しないモデルは、最も高い局所的なルーティング一貫性を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:15:49 GMT)
Struct2D: A Perception-Guided Framework for Spatial Reasoning in Large Multimodal Models [45.7]
Struct2Dは、バードアイビュー(BEV)イメージとオブジェクトマークとオブジェクト中心のメタデータを組み合わせた知覚誘導プロンプトフレームワークである。その結果,LMMは2次元入力を構造化した場合,驚くほど強い空間推論能力を示すことがわかった。オープンソースのLMM(Qwen2.5VL)をStruct2D-Set上で微調整し、複数のベンチマークで競合性能を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:39:08 GMT)
OpenGPT-4o-Image: A Comprehensive Dataset for Advanced Image Generation and Editing [45.5]
本稿では,新しい手法を用いて構築した大規模データセットOpenGPT-4o-Imageを紹介する。制御された多様性を持つ80kの高品質な命令イメージペアを生成し、11の主要ドメインと51のサブタスクをカバーする。私たちの研究は、マルチモーダルAI能力を前進させる上で、システマティックなデータ構築が鍵であることを実証しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:11:09 GMT)
MobileIPL: Enhancing Mobile Agents Thinking Process via Iterative Preference Learning [45.5]
The Chain of Action-Planning Thoughts (CoaT) paradigm has been shown to improve the reasoning performance of VLM-based mobile agent in GUI task。対話型サンプリングによりCoaTツリーを構築し,ルールベース報酬を用いて葉ノードをスコアし,フィードバックをバックプロパゲートして思考レベル直接選好最適化(T-DPO)のペアを導出する反復選好学習(IPL)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:49:00 GMT)
MASLegalBench: Benchmarking Multi-Agent Systems in Deductive Legal Reasoning [45.4]
大規模言語モデル(LLM)の顕著な機能を活用するマルチエージェントシステム(MAS)は、複雑なタスクに対処する大きな可能性を示している。従来の研究でLLMエージェントの法的なベンチマークが開発されたが、MASの独特な利点を考えるために特別に設計されたものはない。提案するMASLegalBenchは,MASに適した法的なベンチマークであり,帰納的推論手法を用いて設計されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:24:40 GMT)
The Era of Real-World Human Interaction: RL from User Conversations [45.2]
In-the-wild user conversation から直接学習するパラダイムである Reinforcement Learning from Human Interaction (RLHI) を紹介する。本研究では,(1)ユーザの自然言語フォローアップ応答に基づいて不満足なモデル出力を更新するユーザガイドリライトを用いたRLHI,(2)ユーザベースリワードを用いたRLHIの2つの補完手法を開発する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:50:31 GMT)
Learning to Solve Optimization Problems Constrained with Partial Differential Equations [45.1]
部分方程式 (PDE) に制約のある最適化は、多くの科学的・工学的な領域で発生する。本稿では,動的予測器と最適化サロゲートを統合した学習ベースのフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:28:14 GMT)
DART: Differentiable Dynamic Adaptive Region Tokenizer for Vision Foundation Models [45.1]
DARTは、完全に微分可能な動的領域適応型トケナイザである。 DARTは学習可能な領域スコアと量子ベースのパーティショニングを使用して、さまざまなサイズのコンテンツ認識パッチを生成する。 DART-Smallは、DiT-Base86の性能とほぼ2倍の推論速度で一致している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:14:20 GMT)
AceSearcher: Bootstrapping Reasoning and Search for LLMs via Reinforced Self-Play [45.0]
AceSearcherは1つの大きな言語モデル(LLM)をトレーニングし、複雑なクエリを分解するデコンポスタと、検索したコンテキストを統合して回答生成するソルバという2つの役割を交互に行う。 10データセットにわたる3つの推論集約タスクの実験は、AceSearcherが最先端のベースラインを上回り、平均的な正確なマッチング改善を7.6%達成していることを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:14:30 GMT)
Foundation Models for Causal Inference via Prior-Data Fitted Networks [44.9]
CausalFMは、様々な因果推論設定でPFNベースの基礎モデルをトレーニングするためのフレームワークである。 PFNは、予め指定された事前分布から生成された合成データに基づいて事前訓練された変換器である。 CausalFMは,手前のタスクに特化して訓練されたベースラインと比較して,コンテクスト内学習性能の競争力が高いことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:58:45 GMT)
T-POP: Test-Time Personalization with Online Preference Feedback [44.8]
本稿では、テキスト生成中に収集したオンラインのペアワイズ嗜好フィードバックから学習することで、リアルタイムパーソナライズのための新しいパラダイムを提案する。 T-POPは、デュエルブレイトを活用することにより、ユーザの好みを探索し、学習した知識を利用してパーソナライズされたテキストを生成することで、効率的にバランスをとることができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:28:23 GMT)
Retro*: Optimizing LLMs for Reasoning-Intensive Document Retrieval [44.7]
Retro*は、推論集約的なドキュメント検索のための新しいアプローチである。本稿では,タスクとドキュメントの関係をモデルが推論できる,ルーブリックに基づく関連性スコアリング機構を提案する。実験の結果,Retro* は既存の文書検索手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:53:05 GMT)
Fast Feature Field ($\text{F}^3$): A Predictive Representation of Events [44.7]
本稿では,イベントベースカメラからのデータ表現を構築するための数学的議論とアルゴリズムを開発する。我々は、過去の出来事から将来の出来事を予測することでこの表現を学び、シーン構造と動き情報を保存することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:52:31 GMT)
Measurement-induced phase transition in interacting bosons from most likely quantum trajectory [44.6]
量子軌跡の確率分布からそのような軌跡を同定する方法を示す。ガウス理論の場合、この方法を正確に証明し、相互作用するSine-Gordonモデルに拡張する。このフレームワークではもはや正確ではないが、この手法は自己一貫性のある時間依存調和近似を通して力学を捉える。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:37:01 GMT)
$\mathbf{Li_2}$: A Framework on Dynamics of Feature Emergence and Delayed Generalization [44.6]
本稿では,複雑な構造化された入力に対して,どのような特徴が現れるのか,どのような条件でトレーニングから発生するのか,といった特徴を特徴付ける新しい枠組みを提案する。これらの局所オプティマ誘導特徴が一般化可能か,その表現力,および群演算タスクにおけるサンプルサイズの変化について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:29:44 GMT)
KnowGuard: Knowledge-Driven Abstention for Multi-Round Clinical Reasoning [44.5]
臨床実践では、患者情報が不十分な場合、医師は意思決定を控える。禁忌として知られるこの行動は、潜在的に有害な誤診を防ぐ重要な安全メカニズムである。臨床意思決定のための体系的な知識グラフ探索を統合する新しいパラダイムであるKnowGuardを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:03:01 GMT)
FedPOB: Sample-Efficient Federated Prompt Optimization via Bandits [44.4]
マルチアームバンディット(MAB)に基づく,サンプル効率の高いフェデレーションプロンプト最適化のための新しいフレームワークを提案する。 MABフレームワークは,(1)ブラックボックス最適化法,(2)事実上のサンプリング効率,(3)理論的に保証されたエージェントの利益と協調学習を可能にするため,この問題に特化している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:32:21 GMT)
DelRec: learning delays in recurrent spiking neural networks [44.4]
スパイキングエネルギーネットワーク(SNN)は、従来の実数値深層学習モデルに代わるバイオインスパイアされた代替品である。 SNNでは、各シナプスは重量だけでなく伝送遅延によっても特徴付けられる。繰り返しスパイキング層における軸索的遅延やシナプス的遅延をトレーニングする最初のSGLベースの手法である'DelRec'を紹介した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:38:57 GMT)
Rethinking Entropy Regularization in Large Reasoning Models [44.0]
検証可能な報酬(RLVR)による強化学習は、大きな推論モデル(LRM)の推論能力を高める上で大きな可能性を示している。エントロピー崩壊と早期収束という重大な問題に悩まされている。本稿では,SIREN(SelectIve entRopy rEgularizatioN)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:49:25 GMT)
Neural Catalog: Scaling Species Recognition with Catalog of Life-Augmented Generation [43.9]
現状のシステムでは, 何千もの候補種に対して, リアルなオープン語彙設定で30%以上の性能低下を経験している。本稿では,構造化百科事典の知識と認識を結びつける新しいフレームワークであるVisual Re-level Retrieval-Augmented Generation (VR-RAG)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:26:12 GMT)
RL in the Wild: Characterizing RLVR Training in LLM Deployment [43.8]
Reinforcement Learning with Verifiable Rewards (RLVR)は、その推論と理解能力を高めるために、ここ数ヶ月で急増している。しかし、その複雑なデータフローと多様なタスクは、RLトレーニングシステムに重大な課題をもたらす。システムの観点からは、RLVRの理解は限られている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:09:27 GMT)
Semi-structured LLM Reasoners Can Be Rigorously Audited [43.7]
半構造化推論モデル (SSRM) を導入し, 推論の半構造化表現を生成する訓練を行った。 SSRMは、実行不可能なPythonの構文で推論トレースを生成し、各推論ステップを指定し、入力と出力をマークする。これらの手法はすべて、予測可能な推論エラーを効果的にフラグできることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:21:56 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [43.3]
人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。 LLMは、さまざまな機械学習評価シナリオのスコア付け、ランキング、選択を行うために活用される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:52:21 GMT)
Evaluating and Steering Modality Preferences in Multimodal Large Language Model [42.8]
マルチモーダル大言語モデル(MLLM)は、マルチモーダルコンテキストを持つ複雑なタスクにおいて顕著なパフォーマンスを実現している。実験対象のMLLMは, すべて明らかなモダリティバイアスを示し, 外部介入の影響を受けやすいことがわかった。本稿では,モダリティの選好を明示的に制御するための表現工学に基づく探索・操舵手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:28:30 GMT)
Scaling Behaviors of LLM Reinforcement Learning Post-Training: An Empirical Study in Mathematical Reasoning [42.8]
我々は、モデルスケール、データボリューム、計算予算がどのように相互作用し、パフォーマンスを形作るかを研究する。より少ないステップでトレーニングされたより大きなモデルは、より多くのステップでトレーニングされた小さなモデルよりも一貫して優れています。データ制約されたレシエーションでは、高品質なデータの繰り返し再利用は極めて効果的である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:10:35 GMT)
Wavelet-Assisted Mamba for Satellite-Derived Sea Surface Temperature Super-Resolution [42.4]
衛星海面温度(SST)データに対するウェーブレット支援マンバ超解法(WMSR)フレームワークを提案する。 WMSRには、低周波状態空間モジュール(LFSSM)と高周波拡張モジュール(HFEM)の2つの重要なコンポーネントが含まれている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:33:07 GMT)
GLASS Flows: Transition Sampling for Alignment of Flow and Diffusion Models [42.2]
GLASS Flowsは「フローマッチングモデル」をシミュレートしてマルコフ遷移をサンプリングする新しいサンプリングパラダイムである。大規模テキスト・画像モデルでは,GLASSフローが進化と効率のトレードオフをなくすことが示されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:58:36 GMT)
Let Physics Guide Your Protein Flows: Topology-aware Unfolding and Generation [42.1]
拡散に基づく生成モデルはタンパク質の設計に革命をもたらし、新しいタンパク質の創出を可能にした。タンパク質を二次構造に展開する物理的動機付けのない非線形ノイズ発生過程を古典物理学に基礎として導入する。次に、このプロセスとSE(3)上のフローマッチングパラダイムを統合し、高い忠実度を持つタンパク質のバックボーンの不変分布をモデル化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:31:22 GMT)
Quantum Dynamics with Time-Dependent Neural Quantum States [42.0]
本稿では,時間依存型ニューラル量子状態(NQS)シミュレーションの実証について述べる。 NQSは、ニューラルネットワークアーキテクチャによる波動関数のパラメータ化を利用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:50:02 GMT)
Vision-and-Language Navigation with Analogical Textual Descriptions in LLMs [42.0]
既存のVision-and-Language Navigation (VLN)エージェントは、画像をテキストシーン記述としてエンコードする。複数の視点からテキスト記述を組み込むことで,ナビゲーションエージェントの文脈理解を改善した。 R2Rデータセットに対する我々のアプローチの評価を行い、ナビゲーション性能を大幅に改善したことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:51:01 GMT)
Identifying Group Anchors in Real-World Group Interactions Under Label Scarcity [41.9]
グループ間相互作用は、例えば、共著者、電子メール通信、オンラインQ&Aなど、様々な現実世界の文脈で発生する。各グループには、しばしば重要なメンバーが存在し、その周りでグループが形成されている。このような個人をグループアンカーと呼び、それらを識別する問題について研究する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:41:40 GMT)
FlashI2V: Fourier-Guided Latent Shifting Prevents Conditional Image Leakage in Image-to-Video Generation [41.9]
I2V(Image-to-Video)生成では、入力画像を第1フレーム条件としてビデオを生成する。条件付き画像リークは、スローモーションや色の不整合などのパフォーマンス劣化問題を引き起こす。本稿では,Fourier-Guided Latent Shifting I2Vについて述べる。パラメータは1.3Bで、FlashI2VはVbench-I2Vで53.01のダイナミックスコアを獲得し、CogVideoX1.5-5B-I2VとWan2.1-I2V-14B-480Pを上回った。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:53 GMT)
Metamorphic Testing for Audio Content Moderation Software [41.6]
本稿では,音声コンテンツモデレーションソフトウェアのためのメタモルフィックテスティングフレームワークMTAMを提案する。本研究は2000の音声クリップのパイロット実験を行い,2つの摂動カテゴリ(音声特徴ベースとヒューリスティック摂動)にまたがる14の変成関係を定義した。 MTAMは、これらのメタモルフィックな関係を有毒なオーディオコンテンツに適用し、検出を回避しつつ有害なケースを発生させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:55:07 GMT)
Safety is Not Only About Refusal: Reasoning-Enhanced Fine-tuning for Interpretable LLM Safety [41.3]
大きな言語モデル(LLM)は、従来の安全アライメントの弱点を利用するジェイルブレイク攻撃に対して脆弱である。解釈可能なLLM安全性のための推論強化ファインタニング(Rational)を提案する。合理的列車は、応答前に明確な安全な推論を行うようにモデル化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:56:50 GMT)
UniVid: The Open-Source Unified Video Model [41.2]
MLLMと拡散デコーダを結合した統合アーキテクチャであるUniVidを,軽量なアダプタで実現し,理解と生成を両立させる。標準ベンチマークの実験では、VBench-Longの総スコアをEasyAnimateV5.1と比べて2.2%改善し、MSVD-QAとActivityNet-QAでは1.0%と3.3%の精度向上を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:31:36 GMT)
Scalable GANs with Transformers [41.1]
スケーラビリティはジェネレーティブモデリングの最近の進歩を駆り立ててきたが、その原理は相変わらず敵対的な学習のために探求されている。本稿では,GAN(Generative Adversarial Networks)のスケーラビリティを2つの設計選択により検討する。ネットワーク規模が拡大するにつれて、ジェネレータの初期レイヤの未利用や最適化の不安定性が問題となる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:36:15 GMT)
ReCon-GS: Continuum-Preserved Guassian Streaming for Fast and Compact Reconstruction of Dynamic Scenes [41.1]
ReCon-GSは、高忠実なオンライン動的シーン再構築とリアルタイムレンダリングを可能にするストレージ対応フレームワークである。本稿では,ReCon-GSがトレーニング効率を約15%向上し,FVV合成品質が向上することを示す。同等のレンダリング品質では、ReCon-GSは最先端の方法と比較して、メモリ要求を50%以上削減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:23:47 GMT)
Sparsity Forcing: Reinforcing Token Sparsity of MLLMs [40.9]
マルチモーダル大規模言語モデル(MLLM)におけるトークンの分散性を,単純なRLベースのポストトレーニングフレームワークであるtextitSparsity Forcing を用いて明示的に強化する。本手法では,複数ロールアウトを異なるトークン予算で実行し,効率(トーケン還元率)と性能(回答正当性)の両方を共同報酬として定式化することにより,効率・正確性トレードオフを探索する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:41:48 GMT)
Watermark under Fire: A Robustness Evaluation of LLM Watermarking [40.9]
WaterParkは10の最先端の透かしと12の代表的な攻撃を統合する統合プラットフォームである。我々は既存の透かしを総合的に評価し、様々な設計選択が攻撃の堅牢性に与える影響を明らかにする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:40:08 GMT)
DS-STAR: Data Science Agent via Iterative Planning and Verification [40.5]
DS-STARは,様々なデータフォーマットからコンテキストを自動探索し抽出する新しいデータサイエンスエージェントである。具体的には,(1)非構造化型を含む多種多様なデータ形式からコンテキストを自動的に探索・抽出するデータファイル解析モジュール,(2)LLMベースの審査員が各段階で解析計画の十分性を評価する検証ステップ,(3)単純で実行可能な計画から始まる逐次計画機構,(3)DS-STARの満足度が検証されるまでそのフィードバックに基づいて反復的に洗練する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:14:15 GMT)
MimicDreamer: Aligning Human and Robot Demonstrations for Scalable VLA Training [40.5]
低コストな人間によるデモンストレーションをロボットで使用可能な監視に変換するフレームワークであるMimicDreamerを提案する。視覚的アライメントのために,高忠実度ロボットデモビデオを生成するビデオ拡散モデルH2R Alignerを提案する。視点安定化のためにEgoStabilizerを提案する。動作アライメントのために,人間の手の動きをロボットフレームにマッピングし,制約付き逆運動学解法を適用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:03:33 GMT)
Quantum Zeno Effect in the Spatial Evolution of a Single Atom [40.4]
量子ゼノ効果(QZE)は、頻繁な測定が量子進化を抑制することを明らかにしている。我々は,光双極子トラップを用いて,自由空間における単一冷間原子の運動を研究する。本研究では,実空間におけるQZEの直接的実験実験を行い,原子運動の計測に基づく制御のための多目的フレームワークを構築した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:23:19 GMT)
MAS$^2$: Self-Generative, Self-Configuring, Self-Rectifying Multi-Agent Systems [40.4]
マルチエージェントシステムを自律的に設計するマルチエージェントシステムであるMAS$2$を紹介する。 MAS$2$は、最先端のMASに対して最大19.6%のパフォーマンス向上を達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:20:10 GMT)
AttentionViG: Cross-Attention-Based Dynamic Neighbor Aggregation in Vision GNNs [40.4]
Vision Graph Neural Networks (ViGs)は、画像認識タスクにおいて、CNNやVision Transformersに対して有望なパフォーマンスを示す。 ViGフレームワークの重要な部分は、ノード近傍の機能集約法である。本稿では,クエリプロジェクションをノードから,キープロジェクションを隣りのノードから,クロスアテンションに基づくアグリゲーション手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:47:48 GMT)
CLQ: Cross-Layer Guided Orthogonal-based Quantization for Diffusion Transformers [40.3]
トレーニング後の量子化(PTQ)は、メモリ消費を減らし、推論を高速化する。直交型直交量子化法であるCLQを提案する。我々は、画像生成モデルと映像生成モデルの両方でCLQを評価し、視覚的品質とメトリクスの無視できる劣化を伴って、モデルをW4A4に圧縮することに成功した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:06:42 GMT)
Latent Visual Reasoning [40.3]
視覚埋め込み空間に直接自己回帰推論を可能にする新しいパラダイムであるLatent Visual Reasoning(LVR)を紹介する。その結果,LVRは細粒度視認と知覚を著しく改善し,MMVPでは71.67%,Qwen2.5-VLでは66.67%であった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:52:01 GMT)
Beyond Static Retrieval: Opportunities and Pitfalls of Iterative Retrieval in GraphRAG [40.3]
グラフベースのRAG(GraphRAG)は、知識集約型質問応答において、大規模言語モデル(LLM)を改善するための強力なパラダイムである。反復検索は有望な代替手段として登場したが、GraphRAGにおけるその役割は未だよく分かっていない。本稿では,グラフベースのバックボーンと異なる戦略がどのように相互作用するかを解析し,グラフRAGにおける反復検索に関する最初の体系的研究について述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:38:28 GMT)
StorySage: Conversational Autobiography Writing Powered by a Multi-Agent Framework [40.2]
StorySageはユーザ主導のソフトウェアシステムで、多様なユーザのニーズを満たすように設計されている。本システムでは,ユーザの記憶を反復的に収集し,自伝を更新し,今後の会話の計画を立てる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:55:21 GMT)
Multimodal Large Language Models Meet Multimodal Emotion Recognition and Reasoning: A Survey [40.2]
AI for Scienceでは、マルチモーダルな感情認識と推論が急速に成長するフロンティアとなっている。本論文は,マルチモーダル感情認識と推論によるMLLMの交点を包括的に調査する最初の試みである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:13:14 GMT)
EnvSDD: Benchmarking Environmental Sound Deepfake Detection [40.1]
環境音には異なる特徴があり、現実世界の音に対して、音声の検出やディープフェイクの歌唱の方法がより効果的になる可能性がある。環境音のディープフェイク検出のための既存のデータセットは、スケールとオーディオタイプに制限されている。このタスクのために設計された最初の大規模キュレートデータセットであるEnvSDDを導入し、実時間45.25時間、偽オーディオ316.74時間からなる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:59:31 GMT)
From Faithfulness to Correctness: Generative Reward Models that Think Critically [40.1]
本稿では,批判的思考能力を持つ報酬モデルを実現するために,思考監督リワードモデル(TRM)を提案する。問合せ、回答、支援文書が与えられたとき、TRMはまず各回答文の忠実さを支援文書に評価し、その後、文レベルの正しさを評価するための推論ステップを適用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:06:56 GMT)
Talk in Pieces, See in Whole: Disentangling and Hierarchical Aggregating Representations for Language-based Object Detection [39.7]
本稿では,言語に基づく物体検出のための文内階層関係に基づく言語表現の再構成を提案する。重要な洞察は、テキストトークンを中核となる構成要素、属性、関係("talk in pieces")に切り離し、その後階層的に構造化された文レベルの表現に集約する必要性である。 OmniLabelベンチマークによる実験結果は24%のパフォーマンス向上を示し、言語構成の重要性を示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:14:26 GMT)
Fidelity-Aware Data Composition for Robust Robot Generalization [39.7]
大規模で視覚的に均質なデータセットで訓練された汎用的なロボットポリシーは、学習のショートカットに影響を受けやすい。本稿では、ロバストな一般化は、原理的、忠実なデータ構成に依存することを示唆する。本稿では,データ合成を最適化問題として扱うフレームワークであるCoherent Information Fidelity Tuning(CIFT)を紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:48:36 GMT)
World Model for AI Autonomous Navigation in Mechanical Thrombectomy [39.5]
モデルベースRLアルゴリズムであるTD-MPC2を用いて,自律型血管内ナビゲーションのための世界モデルを提案する。 SAC(Soft Actor-Critic)法と比較し,複数の血管内ナビゲーションタスクに対して1つのRLエージェントを訓練した。その結果,TD-MPC2は多タスク学習においてSACを有意に上回り,SACの37%に比べ平均成功率は65%,パス比は顕著に改善した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:21:30 GMT)
Navigate the Unknown: Enhancing LLM Reasoning with Intrinsic Motivation Guided Exploration [39.5]
そこで,本研究では,高密度報酬を付与し,RLに基づくパラダイムにおける探索を増幅するために,固有モチベーションギルド探索比N meThOd foR LLM推論(i-MENTOR)を提案する。 4つの公開データセットにわたる実験は、i-MENTORの有効性を示し、AIME 2024で22.23%改善した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:28:15 GMT)
DreamO: A Unified Framework for Image Customization [39.4]
複数の条件をシームレスに統合しながら、幅広いタスクをサポートするために設計された画像カスタマイズフレームワークであるDreamOを紹介する。具体的には、DreamOは拡散変換器(DiT)フレームワークを使用して、異なるタイプの入力を均一に処理する。ベースライン整合性を確立するための限られたデータを伴う単純なタスクに焦点を当てた初期段階、カスタマイズ能力を包括的に強化するためのフルスケールトレーニング段階、低品質データによって導入された品質バイアスを補正するための最終品質アライメント段階の3段階からなるプログレッシブトレーニング戦略を採用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:27:36 GMT)
Knowledge Extraction on Semi-Structured Content: Does It Remain Relevant for Question Answering in the Era of LLMs? [39.4]
大規模言語モデル(LLM)は、半構造化コンテンツに対するWebベースの質問回答システム(QA)を大幅に進歩させた。本稿では,既存のベンチマークを知識抽出アノテーションで拡張することにより,新たなパラダイムにおける三重抽出の価値について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:39:19 GMT)
Benchmarking Computational Methods for Emerging Drug-Drug Interaction Prediction [39.4]
DDI-Benは、分散変更の下でのDDI予測の出現のためのベンチマークフレームワークである。既存のほとんどのアプローチは,分布変化による性能劣化に悩まされていることを示す。分析の結果,大規模言語モデル(LLM)に基づく手法と薬物関連テキスト情報の統合は,そのような劣化に対して有望な堅牢性をもたらすことが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:32:42 GMT)
LLMs Are In-Context Bandit Reinforcement Learners [39.3]
大規模言語モデル(LLMs)は、モデルコンテキストに注釈付きサンプルを追加することに依存する教師付き学習技術であるICL(In-context Learning)で優れている。そこで本研究では、教師付きデータではなく、外部報酬からオンラインのコンテキスト内学習を行うICRL(In-context reinforcement Learning)について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:07:01 GMT)
GEM: 3D Gaussian Splatting for Efficient and Accurate Cryo-EM Reconstruction [39.1]
核電子顕微鏡(cryo-EM)は高分解能構造生物学の中心的なツールとなっている。大規模なデータセットは、計算コストとメモリ集約の両方を3D再構成する。 GEMは3次元ガウス平板上に構築された新しいCreo-EM再構成フレームワークである(3DGS)。標準的なCryo-EMベンチマークでは、GEMは最先端の手法に比べて最大48%高速なトレーニングと12%低いメモリ使用率を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:17:53 GMT)
BOE-XSUM: Extreme Summarization in Clear Language of Spanish Legal Decrees and Notifications [39.0]
BOE-XSUM は、スペイン語の Bolet'in Oficial del Estado' (BOE) に由来する3,648の簡潔で平易な要約からなるキュレートされたデータセットである。 BOE-XSUMで微調整した中型大言語モデルの性能評価を行い,ゼロショット環境での汎用生成モデルと比較した。最高のパフォーマンスモデルであるBERTIN GPT-J 6B(32ビット精度)は、トップのゼロショットモデルであるDeepSeek-R1よりも24%パフォーマンスが向上する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:15:17 GMT)
Can Less Precise Be More Reliable? A Systematic Evaluation of Quantization's Impact on CLIP Beyond Accuracy [38.9]
量子化がCLIPの性能に与える影響を精度を超えて評価する。量子化は、一般に信頼できない事前学習モデルの校正を一貫して改善することを示す。我々は、ゼロショット精度、キャリブレーション、OODロバスト性において同時ゲインをもたらす特定の量子化対応トレーニング(QAT)法を同定する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:09:00 GMT)
ContextPRM: Leveraging Contextual Coherence for multi-domain Test-Time Scaling [38.8]
プロセス報酬モデル(PRM)は,テストタイムスケーリング(TTS)を活用して,大規模言語モデル(LLM)の数学的推論能力を高める上で,極めて有効であることを示す。学習目標をドメイン固有の知識の検証からドメインに依存しない論理フローのモデリングにシフトする。我々のアプローチは、さまざまなドメインにわたるモデルの一般化能力を高める新しいデータアノテーションとトレーニングフレームワークによって実現されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:40:46 GMT)
High-Order Progressive Trajectory Matching for Medical Image Dataset Distillation [38.6]
トラジェクトリマッチングは、データセット蒸留の有望な方法論として登場した。本稿では,パラメータ軌跡の幾何学的構造を捉える形状ワイドポテンシャルと,簡易で複雑なマッチング戦略を提案する。医用画像分類タスクの実験では,プライバシを保ちながら蒸留性能を向上させることが示されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:45:11 GMT)
VSSFlow: Unifying Video-conditioned Sound and Speech Generation via Joint Learning [38.4]
V2SタスクとVisualTTSタスクをシームレスに統合したフローマッチングフレームワークであるVSSFlowを提案する。 VSSFlowは、学習段階に余分な設計を加えることなく、音声および音声生成のためのエンドツーエンドのジョイントラーニングプロセスの恩恵を受ける。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:38:24 GMT)
Functional-level Uncertainty Quantification for Calibrated Fine-tuning on LLMs [38.3]
Calibrated Fine-Tuning (UQ4CT)は、入力を出力にマッピングする関数の空間上の不確実性をキャプチャし、校正する。我々は,機能空間を階層的に分解するMix-of-expertsフレームワークを用いて,微調整段階のUQ4CTを実装した。分散シフト中であっても、UQ4CTはより優れたECE性能を高い精度で維持し、一般化性の向上を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:32:40 GMT)
When MLLMs Meet Compression Distortion: A Coding Paradigm Tailored to MLLMs [38.3]
マルチレベル特徴を適応的に保護し、下流タスクの異なる要求に適合するように設計されたMLLM(CoTAM)に適応した画像コーデックTAiloredを提案する。 MLLMタスクで同じ性能を維持しながら,最大35.99%の省力化を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:07:52 GMT)
HarmMetric Eval: Benchmarking Metrics and Judges for LLM Harmfulness Assessment [38.1]
LLM出力の有害性を評価するための様々な指標と裁判官が伴って、ジェイルブレイク攻撃が急増している。我々のベンチマークには、多様な有害で有害でないモデル応答と組み合わせた有害なプロンプトの高品質データセットが含まれています。実験の結果,従来の2つの指標-METEORとROUGE-1-は,モデル応答の有害性を評価する上で,優れたLCMベースの判断器であることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:34:01 GMT)
Beyond Sharp Minima: Robust LLM Unlearning via Feedback-Guided Multi-Point Optimization [38.0]
より安定したパラメータ領域を明示的に求める双方向フィードバック誘導最適化フレームワークを提案する。 WMDP と MUSE のベンチマーク実験により,本手法は再学習および脱獄攻撃に対して極めて堅牢であることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:38:13 GMT)
Rethinking JEPA: Compute-Efficient Video SSL with Frozen Teachers [37.9]
ビデオ共同埋め込み予測アーキテクチャ(V-JEPA)は,指数移動平均(EMA)更新型教師を用いて,潜伏空間内のマスキング領域を予測することで,市販のビデオ表現の一般化を学習する。マスク付き潜伏予測を再検討し,凍結した教師が満足することを示す。生徒の質は、教師の質に対して著しく堅牢であることに気付きました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:55:17 GMT)
StreamForest: Efficient Online Video Understanding with Persistent Event Memory [37.7]
StreamForestは、ビデオの理解をストリーミングするために設計されている。微粒な時空間ウィンドウは、現在のシーン知覚を改善するために、詳細な短期的な視覚的手がかりをキャプチャする。 OnlineITはリアルタイム認識と将来の予測の両方においてMLLMのパフォーマンスを大幅に向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:53:57 GMT)
Beyond Isolated Facts: Synthesizing Narrative and Grounded Supervision for VideoQA [37.7]
よりリッチな監視信号を合成するためのフレームワークを導入する。質問ベースパラフレーズ(QBP)と質問ベースキャプション(QBC)の2つの補完戦略を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:28:44 GMT)
Continual Dialogue State Tracking via Example-Guided Question Answering [37.6]
そこで本研究では,対話状態の追跡を具体化した質問応答タスクのバンドルとして提案する。我々のアプローチは、サービス固有の記憶を緩和し、与えられた質問や例を文脈化するためのモデルを教える。類似の対話状態変化のあるターンを識別するために訓練された検索者によって検索されたコンテキスト内例から学習することで,600万のパラメータしか持たないモデルが大きな向上を達成できることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:55:31 GMT)
MixtureVitae: Open Web-Scale Pretraining Dataset With High Quality Instruction and Reasoning Data Built from Permissive-First Text Sources [37.6]
MixtureVitaeは、強力なモデルパフォーマンスを提供しながら、法的リスクを最小限に抑えるために開発されたオープンアクセス事前トレーニングコーパスである。ライセンス対応のフィルタリング、安全性と品質のスクリーニング、ドメイン対応のミキシングのための透過的で多段階のパイプラインについて詳述する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:40:10 GMT)
Aligning Visual Foundation Encoders to Tokenizers for Diffusion Models [37.6]
本稿では,画像生成における遅延拡散モデルのトークン化として,事前学習したビジュアルエンコーダの整合性を提案する。 ImageNet 256$times$256では、トークン化器は拡散モデルの収束を加速し、64時間以内で1.90gFIDに達する。提案手法は単純で拡張性があり,連続トークン化設計のための意味論的基盤となるパラダイムを確立している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:57:39 GMT)
Adaptive Sample Scheduling for Direct Preference Optimization [37.5]
DPOのためのサンプルスケジューリングという,新しい問題を紹介します。モデルの進化状態に基づいてトレーニングサンプルを動的かつ適応的にスケジュールすることを目的としている。トレーニングバッチ毎にサンプルを適応的に選択する,効率的かつ効率的なアルゴリズムであるSamSを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:35:14 GMT)
Agent-as-Judge for Factual Summarization of Long Narratives [37.5]
大規模言語モデル(LLM)は、ROUGEやBERTScoreといった従来のメトリクスに基づいた要約タスクにおいて、ほぼ人間に近い性能を示す。 LLM-as-a-Judgeのような最近の進歩は、語彙的類似性に基づくメトリクスの限界に対処するが、実際には矛盾を示す。本稿では,要約を評価・精査するための新しい「Agent-as-a-Judge」フレームワークであるNarrativeFactScoreを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:18:34 GMT)
Demonstration of quantum error detection in a silicon quantum processor [37.3]
ドナーベースのシリコン量子プロセッサ上での量子エラー検出を実演する。このシステムの絡み合い能力は、2量子ベル状態絡みの確立によって検証される。安定化器を用いて4量子誤り検出回路を動作させることで、任意の単一ビット誤りを検出できる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:33:05 GMT)
Who's Your Judge? On the Detectability of LLM-Generated Judgments [37.3]
大言語モデル(LLM)に基づく判断は、強力なLLMを活用して、候補内容の効率よく評価し、判定スコアを提供する。本研究は,判断検出の課題を提示し,定式化するものである。我々は、明示的に抽出された言語的特徴とLLM強化特徴を付加した、軽量で透明なニューラル検出器であるtextitJ-Detectorを紹介した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:54:57 GMT)
SCI-Verifier: Scientific Verifier with Thinking [37.1]
大規模言語モデル(LLM)は、科学的推論にますます応用されている。科学的領域における既存の検証研究は2つの大きな限界に悩まされている。データレベルとモデルレベルでのソリューションを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:58:43 GMT)
Improving the adaptive and continuous learning capabilities of artificial neural networks: Lessons from multi-neuromodulatory dynamics [37.0]
生物学的生物は、動的環境に適応しながら知識を取得し、移動し、保持する。本研究は,生物学習システムの基本的特徴である神経調節が,破滅的な忘れ込みなどの課題にどのように対処できるかを考察する。マルチスケールの神経調節を統合することで,生物学習と人工システムとのギャップを埋めることを目指す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:20:16 GMT)
Enhancing Physical Plausibility in Video Generation by Reasoning the Implausibility [37.0]
拡散モデルはリアルなビデオを生成することができるが、既存の方法は大規模テキストビデオデータセットから暗黙的に物理的推論を学ぶことに依存している。本研究では,推論時の身体的可視性を改善するためのトレーニングフリーフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:32:54 GMT)
Is Sequence Information All You Need for Bayesian Optimization of Antibodies? [36.9]
一定の構造情報により、初期最適化ラウンドにおけるデータ効率は向上するが、等価なピーク性能を有することがわかった。本稿では,タンパク質言語モデルに基づくソフト制約'を用いて,空間の有望な領域に最適化を誘導する手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:36:04 GMT)
Towards Foundation Models for Cryo-ET Subtomogram Analysis [36.9]
我々は,452個の粒子クラスから904k以上のサブトモグラムを生成する大規模合成データ生成装置であるCryoEngineを紹介した。第2に、適応位相トークン化を等価化モジュールとして組み込んだ適応位相トークン変換器(APT-ViT)を設計する。第3に,強騒音条件下での表現学習を安定させるため,NRCL(Noss-Resilient Contrastive Learning)戦略を導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:47:45 GMT)
VisualOverload: Probing Visual Understanding of VLMs in Really Dense Scenes [36.4]
2,720組の質問応答対からなる視覚的質問応答(VQA)ベンチマークであるVisualOverloadを提案する。通常、地球近傍の画像理解に焦点を当てた以前のVQAデータセットとは異なり、VisualOverloadは、密集したシーンでシンプルで知識のない視覚タスクを実行するためにモデルに挑戦する。 37の試験モデルのうち最高のモデル(o3)でさえ、最も難しいテスト分割で19.6%、すべての質問で69.5%の精度しか達成できない。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:25 GMT)
Rethinking and Benchmarking Large Language Models for Graph Reasoning [36.3]
グラフ推論のための大規模言語モデル(LLM)は、過去2年間にわたって広く研究されてきた。近年の研究では、LLMがグラフ推論タスクを扱う可能性を示しているが、その性能は過大評価されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:10:12 GMT)
Every Subtlety Counts: Fine-grained Person Independence Micro-Action Recognition via Distributionally Robust Optimization [36.2]
マイクロアクション認識は、心理的アセスメントと人間とコンピュータの相互作用に不可欠である。既存の手法は現実のシナリオで失敗することが多い。本稿では、分散ロバスト最適化の原則を取り入れた個人独立ユニバーサルマイクロアクション認識フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:48:34 GMT)
KompeteAI: Accelerated Autonomous Multi-Agent System for End-to-End Pipeline Generation for Machine Learning Problems [36.2]
KompeteAIは、動的ソリューション空間探索を備えた新しいAutoMLフレームワークである。我々は動的ソリューション空間探索を備えた新しいAutoMLフレームワークであるKompeteAIを紹介する。我々は,MLE-Benchにおける制約に対応するために,Kompete-benchを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:54:50 GMT)
Adapting Chat Language Models Using Only Target Unlabeled Language Data [36.1]
チャットLLMのための新しい言語適応手法であるElChatを提案する。ベースモデルなしで、ターゲットの未ラベルデータに直接チャットモデルを適用する。ソースチャットモデルから情報をインジェクトすることで、チャット能力を付与する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:17:10 GMT)
Bridging Semantic Logic Gaps: A Cognition Inspired Multimodal Boundary Preserving Network for Image Manipulation Localization [36.0]
認知にインスパイアされたマルチモーダル境界保存ネットワーク(CMB-Net)を提案する。 CMB-Netは、視覚情報における意味的関係の欠如を補うために、プロンプトベースのテキスト情報を生成する。テキスト特徴と画像特徴のあいまいさによって、テキスト特徴に重みを割り当てる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:26:26 GMT)
MedMMV: A Controllable Multimodal Multi-Agent Framework for Reliable and Verifiable Clinical Reasoning [36.0]
MedMMV(MedMMV)は,信頼性・信頼性の高い臨床推論のための多エージェントフレームワークである。 6つの医療ベンチマークでは、MedMMVは最大12.7%の精度向上を実現し、さらに重要な点として信頼性の向上が示されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:51:25 GMT)
Efficient Hyperparameter Tuning via Trajectory Invariance Principle [35.9]
学習速度と重み減衰を組み合わせた量に関して, 学習前損失曲線, 勾配雑音, 勾配ノルムがほぼ重なり合う, トラジェクトリ不変(trajectory invariance)と呼ばれる現象を同定する。この現象は、元の2次元のハイパーパラメータ空間を1次元に効果的に還元し、効率的なチューニング規則をもたらす。全体として,本研究は,効率的なチューニングのための新しい原則を提案し,スケーリング法則に関する今後の研究を刺激するものである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:01:19 GMT)
Translation from Wearable PPG to 12-Lead ECG [35.8]
12誘導心電図(ECG)は、心臓血管モニタリングの標準規格である。既存の12リードのECGシステムは、不安定なマルチ電極セットアップに依存しており、アンブロトリー環境での持続的な監視を制限している。 PPG信号から臨床的に有効な12誘導心電図を生成するために設計された,革新的な人口動態認識フレームワークであるP2Esを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:36:24 GMT)
The 4th Dimension for Scaling Model Size [35.8]
大きな言語モデルのスケーリングは通常、深さ、幅、パラメータカウントの3つの次元を含む。重みを再利用することでパラメータ数を変化させることなく効率的なアルゴリズム深度を増大させる第4次元、textbfvirtual logical depth (VLD) を探索する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:14:46 GMT)
Prompt and Parameter Co-Optimization for Large Language Models [35.7]
LLM(Large Language Models)トレーニングのために,迅速な最適化と微調整を共同で統合する,新しいフレームワークであるMetaTunerを紹介する。我々のフレームワークは、プロンプトとパラメータの最適な組み合わせを見つけるために最適化されている。様々なベンチマーク実験により、我々の手法はベースラインを一貫して上回ることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:38:25 GMT)
Fine-grained Contrastive Learning for ECG-Report Alignment with Waveform Enhancement [35.5]
既存のECG-Reportコントラスト学習手法は、全ECGとレポートアライメントに重点を置いている。本報告では,特定のECGセグメントと各タグとの微粒なアライメントを実現するFG-CLEPを提案する。 6つのデータセットの実験により、FG-CLEPはきめ細かいアライメントを大幅に改善することが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:21:34 GMT)
Bayesian Surrogates for Risk-Aware Pre-Assessment of Aging Bridge Portfolios [35.5]
インフラポートフォリオの老朽化は、リソース割り当ての重要な課題である。高速な構造事前評価のためのベイズニューラルネットワーク(BNN)サロゲートを提案する。鉄道アンダーパスの実例研究において,この枠組みの有効性を実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:51:02 GMT)
VQToken: Neural Discrete Token Representation Learning for Extreme Token Reduction in Video Large Language Models [35.4]
最小限の離散トークンを用いてビデオ全体を表現することを目的としたExtreme Short Token Reductionという新しいタスクを紹介した。 Extreme Short Token Reductionタスクでは、私たちのVQTokenはシーケンスをオリジナルの長さのわずか0.07パーセントまで圧縮し、NextQA-MCベンチマークでは0.6%の精度しか達成していません。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:09:31 GMT)
How to Protect Yourself from 5G Radiation? Investigating LLM Responses to Implicit Misinformation [35.4]
大規模言語モデル(LLM)は多様なシナリオに広くデプロイされている。彼らが誤報をうまく広める程度は、重大な安全上の懸念として浮かび上がっている。私たちは、暗黙の誤報の最初のベンチマークであるEchoMistをキュレートしました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:56:52 GMT)
Advantage Weighted Matching: Aligning RL with Pretraining in Diffusion Models [35.4]
拡散の政策段階的手法である textbfAdvantage Weighted Matching (AWM) を導入する。 AWMは、事前学習と同一のモデリング目標を維持しながら、高逆サンプルの影響を高め、低逆サンプルを抑制する。これは事前学習とRLを概念的かつ実践的に統一し、政策次数理論と整合性を持ち、分散を減少させ、より高速な収束をもたらす。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:02:20 GMT)
Discerning minds or generic tutors? Evaluating instructional guidance capabilities in Socratic LLMs [35.3]
本研究は,質問生成を超えて指導指導能力を強調する。実際の教育対話を基盤としたベンチマークである GuideEval を提案する。本稿では,行動促進型指導対話を活用した行動誘導型微調整戦略を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:32:32 GMT)
Bidirectional Likelihood Estimation with Multi-Modal Large Language Models for Text-Video Retrieval [35.3]
MLLM (BLiM) を用いた双方向類似度推定手法を提案する。 4つのText-Video Retrievalベンチマークでは、CPNを搭載したBLiMは、従来の最先端モデルを平均6.4R@1で上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:19:41 GMT)
MaintainCoder: Maintainable Code Generation Under Dynamic Requirements [35.2]
保守性は、現実世界のソフトウェア開発において重要な要素です。最小限の再作業で動的要求を処理するために MaintainCoder を提案する。ウォーターフォールモデル、デザインパターン、マルチエージェントコラボレーションを統合する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:34:59 GMT)
UI2V-Bench: An Understanding-based Image-to-video Generation Benchmark [35.2]
I2V(Image-to-Video)の生成は、ビデオ合成の分野において重要な焦点となっている。既存の評価ベンチマークは主にビデオの品質や時間的一貫性といった側面に焦点を当てている。 We propose UI2V-Bench, a novel benchmark for evaluation I2V model with focus on semantic understanding and reasoning。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:14:26 GMT)
SimulRAG: Simulator-based RAG for Grounding LLMs in Long-form Scientific QA [35.0]
大規模言語モデル (LLMs) は科学的問題の解決において有望であることを示す。科学的な疑問に対する長文の回答を生成するのに役立ちます。 LLMは幻覚に悩まされることが多く、特に長期にわたる科学的な疑問応答の難しい課題に悩まされる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:07:00 GMT)
Scaling Laws and Spectra of Shallow Neural Networks in the Feature Learning Regime [34.8]
本稿では,特徴学習体制における2次ニューラルネットワークと対角ニューラルネットワークのスケーリング法則を体系的に解析する。我々は, 余剰リスクのスケーリング指数を, 試料の複雑さと重量減衰の関数として, 詳細な位相図を導出した。重みスペクトルにおけるパワーローテールの出現とネットワーク一般化性能を結合した最近の経験的観測の理論的検証を行う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:58:13 GMT)
Bias Mitigation or Cultural Commonsense? Evaluating LLMs with a Japanese Dataset [34.7]
大規模言語モデル(LLM)は社会的偏見を示し、様々な嫌悪法の開発を促す。従来の研究は、偏見緩和の影響を、主に一般的な言語理解を測るタスクを通じて評価してきた。文化的常識は社会的偏見と密接に関連しており、どちらも社会的規範や価値観に根ざしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:45:50 GMT)
Automatically Generating Web Applications from Requirements Via Multi-Agent Test-Driven Development [34.6]
私たちは、エンドツーエンドのフルスタックWebアプリケーション生成のための最初のテスト駆動開発フレームワークであるTDDevを紹介します。自然言語の説明や設計イメージが与えられたら、TDDevは自動的に実行可能なテストケースを導き、フロントエンドとバックエンドのコードを生成し、ユーザーインタラクションをシミュレートします。本フレームワークは,ユーザ要求の不明確さ,複数ファイル間の複雑な相互依存性,機能的正当性と視覚的忠実性といった,フルスタック自動化における重要な課題に対処する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:18:19 GMT)
Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models [34.4]
ビデオ大言語モデル(VideoLLM)は、より長いビデオ入力を処理し、複雑な推論と分析を可能にする能力を実証している。ビデオフレームからの数千の視覚トークンのため、キー値(KV)キャッシュはメモリ要求を大幅に増加させることができる。本稿では,KVキャッシュを2ビット未満に圧縮するKVキャッシュ量子化手法であるVidKVを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:46:45 GMT)
DiTraj: training-free trajectory control for video diffusion transformer [34.1]
軌道制御は、制御可能なビデオ生成におけるユーザフレンドリなタスクを表す。提案するDiTrajは,DiTに適したテキスト・ビデオ生成におけるトラジェクトリ制御のためのトレーニングフリーフレームワークである。提案手法は,映像品質とトラジェクトリ制御性の両方において,従来の手法よりも優れていた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:15:43 GMT)
When Scores Learn Geometry: Rate Separations under the Manifold Hypothesis [33.9]
拡散モデルと逆問題はしばしば低雑音限界におけるデータ分布の学習として解釈される。彼らの成功は、完全な分布ではなく、データ多様体を暗黙的に学習することから生じると我々は主張する。スコア誤差が$o(sigma-2)$であるのに対して、特定のデータ分布を復元するにはより厳密な$o(1)$エラーが必要である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:18:43 GMT)
Causality-guided Prompt Learning for Vision-language Models via Visual Granulation [33.9]
CLIPの視覚的顆粒化による因果誘導型テキストプロンプト学習法を提案する。筆者らのCaPL法は,特に細粒度データセットにおいて,最先端のプロンプト学習法よりも優れていた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:53:30 GMT)
PhysiAgent: An Embodied Agent Framework in Physical World [33.8]
VLA(Vision-Language-Action)モデルは顕著な成功を収めたが、しばしば限定的な一般化に苦戦している。現在のアプローチはしばしばこれらのモデルを厳密でシーケンシャルな構造に組み合わせる。本研究では,物理環境において効果的に動作するように調整された物理エージェントフレームワークであるPhysorAgentを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:39:32 GMT)
Video models are zero-shot learners and reasoners [33.7]
Veo 3は、明示的にトレーニングされていないさまざまなタスクを解決できます。 Veoの創発的なゼロショット機能は、ビデオモデルが統一された一般的なビジョン基盤モデルへの道のりにあることを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:44:46 GMT)
AXIS: Explainable Time Series Anomaly Detection with Large Language Models [33.7]
AXISは、時系列理解のための凍結したLarge Language Models (LLM) を規定するフレームワークである。 LLMは離散トークンで動作し、長い連続的な信号を直接処理するのに苦労する。文脈的接地とパターンレベルのセマンティクスを監督するマルチフォーマットの質問と合理性を特徴とする新しいベンチマークを導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:24:22 GMT)
Generative Value Conflicts Reveal LLM Priorities [33.6]
我々は、言語モデルが異なる値をどのように優先順位付けするかを評価する自動パイプラインであるConflictScopeを紹介した。ユーザ定義の値セットが与えられた場合、ConflictScopeは、言語モデルがセットからサンプリングされた2つの値間の競合に直面するシナリオを自動的に生成する。モデルでは、無害などの保護的価値のサポートから、ユーザーの自律性などの個人的価値のサポートへと、よりオープンな価値紛争設定へと移行している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:19:43 GMT)
Towards Generalizable AI-Generated Image Detection via Image-Adaptive Prompt Learning [33.3]
画像適応型プロンプト学習(IAPL)は、学習後に修正するのではなく、各入力画像に応じてプロンプトを調整する新しいパラダイムである。 IAPLは、広く使われているUniversalFakeDetectとGenImageデータセットで95.61%と96.7%の精度で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:12:33 GMT)
Expanding Computation Spaces of LLMs at Inference Time [33.2]
Chain-of-Thought(CoT)の理論的根拠により、言語モデルでは問題解決にタスク関連のテキストを追加することができる。本稿では,人工的に挿入されたフィラートークンのシーケンスを推論のみに活用できる言語モデルについて検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:59:44 GMT)
Rethinking Human-Object Interaction Evaluation for both Vision-Language Models and HOI-Specific Methods [33.1]
本稿では,HOI検出を複数問合せタスクとして再構成するベンチマークデータセットを提案する。以上の結果から,多くの指標において,大規模VLMが最先端のHOI固有の手法をすでに超越していることが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:32:20 GMT)
Short window attention enables long-term memorization [33.0]
スライディングウインドウの注意とxLSTM線形RNN層からなるハイブリッドアーキテクチャであるSWAXを紹介する。 SWAXの反直感的な発見は、大きなスライディングウィンドウが長いコンテキスト性能を向上しないことである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:04:12 GMT)
Differentiable Light Transport with Gaussian Surfels via Adapted Radiosity for Efficient Relighting and Geometry Reconstruction [32.7]
放射場は、新しいビュー合成から幾何学的再構成まで幅広い応用で大きな成功を収めている。これらの制限に対処する方法の1つは、物理ベースのレンダリングを組み込むことである。最適化の内ループに完全なグローバル照明を組み込むことは、違法に高価である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:51:54 GMT)
Neural Message-Passing on Attention Graphs for Hallucination Detection [32.3]
CHARMは、グラフ学習タスクとして幻覚検出をキャストし、上記の属性グラフにGNNを適用することでそれに取り組む。我々は、CHARMが事前の注意に基づくトレースを確実に仮定し、実験的に、様々なベンチマークで他のアプローチを一貫して上回っていることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:37:12 GMT)
Pretraining with hierarchical memories: separating long-tail and common knowledge [32.2]
我々は,世界知識を符号化する大規模階層型パラメトリックメモリバンクにアクセスする小型言語モデルを提案する。事前トレーニングと推論の間、小さなコンテキスト依存のメモリブロックを取得し、それをモデルに追加します。我々の事前学習は、記憶パラメータに長い世界知識を格納することを学び、一方、小言語モデルは一般的な推論能力を捉えるアンカーとして機能する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:50 GMT)
Sampling Complexity of TD and PPO in RKHS [32.0]
機能空間の観点からPPO(Proximal Policy Optimization)を再考する。我々の結果は、PPOを有限次元の仮定を超えた厳密な理論上の足場に置く。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:19:19 GMT)
DeepSearch: Overcome the Bottleneck of Reinforcement Learning with Verifiable Rewards via Monte Carlo Tree Search [31.9]
我々はモンテカルロ木探索を直接RLVRトレーニングに統合するフレームワークであるDeepSearchを紹介する。推論時にのみツリー検索に依存する既存のメソッドとは対照的に、DeepSearchは構造化された検索をトレーニングループに埋め込む。コントリビューションには,(1)検索ツリー全体にわたって有望なノードを優先するグローバルフロンティア選択戦略,(2)監督のための確実なパスを識別するエントロピーベースのガイダンスによる選択,(3)効率的なソリューションキャッシングによる適応的リプレイバッファトレーニングなどが含まれている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:00:29 GMT)
ELEPHANT: Measuring and understanding social sycophancy in LLMs [31.9]
本稿では,ユーザの顔の過剰な保存を特徴とする社会性梅毒について紹介する。ベンチマークを11モデルに適用すると、LSMは社会的梅毒の頻度が常に高いことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:29:38 GMT)
Contrastive Representations for Temporal Reasoning [31.9]
標準的な時間的コントラスト学習は、その人気にもかかわらず、しばしば、刺激的な特徴に依存しているため、時間的構造を捉えることに失敗する。本稿では,これらの突発的特徴を正に除去する負のサンプリング手法である,時間的推論のための Combinatorial Representations(CRTR)を紹介する。 CRTRはソコバンやルービックキューブのような複雑な時間構造を持つ領域に対して強い結果をもたらす。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:34:40 GMT)
Training Dynamics of Parametric and In-Context Knowledge Utilization in Language Models [31.8]
大規模言語モデルは、推論時に取得した文脈内知識と事前訓練中に取得したパラメトリック知識の衝突にしばしば遭遇する。本研究は,学習条件がモデルにおけるインコンテキストとパラメトリック知識の使用にどのように影響するかを初めて制御した研究である。実験の結果,文書内における事実の反復は,パラメトリックとインコンテクストの両方の能力の発達を促進することが明らかとなった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:18:18 GMT)
TRACE Back from the Future: A Probabilistic Reasoning Approach to Controllable Language Generation [31.8]
大規模な言語モデルは、人間の値や望ましい属性と整合する必要がある。既存のソリューションは、各新しい属性に対する訓練後のLM(expensive)と非フレキシブル(inflexible)のどちらかで、サンプリングやトレーニングによって将来のシーケンスの期待属性確率(EAP)を近似する。 TRACEは,EAPを効率よく計算し,トラクタブル確率論的推論と軽量制御によって新しい属性に適応する新しいフレームワークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:34:04 GMT)
Taxonomy of Comprehensive Safety for Clinical Agents [31.8]
TACOSは、安全フィルタリングとツールの選択を単一のユーザ意図の分類ステップに統合する、きめ細かい21クラスの分類である。分類の妥当性を検証するため,TACOSに注釈付きデータセットをキュレートし,広範な実験を行う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:56:57 GMT)
Model Merging Scaling Laws in Large Language Models [31.7]
クロスエントロピーによって測定された言語モデルマージのスケーリング法則について検討する。モデルサイズとエキスパート番号を結びつけるコンパクトパワー法則を同定する。ここでは、なぜゲインが 1/k になるのかを説明する単純な理論を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:36:55 GMT)
OAT-FM: Optimal Acceleration Transport for Improved Flow Matching [31.7]
Flow Matching (FM)は、ノイズからデータへの速度場学習を目的としている。 FM橋と最近の最適加速輸送理論(OAT) 我々は、OAT-FMと呼ばれる改良されたFM法を開発し、理論と実践の両面でその利点を探求する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:36:27 GMT)
Mask Clustering-based Annotation Engine for Large-Scale Submeter Land Cover Mapping [31.7]
マスククラスタリングベース。エンジン(MCAE) 私たちは、HiCity-LCと呼ばれる約140億個のラベル付きピクセルの高品質な注釈付きデータセットを構築します。中国の主要都市5都市にまたがる都市規模の土地被覆地図の作成を支援し、85%以上をランク付けしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:21:10 GMT)
A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory [31.7]
大規模言語モデル(LLM)エージェントは、過去のインタラクションから学習するためにメモリを使用する。敵は、エージェントのメモリに一見無害なレコードを注入して、その将来の振る舞いを操作できる。 A-MemGuard は LLM エージェントメモリのための最初のプロアクティブな防御フレームワークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:04:15 GMT)
Denoising Neural Reranker for Recommender Systems [31.6]
2段階の枠組みの下での順位変更作業は、自然にレシーバのスコアに対するノイズ低減問題であることを示す。本稿では,デノナイジング・リランカと慎重に設計したノイズ発生モジュールを関連づける逆方向のフレームワークDNRを導出する。得られたDNRソリューションは、従来のスコアエラー最小化損失を3つの拡張目標で拡張する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:41:04 GMT)
A Survey of Graph Retrieval-Augmented Generation for Customized Large Language Models [31.4]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)をカスタマイズするための有望なソリューションとして登場した。本調査は,GraphRAG(Graph-based Retrieval-Augmented Generation)の系統的解析である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:55:52 GMT)
Your thoughts tell who you are: Characterize the reasoning patterns of LRMs [31.3]
生成言語モデルを用いて、2つのLRMからの推論トレースを比較し、その特徴を単語で表現する。このプロセスを推論トレースのデータセットで反復すると、モデルがどのように考えるかを特徴づける人間の言語分類が得られる。 LOTは、その思考の体系的な違いを特定し、スケール、ベースモデルファミリ、客観的領域が異なるLEMからの推論トレースを80-100%精度で識別する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:52:07 GMT)
SDPose: Exploiting Diffusion Priors for Out-of-Domain and Robust Pose Estimation [31.3]
安定拡散に基づく微調整フレームワークである textbfSDPose を提案する。我々は、遅延した特徴を軽量な畳み込みポーズヘッドを通じてキーポイントのヒートマップにマッピングし、事前訓練されたバックボーンの破壊を避ける。 SDPoseは、COCO上でSapiensが使用するトレーニングスケジュールの5分の1しか使用せず、COCO検証セット上でSapiens-1B/2Bと同等である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:09:03 GMT)
Neural Visibility of Point Sets [31.1]
本稿では,2進分類タスクとして定式化することで,点雲の可視性判定に新たなアプローチを提案する。我々のネットワークは、レンダリングされた3Dモデルから生成された地味な可視性ラベルでエンドツーエンドに訓練されている。提案手法は,HPRの精度と計算効率を両立させ,最大126倍の高速化を実現した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:54:00 GMT)
DepthLM: Metric Depth From Vision Language Models [31.1]
視覚言語モデル(VLM)はテキストインタラクションによって様々な視覚タスクに柔軟に対応できる。アーキテクチャや損失変更なしに、専門家レベルの精度に達することができることを示す。提案手法は,最も進んだVLMの精度を2倍以上上回る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:12:13 GMT)
AutoRAN: Automated Hijacking of Safety Reasoning in Large Reasoning Models [31.1]
AutoRANは、大規模な推論モデルで内部安全推論のハイジャックを自動化する最初のフレームワークである。 GPT-o3/o4-mini や Gemini-2.5-Flash など,最先端の LRM に対する AutoRAN の評価を行った。その結果、AutoRANは1回か数回で100%の成功率に近づくことができた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:35:55 GMT)
Enhancing Textual Personality Detection toward Social Media: Integrating Long-term and Short-term Perspectives [31.0]
テキスト・パーソナリティ検出は、ソーシャルメディア・プラットフォーム上でユーザーが生成したコンテンツを分析することで人格の特徴を識別することを目的としている。本稿では,利用者の長期的・短期的性格特性をモデル化するためのDENを提案する。双方向インタラクションモジュールは、パーソナリティの両面を統合し、ユーザのパーソナリティを包括的かつ包括的に表現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:51:02 GMT)
Double Machine Learning Based Structure Identification from Temporal Data [30.7]
時系列データの原因を学習することは、ファイナンスから地球科学、バイオメディカルアプリケーションまで、多くのアプリケーションにおいて基本的な課題である。このタスクの一般的なアプローチはベクトル自己回帰に基づいており、潜在的な原因間の未知の矛盾を考慮していない。時間的データ(DR-SIT)から構造を識別する新しいダブル機械学習手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:09:10 GMT)
Towards generalizable deep ptychography neural networks [30.6]
本研究では, 実験的な測定を行ったプローブと, 手続き的に生成したオブジェクトを組み合わせることで, プローブ学習を重視した教師なし学習ワークフローを提案する。このプローブ中心のアプローチにより、1つの物理インフォームドニューラルネットワークは、複数のビームラインにわたって見えない実験を再構築することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:38:13 GMT)
Dive into the Agent Matrix: A Realistic Evaluation of Self-Replication Risk in LLM Agents [30.4]
大言語モデル(LLM)エージェントの自己複製リスクは、客観的なミスアライメントによって増大している。本稿では,自己複製リスクの定量化のための総合評価フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:49:50 GMT)
BFSM: 3D Bidirectional Face-Skull Morphable Model [30.3]
遠隔診断、手術計画、医学教育、身体に基づく顔シミュレーションなどの応用において、関節型顔面骨格形態モデルの構築は大きな可能性を秘めている。しかし、このビジョンを実現するには、対面スカルデータの不足、登録精度の不足、再建と臨床応用の限定的な探究など、制約がある。本稿では, 顔と頭蓋骨の形状推定を共有空間を通して行う3次元双方向顔・骨格形態モデル(BFSM)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:34:13 GMT)
Stable Forgetting: Bounded Parameter-Efficient Unlearning in LLMs [30.1]
我々は,大規模な言語モデル (LLM) のフィードフォワード層において,左折集合の上昇がいかに最適化を不安定化させるかを説明する理論的枠組みを提供する。本研究では, パラメータ効率のよい手法である境界境界アンラーニングを提案し, 適応子に有界関数を適用することにより微調整を安定化する。提案手法は,LLMにおける非学習のための理論的基盤と実践的拡張性を備えた枠組みを確立するとともに,保持状態を維持しながら忘れることの大幅な改善を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:30:15 GMT)
CHROMA: Consistent Harmonization of Multi-View Appearance via Bilateral Grid Prediction [30.1]
カメラパイプラインは、露光調整、ホワイトバランス、色補正など、デバイス上の広範な処理を適用する。外観の変化は複数ビューの一貫性に反し、新しいビュー合成を劣化させる。多視点一貫した方法で測光変動を補正するために、空間適応型二元格子を予測できる一般化可能なフィードフォワード手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:41:52 GMT)
Fast Exact Unlearning for In-Context Learning Data for LLMs [30.1]
大規模言語モデルでは「微調整データ」を効率的に解き放つことができることを示す。正確な文脈内学習は量子化k-meansで行うことができ、効果的に一定時間非学習操作ができることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:10:01 GMT)
GCDance: Genre-Controlled Music-Driven 3D Full Body Dance Generation [30.0]
GCDanceは、ジャンル固有の3Dフルボディダンス生成のためのフレームワークで、音楽と記述テキストに条件付けされている。我々は、入力プロンプト、明示的なジャンルラベル、自由形式の記述文をジャンル固有の制御信号にマッピングするテキストベースの制御機構を開発する。テキストジャンル情報を抽出し、高品質な生成結果を維持することの目的をバランスさせるため、我々は新しいマルチタスク最適化戦略を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:12:31 GMT)
Flow Matching with Semidiscrete Couplings [30.0]
時間依存速度場としてパラメータ化された流れモデルは、ODEを統合することでノイズからデータを生成することができる。これらのモデルは、しばしばフローマッチング、すなわちランダムなノイズ対とターゲットポイントをサンプリングすることによって訓練される。理論上は有望ではあるが、OT-FM(OT flow matching)アプローチは実際には広く使われていない。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:22:35 GMT)
Pixels Versus Priors: Controlling Knowledge Priors in Vision-Language Models through Visual Counterfacts [29.8]
我々は、世界的知識を視覚入力と直接衝突させる視覚的現実的反事実のデータセットであるVisual CounterFactを紹介した。モデル予測は、当初記憶された先行を反映していたが、中期から後期の層における視覚的エビデンスに移行したことを示す。このダイナミクスは、2つのモダリティ間の競合を明らかにし、視覚的な入力は評価中に最終的に事前をオーバーライドする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:26:07 GMT)
CryoCCD: Conditional Cycle-consistent Diffusion with Biophysical Modeling for Cryo-EM Synthesis [29.7]
単一粒子低温電子顕微鏡(cryo-EM)は構造生物学の基盤となっている。本稿では,CryoCCDについて述べる。CryoCCD,CryoCCD,CryoCCD,CryoCCD,CryoCCD,CryoCCD。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:12:54 GMT)
MINGLE: Mixture of Null-Space Gated Low-Rank Experts for Test-Time Continual Model Merging [29.6]
連続モデルマージは、オリジナルのトレーニングデータにアクセスすることなく、独立して微調整されたモデルを順次統合する。既存の手法では、タスク間のパラメータ干渉という2つの重要な課題に直面している。テスト時間連続モデルマージの新しいフレームワークであるMINGLEを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:49:55 GMT)
Real-Aware Residual Model Merging for Deepfake Detection [29.5]
ディープフェイクジェネレータは急速に進化し、徹底的なデータ収集と反復的な再訓練が不可能になる。本稿では,Real-Aware Residual Model Merging (R$2$M)を提案する。 R$2$M はタスクベクトルの低ランク因数分解を通じて共有リアル成分を推定し、各専門家をリアル整列部分とフェイク残基に分解し、階層的なランク切り込みで残基を分解し、タスク毎のノルムマッチングでそれらを集約する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:10:03 GMT)
ELASTIQ: EEG-Language Alignment with Semantic Task Instruction and Querying [29.3]
本稿では,セマンティックタスク命令とクエリによるEEG-Language Alignmentの基礎モデルであるELASTIQを提案する。 ELASTIQは、タスク認識のセマンティックガイダンスを統合し、構造化され言語的に整合したEEG埋め込みを生成する。運動画像,感情認識,定常的視覚誘発電位,隠蔽音声,医療タスクを対象とする20のデータセット上でELASTIQを評価した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:29:12 GMT)
Task Vectors, Learned Not Extracted: Performance Gains and Mechanistic Insight [29.2]
大規模言語モデル(LLM)は、インコンテキスト学習(ICL)として知られる、インコンテキストのデモンストレーションから新しいタスクを実行することができる。近年の研究では、これらの実演は、LLMが予測に利用するコンパクトなタスク表現であるタスクベクトル(TV)に圧縮されることが示唆されている。本稿では,抽出したテレビを精度良く越え,優れたフレキシビリティを実現するLearted Task Vectors(LTV)を直接訓練することを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:33:20 GMT)
Orak: A Foundational Benchmark for Training and Evaluating LLM Agents on Diverse Video Games [29.2]
Orakは、さまざまな現実世界のビデオゲームでLarge Language Model (LLM)エージェントをトレーニングし、評価するために設計されたベンチマークである。 LLMの一貫した評価を支援するために,モデルコンテキストプロトコル(MCP)に基づくプラグアンドプレイインタフェースを導入する。 Orakは総合的な評価フレームワークを提供しており、一般的なゲームスコアのリーダーボード、LLMバトルアリーナ、視覚入力状態、エージェント戦略、微調整効果の詳細な分析を含んでいる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:43:28 GMT)
Open-Vocabulary Online Semantic Mapping for SLAM [29.0]
本稿では,Open-Vocabulary Online 3Dセマンティックマッピングパイプラインを提案する。提案するRGB-Dフレームの列から,CLIPベクトルを用いて記述した3次元セグメントを検出し,追跡する。我々のOVOは、オフラインのベースラインよりも計算量やメモリフットプリントが大幅に少ない一方で、オフラインやオンラインのフットプリントよりもセグメンテーションの指標が優れている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:09:39 GMT)
LaMoGen: Laban Movement-Guided Diffusion for Text-to-Motion Generation [28.7]
本研究は,テキスト誘導運動生成モデルにラガンエフォートと形状成分の定量化手法をシームレスに統合することにより,人間の動作生成の解釈および表現的制御を実現することを目的とする。提案手法は,ターゲットラバンタグによる動作特性の操作により,動作の同一性を保ちながら,多様な表現的動作特性が得られる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:48:49 GMT)
FishNet++: Analyzing the capabilities of Multimodal Large Language Models in marine biology [28.7]
MLLM(Multimodal large language model)は、優れたクロスドメイン機能を示しているが、海洋生物学のような専門的な科学分野において、その能力は未解明のままである。本研究では,最新のMLLMを体系的に評価し,魚種を微粒化認識する能力に重大な限界があることを明らかにする。大規模なマルチモーダルベンチマークである FishNet++ を紹介する。 FishNet++は、マルチモーダル学習のための35,133のテキスト記述、形態学研究のための706,426のキーポイントアノテーション、検出のための119,399のバウンディングボックスによって、既存のリソースを大幅に拡張している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:39:58 GMT)
Metis: Training Large Language Models with Advanced Low-Bit Quantization [28.6]
メティス(Metis)は、異方性スペクトルを独立量子化のためのより狭い部分分布に分割するフレームワークである。 100Bトークンで訓練されたLLaMA-3 8Bでは、メティスは重量、アクティベーション、勾配のFP4量子化による堅牢なW4A4G4トレーニングを可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:05:18 GMT)
Humanline: Online Alignment as Perceptual Loss [28.2]
オンラインのオンラインオンラインサンプリングは、そのモデルが生み出すことができる人間の知覚分布をよりよく近似する。我々の理論はさらに、オンライン/オフライン自体が人間の実用性を最大化するのに付随していることを示唆している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:41:16 GMT)
Implicit-ARAP: Efficient Handle-Guided Neural Field Deformation via Local Patch Meshing [28.2]
本稿では,ハンドル誘導型ニューラルフィールド変形の新しい手法を提案する。本手法は, 変形品質, 頑健性, 計算効率において, ベースラインを一貫して上回ることを示す。我々の研究は、スケーラブルで高品質なニューラルフィールドの変形を可能にし、他の幾何学的タスクをニューラルドメインに拡張する方法を舗装する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:40:46 GMT)
Adversarial Reinforcement Learning Framework for ESP Cheater Simulation [27.7]
エクストラ・センセーショナル・パーセプション(ESP)の不正行為は、プレイヤーの行動において直接観察できないため、検出が困難である。本研究では,ESPチーター,非チーター,トラジェクトリベース検出器のモデル化のためのシミュレーションフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:32:45 GMT)
Forge4D: Feed-Forward 4D Human Reconstruction and Interpolation from Uncalibrated Sparse-view Videos [27.6]
本研究では,非校正されたスパースビュー映像からの時間的整列表現を効率よく校正するフィードフォワード4次元人間の再構成とモデルを提案する。新たに,隣接する2つのフレーム間の3次元ガウス運動の高密度な動きを予測するための動き予測モジュールを設計した。実験では、ドメイン内データセットとドメイン外データセットの両方において、モデルの有効性を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:47:14 GMT)
BLADE: Block-Sparse Attention Meets Step Distillation for Efficient Video Generation [27.6]
本稿では,ビデオ推論のためのデータフリー共同学習フレームワークBLADEを紹介する。異なるスケールで顕著な効率向上を示す。短いビデオシーケンス長を持つCagVideoX-5Bのようなモデルでは、我々のフレームワークはロバストな8.89倍のスピードアップを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:46:55 GMT)
Neuro-Symbolic Entity Alignment via Variational Inference [27.5]
NeuSymEAは統合されたニューロシンボリック推論フレームワークである。強靭なエンティティアライメントのために、クロスKG構造パターンを利用する。 NeuSymEAは、強いベースラインと比較して、$textDBP15K_textZH-EN$で7.6%改善されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:16:21 GMT)
Efficient Federated Learning against Byzantine Attacks and Data Heterogeneity via Aggregating Normalized Gradients [27.4]
Federated Learning (FL)は、クライアントが生データを共有せずに、協力的にモデルをトレーニングすることを可能にする。 FLはByzantine攻撃やデータ不均一性の反復に弱いため、パフォーマンスが著しく低下する可能性がある。フェデレート正規化勾配アルゴリズム (Federated Normalized Gradients Algorithm, NGA) を提案する。既存手法に対するベンチマーク収束の実験結果
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:35:49 GMT)
FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing [27.4]
置換関数共有kan (FS-KAN) は任意の置換対称性群に対して同変かつ不変なKA層を構築するための原理的アプローチである。 FS-KANは標準パラメータ共有層よりも優れたデータ効率を示すことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:49:09 GMT)
VGGT-X: When VGGT Meets Dense Novel View Synthesis [27.4]
我々は3次元基礎モデル(3DFM)を高密度新規ビュー合成(NVS)に適用する問題について検討する。我々の研究は、3DFMを高密度に拡大することは、VRAM負荷を劇的に増加させ、3Dトレーニングを低下させる不完全な出力の2つの基本的な障壁に直面することを明らかにした。本稿では,1000以上の画像にスケール可能なメモリ効率のよいVGGT実装,VGGT出力向上のための適応的グローバルアライメント,堅牢な3DGSトレーニングプラクティスを取り入れたVGGT-Xを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:59 GMT)
Uni-X: Mitigating Modality Conflict with a Two-End-Separated Architecture for Unified Multimodal Models [27.4]
We propose Uni-X, a two-end-separated, middle-shared architecture for unified multimodal model。 Uni-Xは、その初期層と最終層をモダリティ固有の処理に捧げ、ハイレベルなセマンティックフュージョンのために中間層で共有パラメータを維持している。この結果から,Uni-Xは将来の統一マルチモーダルモデリングのためのパラメータ効率・拡張性の基礎として確立された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:05:10 GMT)
Vision-Zero: Scalable VLM Self-Improvement via Strategic Gamified Self-Play [27.2]
Vision-Zeroは視覚言語モデル(VLM)の自己改善を可能にするフレームワークで、任意の画像ペアから生成される競合視覚ゲームを通じて実現されている。 Vision-Zeroは"Who Is the Spy"スタイルのゲームでVLMを訓練し、モデルが複数の役割にわたる戦略的推論とアクションを行う。既存のゲーミフィケーションフレームワークとは異なり、Vision-Zeroは任意の画像からゲームを生成することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:55:55 GMT)
AIRoA MoMa Dataset: A Large-Scale Hierarchical Dataset for Mobile Manipulation [27.1]
AIRoA MoMaは、モバイル操作のための大規模な実世界のマルチモーダルデータセットである。これには、同期されたRGBイメージ、関節状態、6軸手首力トルク信号、そして内部ロボット状態が含まれる。最初のデータセットは、HSR(Human Support Robot)で収集された25,469エピソードで構成され、LeRobot v2.1フォーマットで完全に標準化されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:51:47 GMT)
Generating Full-field Evolution of Physical Dynamics from Irregular Sparse Observations [26.9]
不規則なスパース観測から物理力学のフルフィールド進化を生成する新しいフレームワークである関数タッカー空間における逐次拡散について述べる。本研究では, 復元精度と計算効率の両面で, 最先端の手法と比較して有意な改善が認められた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:19:07 GMT)
Geo-R1: Unlocking VLM Geospatial Reasoning with Cross-View Reinforcement Learning [26.9]
視覚言語モデルにおける地理空間的推論を解き放つ推論中心のポストトレーニングフレームワークであるGeo-R1を紹介する。足場形成の段階では、Geo-R1は、シンセサイザーチェーン・オブ・シンセサイザー(synthetic chain-of-thinkt exemplars)の教師付き微調整を通じて、地理空間的思考パラダイムを注入する。昇降段階では、弱い教師付きクロスビューペアリングプロキシ上でGRPOベースの強化学習を使用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:34:55 GMT)
EVLF-FM: Explainable Vision Language Foundation Model for Medicine [26.8]
本稿では,多モード視覚言語基盤モデルEVLF-FMについて述べる。 EVLF-FMの開発とテストは、23のグローバルデータセットから13万以上のサンプルを含んでいた。疾患診断のための内部検証では、EVLF-FMは最高平均精度0.858とF1スコア0.797を達成した。医学的な視覚的グラウンドでは、EVLF-FMは平均mIOU 0.743、Acc@0.5 0.837の9つのモードで恒星の性能を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:15:57 GMT)
DHG-Bench: A Comprehensive Benchmark for Deep Hypergraph Learning [26.7]
近年,ハイパーグラフニューラルネットワーク (HNN) が注目されている。 DHG-BenchはHNNの最初の包括的なベンチマークである。我々は22種類のデータセットに対して17の最先端HNNアルゴリズムを包括的に評価した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:21:33 GMT)
When Greedy Wins: Emergent Exploitation Bias in Meta-Bandit LLM Training [26.7]
大規模言語モデル(LLM)は、しばしばシーケンシャルな意思決定において最適に探索する。最近の研究は、教師付き微調整(SFT)や強化学習(RL)を通じてこの能力を向上し、古典的なマルチアームバンディットタスクの後悔を改善することを目指している。本研究では,SFT を用いた LLM の訓練と,RL による様々な報奨信号の学習により,両パラダイムについて検討する。その結果、エージェントは事前訓練されたモデルより優れ、アッパー信頼境界(UCB)やトンプソンサンプリングに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:25:42 GMT)
Inductive Bias and Spectral Properties of Single-Head Attention in High Dimensions [26.6]
合成高次元シークエンスタスクを訓練した単一頭部拘束層における経験的リスクについて検討した。トレーニングやテストエラーのシャープを導き、ウェイトとリカバリしきい値を特定し、学習したウェイトのスペクトル分布の制限を特徴付ける。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:19:31 GMT)
OIG-Bench: A Multi-Agent Annotated Benchmark for Multimodal One-Image Guides Understanding [26.5]
OIG-Benchは、様々な領域にわたるワンイメージガイド理解に焦点を当てたベンチマークである。我々は、プロプライエタリモデルとオープンソースモデルの両方を含む29の最先端MLLMの総合評価を行った。その結果,Qwen2.5-VL-72Bは評価モデルの中で最高の性能を示し,全体の精度は77%であった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:44:08 GMT)
Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns [26.4]
ソフトアクターのためのシーケンス条件付き批評家を紹介する--Critic (SAC) 我々の手法は,重要サンプリング(IS)を伴わずに,短い軌道セグメントを条件付け,複数ステップの戻り値を統合することによって,批判そのものを強化する。その単純さにもかかわらず、私たちのアプローチは標準のSACと強力な非政治ベースラインを一貫して上回ります。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:19:57 GMT)
Robust Policy Expansion for Offline-to-Online RL under Diverse Data Corruption [26.4]
Offline-to-Online Reinforcement Learning (O2O RL)は、現実世界のRLデプロイメントにおいて有望なパラダイムとして登場した。データ破損はポリシーの重大な振る舞いを誘発し、それによってオンライン探索の効率を大幅に低下させる。我々は、$textbfRPEX$: $textbfR$obust $textbfP$olicy $textbfEX$pansionという新しい、シンプルで効果的なメソッドを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:15:42 GMT)
Rethinking Parameter Sharing for LLM Fine-Tuning with Multiple LoRAs [26.2]
マルチタスクファインタニングにおいて,複数の$A$行列と1つの共有$B$を持つ非対称なマルチローラ設計を提案する。提案手法は,既存のマルチLoRA手法と比較して,同等あるいは優れた平均精度でタスク間のバランスの取れた性能を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:16:14 GMT)
AdaBoN: Adaptive Best-of-N Alignment [26.2]
Inference-time計算をより効率的に割り当てるBest-of-Nアライメントのためのプロンプト適応戦略を提案する。レイテンシの懸念から、我々は2段階のアルゴリズムを開発した。我々の手法はシンプルで実用的で、どのLM-RM組み合わせとも互換性がある。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:55:00 GMT)
XQC: Well-conditioned Optimization Accelerates Deep Reinforcement Learning [26.1]
我々は,ソフトアクター・クリティックをベースとした,よく動機付けられた,サンプル効率の高いディープアクター・クリティックアルゴリズムであるXQCを紹介する。 55のプロプリセプションと15の視覚に基づく連続制御タスクにまたがる最先端のサンプル効率を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:58:53 GMT)
RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentangled Representation [25.9]
イベントカメラはスパースだが時間的に高解像度のモーション情報を提供する。ダイナミックビジョンセンサー(DVS)の閾値を上げることでノイズを低減できるが、これは必然的にイベントの過度な報告を引き起こす。本稿では,モダリティ特異的な不整合表現を備えたロバストイベント誘導型デブロワーリングネットワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:03:14 GMT)
MANI-Pure: Magnitude-Adaptive Noise Injection for Adversarial Purification [25.9]
我々は、入力の等級スペクトルを利用して浄化過程を導出する等級適応浄化フレームワークMANI-Pureを紹介する。均一なノイズを注入する代わりに、MANI-Pureは不均一で周波数目標のノイズを適応的に適用し、脆弱な高周波低磁気帯域における対向的摂動を効果的に抑制する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:22:40 GMT)
R-Capsule: Compressing High-Level Plans for Efficient Large Language Model Reasoning [25.9]
CoT(Chain-of-Thought)は、大規模言語モデル(LLM)が明確なステップバイステップの合理性を引き出すことによって、複雑な推論に対処するのに役立つ。提案するReasoning Capsule (R-Capsule) は,遅延推論の効率と明示的なCoTの透明性の両立を目的としたフレームワークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:19:32 GMT)
ThinkEdit: Interpretable Weight Editing to Mitigate Overly Short Thinking in Reasoning Models [25.9]
推論モデルの隠れ表現に、推論の長さがどのように埋め込まれているかを検討する。我々は、過剰に短い推論の問題を軽減するために、シンプルだが効果的な重み付けアプローチであるThinkEditを紹介した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:24:51 GMT)
PAD3R: Pose-Aware Dynamic 3D Reconstruction from Casual Videos [25.8]
PAD3Rは、カジュアルにキャプチャーされたモノクロビデオから変形可能な3Dオブジェクトを再構成する方法である。その中心となるアプローチは、事前訓練された画像から3Dモデルによって教師される、パーソナライズされたオブジェクト中心のポーズ推定器を訓練する。 PAD3Rは、生成前の先行と異なるレンダリングを組み合わせることで、カテゴリーに依存しない方法で、高忠実で明瞭なオブジェクトの3D表現を再構築する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:33 GMT)
SeaPO: Strategic Error Amplification for Robust Preference Optimization of Large Language Models [25.7]
大規模言語モデルで一般的に発生する3つのエラータイプを活用する戦略的誤り増幅手法であるSeaPOを紹介する。その結果,SeaPOはモデル全体の性能を,特に真性の観点から著しく改善した。最も一般的なエラータイプを注入すると、関連するタスクのパフォーマンスが向上する一方、エラータイプが混在すると、より広範なパフォーマンス向上につながる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:42:41 GMT)
A Model Zoo on Phase Transitions in Neural Networks [25.6]
重量空間学習法は、訓練されたモデルの集団を、開発と評価のためのデータセットとして要求する。モデル動物園と呼ばれる既存のモデルのコレクションは、構造化されていないか、多様性の初歩的な定義に従っている。我々は、モデル動物園のアイデアとフェーズ情報を組み合わせることで、人口の多様性の制御された概念を創出する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:13:22 GMT)
Fuzzy Information Evolution with Three-Way Decision in Social Network Group Decision-Making [25.5]
グループ意思決定(GDM)のシナリオでは、不確実性、動的な社会構造、曖昧な情報が大きな課題である。本研究では,3方向決定(3WD)理論,動的ネットワーク再構築,言語的意見表現を統合した,新たなソーシャルネットワークグループ意思決定フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:29:24 GMT)
ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration [25.5]
大規模言語モデル(LLM)は、インテリジェントなマルチロボットコラボレーションを可能にするが、基本的なトレードオフに直面している。本稿では,アクションチェーンを導入した新たなフレームワークであるELHPlanを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:15:56 GMT)
Causal-Adapter: Taming Text-to-Image Diffusion for Faithful Counterfactual Generation [25.4]
Causal-Adapterは、凍結したテキストから画像への拡散バックボーンを、反ファクト画像生成に適応させるモジュラーフレームワークである。本手法は目的属性に対する因果的介入を可能にし,画像のコアアイデンティティを変更することなく因果的依存者に対する影響を一貫して伝播させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:49:28 GMT)
Interactive Program Synthesis for Modeling Collaborative Physical Activities from Narrated Demonstrations [25.0]
協調的なタスクは、本質的に曖昧で動的なプロセスであるチームメイト意図について、ユーザの仮定を推測するシステムを必要とします。これにより、解釈可能で修正可能な表現が必要となり、ユーザーはシステムの振る舞いを検査し、洗練することができる。本システムでは,動作を編集可能なプログラムとして表現し,学習,検査,システム論理の修正のための統一的なモダリティとして,ペアリングされた物理行動と自然言語を用いたナレーションを用いた実演を行う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:44:05 GMT)
Leveraging Temporally Extended Behavior Sharing for Multi-task Reinforcement Learning [25.0]
マルチタスク強化学習(MTRL)は、サンプル効率を改善するための有望なアプローチを提供する。多様なタスクデータを収集するコストが高いため、MTRLをロボット工学に適用することは依然として困難である。 MTRL環境における試料効率を向上させる新しい探索手法MT-L'evyを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:16:21 GMT)
Diversity-Enhanced Reasoning for Subjective Questions [24.9]
多様性を高めるトレーニングフレームワークであるMultiRole-R1は、様々な役割の観点から推論チェーンを合成する。ドメイン内精度とドメイン外精度を14.1%と7.64%向上させ、AIME 2024のような高度な数学推論の性能も向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:38:32 GMT)
A Greedy PDE Router for Blending Neural Operators and Classical Methods [24.8]
最適なハイブリッド反復解法が設計され、各イテレーションにおいて、ソルバのアンサンブルからソルバが選択され、それらの相補的な強みを利用する。最適解に対する定数要素を保証するためには、欲求選択戦略が望ましいが、各ステップにおける真のエラーの知識が必要である。本稿では,解法選択に対するグリージーアプローチを効率的に模倣する近似グリージールータを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:02:27 GMT)
H+: An Efficient Similarity-Aware Aggregation for Byzantine Resilient Federated Learning [24.7]
Federated Learning (FL)は、生データを共有することなく、分散モデルトレーニングを可能にする。 FLは、中央サーバでローカルに更新されたパラメータの集約を損なう可能性があるByzantine攻撃に対して脆弱なままである。類似性を認識したアグリゲーションは、悪意のあるクライアントを特定してフィルタリングすることで、このような攻撃を軽減する効果的な戦略として現れている。クリーンなデータを持つシナリオにおいて既存のメソッドよりも優れているだけでなく,クリーンなデータを持たないFLシステムにも適用可能な,新しい類似性を考慮したアグリゲーション手法であるH+を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:28:51 GMT)
DocHPLT: A Massively Multilingual Document-Level Translation Dataset [24.7]
DocHPLTは、これまでで最大のドキュメントレベルの翻訳データセットである。 50言語にまたがる1億2400万行の文書が英語と組み合わせられ、そのうち426億行が文化されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:48:34 GMT)
Calibrating Verbalized Confidence with Self-Generated Distractors [24.6]
DINCO(Distractor-Normalized Coherence)を紹介する。 DINCOは、LLMの予測可能性バイアスを推定し、いくつかの自己生成障害に対してモデルに独立して信頼性を持たせることによって説明している。我々は、自己整合性の一般的なアプローチを、サンプル世代間でのコヒーレンスを活用すること、および非互換なクレーム上での検証におけるコヒーレンスを活用することとして、言語化された信頼を正規化したものである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:41:22 GMT)
Structural Reward Model: Enhancing Interpretability, Efficiency, and Scalability in Reward Modeling [24.6]
Structure Reward Model (SRM) はサイドブランチと補助機能ジェネレータを統合したモジュラーフレームワークである。粒度の細かい寸法を導入することで、RMは解釈可能で効率的な評価、ターゲット診断、最適化を可能にします。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:09:25 GMT)
KANO: Kolmogorov-Arnold Neural Operator [24.5]
Kolmogorov--Arnold Neural Operator (KANO) 本稿では、スペクトルベースと空間ベースの両方でパラメータ化された二重ドメインニューラル演算子であるKanoを紹介した。量子ハミルトニアン学習ベンチマーク(英語版)において、カノは、係数の4番目の十進位に正確である閉形式の記号表現で、接地トルースハミルトニアンを再構成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:51:09 GMT)
Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct [24.4]
DiDi-Instructは、高速言語生成モデルにつながるトレーニングベースの手法である。 OpenWebTextでは、DiDi-Instructはすべてのアクセラレーションされた言語生成モデルより優れています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:55:44 GMT)
Data Uniformity Improves Training Efficiency and More, with a Convergence Framework Beyond the NTK Regime [24.4]
より均一に分散したデータを選択することで、トレーニング効率が向上し、性能が向上することを示す。具体的には、より均一な(バイアスのない)分布が、データポイント間の最小ペア距離を大きくすることを示す。理論的には、ニューラルネットワークの近似誤差は、h_min$が増加するにつれて減少する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:02 GMT)
Alignment-Sensitive Minimax Rates for Spectral Algorithms with Learned Kernels [24.3]
我々は、アライメントに敏感な複雑性尺度である有効スパンディメンション(ESD)を導入する。 ESDが少なくとも$K$のシーケンスモデルでは、ミニマックス超過リスクは$sigma2K$とスケールする。この発見は、適応的特徴学習とスペクトルアルゴリズムの一般化における証明可能な改善との関連性を確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:11:26 GMT)
Lightweight and Robust Federated Data Valuation [24.2]
フェデレーテッド・ラーニング(FL)は、非IIDデータ分散と敵対的クライアントの振る舞いにより、永続的な課題に直面している。提案するFLアグリゲーションフレームワークであるFedIFは,トラジェクトリに基づく影響推定を利用して,クライアントのコントリビューションを効率的に計算する。実世界の展開において,FedIFは,効率的かつ堅牢なFLを実現するために,Shapley値ベースのアプローチに代わる実用的で理論的に基礎的かつスケーラブルな代替手段として確立されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:31:56 GMT)
Sparse Covariance Neural Networks [24.0]
本稿では,サンプル共分散行列にスペーシフィケーション手法を適用し,後者をVNNアーキテクチャに組み込むフレームワークを提案する。 S-VNNは、名目VNNや類似のスパース主成分分析よりも有限サンプル共分散推定の方が安定であることを示す。我々は、脳データから人間の行動認識まで、様々な応用シナリオに関する実験結果を用いて、理論的な結果をサポートし、タスク性能の向上、安定性の向上、代替よりも計算時間を短縮した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:35:01 GMT)
Coupling Generative Modeling and an Autoencoder with the Causal Bridge [23.9]
我々は、治療(介入)の因果効果が、治療と結果の両方に影響を与える潜在的に観察されていない共同設立者がいる状況における関心の結果に与える影響を推測する。これは、治療と結果に関連する2つの異なる制御(プロキシ)のセットへのアクセスを仮定することで達成できる。本稿では,CBによる治療効果を推定可能な場合の関連する仮定と,CBの仮定に違反した場合の処理効果の平均誤差について述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:46:54 GMT)
R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning [23.8]
R1-Code-Interpreterは,マルチターン制御微調整(SFT)と強化学習(RL)によって訓練されたテキストのみの大規模言語モデル(LLM)の拡張である。 144種類の多種多様な推論・計画タスクにまたがる汎用コードインタープリタのトレーニングは,タスクの不均一性や有効サンプルの不足による重大な課題を呈している。最終モデルであるR1-CI-14Bは、37のテストタスクの平均精度を44.1%から72.4%に改善し、テキストのみのGPT-4o (58.6%) と GPT-4o with Code Interpreter (70.9%) を上回りました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:29:09 GMT)
AdaRank: Adaptive Rank Pruning for Enhanced Model Merging [23.6]
モデルマージは、独立して微調整されたモデルを統合されたフレームワークに統合するための有望なアプローチとして現れている。 AdaRankは、タスクベクトルの最も有用な特異な方向を適応的に選択し、複数のモデルをマージする新しいモデルマージフレームワークである。 AdaRankは、さまざまなバックボーンとタスク数で一貫して最先端のパフォーマンスを実現し、微調整されたモデル間のパフォーマンスギャップを1%近く削減している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:23:36 GMT)
Hardware-Aware Parallel Prompt Decoding for Memory-Efficient Acceleration of LLM Inference [23.6]
LLM(Large Language Models)の自動回帰デコーディングは、ハードウェアの性能に大きなオーバーヘッドをもたらす。トレーニング可能なパラメータを0.0002$%しか必要とせず,A100-40GBのGPUをたった16時間で効率的にトレーニングできる並列プロンプトデコーディングを提案する。我々のアプローチでは、最大2.49$times$ スピードアップを示し、最小のメモリオーバーヘッドは0.0004$%である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:16:53 GMT)
Fast and Fluent Diffusion Language Models via Convolutional Decoding and Rejective Fine-tuning [23.6]
Autoregressive (AR)言語モデルでは、テキストを1つずつ生成することで、推論速度が制限される。本稿では,デコードウインドウを狭める正規化法であるConal decoding (Conv)を提案する。 Rejecting Rule-based Fine-Tuning (R2FT)も導入しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:50:10 GMT)
When MCP Servers Attack: Taxonomy, Feasibility, and Mitigation [23.6]
モデルコンテキストプロトコル(MCP)サーバは、AIアプリケーションがプラグアンドプレイ方式で外部システムに接続できるようにする。このようなプレッシャーのかかるリスクにもかかわらず、CPサーバのセキュリティへの影響はいまだ過小評価されている。 MCPサーバをアクティブな脅威アクターとして扱い、それらをコアコンポーネントに分解する最初の体系的な研究を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:29:58 GMT)
Rare-to-Frequent: Unlocking Compositional Generation Power of Diffusion Models on Rare Concepts with LLM Guidance [23.5]
拡散モデルの合成生成能力は,大規模言語モデル指導によって著しく向上できることを示す。本稿では、レア・ツー・頻繁なコンセプトガイダンスを計画し、実行するためのトレーニングフリーアプローチR2Fを提案する。我々のフレームワークは、事前訓練された拡散モデルやLLMに対して柔軟であり、領域誘導拡散アプローチとシームレスに統合することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:20:27 GMT)
Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning [23.5]
我々はUnified Neural Topological Foundation Model (Uni-NTFM)を紹介する。 Uni-NTFMは神経科学の原理に基づいて設計され、普遍的で解釈可能な表現を生成する。最大のモデルであるUni-NTFM$_large$は記録破りの1.9Bパラメータを持ち、28,000時間以上の多様な脳波データを事前訓練した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:03:32 GMT)
A Text-To-Text Alignment Algorithm for Better Evaluation of Modern Speech Recognition Systems [23.2]
現代のニューラルネットワークは、音声認識ベンチマークのパフォーマンスを大幅に改善した。稀な用語、名前付きエンティティ、ドメイン固有の語彙の誤りは、より簡潔であるが、集約されたメトリクスによって隠されている。本稿では,動的プログラミングとビーム探索スコアリングを結合したアライメントアルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:53:02 GMT)
SRA-CL: Semantic Retrieval Augmented Contrastive Learning for Sequential Recommendation [23.1]
SRA-CL(Semantic Retrieval Augmented Contrastive Learning)という新しい手法を提案する。 SRA-CLはLLMのセマンティック理解と推論機能を活用し、ユーザの好みやアイテムの特徴をキャプチャする表現的な埋め込みを生成する。 SRA-CLはプラグイン・アンド・プレイの設計を採用しており、既存のシーケンシャルレコメンデーションアーキテクチャとシームレスに統合できる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:51:55 GMT)
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting [22.9]
本稿では,透かしの整合性とレンダリング品質を保った圧縮耐性3DGS透かし法を提案する。我々のアプローチでは、アンカーベースの3DGSを使用して、透かしをアンカー属性、特にアンカー機能に埋め込む。また、トレーニング中に量子化ノイズを注入し、圧縮後の透かしを保存する量子化歪み層を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:20:26 GMT)
A Quantum Computer Based on Donor-Cluster Arrays in Silicon [22.8]
ホスホラス(P)をドープしたスピン量子ビットはコヒーレンスに優れ、99.9%を超える高忠実な2量子ビットゲートを証明している。核スピン量子ビットに対するスケーラブルなクラスタアレイアーキテクチャとそれに対応する制御プロトコルを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:16:05 GMT)
Sometimes I am a Tree: Data Drives Unstable Hierarchical Generalization [22.7]
初期の訓練では、LMはn-gramモデルのように振る舞うことができるが、最終的には木に基づく構文規則を学び、階層的に分布から一般化する。制御された文法学習タスク(質問形成と時制インフレクション)を用いて、このシフトを研究する。これらの結果は、学習データの一般化形成における中心的な役割を強調し、なぜ競合戦略が不安定な結果をもたらすのかを説明する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:50 GMT)
Blockwise Missingness meets AI: A Tractable Solution for Semiparametric Inference [22.7]
我々は,データの特徴がブロックワイドで非単調な場合のパラメータ推定と推定について考察する。我々のアプローチは半パラメトリック理論に根ざし、予測による推論にインスパイアされ、既成のAI(予測的または生成的)モデルを活用して、完全にランダムなメカニズムで処理する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:17:28 GMT)
BitHydra: Towards Bit-flip Inference Cost Attack against Large Language Models [22.7]
モデル重みを直接修正し,漏洩したLLMの全ユーザに対して持続的オーバーヘッドを誘発する,最初のビットフリップ推論コスト攻撃を導入する。この攻撃パラダイムをBitHydraでインスタンス化し、(1)シーケンス終端トークン(EOS)を抑制する損失を最小限に抑え、(2)EOS埋め込みベクトルに焦点をあてた効率的かつ効果的なクリティカルビット探索を利用する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:08:08 GMT)
Training-Free Multimodal Guidance for Video to Audio Generation [22.6]
Video-to-audio (V2A) の生成は、サイレントビデオから現実的でセマンティックに整合したオーディオを合成することを目的としている。既存のアプローチでは、大規模なペアデータセットでのコストのかかる共同トレーニングが必要か、ペアの類似性に依存している。本稿では,V2A拡散のための新しいトレーニングフリーマルチモーダル誘導機構を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:00:36 GMT)
Beyond Manuals and Tasks: Instance-Level Context Learning for LLM Agents [22.6]
大規模言語モデル(LLM)エージェントは通常、インタラクションインターフェースとグローバルルールを定義する環境レベルのマニュアルと、特定の目標に関連するタスクレベルのガイダンスまたはデモの2つの種類のコンテキストを受信する。我々は、複雑なタスクにおいて、LLMエージェントの障害発生源としてインスタンスレベルのコンテキストが欠如していることを論じる。我々は、この問題をインスタンスレベルコンテキスト学習(ILCL)として定式化し、それを解決するためのタスクに依存しない方法を紹介します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:38:51 GMT)
Euclid's Gift: Enhancing Spatial Perception and Reasoning in Vision-Language Models via Geometric Surrogate Tasks [22.5]
ユークリッド幾何学の問題解決を代理課題として扱う。モデルがユークリッドの原理を取得し、適用できるようにするため、Qwen2.5VLファミリーとRoboBrain2.0ファミリーを微調整する。実験により, 得られたモデルが4つの空間的推論ベンチマークにおいて, 実質的なゼロショットゲインを達成できることが実証された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:49:21 GMT)
Risk-Sensitive RL for Alleviating Exploration Dilemmas in Large Language Models [22.5]
Reinforcement Learning with Verifiable Rewards (RLVR) は,Large Language Models (LLMs) の強化に有効であることが証明された。リスク感性強化学習フレームワークを導入する。提案手法では,平均と最大報酬を補間するリスク探索の手法を用いて,新しいアルゴリズムを提案する。注目すべきは、RS-GRPOの実装が簡単で、マイナーなコード修正しか必要としないことだ。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:12:20 GMT)
When Autonomous Vehicle Meets V2X Cooperative Perception: How Far Are We? [22.4]
V2X(Van-to-Everything)協調的な知覚は、遠く離れた物体を感知する際の限界に対処する可能性がある。本研究では,エゴ車両の知覚性能に及ぼす協調知覚の影響について検討した。本研究は,協調認識システムの重要な構成要素における潜在的なリスクと脆弱性を明らかにするものである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:28:27 GMT)
TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent [22.4]
本稿では,言語ステガノグラフィーによる自然界のアウトプットにセンシティブな文脈情報を埋め込む,新たな脅威モデルであるTrojanStegoを提案する。本稿では, LLMのリスク要因を概説した分類法を導入し, 脅威のリスクプロファイルを評価する。実験の結果,妥協されたモデルでは,32ビットのシークレットを87%の精度で確実に送信し,97%以上の精度で3世代にわたる過半数投票を行った。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:08:33 GMT)
TR2-D2: Tree Search Guided Trajectory-Aware Fine-Tuning for Discrete Diffusion [22.3]
TRee Search Guided TRajectory-Aware Fine-Tuning for Discrete Diffusion (TR2-D2) 本稿では,Tree Search Guided TRajectory-Aware Fine-Tuning for Discrete Diffusion (TR2-D2)を紹介した。これらのバッファはモンテカルロ木探索(MCTS)を用いて生成され、その後、最適制御目的の下で事前学習された離散拡散モデルを微調整するために使用される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:58:45 GMT)
Composite nonadiabatic geometric quantum gates with optimization on superconducting circuits [22.2]
本稿では,OCNGQGの最適化手法を提案する。具体的には,経路パラメータを最適化することにより,両方向の系統的誤りを効果的に抑制する。数値シミュレーションにより,本手法は2種類の誤差に対して優れたゲートロバスト性を示すことが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:00:49 GMT)
Adaptive Canonicalization with Application to Invariant Anisotropic Geometric Networks [22.0]
ニューラルネットワークにおいて対称性を強制する一般的なフレームワークである強調正準化を導入する。この構造は、普遍近似特性を持つ連続的および対称性を反映するモデルをもたらすことを証明している。 i)スペクトルグラフニューラルネットワークにおける固有ベイシスの解法と(ii)点雲における回転対称性の扱いの2つの方法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:59:46 GMT)
Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO [22.0]
グループ相対ポリシー最適化は、グループ内のすべてのレスポンスが正しくない場合にポリシーを更新できない。この制限は、人工知能と人間の知性の間に重要なギャップを浮き彫りにする。グループ内に応答の多様性を取り入れることで、全負のサンプル問題を緩和するシンプルなフレームワークを導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:17:57 GMT)
PoI: A Filter to Extract Pixel of Interest from Novel View Synthesis for Scene Coordinate Regression [21.9]
新たなビュー合成(NVS)技術は、レンダリングされた画像でトレーニングデータを拡張することで、カメラのポーズ推定を強化することができる。これらの方法で撮影された画像は、しばしばぼやけ、カメラポーズ推定のためのトレーニングデータとして信頼性を損なう。本稿では,トレーニング中に最適な画素を動的に識別・破棄する二基準フィルタリング機構を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:18:07 GMT)
Boolean Satisfiability via Imitation Learning [21.9]
我々は、競合駆動型節学習(CDCL)問題解決のための分岐ポリシーであるImitSATを提案する。 ImitSATは、専門家のKeyTraceから学んだ。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:09:37 GMT)
Knowledge Editing with Subspace-Aware Key-Value Mappings [21.8]
Subspace Knowledge Edit (SUIT) は、編集に関連する重要な機能のサブスペースのみを特定し、修正する手法である。以上の結果から,SuITは高い編集効率を維持しつつ,強いベースライン上での知識保存を劇的に改善することが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:17:42 GMT)
B-cos LM: Efficiently Transforming Pre-trained Language Models for Improved Explainability [21.7]
自然言語処理(NLP)タスクに有効なB-cos言語モデル(LM)を導入する。提案手法は,B-cos変換とタスク細調整を組み合わせることで,事前学習した言語モデルをB-cos LMに変換する。自動評価の結果,B-cos LMはポストホック法よりも信頼性が高く,人間の解釈可能な説明が得られていることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:00:09 GMT)
ASIA: Adaptive 3D Segmentation using Few Image Annotations [21.7]
ASIA(Adaptive 3D using few Image s)は、3Dで非意味的かつ非テキスト記述可能な「部分」のセグメンテーションを可能にする新しいフレームワークである。本手法は,画像空間から3次元へのセグメンテーションの転送に,SD(Stable Diffusion)などのテキスト・画像拡散モデルのリッチな先行性を利用する。 ASIAは意味的および非意味的な3Dセグメンテーションタスクに対して実用的で一般化可能なソリューションを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:04:11 GMT)
ReactDance: Hierarchical Representation for High-Fidelity and Coherent Long-Form Reactive Dance Generation [21.7]
我々は,新しい階層型潜在空間で動作する拡散フレームワークであるtextbfReactDanceを紹介する。 ReactDanceは、動作品質、長期コヒーレンス、サンプリング効率において、最先端の手法を大幅に上回ることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:59:21 GMT)
A Neurosymbolic Fast and Slow Architecture for Graph Coloring [21.6]
制約満足度問題(CSP)は人工知能に重大な課題をもたらす。既存のシンボリック・ソルバは、しばしば遅く、以前の研究では、LLM(Large Language Models)は、その複雑さのため、CSP(Large Language Models)のみに苦しむことが示されている。我々は、Daniel Kahneman氏の'Thinking, Fast and Slow'の認知モデルをAIに適用する既存のSOFAIアーキテクチャ(SOFAI_v1)の上に構築する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:57:36 GMT)
Learning to Parallel: Accelerating Diffusion Large Language Models via Adaptive Parallel Decoding [21.6]
大規模言語モデル(LLM)における自己回帰復号には、$n$トークンに対して$mathcalO(n)$シーケンシャルステップが必要である。本稿では,並列デコード学習(Learn2PD)を提案する。これは軽量かつ適応的なフィルタモデルをトレーニングし,各トークン位置に対して,現在の予測が最終出力と一致するかどうかを予測するフレームワークである。この学習されたフィルタは、正しく予測された場合にのみトークンをアンマスクするオラクル並列復号法を近似する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:54 GMT)
OmniPlay: Benchmarking Omni-Modal Models on Omni-Modal Game Playing [21.6]
オムニプレイ(OmniPlay)は、全知覚スペクトルにおけるエージェントモデルの融合と推論能力を調査するために設計された診断ベンチマークである。高忠実度メモリタスクに超人的性能を示すが、堅牢な推論と戦略的計画を必要とする課題において、体系的な失敗に苦しむ。以上の結果から, AGI への道のりは, 相乗的融合に明示的に対処するためには, スケーリング以上の研究が必要であることが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:48:39 GMT)
UP2You: Fast Reconstruction of Yourself from Unconstrained Photo Collections [21.6]
UP2Youは、非拘束の2D写真から高精細度の3D肖像画を再構築するためのチューニング不要のソリューションだ。 UP2Youの中心は、ポーズ関連フィーチャーアグリゲーションモジュールである。 4D-Dress, PuzzleIOI, in-the-wild captures の実験では、UP2You は幾何学的精度とテクスチャ忠実度の両方において、従来手法を一貫して上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:06:00 GMT)
Mitigating Visual Hallucinations via Semantic Curriculum Preference Optimization in MLLMs [21.5]
MLLM(Multimodal Large Language Models)は様々なタスクのパフォーマンスを大幅に向上させたが、視覚幻覚に悩まされ続けている。本稿では,MLLMアライメントのための新しいフレームワークであるSemantic Curriculum Preference Optimization (SCPO)を提案する。 SCPOは、私たちのSemantic Curriculum Preference Pairsデータセット上に構築された、進歩的で、容易にハードなカリキュラムを採用しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:03:36 GMT)
Functional Complexity-adaptive Temporal Tensor Decomposition [21.4]
機能的アンダーラインコンプレシティ-アンダーライン適応アンダーラインテンソルダンダーラインエコレーション(textscCatte)を提案する。提案手法では,連続的な空間指標を学習可能なフーリエ特徴としてエンコードし,潜時空間におけるニューラルODEを用いて時間的要因の軌跡を学習する。分析的エビデンスを低く抑えた効率的な変分推論手法を開発し,サンプリング不要な最適化を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:30:12 GMT)
Adaptive Conformal Guidance for Learning under Uncertainty [21.4]
本稿では,適応型コンフォーマルガイダンス(AdaConG)を提案する。 AdaConGは、潜在的に誤解を招く信号への依存を減らし、学習性能を向上させる。 AdaConGは知識蒸留、半教師付き画像分類、グリッドワールドナビゲーション、自律運転など様々なタスクで検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:06:11 GMT)
United We Stand: Towards End-to-End Log-based Fault Diagnosis via Interactive Multi-Task Learning [21.3]
Chimeraは、新しいエンドツーエンドのログベースの障害診断手法である。異常検出と根本原因の局在のギャップを埋める。産業用クラウドプラットフォームとして運用に成功している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:03:23 GMT)
PRIVMARK: Private Large Language Models Watermarking with MPC [21.3]
プライバシ問題に対処するために,セキュアなマルチパーティ計算 (MPC) ベースのプライベート LLM 透かしフレームワーク PRIVMARK を提案する。本研究では,最先端LLMの透かし手法であるPostMarkを調査し,その基本動作を定式化する。そこで我々は,MPCプリミティブをブラックボックス方式で,これらの操作のための効率的なプロトコルを構築した。このようにして、PRIVMARKは、複数のパーティが、モデルの重みを単一のコンピューティングパーティに公開することなく、LCMの出力を協調的にウォーターマークすることができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:34:09 GMT)
Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features [21.2]
本稿では、任意の機能の下で線形TD($lambda$)演算に対する最初の$L2$収束率を確立する。任意の特徴から生じる解の潜在的非特異性に対処するために、単一点ではなく解集合への収束率を特徴とする新しい近似結果を開発する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:16:06 GMT)
PROFusion: Robust and Accurate Dense Reconstruction via Camera Pose Regression and Optimization [21.2]
リアルタイムの密集したシーン再構築はロボティクスにとって不可欠である。現在のRGB-D SLAMシステムは、カメラが大きな視点の変化、速い動き、突然の揺れを経験したときに失敗する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:20:49 GMT)
FreeRet: MLLMs as Training-Free Retrievers [21.0]
FreeRetは、任意のMLLMを2段階のレトリバーに変換するプラグイン・アンド・プレイフレームワークである。 MMEBとMMEB-V2のベンチマークでは、FreeRetは何百万ものペアでトレーニングされたモデルよりも大幅に優れています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:28:42 GMT)
MindVL: Towards Efficient and Effective Training of Multimodal Large Language Models on Ascend NPUs [20.8]
MindVLは、Ascend NPUでエンドツーエンドに訓練されたマルチモーダルな大規模言語モデルである。我々は,安定かつ高性能なトレーニングを支援する,高効率なトレーニングフレームワークであるMindSpeed-MLLMを紹介した。異なるシーケンス長でトレーニングされたチェックポイントから平均的な重み付けが特に有効であることが判明した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:44:58 GMT)
FuncPoison: Poisoning Function Library to Hijack Multi-agent Autonomous Driving Systems [20.7]
我々はFuncPoisonを紹介した。FuncPoisonは、機能ライブラリをターゲットにした中毒ベースの攻撃である。 FuncPoisonは、エージェントが関数ライブラリにアクセスする方法における2つの重要な弱点を利用する。我々はFuncPoisonを2つの代表的なマルチエージェント自動運転システム上で実験的に評価した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:56:23 GMT)
DAL: A Practical Prior-Free Black-Box Framework for Non-Stationary Bandits [20.5]
我々は,非定常的盗賊問題に対して,検出強化学習(DAL)と呼ばれる実用的なブラックボックスフレームワークを導入する。 DALは任意の定常バンディットアルゴリズムを入力として受け入れ、変更検出器で拡張し、すべての一般的なバンディット変種に適用可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:29:23 GMT)
Rethinking Unsupervised Cross-modal Flow Estimation: Learning from Decoupled Optimization and Consistency Constraint [20.5]
DCFlowは、教師なしのクロスモーダルフロー推定フレームワークである。本稿では,タスク固有の監督機能を備えた非結合最適化戦略を導入し,モダリティの相違と幾何学的相違を明確に解消する。評価のために、パブリックデータセットを再取得することで、包括的なクロスモーダルフローベンチマークを構築する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:10:41 GMT)
LogAction: Consistent Cross-system Anomaly Detection through Logs via Active Domain [20.4]
アクティブドメイン適応に基づく新しいログベース異常検出モデルであるLogActionを提案する。一方、成熟したシステムのラベル付きデータを使用してベースモデルをトレーニングし、アクティブな学習におけるコールドスタート問題を緩和する。一方、LogActionは、自由エネルギーに基づくサンプリングと不確実性に基づくサンプリングを利用して、手動ラベリングのための分布境界に位置するログを選択する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:09:19 GMT)
Improving Generalizability and Undetectability for Targeted Adversarial Attacks on Multimodal Pre-trained Models [20.4]
マルチモーダル事前学習モデルには、一般化可能性と非検出性という2つの側面がある。具体的には、工芸目的敵例(AE)は、クロスモーダルアライメントタスクにおいて、部分的に知られている、または意味的に類似したターゲットに限定的な一般化を示す。本稿では,複数のソース・モーダル・ターゲット・モーダル・プロキシを利用してターゲットAEを最適化するPTA(Proxy Targeted Attack)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:01:30 GMT)
Semantic-Enhanced Time-Series Forecasting via Large Language Models [20.4]
時系列予測は、金融、エネルギー、気象学、IoTアプリケーションにおいて重要な役割を果たす。近年,大規模言語モデル(LLM)の一般化機能を活用して時系列予測に適応し,有望な性能を実現している。本稿では,時系列の固有周期性と異常特性を探索し,意味空間に埋め込むセマンティック拡張LDM(SE-LLM)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:29:47 GMT)
CoDiEmb: A Collaborative yet Distinct Framework for Unified Representation Learning in Information Retrieval and Semantic Textual Similarity [20.3]
統合されたテキスト埋め込みをトレーニングするための統合フレームワークであるCoDiEmbを紹介する。 CoDiEmbは、効果的な共同最適化のための3つの重要なイノベーションを統合している。我々の結果と分析は、このフレームワークがクロスタスクトレードオフを緩和していることを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:05:23 GMT)
Reward-Agnostic Prompt Optimization for Text-to-Image Diffusion Models [20.3]
RATTPOは,様々な報酬シナリオに適用可能なフレキシブルなテスト時間最適化手法である。 RATTPOは、報酬固有のタスク記述を必要とせずに、大きな言語モデル(LLM)のテキストをクエリすることで、最適化されたプロンプトを検索する。経験的結果はRATTPOの汎用性を示し、多様な報酬設定のユーザプロンプトを効果的に強化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:36:01 GMT)
Warm Starts Accelerate Conditional Diffusion [20.2]
拡散や流れマッチングのような生成モデルは、ノイズを徐々に精製することで高忠実度サンプルを生成する。本稿では、簡単な決定論的モデルを用いて条件生成を劇的に高速化するWarm-Start Diffusion(WSD)を紹介する。 WSDは効率的なサンプリング方式において標準拡散を著しく上回る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:09:38 GMT)
NoiseSDF2NoiseSDF: Learning Clean Neural Fields from Noisy Supervision [20.2]
NoiseSDF2NoiseSDFは2次元画像のためのNoss2Noiseパラダイムにインスパイアされている。我々のアプローチは、ノイズの多い監視を通じてノイズの多い点雲から直接、クリーンなニューラルネットワークSDFを学習することを可能にする。本研究では,ShapeNet,ABC,Famous,RealデータセットなどのベンチマークにおけるNosureSDF2NoiseSDFの有効性を評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:18:43 GMT)
An Empirical Analysis of Machine Learning Model and Dataset Documentation, Supply Chain, and Licensing Challenges on Hugging Face [20.2]
人気のモデル共有サイトHugging Faceから抽出された760,460モデルと175,000のデータセットを広範囲に分析する。我々は、Hugging Faceサプライチェーンにおけるドキュメンテーションの現状を評価し、欠陥の実例を報告し、改善のための実用的な提案を提供する。我々の研究結果は、MLモデル/データセットのライセンス管理の改善など、複数の研究の道のりを動機付けています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:52:25 GMT)
FW-Merging: Scaling Model Merging with Frank-Wolfe Optimization [20.1]
本稿では,FW-Merging(FW-Merging)を制約付き最適化問題として紹介する。 FW-Mergingは、データフリーマージ法を32.8%上回り、20ViTモデルをマージした場合、データインフォームされたAdamergingを8.39%上回る。実験の結果、FW-Mergingスケールは様々なモデルソースにまたがっており、16の無関係モデルでは安定であり、20のCVタスクでは16の関連モデルでは15.3%改善され、メモリオーバーヘッドは一定に保たれている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:53:22 GMT)
Model-based Metric 3D Shape and Motion Reconstruction of Wild Bottlenose Dolphins in Drone-Shot Videos [19.8]
モノクロビデオから野生イルカの3次元形状と動きを推定する問題に対処する。異なる海洋環境下で撮影された映像に本手法を適用した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:01:20 GMT)
UI-UG: A Unified MLLM for UI Understanding and Generation [19.7]
UI-UG(UI理解と生成のための統合MLLM)を導入し、両方の機能を統合する。タスク理解には,グループ相対政策最適化(GRPO)を併用したスーパービジョンファインチューニング(SFT)を用い,より詳細な理解を深める。生成タスクでは、さらにDPO(Direct Preference Optimization)を使用して、モデルが人間の好みのUIを生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:59:09 GMT)
Foggy Crowd Counting: Combining Physical Priors and KAN-Graph [19.7]
本稿では,大気散乱の物理的先行性を考慮した群衆計測手法を提案する。濃霧のシナリオでは主流のアルゴリズムに比べて12.2%-27.5%のMAE測定値の削減が達成されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:59:36 GMT)
BloomAPR: A Bloom's Taxonomy-based Framework for Assessing the Capabilities of LLM-Powered APR Solutions [19.7]
ブルームの分類を基盤とした新しい動的評価フレームワークであるBloomAPRを紹介する。我々のフレームワークは、段階的に複雑な推論レベルを越えて、LLMによるAPRソリューションの認知能力を評価するための構造化されたアプローチを提供する。以上の結果から,これらのソリューションは基本的推論能力を示す一方で,合成されたバグによって性能が向上することが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:16:11 GMT)
Controllable Motion Generation via Diffusion Modal Coupling [19.5]
マルチモーダルな事前分布を利用して拡散モデルの制御性を向上する新しいフレームワークを提案する。 Maze2D環境におけるデータセットとマルチタスク制御を用いた動作予測手法の評価を行った。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:44:44 GMT)
ScatterAD: Temporal-Topological Scattering Mechanism for Time Series Anomaly Detection [19.4]
正常試料と異常試料の両方が高次元空間に散在する傾向があることを示す実験的検討を行った。我々は、この分散現象を散乱として定式化し、サンプル表現の平均対距離で定量化する。我々は,学習した時間的および位相的表現の補完を保証するために,対照的な融合機構を導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:03:03 GMT)
FSDENet: A Frequency and Spatial Domains based Detail Enhancement Network for Remote Sensing Semantic Segmentation [19.3]
周波数領域と空間領域に基づく詳細拡張ネットワーク(FSDENet)を提案する。本フレームワークでは,マルチスケールな空間的特徴と細かな意味的詳細を抽出するために,空間処理手法を用いている。 FSDENetは、広く採用されている4つのデータセット上で、最先端(SOTA)のパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:09:09 GMT)
Bird Eye-View to Street-View: A Survey [19.3]
衛星画像からストリートビュー画像がどのように合成されるのかを概観するため、20の最近の研究論文をレビューした。主な発見は, (i) より現実的で正確なストリートビュー画像の合成に新しいディープラーニング技術が必要であること, (ii) 公共利用のためにより多くのデータセットを収集する必要があること, (iii) 生成された画像を適切に評価するためには,より具体的な評価指標を検討する必要があること,である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:34:01 GMT)
Community detection robustness of graph neural networks [19.2]
グラフニューラルネットワーク(GNN)は、属性付きネットワークのコミュニティ検出にますます利用されている。我々は、GCN、GAT、Graph-SAGE、DiffPool、MinCUT、DMoNの6つの広く採用されているGNNアーキテクチャを評価した。教師なしGNNは高いベースライン精度を達成する傾向があるが、教師なしの手法、特にDMoNは強いレジリエンスを維持している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:08:22 GMT)
JSProtect: A Scalable Obfuscation Framework for Mini-Games in WeChat [19.2]
既存のJavaScript難読化ツールは、禁止された処理時間、厳しいランタイムパフォーマンスの劣化、持続不可能なコードサイズインフレーションに悩まされ、大規模アプリケーションには不備である。本稿では,これらの基本的制約を克服するための高スループット並列化難読化フレームワークであるJSProtectを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:13:18 GMT)
Safe In-Context Reinforcement Learning [19.1]
In-context reinforcement learning (ICRL) は、エージェントが事前訓練の後にパラメータを更新せずに配布外テストタスクに適応できる新しいRLパラダイムである。本稿では,ICRLの適応プロセスの安全性を制約付きマルコフ決定プロセスの枠組みで促進する手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:07:32 GMT)
Mitigating Hallucination in Multimodal LLMs with Layer Contrastive Decoding [19.0]
我々はLayerCD(Layer Contrastive Decoding)と呼ばれる単純な手法を提案する。 LayerCDは、異なるレベルの視覚的特徴から生成された出力分布を対比することで幻覚を除去することを目的としている。 2つのベンチマークで広範な実験を行い、LayerCDが現在の最先端を著しく上回っていることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:16 GMT)
Towards a Certificate of Trust: Task-Aware OOD Detection for Scientific AI [18.9]
スコアベース拡散モデルを用いて関節確率を推定する新しいOOD検出法を提案する。このアプローチは入力だけでなく回帰モデルの予測も考慮し、タスク対応の信頼性スコアを提供する。我々の研究は「信頼の証明」を構築するための基本的なステップを提供し、それによってAIベースの予測の信頼性を評価するための実践的なツールを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:21:25 GMT)
NeuroScalar: A Deep Learning Framework for Fast, Accurate, and In-the-Wild Cycle-Level Performance Prediction [18.9]
本稿では,生産ハードウェア上での高忠実なインザワイルドシミュレーションのための新しいディープラーニングフレームワークを提案する。我々のコアコントリビューションは、仮説プロセッサ設計のためのサイクルレベルの性能を予測するために、マイクロアーキテクチャに依存しない機能に基づいて訓練されたDLモデルである。このフレームワークは,大規模なハードウェアA/Bテストと正確な性能解析を可能にすることを実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:23:10 GMT)
d2: Improved Techniques for Training Reasoning Diffusion Language Models [18.8]
マスク拡散言語モデル(DLM)に適した推論フレームワークであるd2を導入する。我々のフレームワークの中心は、サンプリング軌道の確率を正確に推定するためにマスキングの特性に依存する新しいポリシー勾配アルゴリズムである。実験的に、d2はRLのみを使用した従来の拡散推論フレームワークよりも大幅に改善される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:33:05 GMT)
Assessing the risk of future Dunkelflaute events for Germany using generative deep learning [18.8]
ダンケルフルート現象が今後数年間のドイツの電力生産に与える影響について検討する。我々は近年,CMIP6アンサンブルからの気候シミュレーションの大規模化に向け,生成的深層学習の枠組みを適用した。アンサンブル平均におけるドイツにおけるダンケルフルート現象の頻度と持続期間は,歴史的に比較するとほとんど変化がないと推定されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:44:22 GMT)
DM-Codec: Distilling Multimodal Representations for Speech Tokenization [18.8]
音声モデルでは、音声のトークン化と合成が大幅に改善されている。近年,性能向上のための音響・意味トークンの統一化が試みられているが,文脈表現の重要な役割を見落としている。本研究では,(1)文脈情報を組み込んだ言語モデル(LM)誘導蒸留法,(2)LMと自己教師型音声モデル(SM)誘導蒸留技術を組み合わせた2つの新しい蒸留手法を提案する。実験の結果、DM-Codecは最先端の音声トークンモデルを大幅に上回り、WERを最大13.46%、WILを9.82%、音声品質を5.5%改善した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:08:40 GMT)
Differentially Private Clipped-SGD: High-Probability Convergence with Arbitrary Clipping Level [18.7]
本研究では,DPのクリッピングレベルが固定された最初の高確率収束解析法を提案する。提案手法は,固定クリッピングレベルにおいて,既存の方法よりも高速に近傍最適解に収束することを示す。この地区は、DPが導入した騒音とバランスが取れており、収束速度とプライバシー保証のトレードオフが洗練されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:36:44 GMT)
Sheaf Discovery with Joint Computation Graph Pruning and Flexible Granularity [18.7]
ニューラルネットワークモデル(LM)から自己完結型モジュールユニットを抽出するフレームワークであるDiscoGPを紹介する。筆者らのフレームワークは,両者をグラデーション・ベース・プルーニング・アルゴリズムを用いてせん断を同定し,この手法により元のLMを,特定のコア機能を保持するスパーススケルトンに還元する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:07:47 GMT)
A Scalable Distributed Framework for Multimodal GigaVoxel Image Registration [18.6]
FFDPは、かつてない規模の画像登録のための分散フレームワークを補足した、IO対応非GEMM融合カーネルのセットである。我々は,100ミクロンのヒト脳MRI容積をネイティブ解像度でマルチモーダル登録することにより,前例のない機能を示す。 FFDPは既存の最先端最適化とディープラーニング登録パイプラインを最大6～7倍高速化し、ピークメモリ消費量を20～59%削減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:58:40 GMT)
Circuit Distillation [18.6]
本稿では,教師モデルと学生モデルにおける類似回路コンポーネント間の内部表現の整合化を目的とした回路蒸留を提案する。我々は、Llama3ファミリーのモデルを用いて、実体追跡と心の理論(ToM)タスクの回路蒸留を評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:28:36 GMT)
Walk the Talk: Is Your Log-based Software Reliability Maintenance System Really Reliable? [18.6]
本稿では、サービス提供者の信頼を得るためのモデルに対する信頼性基準、診断忠実度を定義する。本稿では,忠実なログに基づく異常検出システムであるFaithLogを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:52:40 GMT)
LUMA: Low-Dimension Unified Motion Alignment with Dual-Path Anchoring for Text-to-Motion Diffusion Model [18.6]
本稿では,2経路アンカーを組み込んだテキスト・ツー・モーション拡散モデルを提案し,セマンティックアライメントを強化する。 FIDスコアはそれぞれ0.035と0.123である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:58:28 GMT)
UML-CoT: Structured Reasoning and Planning with Unified Modeling Language for Robotic Room Cleaning [18.5]
CoT(Chain-of-Thought)は、大規模言語モデル(LLM)の推論を改善するが、非構造化テキストへの依存は、エンボディされたタスクの解釈可能性と実行可能性を制限する。本稿では,UML(Unified Modeling Language)を利用してシンボルCoTと実行可能なアクションプランを生成する構造的推論・計画フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:56:38 GMT)
Multi-Head RAG: Solving Multi-Aspect Problems with LLMs [18.5]
MRAG(Multi-Head RAG)は、マルチアスペクト文書を取得するための新しいスキームである。 MRAGは18RAGベースラインに対して設計上の優位性を示し,検索成功率の最大20%を実証的に改善した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:43:23 GMT)
Think Twice, Generate Once: Safeguarding by Progressive Self-Reflection [18.5]
本稿では,大規模言語モデルを自己監視に活用し,その出力を動的に補正する新しい推論時間手法であるプログレッシブ・セルフリフレクションを紹介する。 Llama-3.1-8B-Instructに提案手法を適用した結果,攻撃成功率は77.5%から5.9%に低下した。提案手法はテスト時間スケーリングの手法として機能し,追加の自己回帰ラウンドによって推論オーバーヘッドのコストで安全性が向上する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:54:28 GMT)
Vision At Night: Exploring Biologically Inspired Preprocessing For Improved Robustness Via Color And Contrast Transformations [18.4]
生物学的に動機づけられた入力前処理によるロバストなセマンティックセグメンテーションについて検討する。 RGB, グレースケール, 反対色チャネルに差分ガウスフィルタを適用することにより, モデルアーキテクチャやトレーニングを変更することなく, 局所コントラストを高めることができる。このような前処理は, 夜間, 霧, 雪等の悪環境に適応しつつ, 流通性能を維持していることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:48:32 GMT)
HealthSLM-Bench: Benchmarking Small Language Models for Mobile and Wearable Healthcare Monitoring [18.4]
小型言語モデル(SLM)は軽量で、モバイルおよびウェアラブルデバイス上でローカルかつ効率的に動作するように設計されている。ゼロショット,少数ショット,命令微調整による健康予測タスクにおけるSLMの評価を行った。その結果,SLMは大規模言語モデルに匹敵する性能を達成でき,効率とプライバシを大幅に向上させることができることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:48:40 GMT)
FuseCodec: Semantic-Contextual Fusion and Supervision for Neural Codecs [18.4]
音声トークン化は、離散表現を可能にし、音声言語モデリングを容易にする。本研究では,FuseCodecを導入し,音響的,意味的,文脈的表現を強力な相互アライメントとグローバルインフォメーション・インフォメーションを通じて統合する。 FuseCodecは、EnCodec、SpeechTokenizer、DACを上回り、転写精度、知覚的品質、インテリジェンス、話者類似性において、LibriSpeechの最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:43:07 GMT)
Bridging the behavior-neural gap: A multimodal AI reveals the brain's geometry of emotion more accurately than human self-reports [18.3]
大規模な類似性判定は、脳の感情幾何学をより忠実に捉えることができることを示す。 MLLMは、リッチで神経に適応した感情表現を自律的に開発できるという、説得力のある証拠を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:22:33 GMT)
Semantic Compression via Multimodal Representation Learning [18.2]
マルチモーダル表現学習は、共有潜在空間における様々なモダリティを整列させる埋め込みを生成する。鍵となるオープンな問題は、セマンティック圧縮を実現する方法であり、マルチモーダル埋め込みのメモリフットプリントを減らすことである。学習後セマンティック圧縮の実現可能性とモダリティギャップの低減との間には,強い関係があることを実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:16:38 GMT)
Exploiting AI for Attacks: On the Interplay between Adversarial AI and Offensive AI [18.1]
攻撃対象としてのAI(Adversarial AI')と、攻撃対象に対する攻撃を開始する手段としてのAI(Offensive AI') この記事では、AIに関連する2つの脅威と、それら間の相互作用について説明する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:26:22 GMT)
DecAlign: Hierarchical Cross-Modal Alignment for Decoupled Multimodal Representation Learning [18.1]
マルチモーダル表現学習は、複数のモーダルをまたいだ共有情報と相補的セマンティック情報の両方をキャプチャすることを目的としている。マルチモーダル表現をモダリティ・ユニク(異種)とモダリティ・コモン(異種)に分離するために設計された,新しい階層的クロスモーダルアライメントフレームワークであるDecAlignを紹介する。広く使われている4つのマルチモーダルベンチマーク実験により、DecAlignは既存の最先端手法を一貫して上回っていることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:31:06 GMT)
Do Natural Language Descriptions of Model Activations Convey Privileged Information? [17.9]
先行作業で使用されるデータセット間での一般的な動詞化手法を批判的に評価する。言語化は,LLMのパラメトリック知識を反映することが多い。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:57:58 GMT)
Paired by the Teacher: Turning Unpaired Data into High-Fidelity Pairs for Low-Resource Text Generation [17.9]
Paired by the Teacher (PbT)は、人間のラベルや並列データなしで正確な入出力ペアを合成する2段階の教師学生パイプラインである。我々は,5つのベンチマーク文書要約,対話要約,SAMSum,DialogSum,質問生成のPbTを評価する。 8Bの学生は、PbTデータのみを訓練し、70Bの教師生成コーパスで訓練されたモデルを上回った。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:51:55 GMT)
3DGAA: Realistic and Robust 3D Gaussian-based Adversarial Attack for Autonomous Driving [17.8]
本稿では,新しい対向オブジェクト生成フレームワークである3D Gaussian-based Adrial Attack (3DGAA)を提案する。パッチやテクスチャ最適化に依存する以前の作品とは異なり、3DGAAは幾何学的属性と外見的属性の両方を共同で摂動する。 3DGAAは検出mAPを87.21%から7.38%に減らし、既存の3D物理攻撃を著しく上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:20:49 GMT)
TranSUN: A Preemptive Paradigm to Eradicate Retransformation Bias Intrinsically from Regression Models in Recommender Systems [17.8]
そこで本研究では,モデルから内在的にバイアスを除去するプリエンプティブ・パラダイムを提案する。理論的に保証された不偏性を提供するために, 共同バイアス学習法を用いて新しいTranSUN法を提案する。総合的な実験結果から,様々な領域のデータにまたがる手法の優位性が示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:38:08 GMT)
Differential Encoding for Improved Representation Learning over Graphs [17.8]
メッセージパッシングパラダイムとグローバルアテンションメカニズムは、基本的にノードの埋め込みを生成する。支配的な情報がノード自身からなのか、あるいはノードの隣人からなのかは不明だ。本稿では,失った情報の問題に対処する差分符号化手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:25:38 GMT)
Category Discovery: An Open-World Perspective [17.6]
カテゴリー発見(CD)は、非競合データを自動的に分類することを目的とした、新たなオープンワールド学習タスクである。文献の総合的なレビューを行い、様々な手法について詳細な分析と詳細な議論を行う。大規模に訓練されたバックボーン,階層的および補助的なキュー,カリキュラムスタイルのトレーニングが,すべてカテゴリ発見に有用であることを示す重要な知見を抽出する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:48:01 GMT)
ActiveCQ: Active Estimation of Causal Quantities [17.6]
因果量の推定(CQ)は通常、大きなデータセットを必要とする。この課題は、サンプル効率のよいアクティブラーニング戦略の重要性を強調している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:14:37 GMT)
BRIDGE - Building Reinforcement-Learning Depth-to-Image Data Generation Engine for Monocular Depth Estimation [17.6]
BRIDGEはRL最適化Deep-to-image(D2I)生成フレームワークである。現実的かつ幾何学的に正確なRGB画像を20万枚以上合成する。我々は,このデータセット上で,ハイブリッド監視戦略を用いて深度推定モデルを訓練する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:19:45 GMT)
Cell2Text: Multimodal LLM for Generating Single-Cell Descriptions from RNA-Seq Data [17.4]
我々は、cRNA-seqプロファイルを構造化された自然言語記述に変換するフレームワークであるCell2Textを紹介する。遺伝子レベルの埋め込みと事前訓練された大きな言語モデルを統合することで、Cell2Textは、細胞のアイデンティティ、組織の起源、疾患関連、経路活性をキャプチャするコヒーレントな要約を生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:20:50 GMT)
Of-SemWat: High-payload text embedding for semantic watermarking of AI-generated images with arbitrary size [17.3]
テキスト埋め込みのための高負荷画像透かし手法を提案する。入力テキストプロンプトに対応可能なイメージのセマンティック記述が画像内に埋め込まれている。実験の結果,提案手法は多種多様な画像処理に対して極めて堅牢であることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:10:15 GMT)
Confidence Improves Self-Consistency in LLMs [17.3]
信頼性インフォームド・セルフ一貫性(CISC)について紹介する。 CISCは、モデルから直接得られる信頼度スコアに基づいて、重み付けされた多数決を行う。 9つのモデルと4つのデータセットでテストすると、CISCはほぼすべての構成で自己整合性を上回っます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:59:02 GMT)
MSG: Multi-Stream Generative Policies for Sample-Efficient Robotic Manipulation [17.2]
マルチストリーム生成ポリシー(MSG)は、複数のオブジェクト中心ポリシーを推論時に組み合わせて一般化とサンプル効率を改善する。 MSGはモデルに依存しない推論のみであり、そのため様々な生成ポリシーや訓練パラダイムに広く適用されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:50:51 GMT)
From Internal Representations to Text Quality: A Geometric Approach to LLM Evaluation [17.2]
本稿では,大言語モデル(LLM)の内部および外部分析手法を橋渡しする。我々は,最大説明変数,有効ランク,内在次元,MAUVEスコア,Schatten Normsなどの指標を検証した。我々の重要な発見は、異なるモデルが、これらの幾何学的性質に基づいて、同じ順序で、様々なソースからのテキストを一貫してランク付けしていることを明らかにする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:08:47 GMT)
TP-MVCC: Tri-plane Multi-view Fusion Model for Silkie Chicken Counting [17.2]
トリプレーン型マルチビューチキンカウントモデル(TP-MVCC)を提案する。このフレームワークは、単一ビューの特徴を抽出し、空間変換によりそれらを整列し、シーンレベルの密度マップをデコードして正確なチキンカウントを行う。実験の結果、TP-MVCCはシングルビューと従来の核融合比較を著しく上回り、密閉されたシナリオにおいて95.1%の精度と強い強靭性を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:27:04 GMT)
SemanticShield: LLM-Powered Audits Expose Shilling Attacks in Recommender Systems [17.0]
大規模言語モデル(LLM)を介してアイテム側セマンティクスを統合する2段階検出フレームワークを提案する。 6つの代表的な攻撃戦略の実験は、セマンティックシールドのシリング攻撃に対する効果を実証している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:53:47 GMT)
A Measurement Study of Model Context Protocol [17.0]
Model Context Protocol (MCP) は、大規模な言語モデルを外部ツールやリソースと接続するための統一標準として提案されている。 MCPエコシステムに関する大規模な実証的研究を初めて紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:29:20 GMT)
Experience Paper: Adopting Activity Recognition in On-demand Food Delivery Business [17.0]
本稿では,中国におけるオンデマンドフードデリバリー産業におけるヒューマンアクティビティ認識(HAR)技術の全国展開について紹介する。我々は、最先端のLIMU-BERTファンデーションモデルをデリバリプラットフォームに適応させることに成功しました。このデプロイメントから学んだ教訓を共有し、数百万時間のセンサデータで事前トレーニングされたLIMU-BERTをオープンソースにしています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:35:49 GMT)
Lobster: A GPU-Accelerated Framework for Neurosymbolic Programming [16.9]
ニューロシンボリックプログラムは、より優れたデータ効率、解釈可能性、一般化可能性を達成するために、ディープラーニングとシンボリック推論を組み合わせる。既存のニューロシンボリック学習フレームワークは、高度にスケーラブルでGPUアクセラレーションされたニューラルコンポーネントと、CPU上で動作する遅いシンボリックコンポーネントとの不安定な結婚を実装している。ニューロシンボリック学習のために,GPUをエンドツーエンドに活用するための統一フレームワークであるLobsterを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:34:13 GMT)
Fingerprinting LLMs via Prompt Injection [16.9]
大規模言語モデル(LLM)は、後処理や量子化といった後処理によって、リリース後にしばしば修正される。既存のプロファイランス検出手法には,(1)リリース前のベースモデルにシグナルを埋め込む,(2)手作りのプロンプトやランダムなプロンプトを用いたモデル間の出力を比較する,という2つの制限がある。我々はLLMPrintを提案する。LLMPrintはLDM固有の脆弱性を利用して指紋を検知する新しいフレームワークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:54:36 GMT)
Reinforcement Mid-Training [16.8]
トレーニング中における効率,適応性,統一的な強化のためのフレームワークを提案する。 RMTは,言語モデリングにおける推論長の21%に過ぎず,+64.91%の性能向上を実現している。また, 強化中等訓練後に得られたチェックポイントは, その後のトレーニングに有効であり, 数学領域では+18.76%の改善が得られた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:21:24 GMT)
Q-Net: Transferable Queue Length Estimation via Kalman-based Neural Networks [16.8]
信号化された交差点で待ち行列の長さを推定することは、トラフィック管理の課題である。本稿では,待ち行列長推定のためのデータ効率・解釈可能なフレームワークであるQ-Netを紹介する。 Q-Netは2つの広く利用可能なプライバシフレンドリーなデータソースを統合している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:51:08 GMT)
Efficient Sketching and Nearest Neighbor Search Algorithms for Sparse Vector Sets [16.8]
スパースANNSのための新しいデータ構造とアルゴリズム手法を提案する。我々の貢献は、スパースベクトルに対する理論的に基底化されたスケッチアルゴリズムから、それらの有効次元を減少させるものまで様々である。我々の最終アルゴリズムは耐震性と呼ばれ、大規模ベンチマークデータセット上で高精度でミリ秒以下のレイテンシに達する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:02:45 GMT)
Building Benchmarks from the Ground Up: Community-Centered Evaluation of LLMs in Healthcare Chatbot Settings [16.7]
Samikshaはコミュニティ主導の評価パイプラインであり、市民社会組織(CSO)とコミュニティメンバーの共同開発である。私たちのアプローチは、文化的に認識されたコミュニティ主導のパイプラインを通じて、スケーラブルで自動化されたベンチマークを可能にします。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:20:15 GMT)
jina-reranker-v3: Last but Not Late Interaction for Document Reranking [16.7]
jina-reranker-v3は0.6Bパラメータの多言語ドキュメント再ランカである。このアーキテクチャは、61.94 nDCG@10で最先端のBEIR性能を実現し、生成的リストワイド・リランカの10倍小さい。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:23:54 GMT)
Fair Classification by Direct Intervention on Operating Characteristics [16.7]
複数のグループフェアネス制約を持つ二項分類のための属性認識設定において、グループフェアネスの下で新しい分類器を開発する。本稿では,事前学習した基底分類器の動作特性を直接介入して,線形分数制約に適用可能な新しい手法を提案する。標準データセットでは, DP, EO, PPをほとんど介入せず, 精度がほぼ低下し, 同時に近似DP, EO, PPを満足する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:36:32 GMT)
Gradient Descent with Large Step Sizes: Chaos and Fractal Convergence Region [16.7]
パラメータ空間は大きなステップサイズで行列分解におけるフラクタル構造を発達させることを示す。以上の結果から, 近臨界ステップサイズは, 長期変動が予測不可能な, 勾配降下のカオス的な状態を引き起こすことが明らかとなった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:04:22 GMT)
DRIFT-Net: A Spectral--Coupled Neural Operator for PDEs Learning [16.7]
ニューラルソルバを用いたPDE動的学習のための textbfDRIFT-Net を提案する。スペクトルブランチとイメージブランチからなるデュアルブランチ設計を採用している。トレーニング設定と予算は同じで,パラメータが少なく,エラーの低減とスループットの向上を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:52:31 GMT)
Towards Generalizable PDE Dynamics Forecasting via Physics-Guided Invariant Learning [16.7]
iMOOEと呼ばれる物理誘導型不変学習法を提案する。 iMOOEは、エキスパートアーキテクチャの分散に整合した混合と、周波数に富んだ不変学習の目的を特徴としている。実験では、様々なOOD予測シナリオにおいて、iMOOEの優れた分散性能とゼロショット一般化能力を検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:30:01 GMT)
Bidirectional Uncertainty-Aware Region Learning for Semi-Supervised Medical Image Segmentation [16.7]
半教師付き医療画像のセグメンテーションでは、ラベルのないデータの質が悪く、モデルの予測の不確かさが誤った擬似ラベルにつながる。本稿では,ラベル付きデータによる正確な監視をフル活用するための,双方向不確実性を考慮した領域学習戦略を提案する。提案手法は,異なる医用画像分割タスクにおいて,大幅な性能向上を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:37:46 GMT)
Efficiently Attacking Memorization Scores [16.6]
本稿では,記憶をベースとした影響推定装置の攻撃可能性について検討する。我々は、訓練されたアルゴリズムが正確である体制において、高度に記憶されたサンプルを高感度なクエリとして生成する攻撃を特徴付ける。本研究は,影響に基づく属性の重大な脆弱性を浮き彫りにし,堅牢な防御の必要性を示唆する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:41:29 GMT)
Training-Free Token Pruning via Zeroth-Order Gradient Estimation in Vision-Language Models [16.5]
VLM(Large Vision-Language Models)は、強力なマルチモーダル推論を実現するが、冗長な視覚トークンから重い推論コストを発生させる。注意に基づく手法は、しばしばレイヤやヘッド間で不安定な生の注意スコアに依存する。簡単な直感に基づいて構築されたトレーニング不要のフレームワークとして,我々の提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:20:05 GMT)
Uncertainty-driven Embedding Convolution [16.5]
不確実性駆動型埋め込み畳み込み(UEC)を提案する。 UECは決定論的埋め込みをポストホックな方法で確率論的に変換する。その後、埋め込みの不確実性に基づいて適応アンサンブル重みを計算する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:20:46 GMT)
Prior-based Noisy Text Data Filtering: Fast and Strong Alternative For Perplexity [16.5]
コーパスレベルの項周波数統計量を用いてトークンの先行値を推定する事前データフィルタリング手法を提案する。 PPLの高速プロキシとして,トークン前の平均偏差と標準偏差に基づいて文書をフィルタする手法を提案する。その単純さにもかかわらず、事前ベースフィルタは、20のダウンストリームベンチマークで最高の平均性能を達成している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:13:38 GMT)
One Patient, Many Contexts: Scaling Medical AI with Contextual Intelligence [16.5]
コンテキストスイッチングにより、医療AIは専門分野、人口、地理に適応できる。データ設計、モデルアーキテクチャ、評価フレームワークの進歩が必要です。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:31:15 GMT)
STAGE: Stable and Generalizable GRPO for Autoregressive Image Generation [16.4]
近年,テキスト・ツー・イメージ・ジェネレーションを改善するために強化学習が研究されている。既存のGRPOアルゴリズムを自己回帰(AR)イメージモデルに適用することは依然として困難である。本研究では,AR画像生成のためのGRPOを再検討し,不必要なトークンからの矛盾した勾配と不安定なポリシーエントロピーダイナミクスの2つの主要な問題を特定する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:50:21 GMT)
Environmental Rate Manipulation Attacks on Power Grid Security [16.4]
従来のトロイの木馬の設計は、標準的なテストで検出できるデジタルトリガーや固定しきい値条件に依存している。本稿では,環境パラメータの変化率を監視して起動する,新しいトロイの木馬トリガー機構であるERMを紹介する。この攻撃の重要性は、個々のセンサーを超えて、電力エレクトロニクスに共通する環境検知システム全体のクラスにまで及んでいる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:30:21 GMT)
From Ambiguity to Verdict: A Semiotic-Grounded Multi-Perspective Agent for LLM Logical Reasoning [16.4]
LogicAgentは、論理的な複雑さと意味的な複雑さを共同で扱うように設計された、セミオティックな2乗誘導フレームワークである。既存のデータセットのセマンティックな単純さと論理的な複雑さを克服するために、大学レベルの難易度に達するベンチマークであるRepublicQAを導入する。 LogicAgentはRepublicQAで最先端のパフォーマンスを実現しており、強いベースラインよりも平均6.25%向上している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:31:22 GMT)
DuetGraph: Coarse-to-Fine Knowledge Graph Reasoning with Dual-Pathway Global-Local Fusion [16.4]
DuetGraphは、二重経路グローバル局所融合を伴う粗大なKG推論機構である。ローカル(メッセージパッシング)とグローバル(注意)情報を2つの異なる経路に分離することで、過密化に取り組む。推論品質が8.7%向上し、トレーニング効率が1.8$times$Acceleratorになった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:11:20 GMT)
Which Words Matter Most in Zero-Shot Prompts? [16.3]
ZIPスコアは、命令プロンプトにおいて個々の単語の重要性を定量化する最初の体系的手法である。数学的な問題が「ステップ・バイ・ステップ」を優先するタスク固有の単語階層が存在し、推論タスクは「思考」を好むことを示す。我々は,20の検証プロンプトを所定キーワードで行うことで,素早い解釈可能性を示す最初の基盤トラバス・ベンチマークを確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:29:27 GMT)
Discrete Variational Autoencoding via Policy Search [16.3]
変分オートエンコーダ(VAE)の離散遅延ボトルネックは高いビット効率を提供する。離散確率変数は、正確に微分可能なパラメータ化を許さない。非パラメトリックエンコーダの自然な勾配を利用する離散型VAEのためのトレーニングフレームワークを提案する。自動ステップサイズ適応とトランスフォーマーベースのエンコーダを組み合わせることで、ImageNetのような挑戦的なデータセットにスケールする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:44:05 GMT)
Fine-Grained Detection of Context-Grounded Hallucinations Using LLMs [16.2]
コンテキストグラウンドド・幻覚(Context-grounded hallucination)は、モデル出力がソーステキストに対して検証できない情報を含む場合である。このような幻覚を局在化するためのLCMの適用性について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:02:11 GMT)
Event-based Facial Keypoint Alignment via Cross-Modal Fusion Attention and Self-Supervised Multi-Event Representation Learning [16.2]
イベントカメラは、困難な条件下での顔のキーポイントアライメントにユニークな利点を提供する。本稿では、イベントベースの顔キーポイントアライメントのための、相互統合注意(CMFA)と自己教師型マルチイベント表現学習(SSMER)に基づく新しいフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:00:50 GMT)
Is Active Persona Inference Necessary for Aligning Small Models to Personal Preferences? [16.1]
人気のトレンドは、現在のユーザの会話にプレフィックスを追加して、好みの配布を操ることである。ほとんどのメソッドは、前の例の選好ペアで個人的な選好を受動的にモデル化する。モデルが嗜好記述を積極的に推測する利点があるかどうかを問う。次に、微調整された1-8Bサイズのモデルが、個人の好みを推測し調整する上で、いかに効果的かをテストする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:23:06 GMT)
Evolution Strategies at Scale: LLM Fine-Tuning Beyond Reinforcement Learning [16.1]
強化学習はおそらく最も顕著な微調整法である。進化戦略(ES)はかつて、数百万のパラメータを持つモデルでRLに匹敵する性能を示した。 ESは数十億のパラメータを効率的に探索し、既存のRLファインチューニング手法より優れている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:19:34 GMT)
Preference-Based Dynamic Ranking Structure Recognition [16.1]
本稿では、嗜好に基づくデータに対するランキング構造認識の新しい枠組みを提案する。まず、祝福されたブラッドリー・テリーモデルに対するスペクトル推定に時間的罰則を組み込むことで、動的ランキング群を同定する手法を開発する。構造的変化を検出するために,革新的目的関数を導入し,動的プログラミングに基づく実践可能なアルゴリズムを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:06:05 GMT)
Sanitize Your Responses: Mitigating Privacy Leakage in Large Language Models [15.9]
セルフサニタイズ(Self-Sanitize)は、認知心理学に触発されたLLM駆動の新たな緩和フレームワークである。会話中の人間の自己監視と自己修復行動をエミュレートする。 LLMの利便性を低下させることなく、最小限のオーバーヘッドで優れた緩和性能を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:59:44 GMT)
Training Agents Inside of Scalable World Models [15.9]
高速で正確な世界モデル内での強化学習により制御タスクの解法を学習する,スケーラブルなエージェントであるDreamer 4を紹介する。複雑なビデオゲームMinecraftでは、世界モデルはオブジェクトの相互作用とゲーム力学を正確に予測し、以前の世界モデルよりも大きなマージンで上回る。想像力で振舞うことを学ぶことで、Dreamer 4はマインクラフトで初めて、環境の相互作用なしにオフラインデータからダイヤモンドを入手したエージェントである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:42:27 GMT)
Model Extraction Attacks Revisited [15.8]
モデル抽出(ME)攻撃は、MachineLearning-as-a-Serviceプラットフォームに対する大きな脅威のひとつだ。 MLプラットフォームのME攻撃に対する脆弱性は、どのように進化していますか? 本研究は,MEの脆弱性の現状に光を当て,今後の研究に期待できるいくつかの方向性を示すものである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:55:43 GMT)
Reasoning or Retrieval? A Study of Answer Attribution on Large Reasoning Models [15.8]
大きな推論モデル (LRMs) は、Chain-of-Thought (CoT) 推論を通じて複雑な問題を解く際、前例のない能力を示す。最近の研究では、彼らの最後の答えは、しばしば彼ら自身の推論の痕跡と矛盾していることが明らかになっている。この矛盾は、CoT推論とメモリ検索という2つの競合メカニズムに起因していると仮定する。本稿では,メモリアンラーニングと強化学習を統合したファインチューニングフレームワークFARLを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:13:33 GMT)
Self-Evolving LLMs via Continual Instruction Tuning [15.8]
大規模言語モデル(LLM)の産業規模・自己進化型連続命令チューニングのためのパラメータ効率の良い逆混合処理フレームワークであるMoE-CLを提案する。 MoE-CLは、タスクごとに専用のLoRAエキスパートをパラメータ独立性を通じてタスク固有の知識を保存し、忘れを軽減し、(2)クロスタスク転送を可能にする共有のLoRAエキスパートを使用。公開 MTL5 ベンチマークと産業用 Tencent3 ベンチマークの広範な実験により、継続的な命令チューニングにおける MoE-CL の有効性が検証された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:42:58 GMT)
Environment-Aware Satellite Image Generation with Diffusion Models [15.7]
拡散に基づく基礎モデルは、最近、生成モデリングの分野で多くの注目を集めている。従来の手法は、限られた環境条件に依存し、欠落や破損したデータに悩まされ、しばしば生成された出力にユーザの意図を確実に反映できない。本稿では,3つの異なる制御信号の組み合わせを条件に,衛星画像の生成が可能な,環境条件に基づく新しい拡散モデルを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:54:53 GMT)
TENET: Leveraging Tests Beyond Validation for Code Generation [15.7]
テスト駆動開発(TDD、Test-Driven Development)は、開発者がコード実装と一緒にテストを作成し実行する必要がある、広く採用されているソフトウェア工学のプラクティスである。本稿では、TDD設定の下で複雑な現実世界のリポジトリで関数を生成するエージェントTENETを紹介する。 TENETはRepoCodとRepoEvalのベンチマークで69.08%と81.77%のPass@1を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:53:16 GMT)
Meta-Router: Bridging Gold-standard and Preference-based Evaluations in Large Language Model Routing [15.7]
大規模言語モデル(LLM)ルータは、クエリ毎に候補のプールから最も適切なモデルを選択する。クラウドソーシングやLSM-as-a-judgeシステムを通じて収集された嗜好ベースのデータは、より安価でスケーラブルだが、応答の真の品質を反映することにはバイアスが伴うことが多い。我々は、好みデータバイアスを補正し、2つのデータソース間の不均衡に対処し、ルーティングの堅牢性と効率を改善する統合因果ルータトレーニングフレームワークを開発する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:44:00 GMT)
The Dialogue That Heals: A Comprehensive Evaluation of Doctor Agents' Inquiry Capability [15.6]
我々は,医療マルチターン質問の自動的・包括的評価のための,これまでで最大のベンチマークであるMAQuE(Medical Agent Questioning Evaluation)を提案する。 3000の患者エージェントがリアルにシミュレートされ、多様な言語パターン、認知的制限、感情的反応、受動的開示の傾向を示す。また,タスク成功,質問能力,対話能力,質問効率,患者体験を網羅する多面的評価フレームワークも導入した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:52:36 GMT)
Improving Reliability and Explainability of Medical Question Answering through Atomic Fact Checking in Retrieval-Augmented LLMs [15.6]
大型言語モデル (LLM) は医学的知識が豊富であるが、幻覚や不正確な引用の傾向にある。 Retrieval Augmented Generationのような現在の手法は、ソース文書の回答を根拠にすることで、これらの問題に部分的に対処する。我々は,LLMの信頼性と説明可能性を高めるために,新しい原子ファクトチェックフレームワークを導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:59:30 GMT)
Accurate Cobb Angle Estimation via SVD-Based Curve Detection and Vertebral Wedging Quantification [15.5]
思春期特発性強皮症(AIS)は、世界中で約2.2%の男子と4.8%の女子に影響を及ぼす一般的な脊椎変形である。従来の方法は、単純な脊椎モデルと、臨床の複雑さに対処できない所定の曲線パターンを使用する。 AIS評価のための新しい深層学習フレームワークを提案し,各椎骨について,上面と下面の両方の角度と,対応する中点座標を同時に予測する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:07:55 GMT)
Learning Hamiltonian Dynamics at Scale: A Differential-Geometric Approach [15.5]
本稿では,ハミルトニアン力学の保存則とモデル次数減少のスケーラビリティを結合した,物理に着想を得た新しいニューラルネットワークを提案する。実験により, RO-HNNは複雑な高次元力学の物理的に一貫性があり, 安定であり, 一般化可能な予測を提供することを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:36:35 GMT)
Data-Efficient Multitask DAgger [15.5]
多くのタスクを実行できる汎用的なロボットポリシーは、訓練に広範囲な専門的なデータやシミュレーションを必要とする。本稿では,複数のタスク固有の専門家ポリシーから単一のマルチタスクポリシーを抽出する,データ効率の良いマルチタスクDAggerフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:17:35 GMT)
A TRIANGLE Enables Multimodal Alignment Beyond Cosine Similarity [15.4]
マルチモーダル学習は、人工知能システムの進歩において重要な役割を担っている。現在の最先端モデルは、完全にマルチモーダルなモデルの開発が成功しないような厳しい限界に悩まされている。本稿では,モダリティ埋め込みにより,高次元空間で直接計算される新しい類似度尺度であるTRIANGLEを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:58:46 GMT)
LayerD: Decomposing Raster Graphic Designs into Layers [15.3]
LayerDは、グラフィックデザインをレイヤに分解して、再編集可能なクリエイティブワークフローを作成する方法である。層が一様に見えるという仮定を生かした,単純かつ効果的な改質手法を提案する。実験では、LayerDは高品質な分解を実現し、ベースラインを上回ります。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:50:12 GMT)
Skip-It? Theoretical Conditions for Layer Skipping in Vision-Language Models [15.3]
視覚言語モデル(VLM)は、幅広いタスクにわたって素晴らしいパフォーマンスを達成するが、その大きなサイズは推論をコストがかかる。最近の研究は、VLM層を選択的にスキップすることで、パフォーマンスの損失を最小限に抑えて効率を向上できることを示している。我々は,情報と学習理論を用いて,レイヤスキップが性能を犠牲にすることなく効率を向上する条件を特徴付けるフレームワークを開発した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:16:44 GMT)
XR Blocks: Accelerating Human-centered AI + XR Innovation [15.1]
XR Blocksは、人間中心のAI + XRイノベーションを加速するために設計されたクロスプラットフォームフレームワークである。 AI + XR:user, world, peers, interface, context, agentにおけるコア抽象化のためのプラグイン・アンド・プレイコンポーネントを備えたモジュールアーキテクチャを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:00:53 GMT)
Pairwise Optimal Transports for Training All-to-All Flow-Based Condition Transfer Model [15.1]
本稿では,全ての条件分布に対する最適輸送の同時学習を可能にする新しいコスト関数を提案する。我々の手法は、その極限において、ペアの最適輸送に収束するという理論的な保証によって支持されている。学習されたトランスポートマップはその後、条件付きフローマッチングでデータポイントを分割するために使用される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:17:14 GMT)
Nested Named Entity Recognition as Single-Pass Sequence Labeling [15.1]
我々は、ネストされた名前付きエンティティ認識(NNER)を、選挙区構造を線形化する事前の作業を活用することで、シーケンスラベリングタスクとしてキャストした。これらの領域の線形化と事前訓練されたエンコーダを組み合わせることで、ネストされたエンティティを正確にn個のタグ付け動作でキャプチャする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:28:39 GMT)
Fundamental Limit of Discrete Distribution Estimation under Utility-Optimized Local Differential Privacy [15.0]
ユーティリティ最適化ローカルディファレンシャルプライバシ(ULDP)における離散分布推定の問題点について検討する。そこで本研究では,LDP制約下で最適なブロック設計機構の非保存的変更として得られる,実用最適化ブロック設計(uBD)方式のクラスを提案する。これらの結果は、ULDP下で達成可能な推定精度を厳密に評価し、プライバシーを自明な統計的推測のための最適メカニズムの構造に関する新たな知見を明らかにする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:41:36 GMT)
Dynamic Orchestration of Multi-Agent System for Real-World Multi-Image Agricultural VQA [14.9]
農業の視覚的質問応答は、農家や研究者に正確でタイムリーな知識を提供することに不可欠である。本稿では,Retriever,Reflector,Answerer,Improverの4つの役割を統合した自己修正型自己改善型マルチエージェントフレームワークを提案する。 AgMMUベンチマーク実験により, マルチイメージ農業QAにおける競争性能が得られた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:52:10 GMT)
Decoupled Classifier-Free Guidance for Counterfactual Diffusion Models [14.8]
CFGはすべての属性に対してグローバルなガイダンス尺度を定めており、推論されたカウンターファクトの大幅な変更につながっている。本稿では,因果グラフに従う属性ワイズ制御を可能にする,フレキシブルでモデルに依存しないガイダンス手法であるDecoupled-Free Guidance (DCFG)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:03:12 GMT)
Semantic Editing with Coupled Stochastic Differential Equations [14.7]
我々は,任意の事前学習された生成モデルのサンプリング過程を導くために,結合微分方程式(結合SDE)を提案する。ソース画像と編集画像の両方を同一の相関雑音で駆動することにより,新たなサンプルを所望のセマンティクスに導出する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:05:16 GMT)
DSAT-HD: Dual-Stream Adaptive Transformer with Hybrid Decomposition for Multivariate Time Series Forecasting [14.7]
時系列予測は、天気、交通、電気、エネルギー予測など様々な用途に欠かせない。既存のアプローチは、主に制限された時系列や固定スケールをモデル化し、さまざまな機能をさまざまな範囲にわたって捉えることがより困難になる。本稿では,DSAT-HD(Hybrid Decomposition Dual-Stream Adaptive Transformer)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:50:56 GMT)
PALM: Synergizing Program Analysis and LLMs to Enhance Rust Unit Test Coverage [14.7]
本稿では,大規模言語モデル(LLM)を活用して高カバレッジ単体テストを生成する手法であるPALMを提案する。 PALMはプログラム解析を行い、関数内の分岐条件を特定し、それを経路制約に結合する。このアプローチを実装し、それを15のオープンソースのRustクラッドで評価します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:27:38 GMT)
Bridging Developer Instructions and Code Completion Through Instruction-Aware Fill-in-the-Middle Paradigm [14.4]
Instruction-aware Fill-in-the-Middle (IFIM)を導入し、コード補完モデルを強化する。 IFIMは明示的な命令セクションを入力に組み込んで、モデルが三つ子から学習できるようにする。結果:IFIMは命令フォロー機能を大幅に改善し、Pass@1スコアは84.6%から93.6%に向上した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:45:54 GMT)
Evaluating Foundation Models with Pathological Concept Learning for Kidney Cancer [14.4]
腎癌に焦点をあてた病理概念学習アプローチを開発した。 TNMステージングガイドラインと病理報告を活用することで,腎癌に対する包括的病態概念を構築した。腎癌生存解析における本手法の有効性を実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:21:10 GMT)
Wan-Alpha: High-Quality Text-to-Video Generation with Alpha Channel [14.4]
我々は,RGBとαチャネルを共同で学習することで,透過的なビデオを生成する新しいフレームワークであるtextitWan-Alphaを提案する。我々のモデルは最先端の手法と比較して、視覚的品質、動きリアリズム、透明性のレンダリングにおいて優れた性能を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:08:21 GMT)
Bipartite Randomized Response Mechanism for Local Differential Privacy [14.3]
ローカル微分プライバシー(LDP)は、最近、各ユーザのプライバシをデータアナリストから保護するための強力なプライバシ尺度になっている。我々のゴールは、グローバルな予測エラーを持つアイテムを可能な限り小さくリリースする、微分プライベートなメカニズムを設計することです。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:31:41 GMT)
Cogito, Ergo Ludo: An Agent that Learns to Play by Reasoning and Planning [14.3]
我々は,環境の仕組みとその戦略を明示的かつ言語ベースで理解する新しいエージェントアーキテクチャであるCogito, ergo ludo (CEL)を紹介した。 CELは相互作用とリフレクションのサイクルで動作し、ルール誘導と戦略とプレイブック要約という2つの同時学習プロセスを実行する。我々は,多様なグリッドワールドタスク(マインズウィーパー,フリーズレーク,ソコバン)でCELを評価し,CELエージェントが,ルールを自律的に発見し,スパース報酬から効果的なポリシーを開発することで,これらのゲームを習得することに成功したことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:02:31 GMT)
DiaCDM: Cognitive Diagnosis in Teacher-Student Dialogues using the Initiation-Response-Evaluation Framework [14.3]
DiaCDMは、対話における生徒の認知状態を評価するツールである。我々は,対話に適した診断枠組みを設計するために,IRE(Initiation-Response-evaluation)フレームワークを教育理論から応用した。 3つの実世界の対話データセットの実験により、DiaCDMは診断精度を大幅に向上するだけでなく、結果の解釈可能性も向上することを確認した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:09:04 GMT)
Spectral Collapse Drives Loss of Plasticity in Deep Continual Learning [14.2]
深層ニューラルネットワークは、深層学習において可塑性の喪失に悩まされていることを示す。我々は、$tau$-trainabilityの概念を導入し、現在の可塑性保存アルゴリズムをこのフレームワークで統一できることを示します。連続的な教師付きおよび強化学習タスクの実験により、これら2つのレギュレータを組み合わせることで、可塑性を効果的に維持できることが確認された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:32:19 GMT)
U-Cast: Learning Hierarchical Structures for High-Dimensional Time Series Forecasting [14.2]
チャネルに依存した予測アーキテクチャであるU-Castを提案する。大規模で多様な高次元データセットの最初のベンチマークであるTime-HDもリリースしています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:24:14 GMT)
Combinatorial Creativity: A New Frontier in Generalization Abilities [14.1]
大規模言語モデル(LLM)における創造性のスケーリング挙動について検討する。固定的な計算予算では、創造力に最適なモデル深さと幅が存在することが分かりました。 LLMは新たな科学的アイデアの創出に長けつつ,現実的な実現性確保に苦慮しているため,創造性アルゴリズムの基本的な新規性・実用性トレードオフ特性によって説明できる可能性が示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:04:28 GMT)
High-Dimensional Analysis of Single-Layer Attention for Sparse-Token Classification [14.1]
信号強度が対数的に増加すると, 単層アテンション分類器は, 信号長が$L$で対数的に大きくなると, 基本的には消滅するテスト誤差を達成できることを示す。注意分類器の問合せ重みベクトルに対して2つの勾配更新だけで隠れ信号と非自明なアライメントが得られることを証明し、情報トークンを選択的に増幅する注意マップを誘導する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:54:53 GMT)
ThermalGen: Style-Disentangled Flow-Based Generative Models for RGB-to-Thermal Image Translation [14.1]
ペアリングRGBサーマルデータは、視覚-サーマル・フュージョンとクロスモダリティ・タスクに不可欠である。この課題を克服するため、RGB-to-Thermal (RGB-T)イメージ翻訳が有望なソリューションとして登場した。本研究では,RGB-T画像変換のための適応型フローベース生成モデルであるHeatherGenを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:55:51 GMT)
PAME-AI: Patient Messaging Creation and Optimization using Agentic AI [14.1]
我々は,エージェントAIを用いた患者メッセージ作成と最適化のための新しいアプローチであるPAME-AIを開発した。 Data-Information-Knowledge-Wisdom階層に基づいて構築されたPAME-AIは、生データから高性能メッセージング設計のための実行可能な洞察に移行するための構造化されたフレームワークを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:14:46 GMT)
Toward a Vision-Language Foundation Model for Medical Data: Multimodal Dataset and Benchmarks for Vietnamese PET/CT Report Generation [14.0]
我々は,1,567,062対のCT-PET画像と,それに対応する2,757人の臨床報告からなるベトナム語多言語医療データセットを新たに導入した。私たちの知る限りでは、ベトナムでPET/CT-レポートペアを包括的に提供する最初のデータセットです。我々は、医療報告生成や視覚的質問応答など、下流タスクにおける最先端VLMのベンチマークを総合的に実施する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:03:57 GMT)
An empirical study on the limitation of Transformers in program trace generation [13.9]
モデルが合成プログラムのステップバイステップ実行トレースを生成するタスクプログラムトレース生成(PTG)について、トランスフォーマーについて検討する。我々は、代替位置エンコーディング、ソフトマックス置換、ハイブリッドモデル、短い畳み込みなど、様々な修正を施した小さなトランスフォーマーを訓練する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:17:07 GMT)
Conformal Prediction for Signal Temporal Logic Inference [13.8]
信号時間論理(STL)推論は時系列データから人間の解釈可能な規則を抽出しようとする。既存のメソッドには、推論されたルールに対する正式な信頼性保証がない。 STL推論のためのエンドツーエンドの差別化可能なCPフレームワークを導入し、信頼性と解釈性の両方を向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:25:02 GMT)
Enhancement of superconducting pairing via quantum Lyapunov control [13.8]
量子リアプノフ制御は、フェルミ・ハバードモデルにおける超伝導相関の強化に有効な戦略を提供する。提案手法では, 簡単なフィードバックベースのプロトコルを用いて, 超伝導相関の減少を防止する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:50:23 GMT)
SoC-DT: Standard-of-Care Aligned Digital Twins for Patient-Specific Tumor Dynamics [13.8]
スタンダード・オブ・ケア(SoC)療法下での腫瘍軌跡の正確な予測は、腫瘍学において大きな未解決の課題である。反応拡散腫瘍成長モデルを統一する微分可能なフレームワークであるStandard-of-Care Digital Twin(SoC-DT)を紹介する。また, SoC 処理時の安定性, 肯定性, スケーラビリティを確保するために, 暗黙的に指数関数的な時間差解決器 IMEX-SoC も提案されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:14:11 GMT)
Anatomy-DT: A Cross-Diffusion Digital Twin for Anatomical Evolution [13.8]
腫瘍の進行を周囲の解剖と共にモデル化し、疾患のダイナミックスに関する包括的かつ臨床的に関係のある理解を得ることが重要である。偏微分方程式を微分可能な深層学習で結合する数学的基盤の枠組みを導入する。この研究は、視覚的に現実的で排他的で、位相的に一貫したデジタル双生児のための解剖学から解剖学への原則的な道を確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:28:35 GMT)
MMRQA: Signal-Enhanced Multimodal Large Language Models for MRI Quality Assessment [13.8]
本稿では,MMRQA(Multimodal MRI Quality Assessment)フレームワークを導入し,MLLM(Multimodal Large Language Model)と取得対応信号処理を統合した。 MMRQAは、MRQyによるロバストなメトリック抽出と、シミュレーションされたアーティファクト、Qwenを用いてメトリクスを問合せペアに構造化した変換、LLaVA-OneVisionのローランク適応(LoRA)によるパラメータ効率の融合を組み合わせた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:00:19 GMT)
A Spectral-Grassmann Wasserstein metric for operator representations of dynamical systems [13.8]
本稿では,各系を共振器の固有値とスペクトルプロジェクタの分布として表現する新しい手法を提案する。シミュレーションおよび実世界のデータセットの実験により、我々のアプローチは機械学習アプリケーションにおける標準的なオペレーターベース距離を一貫して上回っていることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:24:05 GMT)
Aligning Multilingual Reasoning with Verifiable Semantics from a High-Resource Expert Model [13.8]
本稿では,セマンティック検証リワードを用いたPivot-based Reinforcement Learningを紹介する。このフレームワークは、ターゲット言語における人間の注釈付きデータの必要性を回避し、多言語推論を強化する。提案手法は,英語と他言語のパフォーマンスギャップを著しく狭めることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:03:11 GMT)
Learning in an Echo Chamber: Online Learning with Replay Adversary [13.8]
本稿では,リプレイ設定におけるオンライン学習という学習理論の枠組みを紹介する。クロージャベースの学習者は、少なくとも$mathrmExThD(mathcalH)$の誤りを任意の適応的敵に対して行う。敵に対しては、すべての交叉閉クラスに対して同様の有界性を証明する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:50:24 GMT)
Experimental Extraction of Coherent Ergotropy and Its Energetic Cost in a Superconducting Qubit [13.7]
超伝導トランスモンキュービットからの作業抽出における初期状態コヒーレンスの役割を実験的に検討した。初期状態の選択は、支配的なデコヒーレンスチャネル-エネルギー緩和またはデフォーカスに依存する。その結果,初期状態設計はコヒーレンス制御にスケーラブルなアプローチを提供し,効率的な量子熱力学デバイスの開発を進展させることを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:58:57 GMT)
Optimizing Privacy-Preserving Primitives to Support LLM-Scale Applications [13.7]
本稿では,プライバシー保護学習システムにおける,このオーバーヘッドと実践性のギャップを埋めるための取り組みの概要を紹介する。プライバシー保護設定におけるLLMスケールアプリケーションの実現に向けた進展を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:16:51 GMT)
Hyperspherical Latents Improve Continuous-Token Autoregressive Generation [13.7]
自己回帰(AR)モデルは画像生成に期待できるが、連続学習のARモデルは遅延拡散やマスク世代モデルに追随することが多い。本稿では,ARデコード時に増幅されるVAEラテントの不均一な分散問題に対処するために,SphereARを提案する。理論解析により,超球面制約がスケール成分を除去し,ARデコーディングを安定化させることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:34:24 GMT)
LATTE: Latent Trajectory Embedding for Diffusion-Generated Image Detection [13.6]
LATent Trajectory Embeddingは、複数の認知ステップにまたがる遅延埋め込みの進化をモデル化する新しいアプローチである。 GenImage、Chameleon、Diffusion Forensicsといったいくつかのベンチマークの実験は、LATTEが優れたパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:49:26 GMT)
Attention Surgery: An Efficient Recipe to Linearize Your Video Diffusion Transformer [13.5]
トランスフォーマーベースのビデオ拡散モデル(VDM)は、最先端のビデオ生成の品質を提供するが、自己注意の二次コストに制約される。テキストリニアライズおよびテキストリニアライズのための効率的なフレームワークであるtextitAttention Surgeryを導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:09:51 GMT)
Optimal thresholds and algorithms for a model of multi-modal learning in high dimensions [13.5]
本論文は、このモデルに対する近似メッセージパッシング(AMP)アルゴリズムを導出し、関連する状態の進化を通じて高次元限界におけるその性能を特徴付ける。 AMPの線形化は、広く使われている部分最小二乗法(PLS)と正準相関解析法(CCA)とを数値的に比較する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:04:15 GMT)
Euclidean Fast Attention -- Machine Learning Global Atomic Representations at Linear Cost [13.5]
長距離相関は、多くの機械学習タスクにおいて不可欠である。 Euclidean fast attention (EFA) はユークリッドデータのための線形スケーリング型注目機構である。 EFAは様々な長距離効果を効果的に捉え、MLFFは困難な化学相互作用を記述できる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:40:03 GMT)
UniDex: Rethinking Search Inverted Indexing with Unified Semantic Modeling [13.5]
逆索引付けは、伝統的に現代の検索システムの基盤であり、クエリとドキュメントの関連性を決定するために正確な項マッチングを活用してきた。 Inverted indexing に革命をもたらすために統合意味モデリングを利用する新しいモデルベース手法である UniDex を提案する。提案手法には,クエリとドキュメントをセマンティックIDにマッピングして検索を改善するUniTouchと,セマンティックマッチングを用いて検索結果を効率的にランク付けするUniRankの2つの重要なコンポーネントが含まれている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:41:12 GMT)
PET: Preference Evolution Tracking with LLM-Generated Explainable Distribution [13.4]
一般的なプラクティスは、好まれる項目のランク付けリストを直接生成することで、ユーザの次のアクションを予測するために、大規模言語モデルを使用することである。短期予測には有効であるが、エンドツーエンド生成パラダイムは本質的にパーソナライゼーションを制限している。本稿では,選好クラスタの安定かつ解釈可能な格子上での動的確率分布を推定するフレームワークであるPreference Evolution Tracking (PET)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:09:15 GMT)
BeyondBench: Benchmark-Free Evaluation of Reasoning in Language Models [13.4]
インターネット規模のトレーニングデータから汚染を避けるための評価フレームワークであるBeyondBenchを紹介する。本フレームワークでは,44のアルゴリズムタスクを117のバリエーションでカバーし,3つの難易度に分類する。 85のオープンソースモデルと16のクローズドソースモデルを含む101の言語モデルを評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:49:01 GMT)
Online Mapping for Autonomous Driving: Addressing Sensor Generalization and Dynamic Map Updates in Campus Environments [13.4]
本稿では,2台のフロントカメラとLiDARセンサを備えたキャンパスゴルフカートプラットフォーム上でのオンラインマッピングシステムの実現について述べる。本研究は,(1)キャンパス環境における3次元HDマップのラベル付け,(2)SemVecMapモデルの統合と一般化,(3)予測されたHDマップを段階的に生成・更新して環境変化を捉える,という3つの課題に取り組む。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:56:29 GMT)
Robust Multimodal Semantic Segmentation with Balanced Modality Contributions [13.3]
モダリティの等価符号化によるモダリティ貢献のバランスをとるフレームワークであるEQUISegを提案する。本研究では,EQUISegが性能向上を実現し,セグメンテーションタスクにおけるモダリティの不均衡の悪影響を効果的に軽減することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:19:10 GMT)
GRPO-MA: Multi-Answer Generation in GRPO for Stable and Efficient Chain-of-Thought Training [13.2]
RL(Reinforcement Learning)アプローチであるGRPOは,大規模言語モデル(LLM)と視覚言語モデル(VLM)において,CoT(Chain-of-Thought)推論を効果的に訓練することができる。本稿では,GRPOの3つの課題として,思考と回答の勾配結合,限られた並列サンプリングによる報酬信号の分散,不安定な優位性推定について分析する。本稿では, GRPO-MAを提案する。GRPO-MAは, 各思考プロセスから複数問合せを生成し, より堅牢で効率的な最適化を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:07:45 GMT)
ControlHair: Physically-based Video Diffusion for Controllable Dynamic Hair Rendering [13.2]
物理シミュレータと条件付きビデオ拡散を統合し,動的ヘアレンダリングを可能にするハイブリッドフレームワークであるControlHairを提案する。 ControlHairは3段階のパイプラインを採用しており、まずシミュレータを使って物理パラメータをフレーム単位の幾何学にエンコードし、次にフレーム単位の制御信号を抽出し、最後に制御信号をビデオ拡散モデルに供給して、所望のヘアダイナミックスでビデオを生成する。 10Kのビデオデータセットに基づいてトレーニングされたControlHairは、テキストとポーズ条件のベースラインを上回り、正確に制御されたヘアダイナミックスを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:41:47 GMT)
Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks [13.2]
インピーダンス制御は物理的相互作用を形作るが、実現可能なインピーダンスパラメータを選択することでタスク認識チューニングを必要とする。両ドメインを組み合わせたフレームワークである拡散型インピーダンス学習を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:22:15 GMT)
Query Circuits: Explaining How Language Models Answer User Prompts [13.2]
クエリ回路を導入し、特定の入力を出力にマッピングするモデル内の情報の流れをトレースする。 NDFは、発見回路が特定の入力に対するモデルの判断をいかにうまく回復するかを評価する指標である。モデル内には非常にスパースなクエリ回路が存在し、単一のクエリでその性能を回復できることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:59:02 GMT)
Deep Survival Analysis for Competing Risk Modeling with Functional Covariates and Missing Data Imputation [13.1]
本稿では、競合リスク下での離散時間生存分析のための統合ディープラーニングフレームワークFCRNを紹介する。関数データ表現のためのマイクロネットワークバス層と勾配ベースの計算モジュールを組み合わせることで、FCRNは、欠落した値をインプットし、イベント固有のハザードを予測することを同時に学習する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:33:00 GMT)
LVT: Large-Scale Scene Reconstruction via Local View Transformers [13.1]
Local View Transformer (LVT) は大規模なシーン再構成と新しいビュー合成アーキテクチャである。空間的近傍のビューは、遠方からのビューよりも、局所的なシーン構成に関する有用な信号を提供するという知見に触発され、我々のモデルは、各ビュー周辺のローカルなエリアで全ての情報を処理します。我々は、このモデルを色と不透明度の両方のビュー依存性を含む3次元ガウスシーン表現にデコードする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:24:34 GMT)
Break the ID-Language Barrier: An Adaption Framework for LLM-based Sequential Recommendation [13.0]
ドメイン固有知識に富んだ事前学習ID埋め込みを,大規模言語モデルに統合するフレームワークであるIDLE-Adapterを提案する。 IDLE-Adapterはブリッジとして機能し、疎いユーザ-イテムインタラクションデータを高密度でLLM互換の表現に変換する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:45:36 GMT)
Towards Better Generalization via Distributional Input Projection Network [13.0]
本稿では,各層で学習可能な分布に入力を投影する新しいフレームワークDIPNetを紹介する。 DIPNetは局所的滑らか度測定とネットワークのリプシッツ定数の両方を低減し,一般化性能の向上に寄与することを示す。提案手法は既存のモデルにシームレスに組み込むことができ、現代のディープラーニングにおける一般化性能を高めるための汎用的で効果的なアプローチを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:20:58 GMT)
UniAPL: A Unified Adversarial Preference Learning Framework for Instruct-Following [12.9]
トレーニング後のアライメントは基本的には、参照学習の統一的な問題である、と我々は主張する。 UniAPLは、SFTと嗜好データの混合バッチから共同で学習する、単一段階の統合トレーニング目標を実装している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:53:09 GMT)
Visual serial processing deficits explain divergences in human and VLM reasoning [12.9]
視覚言語モデル(VLM)は、単純な視覚的推論タスクにおいて、人間のパフォーマンスにマッチしないことが多い。我々は、シリアル処理の要求に応じて、タスク間で人間とVLMのパフォーマンスを比較した。タスクがより要求されるシリアル処理を必要とするため、VLMと人間のパフォーマンスギャップは確実に広がる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:51:20 GMT)
FRABench and UFEval: Unified Fine-grained Evaluation with Task and Aspect Generalization [12.9]
UFEvalは4つの評価タスクに対してタスクとアスペクトを一般化した最初の統一された粒度評価器である。 FRABenchは、包括的なきめ細かい評価データセットである。実験により、特定の側面での学習により、UFEvalは目に見えない側面に一般化できることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:11:09 GMT)
Efficient Decomposition Identification of Deterministic Finite Automata from Examples [12.8]
DFA分解識別問題(DFA-DIP)について検討する。 DFA-DIPアプローチは、Augmented Prefix Tree Acceptors(APTA)由来のSATエンコーディングに依存する私たちの重要なイノベーションの1つは、APTAをラベル付き例から直接派生した3つの価値付きDFAに置き換えています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:50:03 GMT)
Dual Mechanisms of Value Expression: Intrinsic vs. Prompted Values in LLMs [12.8]
大きな言語モデル(LLM)は2つの異なる方法で異なる値を表現することができる。内在的表現では、トレーニング中に学んだモデル固有の価値を反映し、明示的なプロンプトによって引き起こされる表現を誘発する。内在的および帰納的価値機構は、値表現の誘導に不可欠であるが、異なる方法で現れるユニークな要素も持つ共通成分を部分的に共有していることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:57:00 GMT)
An Enhanced Pyramid Feature Network Based on Long-Range Dependencies for Multi-Organ Medical Image Segmentation [12.8]
複数の臓器にまたがる細粒度セグメンテーションタスクのための,LamFormerと呼ばれる新しいディープラーニングネットワークを提案する。 LamFormerは、既存のセグメンテーションメソッドを7つの複雑で多様なデータセットで上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:57:11 GMT)
Toxicity in Online Platforms and AI Systems: A Survey of Needs, Challenges, Mitigations, and Future Directions [12.7]
デジタル通信システムの進化とオンラインプラットフォームの設計は、必然的に有害な行動の潜在意識の伝播を促進してきた。この調査は、様々な観点から毒性の包括的分類を創出しようと試みている。人工知能時代において社会が直面する状況と環境を理解することによって、毒性を説明するための全体論的アプローチを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:55:23 GMT)
Learning with Local Search MCMC Layers [12.6]
不正確な解法による学習に理論的に根ざしたアプローチを導入する。局所探索で使用される問題固有近傍系を提案分布に変換する。時間窓を用いた大規模動的車両ルーティング問題に対する我々のアプローチを実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:05:00 GMT)
SAIP: A Plug-and-Play Scale-adaptive Module in Diffusion-based Inverse Problems [12.6]
拡散バックボーンの再トレーニングや変更をすることなく,各タイミングで適応的にスケールを改良するプラグイン・アンド・プレイモジュールであるSAIPを提案する。 SAIPは既存のサンプルにシームレスに統合され、多様な画像復元タスクの再構築品質を継続的に改善する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:41:20 GMT)
MixGRPO: Unlocking Flow-based GRPO Efficiency with Mixed ODE-SDE [12.6]
MixGRPOは、混合サンプリング戦略の柔軟性を活用する新しいフレームワークである。 MixGRPOは、人間の嗜好アライメントの多次元にわたって大きな利益をもたらし、DanceGRPOの効率と効率の両方において優れています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:05:33 GMT)
Toward Efficient Spiking Transformers: Synapse Pruning Meets Synergistic Learning-Based Compensation [12.6]
Transformerは最近、様々なタスクで有望なパフォーマンスを持つニューラルネットワークに適応している。既存のスパイキングトランスフォーマー(ST)ベースのモデルは、かなりの数のパラメータと高い計算コストを必要とする。本稿では, シナプスプルーニングと相乗的学習に基づく補償戦略を組み合わせることで, 軽量STベースモデルを導出することを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:51:37 GMT)
Segmentor-Guided Counterfactual Fine-Tuning for Image Synthesis [12.5]
対物画像生成は、トレーニングデータの拡大、データセットのデバイアス、モデリング疾患のための強力なツールである。本稿では,Seg-CFT(Seg-CFT)とSeg-CFT(Segmentor-Guided Counterfactual Fine-Tuning)を提案する。リアルな胸部X線写真を作成する能力を実証し,冠動脈疾患のモデル化に有望な結果を示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:19:09 GMT)
Efficient Generative Model Training via Embedded Representation Warmup [12.5]
生成モデルは基本的な課題に直面し、高いレベルのセマンティック概念と低レベルの合成の詳細を同時に学ばなければならない。基本的2相学習フレームワークである組込み表現ワームアップを提案する。このフレームワークは,REPAのような単一位相法と比較して,FID=1.41に達するために350エポックで11.5$times$の高速化を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:39:58 GMT)
Hyperdimensional Probe: Decoding LLM Representations via Vector Symbolic Architectures [12.5]
超次元プローブは、大規模言語モデルベクトル空間から情報を復号するための新しいパラダイムである。シンボリック表現とニューラルプローブのアイデアを組み合わせて、モデルの残留ストリームを解釈可能な概念に投影する。我々の研究は、LLMベクトル空間における情報復号化を進め、神経表現からより情報的、解釈可能、構造化された特徴を抽出することを可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:59:07 GMT)
SuperEvent: Cross-Modal Learning of Event-based Keypoint Detection for SLAM [12.4]
SuperEventは、表現力のある記述子で安定したキーポイントを予測するための、データ駆動のアプローチである。我々は SuperEvent を,現代的なスパースキーポイントとディスクリプタベースのSLAM フレームワークに統合することで,その有用性を実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:26:12 GMT)
Bridging Kolmogorov Complexity and Deep Learning: Asymptotically Optimal Description Length Objectives for Transformers [12.4]
本稿では,普遍性と最適記述長の目的に関する理論的概念を紹介する。変動目的を構築・解析することで,そのような目的を抽出し,識別可能であることを示す。より広義には、強力なアルゴリズム保証を持つ記述長目標を識別する理論的枠組みを提供することにより、より圧縮と一般化を達成するニューラルネットワークのトレーニングへの潜在的な道筋を概説する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:16:38 GMT)
Sparse Autoencoders Make Audio Foundation Models more Explainable [12.4]
我々はSparse Autoencoders (SAE) を用いて事前訓練されたモデルの隠れ表現を分析する。 SAEは元の表現とクラスラベルに関する情報の両方を保持し、内部構造を可能にする。 SAEは発声特性のゆがみを高め,それらの表現に符号化された要因を識別するための有効なツールとして確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:46:48 GMT)
K-Prism: A Knowledge-Guided and Prompt Integrated Universal Medical Image Segmentation Model [12.4]
$textbfK-Prism$は統合セグメンテーションフレームワークである。 i) $textitsemantic priors$ アノテーション付きデータセットから学び、 (ii) $textitin-context knowledge$ スクリーンショット参照例から学ぶこと、 (iii) $textitinteractive feedback$ クリックやスクリブルのようなユーザ入力から学ぶこと。セマンティック、インコンテキスト、インタラクティブセグメンテーション設定で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:34:05 GMT)
Small Vectors, Big Effects: A Mechanistic Study of RL-Induced Reasoning via Steering Vectors [12.3]
ベースモデルの残留流路に挿入された軽量ステアリングベクトルについて検討し,強化学習目標を用いて訓練を行った。 i)最後の層ステアリングベクトルは、第1生成トークンに集中したトークン置換バイアスのように振舞い、"To"や"Step"のようなトークンを一貫して増加させる。また, (i) ステアリングベクトルが他のモデルに遷移し, (ii) 独立に訓練された場合, (iii) 適応的なトークンワイドスケーリングの下で意味のあるプロンプトセグメントに集中して, 層間を結合することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:10:35 GMT)
Hybrid Reward Normalization for Process-supervised Non-verifiable Agentic Tasks [12.3]
ステップレベルの評価と結果の検証を統一するRLアプローチである原則プロセス・リワード(PPR)を導入する。 PPRは幅広いベンチマークで最先端のパフォーマンスを実現し、その顕著な堅牢性と一般化を実証している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:44:55 GMT)
Classifier-Centric Adaptive Framework for Open-Vocabulary Camouflaged Object Segmentation [12.3]
カモフラージュされたオブジェクトセグメンテーションは、トレーニング中に見つからない任意のカテゴリのカモフラージュされたオブジェクトをセグメントするモデルを必要とする。セグメンテーション性能を高めるために分類中心適応フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:16:28 GMT)
Muon Optimizes Under Spectral Norm Constraints [12.3]
重み行列のスペクトルノルムに制約を課す最適化問題を暗黙的に解くことを示す。この観点は、暗黙的に正規化され制約付き最適化アルゴリズムのより広範なクラスを探索することを可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:34:14 GMT)
Intelligent Optimization of Wireless Access Point Deployment for Communication-Based Train Control Systems Using Deep Reinforcement Learning [12.3]
都市鉄道システムは、通信ベースの列車制御(CBTC)システムにますます依存している。トンネル内のアクセスポイント(AP)の最適配置は、堅牢な無線通信に不可欠である。経験的モデルに基づく最適化アルゴリズムのような従来の手法は、過剰な測定要求によって妨げられている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:07:44 GMT)
Robust Partial 3D Point Cloud Registration via Confidence Estimation under Global Context [12.2]
部分点雲の登録は、自律認識と3Dシーン理解に不可欠である。我々は,ロバストな部分的3次元登録のための統一的信頼性駆動型フレームワークであるCEGC(Global Context)に基づく信頼度推定を提案する。 CEGCは、共有グローバルコンテキスト内で重なり合う信頼性と対応信頼性を共同でモデル化することにより、複雑なシーンの正確なアライメントを可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:36:55 GMT)
Combining Experimental and Observational Data for Identification and Estimation of Long-Term Causal Effects [12.2]
本研究では,観察領域と実験領域のデータを用いて,治療変数の長期成績に対する因果関係の同定と推定について検討した。因果効果の同定と推定を目的としたデータ融合のための3つの手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:04:19 GMT)
Multi-Scenario Highway Lane-Change Intention Prediction: A Physics-Informed AI Framework for Three-Class Classification [12.2]
車線変更操作は高速道路事故の主要な原因である。本稿では,車体キネマティクス,インタラクション実現可能性,およびトラフィック安全メトリクスを学習プロセスに統合する物理インフォームドAIフレームワークを提案する。 99.8%の精度、93.6%のマクロF1、96.1%の精度、88.7%のマクロF1を1秒の地平線で表す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:42:30 GMT)
MASt3R-Fusion: Integrating Feed-Forward Visual Model with IMU, GNSS for High-Functionality SLAM [12.2]
フィードフォワード・ポイントマップ・レグレッションと相補的なセンサ情報を統合するマルチセンサ支援視覚SLAMフレームワークMASt3R-Fusionを提案する。実時間スライディングウインドウ最適化とアグレッシブループ閉鎖を伴う大域的最適化の両立が可能な階層的因子グラフ設計法を開発した。我々は、公開ベンチマークと自己収集データセットの両方に対するアプローチを評価し、精度とロバスト性を大幅に改善したことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:40:50 GMT)
Graph Theory Meets Federated Learning over Satellite Constellations: Spanning Aggregations, Network Formation, and Performance Optimization [12.1]
Fed-Span(フェド・スパン)は、低軌道衛星コンステレーション用に設計された新しい分散学習フレームワークである。グラフ理論の原則を活用することで、Fed-Spanは動的衛星ネットワークにおける分散学習の課題に対処する。モデル収束の高速化,エネルギー効率の向上,遅延の低減などにより,Fed-Spanは既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:35:37 GMT)
AdaDetectGPT: Adaptive Detection of LLM-Generated Text with Statistical Guarantees [12.1]
テキストが人間によって作成されているか,あるいは大言語モデル(LLM)によって作成されているかを決定する問題について検討する。既存のアートロジットに基づく検出器は、所定のソースLLMの分布関数を用いて評価された観測テキストの対数確率から得られた統計値を利用する。 AdaDetectGPTは、ロジットベースの検出器の性能を高めるために、トレーニングデータから証人関数を適応的に学習する新しい分類器である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:04:35 GMT)
Everyday Physics in Korean Contexts: A Culturally Grounded Physical Reasoning Benchmark [12.1]
既存の物理コモンセンス推論ベンチマークは、主に西洋の文脈に焦点を当て、物理的な問題解決の文化的バリエーションを見下ろしている。 EPiK(Everyday Physics in Korean Contexts)は、韓国の文化的文脈における物理的推論をテストする181のバイナリ選択問題からなる新しいベンチマークである。 EPiKは2段階生成および検証パイプラインを使用して構築され、文化的にオーセンティックな問題を生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:45:16 GMT)
Multilingual Text-to-SQL: Benchmarking the Limits of Language Models with Collaborative Language Agents [12.1]
Text-to-Spiderはデータベースへの自然なアクセスを可能にするが、ほとんどのベンチマークは英語のみであり、多言語による進捗を制限する。我々はMultiSpider 2.0を導入し、スパイダー2.0を8言語(英語、ドイツ語、フランス語、スペイン語、ポルトガル語、日本語、中国語、ベトナム語)に拡張する。このベンチマークでは、最先端のLLMは本質的な推論に依存する場合、4%の精度でしか実行できないが、MultiSpider 1.0では60%に留まった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:50:39 GMT)
The Rise of AfricaNLP: Contributions, Contributors, and Community Impact (2005-2025) [12.0]
本研究ではアフリカンNLP(AfricaNLP)の進展について,基礎研究の課題を問う。我々は,1.9K NLP論文要約,4.9K著者コントリビュータ,および7.8K人による貢献文を用いて,アフリカNLP研究の貢献を定量的に検討した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:31:12 GMT)
In-Context Learning of Temporal Point Processes with Foundation Inference Models [12.0]
MTPP推論への現在のアプローチは、ターゲットシステムごとに個別に訓練された特殊なモデルに依存している。我々は、イベントシーケンスの集合によって定義されたコンテキストから、イベント履歴の条件付き強度関数を推論するために、ディープニューラルネットワークを事前訓練する。我々のアモータライズされたアプローチは、一般的なベンチマークデータセットをまたいだ次世代の予測において、特別なモデルのパフォーマンスと一致します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:28:06 GMT)
The Ultimate Test of Superintelligent AI Agents: Can an AI Balance Care and Control in Asymmetric Relationships? [12.0]
シェパードテストは、超知能人工エージェントの道徳的および関係的な次元を評価するための新しい概念テストである。私たちは、AIが知的エージェントを操作、育む、そして機器的に使用しない能力を示すときに、重要な、潜在的に危険な、知能のしきい値を越えることを主張する。これには、自己利益と従属エージェントの幸福の間の道徳的なトレードオフを評価する能力が含まれる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:30:45 GMT)
Fidel-TS: A High-Fidelity Benchmark for Multimodal Time Series Forecasting [11.9]
我々は、データソーシングの整合性、厳密な因果音性、構造的明快さに焦点をあてて、高忠実度ベンチマークのコア原則を定式化する。ライブAPIからデータをソーシングすることで,これらの原則に基づいて構築された,新たな大規模ベンチマークであるFidel-TSを紹介します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:44:49 GMT)
The Role of Empathy in Software Engineering -- A Socio-Technical Grounded Theory [11.9]
その重要性にも拘わらず、ソフトウェア工学(SE)ではいまだに共感があまり研究されていない。本研究は、SEにおける共感の役割と、SE活動とプロセスが共感を考慮してどのように改善できるかを考察した。我々の理論は、共感が起こる状況、それを形成する条件、その存在と欠如の原因と結果について詳述している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:11:11 GMT)
Manifestations of Empathy in Software Engineering: How, Why, and When It Matters [11.9]
共感はソフトウェア工学(SE)において重要な役割を担い、コラボレーション、コミュニケーション、意思決定に影響を与える。本研究は,22回のインタビューと,ソフトウェア実践者116名による大規模調査を通じて,これらの側面を調査した。本研究は, 共感の表現, 共感の実践の背景にある要因, 共感が有用であるか否かを判断するSE活動, 共感に影響を与える他の要因について考察した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:54:11 GMT)
Deeper Insights into Deep Graph Convolutional Networks: Stability and Generalization [11.9]
グラフ畳み込みネットワーク(GCN)は、グラフ学習タスクの強力なモデルとして登場した。深部GCNの安定性と一般化特性について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:28:23 GMT)
Prover Agent: An Agent-Based Framework for Formal Mathematical Proofs [11.9]
本稿では,自動定理証明のためのAIエージェントであるProver Agentを紹介する。大規模な言語モデル(LLM)と公式な証明アシスタントであるLeanを統合している。 MiniF2Fベンチマークで88.1%の成功率を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:01:54 GMT)
CommonPower: A Framework for Safe Data-Driven Smart Grid Control [11.9]
PythonツールのCommonPowerは、機械学習に適したパワーシステム管理のモデリングとシミュレーションのための最初のフレームワークである。 CommonPowerには、機械学習ベースの予測器のためのトレーニングパイプラインと、RLコントローラの学習アップデートにセーフガードのフィードバックを組み込む柔軟なメカニズムが含まれている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:07:39 GMT)
BALR-SAM: Boundary-Aware Low-Rank Adaptation of SAM for Resource-Efficient Medical Image Segmentation [11.6]
Segment Anything Model (SAM)のようなビジョン基盤モデルは、ドメイン固有の適応が欠如しているため、しばしば医療画像のセグメンテーションに苦労する。医療画像のSAMを強化する境界対応低ランク適応フレームワークであるBALR-SAMを提案する。 2) SAMのVision Transformerブロックに組み込まれた低ランクのアダプタは、医学的コンテキストにおける特徴表現と注意を最適化し、同時にパラメータ空間を著しく削減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:36:09 GMT)
The Accuracy Cost of Weakness: A Theoretical Analysis of Fixed-Segment Weak Labeling for Events in Time [11.6]
我々は、アノテータが固定長のデータセグメントに存在または不在ラベルを割り当てる共通の弱いラベル付けプロセスをモデル化する。この固定長ラベリング手法を,真のイベントアクティベーションを用いてセグメントを構成するオラクル法と比較する。本研究は, オラクルプロセスを模倣した適応的弱ラベル戦略の理論的正当性を示すものである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:44:00 GMT)
Magnon squeezing near a quantum critical point in a cavity-magnon-qubit system [11.6]
本研究では, ハイブリッドキャビティ-マグノン-量子ビット系においてマグノン圧縮状態を生成することを提案する。本研究では, 消音, 消音, サーマルノイズがマグノンスクイーズに及ぼす影響を解析した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:16:55 GMT)
Fin-Ally: Pioneering the Development of an Advanced, Commonsense-Embedded Conversational AI for Money Matters [11.6]
Fin-Solution 2.Oは、マルチターン金融対話データセットFin-Vaultを導入する高度なソリューションである。統一されたモデルであるFin-Allyが組み込まれており、常識推論、丁寧さ、人間のような会話力学を統合している。新たなFin-Vaultデータセットは、1,417の注釈付きマルチターンダイアログで構成されており、Fin-Allyは基本的なアカウント管理を超えて、パーソナライズされた予算管理、リアルタイムの費用追跡、自動化された金融計画を提供することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:44:47 GMT)
Agentar-Scale-SQL: Advancing Text-to-SQL through Orchestrated Test-Time Scaling [11.6]
最先端のSOTA (State-of-the-art) テキスト・トゥ・ザ・アートの手法は、BIRDのような挑戦的なベンチマークに関して、人間の専門家よりかなり遅れている。テスト時間のスケーリングを探求する現在のアプローチでは、組織化された戦略が欠如し、モデルの内部推論プロセスを無視しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:50:02 GMT)
What Do You Need for Diverse Trajectory Composition in Diffusion Planning? [11.6]
計画において、縫合はアルゴリズムが訓練されたデータのサブトラジェクトリをまとめて新しい多様な振る舞いを生成する能力である。近年のBC法では縫合の習熟度が向上している。この背景にある主な要因はよく理解されておらず、確実に縫合できる新しいアルゴリズムの開発を妨げる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:35:44 GMT)
Generalist Multi-Class Anomaly Detection via Distillation to Two Heterogeneous Student Networks [11.5]
異常検出は、様々な現実世界のアプリケーションにおいて重要な役割を果たす。最近の手法では、一般的な異常検出に対処しようと試みているが、その性能はデータセット固有の設定や単一クラスタスクに敏感である。本稿では,このギャップを埋めるために,知識蒸留(KD)に基づく新しい二重モデルアンサンブル手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:31:31 GMT)
Mind the Value-Action Gap: Do LLMs Act in Alignment with Their Values? [11.5]
バリュー・アクション・ギャップ(Value-Action Gap)は、現実の文脈における個人の価値観と行動の相違を明らかにする。本研究では,LLMの値と値インフォームドアクションのアライメントを評価するための評価フレームワークであるValueActionLensを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:03:13 GMT)
Hamiltonian Neural PDE Solvers through Functional Approximation [11.5]
ハミルトンニューラルネットワークは、物理系において保存法則が尊重されるように、原則化された方法を提供する。本研究では、ハミルトニアン汎函数を、ニューラルネットワークによってパラメータ化されたカーネル積分として表現する。これにより、勾配領域における機能的および学習を予測することにより、ハミルトン力学をニューラルPDEソルバに拡張することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:43:43 GMT)
Socratic-Zero : Bootstrapping Reasoning via Data-Free Agent Co-evolution [11.5]
Socratic-Zeroは、最小限のシード例から高品質なトレーニングデータを生成する、完全に自律的なフレームワークである。このシステムは、既存のタスクやラベルを必要とせずに、自己改善カリキュラムを生成する。 Socratic-r-8Bは、以前のデータ合成法よりも平均的に+20.2ポイント向上する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:54:07 GMT)
Scalable Audio-Visual Masked Autoencoders for Efficient Affective Video Facial Analysis [11.4]
Affective Video Face Analysis (AVFA) は感情認識知能システム構築の鍵となる研究分野として浮上している。 Masked Autoencoders (MAE) が勢いを増し、オーディオ・ビジュアル・コンテキストへの適応が増加している。 AVF-MAE++(AVF-MAE++)は、AVFAのスケーリング特性を効率的に調査するために設計されたオーディオビジュアルMAEモデルのファミリーである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:53:49 GMT)
DRCP: Diffusion on Reinforced Cooperative Perception for Perceiving Beyond Limits [11.3]
Diffusion on Reinforced Cooperative Perception (DRCP)は動的運転環境における問題に対処するために設計されたリアルタイムデプロイ可能なフレームワークである。提案システムは,モバイルプラットフォーム上でのリアルタイムなパフォーマンスを実現するとともに,困難な条件下でのロバスト性を大幅に向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:13:03 GMT)
Modeling Others' Minds as Code [11.3]
コード内の行動プログラムを合成する新しいアルゴリズムであるROTEを紹介する。 ROTEは、スパースな観察から人間とAIの振る舞いを予測する。行動理解をプログラム合成問題として扱うことで、ROTEはAIシステムが現実世界の人間の行動を効率的に効果的に予測する道を開く。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:56:34 GMT)
TRUE: A Reproducible Framework for LLM-Driven Relevance Judgment in Information Retrieval [11.3]
関連判断生成のためのtextitTask-aware Evaluation (TRUE) を提案する。 TRUEはもともと,検索セッションにおける有用性評価のために開発された。 TRUEをTREC DL 2019, 2020, LLMJudgeデータセットで評価した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:58:47 GMT)
Norm-Bounded Low-Rank Adaptation [11.3]
パラメータ効率の良い微調整のためのノルム有界低ランク適応(NB-LoRA)を提案する。 NB-ロラ (NB-LoRA) は、適応行列の各特異値の明示的な境界を許容する低ランクな重み適応の新しいパラメータ化である。実験により,NB-LoRAは適応性能の小さなコストを伴わずにモデル忘れを回避できることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:01:43 GMT)
Black-Box Crypto is Useless for Pseudorandom Codes [11.2]
擬似乱数符号(英: pseudorandom code)は、任意の数の符号化が任意の計算上の有界敵に対してランダムに現れるという性質を持つ鍵付き誤り訂正スキームである。ランダムエラーの一定率を許容するコードの疑似ランダム性は、ほぼすべての汎用暗号プリミティブに対するブラックボックスの削減に基づいてはならないことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:28:54 GMT)
ChessArena: A Chess Testbed for Evaluating Strategic Reasoning Capabilities of Large Language Models [11.2]
本稿では,大規模言語モデル(LLM)の戦略的推論能力を評価するためのチェステストベッドであるChessArenaを提案する。 Chessには、長期計画、厳格なルール理解、マルチターン会話記憶など、複雑な戦略的推論機能が必要である。素人レベルのチェスエンジンであるマイア1100に勝てるモデルはないが、任意に動きを選択するランダムプレイヤーに勝てないモデルもある。我々の微調整されたQwen3-8Bは性能を大幅に改善し、最先端の推論モデルにアプローチしました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:24:48 GMT)
SpecExtend: A Drop-in Enhancement for Speculative Decoding of Long Sequences [11.2]
SpecExtendは、追加のトレーニングなしで長いシーケンスでの投機的復号化を改善する。長い入力のドラフト精度と速度をトレーニングせずに向上させるため,クロスモデル検索を提案する。 SpecExtendは16K-tokenの長い要約で最大2.84倍、長い推論で最大3.86倍の投機的復号化を加速する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:34:50 GMT)
Takedown: How It's Done in Modern Coding Agent Exploits [11.2]
本研究では,8つの実世界の符号化エージェントの総合的セキュリティ分析を行う。ユーザシステムの機密性や整合性を損なうために悪用される可能性のある,これまで見過ごされあるいは見逃された問題を含む,15のセキュリティ問題を特定します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:27:18 GMT)
Sample-based Hamiltonian and Lindbladian simulation: Non-asymptotic analysis of sample complexity [11.2]
本稿では、密度行列指数(DME)と波行列リンドブラッド化(WML)の詳細なサンプル複雑性解析について述べる。どちらのアルゴリズムも原型的なサンプルベース量子アルゴリズムである。リンドブラッド作用素が非自明に振る舞うとき、WMLはサンプルベースのリンドブラディアンシミュレーションに最適であることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:55:22 GMT)
Nonclassical phonon pair [11.2]
懸濁シリコンマイクロ構造における量子相関フォノン対を生成する新しい手法を提案する。コーシー=シュワルツの不等式に違反して生成したフォノン対の古典的でない性質を実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:16:15 GMT)
HyperHELM: Hyperbolic Hierarchy Encoding for mRNA Language Modeling [11.1]
HyperHELMはmRNA配列の双曲空間で事前訓練を行うマスク付き言語モデルを実装している。これは、プロパティ予測を含む10のタスクのうち9つのタスクでユークリッドのベースラインを上回ります。これは、階層を意識したユークリッドモデルを3%のアノテーション精度で上回る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:04:15 GMT)
Digital Privacy Under Attack: Challenges and Enablers [11.1]
我々は、匿名データ、統計集計、プライバシー保護モデルという3つのドメインをターゲットにした攻撃を体系的に分類する。各カテゴリにおいて、攻撃方法、敵の能力、脆弱性メカニズムを解析する。我々の分析によると、差分プライバシーは強力な理論的保証を提供するが、新たな攻撃に対する実装上の課題と潜在的な脆弱性に直面している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:23:37 GMT)
Amelia: A Large Dataset and Model for Airport Surface Movement Forecasting [11.0]
米国では、空港の管制塔の90%以上が不足しており、FAA(連邦航空局)や労働組合の基準に満たされていない。データ駆動型端末空域予測モデルは、これらの課題に対処する可能性を示している。アメリア42 (Amelia-42) は、空港の原位置移動に関する報告をまとめた大規模なコレクションである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:20:32 GMT)
BiHDTrans: binary hyperdimensional transformer for efficient multivariate time series classification [11.0]
本稿では,効率的なニューロシンボリック二次元超次元変換器であるBiHDTransを紹介する。変換器の時間的モデリング能力とHDコンピューティングの表現効率を統一する。 FPGA上でのハードウェアアクセラレーションにより、BiHDTransはSOTAバイナリトランスよりも39.4倍低い推論レイテンシを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:12:51 GMT)
SimuHome: A Temporal- and Environment-Aware Benchmark for Smart Home LLM Agents [10.9]
SimuHomeは、スマートデバイスをシミュレートし、APIコールをサポートし、環境変数の変更を反映する時間短縮ホーム環境である。 SimuHomeは高忠実な環境を提供し、SimuHomeで検証されたエージェントは、最小限の適応で実際のMatter準拠のデバイスにデプロイできる。統合されたReActフレームワーク下での11エージェントの評価では、モデルが単純なタスクでうまく機能する一方で、潜在意図推論、状態検証、特に時間的スケジューリングに苦労していることが判明した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:54:20 GMT)
Cold-Start Active Correlation Clustering [10.9]
本研究では,ペアの類似性を事前に提供せず,能動学習によるコスト効率の高いクエリを行なわなければならない,能動相関クラスタリングについて検討する。プロセスの早期に多様性を促進するカバレッジ・アウェア手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:29:21 GMT)
Physics-Inspired Extrapolation for efficient error mitigation and hardware certification [10.8]
量子エラー軽減は、ノイズの多い中間スケールの量子時代にとって不可欠である。ほとんどのQEM法は、偏りのない推定を達成するために指数的なサンプリングオーバーヘッドを発生させる。本稿では,物理に着想を得た線形回路ランタイムプロトコルである外挿法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:25:10 GMT)
FM-FoG: A Real-Time Foundation Model-based Wearable System for Freezing-of-Gait Mitigation [10.8]
フリーズ・オブ・ゲイト(FoG)は、パーキンソン病(PD)患者の50%以上に影響を与える。現在のFoG検出システムは、患者固有の広範なトレーニングデータを必要とし、一般化が欠如している。 FM-FoGは, 患者固有の訓練を受けずに, 未確認患者のFoG検出を実現するための, リアルタイム基礎モデルに基づくウェアラブルシステムである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:45:05 GMT)
Expanding Horizons of Level Diversity via Multi-objective Evolutionary Learning [10.8]
本稿では,生成モデルの訓練において,多次元の多様性を考慮し,レベル多様性の地平を広げることを目的とする。モデルトレーニングを多目的学習問題として定式化し、各多様性指標を個別の目的として扱う。モデル学習プロセスを通して複数の多様性指標を同時に最適化する多目的進化学習フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:43:33 GMT)
OMeGa: Joint Optimization of Explicit Meshes and Gaussian Splats for Robust Scene-Level Surface Reconstruction [10.7]
OMeGaは、明示的な三角形メッシュと2Dガウススプラットを共同で最適化するエンドツーエンドフレームワークである。 OMeGaは、挑戦的な屋内再構築ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:43:40 GMT)
Similarity-Dissimilarity Loss for Multi-label Supervised Contrastive Learning [10.7]
教師付きコントラスト学習はラベル情報を活用することで大きな成功を収めた。しかし、多ラベルシナリオにおける正のサンプルの決定は依然として重要な課題である。そこで本研究では,類似度と相似性係数に基づいて,サンプルを動的に再重み付けする新しい類似性-相似性損失を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:25:40 GMT)
VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip [10.7]
Value Sign Flip (VSF) は、数ステップの拡散とフローマッチング画像生成モデルに負のプロンプトガイダンスを組み込む、シンプルで効率的な方法である。本手法は計算オーバーヘッドを小さくし,MMDiTスタイルのアーキテクチャを効果的に統合する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:57:53 GMT)
T2VUnlearning: A Concept Erasing Method for Text-to-Video Diffusion Models [10.6]
テキスト・ツー・ビデオ拡散モデル(T2V)の最近の進歩は、生成されたビデオの品質を大幅に向上させた。明示的または有害なコンテンツを生成する能力は、誤用や潜在的権利侵害に関連する新しい課題をもたらす。未学習に基づく概念消去を解決策として提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:38:50 GMT)
CLPO: Curriculum Learning meets Policy Optimization for LLM Reasoning [10.5]
政策最適化プロセス内に動的教育フィードバックループを生成する新しいアルゴリズムであるCLPOを提案する。 Curriculum-Guided Learning for Policy Optimizationは、静的トレーニング手順を、モデルの能力と共進化する動的なプロセスに変換する。実験により、CLPOは8つの挑戦的な数学的および一般的な推論ベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:29:04 GMT)
SpecExit: Accelerating Large Reasoning Model via Speculative Exit [10.5]
我々は、将来のトークンとドラフトモデルから直接、オーバーヘッドを予測せずに早期終了シグナルを予測するフレームワークであるSpecExitを提案する。提案手法は,平均生成長を66%削減し,エンドツーエンドのレイテンシで2.5倍の高速化を実現した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:39:32 GMT)
Q-REACH: Quantum information Repetition, Error Analysis and Correction using Caching Network [10.5]
量子メモリを組み込んだ量子リピータは、送信された量子情報(光子)の損失軽減に重要な役割を果たすこのような量子リピータにおける利用可能なストレージの可用性の制限は、量子情報忠実度(量子状態のペア間の類似度を定量化する計量)と量子ビット伝送率の間のトレードオフを示す。本稿では,キャッシュネットワークにおけるキューイング理論を利用したQ-REACHを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:54:44 GMT)
Multi-Scale Geometric Autoencoder [10.5]
オートエンコーダ設計における重要な課題は、潜在空間におけるデータの幾何学的構造を維持することである。幾何構造の両スケールを同時に保存するマルチスケール幾何オートエンコーダ(MAE)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:32:25 GMT)
A GREAT Architecture for Edge-Based Graph Problems Like TSP [10.5]
グラフエッジ注意ネットワーク(GREAT)と呼ばれる新しいGNNベースのエッジ指向ニューラルモデルを提案する。 GREATをエンコーダとして使用して、ルーティング問題インスタンスのプロパティをキャプチャし、強化学習フレームワークを構築する。我々のフレームワークは、これらの問題の非ユークリッド変種と学習ベースのベンチマーク間の競合結果に最初に取り組みました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:30:46 GMT)
Hallucination is Inevitable for LLMs with the Open World Assumption [10.5]
大言語モデル(LLM)は印象的な言語能力を示すが、不正確または製造されたアウトプットも生成する(しばしば幻覚と呼ばれる)。」本稿では,一般化問題の顕在化として「幻覚」を再構成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:38:44 GMT)
Predicting Training Re-evaluation Curves Enables Effective Data Curriculums for LLMs [10.4]
トレーニング再評価曲線 (TREC)* を導入する。 TRECの低点に高品質なデータを置くと性能が著しく向上することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:31:35 GMT)
Stabilizing Humanoid Robot Trajectory Generation via Physics-Informed Learning and Control-Informed Steering [10.4]
近年のヒューマノイドロボット制御は、人間のデータからスムーズな人間のような軌道の学習を可能にするために模倣学習に成功している。本稿では,システムの物理と基本的な制御原理を活かした2段階の学習戦略を提案する。本研究では, エルゴキューブ型ヒューマノイドロボットの移動挙動を解析し, 物理インフォームド・ロスが接触足の速度をゼロにする手法について検証した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:31:14 GMT)
Ethics Statements in AI Music Papers: The Effective and the Ineffective [10.3]
ISMIR, NIME, および過去5年間のAI音楽における著名な作品について, 倫理的記述のレビューを行う。我々は,音声会議と研究者の両方に対して,形式的コンプライアンスよりも有意義なリフレクションを助長する方法として,倫理的ステートメントへの関与を推奨する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:52:30 GMT)
Uncertainty-Aware Deep Learning for Wildfire Danger Forecasting [10.3]
森林火災は最も深刻な自然災害の1つであり、人間や自然の生態系に重大な脅威をもたらす。深層学習(DL)は山火事の危険性を予測することを約束しているが、その導入は予測の信頼性に関する懸念から妨げられている。本稿では,短期的な山火事の危険予知を支援するために,モデルとアレータリック(データ)の不確実性を共同で捕捉する不確実性認識型DLフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:43:17 GMT)
Confidence-Guided Error Correction for Disordered Speech Recognition [10.3]
音声認識のための後処理モジュールとしての大規模言語モデル(LLM)について検討する。話者とデータセット間のロバスト性や一般化を改善するために,単語レベルの不確実性推定を直接LLMトレーニングに組み込む信頼性インフォームドプロンプトを提案する。我々はLLaMA 3.1モデルを微調整し、我々のアプローチを転写のみの微調整とポストホック信頼に基づくフィルタリングと比較する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:00:38 GMT)
Cycle Diffusion Model for Counterfactual Image Generation [10.3]
サイクル拡散モデル(CDM)は生成された画像と元の画像の一貫性を強制する。コンディショニングの精度を向上し、FIDとSSIMで測定した画質を向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:24:13 GMT)
OSDA: A Framework for Open-Set Discovery and Automatic Interpretation of Land-cover in Remote Sensing Imagery [10.2]
リモートセンシングにおけるオープン・セットの土地被覆分析は、きめ細かい空間的局所化とセマンティック・オープンな分類を実現する能力を必要とする。我々は,アノテーションのないオープンセット土地被覆発見,セグメンテーション,記述のための3段階統合フレームワークOSDAを紹介する。我々の研究は、動的土地被覆モニタリングのためのスケーラブルで解釈可能なソリューションを提供し、自動地図更新と大規模地球観測分析の強力な可能性を示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:22:45 GMT)
Protecting Human Cognition in the Age of AI [10.2]
ジェネレーティブAI(GenAI)の急速な採用は、人間の認知を大きく変えつつある。本稿では、認知の異なる側面におけるGenAIの影響について、既存の文献を合成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:50:58 GMT)
Breaking Rank Bottlenecks in Knowledge Graph Embeddings [10.1]
リンク予測のための知識グラフ埋め込み(KGE)モデルは強力なエンコーダを使用する。エンティティの数がモデルの埋め込み次元よりも大きい場合、ランクのボトルネックを持つ線形出力層が存在します。言語モデリングの文献から着想を得たKGE-MoSを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:55:48 GMT)
Prompting Robot Teams with Natural Language [10.1]
鍵となる課題は、集団における個人の行動は特定し解釈することが難しいことである。これは、タスクのロジックとセマンティクスによって要求される表現能力を持つフレームワークを必要とする。シミュレーションおよび実世界のマルチロボットタスクにおいて,この単一軽量解釈モデルの評価を行う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:29:18 GMT)
Entanglement and Bell Nonlocality in $τ^+ τ^-$ at the LHC using Machine Learning for Neutrino Reconstruction [10.1]
標準モデルで予測される物理過程の精密測定は、高エネルギーで自然を深く理解し続けています。我々は、量子トモグラフィーと量子エンタングルメントを測定するために、$pp to tau+tau-X$のプロセスの詳細なシミュレーションを行う。ニュートリノ運動量再構成のための高度な機械学習技術を用いて、全スピン密度行列の正確な測定を実現する。統計学的に有意なベル非局所性は, 5$sigma$を超え, $tau+ tau-$が確立された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:17:49 GMT)
Reward Model Overoptimisation in Iterated RLHF [10.0]
RLHF(Reinforcement Learning from Human feedback)は、大規模言語モデルと人間の好みを整合させる手法である。 RLHFはしばしば報酬モデルの過度な最適化に悩まされ、モデルが報酬関数に過度に適合する。反復RLHFにおける過最適化の総合的研究について紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:26:43 GMT)
Saliency Guided Longitudinal Medical Visual Question Answering [10.0]
縦断的視覚的質問応答(Diff-VQA)は、異なる時間点からペアによる研究を比較する必要がある。本稿では, 胸部X線Diff-VQAのためのサリエンシ誘導型エンコーダデコーダを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:26:17 GMT)
PEARL: Performance-Enhanced Aggregated Representation Learning [10.0]
本稿では,性能向上型集約表現学習手法を提案する。下流タスクのパフォーマンスを改善するために、複数の表現学習アプローチを組み合わせる。本手法を高度な機械学習モデルと比較することにより,多様なタスクにおいて評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:50:29 GMT)
Symmetry-Aware Bayesian Optimization via Max Kernels [9.9]
群軌道間の最大の類似性の使用は、他の領域で長い間検討されてきた。本研究では、最大核のPSDプロジェクションを考慮し、この考え方を再考する。既存の不変(および不変でない)カーネルと比較して、合成および実世界のBOベンチマークにおいて、非常に少ない後悔が得られることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:02:28 GMT)
A Markov Categorical Framework for Language Modeling [9.9]
自己回帰言語モデルは、優れたパフォーマンスを達成するが、内部メカニズム、訓練が表現をどのように形作り、複雑な振る舞いを可能にするかを説明する統一理論は、いまだ解明されていない。本稿では,マルコフカテゴリーの言語を用いた情報処理段階の合成として,単一ステップ生成過程をモデル化する新しい分析フレームワークを提案する。この研究は、モデルを通して情報がどのように流れ、訓練対象が内部形状をどう形成するかを理解するための強力な新しいレンズを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:08:06 GMT)
Optimal Nuisance Function Tuning for Estimating a Doubly Robust Functional under Proportional Asymptotics [9.9]
我々は,既存のECC推定器3つと,必要なニュアンス関数を推定するための2つのサンプル分割戦略を評価する。我々のバイアス補正戦略は、異なるサンプル分割戦略と推定器の選択で$sqrtn$-consistent estimatorが生成されることを示す。解析の結果、予測調整パラメータ(すなわち、ニュアンス関数を最適に推定するパラメータ)は、ECC推定器の最低分散に繋がらないことが明らかとなった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:46:14 GMT)
Instruction Guided Multi Object Image Editing with Quantity and Layout Consistency [9.8]
QL-Adapterは、オブジェクトカウントと空間レイアウトの実施、さまざまなカテゴリの調整という2つの課題に取り組む、複数のオブジェクト編集のためのフレームワークである。 QL-Datasetは幅広いカテゴリ、レイアウト、カウントのバリエーションにまたがるベンチマークで、量とレイアウト一貫性のあるイメージ編集(QL-Edit)のタスクを定義しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:33:51 GMT)
LOGOS: LLM-driven End-to-End Grounded Theory Development and Schema Induction for Qualitative Research [9.8]
グラウンドド理論は質的なデータから深い洞察を提供するが、専門家が集中する手動コーディングに依存しているため、大きなスケーラビリティのボトルネックが生じる。基礎理論ワークフローを完全に自動化する新しいエンドツーエンドフレームワークであるLOGOSを紹介する。 LOGOSはLLM駆動のコーディング、セマンティッククラスタリング、グラフ推論、そして再利用可能なコードブックを構築するための新しい反復的洗練プロセスを統合している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:16:09 GMT)
ScarFinder: a detector of optimal scar trajectories in quantum many-body dynamics [9.7]
量子多体傷などのコヒーレントな量子力学を引き起こすメカニズムは、最近多くの関心を集めている。 ScarFinderは、スカー状態やその構造を事前に知ることなく、スカーライクなダイナミクスの可能性を明らかにする変分フレームワークである。我々はScarFinderを量子多体系におけるコヒーレントダイナミクスの同定と最適化のための強力なモデルに依存しないツールとして確立した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:30:37 GMT)
AGNOMIN - Architecture Agnostic Multi-Label Function Name Prediction [9.7]
本稿では,削除されたバイナリにおける複数ラベル関数名予測の新しい手法AGNOMINを提案する。 AGNOMINはFeature-Enriched Hierarchical Graphs (FEHGs)を構築し、コントロールフローグラフ、ファンクションコールグラフ、動的に学習されたtexttPCode機能を組み合わせた。我々はAGNOMINを3つのアーキテクチャにわたる9000個のELF実行可能バイナリの包括的データセットで評価し、最先端のアプローチと比較して優れた性能を示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:18:18 GMT)
Resisting Contextual Interference in RAG via Parametric-Knowledge Reinforcement [9.7]
Retrieval-augmented Generation (RAG)は、知識集約的なタスクのパフォーマンスを向上させるが、間違った、無関係、あるいは、検索されたテキストの矛盾によって脱線することができる。本稿では,大規模言語モデルにパラメトリック知識を用いた強化学習フレームワークであるKnowledgeable-R1を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:47:56 GMT)
Beyond checkmate: exploring the creative chokepoints in AI text [9.7]
我々は、テキストセグメント間の人間とAIのテキスト間のニュアンスな区別を描写する(模倣、体、結論)。我々の研究は、人間とAIのテキストの違いに対する新たな洞察を提供し、より効果的かつ解釈可能な検出戦略の道を開く。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:58:01 GMT)
LLM-RG: Referential Grounding in Outdoor Scenarios using Large Language Models [9.6]
屋外の運転シーンにおける参照グラウンドリングは、大きなシーンの変動、多くの視覚的に類似したオブジェクト、動的要素のために困難である。 LLM-RGは,既製の視覚言語モデルと,記号的推論のための大規模言語モデルを組み合わせたハイブリッドパイプラインである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:32:54 GMT)
Identifying All ε-Best Arms in (Misspecified) Linear Bandits [9.6]
LinFACT (LinFACT) は、リニアバンディットにおける全てのエプシロンベストアームの識別を最適化するために設計されたアルゴリズムである。我々は、LinFACTが、この下界を対数係数にマッチングすることで、インスタンス最適性を達成することを示す。合成および実薬品発見データを含む数値実験により、LinFACTはサンプルの複雑さを減らしたより有望な候補を同定することを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:26:52 GMT)
RobustNeuralNetworks.jl: a Package for Machine Learning and Data-Driven Control with Certified Robustness [9.5]
RobustNeuralNetworks.jl: ニューラルネットワークモデル用のJuliaパッケージ。このパッケージは、最近提案されたRecurrent Equilibrium Network (REN)とLipschitz-Bounded Deep Network (LBDN)モデルクラスに基づいている。 Juliaの最も広く使われている機械学習パッケージであるFlux.jlに直接インタフェースするように設計されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:41:39 GMT)
Watermarking Diffusion Language Models [9.5]
拡散言語モデル(DLM)に適した最初の透かしを導入する。これは、トークンを逐次生成する標準自己回帰言語モデル(ARLM)とは対照的に、任意の順序でトークンを生成できる創発的LLMパラダイムである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:11:40 GMT)
Noise Sensitivity and Learning Lower Bounds for Hierarchical Functions [9.5]
階層内の各関数が線型から$varepsilon$-farであれば、雑音安定性は階層の深さにおいて指数関数的に小さくなることを示す。私たちの結果はすぐに学習に役立ちます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:18:45 GMT)
ClustRecNet: A Novel End-to-End Deep Learning Framework for Clustering Algorithm Recommendation [9.4]
ClustRecNetは、特定のデータセットに最適なクラスタリングアルゴリズムを決定するための、新しいディープラーニング(DL)ベースのレコメンデーションフレームワークである。多様な構造を持つ34,000の合成データセットからなる包括的データリポジトリを構築した。提案するネットワークアーキテクチャは,局所構造パターンとグローバル構造パターンの両方を捉えるために,畳み込み,残差,注意機構を統合している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:48:33 GMT)
ePC: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks [9.4]
Predictive Coding (PC)は、ニューラルネットワークトレーニングのバックプロパゲーションに生物学的に妥当な代替手段を提供する。本稿では根本原因を特定し,原理的解法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:58:40 GMT)
Skeleton-based Robust Registration Framework for Corrupted 3D Point Clouds [9.4]
実世界の点雲は、しばしばセンサーの制限、環境騒音、前処理エラーによって影響を受ける。既存の登録方法は直接点マッチングや表面特徴抽出に依存しており、これはこれらの汚職に非常に影響を受けやすい。スケルトンベースのロバストな登録フレームワークが紹介され、レジリエントな骨格表現を導入し、レジストネスと精度を向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:31:47 GMT)
Gradient-Free Training of Quantized Neural Networks [9.3]
ニューラルネットワークのトレーニングには、かなりの計算資源とエネルギーが必要である。混合精度と量子化学習はビット使用量を減少させるが、計算コストの高い勾配に基づく最適化に大きく依存している。我々は、勾配を完全に排除するパラダイムシフトを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:57:27 GMT)
LEAD: Large Foundation Model for EEG-Based Alzheimer's Disease Detection [9.3]
認知症における脳波解析のための最初の大規模基礎モデルであるLEADを提案する。私たちは、12のデータセット(AD関連3つ、非AD9つ)で事前トレーニングを行い、4つのADデータセットで微調整/テストを行いました。 10基のベースラインと比較して、LEADは一貫して被写体レベルの検出性能が優れている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:25:49 GMT)
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration [9.2]
自動科学的発見のための情報理論フレームワークPiFlowを紹介する。提案手法は,曲線下面積の73.55%増加を反映して,発見効率を著しく向上させる。全体として、PiFlowはPlug-and-Playメソッドとして機能し、高度に効率的な自動科学的発見における新しいパラダイムシフトを確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:30:53 GMT)
Mechanisms of Matter: Language Inferential Benchmark on Physicochemical Hypothesis in Materials Synthesis [9.2]
物質合成のための有効な科学的仮説を生成するための大規模言語モデルの能力は、ほとんど定量化されていない。本研究では、8つのナノマテリアル合成ドメインにわたるLCM生成仮説を評価するベンチマークであるMatterMechを紹介する。 LLMは抽象論理に精通しているが、基礎的な物理化学的原理の根拠にはならない。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:03:09 GMT)
Intent-Driven Storage Systems: From Low-Level Tuning to High-Level Understanding [9.2]
既存のストレージシステムはワークロードインテントの可視性を欠き、現代的な大規模アプリケーションに適応する能力を制限する。 Intent-Driven Storage Systems (IDSS) は,大規模言語モデル(LLM)が非構造化信号からワークロードとシステム意図を推論する新しいパラダイムのビジョンである。 IDSSは、競合する要求に対する全体的な推論を提供し、ポリシーガードレール内の安全で効率的な決定を合成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:07:40 GMT)
Memory Transfer Planning: LLM-driven Context-Aware Code Adaptation for Robot Manipulation [9.1]
大規模言語モデル(LLM)はロボット操作においてますます研究されているが、既存の多くの手法は新しい環境への適応に苦慮している。本稿では,異なる環境からの制御コード例を手続き的知識として活用する,メモリ転送計画(MTP)を紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:18:59 GMT)
Scaling with Collapse: Efficient and Predictable Training of LLM Families [9.0]
崩壊は計算効率のトレーニングのサインとして現れる。計算効率のトレーニングのサインとして崩壊が現れることを示す。大規模に2つの応用を実演する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:26:11 GMT)
VIMD: Monocular Visual-Inertial Motion and Depth Estimation [9.0]
我々は,高密度な距離深さを推定するために,単眼の視覚-慣性運動と深度学習フレームワークを開発した。中心となるVIMDは、複数ビュー情報を利用してピクセル単位のスケールを反復的に洗練することである。以上の結果から,画像あたり10～20メートルの奥行きが極めて少ない場合でも,VIMDの精度と頑健性は極めて高いことがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:52:30 GMT)
Lifelong Learning with Behavior Consolidation for Vehicle Routing [8.9]
本稿では,ニューラルVRPソルバのための新しい生涯学習パラダイムについて検討する。 LLR-BCは、新しいタスクで訓練された問題解決者の行動とバッファリングされた課題とを整合させることにより、事前知識を効果的に統合する。静電容量化車両経路問題と走行セールスマン問題の実験は、高性能ニューラルネットワークの訓練におけるLLR-BCの有効性を実証している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:24:05 GMT)
The Thinking Spectrum: An Empirical Study of Tunable Reasoning in LLMs through Model Merging [8.9]
本稿では,複数の推論ベンチマークにまたがるモデルマージ手法について,大規模な実験的検討を行った。その結果, モデルマージは, 推論精度とトークン効率のトレードオフを校正するための, 効果的かつ制御可能な手法であることがわかった。本研究は、この調整可能な空間を包括的に解析し、特定の推論プロファイルを持つLCMを作成するための実践的ガイドラインを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:57:53 GMT)
SkyLink: Unifying Street-Satellite Geo-Localization via UAV-Mediated 3D Scene Alignment [8.9]
クロスビュージオローカライゼーションは、異なる視点間の位置対応を確立することを目的としている。既存のアプローチは通常、直接的特徴類似性マッチングを通じて、クロスビュー相関を学習する。本稿では,この特異な問題に対処する新しいSkyLink法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:43:18 GMT)
IMPACT: Importance-Aware Activation Space Reconstruction [8.9]
大規模言語モデル(LLM)は、多くのドメインにわたって高いパフォーマンスを達成するが、リソース制約のある設定では、そのサイズのためデプロイが困難である。本稿では, モデル圧縮決定とモデル動作への影響を関連付ける, 重要度に配慮したアクティベーション再構築のためのフレームワークであるIMPACTを提案する。多様なモデルやタスクにわたる実験により、IMPACTは最先端のベースラインに匹敵する精度で最大48.6%のモデルサイズ縮小を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:12:38 GMT)
Multimodal Iterative RAG for Knowledge-Intensive Visual Question Answering [8.8]
MI-RAGは、推論を利用して検索を強化し、知識合成を取り入れて理解を深めるフレームワークである。 Encyclopedic VQA、InfoSeek、OK-VQAといった挑戦的なベンチマークの実験は、MI-RAGが検索リコールと回答精度の両方を著しく改善していることを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:50:38 GMT)
Smart Contract Intent Detection with Pre-trained Programming Language Model [8.7]
スマートコントラクトにおける悪意ある開発者の意図は、分散アプリケーション(DApps)において重大なセキュリティ脅威となる。本研究では,このモデルの強化版であるSmartIntentNN2(Smart Contract Intent Neural Network V2)を提案する。 BERTベースの事前訓練型プログラミング言語モデルを統合することで,実世界の16,000のスマートコントラクトのデータセットに対して,ドメイン順応的に事前トレーニングを行うことが可能になる。実験の結果,SmartIntentNN2は0.9789,精度0.9090,リコール0.9476,F1スコア0.9279の総合的性能に優れていた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:30:09 GMT)
Distributionally Robust Federated Learning with Outlier Resilience [8.7]
本研究では, 分散的頑健なフェデレーション学習について, 明確な外部レジリエンスを用いて検討した。我々は、ロバスト性証明を許容するトラクタブルなラグランジアンペナルティ最適化として問題を再構築する。この改革に基づいて,分散外乱フェデレーション学習アルゴリズムを提案し,その収束保証を確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:42:12 GMT)
DWGS: Enhancing Sparse-View Gaussian Splatting with Hybrid-Loss Depth Estimation and Bidirectional Warping [8.7]
スパースビューからの新規ビュー合成は3次元再構成における中核的な課題である。スパースビュー合成のための3DGSを強化する新しい統合フレームワークであるDWGSを提案する。 DWGSは21.13dBのPSNRと0.189LPIPSを達成し、リアルタイム推論能力を維持している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:03:31 GMT)
Non-Invasive Detection of PROState Cancer with Novel Time-Dependent Diffusion MRI and AI-Enhanced Quantitative Radiological Interpretation: PROS-TD-AI [8.6]
前立腺癌(PCa)は、男性で最も頻繁に診断される悪性腫瘍であり、世界で8番目に多いがん死の原因である。組織を特徴づける新しい配列である時間依存性拡散(TDD)MRIでは、臨床的に有意なPCaと区別する上で、前臨床効果が促進されている。本研究プロトコルは,自家製のAI強化型TDD-MRIソフトウェア(PROSTDAI)の診断における将来的評価を概説する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:12:02 GMT)
EigenTrack: Spectral Activation Feature Tracking for Hallucination and Out-of-Distribution Detection in LLMs and VLMs [8.6]
EigenTrackは大規模言語モデル(LLM)のための解釈可能なリアルタイム検出器である表面誤差が現れる前に幻覚とOODドリフトを信号する表現構造における時間的シフトを追跡する。既存のホワイトボックス検出器とは異なり、時間的コンテキストを保存し、グローバルシグナルを集約し、解釈可能な精度-遅延トレードオフを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:54:21 GMT)
Physics-informed learning under mixing: How physical knowledge speeds up learning [8.6]
物理インフォームド機械学習における大きな課題は、事前ドメイン知識の取り込みがデータに依存する場合の学習率にどのように影響するかを理解することである。確率と予測における余剰リスクに複雑性に依存した境界を導出する。物理先行情報が整列されると、学習速度が(低)ソボレフのミニマックスレートから(高速)最適i.dに向上することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:52:02 GMT)
Ko-PIQA: A Korean Physical Commonsense Reasoning Dataset with Cultural Context [8.5]
Ko-PIQAは、文化的な文脈を取り入れた韓国の物理常識推論データセットである。 19.7%の質問には、伝統的な朝鮮料理(キムチ)、衣服(ハンボック)、特殊器具(キムチ冷蔵庫)など、文化的に特定の要素が含まれている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:32:59 GMT)
Leveraging Vulnerabilities in Temporal Graph Neural Networks via Strategic High-Impact Assaults [8.5]
時間グラフニューラルネットワーク(TGNN)は、臨界アプリケーションにおける動的グラフの分析に欠かせないものとなっている。 High Impact Attack (HIA)は、TGNNの重大な脆弱性を明らかにするために設計された、制限されたブラックボックス攻撃フレームワークである。 HIAはリンク予測タスクにおいてTGNNの精度を著しく低下させ、平均相反ランク(MRR)を最大35.55%減少させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:21:56 GMT)
ViReSkill: Vision-Grounded Replanning with Skill Memory for LLM-Based Planning in Lifelong Robot Learning [8.5]
LLM(Large Language Models)とVLM(Vision-Language Models)は、最小限のデータから知識豊富なプランニングを約束する。本稿では,ビジュアルグラウンドのリプランニングと,蓄積と再利用のためのスキルメモリを組み合わせたフレームワークであるViReSkillを提案する。成功すると、実行された計画は再利用可能なスキルとして保存され、LLM/VLMへの追加の呼び出しなしで将来の遭遇で再生される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:58:53 GMT)
SCOPE: Semantic Conditioning for Sim2Real Category-Level Object Pose Estimation in Robotics [8.5]
SCOPEは拡散に基づくカテゴリーレベルのオブジェクトポーズ推定モデルである。 DINOv2の機能を連続的なセマンティックプリエントとして活用することで、個別のカテゴリラベルの必要性を解消する。 5$5cmのメートル法で31.9%の相対的な改善を達成している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:27:59 GMT)
Speculative Verification: Exploiting Information Gain to Refine Speculative Decoding [8.4]
投機的検証は投機精度を動的に予測し、検証長を適用してスループットを最大化する。 SD性能を最大2$times$まで改善し、大容量設定では平均1.4$times$になる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:25:54 GMT)
Transduction is All You Need for Structured Data Workflows [8.2]
本稿では,構造化データワークフローパイプライン構築のためのエージェント型AIフレームワークであるAgenticsを紹介する。研究と実践の両方のために設計されたAgenticsは、エージェントがデータタイプに埋め込まれる新しいデータ中心のパラダイムを提供する。本稿では,本手法の有効性を実証した,構造化データワークフロータスクと実証的エビデンスについて述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:42:12 GMT)
Infrastructure Sensor-enabled Vehicle Data Generation using Multi-Sensor Fusion for Proactive Safety Applications at Work Zone [8.1]
インフラベースセンシングとリアルタイム軌道生成は、ワークゾーンなどの高リスク道路セグメントの安全性向上を約束する。本研究では、路面カメラとLiDARセンサーを協調環境に組み込むことにより、これらの障壁に対処する。シミュレーションでは、融合アルゴリズムは個々のセンサーと比較して、長手誤差を最大70%削減した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:58:27 GMT)
Unmute the Patch Tokens: Rethinking Probing in Multi-Label Audio Classification [8.1]
オーディオにおける自己教師型学習は、微調整をデフォルトとする。本稿では,二項化プローブについて紹介する。二項化プローブは,プロトタイプを学習し,クラスワイズ情報アグリゲーションを行う軽量でシンプルなプーリング手法である。我々の研究は、オーディオSSLモデルを評価するための競争的かつ効率的なパラダイムとして探索を確立し、コストのかかる微調整への依存に挑戦する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:11:18 GMT)
From Code to Action: Hierarchical Learning of Diffusion-VLM Policies [8.1]
ロボット操作の模倣学習はしばしば、限られた一般化とデータ不足に悩まされる。本稿では,コード生成型視覚言語モデル(VLM)を活用した階層型フレームワークを提案する。この設計は、解釈可能なポリシーの分解を可能にし、フラットなポリシーと比較して一般化を改善し、高レベルの計画と低レベルの制御を別々に評価できるようにする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:22:18 GMT)
InterKey: Cross-modal Intersection Keypoints for Global Localization on OpenStreetMap [8.0]
OpenStreetMap (OSM)は、無償でグローバルに利用可能な代替手段を提供するが、その粗い抽象化は、センサーデータとマッチングする上での課題を提起する。道路交差点をグローバルなローカライゼーションの目立ったランドマークとして活用するクロスモーダルなフレームワークであるInterKeyを提案する。本手法は,道路を共同で符号化し,点群とOSMからのインプリントを構築することで,コンパクトなバイナリ記述子を構築する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:12:09 GMT)
REALIGN: Regularized Procedure Alignment with Matching Video Embeddings via Partial Gromov-Wasserstein Optimal Transport [8.0]
実世界の命令データには、しばしばバックグラウンドセグメント、繰り返しアクション、順番に示されるステップが含まれている。正規化部分グロモフ・ワッサースタイン最適輸送(R-FPGWOT)に基づく手続き学習のための自己指導型フレームワークREALIGNを紹介する。 KOTとは対照的に、我々の定式化は部分的なアライメントスキームの下で視覚的対応と時間的関係を共同でモデル化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:32:14 GMT)
Less is More: Lean yet Powerful Vision-Language Model for Autonomous Driving [7.9]
我々は,一段階のエンドツーエンド自動運転のための新しいフレームワークであるMax-V1を紹介する。我々のフレームワークは、運転の本質的にの順序性と整合した単一パス生成パラダイムを提供する。実験により,本手法はnuScenesデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:14:18 GMT)
Successful Misunderstandings: Learning to Coordinate Without Being Understood [7.8]
信号ゲームでは、個人は通信信号と相互作用の結果以外の共通の観察をしない。この設定は、異なる環境を知覚するエージェントの集団におけるコミュニケーションの出現を研究するためのプロキシとして使用される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:08:00 GMT)
A multiscale analysis of mean-field transformers in the moderate interaction regime [7.7]
本研究では,エンコーダのみの変圧器モデルを用いた推論時間におけるトークンの進化について検討する。これらの相のそれぞれにおける極限力学の厳密な特徴づけを提供し、上述の極限における収束性を証明する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:57:04 GMT)
"Stop replacing salt with sugar!'': Towards Intuitive Human-Agent Teaching [7.7]
人間は少数の例からすぐに新しい概念を学ぶ。そこで本研究では,エージェントに実例を提供してタスクの実行方法を教えることができる直感的なヒューマンエージェント教育アーキテクチャを提案する。本研究では,外部の記号的知識を活用する学習手法とともに,戦略的順序で例を提示することにより,エージェントをより効率的に一般化できることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:00:53 GMT)
Human vs. AI Safety Perception? Decoding Human Safety Perception with Eye-Tracking Systems, Street View Images, and Explainable AI [7.7]
アイトラッキングシステムは、ユーザーが見ているものや、特定の環境要素にどれくらいの時間従事しているかを定量化する。安全な環境を認識する際に人間の注意を引き付ける重要な視覚要素を同定する。これらの洞察は、都市の特徴が人間の安全知覚に影響を与えるというより人間中心の理解を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:05:39 GMT)
Localizing Task Recognition and Task Learning in In-Context Learning via Attention Head Analysis [7.7]
TRヘッドはタスクサブスペースに隠れた状態をアライメントすることでタスク認識を促進する一方、TLヘッドはサブスペース内の隠れた状態を正しいラベルに向けて回転させ、予測を容易にする。したがって、我々のフレームワークは、様々なタスクや設定で大規模な言語モデルがどのようにILCを実行するかについて、統一的で解釈可能な説明を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:28:37 GMT)
MAESTRO : Adaptive Sparse Attention and Robust Learning for Multimodal Dynamic Time Series [7.7]
既存のマルチモーダル学習アプローチの重要な制約を克服する新しいフレームワークであるMAESTROを紹介する。 MAESTROのコアとなるのは、タスクの関連性に基づいた動的イントラモーダル相互作用とクロスモーダル相互作用である。 3つのアプリケーションにまたがる4つの多様なデータセットに基づいて,MAESTROを10のベースラインに対して評価した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:07:06 GMT)
Differentiable Expectation-Maximisation and Applications to Gaussian Mixture Model Optimal Transport [7.7]
expectation-Maximisation (EM)アルゴリズムは計算と機械学習の中心的なツールである。 EMは通常、差別化不可能なブラックボックスとして扱われ、現代の学習パイプラインへの統合を妨げている。本稿では,EMの完全自動微分から近似手法まで,その精度と計算効率を評価・比較する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:15:38 GMT)
SiNGER: A Clearer Voice Distills Vision Transformers Further [7.6]
高ノルムのアーティファクトが目的を担っているため、学生はアーティファクトや過度な情報信号に過度に適合する。以前の作業では、アーティファクトの除去を試みたが、アーティファクトの抑制と情報的信号の保存の間に固有のトレードオフに遭遇した。 Singular Nullspace-Guided Energy Reallocation (SiNGER)を紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:07:53 GMT)
Neural network embeddings recover value dimensions from psychometric survey items on par with human data [7.6]
SQuID(Survey and Questionnaire Item Embeddings Differentials)は,ニューラルネットワークの埋め込みによって心理測定項目から潜伏次元を復元する手法である。本研究では,SQuIDで処理された大規模言語モデルから得られた埋め込みが,人間のレーダ判断から得られた人間の値の構造を復元できることを実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:14:54 GMT)
Encoder Circuit Optimization for Non-Binary Quantum Error Correction Codes in Prime Dimensions: An Algorithmic Framework [7.5]
本稿では,素次元安定化器符号に対してエンコーダ回路を最適化するための体系的枠組みを提案する。本手法が鍵符号に対して有効であることを示し,エンコーダ回路ゲート数の13～44%削減を実現した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:24:07 GMT)
Answer Convergence as a Signal for Early Stopping in Reasoning [7.5]
大型言語モデル(LLM)における思考の連鎖(CoT)の促進提案手法は,(1)応答整合性による早期停止,(2)終末信号発生確率の向上,(3)内部アクティベーションに基づいていつ停止するかを学習する教師付き手法である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:58:14 GMT)
An Efficient 3D Latent Diffusion Model for T1-contrast Enhanced MRI Generation [7.5]
ガドリニウム系造影剤(GBCA)は、病変の可視化を促進するために一般的にT1w MRIで使用されるが、腎原性全身線維症のリスクがある患者に限られる。本研究では,前コントラストマルチパラメトリックMRIからT1コントラスト強調画像(T1C)を生成する3次元ディープラーニングフレームワークを開発した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:22:55 GMT)
Agentic Specification Generator for Move Programs [7.5]
我々は、Moveスマートコントラクト用に設計された自動仕様生成ツールであるMSGを紹介する。 MSGは、テストされたMove関数の84%の検証可能な仕様を生成することに成功した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:34:31 GMT)
RadOnc-GPT: An Autonomous LLM Agent for Real-Time Patient Outcomes Labeling at Scale [7.5]
RadOnc-GPTは、患者固有の情報を独立して取り出すことができる、LLMベースの自律型大規模言語モデルである。以上の結果から,RadOnc-GPTは複雑性が増大する2つの明確な階層にまたがって明確に評価されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:55:50 GMT)
CharGen: Fast and Fluent Portrait Modification [7.5]
CharGenは属性固有のConcept SlidersとStreamDiffusionサンプリングパイプラインを組み合わせた、文字中心のエディタである。正確な編集制御とID一貫性のある結果によって、2～4倍高速な編集ターンアラウンドを実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:09:30 GMT)
Ocassionally Secure: A Comparative Analysis of Code Generation Assistants [7.4]
本稿では,LLMを効果的かつ安全に展開できる状況と状況を特定し,理解することに焦点を当てる。 Google の ChatGPT と Bard と Gemini を用いた 4 つの高度な LLM--GPT-3.5 と GPT-4 の比較分析を行い,各モデルのコード生成能力を評価した。 61のコードアウトプットを収集し、機能、セキュリティ、パフォーマンス、複雑さ、信頼性など、さまざまな側面で分析しました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:46:04 GMT)
Spontaneous High-Order Generalization in Neural Theory-of-Mind Networks [7.4]
理論・オブ・ミンド(Theory-of-Mind、ToM)は、精神状態が自己や他者に帰属する中核的な人間の認知能力である。ニューラルネットワークは、高度なスキルに頼ることなく、一階から高階までのToMを自然に一般化できることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:01:06 GMT)
Nirvana AI Governance: How AI Policymaking Is Committing Three Old Fallacies [7.4]
私は現在のAI規制提案の根本的な欠陥を明らかにします。一部のコメンテーターは、人々は機械よりも信頼性が高いと直感的に信じている。一部の政策立案者や研究者は、損害とコストが彼らの提案に固有のものであるという事実に気付いていない。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:47:36 GMT)
Identity Bridge: Enabling Implicit Reasoning via Shared Latent Memory [7.2]
本稿では,ゼロホップ・アイデンティティ・タスク上でモデルを監視することで構成ギャップを解消するメカニズムであるアイデンティティ・ブリッジを紹介する。この機構により、モデルが分配不能な2つのホップ推論をうまく実行できることが示される。研究は大規模モデルに拡張され、潜時記憶を通して2つのホップ推論がまだ達成されていることを観察する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:02:05 GMT)
Regulating Online Algorithmic Pricing: A Comparative Study of Privacy and Data Protection Laws in the EU and US [7.2]
ビッグデータ、AI、機械学習により、売り手やオンラインプラットフォームがリアルタイムで顧客の価格を調整できるようになった。オンラインアルゴリズムの価格設定は、プライバシー、デジタル自律性、非差別の基本的な価値に脅威をもたらす。大西洋の両岸では、議会は異なる方法でオンラインのアルゴリズム価格を規制しようと努力している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:46:56 GMT)
Near-Optimal Simultaneous Estimation of Quantum State Moments [7.2]
量子ビットの再利用による量子状態モーメントの資源効率の同時推定のためのフレームワークを提案する。キュービットリセット操作を利用することで、同時モーメント推定のためのコア回路は2m+1$物理キュービットと$mathcalO(k)$CSWAPゲートしか必要としない。我々は,推定モーメントが状態の最大固有値に厳密な境界を生じることを示すことによって,このプロトコルの有用性を実証し,ハイゼンベルクモデルの低エネルギー状態にアクセスするための量子仮想冷却への応用を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:23:26 GMT)
Comprehensive Benchmarking of YOLOv11 Architectures for Scalable and Granular Peripheral Blood Cell Detection [7.1]
手動末梢血スミア(PBS)分析は、労働集約的で主観的である。ディープラーニングは有望な代替手段を提供するが、細粒度PBS検出のためのYOLOv11のような技術モデルの体系的な評価はいまだに不足している。 12種類の末梢血細胞クラスに16,891枚の画像とレッド血細胞クラスを含む大規模なアノテートされた血液細胞検出分類データセットを収集し,対象検出タスクに慎重にアノテートした。このデータセットには合計で298,850個の注釈付き細胞が含まれている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:00:19 GMT)
Robust Preference Optimization: Aligning Language Models with Noisy Preference Feedback [7.1]
本稿では、アライメント法を改善するために、Robust Preference Optimization (RPO)を導入する。 RPOは、各ラベルの正しさの後方確率を推測するために、期待最大化(EM)アルゴリズムを用いる。我々の実験は、RPOがメタフレームワークとして有効であることを示し、4つの最先端アライメントアルゴリズムを一貫して強化した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:17:49 GMT)
LEAF: A Robust Expert-Based Framework for Few-Shot Continual Event Detection [7.1]
LEAFは、連続イベント検出のための新しくて堅牢なエキスパートベースのフレームワークである。各専門家はローランク適応(LoRA)行列でパラメータ化される。セマンティックアウェアの専門家選択機構は、インスタンスを最も関係のある専門家に動的にルーティングし、専門家の専門化と知識干渉の低減を可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:00:25 GMT)
Pseudorandom Unitaries in the Haar Random Oracle Model [7.1]
量子ハールランダムオラクルモデルにおいて強い擬似乱数ユニタリを構築する。また、ランダムな量子回路から量子擬似ランダム性を構築するためのアプローチも提案した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:17:29 GMT)
FlashOmni: A Unified Sparse Attention Engine for Diffusion Transformers [7.0]
Flash Omni は任意の DiT アーキテクチャと互換性のあるスパースアテンションエンジンである。ほぼ直線で、注意力の空間比のスピードアップとGEMM-$Q$とをよく一致させ、GEMM-$O$で2.5$times$-3.8$times$Accelerationを達成している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:57:14 GMT)
Origins of Creativity in Attention-Based Diffusion Models [7.0]
我々は, 自己注意が, 生成サンプルのパッチレベルを超えて, 局所的な特徴のグローバルな画像一貫性を誘導することを示す。提案理論は, 局所特徴の局所的配置が, 生成サンプルのパッチレベルを超えた世界的イメージ一貫性を持つことを示唆するものである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:10:40 GMT)
Dinkel: State-Aware and Granular Framework for Validating Graph Databases [7.0]
グラフデータベース管理システム(GDBMS)は、多くのデータ駆動アプリケーションを動かしている。我々は,GDBMSを徹底的にテストする,新しい,実用的なアプローチを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:15:17 GMT)
Towards Reliable Generation of Executable Workflows by Foundation Models [6.9]
この作業では、静的解析フィードバックを活用して、FMが生成したDSLベースの欠陥を検出し、修復することを可能にするフレームワークを導入している。 FM生成DSLにおける欠陥の頻度は,少なくとも1つの欠陥を含む研究事例の87.27%と高い。我々は、FM生成DSL用に特別に設計された最初の静的解析器であるTimonを開発し、検出された欠陥を修復するためのFMベースのツールであるPumbaaをガイドする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:42:45 GMT)
Beyond Noisy-TVs: Noise-Robust Exploration Via Learning Progress Monitoring [6.9]
本稿では,LPM(Learning Progress Monitoring)という本質的な動機付け探索手法を提案する。探索中、LPMは予測エラーや新規性ではなくモデルの改善に報いるため、学習可能な遷移を観察するために効果的にエージェントに報いる。その結果、LPMの内因性報酬はより早く収束し、迷路実験でより多くの状態を探究し、アタリにおける外因性報酬のより高い値を得ることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:43:44 GMT)
DiffTester: Accelerating Unit Test Generation for Diffusion LLMs via Repetitive Pattern [6.9]
DiffTesterは、単体テスト生成(UTG)におけるdLLMに適したアクセラレーションフレームワークである。 DiffTesterは、出力の品質を損なうことなく、各ステップで生成されるトークンの数を適応的に増加させる。最初はPythonに限られていたTestEvalベンチマークを拡張し、JavaやC++などの追加のプログラミング言語を導入しました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:04:18 GMT)
Don't Sweat the Small Stuff: Segment-Level Meta-Evaluation Based on Pairwise Difference Correlation [6.8]
Pairwise Different Pearson (PDP)は機械翻訳のための新しいセグメントレベルのメタ評価指標である以前のPearsonの$rho$ベースとKendallの$tau$ベースのメタ評価アプローチの制限に対処する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:06:50 GMT)
LTL$_f$ Learning Meets Boolean Set Cover [6.8]
我々はBoltと呼ばれる新しいCPUツールを実装し、ベンチマークの70%よりも100倍以上高速な公式を学習することで、技術の状態を改善した。 Boolean Set Coverコンポーネントのおかげで、私たちのアプローチは効率と公式サイズの間に新たなトレードオフを提供します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:20:20 GMT)
The Multi-Query Paradox in Zeroth-Order Optimization [6.8]
Zeroth-order Alignment (ZO)は、明示的な勾配が利用できない問題に対して強力なフレームワークを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:52:34 GMT)
Learning Smooth State-Dependent Traversability from Dense Point Clouds [6.7]
オフロード自動運転における主要な課題は、地形の移動可能性がしばしば車両の状態に依存することである。 SPARTA(SPARTA)は、点雲からの接近角度条件付きトラバータビリティを推定する手法である。本モデルでは,40mの岩場を横断する91%の成功率を達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:57:40 GMT)
Two-Dimensional XOR-Based Secret Sharing for Layered Multipath Communication [6.7]
本稿では,層状マルチパス通信ネットワークのための2次元XORを用いた秘密共有方式を提案する。本稿では,各送信層における単一経路を敵が監視し,破壊した場合に,メッセージの回復と完全なプライバシーを保証する構造を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:40:31 GMT)
Multi-Layer Secret Sharing for Cross-Layer Attack Defense in 5G Networks: a COTS UE Demonstration [6.7]
本デモでは,商用オフ・ザ・シェルフ(COTS)5Gユーザ機器(UE)における多層シークレット共有の実装について紹介する。我々のXORベースのアプローチは、ネットワークオペレータと分散リレーに秘密の共有を分散し、1つのネットワークオペレータと1つのリレーが同時に失われても、完全なリカバリとデータの機密性を確保する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:21:30 GMT)
Towards agile multi-robot systems in the real world: Fast onboard tracking of active blinking markers for relative localization [6.7]
マルチロボットチームメンバーの活発な点滅マーカーは、実世界展開における航空機の相対的位置付けの堅牢性を改善する。従来の追跡アルゴリズムは、カメラフレームに断続的に現れるため、素早く動く点滅マーカーに苦しむ。屋外実験では、AMTアプローチは密度、精度、複雑さを追跡する最先端の手法よりも優れていた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:44:15 GMT)
Beyond WER: Probing Whisper's Sub-token Decoder Across Diverse Language Resource Levels [6.6]
本稿では,Whisperの多言語デコーダの詳細な解析を紹介する。提案手法は,ビーム探索経路をトレースし,サブトークン推定とその関連確率を推定する。リソース言語が低いほど、これらのメトリクスは悪化するが、サブトークンの使用ではクラスタリングパターンが異なる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:20:05 GMT)
On the Limitations of Pseudorandom Unitaries [6.6]
Pseudorandom Unitary (PRU) は、Haarのランダムなユニタリーと計算的に区別できない計算可能なユニタリーである。ブラックボックス方式で擬似乱数ユニタリからQCCCビットのコミットメントとQCCC鍵契約を構築することはできないことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:55:25 GMT)
Circuit-Aware Reward Training: A Mechanistic Framework for Longtail Robustness in RLHF [6.6]
本稿では,報酬モデルにおけるレアイベント処理に責任を負う特殊なニューラルネットワークを同定する機械的解釈可能性フレームワークを提案する。我々の理論的枠組みは、回路特殊化、報酬一般化境界、ロングテール性能の間の形式的な接続を確立する。このアプローチは、報酬モデル失敗に関する理論的洞察と、長期的堅牢性を改善するための実践的な介入の両方を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:42:14 GMT)
VAMO: Efficient Zeroth-Order Variance Reduction for SGD with Faster Convergence [6.6]
大規模非問題はディープラーニングでは一般的である。ファーストオーダー(FO)は今日のベースラインとして機能する。 ZOアルゴリズムは計算量とメモリコストを減らす。 VAMOは、より少ない動的メモリ要求でこれらのゲインを達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:30:09 GMT)
Overview of SCIDOCA 2025 Shared Task on Citation Prediction, Discovery, and Placement [6.5]
本稿では,SCIDOCA 2025共有タスクの概要を紹介する。タスクは、Citation Discovery、Masked Citation Prediction、Citation Sentence Predictionの3つのサブタスクに分けられる。我々はセマンティック・スカラー・オープン・リサーチ・コーパス(S2ORC)から構築した大規模データセットを公開し、6万以上の注釈付き段落とキュレートされた参照セットを含む。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:55:18 GMT)
DEPFusion: Dual-Domain Enhancement and Priority-Guided Mamba Fusion for UAV Multispectral Object Detection [6.4]
DEPFusionというフレームワークがUAVマルチスペクトル物体検出のために提案されている。デュアルドメイン強化(DDE)と優先誘導マンバ核融合(PGMF)から構成される。 DroneVehicleとVEDAIデータセットの実験は、DEPFusionが最先端の手法で優れたパフォーマンスを達成することを実証している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:14:38 GMT)
Frequency-Aware Ensemble Learning for BraTS 2025 Pediatric Brain Tumor Segmentation [6.4]
我々は,BraTS-PED 2025チャレンジに対して,nnU-Net,Swin UNETR,HFF-Netを統合するアンサンブルアプローチを提案する。提案手法には3つの重要な拡張が組み込まれている: 最適な nnU-Net 複雑性制御のための調整可能なスケール、BraTS 2021 の事前学習モデルからの変換学習、周波数領域の分解である。最終的なアンサンブルは、nnU-Net、微調整Swin UNETR、HFF-Netを組み合わせ、72.3%(ET)、95.6%(NET)、68.9%(CC)、89.5%(ED)、92.3%(TC)のDiceスコアを得る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:07:57 GMT)
Finding Phones Fast: Low-Latency and Scalable Monitoring of Cellular Communications in Sensitive Areas [6.4]
低レイテンシシステムは、タイムリーな検出、決定(例えばジオフェンシングやローカライゼーション)、および機密領域における未承認通信の破壊を可能にするために重要である。我々は,ユーザデータ転送に先立って,すべての演算子間のセル接続を監視するために設計された,最初の低レイテンシで演算子に依存しないスケーラブルなシステムであるLTagを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:39:12 GMT)
Adaptive Group Policy Optimization: Towards Stable Training and Token-Efficient Reasoning [6.4]
本稿では,適応的グループポリシー最適化(AGPO)を提案する。これは,適応的損失関数(adaptive loss function)を用いて,トレーニングのゆらぎとトークンの非効率を緩和する。実験により,提案手法は推論ステップにおけるトークンを著しく少なくして,より安定した訓練と優れた性能を実現することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:31:50 GMT)
A Predictive Approach To Enhance Time-Series Forecasting [6.4]
本稿では、時系列イベント予測を強化するアプローチであるFuture-Guided Learningを紹介する。本手法は2つのモデルから構成される: 重要事象を識別するために将来のデータを解析する検出モデルと、これらの事象を現在のデータに基づいて予測する予測モデルである。脳波データを用いた発作予測ではAUC-ROCが44.8%増加し,非線形力学系ではMSEが23.4%減少した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:39:26 GMT)
Beyond Overall Accuracy: A Psychometric Deep Dive into the Topic-Specific Medical Capabilities of 80 Large Language Models [6.4]
項目応答理論(IRT)に基づく厳密な評価フレームワークであるtextscMedIRT を紹介する。 80の多種多様な言語モデル (LLMs) から, バランスのとれた1,100のUSMLE準拠のベンチマークで, 新たな回答を期待して収集した。 LLMの潜在モデル能力は質問の難易度や識別と共同で推定し、精度のみよりも安定でニュアンスの高い性能ランキングを得る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:06:13 GMT)
Defeating Cerberus: Concept-Guided Privacy-Leakage Mitigation in Multimodal Language Models [6.3]
本稿では,PII関連コンテンツに関連するモデルの内部状態を同定し,修正する概念誘導緩和手法を提案する。本手法は, PII感受性タスクを学習や微調整を必要とせず, 効果的かつ効率的に拒否できるようにVLMを誘導する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:27:10 GMT)
Alternatives To Next Token Prediction In Text Generation - A Survey [6.3]
Next Token Prediction (NTP) は、Large Language Models (LLMs) を前例のない成功に導いた。本調査では,NTPに代わる新たなエコシステムについて述べる。これらの方法で洞察を合成することにより、この調査はトークンレベルの生成の既知の限界に対処するモデルの研究を導くための分類学を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:18:16 GMT)
ELPG-DTFS: Prior-Guided Adaptive Time-Frequency Graph Neural Network for EEG Depression Diagnosis [6.3]
本稿では,事前誘導型適応時間周波数グラフニューラルネットワークELPG-DTFSを提案する。 128チャンネルのMODMAデータセット(53名の被験者)では、ELPG-DTFSは97.63%の精度と97.33%のF1を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:44:37 GMT)
Interpretable Kernel Representation Learning at Scale: A Unified Framework Utilizing Nyström Approximation [6.2]
我々は、Nystrによるカーネルベースの表現学習のための統一フレームワークであるKREPESを紹介する。 KREPESは、広範囲の非監督的かつ自己監督的な損失に対応している。これは学習した表現の原則的解釈可能性を可能にし、深層モデルよりもすぐれた利益をもたらす。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:45:40 GMT)
What Matters in Data for DPO? [6.2]
DPO(Direct Preference Optimization)は、大規模言語モデルを人間の好みに合わせるためのシンプルで効果的なアプローチとして登場した。本研究では,DPOの嗜好データ分布が理論的・経験的両面からどう影響するかを体系的に検討する。選択された応答の質がDPOの目的を最適化する上で重要な役割を担っているのに対し、拒否された応答の質は比較的限定的な影響を持つ可能性があることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:03:34 GMT)
Forcrat: Automatic I/O API Translation from C to Rust via Origin and Capability Analysis [6.2]
ライブラリ機能の重要なサブセットであるI/O APIを置き換えることに重点を置いています。本稿では,2つの静的解析手法,起点解析と機能解析,エラーソース解析を提案し,その結果を用いてI/O APIを置き換える。提案手法は,(1)変換後にテストスイートをパスした32プログラム,(2)14秒で422kLOCを効率よく解析,変換し,(3)広く適用でき,I/O APIコールの82%を置き換える。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:21:34 GMT)
The Quantum Decoding Problem : Tight Achievability Bounds and Application to Regev's Reduction [6.1]
我々は、$l_infty$ノルムに対するショート・ソリューション(SIS)問題に対する量子的優位性を示す。最近の論文で、Chailloux と Tillich はベルヌーイ分布に従えば、量子復号問題はアルゴリズム時間で解くことができることを示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:48:05 GMT)
Inducing Dyslexia in Vision Language Models [6.1]
我々は、ディプレクシアをシミュレートするために、大規模な視覚言語モデルを使用する。 VLM内の視覚単語選択単位を同定し、これらの単位の目標アブレーションが読解タスクの選択的障害につながることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:03:16 GMT)
Between Help and Harm: An Evaluation of Mental Health Crisis Handling by LLMs [6.0]
臨床的にインフォームドされた6つのメンタルヘルス危機カテゴリーの統一分類を導入する。我々は、危機タイプを分類し、安全で適切な応答を生成する能力のために、3つの最先端のLCMをベンチマークする。間接的または曖昧なリスク信号の処理におけるシステム的弱点、定式的および不完全なデフォルト応答への依存、およびユーザコンテキストとの頻繁な不一致を識別する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:42:23 GMT)
Toward Causal-Visual Programming: Enhancing Agentic Reasoning in Low-Code Environments [6.0]
Causal-Visual Programming (CVP)は、ワークフローモジュールのためのシンプルな"世界モデル"を、直感的にローコードインターフェースで定義することができる。この因果グラフは、エージェントの推論プロセスにおいて重要な制約として機能し、その決定をユーザ定義因果構造に固定する。 CVPは、より解釈可能で信頼性があり、信頼できるAIエージェントを構築するための実行可能な道を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:01:31 GMT)
Emotion-Aligned Generation in Diffusion Text to Speech Models via Preference-Guided Optimization [6.0]
EASPO(Emotion-Aware Stepwise Preference Optimization, EASPO)は、拡散性TTSと微妙な感情的嗜好を中間認知ステップで一致させる学習後フレームワークである。提案手法の中心となるのは、雑音の多い中間音声状態を記録し、自動選好ペア構築を可能にする時間条件付きモデルであるEASPMである。実験は、表現性と自然性の両方において、既存の方法よりも優れた性能を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:19:42 GMT)
Learning Object-Centric Representations Based on Slots in Real World Scenarios [5.9]
この論文では、オブジェクト中心合成のための強力な事前学習拡散モデルを適用するフレームワークを紹介している。我々は、大域的なシーンコヒーレンスと不整合オブジェクト制御のバランスをとるという、重要な課題を識別する。本手法は,軽量なスロットベースの条件付けを事前訓練されたモデルに統合し,オブジェクト固有の操作を提供しながら,それらの視覚的先行を保留する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:01:49 GMT)
Economic Competition, EU Regulation, and Executive Orders: A Framework for Discussing AI Policy Implications in CS Courses [5.9]
コンピュータ科学のカリキュラムには、AI政策の意義に関する議論がまだ存在しないと論じる。技術的および非技術的(倫理的)CSコースにおけるAI政策に関するクラス議論の枠組化のための指導的質問を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:26:53 GMT)
Unit Test Update through LLM-Driven Context Collection and Error-Type-Aware Refinement [5.9]
テストのメンテナンス方法は、主に壊れたテストの修復に焦点を当て、新しい機能を検証するために既存のテストを強化するシナリオを無視します。実運用コードの変更に応じて、ジャスト・イン・タイムの自動テスト更新を可能にする新しいアプローチであるTESTUPDATERを提案する。 TestUPDATERは94.4%のコンパイルパス率と86.7%のテストパス率を達成し、それぞれ最先端のSYTERを15.9%と20.0%で上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:08:22 GMT)
Social 3D Scene Graphs: Modeling Human Actions and Relations for Interactive Service Robots [5.9]
ソーシャル3Dシーングラフ(Social 3D Scene Graphs)は、人間、その属性、活動、環境内の関係をローカルとリモートの両方でキャプチャする拡張3Dシーングラフである。我々の表現は、人間と環境の関係についての人間の行動予測と推論を改善し、社会的に知的なロボットへの道を歩む。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:00:40 GMT)
Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It) [5.8]
スタイル的な特徴空間は、検出を防ぐために最適化された言語モデルからのサンプルを確実に検出するために使用することができる。我々は,文体的特徴空間における人書きと機械書きのギャップを埋めることを目的とした,新しい言い換えのアプローチを探求する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:56:44 GMT)
Trading Carbon for Physics: On the Resource Efficiency of Machine Learning for Spatio-Temporal Forecasting [5.7]
本研究では,誘導バイアスがモデル効率,エネルギー,炭素間のトレードオフにどのように役立つかを考察する。モデル設計に物理帰納バイアスを埋め込むことで、かなりの効率性が得られることを示す。我々は、モデルの有効性を伴うモデル効率が、機械学習モデルの開発と展開を駆動する中核となるべきであると論じている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:34:53 GMT)
GESA: Graph-Enhanced Semantic Allocation for Generalized, Fair, and Explainable Candidate-Role Matching [5.7]
現在のアプローチは、セマンティックな柔軟性、永続的な人口統計バイアス、意思決定プロセスの不透明さ、動的ポリシー制約の下でのスケーラビリティの低下に悩まされている。 GESAは、ドメイン適応型トランスフォーマーの埋め込み、異種自己教師付きグラフニューラルネットワーク、対向的デバイアス機構、多目的遺伝的最適化、説明可能なAIコンポーネントの統合を通じて、これらの制限に対処する包括的フレームワークである。大規模国際ベンチマークによる評価では、94.5%のトップ3アロケーション精度、多様性表現の37%改善、人口統計カテゴリー別0.98フェアネススコア、エンド・ツー・エンドのレイテンシーが優れた性能を示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:41:55 GMT)
Incentive-Aligned Multi-Source LLM Summaries [5.7]
本稿では,具体的トラスラベルを使わずに現実的ロバスト性を向上させるインセンティブ型フレームワークであるTrusful Text Summarization(TTS)を紹介する。 TTSは、情報的合意に報いる、適応されたマルチタスクのピア予測メカニズムでソースをスコアする。我々は、情報源のインセンティブと情報的誠実さを一致させる正式な保証を確立し、実用性を最大化する戦略を真実に報告する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:42 GMT)
Bundle Network: a Machine Learning-Based Bundle Method [5.6]
本稿では,非滑らかな問題に対して,Bundle Methodに着想を得た学習ベースアルゴリズムである Bundle Network を提案する。アンロールされた計算グラフを活用することで、Bundle Networkは自動微分によってエンドツーエンドでトレーニングすることができます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:59:49 GMT)
Towards Identifiability of Interventional Stochastic Differential Equations [5.6]
複数の介入の下で微分方程式(SDE)の識別可能性について検討する。本結果より, 定常分布から得られたサンプルからSDEパラメータを一意に回収するための最初の証明可能なバウンダリが得られた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:59:58 GMT)
Let LLMs Speak Embedding Languages: Generative Text Embeddings via Iterative Contrastive Refinement [5.6]
GIRCSE(Generative Iterative Refinement for Contrastive Sentence Embeddings)は,自己回帰生成を利用して意味表現を反復的に洗練する新しいフレームワークである。その結果,表現学習の新たなパラダイムとして,生成的反復洗練が確立された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:09:08 GMT)
SentenceKV: Efficient LLM Inference via Sentence-Level Semantic KV Caching [5.5]
SentenceKVは、セマンティックコヒーレンスを保持しながら推論効率を向上させるために設計された、新しいKVキャッシュアプローチである。本研究では,SentenceKVがモデル精度を損なうことなく,効率とメモリ使用量の両方において最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:12:51 GMT)
Dynamic Uncertainty Learning with Noisy Correspondence for Text-Based Person Search [5.5]
大規模なテキストイメージデータセットは、ミスマッチしたペアから生成される。既存の手法はしばしばノイズを増幅する負のサンプルに焦点を当てる。動的不確実性共起・アライメントフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:07:37 GMT)
Continuous Wave Quantum Detection and Ranging with quantum heterodyne dectction [5.4]
連続波検出・乱れ検出技術では, ヘテロダイン受信機を用いた周波数変調連続波(FMCW)を用いて, 未知ターゲットの同時かつ正確な距離と速度測定を行うのが一般的である。この技術の量子対する最近の研究にもかかわらず、背景雑音を伴う損失チャネルの測定精度を高めるFMCWの量子プロトコルはまだ確立されていない。本稿では、総和周波数発生と低伝送電力の絡み合った光源を利用するFMCW技術の量子照明プロトコルを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:08:44 GMT)
What Characteristics Make ChatGPT Effective for Software Issue Resolution? An Empirical Study of Task, Project, and Conversational Signals in GitHub Issues [5.4]
GitHubイシュースレッド内で共有されている686人の開発者-ChatGPT会話を分析し、これらの会話を課題解決に効果的にする特徴を特定します。 ChatGPTはコード生成やツール/ライブラリ/APIレコメンデーションに最も効果的ですが、コード説明に苦労しています。問題レベルでは、ChatGPTは開発者のアクティビティが制限され、より高速な解像度で、より単純な問題に対して最善を尽くします。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:27:07 GMT)
Building the EHR Foundation Model via Next Event Prediction [5.4]
Next Event Prediction(NEP)は、大規模言語モデルの時間的推論を強化するフレームワークである。 NEPは、疾患進行パターンと因果関係を明示的にモデル化する。解析の結果,最先端の予測精度と臨床的に解釈可能な注意パターンの2つの利点が明らかになった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:27:51 GMT)
Curriculum Imitation Learning of Distributed Multi-Robot Policies [5.4]
マルチロボットシステムの学習制御ポリシは,長期的調整と現実的なトレーニングデータ取得の難しさから,大きな課題である。そこで本研究では,訓練中の専門的軌跡の長さを徐々に増加させるカリキュラム戦略を提案する。また,各ロボットの自我中心的知覚を,第三者によるグローバルなデモンストレーションのみを用いて近似する手法も導入した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:31:48 GMT)
Survey of AI-Powered Approaches for Osteoporosis Diagnosis in Medical Imaging [5.4]
骨粗しょう症は、世界中の骨格の整合性を静かに侵食する。画像による早期発見は、ほとんどの不安定な骨折を防ぐことができる。人工知能(AI)法は現在、微妙で臨床的に実行可能なマーカーのための定期的なX線吸収率(DXA)、X線、CT(CT)、磁気共鳴イメージング(MRI)スキャンをマイニングしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:01:45 GMT)
Characterizing Event-themed Malicious Web Campaigns: A Case Study on War-themed Websites [5.3]
サイバー犯罪者は、ユーザーの信頼を侵害する詐欺行為のテーマとして、様々な国際的または地域的な出来事を悪用することが多い。本稿では,イベントをテーマとした悪意あるWebサイトベースのキャンペーンを特徴付ける方法について検討する。攻撃者は、イベントのユニークな側面を利用して攻撃を調整している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:07:15 GMT)
Joint Embeddings Go Temporal [5.3]
JEPA(Joint Emmbedding Predictive Architectures)は、潜在分野における自己教師型学習の実現を目的として導入されたアーキテクチャである。時系列JEPA (TS-JEPA) は、時系列表現学習に特化したアーキテクチャである。 TS-JEPAは、異なる標準データセット上で、現在の最先端のベースラインに適合または超えることができることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:57:37 GMT)
Multi-Item-Query Attention for Stable Sequential Recommendation [5.3]
モデルの安定性と精度を高めるために,Multi-Item-Query attention mechanism (MIQ-Attn)を提案する。 MIQ-Attnは、ユーザインタラクションから複数の多様なクエリベクトルを構築し、ノイズを効果的に軽減し、一貫性を向上させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:11:27 GMT)
MIAFEx: An Attention-based Feature Extraction Method for Medical Image Classification [5.2]
医療用イメージアテンションベース機能エクストラクタ (MIAFEx) を提案する。 Transformerエンコーダアーキテクチャ内の分類トークンを強化するために、学習可能な改良機構を採用している。 MIAFExの出力特性は従来の分類器とハイブリッド分類器を用いて古典的特徴抽出器と比較される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:47:23 GMT)
humancompatible.detect: a Python Toolkit for Detecting Bias in AI Models [5.1]
Human compatible.detectはバイアス検出のためのツールキットである。バイアスを検出し評価する2つの新しい手法が組み込まれている。複数の例をドキュメント化した使いやすいAPIがある。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:43:24 GMT)
RainPro-8: An Efficient Deep Learning Model to Estimate Rainfall Probabilities Over 8 Hours [5.1]
ヨーロッパにおける8時間の地平線上での高分解能確率降水予測のための深層学習モデルを提案する。本モデルは,レーダー,衛星,物理に基づく数値気象予測(NWP)を含む複数のデータソースを効率よく統合し,長距離の相互作用を捉える。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:58:31 GMT)
LatXGen: Towards Radiation-Free and Accurate Quantitative Analysis of Sagittal Spinal Alignment Via Cross-Modal Radiographic View Synthesis [5.0]
思春期特発性強皮症(AIS)は複雑な3次元脊髄変形である。 LatXGenは、現実的な側方X線を合成する新しい生成フレームワークである。 LatXGenは正確なラジオグラフを生成し、既存のGANベースの手法を視覚的忠実度と定量的メトリクスの両方で上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:29:53 GMT)
Machine Learning Algorithms for Improving Black Box Optimization Solvers [5.0]
Black-box Optimization (BBO) は、コストのかかるクエリによってのみ目的がアクセス可能な問題に対処する。近年の進歩は機械学習(ML)と強化学習(RL)を用いてBBOを強化している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:28:42 GMT)
AstroMMBench: A Benchmark for Evaluating Multimodal Large Language Models Capabilities in Astronomy [5.0]
AstroMMBenchは、天文学的画像理解において、マルチモーダル大言語モデル(MLLM)を評価するための最初の包括的なベンチマークである。 AstroMMBenchは、6つの天体物理学のサブフィールドにわたる621の多重選択質問で構成され、品質と関連性について15のドメイン専門家によってキュレートされ、レビューされている。結果、Ovis2-34Bは、強力なクローズドソースモデルと比較して高い総合精度(70.5%)を達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:02:30 GMT)
Agribot: agriculture-specific question answer system [4.9]
このシステムは文の埋め込みモデルに基づいており、精度は56%である。コールセンターの従業員の仕事はより簡単になり、様々な労働者のハードワークはより良い目標にリダイレクトできる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:31:01 GMT)
Combining Discrepancy-Confusion Uncertainty and Calibration Diversity for Active Fine-Grained Image Classification [4.9]
アクティブラーニングは、ラベルのないプールから最も有益なサンプルを反復的に選択することで、高品質なラベル付きデータセットを構築することを目的としている。きめ細かい画像分類では、クラス間の微妙な違いのために、この情報性を評価することは特に困難である。能動きめ細粒度画像分類(DECERN)における不一致拡散不確かさとキャリブレーションの多様性を組み合わせた新しい手法を提案する。本手法は最先端の手法と比較して優れた性能を実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:03:44 GMT)
Flexible and Efficient Drift Detection without Labels [4.9]
ラベルレス環境での古典的統計的プロセス制御を用いたフレキシブルで効率的なドリフト検出アルゴリズムを提案する。計算制約の下では、我々の手法は従来の方法よりも統計的に優れている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:38:10 GMT)
An operator-Weyl-symbol approach to eigenstate thermalization hypothesis [4.8]
固有状態熱化仮説における対角関数に関する半古典理論が展開される。量子系の熱化時間スケールは、ハミルトニアンの位相空間勾配に逆比例する可能性があると予測している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:02:27 GMT)
MarS-FM: Generative Modeling of Molecular Dynamics via Markov State Models [4.8]
我々は、マルコフ状態モデル(MSM)によって定義された離散状態の遷移をサンプル化する新しい生成モデル、MSMエミュレータを導入する。本評価は, タンパク質ドメインに, 展開イベントを含む化学的, 構造的多様性を有し, 一般化を評価するために, トレーニングセットとテストセットの厳密な配列の相違を強制する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:42:25 GMT)
Fast Energy-Theft Attack on Frequency-Varying Wireless Power without Additional Sensors [4.7]
特に公共の場所では、エネルギーアクセス保護とサイバーセキュリティの重要性が高まっている。現在、最も一般的なエネルギー暗号化法は周波数と関連するインピーダンス変化を用いる。ハッカーが周波数変化を検出し、補償を調整できるので、この手法は信頼性が低いことが証明されている。我々は攻撃と関連するシステムを最適化し、0.2ms以内のエネルギーを侵入・盗むことができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:49:09 GMT)
Investigating Language and Retrieval Bias in Multilingual Previously Fact-Checked Claim Detection [4.7]
大きな言語モデル(LLM)は言語間ファクトチェックに強力な機能を提供する。 LLMは、しばしば言語バイアスを示し、英語のような高リソース言語で不公平に優れた性能を発揮する。我々は,情報検索システムが他者よりも特定の情報を好む傾向にある場合,検索バイアスという新しい概念を提示し,検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:50:32 GMT)
Principal Components for Neural Network Initialization [4.6]
ニューラルネットワークの第1層にPCAを組み込むためのプライマリコンポーネントベース初期化(PCsInit)を提案する。これらの戦略を用いた説明は、主成分のニューラルネットワークをトレーニングする前にPCAを使用するよりも単純で直接的なものであることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:47:33 GMT)
Guided Diffusion for the Discovery of New Superconductors [4.6]
高温超伝導など、特定の望ましい特性を持つ材料の逆設計は、材料科学における重大な課題である。本稿では,新しい超伝導体の発見を促進するための誘導拡散フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:59:52 GMT)
HiKE: Hierarchical Evaluation Framework for Korean-English Code-Switching Speech Recognition [4.6]
コードスイッチング(英: Code-switching)とは、日々の発話に共通する発話の中で言語が混在することである。 HiKEは、韓国語と英語のコードスイッチングのための、世界で初めてアクセス可能な評価フレームワークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:18:13 GMT)
Imaging a chain of strongly correlated Rydberg excitations enabled by Förster-resonance-enhanced interaction [4.6]
個別のRydberg励起のシングルショットおよびテクスチンシチュー吸収イメージングを実証した。この手法は、量子計算や量子シミュレーションの応用において、アンサンブル符号化された量子ビットを利用するのに大きな関心を持つだろう。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:42:43 GMT)
Graph Foundation Models: Bridging Language Model Paradigms and Graph Optimization [4.5]
グラフ構造上の全ての距離に基づく最適化問題を解くことができる最初のフレームワークであるグラフ基礎モデル(GFM)を紹介する。 GFMはグラフの複雑なトポロジカルおよびニューラルルールを内部化し、構造自体の接続を監督信号として扱うことができる。本研究は, グラフ最適化にプリトレイン・トランスファー・フレームワークを適用する新たなパラダイムを確立し, 基礎モデル革新をオペレーション・リサーチに適用するための扉を開く。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:05:48 GMT)
Muon: Training and Trade-offs with Latent Attention and MoE [4.5]
小型・中型デコーダ(30M-200Mパラメータ)のみで変圧器を訓練するためのMuonの総合的理論的・実証的研究について述べる。厳密な理論解析として, (i) 標準仮定による収束率のショーイング, (ii) 勾配の爆発を防止するスペクトル正則化特性, (iii) スティーフェル多様体上の自然勾配降下への接続, (iv) スペクトルノルムによる最も急勾配降下への同値性などを挙げる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:51:06 GMT)
Probing the Limits of Stylistic Alignment in Vision-Language Models [4.4]
この研究は、小さな視覚言語モデルをユーモアやロマンチックなスタイルに整合させる際のデータ効率について研究する。このアプローチは、これらのモデルの性能限界を定義し、スタイリスティックな飽和を達成するのにどの程度の好みデータが必要かを決定するのに役立ちます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:46:51 GMT)
Dark-fringe interferometer with dynamic phase control for Mössbauer science [4.4]
M"ossbauer interferometryは、短波長のX線波長によって課される安定性の要求のため、依然として困難である。そこで我々は、空の状態での透過を消し去るダークフリンジ干渉計を投入し、感度測定を容易にした。我々は,ナノ秒時間スケールで送信されたX線強度を制御し,この干渉計のチューニング能力を実験的に実証した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:05:24 GMT)
MIRAGE: Multimodal foundation model and benchmark for comprehensive retinal OCT image analysis [4.4]
MIRAGEは、OCTと走査型レーザー眼鏡(SLO)画像の解析のための新しいFMである。 OCT/SLO分類とセグメンテーションタスクを用いた新しい評価ベンチマークを提案する。一般および専門的なFMとセグメンテーション法との比較は,MIRAGEの両タスクにおける優位性を示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:07:38 GMT)
Data-Driven Discrete Geofence Design Using Binary Quadratic Programming [4.3]
都市部や高解像度の地域でジオフェンスを使用する際の課題は、しばしば重複し、政治的地区の境界線や道路セグメントと一致しないことである。本研究では,人間の移動データから任意の形状をジオフェンスとして抽出し,この問題を緩和する問題に対処する。離散ジオフェンスを抽出するための異なる手法を開発し,比較する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:15:59 GMT)
AdaThink-Med: Medical Adaptive Thinking with Uncertainty-Guided Length Calibration [4.3]
本稿では,医療推論モデルにおける適応的思考能力の向上を目的としたエンドツーエンドフレームワークであるAdaThink-Medを提案する。 AdaThink-Med はまず各質問に対して複数の候補出力を生成し、各候補の正しさと不確実性を評価し、不確実性誘導長キャリブレーションモジュールを用いて問題を推定する。 6つの公開医療QAベンチマークでは、AdaThink-Medは最小限の劣化で性能を維持しながら平均6.4倍の長さの縮小を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:13:55 GMT)
From Headlines to Holdings: Deep Learning for Smarter Portfolio Decisions [4.3]
ディープラーニングを用いてポートフォリオの重みを学習するエンドツーエンドフレームワークを提案する。我々は、セクターの多様性とニュース報道のバランスをとるために選ばれた6つのセクターにまたがる9つの米国株の枠組みを評価する。株式の世界は限られているが、結果はポートフォリオ管理のための価格、リレーショナル、感情信号の統合の価値を浮き彫りにしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:42:24 GMT)
A study of Universal ODE approaches to predicting soil organic carbon [4.3]
Universal Differential Equations (UDEs) 上に構築されたSciMLフレームワークは土壌の深さと時間にわたってSOCのダイナミクスを予測する。クリーンでノイズのないベンチマークから,高35%の乗法的空間相関雑音によるストレステストまで,6つの実験事例を評価した。 UDEはスケーラブルで耐雑音性のあるSOC予測に適しているが、現場への展開にはノイズ認識損失関数、確率論的モデリング、微生物力学のより緊密な統合が必要である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:42:28 GMT)
CoTune: Co-evolutionary Configuration Tuning [4.2]
CoTuneは、目標とするパフォーマンス要件に関する情報を、共進化を通じて考慮するツールである。 162のケース(9つのシステムと18の要件)の実験結果から、CoTuneは既存のチューナーよりもかなり優れていることが判明した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:27:47 GMT)
Learning to Route: Per-Sample Adaptive Routing for Multimodal Multitask Prediction [4.2]
本稿では,モジュールごとのモダリティ処理経路とタスク共有戦略を動的に選択するルーティングベースのアーキテクチャを提案する。本モデルは,テキストの生および融合表現や数値的特徴を含む複数のモーダルパスを定義する。本研究は, うつ病および不安症状を予測し, 合成データと実世界心理療法の双方でモデルを評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:42:01 GMT)
Vid-LLM: A Compact Video-based 3D Multimodal LLM with Reconstruction-Reasoning Synergy [4.2]
外部の3Dデータを必要としないビデオ入力を直接処理するビデオベースの3D-MLLMであるVid-LLMを提案する。本手法では, 偏見の知覚性能を向上させるために, 幾何先行法を直接的に用いた。各種ベンチマーク実験により,3次元質問応答,3次元キャプション,3次元視覚的接地作業において,本手法の有効性が検証された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:34:18 GMT)
VeriLLM: A Lightweight Framework for Publicly Verifiable Decentralized Inference [4.2]
大規模言語モデル(LLM)のための分散推論のための公開検証プロトコルを提案する。同一GPUワーカのセット上で両方のロールを多重化する同型推論検証ネットワークを導入する。我々は形式的なゲーム理論解析を提供し、インセンティブの下では、正直な推論と検証がナッシュ均衡を構成することを証明した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:07:32 GMT)
HeDA: An Intelligent Agent System for Heatwave Risk Discovery through Automated Knowledge Graph Construction and Multi-layer Risk Propagation Analysis [4.2]
HeDAは、自動科学的発見のために設計されたインテリジェントなマルチエージェントシステムである。熱波は、相互接続した気候、社会、経済システムに複雑なカスケードリスクをもたらす。 HeDAは10,247以上の学術論文を処理し、23,156ノードと89,472の関係を持つ包括的な知識グラフを構築する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:40:29 GMT)
Dual-Head Reasoning Distillation: Improving Classifier Accuracy with Train-Time-Only Reasoning [4.1]
本稿では,デコーダのみの言語モデル(LM)の簡易訓練法であるDHRDを紹介する。 7つのスーパーGLUEタスクにおいて、DHRDはプールされたベースラインよりも0.65-5.47%の相対的なゲインを得る。テスト時に推論ヘッドを無効にするため、推論スループットはプール化された分類器と一致し、同じバックボーン上のCoTデコーディングをQPSで96-142倍超える。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:58:38 GMT)
On Spectral Learning for Odeco Tensors: Perturbation, Initialization, and Algorithms [4.0]
分解可能な(deodeco)テンソルのスペクトル学習を行う。統計的限界、幾何学、ロバスト性の間の相互作用に焦点を当てる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:45:35 GMT)
Is It Certainly a Deepfake? Reliability Analysis in Detection & Generation Ecosystem [4.0]
ディープフェイク検出器の包括的不確実性解析を行った。生成アーティファクトが予測信頼性に与える影響について検討する。我々の観測に基づいて、不確実性多様体は、深い震源検出のために不確実性を利用するのに十分な一貫性のある情報を保持する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:51:02 GMT)
Scalable Disk-Based Approximate Nearest Neighbor Search with Page-Aligned Graph [4.0]
本稿では,ディスクベースの近接探索(ANNS)フレームワークであるPageANNを提案する。その結果、PageANNは最先端(SOTA)ディスクベースのANNS法を著しく上回り、1.85x-10.83倍のスループット、51.7%-91.9%のレイテンシを異なるデータセットとメモリ予算で達成した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:44:13 GMT)
Observation of Self-Bound Droplets of Ultracold Dipolar Molecules [4.0]
強双極性ナトリウム-セシウム分子の超低温ガス中での自己結合性液滴と液滴アレイの形成を報告する。液滴は初期BECの100倍の密度を示し、強く相互作用する状態に達する。この研究は、強い双極子量子物質を探索するシステムとして超低温分子を確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:09:52 GMT)
Documentation Retrieval Improves Planning Language Generation [3.9]
我々は、オープンソースの計画モデルを改善するために、一連の軽量パイプラインを提示します。私たちの最高のパイプラインは、共通BlocksWorldドメインで、計画の正しさを0%から80%以上改善します。しかし、セマンティックエラーはより困難な領域に留まり、現在のモデルの推論能力の根本的な制限が明らかになった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:20:52 GMT)
SynthPert: Enhancing LLM Biological Reasoning via Synthetic Reasoning Traces for Cellular Perturbation Prediction [3.9]
合成推論は、部分的に不正確な場合でも生物学的知識を効果的に蒸留する。このアプローチは、未知のRPE1細胞に対して87%の精度で、クロスセル型一般化を可能にする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:02:41 GMT)
Binary Sparse Coding for Interpretability [3.9]
その結果,二項化は特徴の解釈可能性や単意味性を著しく向上させることがわかった。また、二項化は解釈不能な超高周波数特徴の数を増大させる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:41:51 GMT)
DRIFT: Divergent Response in Filtered Transformations for Robust Adversarial Defense [3.8]
グラデーション・コンセンサスは逆転性の主要な要因です我々は、勾配のコンセンサスを積極的に破壊するように訓練された軽量で学習可能なフィルタの集合である textbfDRIFT (Divergent Response in Filtered Transformations) を導入する。 DRIFTは、無視可能なランタイムとメモリコストの改善を提供し、敵防衛の実用的で一般化可能な原則として勾配分散を確立している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:57:47 GMT)
Neural Context Flows for Meta-Learning of Dynamical Systems [3.8]
我々は、不確実性推定を含む頑健で解釈可能なメタラーニングフレームワークであるNeural Context Flow (NCF)を紹介する。 NCFはTaylor拡張を使用してコンテキストの自己変調を可能にし、コンテキストベクトルが他のドメインからのダイナミクスに影響を与えると同時に、自分自身を変調することを可能にする。この結果から, 線形および非線形の6つのベンチマーク問題のうち5つにおいて, NCFの出力性能が向上していることが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:33:24 GMT)
Personalized Auto-Grading and Feedback System for Constructive Geometry Tasks Using Large Language Models on an Online Math Platform [3.8]
本稿では,構成的幾何タスクのための自動階調とフィードバックシステムを提案する。このシステムは大規模言語モデル(LLM)を使用して開発され、Algeomathプラットフォーム上にデプロイされた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:35:01 GMT)
Inducing Uncertainty on Open-Weight Models for Test-Time Privacy in Image Recognition [3.8]
AIの安全性に関する主要な懸念は、マシンラーニング(ML)の文献で検証されている。 MLモデルのユーザが不正な個人情報の予測を利用して他人を傷つけないようにするには、どうすればいいでしょうか? 保護されたインスタンスに対して最大不確実性を誘導し、他のすべてのインスタンスに対して精度を保つ。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:48:46 GMT)
Distributed AI Platform for the 6G RAN [3.8]
既存のアプローチは、真のAIネイティブな6Gネットワークのビジョンを実現するには不十分である、と私たちは主張する。我々は,AIネイティブRANのニーズに合わせて,分散AIプラットフォームアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:58:31 GMT)
ID-RAG: Identity Retrieval-Augmented Generation for Long-Horizon Persona Coherence in Generative Agents [3.8]
ID-RAG(ID-Retrieval-Augmented Generation)は、エージェントのペルソナと永続的な嗜好を構造化されたアイデンティティモデルでグルーピングするために設計された新しいメカニズムである。エージェントの決定ループの間、このモデルは関連するアイデンティティコンテキストを検索するためにクエリされ、アクション選択を直接通知する。我々は、Human-AI Agentsと呼ばれる新しいID-RAG対応エージェントを導入、実装することで、このアプローチを実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:54:51 GMT)
Score-based Membership Inference on Diffusion Models [3.7]
拡散モデルに対するメンバーシップ推論攻撃(MIA)は、プライバシーの懸念が強まっている。本稿では,拡散モデルが近似することを学習する予測ノイズベクトルに着目し,スコアベースMIAの理論的,実証的研究を行う。提案手法は, トレーニングセットに近づき, メンバシップが明らかになるような, 近隣のトレーニングサンプルのカーネル重み付き局所平均に対して, 期待されたデノイザ出力が向けられることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:28:55 GMT)
Graph-Based Learning of Free Surface Dynamics in Generalized Newtonian Fluids using Smoothed Particle Hydrodynamics [3.7]
非ニュートン流体の流動挙動を効率的に予測するグラフニューラルネットワーク(GNN)モデルを提案する。粘度が一定であるニュートン流体の伝統的なアルゴリズムは、非ニュートンの場合に適用した場合に収束する。我々は,非ニュートンパワー・ロー流体シミュレーションの計算効率を向上させるために,GNNに基づく新しい数値モデルを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:14:58 GMT)
One-shot Conditional Sampling: MMD meets Nearest Neighbors [3.7]
条件抽出のための新しいフレームワークであるMD(CGMMD)を用いた条件付きジェネレータを提案する。 CGMMDの重要な特徴は、ジェネレータの1つの前方通過で条件付きサンプルを生成する能力である。 CGMMDは複雑な条件密度を含む合成タスクにおいて競合的に機能することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:04:50 GMT)
Spatial-Functional awareness Transformer-based graph archetype contrastive learning for Decoding Visual Neural Representations from EEG [3.7]
本稿では,脳波に基づく視覚的デコーディングを強化するために,空間認識変換器を用いたグラフアーチタイプコントラスト学習(SFTG)フレームワークを提案する。具体的には、空間的脳の接続性と時間的神経力学を同時に符号化する新しいグラフベースのニューラルアーキテクチャであるEEG Graph Transformer(EGT)を紹介する。高い対象内変動を緩和するために,特徴の整合性とクラス分離性を改善するために,主観固有の脳波グラフアーチタイプを学習するグラフアーチタイプコントラスト学習(GAC)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:27:55 GMT)
Can you SPLICE it together? A Human Curated Benchmark for Probing Visual Reasoning in VLMs [3.6]
SPLICEは、複数の次元にわたるイベントベースの推論を調査するために設計されたベンチマークである。その中には、12と180のサブカテゴリ(スポーツ、エンジニアリング、家事など)にまたがる3,381本のビデオが含まれている。我々は、これらのクリップをコヒーレントなイベントシーケンスに再構成する作業において、人間の参加者と最先端の視覚言語モデル(VLM)の両方を評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:50:18 GMT)
Negative Pre-activations Differentiate Syntax [3.6]
ワッサースタインニューロンとして知られる最近発見された絡み合ったニューロンのクラスは、大きな言語モデルでは不均等に重要である。絡み合ったニューロンのスパース部分集合における負の分化は、言語モデルが構文に依存する重要なメカニズムであることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:29:29 GMT)
Integrating Various Software Artifacts for Better LLM-based Bug Localization and Program Repair [3.6]
本稿では,問題コンテンツ(記述とメッセージ)とスタックエラートレースを用いてバグギーメソッドをローカライズするDevLoReを提案する。異なるアーティファクトを組み込むことで、DevLoReはシングルとノンシングルのバグギーメソッドの49.3%と47.6%をうまく見つけることができた。これは現在の最先端のAPRメソッドよりも優れています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:29:23 GMT)
Comparing Open-Source and Commercial LLMs for Domain-Specific Analysis and Reporting: Software Engineering Challenges and Design Trade-offs [3.5]
大規模言語モデル(LLM)は、ドメイン間の複雑な自然言語処理の自動化を可能にする。本研究では、財務報告分析とコメント生成のためのオープンソースおよび商用LCMについて検討した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:46:37 GMT)
Learning Relationships Between Separate Audio Tracks for Creative Applications [3.5]
本稿では,音楽エージェント分野における研究プロジェクトにおける第一歩について述べる。本研究の目的は,ライブ音楽入力とリアルタイム音楽出力との間の,所望の音楽関係のチューニングをトレーニングを通じて行うことである。本稿では,音楽関係の学習と活用が可能なシンボリック決定モジュールを統合するアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:06:21 GMT)
Quantitative convergence of trained single layer neural networks to Gaussian processes [3.4]
本研究では、勾配勾配から関連するガウス過程へ学習した浅層ニューラルネットワークの無限幅限界における定量的収束について検討する。ネットワーク出力とガウス近似の間の二次ワッサーシュタイン距離を任意のトレーニング時間で明示的な上界を与える。この結果は,幅や入力次元などのアーキテクチャパラメータや収束の影響,およびトレーニング力学が近似誤差にどのように影響するかを定量化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:59:27 GMT)
Grocery to General Merchandise: A Cross-Pollination Recommender using LLMs and Real-Time Cart Context [3.4]
本稿では,食料品と一般商品のクロスカテゴリレコメンデーションを橋渡しするクロスポリン化(XP)フレームワークを提案する。提案手法では,(1)共同購入市場バスケット分析とLCMに基づく新しいアイテム・イテム関係の同定手法を用いた候補生成機構,(2)リアルタイム・シーケンシャル・カート・コンテキストを利用したトランスフォーマー・ベース・ローカという2段階の枠組みを用いる。オフライン分析とオンラインA/Bテストは、アイテムページ上のLCMに基づく検索で36%の加算率、カートコンテキストを用いた加算率15%の増加を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:23:57 GMT)
Reinforced Generation of Combinatorial Structures: Applications to Complexity Theory [3.4]
効率的なアルゴリズムの既知の限界を改善する新しい構造を見つけるのにAIのテクニックが役立つかどうかを探索する。具体的には、AlphaEvolveを使って、a)MAX-CUTの平均ケース硬度とMAX-Independent Setの2つの設定を研究します。改良された下界は、最大163$のノード上にほぼ極端ラマヌジャングラフを構築することで得られる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:56:56 GMT)
A Deep Learning Approach for Spatio-Temporal Forecasting of InSAR Ground Deformation in Eastern Ireland [3.3]
本研究では,動的変位データを静的な物理先行値と融合する新しいフレームワークを提案する。公開EGMSデータセットでは、MM-STTが新しい最先端技術を確立し、長距離予測RMSEを桁違いに削減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:49:04 GMT)
MDD-Thinker: Towards Large Reasoning Models for Major Depressive Disorder Diagnosis [3.3]
大うつ病 (Major depressive disorder, MDD) は、世界的障害の主要な原因である。現在の診断アプローチは、しばしば主観的評価に依存し、臨床情報を統合する能力が欠如している。我々はMDD-Thinkerを開発した。MDD-Thinkerは、教師付き微調整(SFT)と強化学習(RL)を統合し、推論能力と解釈可能性を高める。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:56:38 GMT)
Large Language Models for Software Testing: A Research Roadmap [3.3]
大規模言語モデル(LLM)は、ソフトウェアテスト分野で最も重要な破壊の1つとしてプロファイルされ始めている。 LLMは、テストコードの生成やドキュメントの要約など、ソフトウェアテストタスクにうまく適用されています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:58:21 GMT)
TACO-Net: Topological Signatures Triumph in 3D Object Classification [3.3]
TACO-Netは新しい最先端を99.05%$と99.52%$の精度で設定する。 10種類のモデルNet40入力でテストすると、提案したTACO-Netは全体として強いレジリエンスを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:52:53 GMT)
Guided Uncertainty Learning Using a Post-Hoc Evidential Meta-Model [3.2]
GUIDEは,凍結したディープラーニングモデルに適応し,いつ,いつ,不確実かを明確に学習する,軽量な顕在学習メタモデルアプローチである。 GUIDEはリトレーニングもアーキテクチャの変更も必要とせず、ベースとなるディープラーニングモデルに対して手動の中間層選択も必要ありません。さまざまなベンチマークで最先端のアプローチを一貫して上回ります。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:04:15 GMT)
From Satellite to Street: A Hybrid Framework Integrating Stable Diffusion and PanoGAN for Consistent Cross-View Synthesis [3.2]
本稿では,衛星画像からストリートビュー画像を生成するために,拡散モデルと条件付き生成対向ネットワークを統合したハイブリッドフレームワークを提案する。このフレームワークは、きめ細かい局所的な詳細を保存しながら、現実的で幾何学的に一貫したストリートビュー画像を生成することに成功した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:14:49 GMT)
Plug-and-Play Emotion Graphs for Compositional Prompting in Zero-Shot Speech Emotion Recognition [3.2]
大規模音声言語モデル(LALM)は、音声タスク全体で強いゼロショット性能を示すが、音声感情認識(SER)に苦慮している。そこで我々は,感情推論におけるLALMを微調整なしでガイドするための,感情推論のためのCCoT-Emo(Compositional Chain-of-Thought Prompting for Emotion Reasoning)を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:06:03 GMT)
EMO-TTA: Improving Test-Time Adaptation of Audio-Language Models for Speech Emotion Recognition [3.2]
音声言語モデル(ALM)を用いた音声感情認識(SER)は、テスト時の分散シフトに対して脆弱なままである。クラス条件統計を漸進的に更新する軽量でトレーニング不要な適応フレームワークであるEmo-TTAを提案する。 Emo-TTAは、モデルウェイトを変更することなく、個々のテストサンプルで動作する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:52:01 GMT)
Kudzu: Fast and Simple High-Throughput BFT [3.1]
Kudzuは、高速経路を統合した高スループットの原子放送プロトコルである。我々のプロトコルは、$n = 3f + 2p + 1$のレプリカがすべて正しく振る舞う場合、わずか2ラウンドの通信で最終性を達成する。プログレス証明書、複雑なビューの変更、投機的実行などの複雑な処理は避けられる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:44:50 GMT)
Active Authentication via Korean Keystrokes Under Varying LLM Assistance and Cognitive Contexts [3.1]
韓国語におけるキーストロークに基づく認証は、3つの現実的なタイピングシナリオで評価する。本システムは,LLMの使用状況や認知的文脈にまたがって,信頼性の高い性能を維持していることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:57:16 GMT)
Towards Trustworthy Lexical Simplification: Exploring Safety and Efficiency with Small LLMs [3.1]
大規模言語モデル(LLM)は、語彙的単純化の現実的な応用において課題に直面している。脆弱なユーザグループ(例えば障害のある人々)は、この技術の主要なターゲットグループのひとつです。ローカル環境に展開可能な小型LCMを利用するLSシステムのための効率的なフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:25:56 GMT)
Mitigating Barren Plateaus in Quantum Neural Networks via an AI-Driven Submartingale-Based Framework [3.1]
量子ニューラルネットワーク(QNN)におけるバレンプラトー(BP)の緩和を目的としたAdaInitを提案する。 AdaInitは、非無視的な勾配分散をもたらすQNNの初期パラメータを反復的に合成し、BPを緩和する。 AdaInit が様々な QNN スケールで高い勾配分散を維持するために既存の手法を一貫して上回っていることを実証的に検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:36:12 GMT)
EEsizer: LLM-Based AI Agent for Sizing of Analog and Mixed Signal Circuit [3.0]
本稿では,大規模な言語モデルと回路シミュレータ,カスタムデータ解析機能を統合するAIエージェントであるEEsizerを提案する。迅速な工学的推論と理論的推論を駆使して、エージェントは設計の方向性を反復的に探求し、性能を評価し、人間の介入を最小限に抑えてソリューションを洗練する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:08:23 GMT)
Model Fusion with Multi-LoRA Inference for Tool-Enhanced Game Dialogue Agents [2.9]
本稿では,CPDC 2025チャレンジのGPUトラックに対するOpdainlpチームのソリューションについて述べる。この課題は3つのタスクから構成されており、キャラクターのペルソナに準拠し、ゲームのワールドビューと整合し、関数呼び出しをサポートするゲーム内会話型AIの構築を目指している。我々は,LoRAファインチューニングとモデル融合を併用したQwen3-14Bを用い,推論中に複数のLoRAアダプタと統合されたベースモデルを用いた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:15:19 GMT)
RMT-KD: Random Matrix Theoretic Causal Knowledge Distillation [2.9]
BERTやResNetといった大規模なディープラーニングモデルは最先端のパフォーマンスを実現するが、エッジでのデプロイにはコストがかかる。本稿では,Random Matrix Theory (RMT) を用いて知識蒸留を行い,ネットワークサイズを反復的に削減する手法であるRTT-KDを提案する。 GLUE、AG News、CIFAR-10では、RTT-KDは最大80%のパラメータ還元を実現し、2%の精度の損失しか得られず、2.8倍の高速な推論とほぼ半分の消費電力を実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:50:43 GMT)
Learning to Ponder: Adaptive Reasoning in Latent Space [2.9]
我々は、潜時ステアリングによるインスタンス適応推論計算を割り当てる単一グラフのバックボーン学習自由フレームワークFR-Ponderを提案する。 GSM8KとMATH500では、FR-Ponderは計算精度のフロンティアを改善し、一致した精度で低いFLOPを提供し、早期出力ベースラインと比較する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:21:42 GMT)
VISOR++: Universal Visual Inputs based Steering for Large Vision Language Models [2.9]
最適化された視覚入力だけで動作制御を実現するために、出力リダイレクトのためのユニバーサルビジュアル入力ベースのステアリング(VISOR++)を導入する。本研究では、視覚言語モデル(VLM)のアンサンブルに対して単一のVISOR++画像を生成し、それぞれのステアリングベクトルをエミュレートできることを実証する。また、オープンアクセスとクローズアクセスの両方を含む未確認モデルの方向性の挙動シフトを達成する上で、VISOR++イメージの約束を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:43:18 GMT)
Responsible AI Technical Report [2.9]
KTは、AIサービスの安全性と信頼性を保証するために、Responsible AI (RAI)アセスメント方法論とリスク軽減技術を開発した。我々は、KTのAIリスク分類に基づくモデル安全性とロバスト性を検証する信頼性の高い評価手法を提案する。また、特定されたAIリスクを管理し緩和するための実用的なツールも提供します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 05:30:21 GMT)
Improved Stochastic Optimization of LogSumExp [2.9]
勾配法を用いて効率よく最適化できるLogSumExpの新たな近似法を提案する。近似の精度は調整可能なパラメータで制御され、任意に小さくすることができる。 DROと連続最適輸送の実験は、我々のアプローチの利点を実証している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:03:55 GMT)
On-Premise AI for the Newsroom: Evaluating Small Language Models for Investigative Document Search [2.9]
検索拡張生成(RAG)機能を備えた大規模言語モデル(LLM)は、文書発見のプロセスの高速化を約束する。我々は5段階のパイプラインを通して透明性と編集制御を優先するジャーナリスト中心の検索手法を提案する。我々は2つのコーパス上で3つの量子化モデル(Gemma 3 12B, Qwen 3 14B, GPT-OSS 20B)を評価し,信頼性のかなりの変動を見出した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:50:40 GMT)
Not Wrong, But Untrue: LLM Overconfidence in Document-Based Queries [2.9]
大型言語モデル(LLM)は、ニュースルームでますます使われている。幻覚の傾向は、ソーシング、帰属、正確性といった中核的なジャーナリストの慣行にリスクをもたらす。本稿では,ChatGPT,Gemini,NotebookLMの3つのツールについて検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:55:43 GMT)
Strong-to-weak spontaneous symmetry breaking of higher-form non-invertible symmetries in Kitaev's quantum double model [2.8]
トポロジカル秩序は、高次形式の対称性の自発的対称性の破れとして理解することができる。我々はこの枠組みを、対称性が強いか弱いかのいずれかの混合状態に拡張する。得られたデコヒード量子二重混合状態が局所的に区別不能な集合を形成し、情報凸集合を構成することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:53:18 GMT)
PCICF: A Pedestrian Crossing Identification and Classification Framework [2.8]
PCICFは、VRUの状況を体系的に識別し分類するフレームワークである。歩行者集団が合併または分裂した場合でも、複雑な歩行者横断を識別し、分類することができる。以上の結果から,PCICFは,歩行者群が合併・分裂した場合でも,複雑な横断歩道の識別・分類に成功できることが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:35:12 GMT)
RDD: Pareto Analysis of the Rate-Distortion-Distinguishability Trade-off [2.8]
本稿では,圧縮の有効性,歪み量,圧縮正規信号と圧縮異常信号との差について述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:55:35 GMT)
Weight-Space Linear Recurrent Neural Networks [2.8]
WARP (Weight-space Adaptive Recurrent Prediction) は、重み空間学習を線形反復で統一する強力なモデルである。 WARPは、様々な分類タスクにおいて最先端のベースラインと一致しているか、あるいは超越しているかを示す。注目すべきは、我々のモデルの物理インフォームド変種は、次の最良のモデルよりも10倍以上優れています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:08:45 GMT)
Performance-Efficiency Trade-off for Fashion Image Retrieval [2.8]
本稿では,データベースからの2手画像検索のスケーラビリティについて論じる。選択表現フレームワークを導入することで、検索精度を犠牲にすることなく、データベースを元のサイズの10%まで縮小することができる。 DeepFashion Attribute、DeepFashion Con2Shop、DeepFashion2の3つのパブリックデータセットに対するアプローチを評価します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:51:04 GMT)
Do Sparse Subnetworks Exhibit Cognitively Aligned Attention? Effects of Pruning on Saliency Map Fidelity, Sparsity, and Concept Coherence [2.7]
等級ベースプルーニングと微調整が低レベルのサリエンシマップと高レベルの概念表現の両方にどのように影響するかを検討する。以上の結果から,軽質でモデレートなプルーニングは,意味論的に意味のある概念を維持しつつ,サリエンシ・マップの焦点と忠実さを向上させることが示唆された。対照的に、アグレッシブプルーニングは不均一な特徴をマージし、精度を維持しながら、サリエンシマップの間隔とコンセプトコヒーレンスを低減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:19:45 GMT)
Embedded Deep Learning for Bio-hybrid Plant Sensors to Detect Increased Heat and Ozone Levels [2.7]
本稿では,植物と組込み深層学習を統合したバイオハイブリッド環境センサシステムを提案する。本システムは,ヘデラヘリックスからの電気微分電位信号を記録し,組込み深層学習モデルを用いて処理する。センサは温度とオゾンの変化を最大0.98の感度で検出できることを実証した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:19:31 GMT)
Federated Spatiotemporal Graph Learning for Passive Attack Detection in Smart Grids [2.7]
本稿では,時間的ウィンドウ上で物理層と行動指標を融合させて受動的攻撃を検出するグラフ中心型マルチモーダル検出器を提案する。テスト精度は98.32%、シーケンス毎の93.35%を0.15% FPRで達成している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:52:30 GMT)
Radiology's Last Exam (RadLE): Benchmarking Frontier Multimodal AI Against Human Experts and a Taxonomy of Visual Reasoning Errors in Radiology [2.6]
大規模言語モデル(LLM)や視覚言語モデル(VLM)といった一般的なマルチモーダルAIシステムは、臨床医や患者からもアクセスされるようになっている。複数の画像モダリティにまたがる50の専門レベルの「スポット診断」のベンチマークを作成した。我々は,フロンティアAIモデルの性能を,ボード認定放射線科医や放射線学研修生に対して評価した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:31:20 GMT)
K-Dense Analyst: Towards Fully Automated Scientific Analysis [2.6]
我々は,自律型バイオインフォマティクス解析を実現する階層型マルチエージェントシステムであるK-Dense Analystを紹介する。 BixBenchでは、K-Dense Analystが29.2%の精度を達成し、最高のパフォーマンス言語モデル(GPT-5)を6.3%上回っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:01:20 GMT)
Better Together: Leveraging Multiple Digital Twins for Deployment Optimization of Airborne Base Stations [2.5]
航空基地局にとって、徹底的な試験を行うことなく、最良の場所を確立することが重要である。本稿では,デジタルツイン(DT)誘導方式を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:34:14 GMT)
VNODE: A Piecewise Continuous Volterra Neural Network [2.5]
VNODEは離散的なVolterra特徴抽出とODE駆動状態の進化を交互に行う。 VNODEは、計算複雑性を改善したアートモデルの状態を一貫して上回る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:05:57 GMT)
CART: Compositional Auto-Regressive Transformer for Image Generation [2.5]
本稿では,解釈可能な視覚層の階層的構成としてイメージをモデル化する,新しい自己回帰(AR)画像生成手法を提案する。 CARTは意味論的意味のある分解を通じて、画像の詳細を反復的に追加する。我々は、構造化画像操作を可能にしながら、CARTが視覚的に魅力的な結果を生成することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:57:08 GMT)
Hype or not? Formalizing Automatic Promotional Language Detection in Biomedical Research [2.5]
科学では、促進言語(「ハイプ」)が増加しており、証拠の客観的評価を損なう可能性がある。ハイプを自動的に検出するタスクを導入し,これを双曲的言語,主観的言語と定義する。我々は,ハイプ言語を識別するための公式ガイドラインを提案し,それをNIH(National Institutes of Health)認定申請コーパスの一部にアノテートする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:47:15 GMT)
Evolution Meets Diffusion: Efficient Neural Architecture Generation [2.4]
ニューラルアーキテクチャサーチ(NAS)は、ディープラーニングモデル設計におけるトランスフォーメーションの可能性について広く注目を集めている。進化的拡散に基づくニューラルアーキテクチャ生成(EDNAG)を提案する。 EDNAGはアーキテクチャ最適化における最新技術(SOTA)のパフォーマンスを最大10.45%向上させた。時間を要するトレーニングの必要性を排除し、推論速度を平均50倍に向上させ、その例外的な効率性と効果を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:56:22 GMT)
Accelerating Regression Tasks with Quantum Algorithms [2.4]
本稿では,広範囲な回帰タスクを高速化するための統合量子フレームワークを提案する。このスピードアップは、Jambulapati et alの最近の古典的なブレークスルーを拡張することで達成されている。次元が$n$, 空間が$rn$, 誤差パラメータが$epsilon$の場合、このアルゴリズムは$widetildeO(rsqrtmn/epsilon + Mathrmpoly(n,1/epsilon))$量子時間で問題を解く。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:22:59 GMT)
How Well Do LLMs Imitate Human Writing Style? [2.4]
大規模言語モデル(LLM)は、流動的なテキストを生成することができるが、特定の人間の作者の独特のスタイルを再現する能力は、まだ不明である。著者の検証とスタイルの模倣分析のための,高速かつトレーニング不要なフレームワークを提案する。学術エッセイでは97.5%、クロスドメイン評価では94.5%の精度を達成している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:34:40 GMT)
MAD: Manifold Attracted Diffusion [2.3]
拡張スコアの概念を導入し、単純化された設定では、小さな変動をゼロに減らすことができることを示す。本稿では,その近似を標準スコアへの近似から効率的に計算し,玩具問題,合成データ,実データに対する有効性を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:40:20 GMT)
Steering an Active Learning Workflow Towards Novel Materials Discovery via Queue Prioritization [2.3]
生成モデルとアクティブラーニングを組み合わせた待ち行列優先アルゴリズムを提案する。トップデザイン候補の優先順位付けにアクティブラーニングモデルを組み込むことで、生成するAIワークフローが非意味な候補のリソースを浪費することを防ぐことができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:51:13 GMT)
An Automated Retrieval-Augmented Generation LLaMA-4 109B-based System for Evaluating Radiotherapy Treatment Plans [2.3]
我々は,LLaMA-4 109Bを用いた放射線治療計画の自動化,プロトコル認識,解釈可能な評価のためのRAGシステムを開発した。 RAGシステムは5つのSentenceTransformerバックボーンに最適化された検索エンジン、コホート類似性に基づくパーセンタイル予測コンポーネント、臨床制約チェッカーの3つのコアモジュールを統合している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:04:09 GMT)
Uncertainty-Aware Generative Oversampling Using an Entropy-Guided Conditional Variational Autoencoder [2.2]
本稿では,表現学習とデータ生成の両方に局所的不確実性を取り入れた生成的オーバーサンプリングフレームワークを提案する。 LEO-CVAEは,従来のオーバーサンプリングや生成ベースラインよりも優れた性能を示す。これらの結果は、複雑な非線形構造によって支配される領域における不均衡学習に対する不確実性を考慮した生成的オーバーサンプリングの価値を強調した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:11 GMT)
Bridging Technical Capability and User Accessibility: Off-grid Civilian Emergency Communication [2.1]
本稿では,低消費電力長距離ネットワークと危機対応スマートフォンアプリケーションを組み合わせた統合緊急通信システムを提案する。システムは通信性能とアプリケーション機能という2つの次元で評価される。並行して、ピアツーピアメッセージング、アイデンティティ検証、コミュニティモデレーションを備えたモバイルアプリケーションを開発した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:36:21 GMT)
Invisible Yet Detected: PelFANet with Attention-Guided Anatomical Fusion for Pelvic Fracture Diagnosis [2.0]
PelFANetは骨の断片化によって骨の分類を改善するために生の骨盤X線を融合する2重ストリームアテンションネットワークである。 PelFANetはセグメンテーション誘導アプローチで2段階パイプラインでトレーニングされ、従来のメソッドよりも優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:48:24 GMT)
Enabling AI Scientists to Recognize Innovation: A Domain-Agnostic Algorithm for Assessing Novelty [2.0]
相対近傍密度(Relative Neighbor density)は、研究思想における新規性評価のための領域に依存しないアルゴリズムである。 RNDは、コンピュータ科学と生物医学研究領域における最先端のSOTA(State-of-the-art)のパフォーマンスを達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:52:13 GMT)
Privacy-Aware Sequential Learning [2.0]
予防接種登録では、個人は他人を観察して行動し、その結果の公開記録は個人情報を公開することができる。プライバシ保護シーケンシャルラーニング(プライバシ保存シーケンシャルラーニング)について検討し、エージェントが報告された行動に内因性ノイズを加えてプライベートシグナルを隠蔽する。以上の結果から,プライバシが情報を動的にフィードバックし,プラットフォームやポリシの設計を通知する方法が示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:31:43 GMT)
LISA Technical Report: An Agentic Framework for Smart Contract Auditing [1.9]
LISAはエージェント型スマートコントラクト脆弱性検出フレームワークである。ルールベースとロジックベースのメソッドを組み合わせて、スマートコントラクトの幅広い脆弱性に対処する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:31:25 GMT)
Cryogenic pressure sensing with an ultrafast Meissner-levitated microrotor [1.9]
磁気浮上式回転ローターはジャイロスコープによるナビゲーション、フライホイールによるエネルギー貯蔵、ターボ分子ポンプによる超高真空発生、プロセス制御のための圧力感知などの技術において重要な要素である。我々は,4.2ケルビンでマイスナー効果によって浮遊するマイクロマグネットをベースとした回転ローターによる広範囲圧力センシングを実演した。超低トルクノイズで実現される量子力学や重力を含む基礎科学の探索に、浮上ローターを用いることを想定する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:59:29 GMT)
MRAG-Suite: A Diagnostic Evaluation Platform for Visual Retrieval-Augmented Generation [1.9]
多様なマルチモーダルベンチマークを統合する診断評価プラットフォームMRAG-Suiteを提案する。本稿では,要求レベル診断ツールであるMM-RAGCheckerとともに,難易度と曖昧度を考慮したフィルタリング手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:55:28 GMT)
Sobolev norm inconsistency of kernel interpolation [1.8]
我々は、L2$と仮説空間の間を補間するノルムの連続的なスケールで測定されたカーネルの一般化誤差に対して下限を与える。これらの下界は、ノルムの指数が、仮説空間の埋め込みと固有値の崩壊率にのみ依存する定数よりも大きいとき、核は常に矛盾していることを意味する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:23:44 GMT)
Learning Semantic Association Rules from Internet of Things Data [1.8]
アソシエーションルールマイニング(アソシエーションルールマイニング、ARM)は、データ中の共通点を論理的な意味として発見するタスクである。 ARMはIoT(Internet of Things)において、監視や意思決定などさまざまなタスクに使用されている。動的センサデータと静的IoTシステムメタデータの両方を利用した,IoTデータのための新しいARMパイプラインを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:18:33 GMT)
Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization [1.8]
ニューラルネットワーク翻訳(NMT)へのタスクアライメントの適用は,NMTにおける既存のタスクデータミスマッチに対処することを示す。人選好のプロキシとして,事前学習された翻訳品質推定モデルを活用するDPOの変種であるダイレクト品質最適化(DQO)を導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:19:57 GMT)
Message passing-based inference in an autoregressive active inference agent [1.8]
本稿では,因子グラフ上のメッセージパッシングという形で,自己回帰型アクティブ推論エージェントの設計を提案する。提案するエージェントはロボットナビゲーションタスクで検証され,探索とエクスプロイトを実証する。古典的な最適制御器と比較して、エージェントは予測の不確実性に基づいて動作を変調し、後から到着するが、ロボットのダイナミクスをより良くモデル化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:38:09 GMT)
Fast quantum computation with all-to-all Hamiltonians [1.8]
オール・ツー・オールの相互作用は、理論物理学の多くの領域で自然に起こる。我々は、すべてのハミルトン人がはるかに短い時間スケールで情報を処理できることを示します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:02:00 GMT)
Chat to Chip: Large Language Model Based Design of Arbitrarily Shaped Metasurfaces [1.8]
LLMはスペクトル予測と逆設計に必要な物理的関係を学習できることを示す。この"chat-to-chip"ワークフローは、よりユーザフレンドリーなデータ駆動ナノフォトニクスへの一歩である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:24:57 GMT)
Benchmarking ECG Foundational Models: A Reality Check Across Clinical Tasks [1.7]
基礎モデルはより広範な適応性を約束するが、多種多様なECGタスクへの一般化は十分に理解されていない。 12の公開データセットを用いて,臨床関連タスク26のECG基盤モデルをベンチマークした。基礎モデルは成人心電図解析の可能性を示唆するが, 心臓構造, 予後予測, 患者のキャラクタリゼーションには大きなギャップが残っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:29:48 GMT)
Proposing a Framework for Machine Learning Adoption on Legacy Systems [1.7]
機械学習(ML)の統合は、産業の競争力に欠かせないが、その採用は、レガシーシステムの陳腐化したコストと運用上の障害によって、しばしば停滞している。本稿では,MLモデルのライフサイクルを運用環境から戦略的に切り離すことによって,これらの課題を克服するための実用的なAPIベースのフレームワークを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:08:23 GMT)
CiteFusion: An Ensemble Framework for Citation Intent Classification Harnessing Dual-Model Binary Couples and SHAP Analyses [1.7]
CiteFusionは、SciCiteとACL-ARCという2つのベンチマークデータセット上のマルチクラスCitation Intent Classificationタスクに対処する。実験の結果、CiteFusionは最先端のパフォーマンスを達成し、Macro-F1スコアはSciCiteで89.60%、ACL-ARCで76.24%であった。我々は、SciCiteで開発されたCiteFusionモデルを利用して、引用意図を分類するWebベースのアプリケーションをリリースする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:53:09 GMT)
Simulating Post-Neoadjuvant Chemotherapy Breast Cancer MRI via Diffusion Model with Prompt Tuning [1.7]
ダイナミックコントラスト強調MRI(DCE-MRI)によるネオアジュバント化学療法(NAC)に対する反応の観察 NACに対する反応に影響を及ぼす既知の臨床因子を考慮し,即時チューニングを導入する。他のモデルと比較して,pCRによる腫瘍径の変化を反映した画像の生成が良好であった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:05:20 GMT)
A Graph-in-Graph Learning Framework for Drug-Target Interaction Prediction [1.6]
帰納的学習と帰納的学習の両方の力を利用する新しい枠組みを導入する。このフレームワーク内には、GNNベースのGraph-in-Graph(GiG)と呼ばれるモデルがあり、ドラッグとターゲットの分子構造のグラフを、薬物とターゲットの相互作用グラフのメタノードとして表現している。実験結果から,GIGモデルが既存の評価指標をはるかに上回る結果が得られた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:22:57 GMT)
Quantifying Generalisation in Imitation Learning [1.6]
Labyrinthは、構造、開始と目標位置、タスクの複雑さを正確に制御し、一般化をテストするために設計されたベンチマーク環境である。離散的で完全に観測可能な状態空間と既知の最適な行動を提供し、解釈可能性ときめ細かい評価をサポートする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:43:25 GMT)
Neural Ordinary Differential Equations for Learning and Extrapolating System Dynamics Across Bifurcations [1.4]
本稿では,時系列データから直接基底となる分岐構造を復元するニューラル正規微分方程式について述べる。我々は,非カオスからカオスへ遷移するロレンツ系,カオスから周期倍に移行するR"ossler系,グローバル分岐による崩壊を示す捕食者・捕食者モデルという3つのテストケースに対して,我々のアプローチを実証した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:49:00 GMT)
Echoes of Humanity: Exploring the Perceived Humanness of AI Music [1.4]
我々は,AIMを人間がどう知覚するかを理解することを目的としたリスナーに焦点を当てた実験の結果を提示する。我々は,商用モデルの現実的な利用から,AIMの楽曲の新規かつ無制御なデータセットを用いた最初の研究である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:53:58 GMT)
Extracting the Structure of Press Releases for Predicting Earnings Announcement Returns [1.4]
プレスリリースの内容(ソフト情報)は、利益の驚き(ハード情報)と同じくらい情報であることがわかった。我々のフレームワークは,オンライン学習の統合によるリアルタイムリターン予測をサポートし,解釈可能性を提供し,価格形成における言語の役割を明らかにする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:57:05 GMT)
Security of Device-independent Quantum Key Distribution under Sequential Attack [1.4]
デバイス非依存量子鍵分布(DI-QKD)は、非局所相関を利用して、2つの正直な当事者間の暗号鍵を確立する。ベル違反は、観測された統計の本質的な予測不可能を保証し、装置の信頼性には依存しない。量子メモリに格納されたアンシラを用いて連続的な測定を行うことで、Eveはソースを初期制御することなく、特定のパラメータ範囲内で集団攻撃を模倣できることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:33:37 GMT)
Tumor Synthesis conditioned on Radiomics [1.4]
放射能特性を生成条件として利用する腫瘍発生モデルを提案する。本モデルでは,ガンモデルを用いて腫瘍マスクを生成,拡散モデルを用いて放射線学的特徴に基づく腫瘍テクスチャを生成する。本手法では, 任意の位置において, サイズ, 形状, テクスチャなど, ユーザが特定した放射線学的特徴に応じて, 腫瘍画像を生成することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:04:12 GMT)
Off-Policy Maximum Entropy RL with Future State and Action Visitation Measures [1.3]
そこで本研究では,本質的な報酬関数が,割引された状態と行動の分布の相対エントロピーである,という新しいアプローチを提案する。したがって、既存のアルゴリズムは、この固定点のオフポジーを学習し、本質的な報酬を計算するために適応することができる。結果として得られた政策は、良好な状態対応空間をカバーし、高性能な制御を実現することを示します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:42:55 GMT)
Error bounds on the universal Lindblad equation in the thermodynamic limit [1.3]
これは、バルク散逸の対象となる量子多体系の挙動を解明するために、物理学の様々な分野において中心的な問題である。これまで、多体系に対するリンドブラッド量子マスター方程式のいくつかの微視的導出が提案されてきた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:06:02 GMT)
Detecting Errors in a Quantum Network with Pauli Checks [1.3]
量子エラー検出方式であるPauli check sandwiching (PCS) を分散マルチパーティプロトコルにすることで量子ネットワークに適用する。 PCSはターゲットの量子ビットに対して保護を提供し、通常、標準的な量子エラー訂正や検出コードよりもリソースオーバーヘッドを少なくする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:21:48 GMT)
Robust Visual Localization in Compute-Constrained Environments by Salient Edge Rendering and Weighted Hamming Similarity [1.3]
我々は,火星サンプルリターンキャンペーンの文脈において,視覚に基づく6-DoFオブジェクトのポーズ推定の問題を考える。本稿では,エッジ領域にマッチするテンプレートとともに,カスタムメトリックを活用する新しいローカライズアルゴリズムを提案する。汎用ハードウェア上での安価で信頼性の高いローカライゼーションの新たな可能性を実現するため,ロバスト性と精度の両面で,計算およびメモリ制約によるローカライゼーションの最先端性を常に打ち負かしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:22:35 GMT)
Towards Shift-Up: A Framework and a Prestudy on High-Value Activities in GenAI Native Software Development [1.2]
我々は、GenAIがサポートしながら、ソフトウェアチームが高価値な作業に集中するのを支援するGenAIネイティブ開発のためのフレームワークを提案する。論文の終わりに向けて、我々はシフトアップをもっと詳細に研究するための今後の研究目標を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:56:54 GMT)
On-the-Fly Data Augmentation for Brain Tumor Segmentation [1.2]
トレーニング中にGliGAN(Pretrained Generative Adversarial Network)を用いて合成腫瘍を動的に挿入するオンザフライ拡張戦略を提案する。 3つのモデルのアンサンブルは、オンラインBraTS 2025プラットフォーム上のDiceスコアが 0.79 (ET), 0.749 (NETC), 0.872 (RC), 0.825 (SN), 0.79 (TC), 0.88 (WT) となる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:02:36 GMT)
Unsupervised Representation Learning for 3D Mesh Parameterization with Semantic and Visibility Objectives [1.2]
本稿では,標準的な幾何学保存型UV学習を意味的および可視性に配慮した目的で強化する,教師なし微分可能なフレームワークを提案する。提案手法は, テクスチャ生成を支援し, 知覚可能なシームアーティファクトを低減できる紫外線アトラスを生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:28:58 GMT)
Establishing a Foundation for Tetun Ad-Hoc Text Retrieval: Stemming, Indexing, Retrieval, and Ranking [1.2]
本稿では,アドホック検索タスクに着目したテトゥーンテキスト検索について検討する。この研究は本質的な言語資源の開発から始まる。文書タイトルとコンテンツを用いて様々な戦略を評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:11:55 GMT)
Editing Physiological Signals in Videos Using Latent Representations [1.2]
心拍数(Heart Rate、HR)は、個人の健康をモニターする非接触手段である。顔ビデオに重要な信号があることは、プライバシーの懸念を生じさせる。映像中の生理的信号の編集を視覚的忠実性を維持しながら行うことを提案する。リアルビデオにおける生体信号の匿名化や,バイタルサイン付きリアルビデオなどの応用には,制御可能なHR編集が有用である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:02:50 GMT)
Discontinuous Epitope Fragments as Sufficient Target Templates for Efficient Binder Design [1.1]
タンパク質折り畳みニューラルネットワーク(PFNN)は、局所的な相互作用を優先し、グローバルな折り畳み性に制限された感度を示す。結合部位を囲む不連続な表面残基のみを保持する進化のみの戦略を提案する。このアプローチは、シリコの成功率を最大80%向上させ、成功設計当たりの平均時間を最大40倍に削減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:33:32 GMT)
Optical-pumping attack on a quantum key distribution laser source [1.1]
光源レーザのパルスエネルギを外部光で閉じ込めるだけでなく, パルスエネルギを増大させることが可能である。レーザダイオードを1310nm, 1.6mW cwレーザー光に照射すると, パルスエネルギーは10%増加した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:21:52 GMT)
ARGS: Advanced Regularization on Aligning Gaussians over the Surface [1.1]
この研究はSuGaR上に2つの補完的な正規化戦略を導入することで構築されている。最初の戦略は、ガウス原始構造に関する最近の研究によって動機付けられた効果的なランク正則化を導入する。第2の戦略は、ニューラルサイン付き距離関数を最適化プロセスに統合する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:10:55 GMT)
Quantitative quantum soundness for all multipartite compiled nonlocal games [1.1]
我々は,KLVYコンパイラの量子音響量を示す。量子機器にNPAのような階層を導入し、その完全性を証明する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:51:57 GMT)
ORPO-Distill: Mixed-Policy Preference Optimization for Cross-Architecture LLM Distillation [1.1]
本稿では, 優先最適化タスクとして問題を定式化する, クロスアーキテクチャ LLM 蒸留の汎用的手法である ORPO-Distill を紹介する。 Odds-Ratio Preference Optimization(Odds-Ratio Preference Optimization)は、教師と生徒のトレースを対比して、より効果的な学習を行うための目標である。 5つのデータセットと複数の学生モデルの実験は、従来のブラックボックスKDベースラインよりも一貫した改善を示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:34:02 GMT)
High fidelity CNOT gates in photonic integrated circuits using composite segmented directional couplers [1.1]
我々は、一様および複合カプラの変種を用いて、完全に統合されたフォトニック制御NOT(CNOT)ゲートを設計、製造する。合成設計は平均誤差確率を2倍近く低減し、可変性を5倍に低下させる。これらの結果はCSDCを、スケーラブルでスケーラブルな量子フォトニクス回路のためのコンパクトで受動的でファウントリー互換なビルディングブロックとして確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:03:28 GMT)
Understanding Cognitive States from Head & Hand Motion Data [1.1]
本稿では,構造化意思決定タスク中に収集された状態のフレームレベルアノテーションを用いた,頭部・手の動きの新たなデータセットを提案する。以上の結果から,深部側頭葉モデルでは動作のみから微妙な認知状態を推定でき,人間の観察者と同等のパフォーマンスを達成できる可能性が示唆された。この研究は、標準的なVRテレメトリは、ユーザの内的認知プロセスに関連する強力なパターンを含んでおり、新しい世代の適応仮想環境への扉を開くことを実証している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:59:56 GMT)
A theory of time based on wavefunction collapse [1.1]
時間の経過は、ゲージ不変状態に向かって崩壊する瞬間状態の連続過程である。結果として生じる時間進化のユニタリティと指向性は、宇宙論のミニスーパースペースモデルとして実証される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:06:20 GMT)
No Practical Quantum Broadcasting: Even Virtually [1.1]
線形過程が標本効率、ユニタリ共分散、置換不変性、古典的一貫性を維持できないことを証明する。標準の1-to-N$仮想放送マップの特異性を確立する。仮想放送と擬似密度演算子として知られる量子時空フレームワークの相互作用について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:53:07 GMT)
Single-Core Superscalar Optimization of Clifford Neural Layers [1.0]
我々はクリフォード畳み込み層における計算の内部構造を解析した。正確性を保ちながら推論プロセスを高速化するために,いくつかの最適化を提案し,実装する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:37:35 GMT)
A Multi-Modality Evaluation of the Reality Gap in Autonomous Driving Systems [1.0]
我々は、Software-in-the-Loop (SiL), Vehicle-in-the-Loop (ViL), Mixed-Reality (MR), full real-world testingの4つの代表的なテストモードを比較した。以上の結果から,SiLとViLのセットアップは実世界のダイナミックスとセンシングの重要な側面を単純化するが,MRテストは安全性や制御を損なうことなく知覚リアリズムを改善することが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:56:47 GMT)
Dimer-driven multiple reentrant localization with composite potential [1.0]
周期ポテンシャルと準周期変調を受ける一次元格子の局所化現象について検討する。これらの遷移は単位細胞の二量体構造によって一意に安定化されていることを示す。以上の結果から,これらの競合要因間の相互作用が複数の再帰的局所化遷移を引き起こすことが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:12:42 GMT)
Learning Distinguishable Representations in Deep Q-Networks for Linear Transfer [1.0]
本稿では,状態の特徴表現間の正の相関を減少させるために,正規化項を導入する新しいQ-ラーニング手法を提案する。転送学習性能の向上と計算オーバーヘッドの低減に本手法の有効性を実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:44:35 GMT)
Bootstrapping as a Morphism: An Arithmetic Geometry Approach to Asymptotically Faster Homomorphic Encryption [0.9]
本稿では,従来の回路評価モデルを完全にバイパスするブートストラップ手法を提案する。直射射影としてブートストラップ操作を再構成するために,現代の算術幾何学のツールを適用した。我々の研究は、$O(d cdot textpoly(log q))$、$d$が環次元、$q$が暗号文である完全かつ確実に正しいブートストラップアルゴリズムである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:39:01 GMT)
BPMN Assistant: An LLM-Based Approach to Business Process Modeling [0.9]
本稿では、自然言語ベースのBPMNダイアグラムの作成と編集にLarge Language Models(LLM)を活用するツールであるBPMN Assistantについて述べる。プロセス修正の精度を高めるために、XMLの直接処理に代わる構造化された表現として特殊ベースの表現が導入される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:56:08 GMT)
Quantum heuristics for linear optimization over large separable operators [0.9]
量子コプロセッサを導入し、問題の次元を著しく削減する。低次元設定ではシーソー型最適化が良好に動作することを示す。我々は、ハミルトンの分離可能な基底エネルギーを最大28キュービットまで近似する方法を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:22:53 GMT)
Traumatic Brain Injury Segmentation using an Ensemble of Encoder-decoder Models [0.9]
TBI病変の同定とセグメンテーションは、神経イメージングにおいて重要な課題である。本研究の目的は、T1強調MRIにおけるTBI病変を自動的に検出・分節する自動パイプラインを開発することである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:21:32 GMT)
AI in Pakistani Schools: Adoption, Usage, and Perceived Impact among Educators [0.9]
教師の3分の2は、適切な支援を受けたAIツールを採用する意思を示した。回答者の3分の1はAIツールを頻繁に使用しており、その他は時折利用している。教師は、AIによる学生のエンゲージメントと効率の適度な改善を報告した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:20:01 GMT)
The Emergence of Social Science of Large Language Models [0.9]
大規模言語モデル(LLM)の社会科学は、これらのシステムがマインドアトリビューションを誘発し、相互に相互作用し、人間の活動や制度を変革する方法について考察する。社会心としてのLLMは、モデルが認知、道徳、偏見の帰属を示す行動を示し、テスト漏れや表面の手がかりのような課題に対処するかどうかを調査する。ヒューマンインタラクションとしてのLLMは、LLMがタスク、学習、信頼、仕事、ガバナンスをどのように作り変え、ヒューマンAIインターフェースでリスクが生じるかを調べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:55:14 GMT)
Meson dynamics from locally exciting a particle-conserving $Z_2$ lattice gauge theory [0.8]
粒子保存1D$Z$格子ゲージ理論において局所的な高エネルギー励起から生じる閉じ込められた中間子を特徴付ける。この力学は、異なる大きさの中間子の重ね合わせの伝播によって特徴づけられる。この現象は線形閉じ込めの結果であり、強い閉じ込め限界と弱い閉じ込め限度の両方において有効であることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:08:21 GMT)
SemShareKV: Efficient KVCache Sharing for Semantically Similar Prompts via Token-Level LSH Matching [0.8]
大規模言語モデル(LLM)のためのKVキャッシュ共有圧縮フレームワークである textitSemShareKV を提案する。正確なトークンマッチに頼る代わりに、SemShareKVは、トークン埋め込みにローカリティ感受性ハッシュ(LSH)を使用してファジィトークンマッチングを適用し、位置情報をよりよく保存するためにロータリー位置埋め込み(Rotary Position Embedding、RoPE)を組み込んでいる。多様な要約データセットの実験では、最大6.25$times$スピードアップと42%低いGPUメモリ使用率で5kトークンが入力され、品質劣化は無視できる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:16:13 GMT)
SQuaD: Smart Quantum Detection for Photon Recognition and Dark Count Elimination [0.8]
SQuaDは、高タイミング分解能データ取得、マルチスケールデータ分析、インテリジェントな特徴認識と抽出を備えた完全に統合された量子システムである。我々は、SQuaDを原子(エルビウムイオン)光子源に展開し、通信帯域におけるスピン量子ビットのノイズフリー制御と読み出しを実現する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:33:21 GMT)
Evaluating classification performance across operating contexts: A comparison of decision curve analysis and cost curves [0.8]
決定曲線は、ブライア曲線と呼ばれる特定の種類のコスト曲線と密接に関連していることを示す。損失の差は、純利益の差と同等である。我々は,各空間に共通する基準線をいずれにも含めることができることを示唆し,有効比較として,上層エンベロープ決定曲線を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:15:25 GMT)
A Cartography of Open Collaboration in Open Source AI: Mapping Practices, Motivations, and Governance in 14 Open Large Language Model Projects [0.8]
オープンな大規模言語モデル(LLM)の普及は、人工知能(AI)における研究とイノベーションの活発なエコシステムを育んでいる。オープン LLM の開発に用いられている共同開発手法は,まだ包括的に研究されていない。我々は、草の根プロジェクト、研究機関、スタートアップ、北米、ヨーロッパ、アフリカ、アジアのビッグテック企業の14のオープンLCMの開発者との半構造化されたインタビューを描いています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:55:18 GMT)
Orchestrating multi-level magic state distillation: a dynamic pipeline architecture [0.8]
マジックステート蒸留工場は、多くの低忠実度入力魔法状態を消費し、より少ない高忠実度状態を生成する。高忠実度に達するためには、複数の蒸留工場が多層パイプラインに連結されるのが一般的である。蒸留パイプラインの資源利用を最適化する新しい動的パイプラインアーキテクチャを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:49:40 GMT)
Roadmap to planar electron-ion point Paul trap [0.8]
我々は、レーザー冷却したイオンと電子を併用した量子力学システムの開発のための技術的ガイドを示す。本稿では、システムの量子状態を制御する方法の概要と、それを含む前方互換設計のための青写真を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:43:52 GMT)
Enhancing Split Learning with Sharded and Blockchain-Enabled SplitFed Approaches [0.8]
フェデレートラーニング(FL)やスプリットラーニング(SL)といった協調的かつ分散的な学習技術は、プライバシクリティカルなドメインにおける機密データを活用する上で大きな可能性を秘めている。しかし、FLとSLは鍵となる制限に悩まされ、FLはクライアントにかなりの計算要求を課し、SLは長期のトレーニング時間をもたらす。これらの課題を克服するため、SFL(SplitFed Learning)はFLとSLの強みを組み合わせたハイブリッドアプローチとして導入された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:24:24 GMT)
Overcoming Over-Fitting in Constraint Acquisition via Query-Driven Interactive Refinement [0.8]
Constraint Acquisition (CA)は、制約プログラミングにおける手動モデリングを自動化することを目的としている。受動的CAメソッドは、過度に適合する傾向があり、しばしば、限られたデータでトレーニングされた時に、急激なグローバル制約を含むモデルを学習する。本稿では,CAにおける過剰適合の課題に対処するために設計されたハイブリッドCAフレームワークを紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:02:16 GMT)
Convergence of graph Dirichlet energies and graph Laplacians on intersecting manifolds of varying dimensions [0.8]
実世界のデータは、しばしば異なる次元の部品またはクラスから構成される。重要な課題は、どの機械学習手法がそのような様々な次元に適応しているかを理解することである。我々は、正規化されたディリクレエネルギーが、すべての次元に同時に適応するユニオン上の(拡張された)ディリクレエネルギーに収束することを証明する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:39:45 GMT)
LLUAD: Low-Latency User-Anonymized DNS [0.8]
ドメイン名システム(DNS)は、事実上すべてのWebアクティビティに関与している。 DNSはユーザのWebアクティビティを詳細に公開する。プライバシの課題は,トランスレーション/ルックアップサービスを提供するDNSサーバ/リゾルバである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:43:23 GMT)
Evaluation of Polarimetric Fusion for Semantic Segmentation in Aquatic Environments [0.8]
ポラリメトリック・イメージングは、浮遊物体のセマンティックセグメンテーションを妨害する水面グレアを緩和する単一センサーの経路を提供する。我々は、内陸水路におけるプラスチックボトルの偏光画像の公開データセットであるPoTATO上で、最先端の核融合ネットワークをベンチマークした。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:57:20 GMT)
DNS in the Time of Curiosity: A Tale of Collaborative User Privacy Protection [0.8]
パブリックDNSリゾルバは、低レイテンシの解決、高い信頼性、プライバシ保護ポリシー、暗号化DNSクエリのサポートを提供する。ユーザを盗聴者から守るためにますますデプロイされるクライアント・リゾルバのトラフィック暗号化は、好奇心をそそるリゾルバからユーザーを保護するものではない。パフォーマンスを犠牲にすることなく、高いレベルのプライバシを実現することを目的として、提案の重要なアイデアについて議論する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:09:09 GMT)
Neuromorphic Intelligence [0.8]
ニューロモルフィックコンピューティングは、人工システムにおける人間の脳の顕著な効率、柔軟性、適応性を再現しようと試みている。ニューロモルフィックシステムは脳にインスパイアされた計算の原理を利用して、より大きなエネルギー効率のオーダーを達成している。中心的な課題は、多様な規律をブリッジできる統一理論の枠組みを特定することである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:36:58 GMT)
Bandits roaming Hilbert space [0.8]
マルチアームバンディットを用いた量子状態の性質のオンライン学習における探索と利用のトレードオフについて検討する。我々は,情報の理論的下界と,それに対応する上界の最適戦略を導出し,円の平方根として後悔のスケールを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:26:29 GMT)
A Systematic Review of Digital Twin-Driven Predictive Maintenance in Industrial Engineering: Taxonomy, Architectural Elements, and Future Research Directions [0.7]
コストのかかるダウンタイムや悲惨な結果を避けるため、予測メンテナンスの必要性が強まっている。モノのインターネット、人工知能、機械学習、リアルタイムビッグデータ分析の人気が高まり、効率的な予測保守のためのユニークな機会がある。この進化の中心はデジタルツイン技術であり、センサデータを継続的に監視し統合し、資産のパフォーマンスをシミュレートし改善する適応型仮想レプリカである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:26:23 GMT)
Distributed Quantum Error Correction with Permutation-Invariant Approximate Codes [0.7]
この課題に対処するために,近似符号に基づく分散量子誤り訂正フレームワークを導入する。我々は、この非古典的アプローチが顕著な利点をもたらすことを示す低い境界と対応するシミュレーションを導出する。その結果、スケーラブルでモジュラーでフォールトトレラントな量子計算のための近似的な分散誤差補正戦略の可能性を強調した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:28:39 GMT)
Emergent World Representations in OpenVLA [0.7]
本稿では,OpenVLAが状態遷移の潜在知識を含むかどうかを探索するために,状態表現への埋め込み演算を用いた実験手法を提案する。ベースラインを超える状態遷移の統計的に有意な予測能力は,OpenVLAが内部世界モデルを符号化していることを示す。我々は,OpenVLAの早期チェックポイントの予測能力について検討し,トレーニングが進むにつれて世界モデルが出現することを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:12:59 GMT)
A(I)nimism: Re-enchanting the World Through AI-Mediated Object Interaction [0.7]
A(I)ニミズム(A(I)nimism)は、大きな言語オブジェクト(LLO)が日常の物とアニミズムの関係をどのように仲介するかを探索するインタラクティブなインストールである。物理的な「ポータル」に配置され、GPT-4ビジョン、音声入力、メモリベースのエージェントを使用して進化するオブジェクトペルソナを作成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:27:09 GMT)
Outlier Detection in Plantar Pressure: Human-Centered Comparison of Statistical Parametric Mapping and Explainable Machine Learning [0.7]
統計的パラメトリックマッピング(SPM)は、解釈可能な解析を提供するが、アライメントに敏感であり、ロバストな外れ値検出能力は未だ不明である。本研究では、SPMアプローチと説明可能な機械学習(ML)アプローチを比較して、プラント圧力データセットのための透明な品質制御パイプラインを確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:37:15 GMT)
Detecting and Fixing API Misuses of Data Science Libraries Using Large Language Models [0.7]
本稿では,データサイエンスライブラリのAPI誤用を検出し,修正するためのLCMベースのアプローチであるDSCHECKERを紹介する。 APIの誤用の検出と修正に有用な2つの重要な情報、すなわちAPIディレクティブとデータ情報を特定します。ドシェッカー剤は48.65パーセントのF1スコアを検出でき、誤用の39.47パーセントを修正している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:30:02 GMT)
Metaphor identification using large language models: A comparison of RAG, prompt engineering, and fine-tuning [0.7]
本研究では,大言語モデル(LLM)が全文でメタファ識別を自動化する可能性について検討する。 i) 検索拡張生成(RAG) モデルにコードブックを付与し,その規則や例に基づいて注釈を付けるように指示する手法, (ii) タスク固有の言語命令を設計する手法, (iii) ハンドコードされたテキストでモデルを訓練してパフォーマンスを最適化するファインチューニング,の3つの手法を比較した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:50:18 GMT)
Conservative Decisions with Risk Scores [0.6]
リスクスコアの最適カットオフ間隔を決定する新しい手法を提案する。このインターバル内では、アルゴリズムは決定を控えるが、インターバルの外では、分類精度が最大になる。前立腺癌の診断におけるシミュレーション研究と実世界のケーススタディの両方を実施。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:25:50 GMT)
PACER: Physics Informed Uncertainty Aware Climate Emulator [0.6]
PACERは、温室効果ガスの排出データのみを訓練しながら、86年間安定して温度と降水量をエミュレートする。境界条件を考慮に入れたPACERにおいて, 対流拡散の基本的な物理法則を取り入れた。 PACERは、気候モデルの大半でベースラインを上回り、気候セットによって提供される15の気候モデルで訓練されている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:21:49 GMT)
ASTROCO: Self-Supervised Conformer-Style Transformers for Light-Curve Embeddings [0.6]
本研究では,不規則な恒星光曲線に対するコンバータ型エンコーダAstroCoを提案する。 AstroCoは、注意を奥行きの畳み込みとゲーティングと組み合わせることで、グローバルな依存関係とローカル機能の両方をキャプチャする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:09:23 GMT)
CURA: Size Isnt All You Need - A Compact Universal Architecture for On-Device Intelligence [0.6]
本稿では,多様な機械学習タスクに対して,コンパクトで軽量なソリューションを提供するアーキテクチャCURAを提案する。コンパクト化のためには、ベースラインモデルに比べて最大2500倍のパラメータで等価な精度を実現した。一般化のために、4つのNLPベンチマークと1つのコンピュータビジョンデータセットで一貫した性能を示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:06:37 GMT)
S2S-Net: Addressing the Domain Gap of Heterogeneous Sensor Systems in LiDAR-Based Collective Perception [0.6]
この研究は、車車間(V2V)集団知覚におけるSensor2Sensorドメインギャップに対処する最初の試みである。まず、センサドメインのロバストアーキテクチャS2S-Netについて述べる。次に、最先端CP法とS2S-NetのSensor2Sensor領域適応能力を詳細に分析する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:49:46 GMT)
Balancing Compliance and Privacy in Offline CBDC Transactions Using a Secure Element-based System [0.6]
本稿では、暗号通貨やCBDCにも等しく適用可能な、オフラインのデジタル通貨決済のプロトタイプを紹介する。性能評価の結果, 異なる規制環境に柔軟に適応できることが示唆された。我々は、Zero-Knowledge Proofsを設計に組み込むことが、プライバシー保護の強化にどのように対応できるかを概念化した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:19:31 GMT)
Bayesian Transformer for Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data [0.6]
パン・アルキティック海氷の高分解能マッピングは, 海氷濃度チャートの作成に不可欠である。パン・アルキティックSICマッピングと不確実性定量化のための新しいベイズ変圧器手法を提案する。提案手法は2021年9月にPan-Arcticデータセットを用いて検証され,提案モデルが高分解能SICマップと頑健な不確実性マップの両方を達成可能であることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:42:15 GMT)
Zero Trust-based Decentralized Identity Management System for Autonomous Vehicles [0.6]
本稿では,AVのためのZero Trust-based Decentralized Identity Management (D-IM)プロトコルを提案する。 Zero Trust Architectureの中核的な原則である“常に信頼し、常に検証する”ことと、ブロックチェーンネットワークの改ざんし、分散した性質を統合することで、当社のフレームワークは、中央集権的な権威への依存を排除します。都市と高速道路の両方のシナリオで実施された総合的な実験的評価は、プロトコルの実用性を検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:42:51 GMT)
Learning from Convenience Samples: A Case Study on Fine-Tuning LLMs for Survey Non-response in the German Longitudinal Election Study [0.6]
ランダムな非応答と体系的な非応答の両方で自己申告された投票選択をインプットするために、大きな言語モデルを微調整する。 LLMは、ゼロショットよりも正確に個人レベルの予測と人口レベルの分布を復元することができる。このことは、微調整のLSMが、非確率的なサンプルや体系的な欠陥を扱う研究者に有望な戦略を提供することを示唆している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:12:18 GMT)
STRAPSim: A Portfolio Similarity Metric for ETF Alignment and Portfolio Trades [0.6]
STRAPSimは、セマンティックな類似性に基づいて構成成分をマッチングすることでポートフォリオの類似性を計算する新しい方法である。私たちは、Jaccard、重み付きJaccard、およびBERTScoreにインスパイアされたパブリックな分類、回帰、レコメンデーションタスクに対するアプローチをベンチマークします。実験結果から,提案手法は予測精度とランキングアライメントにおいて,ベースラインを一貫して上回ることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:57:41 GMT)
Reducing Spatial and Temporal Dimensionality in the Multidimensional Caldeira-Leggett Model [0.6]
本稿では,多次元カルデイラ・レゲットモデルの縮密度行列のリアルタイムダイナミクスに着目する。本稿では,空間的次元と時間的次元を削減し,効率的なアルゴリズムに組み込むために,いくつかの手法を応用した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:40:41 GMT)
Performance and competence intertwined: A computational model of the Null Subject stage in English-speaking children [0.6]
若い英語話者は、パフォーマンスの影響により、インペラティブなNS発声と宣言的な発声を混同することが多い。そこで我々は,この誤解釈を計算パラメータとして提案し,従属科目文法学習のシミュレーションモデルに組み込む。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:04:30 GMT)
LAMP-PRo: Label-aware Attention for Multi-label Prediction of DNA- and RNA-binding Proteins using Protein Language Models [0.5]
LAMP-PRoは、事前学習されたタンパク質言語モデル(PLM)、注意機構、マルチラベル学習に基づいている。我々はDNA結合タンパク質とRNA結合タンパク質の依存関係を明示的に捉える新しいラベル間アテンション機構を含む。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:13:51 GMT)
Large language models for behavioral modeling: A literature survey [0.5]
大規模言語モデル(LLM)は行動モデリングに広く利用されている。本研究の目的は, 行動モデルにおけるLCMの利用に関する既存研究の概要を明らかにすることである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:43:02 GMT)
WMKA-Net: A Weighted Multi-Kernel Attention Network for Retinal Vessel Segmentation [0.5]
本研究では,マルチスケール機能融合の不十分,文脈連続性の破壊,ノイズ干渉といった問題に対処する二段階解を提案する。第1段では、階層的な適応的畳み込みを使用して、キャピラリーからメイン船へのクロススケール機能を動的にマージするマルチスケール核融合モジュール(Multi-Scale Fusion Module, RMS)を採用している。第2段階では、軸方向の経路を通じて長距離血管の連続性をモデル化する血管指向性注意機構が導入された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:20:44 GMT)
Proof-of-Social-Capital: A Consensus Protocol for Public Blockchains, Replacing Stake for Social Capital [0.5]
本稿では,公正性と分散性を確保するため,社会資本による新たなコンセンサスプロトコルを提案する。提案手法では,Sybil攻撃を防ぐために,認証証明と独自性強化機構を組み込んだzkSNARKの検証を行う。この研究は、金融に応用された現代ソーシャルメディアのライフスタイルに沿った新しい概念を提供し、分散コンセンサスプロトコルの進化に関する実践的な洞察を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:23:19 GMT)
Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective POMDPs and its Impact on Randomised Strategies [0.5]
部分的に観測可能なマルコフ決定過程における多次元ペイオフ関数について考察する。すべての戦略の下で期待される支払いが有限である任意のペイオフに対して、期待されるペイオフは、有限個の戦略を正確に混合することで得られる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:30:59 GMT)
EYE-DEX: Eye Disease Detection and EXplanation System [0.5]
世界全体では、32億人以上の人々が何らかの視覚障害の影響を受けており、年間生産性の損失は4100億ドルと見積もられている。本研究では,網膜10条件を自動分類するEYE-DEXを提案する。我々は、VGG16、VGG19、ResNet50の3つの事前訓練された畳み込みニューラルネットワーク(CNN)モデルのベンチマークを行った。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:10:02 GMT)
GateMABSA: Aspect-Image Gated Fusion for Multimodal Aspect-based Sentiment Analysis [0.5]
GateMABSAは、シンタクティック、セマンティック、融合対応mLSTMを統合した、新しいゲート型マルチモーダルアーキテクチャである。 Twitterの2つのベンチマークデータセットの実験は、GateMABSAがいくつかのベースラインを上回っていることを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:56:10 GMT)
Towards Structured Knowledge: Advancing Triple Extraction from Regional Trade Agreements using Large Language Models [0.4]
本研究では,Large Language Models (LLMs) の有効性について検討した。この知見は、自然言語の法的な貿易合意書から経済的な貿易知識グラフを作成することを含む、幅広いシナリオに適用することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:11:40 GMT)
CAFL-L: Constraint-Aware Federated Learning with Lagrangian Dual Optimization for On-Device Language Models [0.4]
ラグランジアンデュアル最適化(CAFL-L)による制約を考慮したフェデレーション学習ラグランジアンデュアル最適化(CAFL-L)を用いた制約対応フェデレーション学習について紹介する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:07:20 GMT)
Secret Leader Election in Ethereum PoS: An Empirical Security Analysis of Whisk and Homomorphic Sortition under DoS on the Leader and Censorship Attacks [0.4]
Proof-of-Stake(PoS)ブロックチェーンのプロポーラ匿名性は、悪意のあるDoS(DoS)や検閲攻撃といったターゲット攻撃のリスクのために、重要な懸念事項である。敵条件下でSSLEメカニズムを評価するための統一的な実験フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:48:05 GMT)
Accelerating Cerebral Diagnostics with BrainFusion: A Comprehensive MRI Tumor Framework [0.4]
磁気共鳴画像(MRI)を用いた脳腫瘍解析の進歩であるBrainFusionについて検討した。我々は,VGG16,ResNet50,Xceptionを含む腫瘍分類のための細調整畳み込みニューラルネットワーク(CNN)を,境界ボックスによる正確な腫瘍局在のためのYOLOv8と組み合わせた。実験の結果, 微調整されたVGG16モデルでは99.86%の精度が達成され, 従来のベンチマークをはるかに上回っていることがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:53:17 GMT)
Characterizing the Sensitivity to Individual Bit Flips in Client-Side Operations of the CKKS Scheme [0.4]
ホモモルフィック暗号化(HE)は、復号化せずに暗号化されたデータの計算を可能にし、信頼できない環境でのプライバシ保護計算の基盤となる。 HEは、セキュアな機械学習や機密データ分析といったセンシティブなアプリケーションの採用が増加し、エラーに対する堅牢性が重要になると考えている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:46:50 GMT)
Quantum Speed Limit and Quantum Thermodynamic Uncertainty Relation under Feedback Control [0.4]
我々は、量子速度制限と量子熱力学の不確実性関係の理論的枠組みを確立する。フィードバック制御が速度と精度に与える影響を取り入れた一般的な不等式を導出する。我々の研究は、フィードバック制御が量子システムの速度と精度の基本的な限界にどのように影響するかを包括的に理解する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:19:22 GMT)
Evaluating SAP Joule for Code Generation [0.4]
SAPは独自の生成モデルであるSAP Jouleをリリースした。本稿では、SAP JoulesのJavascriptコーディング機能と、29の他のモデルを比較した。 SAP Jouleは、評価において5番目の最良のモデルとして、80.49%の厳密な精度を達成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:13:40 GMT)
Long-Range Bosonic Systems at Thermal Equilibrium: Computational Complexity and Clustering of Correlations [0.4]
本稿では, 準ポリリノミカルを用いた古典的アルゴリズムを用いて, 高温における長距離ボソニック系の分配関数を近似する。また相関関数の正則崩壊の厳密な証明も提示する。これらのシステムにおける計算複雑性と相関クラスタリングに関する2つの長期的ギャップに対処する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:48:32 GMT)
Bengali Document Layout Analysis -- A YOLOV8 Based Ensembling Approach [0.4]
我々は、モデルロバストネスにデータ拡張を採用することで、複雑なBengaliスクリプトに特有の課題に取り組む。完全なデータセットに対する我々のアプローチを微調整し、正確な要素セグメンテーションのための2段階の予測戦略を導いた。私たちの実験は、新しい戦略を確立されたソリューションに組み込む上で重要な洞察を与えました。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:38:34 GMT)
Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete [0.3]
この研究は、自動回帰U-Netモデルを用いて、単位セル内のスカラー損傷場の進化を予測する。畳み込みニューラルネットワーク(CNN)は、観測された収縮や残留剛性を含む重要な力学特性を予測するために用いられる。これはコンクリートの混合設計の最適化に役立ち、耐久性の向上と内部損傷の低減につながる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:15:07 GMT)
Network inference via process motifs for lagged correlation in linear stochastic processes [0.3]
時系列データから因果推論を行う上での大きな課題は、計算可能性と精度のトレードオフである。相関行列から容易に計算できるペアワイドエッジ測度(PEM)を用いて因果関係のネットワークを推論する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:11:13 GMT)
Broadening Ontologization Design: Embracing Data Pipeline Strategies [0.3]
オンロジ化プロセスの設計空間が、現在の実践よりいかに広いかを概説する。データパイプラインとして実装された急激な新しいプラクティスを設計する可能性について検討する。オンロジゼーションのための進化的コンテキストの設定は、これらの新しいプラクティスの性質をよりよく理解するのに役立ちます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:56:33 GMT)
Graph Neural Networks for O-RAN Mobility Management: A Link Prediction Approach [0.3]
5Gまでのセルラーネットワークにおいて、モビリティのパフォーマンスが重要視されている。本稿では,O-RANにおけるモビリティ管理のためのアクティブなHOフレームワークを提案する。リンク予測のためのグラフニューラルネットワーク(GNN)の様々なカテゴリについて検討し、それらをモビリティ管理領域に適用する際の複雑さを分析する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:18:41 GMT)
The 2025 OpenAI Preparedness Framework does not guarantee any AI risk mitigation practices: a proof-of-concept for affordance analyses of AI safety policies [0.3]
著名なAI企業は、自主的な自己管理の一種として「安全フレームワーク」を生産している。 OpenAI 'Preparedness Framework Version 2' (2025年4月) は、余裕のメカニズムと条件モデルとMIT AI Risk Repositoryを用いて分析する。この安全ポリシーは、少数のAIリスクの評価を要求し、‘Medium’機能を備えたシステムのデプロイを奨励し、OpenAIのCEOがさらに危険な機能をデプロイできるようにする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:42:10 GMT)
Bayesian Autoregressive Online Change-Point Detection with Time-Varying Parameters [0.3]
現実世界のシステムにおける変化点は、システムの力学における重要な状態変化を示す。本稿では,一変量時系列を用いたオンライン変化点検出手法を提案する。時間的依存関係と時間的パラメータをモデル化することにより、推定精度と予測能力の両方を高めることができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:38:08 GMT)
Barnett Effect-Induced Nonreciprocal Entanglement in Magnomechanics with Optical Parametric Amplifier [0.3]
非相互性は量子技術において強力なツールである。本稿では,バーネット効果による非相互絡み合いを実現する手法を提案する。我々の研究は、非相互シングルフォノンデバイスの実現の道筋を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:47:24 GMT)
Hierarchical Error Correction for Large Language Models: A Systematic Framework for Domain-Specific AI Quality Enhancement [0.2]
最先端のAIモデルは、医療コーディングタスクで45.9%の精度しか達成していない。我々は、4つの専門分野にわたるエラーパターンを分析し、AIエラーが一貫した階層構造に従うことを発見した。我々は,その階層的重要性に応じて誤りに対処する3段階補正フレームワークを開発した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:21:05 GMT)
Single-particle Fraunhofer diffraction in a classical pilot-wave model [0.2]
ウォーキングオイル滴は定性的で古典的な単一粒子回折のアナログを提供する。我々はダローとブッシュの最近のラグランジアンパイロット波モデルで問題を再考する。シングルスリットとダブルスリットの両方のフラウンホーファーパターンとの一致を見いだす。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:50:05 GMT)
Hybrid Layer-Wise ANN-SNN With Surrogate Spike Encoding-Decoding Structure [0.2]
スパイキングニューラルネットワーク(SNN)は、計算神経科学と人工知能の両方で大きな注目を集めている。本稿では,従来のANNパイプラインにレイヤワイドエンコード・デコードSNNブロックを統合するハイブリッドANN-SNNフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:57:58 GMT)
Norm-Q: Effective Compression Method for Hidden Markov Models in Neuro-Symbolic Applications [0.2]
隠れ計算(HMM)は生成タスクで一般的に用いられ、マルコフ特性に対するニューロシンボリックな応用において強力な能力を示している。本稿では,HMM圧縮のための正規化線形量子化手法を提案する。最小のインパクトでデータのビット幅を削減し、メモリと帯域幅のストレスを軽減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:45:23 GMT)
Beyond Repetition: Text Simplification and Curriculum Learning for Data-Constrained Pretraining [0.2]
本研究では,事前学習におけるカリキュラム学習について研究し,テキストの複雑な順序付けと単純化によるデータ拡張に着目した。繰り返し露光、低から高の複雑さ、高から低、インターリーブの4つのデータスケジュールをテストする。その結果, 簡易データの追加により, 繰り返し露光ベースライン上での微調整, ゼロショット性能が向上することがわかった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:54:59 GMT)
Evaluating Temperature Scaling Calibration Effectiveness for CNNs under Varying Noise Levels in Brain Tumour Detection [0.2]
我々は、カスタムCNNを開発し、それを統合された脳MRIデータセットでトレーニングする。実世界の不確実性をシミュレートするために,ガウス,ポアソン,ソルト&ペッパー,スペックル,ユニフォームの5種類の画像ノイズが導入された。その結果、TSは分類精度を低下させることなく、全ての雑音条件下でECEとNLLを著しく低下させることが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:46:23 GMT)
Quantum Simulation of Noisy Quantum Networks [0.2]
複雑な量子ネットワークは、指数的に増加する状態空間とノイズによる不完全性のためにシミュレーションが難しい。我々は、量子コンピュータとノイズの多い中間規模量子(NISQ)デバイスを量子ネットワークシミュレータとして活用する代替手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:02:36 GMT)
Probabilistic Graybox Characterization of Quantum Devices with Bayesian Neural Networks [0.2]
Grayboxのキャラクタリゼーション手法は暗黙のノイズモデルを可能にし、プラットフォームに依存しないが、不確実性に欠ける。本研究では,確率論的機械学習,特にニューラルニューラルネットワークを用いた確率的グレイボックス特徴付けモデルを開発し,2値測定結果を直接推論に利用する。提案した確率的グレイボックスモデルでは,観測データの分布を最大1.9倍に向上する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:16:50 GMT)
Uncertainty-Guided Expert-AI Collaboration for Efficient Soil Horizon Annotation [0.1]
土壌プロファイルを記述するためのマルチモーダルマルチタスクモデルである$textitSoilNet$に共形予測を適用する。我々は,モデルの不確実性が高い場合に,基本真理アノテーションを得るための限られた予算が利用できる,シミュレーションされたHILアノテーションパイプラインを設計する。実験により、SoilNetの適合性は回帰タスクにおけるより効率的なアノテーションと分類タスクにおける同等のパフォーマンススコアをもたらすことが示された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:54:23 GMT)
Causal Autoencoder-like Generation of Feedback Fuzzy Cognitive Maps with an LLM Agent [0.1]
大規模言語モデル(LLM)は、フィードバック因果ファジィ認知マップ(FCM)をテキストにマッピングし、テキストからFCMを再構築する。この説明可能なAIシステムは、FCMからそれ自身へのアイデンティティマップを近似し、オートエンコーダ(AE)の操作に似ている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:33:53 GMT)
BugMagnifier: TON Transaction Simulator for Revealing Smart Contract Vulnerabilities [0.1]
本稿では,TONスマートコントラクトの脆弱性を系統的に明らかにするトランザクションシミュレーションフレームワークであるBugMagnifierを紹介する。我々のツールは、正確なメッセージキュー操作と差分状態解析と確率的置換テストを組み合わせることで、非同期実行の欠陥を検出する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:26:52 GMT)
Observable-projected ensembles [0.1]
サブシステム内で混合状態のアンサンブルを生成する新しい測定手法を提案する。これを観測可能な投影アンサンブルと呼ぶ。観測可能な射影アンサンブルを探索する第1ステップとして、共形場理論におけるその絡み合い特性について検討する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:02:02 GMT)
Artificial Authority: From Machine Minds to Political Alignments. An Experimental Analysis of Democratic and Autocratic Biases in Large-Language Models [0.1]
政治的信念は、歴史的、文化的、制度的な文脈を反映して、国によって大きく異なる。生成的人工知能の出現は、大規模なコーパスで訓練された政治宇宙エージェントに新しいエージェントを導入する。本稿では,Large Language Models (LLM) が,民主的・独裁的世界観と整合性を示すか否かを考察する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:26:58 GMT)
Context-Driven Performance Modeling for Causal Inference Operators on Neural Processing Units [0.1]
大規模言語モデル(LLM)は、リソース制約されたエッジデバイスに対する長期のコンテキスト推論の需要を押し上げている。ニューラル処理ユニット(NPU)にこれらのモデルをデプロイすると、アーキテクチャミスマッチによる重大な問題が発生する。本稿では,現代NPUにおける各種因果推論演算子の総合的性能解析について述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:55:43 GMT)
Two bases suffice for QMA1-completeness [0.1]
我々は、量子-k-SAT問題の基底制限付き変項を導入し、入力ハミルトニアンの各項は標準基底またはアダマール基底において対角線であることが要求される。我々の主な結果は、この基底制限を持つ量子-6-SAT問題は、既にQMA1完全であり、自然ゲートセットに対して定義されていることである。我々はFeynman-Kitaev回路とHamilton回路をベースとしており、標準時計とHadamardベースで2つのクロックをインターリーブする改良されたクロック符号化を採用している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:39:00 GMT)
NarrLV: Towards a Comprehensive Narrative-Centric Evaluation for Long Video Generation [0.1]
長いビデオ生成タスクの目標は、ビデオの長さを延ばすだけでなく、長いビデオの中でよりリッチな物語コンテンツを正確に表現することである。提案するNarrLVは,Long Video生成モデルのナラティブ表現能力を総合的に評価する最初のベンチマークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:19:15 GMT)
Generalized Wigner theorem for non-invertible symmetries [0.0]
非可逆作用素に関連する保存則は、量子力学の対称性として実現することができる。群構造を形成するすべての対称性(したがって可逆)はユニタリあるいは反ユニタリでなければならない。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:04 GMT)
Generation of C-band entangled photon pairs by biexciton-exciton cascade from symmetric InAs/InP quantum dots [0.0]
非共鳴励起エピタキシャルInAs/InP量子ドット(QDs)からのバイエキシトンエキシトンカスケードによる通信Cバンドの偏光束光子の生成について検討した。微細構造分割 (FSS) の外部チューニングは行わずに実現され、これは成長したナノ構造において10$mu$eVを超えない。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:16:04 GMT)
Digital-Analog Simulations of Schrödinger Cat States in the Dicke-Ising Model [0.0]
そこで我々はDicke-Isingモデルのためのディジタルアナログ量子シミュレータを提案する。本研究では,フィールド理論を用いて,システムの自由エネルギー景観を解析する。我々は、量子ビットと光子自由度をアンタングルするデジタルアナログ量子アルゴリズムを開発した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:10:30 GMT)
Krylov Winding and Emergent Coherence in Operator Growth Dynamics [0.0]
我々は、クリロフ巻は量子カオス系の一般的な特徴であると主張する。スクランブル作用素におけるコヒーレント相の出現は、熱化量子多体系の観点からも謎のままである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:07 GMT)
Meta-Learning to Explore via Memory Density Feedback [0.0]
メタ学習を利用した探索アルゴリズムや学習の学習について検討する。エージェントは、訓練の最盛期にさえ、単一のエピソードで探索の進捗を最大化することを学ぶ。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:11:43 GMT)
tenSVD algorithm for compression [0.0]
本研究では, テンソルを用いた効率的な画像記憶手法を提案し, 記憶の最小化, 伝送の帯域幅, 処理のエネルギを図った。結果の詳細な分析を行い、確立された定量的指標を用いて、アルゴリズム間でのエネルギー消費の観点から、持続可能性に大きな注意を払っている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:25:49 GMT)
Why mask diffusion does not work [0.0]
自己回帰(AR)モデルよりも拡散言語モデルの主な利点は、並列生成と双方向の注意を支援する能力にある。近年、オープンソースのマスク拡散言語モデルが登場し、そのほとんどは吸収拡散として知られる変種に基づいている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:07:09 GMT)
Who invented deep residual learning? [0.0]
2025年現在、21世紀の最も引用された科学論文は、残余接続を伴う深層学習に関するNNの論文である。我々は深層学習の進化のタイムラインを提示する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:57:35 GMT)
Visualizing Celebrity Dynamics in Video Content: A Proposed Approach Using Face Recognition Timestamp Data [0.0]
本稿では,分散マルチGPU推論システムとインタラクティブな可視化プラットフォームを組み合わせたハイブリッドフレームワークを提案する。この推論フレームワークは、最適化されたONNXモデルを利用して、大量のビデオデータを効率的に処理する。このシステムのインタラクティブな性質により、ユーザは動的にデータを探索し、キーモーメントを特定し、個人間の進化する関係を明らかにすることができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:29:11 GMT)
Vehicle Classification under Extreme Imbalance: A Comparative Study of Ensemble Learning and CNNs [0.0]
車両のタイプ認識は、インテリジェントな輸送とロジスティクスを支えるが、公共データセットの厳しいクラス不均衡は、稀なカテゴリーのパフォーマンスを抑制する。我々は、Kaggle、ImageNet、およびWebcrawledデータを統合することで、16クラスのコーパス(47k画像)をキュレートし、SMOTEオーバーサンプリングとターゲットアンダーサンプリングにより6つのバランスの取れた変種を生成する。 Random Forest、AdaBoost、MobileNet-V2機能上に構築されたソフトボッティングコンバインダなどの軽量アンサンブルは、強力な拡張とラベルスムーシングでトレーニングされたResNetスタイルのCNNに対してベンチマークされる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:56:56 GMT)
VAGUEGAN: Stealthy Poisoning and Backdoor Attacks on Image Generative Pipelines [0.0]
本研究では,モジュール型摂動ネットワークPoisonerNetとGenerator Discriminatorペアを組み合わせた攻撃パイプラインであるVagGANを紹介した。実験では、汚染された出力はクリーンな出力よりも視覚的品質が高いことが示され、毒が必ずしも忠実度を低下させるという仮定に挑戦する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:02:31 GMT)
Unified laboratory-frame analysis of atomic gravitational-wave sensors [0.0]
原子干渉計における空間重畳が重力波信号を引き起こすことを示す。本研究では, 原子間干渉計や超エコ原子時計に使用可能なパルスシーケンスを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:19:47 GMT)
Trajectories and Comparative Analysis of Global Countries Dominating AI Publications, 2000-2025 [0.0]
米国と欧州連合(EU27)は、かつては議論を呼ばない指導者であり、相対的な支配力の顕著な低下を経験している。中国は、2000年の5%以下から2025年までに36%近くまで、全世界のAI出版物のシェアを拡大している。これらの経験的発見は、集中的な研究成果の戦略的意味を浮き彫りにしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:35:54 GMT)
TraitSpaces: Towards Interpretable Visual Creativity for Human-AI Co-Creation [0.0]
心理学からアーティストや理論を実践する実践者へのインタビューに基づいて、私たちは、創造性の感情的、象徴的、文化的、倫理的次元を捉えた12の特徴を定義します。環境対話性や空洞アークといったトラストは高い信頼性で予測される。私たちの研究は、文化的・美的な洞察と計算モデリングを結びつけることで、創造性を数字に還元するのではなく、アーティスト、研究者、AIシステムが有意義に協力するための共通の言語と解釈可能なツールを提供することを目的としています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:24:18 GMT)
Towards Understanding the Shape of Representations in Protein Language Models [0.0]
我々は,2乗根速度 (SRV) の表現とグラフ濾過によるタンパク質の構造と表現を同定する。我々は PLM が直接的および局所的な残基間の関係を優先的に符号化するが、より大きな文脈長に対して劣化し始めることを発見した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:06:24 GMT)
Towards Robust Surrogate Models: Benchmarking Machine Learning Approaches to Expediting Phase Field Simulations of Brittle Fracture [0.0]
フラクチャーモデリングのためのML手法のベンチマークと進歩を目的としたPFMシミュレーションに基づくデータセットを提案する。このデータセットには3つのエネルギー分解方法、2つの境界条件、合計6,000のシミュレーションのための1000のランダムな初期き裂構成が含まれている。本研究は, フラクチャーメカニクス研究における機械学習の進歩のためのテストベッドとして, このデータセットの有用性を実証するものである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:26:54 GMT)
The persistence of spin coherence in a crystalline environment [0.0]
分子結晶中の一重項励起子核分裂によって生成される三重項励起子対における量子干渉を解析した。我々は、期待される蛍光量子ビートを抑制できるキーエフェクトとして、トランスポート誘起デファスティング(TID)を導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:53:05 GMT)
The Physical Basis of Prediction: World Model Formation in Neural Organoids via an LLM-Generated Curriculum [0.0]
人間の神経オルガノイドを訓練するために設計された3つのスケーラブルでクローズドループ仮想環境のカリキュラムを提示する。意思決定を成功させるために、より高度な世界モデルを求める3つの異なるタスク環境の設計について詳述する。この研究は、モデルに基づく強化学習と計算神経科学のギャップを埋め、実施、意思決定、および知性の物理的基盤を研究するためのユニークなプラットフォームを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:40:17 GMT)
The Geometry of Cortical Computation: Manifold Disentanglement and Predictive Dynamics in VCNet [0.0]
本稿では,新しいニューラルネットワークアーキテクチャであるVisual Cortex Network(VCNet)を紹介する。 VCNetは、重要な生物学的メカニズムをエミュレートする幾何学的フレームワークである。我々は、VCNetがSpots-10で92.1%、光フィールドデータセットで74.4%の最先端の精度を達成したことを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:33:50 GMT)
TDHook: A Lightweight Framework for Interpretability [0.0]
ディープニューラルネットワーク(DNN)の解釈可能性 (Interpretability of Deep Neural Networks, DNN) は、視覚と言語モデルの研究による成長分野である。私たちは、$texttttensordict$をベースとしたオープンソースで軽量で汎用的な解釈可能性フレームワークであるTDHookを紹介します。コンピュータビジョン、自然言語処理、強化学習、その他のドメインのためにトレーニングできる複雑な構成モデルを扱うことに焦点を当てている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:28:43 GMT)
T-duality and bosonization as examples of continuum gauging and disentangling [0.0]
双対と双対変換は、量子多体物理学と量子場理論の様々な側面において確立された方法論を形成する。これらの概念を連続体に拡張し、場の理論や粒子物理学の連続体における双対変換を導出する方法として提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:38:09 GMT)
Symmetry resolved out-of-time-order correlators of Heisenberg spin chains using projected matrix product operators [0.0]
積分可能なハイゼンベルクスピンチェーンにおける情報スクランブルに対する相互作用の効果について検討する。我々の焦点は、一定数の粒子を持つセクターを対象とする、時間外順序相関器(OTOC)である。複数の粒子を持つすべてのセクターにおいて、OTOCは、局所作用素がランダムなユニタリ行列によって回転されたかのように振る舞う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:29:23 GMT)
Surjective Independence of Causal Influences for Local Bayesian Network Structures [0.0]
多くのドメインでは、利用可能なデータを専門家の判断で補うことが不可欠であることが多い。 ICI仮定を緩和する因果的影響(SICI)モデルの導入について述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:23:11 GMT)
Study of nuclear magnetic resonance spectra with the multi-model multi-level quantum complex exponential least squares algorithm [0.0]
本稿では,MM-QCELSアルゴリズムの新たな応用法を提案する。スピン力学の量子シミュレーションや複雑なカップリングトポロジーを持つ系における位相分解能の向上を実証した。この研究は、量子ベースの化学分析のための有望な新しいアプローチを提供する、実用的な分光学的応用による先進的な量子アルゴリズム設計を橋渡しする。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:10:26 GMT)
Strategies for generating separable photon triplets in waveguides and ring resonators [0.0]
自発3次パラメトリックダウンコンバージョンにより生じる光子三重項のスペクトル特性に関する理論的解析を行った。このような相関関係の定量化と最小化について論じる。我々は,最先端の実験システムを用いて,光子三重項の少数モード生成を実現することが可能であることが確認された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:01:48 GMT)
Spectra of generators of Markovian evolution in the thermodynamic limit: From non-Hermitian to full evolution via tridiagonal Laurent matrices [0.0]
無限直線上の単粒子、翻訳不変のリンドブラッド作用素の生成は、有限レンジ摂動を持つ有限レンジ双無限ローラン作用素の直積分と一意的に等価である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:48:43 GMT)
Sharpness-Aware Minimization with Z-Score Gradient Filtering [0.0]
シャープネス・アウェアの最小化は、高い曲率の方向に向かってパラメータを摂動することで一般化を改善する。本稿では,Zスコアに基づくフィルタを各層の勾配に適用するZスコアフィルタ型シャープネス認識最小化を提案する。提案手法はシャープネス・アウェア・最小化とその変種と比較してテスト精度を一貫して向上する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:46:24 GMT)
ScenarioBench: Trace-Grounded Compliance Evaluation for Text-to-SQL and RAG [0.0]
Scenarioは、コンプライアンスコンテキストにおけるText-to-retrieval-augmented生成を評価するための、ポリシーベースでトレース対応のベンチマークである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:51:08 GMT)
Scalable Boltzmann Generators for equilibrium sampling of large-scale materials [0.0]
本稿では,材料科学の応用に焦点をあてて,スケーラビリティのボトルネックに対処するボルツマンジェネレータアーキテクチャを提案する。我々は,局所的な環境情報に基づいて生成プロセスを構築するために,グラフニューラルネットワークと組み合わせた拡張結合流を利用する。従来のアーキテクチャと比較して、我々のモデルは大幅に高速に訓練し、計算資源をはるかに少なくし、より優れたサンプリング効率を実現する。我々は、レナード・ジョーンズ結晶、mW水の氷相、シリコンの相図など、いくつかの材料システムに適用することで、アプローチの可能性を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:40:54 GMT)
SafeFlowMatcher: Safe and Fast Planning using Flow Matching with Control Barrier Functions [0.0]
本稿では,フローマッチング(FM)と制御バリア関数(CBF)を結合して,リアルタイムの効率性と認証された安全性を実現するための計画フレームワークであるSafeFlowMatcherを提案する。結果のフローシステムに対する障壁証明を証明し、ロバストな安全な集合の前方不変性と、安全な集合への有限時間収束性を確立する。迷路ナビゲーションとベンチマーク全体で、SafeFlowMatcherは拡散とFMベースのベースラインよりも高速でスムーズで安全なパスを実現している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:33:33 GMT)
Safe Reinforcement Learning-Based Vibration Control: Overcoming Training Risks with LQR Guidance [0.0]
構造物の振動は、乗員の安全上の危険、構造物の損傷、メンテナンスコストの増大など、重大なリスクをもたらす。 LQR(Linear Quadratic Regulator)のような従来のモデルベースの制御戦略は、振動を効果的に緩和する。 LQRとRLの両方を統合したハイブリッド制御フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:10:20 GMT)
Responsible AI Adoption in the Public Sector: A Data-Centric Taxonomy of AI Adoption Challenges [0.0]
本研究では、政府におけるAI導入の責任を負うために、データ関連課題の分類法を開発する。 43の研究と21の専門的評価の体系的なレビューに基づいて、分類学は、技術的、組織的、環境的な側面において13の重要な課題を特定している。分類学は、機関の圧力に付加され、リスクの高いAIデプロイメントの「症状」を表面化する診断ツールとして機能する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:42:09 GMT)
Renormalization of Chern-Simons Wilson Loops via Flux Quantization in Cohomotopy [0.0]
2-コホモトピーにおける適切なフラックス量子化は、5D Maxwell-Chern-Simons QFTの非ラグランジアン位相的完備化を達成できることを示す。この結果は、トポロジカルに順序付けられた量子材料に応用された、控えめな従兄弟である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:17 GMT)
Reconstructing Quantum States and Expectations via Dynamical Tomography [0.0]
量子システムでは、トモグラフィー技術による状態再構成には、情報的に完備な可観測物の集合は必要ない。このアイデアは力学量子トモグラフィーにつながり、その実現可能性として一般量子力学を特徴付ける。このフレームワークはスピン鎖(散逸の有無にかかわらず)と電子核系への応用を図示する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:43:52 GMT)
Quenched properties of the Spectral Form Factor [0.0]
ヘミチアンおよび非ヘミチアンランダム行列に対する焼成SFFの特性を計算した。 log MathrmSFF$のゆらぎは深く、分割関数の0に近づくと1つの薄いスパイクになる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:26:51 GMT)
Quantum spacetime from constraints: wave equations and fields [0.0]
我々は、Page と Wootters の量子時間形式を、量子時計とロッドの両方を含むように拡張する。この枠組みから量子粒子を規定する標準波動方程式が自然に現れることを示す。この結果は、時空における量子力学は絡み合いや制約から生じる可能性があるという考え方をさらに支持する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:44:20 GMT)
Quantum process tomography of a compressed time evolution circuit on superconducting quantum processors [0.0]
我々は、IBM量子プロセッサのノイズチャネルを特徴付けるために、最先端の量子プロセストモグラフィー(QPT)技術を採用している。圧縮された回路は、より大きな固有値変調を系統的に生成し、より優れたノイズ耐性を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:51 GMT)
Quantum entanglement correlations in double quark PDFs [0.0]
量子情報理論の手法は、光円錐運動量分数に対する2クォーク密度行列に符号化された量子相関を精査するために用いられる。非摂動的な3つのクォークモデル光-コーン波動関数は、非対称および小さなクォーク運動量分数に対する「摂動負性」測定に関連する重要な非古典的相関を予測する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:16:07 GMT)
Quantum Approximate Optimization Algorithm: Performance on Simulators and Quantum Hardware [0.0]
量子コンピュータ上で量子回路を実行することは、シミュレーターとは異なり、必ずしも「クリーン」な結果を生成するとは限らない。本稿では、量子ノイズに対する反応を異なる方法で観測するために、異なる最適化方法、手法、エラー軽減方法、およびQAOA変種について検討する。他の研究者にとって、実際の量子ハードウェア上でQAOAを実行する複雑さとノイズに対処する際の課題を理解するのに役立つ。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:51:37 GMT)
Qualitative Research in an Era of AI: A Pragmatic Approach to Data Analysis, Workflow, and Computation [0.0]
コンピュータを使って質的なデータを分析するという古典的な議論に基づいて、私たちは長年の懸念を再考し、可能性と危険を評価する。本稿では, コンテンポラリーなエンゲージメントの様式, 合理化, プロジェクト拡大, ハイブリッド分析アプローチ, 計算社会学を紹介する。我々は、技術的楽観主義と拒絶という二元論を超越した実践的な社会学的アプローチを論じる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:59:15 GMT)
Putnam-like dataset summary: LLMs as mathematical competition contestants [0.0]
このデータセットは、パットナム・コンペティションの精神における96の元の問題と、LLMの576の解からなる。我々は,この問題の集合上でのモデルの性能を分析し,数学的なコンテストから問題を解く能力を検証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:13:10 GMT)
Predicting Oscar-Nominated Screenplays with Sentence Embeddings [0.0]
本研究は,現代言語モデルを用いて,脚本のオスカーノミネートを予測できるかどうかを考察する。適切なデータセットが得られなかったため、MovieSumの映画脚本コレクションとキュレートされたオスカーレコードを組み合わせることで、Movie-O-Labelと呼ばれる新しいデータセットが作成された。ベストパフォーマンスモデルはマクロF1スコア0.66、正確リコールAP0.445、ROC-AUC0.79に達した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:25:02 GMT)
Physics-Informed Inductive Biases for Voltage Prediction in Distribution Grids [0.0]
モデルの性能向上における帰納バイアスの役割を系統的に検討する。具体的には, (i) パワーフロー制約損失関数, (ii) 複素数値ニューラルネットワーク, (iii) 残差に基づくタスク再構成の3つの物理インフォームド戦略を評価する。本研究は,現代の配電網における信頼性と効率のよい電圧予測のための学習を,モデル仮定が最も効果的に導くための実践的洞察を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:56:53 GMT)
Phonon thermal Hall as a lattice Aharonov-Bohm effect [0.0]
磁場は絶縁体内の熱流束と熱勾配ベクトルのずれを誘導する。各種絶縁体における熱ホール角は境界を超えない。ボルン=オッペンハイマー近似分子波関数は磁場の存在下で位相を得ることが知られている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:58:52 GMT)
Optimisation of Resource Allocation in Heterogeneous Wireless Networks Using Deep Reinforcement Learning [0.0]
異種無線ネットワーク(HetNets)における動的リソース割り当ては,ユーザ負荷やチャネル条件の異なる従来の手法では困難である。本稿では,伝送電力,帯域幅,スケジューリングを多目的報酬分散スループット,エネルギー効率,公平性を通じて協調的に最適化する深層強化学習フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:48:00 GMT)
Optimal Threshold Signatures in Bitcoin [0.0]
私たちは、Bitcoinのような暗号通貨のプロトコルで可能なように、しきい値署名スキームの設計を定式化します。悪意のある攻撃者が何らかの確率でシグネチャを取得することができることを知って、ユーザはこのスキームを設計する。署名のセキュリティやユーザビリティの向上といった介入によって、より高いしきい値が得られます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:04:19 GMT)
Operator algebra of the information-disturbance tradeoff in quantum measurements [0.0]
本研究では,情報ゲインを最小外乱で記述した演算子を,実験的に識別可能な外乱パターンを表すユニタリ演算子群に拡張可能であることを示す。外乱の観測可能な統計は、測定の情報ゲインの厳密な上限を定義する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:51:28 GMT)
On the Effect of Instability on Learning Continuous-Time Linear Control Systems [0.0]
有限長状態軌跡に基づく連続時間力学におけるシステム同定の問題について検討する。適切なランダム化制御入力を用いて不安定なオープンループ行列を推定する手法を提案する。我々は,推定誤差が軌道長,励起率,信号対雑音比で減衰することを示す理論的性能保証を確立する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:30:38 GMT)
Notes on the type classification of von Neumann algebras [0.0]
これらのノートはフォン・ノイマン代数の型分類の説明を与える。目標は、専門家でない読者には技術的すぎるリソース間の文学のギャップを埋めることです。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:37:47 GMT)
Nonrelativistic quantum dynamics in a twisted screw spacetime [0.0]
2つの独立なツイスト制御を持つスクリュー型時空におけるスピンレス粒子の非相対論的量子力学について検討する。我々は、アジムタールおよび軸流の連続性方程式と閉式を導出する。数値的には、有限差分 Sturm-Liouville ソルバ(軸とランガー変換の近くにコアを持つ)はスペクトル、波動関数、電流を解く。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:43:34 GMT)
Non-positive measurements aren't beneficial in quantum metrology for unitary encoding, but can be for open schemes [0.0]
量子気象学において,非正の演算子値測定が有用かどうかを検討する。ユニタリ符号化では、非正の測定値が正の測定値よりも有利であることを示す。任意のオープンシステム符号化に対して、正の測定値が最適精度を達成するのに十分であるような条件を同定する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:49:28 GMT)
Non-destructive optical read-out and manipulation of circular Rydberg atoms [0.0]
円状のリドベルク原子は、リドベルク状態の典型的な強い双極子-双極子相互作用を長い寿命で結合する。低角モードレーザーアクセス可能なライドバーグ準位は、これまでほとんど使われてきた。我々は、ルビジウムの論理レーザーをトラップした環状リドベリ原子の配列と、Rbアンシラ原子の補助配列を、ロー・ドル・リドベリ準位に過渡的に励起する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:26:47 GMT)
Non-Gaussian Quantum State Engineering with Postselected von Neumann Measurements [0.0]
我々は,非ガウス状態(nG)をポストセレクトされたフォン・ノイマン測定により生成するための実現可能なプロトコルを提案する。ウィグナー関数による非ガウス性の特徴付けと線形エントロピーと共起を用いた絡み合いの定量化を行う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:08:06 GMT)
Non-Expansive Mappings in Two-Time-Scale Stochastic Approximation: Finite-Time Analysis [0.0]
2時間スケール近似アルゴリズムは、最適化、強化学習、制御などのアプリケーションで使用される。我々は、より高速な時間スケールが、より遅い時間スケールで非拡張性をもたらすプロジェクションステップを持つ変種について研究する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:07:26 GMT)
Noise mitigation in quantum enhanced fiber optic gyroscopes [0.0]
我々は、量子FOG相の不確実性、非相関光子飽和の主源の1つに焦点を当てる。我々は、この不確実性を最小化し、サブショットノイズ精度を許容する位相バイアス角の最適範囲を特徴付ける。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:56:57 GMT)
No-Signaling in Steepest Entropy Ascent: A Nonlinear Non-local Non-equilibrium Quantum Dynamics of Composite Systems [0.0]
リンドブレディアン形式主義は「ボトムアップ」アプローチを用いて開量子系をモデル化し、システム-環境相互作用から線形力学を導出する。本稿では,システム構造,サブシステム間の相互作用,環境影響に着目した「トップダウン」アプローチを提案する。第二法則の要件(ギブス状態が唯一の安定均衡である)を組み込むことは、非線形力学を必要とすることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:42:39 GMT)
Neuroplasticity-inspired dynamic ANNs for multi-task demand forecasting [0.0]
本稿では、ニューロプラスティック・マルチタスクネットワーク(NMT-Net)と呼ばれるマルチタスク需要予測のための動的ニューラルネットワーク(D-ANN)の新しいアプローチを提案する。提案手法は, 生体系にみられる神経可塑性にインスパイアされた, トレーニング中の計算グラフの構造適応性を実現する。 NMT-Netは、時系列予測におけるマルチタスクおよび連続学習のためのスケーラブルで適応可能なソリューションを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:08:08 GMT)
Multimodal Arabic Captioning with Interpretable Visual Concept Integration [0.0]
VLCAPは、CLIPベースのビジュアルラベル検索とマルチモーダルテキスト生成を統合したアラビア画像キャプションフレームワークである。ハイブリッド語彙は、トレーニングキャプションから構築され、Visual Genomeデータセットから翻訳された約21Kの一般ドメインラベルで強化されている。第2段階では、キャプション生成のためにQwen-VLとGemini Pro Visionをテストし、6つのエンコーダデコーダ構成を得た。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:52:38 GMT)
Multi-user QKD using quotient graph states derived from continuous-variable dual-rail cluster states [0.0]
マルチパーティの絡み合った状態は、マルチユーザ量子暗号タスクの基本的なリソースである。本稿では,CVデュアルレールクラスタ状態を用いて3つのユーザ会議鍵を生成する新しいプロトコルを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 03:36:04 GMT)
Multi-patch isogeometric neural solver for partial differential equations on computer-aided design domains [0.0]
この研究は、物理インフォームドニューラルネットワークとマルチパッチアイソジオメトリ分析を組み合わせた計算フレームワークを開発する。アイソ幾何学解析の参照領域で動作するパッチローカルニューラルネットワークを利用する。提案手法の有効性を2つの非自明で実用的なユースケースで実証した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:57:54 GMT)
Multi-Task Equation Discovery [0.0]
複数のデータセットにまたがる同時パラメータ識別にはマルチタスク学習フレームワークを用いる。 MTL-RVMはタスク間での情報を組み合わせて、弱い、中程度の興奮したデータセットのパラメータリカバリを改善した。これらの結果は,マルチタスクベイズ推論が過剰適合を緩和し,方程式発見の一般化を促進することを示唆している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:56:40 GMT)
Moravec's Paradox and Restrepo's Model: Limits of AGI Automation in Growth [0.0]
このノートは、モラベックのパラドックスを取り入れることで、レストレポ(2025年)のAGIによる経済成長モデルを拡張している。タスクスペースを認知的および物理的コンポーネントに分割し、いくつかの物理的ボトルネックに対して無限のコストを許容する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:45:00 GMT)
Momentum-resolved two-dimensional spectroscopy as a probe of nonlinear quantum field dynamics [0.0]
創発的な集合励起は相互作用する量子多体系の目印となる。 2次元分光法(2DS)の非線形探査能力と超低温原子系の空間分解能を組み合わせることにより、これらの制限を克服することを提案する。弱結合1次元ボース・アインシュタイン凝縮体の低エネルギーダイナミクスを記述する量子sine-Gordonモデルの運動量分解2DSを解析した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:52:48 GMT)
Modeling amortization systems with vector spaces [0.0]
ベクトル空間に基づく量子力学の定式化を導入する。オペレータは、負債、償却、利子、定期的な支払いのために定義される。借り手2人が全返済額を変更せずに支払スケジュールを関連付けることができるローンの絡み合いを導入する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:19:32 GMT)
MetaChest: Generalized few-shot learning of patologies from chest X-rays [0.0]
少数のラベル付き例から新しいクラスを識別することを目的とした学習手法はほとんどない。胸部X線から病理学の分類のような医学的応用は、しばしば、以前に知られていた知識を同時に活用しながら、新しいクラスを学ぶ必要がある。 4つの公開データベースから収集した479,215個の胸部X線の大規模データセットであるMetaChestを提示する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:27:44 GMT)
Meta-Learning Theory-Informed Inductive Biases using Deep Kernel Gaussian Processes [0.0]
本稿では,正規理論からの生関数予測を抽出可能な確率モデルに自動変換するベイズメタラーニングフレームワークを提案する。この研究は、理論知識をデータ駆動科学調査に統合するための、より一般的でスケーラブルで自動化されたアプローチを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:23:50 GMT)
Mapping Quantum Threats: An Engineering Inventory of Cryptographic Dependencies [0.0]
Shor'sやGrover'sのようなアルゴリズムを駆使した大規模量子コンピュータの出現は、現代の公開鍵暗号に現実的な脅威をもたらす。本稿では, 工学的観点から, 量子脅威にさらされる技術の体系的な在庫について述べる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:30:17 GMT)
Managing Differentiated Secure Connectivity using Intents [0.0]
我々は,セキュリティレベルを区別し,管理フレームワークとしての意図を活用するという概念を提案する。本研究の目的は,セキュリティの自動化,適応性の向上,次世代モバイルネットワークのレジリエンスとセキュリティ姿勢の強化である。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:08:23 GMT)
Magnetometry with Broadband Microwave Fields in Nitrogen-Vacancy Centers in Diamond [0.0]
ダイヤモンド中の窒素空孔(NV)中心は光学的に対応可能で、多用途の光物質界面である。広帯域マイクロ波場を用いた全磁気感度状態の同時探索手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:18:00 GMT)
Magnetic moments in the Poynting theorem, Maxwell equations, Dirac equation, and QED [0.0]
電気力学のどちらのバージョンにも磁気モーメント効果がどのように含まれているかを示す。主な焦点は磁気双極子相互作用であり、磁気単極子相互作用は考慮されていない。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:04:09 GMT)
Machines Do See Color: A Guideline to Classify Different Forms of Racist Discourse in Large Corpora [0.0]
テキストで人種差別的言語を識別し分類する現在の手法は、人種差別的言説の過度な形式にのみ焦点をあてる小さなnの質的アプローチや大規模nのアプローチに依存している。本稿では、大規模コーパスにおける異なる形態の人種差別的言説を識別し分類するためのステップバイステップの一般化可能なガイドラインを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:39:22 GMT)
Machine Learning - Driven Materials Discovery: Unlocking Next-Generation Functional Materials - A review [0.0]
機械学習(ML)によるアプローチは、材料発見、プロパティ予測、マテリアルデザインに革命をもたらしている。このレビューでは、材料の機械的、熱的、電気的、光学的特性を予測するML駆動方式の現実的な応用を強調した。データ品質、解釈可能性、AutoMLと量子コンピューティングの統合など、重要な課題にも対処しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:58:22 GMT)
Localized degenerate solutions to the massless Dirac and Weyl equations [0.0]
質量のないディラック方程式とワイル方程式の退化解のクラスを示す。運動方向に沿って1つまたは複数の異なる位置で局在粒子を記述することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:26:28 GMT)
Legal Matters in Research Software: A Few Things Worth Discussing [0.0]
本稿では,研究ソフトウェアの開発に関連する法的側面と,それを扱うための研究ソフトウェア技術者による実践的アプローチについて論じる。この議論は、研究ソフトウェアの著作権保持者の識別における曖昧性、責任をめぐる不確実性について論じ、研究機関が提供する法的事項に対する様々な支持レベルについて言及する。このコントリビューションの目的は、ソフトウェア開発に関する法的な事項をよりよく理解することが、研究ソフトウェアに科学的進歩の原動力として価値のある適切な価値を与えるための資産である、と指摘することである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:56:16 GMT)
KIRETT - A wearable device to support rescue operations using artificial intelligence to improve first aid [0.0]
KIRETTプロジェクトは、ウェアラブルデバイスを使用した救助活動における最初の支援を改善することを目的としている。このウェアラブルは、人工知能を用いてコンピュータ支援された状況認識に使用される。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:36:14 GMT)
KAQG: A Knowledge-Graph-Enhanced RAG for Difficulty-Controlled Question Generation [0.0]
本研究は知識強化質問生成(KAQG)を紹介する。項目応答理論(IRT)、ブルームの分類学、知識グラフをマルチエージェント検索拡張生成システムに統合する。提案手法は, 項目難易度, 心理測定校正, 認知アライメントのきめ細かい制御を可能にすることによって, 既存の手法の限界を克服する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:01:11 GMT)
Investigation Of The Distinguishability Of Giraud-Verneuil Atomic Blocks [0.0]
我々は、NIST EC P-256曲線上で、右から左へのkPアルゴリズムを用いて、kP に対する Giraud と Verneuil の原子パターンを解析した。我々は、Lecroy WavePro 604HD Oscilloscope、Langer ICS 105 Integrated Circuit Scanner、Langer MFA-R 0.2-75 Near Field Probeを用いて、kP中の電磁放射を測定する。結果として、アトミックパターンはダミー操作で正しく実装されているものの、SCAに対する抵抗は、ハードウェアやソフトウェアレベルで挿入された追加プロセスによっても影響を受けます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:20:16 GMT)
Intelligent 5S Audit: Application of Artificial Intelligence for Continuous Improvement in the Automotive Industry [0.0]
本研究は,大規模言語モデル(LLM)に基づく自動5S監査システムを開発した。インテリジェントな画像解析によって5つの感覚を標準化された方法で評価することができる。提案手法は自動車製造環境の継続的な改善に大きく貢献する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:28:14 GMT)
Information geometry and entanglement under phase-space deformation through nonsymplectic congruence transformation [0.0]
量子状態の幾何学はFisher-Rao (FR) 情報行列を通して考えることができる。本研究では,このアイソメトリーが二部体系の絡み合いに与える影響について検討する。合同変換の単純な選択でさえも、2部ガウス系における絡み合いを誘導することが判明した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:47:16 GMT)
Information Loss and Cost in Symmetry Breaking [0.0]
2つの空間次元における対称性の破れを特徴付ける情報理論の枠組みを開発する。この観点は自然に、トポロジカルな物質の相における任意の凝縮の記述と結びついている。我々の結果は、一般化対称性の研究において、作用素代数、テンソル圏論、および量子情報の間の新たな接続を創出する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:34:31 GMT)
Inferring Cosmological Parameters with Evidential Physics-Informed Neural Networks [0.0]
我々は、最近の超新星とバリオン音響振動(BAO)データセットから宇宙パラメータを予測するために、物理情報ニューラルネットワークの新たな変種を用いている。我々の機械学習フレームワークは、対象変数の不確実性推定と、基礎となるPDE記述の未知パラメータを推定する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:25:53 GMT)
Identifying Information-Transfer Nodes in a Recurrent Neural Network Reveals Dynamic Representations [0.0]
本研究では,RNN内の情報伝達ノードを識別・解析する革新的な情報理論手法を提案する。ノード間の入力ベクトルと出力ベクトルの相互情報を定量化することにより、我々のアプローチは、ネットワーク操作中に情報が流れる重要な経路を特定できる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:24:42 GMT)
Hybrid Approach for Enhancing Lesion Segmentation in Fundus Images [0.0]
脈絡膜壊死は良性色素性眼の病変であり、メラノーマに転移するリスクは少ない。早期発見は生存率を改善するために重要であるが、誤診や診断の遅れは予後不良につながる可能性がある。本稿では,数理/クラスタリングセグメンテーションモデルとU-Netの知見を組み合わせた新しいアプローチを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 22:10:56 GMT)
How Hungry is AI? Benchmarking Energy, Water, and Carbon Footprint of LLM Inference [0.0]
本稿では,商用データセンタにデプロイされる30の最先端モデルを対象とした,AI推論の環境フットプリントを定量化する,新たなインフラストラクチャ対応ベンチマークフレームワークを提案する。以上の結果から,O3とDeepSeek-R1が最もエネルギー集約的なモデルとして出現し,GPT-4.1ナノの70倍以上のGPT-4.1ナノを消費し,Claude-3.7 Sonnetはエコ効率で最高であることがわかった。 AIは安価で速くなっているが、そのグローバルな採用はリソース消費を不均等にしている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:45:18 GMT)
Hound: Relation-First Knowledge Graphs for Complex-System Reasoning in Security Audits [0.0]
Houndは、複雑なコンポーネント間のシステムレベルの推論を改善するリレーショナルファーストグラフエンジンである。 2つめのコントリビューションは、永続的な信念システムである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 02:46:02 GMT)
Hierarchy of timescales in a disordered spin-$1/2$ XX ladder [0.0]
我々は、その拡散力学で知られている実験的に実現可能なモデルである、歪んだスピン-1/2$ XXはしごについて検討する。他の非可積分モデルとは異なり、スピン拡散はエネルギー拡散よりも速く進行する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:18:23 GMT)
Hierarchical Task Environments as the Next Frontier for Embodied World Models in Robot Soccer [0.0]
本稿では, 環境の忠実度やサイズを増大させるだけでなく, 構造的複雑さを明示的な階層的足場に拡張する。明示的で構成可能なタスク層を持つ環境を構築することで、エージェント探索をより効率的に導き、有意義な学習信号を生成し、究極的には、純粋にエンドツーエンドアプローチよりも少ないリソースで、より有能で汎用的なエージェントを訓練することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:38:05 GMT)
Heisenberg Scaling in a Continuous-Wave Interferometer [0.0]
連続波干渉計(Continuous-wave Interferometry, CW)は、その誕生以来、精密測定科学の最前線に立っている。 We demonstrate the first CW interferometer exhibiting resources efficiency approaching Heisenberg scaling。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:34:57 GMT)
Fundamental speed limits on entanglement dynamics of bipartite quantum systems [0.0]
エンタングルメントの相対エントロピーとトレース距離エンタングルメントを用いて,エンタングルメントの速度制限を導出する。任意の量子力学により一定量の絡み合いを発生または分解するのに要する時間で、より低い境界を求める。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 23:33:44 GMT)
From Sound to Setting: AI-Based Equalizer Parameter Prediction for Piano Tone Replication [0.0]
本研究は,音声機能から直接EQパラメータ設定を予測することに焦点を当てた,音楽制作におけるトーン再現のためのAIベースのシステムを提案する。従来のオーディオ・オーディオ法とは異なり、我々の手法は、ミュージシャンがワークフローでさらに調整できる解釈可能なパラメータ値を出力する。このシステムは、音楽プロデューサーのための実用的で柔軟で自動化されたトーンマッチングを可能にし、より複雑なオーディオ効果への拡張の基礎を築き上げている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:50:28 GMT)
Finite-Size Security Bounds in Semi-Quantum Key Distribution: Spectral, Operator-Theoretic, and Entropic Perspectives [0.0]
有限サイズセキュリティ境界に着目したセミ量子鍵分布(SQKD)を3つの相補的観点から検討する。この説明は、物理的に解釈可能なフィギュアによって支持されるステップバイステップの導出を提供し、フレームワークは有限サイズ推定で結論付ける。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:20:37 GMT)
Feedback Control for Small Budget Pacing [0.0]
予算削減はオンライン広告において、ダイナミックオークションのキャンペーン目標に費用を合わせるために重要である。本研究では,バケット化と比例フィードバックを組み合わせることで,安定かつ適応的な消費制御を実現する原理的制御器を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:38:34 GMT)
Federated Learning Meets LLMs: Feature Extraction From Heterogeneous Clients [0.0]
フェデレートラーニング(FL)は、生データを共有せずに協調的なモデルトレーニングを可能にする。我々は,事前学習された大規模言語モデル(LLM)を普遍的特徴抽出器として利用するフレームワークであるFedLLM-Alignを提案する。冠動脈疾患予測におけるFedLLM-Alignの評価は,シミュレートされたスキーマ分岐を用いた分割データセットを用いて行われる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:06:52 GMT)
Feature Space Analysis by Guided Diffusion Model [0.0]
Deep Neural Networks(DNN)の重要な問題のひとつは、内部的特徴抽出プロセスのブラックボックスの性質にある。本稿では,ユーザが指定した特徴と密に一致した特徴を保証した画像を生成するデコーダを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:47:25 GMT)
Fast Real-Time Pipeline for Robust Arm Gesture Recognition [0.0]
本稿では,OpenPoseキーポイント推定に基づく動的アームジェスチャー認識のためのリアルタイムパイプラインを提案する。カスタムな交通制御ジェスチャーデータセットの実験は、様々な視角と速度で高い精度を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:57:56 GMT)
Experimental demonstration of boson sampling as a hardware accelerator for monte carlo integration [0.0]
本稿では,モンテカルロ統合のためのハードウェアアクセラレータとしてボソンサンプリング実験を行った。我々は,3ボソン系の一階エネルギー補正を計算するために,プログラマブルフォトニックプラットフォーム上でのプリンシプル実験を実装した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:59:34 GMT)
Experience Deploying Containerized GenAI Services at an HPC Center [0.0]
Generative Artificial Intelligence(GenAI)アプリケーションは、推論サーバ、オブジェクトストレージ、ベクトルおよびグラフデータベース、ユーザインターフェースなど、特殊なコンポーネントで構成されている。コンテナ化されたGenAIワークロードを実行するHPCとプラットフォームを統合した収束コンピューティングアーキテクチャについて説明する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 01:14:19 GMT)
Evaluation of Machine and Deep Learning Techniques for Cyclone Trajectory Regression and Status Classification by Time Series Data [0.0]
従来の数値天気予報モデルは、計算集約的であり、大気系のカオス的な性質のためにエラーを起こしやすい。本研究では,全国ハリケーンセンターの時系列データを用いて,熱帯性サイクロン軌道の予測と状況に対する機械学習(ML)アプローチを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:51:07 GMT)
Evaluating undergraduate mathematics examinations in the era of generative AI: a curriculum-level case study [0.0]
我々はRussell Group大学の8つの学部数学試験に、GenAIを作成した。 GenAIの到達度は1級のレベルですが、現在のパフォーマンスはモジュールによって異なります。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:08:08 GMT)
Evaluating Relayed and Switched Quantum Key Distribution (QKD) Network Architectures [0.0]
ネットワークワイド量子鍵分布(QKD)のための2つのアーキテクチャの性能評価を行った。 Relayed QKDは非隣接ノードのマルチリンクQKDパス上のキーを中継するが、Switched QKDは任意のQKDモジュールを動的に接続するために光スイッチを使用する。異なるリングサイズ、QKDリンク損失、QKD受信機の感度および未整合モジュールの性能ペナルティのネットワーク性能を比較した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:24:24 GMT)
Error detection without post-selection in adaptive quantum circuits [0.0]
オープン量子システムのシミュレーションがエラー検出の恩恵を受けるかを示す。我々はQuantinuumのH2量子コンピュータを用いて非平衡相転移の論理シミュレーションを行う。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:03 GMT)
Enhancing work-extraction in quantum batteries via correlated reservoirs [0.0]
局所的および空間的に相関した貯水池は、量子電池の作業抽出に影響を及ぼす。量子電池の性能向上を支える重要なリソースとしてのコヒーレンス。さらに、電池の力学が長距離相互作用を持つ実効ハミルトニアンによって支配されるとき、短距離相互作用よりも高いエルゴトロピーが得られることを明らかにした。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:39:49 GMT)
Energy additivity as a requirement for universal quantum thermodynamical frameworks [0.0]
内部エネルギーは、宇宙の閉系エネルギーとの整合性を維持するために環境を考慮に入れなければならない。内部エネルギーは加法的でも保守的でもないことが示され、非物理的特徴に繋がる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:49:22 GMT)
Enabling Physical AI through Biological Principles [0.0]
人工システムの能力を多様化するためには、さらなる生物学的インスピレーションが必要であると我々は主張する。我々は、AIハードウェアとソフトウェアを活用できるNIにインスパイアされたメカニズムの分野を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:38:06 GMT)
Empirical Analysis Of Heuristic and Approximation Algorithms for the The Mutual-Visibility Problem [0.0]
本稿では,3つの異なるアルゴリズム – 直接ランダムな振る舞い,ハイパーグラフに基づく近似,遺伝的アルゴリズム – を実装し,評価する。以上の結果から,より小さなグラフに対して,アルゴリズムは理論的境界に整合したMV集合のサイズを一貫して達成することを示した。既知の最適グラフの検証では、遺伝的アルゴリズムと他のアルゴリズムが試験方法の中で最高の性能を示した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:41:24 GMT)
Eigenstate thermalization to non-monotonic distributions in strongly-interacting chaotic lattice gases [0.0]
非単調平衡エネルギー分布はフェルミ・ディラックやボース・アインシュタイン形式と質的に異なる。この効果は有限エネルギースペクトルを持つ系で現れ、正および負の温度の両方を支えている。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:47:42 GMT)
Efficient CNN Compression via Multi-method Low Rank Factorization and Feature Map Similarity [0.0]
低ランク因子化(LRF)はディープニューラルネットワーク(DNN)の圧縮技術として広く採用されている。最適なランク選択、広大な設計空間、長い微調整時間、異なるレイヤタイプや分解方法との互換性の制限など、いくつかの課題に直面している。本稿では,CNNの圧縮のためのエンドツーエンド設計空間探索手法とフレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:44:02 GMT)
Effectiveness of Large Language Models in Simulating Regional Psychological Structures: An Empirical Examination of Personality and Subjective Well-being [0.0]
本研究では, LLMが人口統計情報に基づいて, 文化的根拠を持つ心理的パターンをシミュレートできるかどうかを検討する。模擬参加者は、外転や開放性が低下し、同意性や神経症が向上し、常に幸福度が低下した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:12:18 GMT)
Effective 2D Envelope Function Theory for Silicon Quantum Dots [0.0]
本稿では、シリコン中の量子ドットの3次元(3次元)記述を、電子スピン量子ビットに対する効果的な2次元(2次元)エンベロープ関数理論に還元する厳密な方法を提案する。本手法の精度を3次元シミュレーションとの比較により検証し,本手法の2次元スライシングよりも優れていることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 13:13:30 GMT)
EOE: Evolutionary Optimization of Experts for Training Language Models [0.0]
本稿では,大規模言語モデル(LLM)の学習のための進化的枠組みを提案する。実験では、最高の専門家がフルモデルとほぼ同じ精度で達成できることが示されている。各ステップでトレーニングされる専門家は1人なので、トレーニングはメモリをはるかに少なくし、スループットもはるかに高くなります。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:18:26 GMT)
Double Descent as a Lens for Sample Efficiency in Autoregressive vs. Discrete Diffusion Models [0.0]
本研究では, 離散拡散モデルと自己回帰モデルのサンプル効率を比例的に比較するために, 二重降下現象を用いる。この結果から, 離散拡散モデルでは十分な容量と計算能力が与えられた場合にのみ, 自己回帰モデルの方がサンプル効率が高いことが示唆された。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:03:12 GMT)
Domain-Robust Marine Plastic Detection Using Vision Models [0.0]
本研究では、ドメイン間の堅牢性、畳み込みニューラルネットワークのトレーニング、ビジョントランスフォーマーのモデルをベンチマークする。 CLIP ViT-L14とGoogleのGemini 2.0 Flashの2つのゼロショットモデルが評価された。結果は、軽量のMobileNetV2が、より大きなモデルを上回る最強のクロスドメインパフォーマンス(F1 0.97)を提供することを示している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:15:07 GMT)
Distillation of multipartite entangled states for arbitrary subsets of parties in noisy quantum networks of increasing size [0.0]
量子ネットワーク状態(quantum network state)は、パーティ間でペアの絡み合いを分散することによって構築される多部状態である。本研究では,雑音量子ネットワークにおける部分蒸留可能性の問題を紹介する。ネットワーク内の接続性を測定するグラフ理論パラメータが,そのサイズで十分に高速に成長すれば,部分蒸留が実現可能であることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:44:40 GMT)
Diffusion models for multivariate subsurface generation and efficient probabilistic inversion [0.0]
拡散モデルは、深い生成モデリングタスクのための安定したトレーニングと最先端のパフォーマンスを提供する。本稿では拡散モデルに固有のノイズ汚染を考慮した近似法を提案する。統計的ロバスト性は有意に向上し, 後部確率密度関数のサンプリングが向上した。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:12:42 GMT)
DeepFake Detection in Dyadic Video Calls using Point of Gaze Tracking [0.0]
悪意ある俳優は、ビデオ会議中にリアルタイムフィッシング攻撃を行うためにディープフェイク技術を使い始めた。本稿では,これまで利用できなかった生体情報を利用して,このジャンルの攻撃に適応したリアルタイムディープフェイク検出手法を提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:59:31 GMT)
Deep Reinforcement Learning in Action: Real-Time Control of Vortex-Induced Vibrations [0.0]
本研究では,回転アクチュエータを用いた高レイノルズ数(Re = 3000)の円柱内渦誘起振動(VIV)のアクティブフロー制御(AFC)のための深部強化学習(DRL)の実験的展開を示す。実世界の実験におけるDRLの適応性と,アクチュエーションラグなどの機器的限界を克服する能力を示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:09:16 GMT)
DINOReg: Strong Point Cloud Registration with Vision Foundation Model [0.0]
ポイントクラウドの登録は、3Dコンピュータビジョンにおける基本的なタスクである。近年の研究では、RGB-Dデータから色情報を特徴抽出に取り入れている。視覚情報と幾何学情報の両方を十分に活用する登録ネットワークであるDINORegを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 07:15:47 GMT)
Crowdsourcing Without People: Modelling Clustering Algorithms as Experts [0.0]
mixsembleは、複数のモデルベースのクラスタリングアルゴリズムから予測を集約するために、Dawid-Skeneモデルを適用するアンサンブル手法である。人間のラベルに依存する従来のクラウドソーシングとは異なり、このフレームワークはクラスタリングアルゴリズムの出力をノイズの多いアノテーションとしてモデル化する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:52:37 GMT)
Convolutional Neural Nets vs Vision Transformers: A SpaceNet Case Study with Balanced vs Imbalanced Regimes [0.0]
本研究では,SpaceNet上の畳み込みニューラルネットワーク (EfficientNet-B0) とビジョントランスフォーマー (ViT-Base) を比較した。精度、マクロF1、バランスの取れた精度、クラスごとのリコール、デプロイメントメトリクスを報告します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 21:41:22 GMT)
Contrastive Learning for Correlating Network Incidents [0.0]
本稿では,ネットワーク状況の類似性に基づく自己教師付き学習手法を提案する。実世界のネットワークモニタリングデータの実験で達成された高精度の精度は、コントラスト学習がネットワークインシデント相関に対する有望なアプローチであることを示唆している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:29:01 GMT)
Complexity of Einstein-Maxwell-non-minimal coupling $R^2F^2$: the role of the penalty factor [0.0]
我々は、AdS時空において、非最小結合の第1次まで摂動性ブラックブレーン解を導入する。このモデルは温度に比例した比抵抗を示すため、奇妙な金属を記述することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:58:08 GMT)
Communicating Plans, Not Percepts: Scalable Multi-Agent Coordination with Embodied World Models [0.0]
MARL(Multi-Agent Reinforcement Learning)の中心的な疑問は、通信プロトコルを設計するか、エンドツーエンドで学習するかである。本稿では,協調的なタスク割り当て問題に対する2つのコミュニケーション戦略を提案し,比較する。我々の実験によると、創発的コミュニケーションは単純な設定で実現可能であるが、設計された世界モデルベースのアプローチは、複雑さが増大するにつれて、優れたパフォーマンス、サンプル効率、スケーラビリティを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:36:28 GMT)
Coherence-Assisted Entanglement Activation During Open Evolution [0.0]
そこで本研究では,システム環境の絡み合いの生成について,純粋に強調された相互作用として知られる,広範かつ重要な相互作用のクラスで検討する。我々の結果は、オープン進化の間に生じる複雑な相関関係をよりよく理解し、定量化するのに役立ちます。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:52:51 GMT)
Co-Evolving Complexity: An Adversarial Framework for Automatic MARL Curricula [0.0]
汎用知的エージェントは、それらが訓練される環境に本質的に関連している。手作りの環境は有限であり、しばしば暗黙のバイアスを含むため、エージェントが真に一般化可能で堅牢なスキルを開発する可能性を制限する。本稿では,環境生成過程を対戦ゲームとしてフレーミングすることで,無拘束かつ適応的な課題のカリキュラムを生成するパラダイムを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:41:53 GMT)
Chaos in a Nonlinear Wavefunction Model: An Alternative to Born's Probability Hypothesis [0.0]
この基準を解析的に検討し, 小型(3キュービット)モデルからシミュレートする。私はまた、不安定性の基準を連続体内のモデルに拡張します。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 19:47:54 GMT)
Certifying quantum enhancements in thermal machines beyond the Thermodynamic Uncertainty Relation [0.0]
定常量子熱機械と,同じ熱力学資源を用いた古典機械を比較した。機械の摂動によって引き起こされるコヒーレンスの存在は、穏やかな条件下で真の熱力学的優位性を保証する。一方、ノイズによるコヒーレンスを受けるエンジンは、全く同じ(非コヒーレントな)リソースセットを使用して古典的なエンジンよりも性能が高い。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:29:50 GMT)
Casimir effect in magnetic dual chiral density waves [0.0]
磁場下での有限密度物質中のディラック場に由来するカシミール効果を理論的に検討する。特に、磁気二重カイラル密度波(MDCDW)相におけるクォーク場を相互作用するディラック・フェルミオン系の不均一基底状態として重視する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 15:41:17 GMT)
CORE-3D: Context-aware Open-vocabulary Retrieval by Embeddings in 3D [0.0]
3Dシーンの理解は、AIとロボティクスの具体化の基礎であり、インタラクションとナビゲーションの信頼性をサポートする。近年のアプローチでは、視覚言語モデル(VLM)により生成された2次元クラス非依存マスクに埋め込みベクトルを割り当てることで、ゼロショットでオープンな3Dセマンティックマッピングを実現している。プログレッシブな粒度改善を施したセマンティックSAMを用いて、より正確で多数のオブジェクトレベルのマスクを生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:43:00 GMT)
CLASP: Adaptive Spectral Clustering for Unsupervised Per-Image Segmentation [0.0]
CLASPは教師なしのイメージセグメンテーションのための軽量なフレームワークである。ラベル付きデータや微調整なしで動作します。 CLASPはCOCO StuffとADE20Kで競合するmIoUとピクセル精度を得る。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:41:30 GMT)
Broadband Magnetless Isolator using Adiabatic Flux Modulation [0.0]
従来のフェライト系アイソレータはかさばるし、損失があり、強磁場に依存している。我々は、これらの制限を、最先端技術に匹敵するシミュレーション性能で克服するマグネットレスアイソレータを提案する。パラメータ変動に対する保証を示す小型で低損失なオンチップ超伝導デバイスを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 10:01:28 GMT)
Bridging Ethical Principles and Algorithmic Methods: An Alternative Approach for Assessing Trustworthiness in AI Systems [0.0]
本稿では,Trustworthy AIの倫理的要素とPageRankとTrustRankのアルゴリズム的プロセスを組み合わせた評価手法を提案する。目標は、フィールドで広く普及する自己評価技術に固有の主観性を最小化するアセスメントフレームワークを確立することである。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:32:21 GMT)
Biomechanical-phase based Temporal Segmentation in Sports Videos: a Demonstration on Javelin-Throw [0.0]
伝統的なスポーツ分析技術は手動のアノテーションや実験室に基づく計測に依存している。このような文脈的に認識された時間的セグメンテーションのための新しい教師なしフレームワークを提案する。提案手法は,テストデータの平均精度(mAP)が71.02%,F1スコアが74.61%であり,競合するベースラインよりもかなり高い。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:11:46 GMT)
Beyond the Hook: Predicting Billboard Hot 100 Chart Inclusion with Machine Learning from Streaming, Audio Signals, and Perceptual Features [0.0]
本研究は,Billboard Hot 100 チャートにトラックを組み込む際の最も強い予測的影響を決定要因が持つかを検討した。この分析によると、人気はBillboard Hot 100のインクルードで最も決定的な予測だった。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:41:09 GMT)
BALF: Budgeted Activation-Aware Low-Rank Factorization for Fine-Tuning-Free Model Compression [0.0]
BALFは、微調整なしでモデルを圧縮するための効率的なパイプラインである。微調整のない体制において優れた結果が得られることを示す。例えば、BALF は ResNeXt-101 上の FLOP を 45% 削減する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:50:29 GMT)
Automated Discovery of Gadgets in Quantum Circuits for Efficient Reinforcement Learning [0.0]
我々は,新しいガジェットや関連ガジェットのファミリーの自動発見アルゴリズムを提案する。このアルゴリズムは、有向グラフとしての量子回路の表現と、繰り返される部分グラフの自動探索に基づいている。新たに発見された家族から採取した4ビットガジェットの性能を比較し,その利点と欠点について考察する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:13:25 GMT)
AuON: A Linear-time Alternative to Semi-Orthogonal Momentum Updates [0.0]
運動量に基づく更新の半直交特性について検討し、スペクトルノルム信頼領域下での運動量更新を束縛する方法を開発した。半直交行列を構成することなく強い性能を達成する線形時間であるAuON(正規化非線形スケーリングによる代替単位ノルム運動量更新)を提案する。提案手法は, 双極子-コサインRMSスケーリング変換と正規化を組み合わせることで, ニュートン-シュルツ法と比較して, 有効性と計算効率の両立を実証する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 06:03:53 GMT)
Aspects of holographic entanglement using physics-informed-neural-networks [0.0]
我々は、ホログラフィックエンタングルメントエントロピーとエンタングルメントウェッジ断面積を計算するために、物理インフォームドニューラルネット(PINN)を実装した。この手法により、任意のAdS計量における部分領域の任意の形状に対してこれらの量を計算することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:00:00 GMT)
Analysis of Bias in Deep Learning Facial Beauty Regressors [0.0]
バイアスは、一見バランスのとれたソースからでもAIシステムに導入することができる。この研究は、美的規範を形成する上でAIが果たす役割について警告を鳴らしている。均等な美容技術への潜在的な道筋を提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:16:24 GMT)
An asymptotic field approach for the control of dipole emission in integrated structures [0.0]
電磁界の量子化をイン/アウトモードの観点から利用することにより、集積フォトニック構造における自然放出をモデル化する枠組みを提案する。このアプローチにより、導波路やリング共振器における双極子放射に関するよく知られた結果を回復できることを示す。アプリケーションとして、出力モードと出力モードの両方をフルに制御できる、調整可能な統合単一光子源を設計する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 12:44:58 GMT)
An Agent-Based Framework for Automated Higher-Voice Harmony Generation [0.0]
本フレームワークは,入力された楽譜を解析,標準化するための音楽摂取エージェントと,コードフォーマー(トランスフォーマーモデル)を用いたコード知識エージェントと,複雑なコード記号の構成音を解釈し,提供するハーモニー生成エージェントと,メロジカルかつリズミカルに相補的な調和ラインを構成するハーモニー生成エージェントとからなる。特定のタスクを専門のエージェントに委譲することで、人間のミュージシャンの協調プロセスを効果的に模倣する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:42:42 GMT)
Almost Sure Convergence for the Last Iterate of Stochastic Gradient Descent Schemes [0.0]
定数運動量パラメータ $beta in (0, 1)$ が $F(w_t) - F_* = O(tmax(p-1)-2p+1p-1na)$ の収束率を得ることを示す。また、定数運動量パラメータ $beta in (0, 1)$ の S が$F(w_t) - F_* = O(tmax(p-2p-1)-1na)$ の収束率を得ることを示す。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:40:21 GMT)
All three-angle variants of Tsirelson's precession protocol, and improved bounds for wedge integrals of Wigner functions [0.0]
ツィレルソンのプレセッションプロトコルは、離散変数系と連続変数系の両方に対して定義できる非古典的な証人である。この研究は、ティレルソンの元々のプロトコルの範囲を広げ、多くの他の状態の非古典性や絡み合いを検出することができる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:20:22 GMT)
Algorithms and data structures for automatic precision estimation of neural networks [0.0]
浮動小数点演算の精度自動推定によりニューラルネットワークライブラリを拡張した。本稿では,ニューラルネットワークのトレーニングと推論の精度を正確に評価し,高い計算性能を維持するための条件について議論する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 11:13:29 GMT)
Agentic Exploration of Physics Models [0.0]
我々はSciExplorerを紹介した。SciExplorerはドメイン固有のブループリントを使わずにシステムの自由な形態の探索を可能にするエージェントである。我々はSciExplorerを、力学力学系、波動進化、量子多体物理学にまたがる幅広いモデルでテストする。この設定の実証された有効性は、他の領域における同様の科学的探索への扉を開く。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:07:05 GMT)
Addressing Methodological Uncertainty in MCDM with a Systematic Pipeline Approach to Data Transformation Sensitivity Analysis [0.0]
現在の実践は、体系的な堅牢性評価を伴わないメソッドのアドホック選択によって特徴づけられる。本稿では,スケーリング変換空間の自動探索を通じて,この手法の不確実性に対処する枠組みを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 16:21:30 GMT)
ActorDB: A Unified Database Model Integrating Single-Writer Actors, Incremental View Maintenance, and Zero-Trust Messaging [0.0]
ActorDBは、書き込み、インクリメンタルビューメンテナンス(IVM)のためのシングルライターアクタモデルと、コアコンポーネントとしてのゼロトラストセキュリティモデルを密に統合した、新しいデータベースアーキテクチャである。 ActorDBはアクターの永続性、ストリーム処理、セキュリティのための個別のシステムを手動で統合する必要があるソリューションと比較して、より堅牢でセキュアで開発者フレンドリなプラットフォームを提供することができる、と私たちは主張する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:51:01 GMT)
ARS: Adaptive Reasoning Suppression for Efficient Large Reasoning Language Models [0.0]
推論抑制(Reasoning Suppression、ARS)は、冗長な推論ステップを動的に抑制する訓練のないアプローチである。 ARSは53%、46.1%、57.9%のトークン、レイテンシ、エネルギー削減を実現し、精度を維持または改善している。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:19:41 GMT)
A signal separation view of classification [0.0]
理論的には,最小限のラベル数を用いたクラス数と完全分類の両方が得られる。サリナスとインディアンパインズのハイパースペクトルデータセットや文書データセットなど、シミュレーションされた実生活のデータセットについて、我々の理論を解説する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 00:28:55 GMT)
A quantitative Robbins-Siegmund theorem [0.0]
我々は、Robins-Siegmund定理の定量的バージョンを提供し、Tao の意味でのエンフェスタスタビリティの領域を見つけるために、どれだけ遠くを見る必要があるかという境界を定めている。我々の証明は、Doobの定理のメタスタブルな類似で$L_$-supermartingalesと、プロセスの和や積を通じて量的情報がどのように伝播するかを正確に示す一連の技術的補題を含んでいる。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 14:17:20 GMT)
A Novel Preprocessing Unit for Effective Deep Learning based Classification and Grading of Diabetic Retinopathy [0.0]
本研究は,糖尿病網膜症を早期に検出するための枠組みである。フレームワークには前処理、セグメンテーション、特徴抽出、分類の3段階が含まれている。提案手法の有効性は,IDRiDとMESSIDORの2つの異なるデータセットを用いて評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 09:11:04 GMT)
A Neural Surrogate-Enhanced Multi-Method Framework for Robust Wing Design Optimization [0.0]
本稿では,ウィング設計プロセスのためのモジュラーでスケーラブルな設計最適化フレームワークを提案する。パイプラインは初期翼のジオメトリーの生成から始まり、その後いくつかのアルゴリズムを用いて翼を最適化する。その結果, 空力特性と安定性が向上し, 翼設計の高速化と高精度化が図られた。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:26:37 GMT)
A Method for Quantifying Human Risk and a Blueprint for LLM Integration [0.0]
サイバーセキュリティ心理学フレームワーク(Cybersecurity Psychology Framework、CPF)は、セキュリティオペレーションにおける人間中心の脆弱性を定量化する新しい方法論である。 CPFは、心理的脆弱性の全範囲にわたってエンドツーエンドのオペレーティングを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 20:31:27 GMT)
A Hybrid CAPTCHA Combining Generative AI with Keystroke Dynamics for Enhanced Bot Detection [0.0]
本稿では,Large Language Models (LLMs) がもたらす認知課題とキーストローク力学の行動バイオメトリックス解析を相乗化するハイブリッドCAPTCHAシステムを提案する。提案手法は,ロボット入力と人間のパターンを区別するために,ユーザのタイピングリズムを解析しながら,人間にとって自明だが自動エージェントには自明な動的予測不可能な質問を生成する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:56:13 GMT)
A Fuzzy Logic-Based Framework for Explainable Machine Learning in Big Data Analytics [0.0]
本稿では,2型ファジィ集合,粒度計算,クラスタリングを組み合わせて,ビッグデータ環境における説明可能性と公平性を高める新しいフレームワークを提案する。 UCI Air Qualityデータセットに適用した場合、このフレームワークはノイズの多いセンサデータの不確実性を効果的に管理し、言語規則を作成し、シルエットスコアとエントロピーを用いて公平さを評価する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 18:02:31 GMT)
A Data-Centric Perspective on the Influence of Image Data Quality in Machine Learning Models [0.0]
本研究では,画像データセットの品質を体系的に評価する手法について検討する。一般的な品質問題を特定し、トレーニングへの影響を定量化します。コミュニティが開発したツールであるCleanVisionとFastdupを統合したパイプラインを開発しています。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 08:09:21 GMT)
A Biophysical-Model-Informed Source Separation Framework For EMG Decomposition [0.0]
表面筋電図(sEMG)からの運動単位分解は、ニューラルドライブ情報を抽出する鍵となる技術である。本稿では,解剖学的に高精度な前方EMGモデルを分解プロセスに統合する,新しいバイオ物理モデルインフォームドソース分離(BMISS)フレームワークを提案する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 17:53:52 GMT)
A Biologically Interpretable Cognitive Architecture for Online Structuring of Episodic Memories into Cognitive Maps [0.0]
本稿では,認識地図にエピソード記憶を構造化するための新しい認知アーキテクチャを提案する。我々のモデルは、継承機能フレームワークとエピソード記憶を統合し、インクリメンタルなオンライン学習を可能にします。この研究は計算神経科学とAIを橋渡しし、人工適応剤の認知地図形成に生物学的に基礎を置いたアプローチを提供する。
論文参考訳（メタデータ） (Mon, 29 Sep 2025 04:07:38 GMT)