MultiFinBen: Benchmarking Large Language Models for Multilingual and Multimodal Financial Application [118.6] MultiFinBen は、現実的な財務状況下で LLM を評価するための、最初のエキスパートアノテーション付き多言語(5言語)およびマルチモーダルベンチマークである。
財務理由付けテストは、書類やニュースと統合された言語間のエビデンスと、スキャンされた文書から構造化されたテキストを抽出する財務OCRである。
21個のLLMを評価したところ、GPT-4oのようなフロンティアのマルチモーダルモデルでさえ、視力とオーディオが強く、多言語設定では急激に低下するが、全体の46.01%しか達成していないことが示されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:12:16 GMT)
MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with Holistic Platform and Adaptive Hybrid Policy Optimization [103.7] ロングチェーンのリフレクティブ推論は、複雑な現実世界の問題を解決するための前提条件である。
我々は42の難解な合成タスクの1,260のサンプルからなるベンチマークを構築した。
トレーニング後のデータを生成し、そのようなデータを活用するための学習パラダイムを探索する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:52:01 GMT)
Semantic Visual Anomaly Detection and Reasoning in AI-Generated Images [96.4] AnomReasonは4倍のtextbfAnomAgentのような構造化アノテーションを備えた大規模ベンチマーク
AnomReasonとAnomAgentは、AI生成画像の意味的妥当性の測定と改善の基盤となっている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:09:24 GMT)
Unifying Tree Search Algorithm and Reward Design for LLM Reasoning: A Survey [92.7] 線形木探索はLarge Language Model (LLM) 研究の基盤となっている。
本稿では,検索アルゴリズムを3つのコアコンポーネントに分解する統合フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:29:18 GMT)
Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.6] 本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。
ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。
我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:11:09 GMT)
Demystifying deep search: a holistic evaluation with hint-free multi-hop questions and factorised metrics [89.2] We present WebDetective, a benchmark of hint-free multi-hop questions with a control Wikipedia sandbox。
25の最先端モデルに対する我々の評価は、すべてのアーキテクチャにまたがる体系的な弱点を明らかにしている。
私たちはエージェントワークフローであるEvidenceLoopを開発し、ベンチマークが特定する課題を明示的にターゲットしています。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:50:43 GMT)
Baking Gaussian Splatting into Diffusion Denoiser for Fast and Scalable Single-stage Image-to-3D Generation and Reconstruction [85.6] 単一視点からのオブジェクト生成とシーン再構成のための新しい1段3次元拡散モデルDiffusionGSを提案する。
DiffusionGSはビュー一貫性を強制するために、各タイミングで3Dガウス点雲を直接出力する。
DiffusionGSは、オブジェクトやシーンのPSNR/FIDにおいて2.20dB/23.25と1.34dB/19.16の改善をもたらすことを示した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:53:18 GMT)
Large Language Model Sourcing: A Survey [84.6] 大規模言語モデル(LLM)は人工知能に革命をもたらし、目的的タスクのサポートから主観的な意思決定の強化へと移行した。
LLMのブラックボックスの性質と生成したコンテンツの人間的品質のため、幻覚、偏見、不公平さ、著作権侵害などの問題が重要になる。
本研究は,4つの相互関連次元を中心に整理されたLCMによるコンテンツの出所追跡について,系統的研究を行った。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:52:30 GMT)
BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation [84.1] BILLY (BlendIng persona vectors for Large Language model creativitY) をマルチLLMコラボレーションのためのトレーニングフリーフレームワークとして提案する。
モデル生成過程をこの統合ベクタを用いて推論し、明示的なマルチLLM通信を伴わずにマルチパースペクティブ出力を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:36:39 GMT)
A Unified Frequency Domain Decomposition Framework for Interpretable and Robust Time Series Forecasting [81.7] 時系列予測の現在のアプローチは、時間領域であれ周波数領域であれ、主に線形層やトランスフォーマーに基づいたディープラーニングモデルを使用する。
本稿では,多種多様な時系列を数学的に抽象化する統合周波数領域分解フレームワークFIREを提案する。
火は長期予測ベンチマークで最先端のモデルを一貫して上回る。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:59:25 GMT)
Does Machine Unlearning Truly Remove Knowledge? [80.8] 本研究では,3つのベンチマークデータセット,6つのアンラーニングアルゴリズム,および5つのプロンプトベースの監査手法からなる,アンラーニング評価のための総合的な監査フレームワークを提案する。
異なるアンラーニング戦略の有効性とロバスト性を評価する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:41:55 GMT)
Learning to Instruct for Visual Instruction Tuning [79.8] 視覚インストラクションチューニング(VIT)の進歩であるL2Tを提案する。
L2Tは、損失関数を命令シーケンスと応答シーケンスの両方に組み込むことによって、シンプルだが効果的なアプローチを採用する。
驚くべきことに、L2Tは極めて基本的な視覚能力を備えており、キャプション性能は最大で18%向上している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:54:17 GMT)
Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny [78.2] 強化学習(RL)で訓練された大規模言語モデル(LLM)は、信頼性も拡張性もない、という大きな課題に直面している。
有望だが、ほとんど報われていない代替手段は、フォーマルな言語ベースの推論である。
生成モデルが形式言語空間(例えばダフニー)で機能する厳密な形式体系におけるLLMの接地は、それらの推論プロセスと結果の自動的かつ数学的に証明可能な検証を可能にする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:09:23 GMT)
OmniVCus: Feedforward Subject-driven Video Customization with Multimodal Control Conditions [77.0] 本研究では、画像編集データを用いた画像-動画移動混合(IVTM)訓練を開発し、カスタマイズされたビデオにおける被写体に対するインストラクティブな編集を可能にする。
また,2つの埋め込み機構を持つ拡散トランスフォーマーフレームワークであるOmniVCusを提案し,Luttery Embedding (LE) とTemporally Aligned Embedding (TAE) を提案する。
本手法は定量評価と定性評価の両方において最先端の手法を大幅に超えている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:49:53 GMT)
Toward Relative Positional Encoding in Spiking Transformers [76.7] スパイキングニューラルネットワーク(スパイキングニューラルネット、英: Spiking Neural Network、SNN)は、脳内のニューロンが離散スパイクを通してどのように通信するかを模倣するバイオインスパイアネットワークである。
スパイクのバイナリ特性を保ちながら、スパイク変換器における相対的な位置エンコーディングを近似する戦略をいくつか導入する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:19:03 GMT)
Backdoor Collapse: Eliminating Unknown Threats via Known Backdoor Aggregation in Language Models [75.3] Ourmethodは、複数のベンチマークで平均的な攻撃成功率を4.41%に下げる。
クリーンな精度と実用性はオリジナルのモデルの0.5%以内に保存される。
防衛はさまざまな種類のバックドアをまたいで一般化し、実際のデプロイメントシナリオにおける堅牢性を確認します。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:47:35 GMT)
TRAJECT-Bench:A Trajectory-Aware Benchmark for Evaluating Agentic Tool Use [74.5] 大規模言語モデル(LLM)ベースのエージェントは、現実のタスクを完了するためのツールの使用にますます依存している。
LLMのツール使用能力を総合的に評価するためのトラジェクトリ対応ベンチマークであるTRAJECT-Benchを紹介する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:19:32 GMT)
Complementary and Contrastive Learning for Audio-Visual Segmentation [74.1] 本稿では,ローカル情報とグローバル情報の両方を処理可能な新しいフレームワークであるComplementary and Contrastive Transformer(CCFormer)を提案する。
提案手法は,S4, MS3, AVSSデータセットにまたがる最先端のベンチマークを新たに設定する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:36:59 GMT)
Motion Capture from Inertial and Vision Sensors [73.3] Inertial と visION Sensors から収集した大規模なモーションキャプチャーデータセット MINIONS をコントリビュートする。
提案するMINIONSデータセットを用いて,IMUやビデオから人間の動きをキャプチャするSparseNetフレームワークを提案する。
実験結果は、慣性・視覚センサーの独特な利点を強調し、消費者が使用可能なマルチモーダルモーションキャプチャーの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:10:46 GMT)
MCPVerse: An Expansive, Real-World Benchmark for Agentic Tool Use [72.5] 我々はエージェントツールの使用を評価するための実世界のベンチマークであるMCPVerseを紹介する。
MCPVerseは550以上の実世界の実行可能なツールを統合し、140kトークンを超える前例のないアクション空間を作成する。
私たちは最先端のLSMを3つのモード(Oracle、Standard、Max-Scale)でベンチマークしました。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:48:07 GMT)
Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [68.9] 我々は、知識保持をモデル化し、そのコーパスから事実情報を記憶するための事前学習言語モデルの能力を示し、学習前にそれを推定する原則的手法を導入する。
本稿では,知識周波数,知識特異度,モデルサイズを統合し,クローズドブック質問応答(QA)の精度を予測する情報理論予測器である,サイズ依存型相互情報(SMI)を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:54:16 GMT)
FlareX: A Physics-Informed Dataset for Lens Flare Removal via 2D Synthesis and 3D Rendering [66.7] 本稿では, パラメータ化テンプレート生成, 照明対応2D合成法, 物理エンジンによる3Dレンダリングの3段階からなるフレアデータ生成法を提案する。
このデータセットは、95のフレアパターンから派生した9,500の2Dテンプレートと60の3Dシーンからレンダリングされた3000のフレアイメージペアを提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:45:41 GMT)
Can Prompt Difficulty be Online Predicted for Accelerating RL Finetuning of Reasoning Models? [65.2] 本研究では任意のプロンプトの反復的近似評価について検討する。
Model Predictive Prompt Selection (MoPPS)はベイズにおけるリスク予測フレームワークである。
MoPPSは迅速な困難を確実に予測し、ロールアウトを大幅に削減したトレーニングを加速する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:54:34 GMT)
Token Hidden Reward: Steering Exploration-Exploitation in Group Relative Deep Reinforcement Learning [64.0] Token Hidden Reward (THR) はトークンレベルのメトリクスで、それぞれのトークンが正しい応答の確率に与える影響を定量化する。
トレーニングダイナミクスは、高い絶対THR値を持つトークンの小さなサブセットに支配されている。
この知見は、GRPOの学習信号を修正し、エクスプロイトや探索に向けて明示的にバイアストレーニングを行うTHR誘導再重み付けアルゴリズムを示唆している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:16:29 GMT)
On the Entity-Level Alignment in Crosslingual Consistency [62.3] SubSubとSubInjは、主題の英語翻訳を言語間のプロンプトに統合し、実際のリコール精度と一貫性を大きく向上させた。
これらの介入はモデルの内部ピボット言語処理を通じて概念空間における実体表現のアライメントを強化する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:26:50 GMT)
X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model [62.2] Vision-Language-Actionモデルは、多様なロボットプラットフォームにわたる効果的なトレーニングに依存している。
最小限のパラメータを付加したソフトプロンプト手法を提案する。
0.9Bのインスタンス化-X-VLA-0.9Bは,ベンチマークの全体にわたってSOTA性能を同時に達成することを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:20:17 GMT)
Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization [61.6] 低高度経済ネットワーク(LAENets)は、航空監視、環境検知、セマンティックデータ収集など、様々な応用を可能にしている。
オンボードビジョン(VLM)は、リアルタイムな推論を提供するが、オンボードの動的ネットワーク条件は限られている。
動的LEENet条件下での通信効率を向上させるUAV対応LEENetシステムを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:11:21 GMT)
Investigating VLM Hallucination from a Cognitive Psychology Perspective: A First Step Toward Interpretation with Intriguing Observations [60.6] 幻覚は、視覚言語モデル(VLM)で積極的に研究されている長年の問題である。
既存の研究は、幻覚は技術的な制限や梅毒のバイアスによるもので、後者はモデルがユーザの期待に沿う誤った回答を生み出す傾向があることを意味している。
本研究では, VLMの認知バイアスを分類し, サイコフィナンシー, 論理的不整合, 新たに同定された VLM の行動, 権威へのアピールなど, 幻覚へと導く。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:29:39 GMT)
Diverse Text-to-Image Generation via Contrastive Noise Optimization [60.5] テキスト・ツー・イメージ(T2I)拡散モデルは高忠実度画像の生成において顕著な性能を示した。
既存のアプローチは通常、推論中に中間の潜伏状態やテキスト条件を最適化する。
本稿では,多様性問題に異なる視点から対処する簡易かつ効果的な手法であるContrastive Noise Optimizationを紹介する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:37:42 GMT)
Color3D: Controllable and Consistent 3D Colorization with Personalized Colorizer [58.9] 静的な3Dシーンと動的な3Dシーンの両方をモノクロ入力から色づけする、高度に適応可能なフレームワークであるColor3Dを提案する。
当社のアプローチは、クロスビューとクロスタイムの一貫性を確保しながら、カラー多様性とステアビリティを維持できます。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:21:19 GMT)
SaFiRe: Saccade-Fixation Reiteration with Mamba for Referring Image Segmentation [58.8] Referring Image (RIS) は、自然言語で表現された画像に対象のオブジェクトを分割することを目的としている。
最近の手法は主に「赤い車」や「左少女」のような単純な表現に焦点を当てている
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:50:58 GMT)
MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.7] MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:16:33 GMT)
Audio Does Matter: Importance-Aware Multi-Granularity Fusion for Video Moment Retrieval [58.6] Video Moment Retrieval (VMR)は、特定のクエリに関連する特定のモーメントを検索することを目的としている。
既存のVMRメソッドの多くは、補完的ではあるが重要なオーディオのモダリティを無視しながら、視覚的およびテキスト的モダリティにのみ焦点をあてている。
本稿では,VMRの音声ビジョンコンテキストを動的かつ選択的に集約する,新しいImportance-Aware Multi-Granularity fusion Model (IMG)を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:07:19 GMT)
Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.4] Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:05:28 GMT)
The Quantum Multiple-Access Channel with Cribbing Encoders [58.3] 量子多重アクセスチャネル(MAC)とクリッピングエンコーダとの通信を検討する。
閉包定理に基づき、完全クリビングは不可能である。
部分復号-フォワード領域は、非ロバストなクリビングを持つ量子MACに対して導出される。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:02:17 GMT)
Learning to Reason as Action Abstractions with Scalable Mid-Training RL [55.2] 効果的な中間訓練フェーズは、有用なアクションのコンパクトなセットを特定し、高速な選択を可能にする。
本稿では,スケーラブルなミッドトレーニングアルゴリズムであるReasoning as Action Abstractions (RA3)を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:23:08 GMT)
A Survey of Inductive Reasoning for Large Language Models [55.2] 帰納的モードは知識の一般化に不可欠であり、人間の認知とよく一致している。
帰納的推論の重要性にもかかわらず、体系的な要約は存在しない。
本稿では,大規模言語モデルに対する帰納的推論の包括的調査を行う。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:45:38 GMT)
Beyond Sample-Level Feedback: Using Reference-Level Feedback to Guide Data Synthesis [54.2] 参照レベルフィードバック(Reference-Level Feedback)は、厳選された参照サンプルから望ましい特徴を抽出し、高品質な命令応答対の合成を導くパラダイムである。
実験により、参照レベルフィードバックは従来のサンプルレベルのフィードバック手法を一貫して上回り、モデルアーキテクチャ全体にわたって一般化し、高品質で多様なデータを低コストで生成することを示した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:30:00 GMT)
Ctrl-World: A Controllable Generative World Model for Robot Manipulation [53.7] 汎用ロボットポリシーは、幅広い操作スキルを実行することができる。
未知の物体や命令で 彼らの能力を評価し 改善することは 重要な課題です
世界モデルは、イマジネーション空間内でポリシーの展開を可能にすることで、有望でスケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:13:10 GMT)
Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.0] 我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。
我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。
車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:56:12 GMT)
Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.9] 大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:24:35 GMT)
Interpretable Graph-Language Modeling for Detecting Youth Illicit Drug Use [51.7] 十代の若者や若者(TYA)の間での違法薬物使用は、公衆衛生上の問題となっている。
TYAの違法薬物使用を検出するため、研究者は若者のリスク行動調査(YRBS)や全米薬物使用・健康調査(NSDUH)などの大規模調査を分析した。
既存のモデリング手法は、潜伏構造と相互接続構造を見渡すことで、調査変数を独立に扱う。
LAMIは違法薬物の使用を検知し、TYA間の行動危険因子を解釈するための新しいグラフ言語モデリングフレームワークである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:29:50 GMT)
ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy [51.6] ASTREAは、自律的な宇宙船運用のためのフライト・ヘリテージ・ハードウェア上で実行される最初のエージェント・システムである。
我々は,資源制約付き大規模言語モデル(LLM)エージェントと強化学習コントローラを,空間対応プラットフォームに適した非同期アーキテクチャに統合する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:26:59 GMT)
You only need 4 extra tokens: Synergistic Test-time Adaptation for LLMs [50.5] 大規模言語モデル (LLM) は、金融、医療、農業などの専門分野にますます導入されている。
本稿では,言語モデルに対するラベルフリーテスト時適応について検討し,追加の監督なしにモデルをオンザフライで適応する推論時フレームワークであるSyTTAについて述べる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:00:39 GMT)
RAG-IGBench: Innovative Evaluation for RAG-based Interleaved Generation in Open-domain Question Answering [50.4] 本稿では,RAG-IG(Retrieval-Augmented Generation)に基づくインターリーブドジェネレーション(Interleaved Generation)の課題を評価するためのベンチマークであるRAG-IGBenchを提案する。
RAG-IGは、MLLM(Multimodal large language model)と検索機構を統合し、モデルがコヒーレントなマルチモーダルコンテンツを生成するための外部画像テキスト情報にアクセスできるようにする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:06:39 GMT)
DixitWorld: Evaluating Multimodal Abductive Reasoning in Vision-Language Models with Multi-Agent Dixit Gameplay [50.3] マルチモーダルな帰納的推論を分解するための総合評価スイートであるDixitWorldを紹介した。
DIXITWORLDは,仮説生成と仮説選択を評価する動的マルチエージェント環境であるDixitArenaという,2つのコアコンポーネントを備えている。
DixitArenaの結果は、異なる、役割に依存した行動を明らかにしている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:48:48 GMT)
Exploring the Generalizability of Factual Hallucination Mitigation via Enhancing Precise Knowledge Utilization [50.0] PKUE(Precise Knowledge utilization Enhancement, 精密知識利用促進)を導入し, 正確かつ単純な事実質問に対する自己生成応答のモデルを微調整する。
大規模な実験により、PKUEはLLM全体の性能を著しく改善することが示された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:59:55 GMT)
MTP-S2UT: Enhancing Speech-to-Speech Translation Quality with Multi-token Prediction [49.9] 音声から単位への翻訳(S2UT)モデルにマルチトークン予測(MTP)損失を導入する。
全てのMPP損失変種がS2UT翻訳の品質を一貫して改善していることが示される。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:06:20 GMT)
Lighter-X: An Efficient and Plug-and-play Strategy for Graph-based Recommendation through Decoupled Propagation [49.9] 我々は,既存のGNNベースのレコメンデータアーキテクチャとシームレスに統合可能な,効率的かつモジュール化されたフレームワークである textbfLighter-X を提案する。
提案手法は,基本モデルの理論的保証と経験的性能を保ちながら,パラメータサイズと計算複雑性を大幅に低減する。
実験の結果、Lighter-Xはパラメータが大幅に少ないベースラインモデルに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:33:08 GMT)
Training-Free In-Context Forensic Chain for Image Manipulation Detection and Localization [49.6] In-Context Forensic Chain (ICFC) は、MLタスクの解釈にMLLM(Multi-modal large language model)を活用する、トレーニングフリーのフレームワークである。
ICFCは、信頼できる知識基盤を構築するために、オブジェクト化されたルール構築と適応的なフィルタリングを統合する。
ICFCは最先端のトレーニングフリーメソッドを超えるだけでなく、弱く完全に監督されたアプローチに比べて、競争力や優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:42:31 GMT)
Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control [48.9] テキスト・トゥ・イメージ(T2I)モデルは、正確な空間レイアウト制御に苦慮している。
Seg2Anyは、高度なマルチモーダル拡散変換器上に構築された新しいS2Iフレームワークである。
Seg2Anyは、オープンセットとクローズセットの両方のS2Iベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:12:17 GMT)
MarkPlugger: Generalizable Watermark Framework for Latent Diffusion Models without Retraining [48.4] AI生成コンテンツ(AIGC)の急速な発展期には、潜伏拡散モデル(LDM)の迅速な反復と修正により、ウォーターマークモデルによる再トレーニングがコストがかかる。
我々は,LDMの再学習を伴わない汎用的なプラグイン・アンド・プレイ・ウォーターマーク・フレームワークであるMarkPluggerを提案する。
実験結果から,本手法は画像品質と透かし回収率を効果的に調和させることがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:08:08 GMT)
DiffHeads: Differential Analysis and Inference-Time Masking of Bias Heads in Large Language Models [47.6] DiffHeadsは,大規模言語モデルのための軽量なデバイアス処理フレームワークである。
DiffHeadsは、モデルユーティリティを損なうことなく、それぞれDAとCoTで49.4%、40.3%の不正性を減少させることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:48:31 GMT)
DetailMaster: Can Your Text-to-Image Model Handle Long Prompts? [46.6] DetailMasterはテキスト・ツー・イメージ(T2I)モデルを評価するために設計された最初の総合ベンチマークである。
このベンチマークは、専門家アノテータによって高品質な検証がなされた、平均284.89トークンの長大かつ詳細なプロンプトで構成されている。
7つの汎用T2Iモデルと5つの長周期最適化T2Iモデルの評価は、重要な性能限界を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:52:30 GMT)
MultiCOIN: Multi-Modal COntrollable Video INbetweening [46.4] マルチモーダル制御を実現するMultiCOINを紹介した。
DiTとマルチモーダルコントロールの互換性を確保するため、すべてのモーションコントロールを共通スパース表現にマッピングする。
また,モデルがマルチモーダル制御を円滑に学習できるように,段階的な学習戦略を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:20:14 GMT)
Frontier AI's Impact on the Cybersecurity Landscape [46.3] AIはすでに攻撃に広く使われているが、その防衛用途は限られている。
専門家はAIが攻撃者を擁護し続けると予想しているが、そのギャップは徐々に狭まるだろう。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:53:43 GMT)
Stop When Enough: Adaptive Early-Stopping for Chain-of-Thought Reasoning [46.1] REFRAINはトレーニング不要のフレームワークで、理由付けをやめて過度に考えることを緩和する。
REFRAINは、標準的なCoTプロンプトと比較して、トークンの使用量を20~55%削減し、精度を維持または改善している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:30:00 GMT)
$\texttt{AVROBUSTBENCH}$: Benchmarking the Robustness of Audio-Visual Recognition Models at Test-Time [45.4] 我々は、音声視覚認識モデルの試験時間ロバスト性を評価するために設計された総合的なベンチマークである$textttAVROBUSTBENCH$を紹介した。
$textttAVROBUSTBENCH$は、4つのオーディオ視覚ベンチマークデータセット、$textttAUDIOSET-2C$、$texttVGGSOUND-2C$、$texttKINETICS-2C$、$textttEPICKITCHENS-2C$からなる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:22:07 GMT)
Learning to Be Cautious [45.1] 強化学習の分野における重要な課題は、新しい状況下で慎重に行動するエージェントを開発することである。
注意深い行動がますます不要になるタスクのシーケンスと、システムが注意深いことを学習できることを実証するアルゴリズムを提示する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:39:41 GMT)
ImCoref-CeS: An Improved Lightweight Pipeline for Coreference Resolution with LLM-based Checker-Splitter Refinement [45.0] InmCoref-CeSは,拡張教師付きモデルとLarge Language Models(LLM)ベースの推論を統合する新しいフレームワークである。
まず、教師付きニューラルネットワークの性能境界を押し上げる改良CR法(textbfImCoref)を提案する。
マルチロールチェッカースプリッターエージェントとして機能するLCMを用いて、候補参照とコア参照結果の検証を行う。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:48:08 GMT)
Minibatch and Local SGD: Algorithmic Stability and Linear Speedup in Generalization [44.8] ミニバッチ勾配降下(ミニバッチSGD)と局所SGDは並列最適化の2つの一般的な方法である。
ミニバッチと局所SGDの安定性と一般化解析について検討した。
極小バッチと局所SGDが最適リスク境界を達成するために線形スピードアップを達成することを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:59:28 GMT)
PermLLM: Learnable Channel Permutation for N:M Sparse Large Language Models [44.3] チャネル置換はN:Mスパースモデルの精度を高めるための強力な手法である。
本稿では,学習可能なチャネル置換を導入したポストトレーニング・プルーニングフレームワークPermLLMを提案する。
我々は,N:Mスパースモデルの最適化において,PermLLMが優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:40:27 GMT)
Enhancing the Cross-Size Generalization for Solving Vehicle Routing Problems via Continual Learning [44.2] 既存の車両ルーティング問題に対する深いモデルは通常、単一のサイズのインスタンスを使用して訓練され、評価される。
これにより、異なる問題サイズにまたがって一般化する能力が大幅に制限される。
本稿では,問題の大きさの上昇を事例として,深層モデルを逐次訓練する継続的学習に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:39:36 GMT)
Pure-Pass: Fine-Grained, Adaptive Masking for Dynamic Token-Mixing Routing in Lightweight Image Super-Resolution [44.0] CAMixerは、既存の軽量画像超解法の利点を統合する先駆的な取り組みである。
本稿では,Pure-Pass(Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass,Pure-Pass)を提案する。
PP-ATD-lightは最小オーバーヘッドで優れたSR性能を実現し、再構成品質とパラメータ効率でCAMixer-ATD-lightを上回っている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:22:40 GMT)
From Programs to Poses: Factored Real-World Scene Generation via Learned Program Libraries [43.6] FactoredScenesは部屋の構造を利用してリアルな3Dシーンを合成するフレームワークである。
本研究では,FacteredScenesが実際のScanNetのシーンと区別が難しい現実的な現実世界の部屋を生成することを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:14:24 GMT)
DMDTEval: An Evaluation and Analysis of LLMs on Disambiguation in Multi-domain Translation [43.1] 大規模言語モデル(LLM)は機械翻訳において顕著な成果を上げている。
しかし、マルチドメイン翻訳(MDT)の性能は不十分である。
マルチドメイン翻訳(DMDTEval)における曖昧性の評価と解析について述べる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:24:39 GMT)
A Token is Worth over 1,000 Tokens: Efficient Knowledge Distillation through Low-Rank Clone [42.0] 低ランククローン(Lol-Rank Clone、LRC)は、強力な教師モデルによる行動等価性を目指すSLMを構築するための効率的な事前学習手法である。
LRCは、20Bトークンしか使用せず、1000倍以上のトレーニング効率を達成しながら、何十兆ものトークンでトレーニングされた最先端のモデルと一致または超えている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:22:06 GMT)
EditCast3D: Single-Frame-Guided 3D Editing with Video Propagation and View Selection [41.6] EditCast3Dは、ビデオ生成基盤モデルを使用して、再構築前にデータセット全体にわたって単一のファーストフレームから編集を伝搬するパイプラインである。
一般的に使用されている3D編集データセット上でEditCast3Dを評価し,最先端の3D編集ベースラインと比較した。
これらの結果は、基礎モデルを3D編集パイプラインに統合するためのスケーラブルで汎用的なパラダイムとしてEditCast3Dを確立している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:15:47 GMT)
Skill-Targeted Adaptive Training [41.5] 言語モデルは、バニラ教師付き微調整(SFT)によって訓練された場合、ほとんど改善されないことが多い。
そこで我々は,より強力な大規模言語モデル(LLM)を教師としてメタ認知能力を用いて,そのような学生モデルを訓練するための新たな微調整戦略STATを導入する。
スキル目標の適応トレーニングは、現在のトレーニングパイプラインを広範囲に改善するべきである、と結論付けている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:02:36 GMT)
Latent Reasoning via Sentence Embedding Prediction [41.1] 本稿では,次の文の連続的な埋め込みを自動回帰予測することにより,事前訓練されたトークンレベルのLMを文空間内での操作に適応させるフレームワークを提案する。
以上の結果から,事前学習したLMは,遅延埋め込み空間内での抽象的構造的推論に効果的に移行できることが示唆された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:55:53 GMT)
ConQuER: Modular Architectures for Control and Bias Mitigation in IQP Quantum Generative Models [41.0] 瞬時量子(IQP)回路に基づく量子生成モデルは、複素分布の学習において非常に有望である。
現在の実装は、生成した出力に対する制御性の欠如と、期待される特定のパターンに対する深刻な生成バイアスに悩まされている。
モジュール回路アーキテクチャによる両課題に対処する制御可能な量子生成フレームワーク ConQuER を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:39:03 GMT)
Path Drift in Large Reasoning Models:How First-Person Commitments Override Safety [40.9] ロングCoTモデルにおける推論軌道は、整列された経路からドリフトし、結果として安全性の制約に反する内容となる。
本稿では,認知的負荷増幅,自己ロールプライミング,条件チェーンハイジャックを含む3段階のパスドリフト誘導フレームワークを提案する。
本研究は,トークンレベルのアライメントを超えた長期的推論において,軌道レベルのアライメント監視の必要性を強調した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:39:50 GMT)
CodeCrash: Exposing LLM Fragility to Misleading Natural Language in Code Reasoning [40.9] 私たちは、CruxEvalとLiveCodeBenchから1,279の質問が寄せられたストレステストフレームワークであるCodeCrashを紹介します。
モデルはしばしばNLキューをオーバーリライズすることで推論をショートカットし、出力予測タスクの平均的な性能劣化が23.2%になることがわかった。
チェーン・オブ・ソート(Chain-of-Thought)の推論でさえ、平均的なモデルでは、混乱と合理化のためにまだ13.8%の減少がある。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:41:48 GMT)
Output Supervision Can Obfuscate the Chain of Thought [40.9] OpenAI (2025) は、思考の連鎖(CoT)モニターに対するトレーニングが難解なCoTを引き起こす可能性があることを示した。
このようなトレーニングは、2つのメカニズムによっても難読化CoTを発生させる可能性がある。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:13:02 GMT)
Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles [40.6] 本稿では、ジグソーパズルを構造化実験フレームワークとして用いて、ルールベースの視覚的RLについて包括的に研究する。
Jigsawのパズルは、固有の真実、調整可能な困難、複雑な意思決定を要求する。
MLLMは、最初は最も単純なジグソーパズルのランダムな推測に近づき、ほぼ完璧な精度を達成し、微調整によって複雑で目に見えない構成に一般化する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:03:29 GMT)
OrbitZoo: Multi-Agent Reinforcement Learning Environment for Orbital Dynamics [40.3] OrbitZooは、多機能なマルチエージェントRL環境であり、高忠実度業界標準ライブラリ上に構築されている。
衝突回避や協調操作のようなシナリオをサポートし、ロバストで正確な軌道力学を保証する。
実際の衛星星座であるスターリンクに対して検証され、実際のデータと比較すると平均絶対パーセンテージ誤差(MAPE)は0.16%に達する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:52:13 GMT)
OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [39.7] 事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。
我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
実験により、OSCARは量的および視覚的品質の指標において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:38:04 GMT)
Language Surgery in Multilingual Large Language Models [39.7] 大規模言語モデル(LLM)はタスクや言語にまたがる顕著な一般化機能を示している。
本稿では, LLMにおける自然に出現する表現アライメント, 特に中層における表現アライメントについて検討する。
Inference-Time Language Control (ITLC) を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:20:17 GMT)
Quantization Meets Reasoning: Exploring and Mitigating Degradation of Low-Bit LLMs in Mathematical Reasoning [39.6] 低ビット後の量子化は、より厳しい設定で69.81%の数学的推論を損なう。
デプロイクリティカルな2つの問題に,プロセスレベルの精度で対処する。
われわれの設定では、332のキュレートされたサンプルと1つのGPUで3~5分計算すると、完全な精度のベースラインに向かって4ビットの重み計算が引き起こされる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:12:01 GMT)
SkewRoute: Training-Free LLM Routing for Knowledge Graph Retrieval-Augmented Generation via Score Skewness of Retrieved Context [39.2] 大規模な言語モデルは多くのタスクで優れていますが、デプロイ時に高い推論コストがかかります。
そこで本稿では,KG-RAGのための極めてシンプルで効果的なルーティングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:45:21 GMT)
Stochastic gradient descent estimation of generalized matrix factorization models with application to single-cell RNA sequencing data [39.1] 単細胞RNAシークエンシングは、個々の細胞レベルでの遺伝子発現の定量化を可能にする。
次元の減少は、サンプルの可視化、クラスタリング、表現型特徴付けに不可欠な一般的な前処理ステップである。
一般指数分散族分布を仮定した一般化行列分解モデルを提案する。
提案手法は, 数百万セルにシームレスに拡張可能であることを示し, 大規模単一セルデータセットの次元性低減を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:48:40 GMT)
SAFER: Risk-Constrained Sample-then-Filter in Large Language Models [39.0] 本稿では,無意識サンプリングと共形フィルタリングを組み合わせた2段階リスク制御フレームワークを提案する。
その結果,SAFERはタスク固有の基準やキャリブレーションテストのスプリット比と互換性があることが判明した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:12:41 GMT)
OmniSAM: Omnidirectional Segment Anything Model for UDA in Panoramic Semantic Segmentation [38.7] Segment Anything Model 2 (SAM2) は様々なピンホール画像分割タスクにおいて強力なベースモデルとして登場した。
ピンホール(70円×70円)とパノラマ画像(180円×360円)の間には、ユニークな課題がある。
本稿では,パノラマセマンティックセマンティックセグメンテーションにSAM2を適用しようとする新しいOmniSAMフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:08:17 GMT)
HccePose(BF): Predicting Front \& Back Surfaces to Construct Ultra-Dense 2D-3D Correspondences for Pose Estimation [37.5] 観測対象の推定では、ニューラルネットワークを使用して2D画像上の物体表面の密集した3D座標を予測する。
本研究は、ポーズ間の3次元座標を密集して、物体の前面と後面の両方を3次元座標で予測する。
その結果,提案手法は7つの古典的BOPコアデータセットより優れていることがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:29:53 GMT)
Rethinking Graph Structure Learning in the Era of LLMs [37.3] Large Language and Tree Assistant (LLaTA)は、木に基づくLLMインコンテキスト学習を活用し、トポロジーとテキストの理解を強化する。
11のデータセットに対する大規模な実験は、LLaTAが任意のバックボーンを組み込んだ柔軟性を享受していることを示している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:52:51 GMT)
When Vision Fails: Text Attacks Against ViT and OCR [37.0] テキストベースの機械学習モデルは、Unicodeベースの敵の新たなクラスに対して脆弱である。
理論上、OCRモデルは悪意のあるUnicode文字を無視し、モデルに入力される視覚的に正しい入力を抽出する。
これらの視覚的防御はこの種の攻撃を防げないことを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:55:43 GMT)
FCVSR: A Frequency-aware Method for Compressed Video Super-Resolution [36.6] 本稿では,移動誘導型適応アライメントネットワークと多周波特徴改善モジュールで構成される,深帯域圧縮ビデオSRモデル(FCVSR)を提案する。
提案モデルは3つの圧縮ビデオ圧縮超解像データセットで評価されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:44:39 GMT)
MGPATH: Vision-Language Model with Multi-Granular Prompt Learning for Few-Shot WSI Classification [36.6] 全スライド画像分類は、ギガピクセル画像サイズと限定アノテーションラベルによる課題を提示する。
本稿では,数ショットの病理分類に大規模な視覚言語モデルを適用するための素早い学習手法を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:30:10 GMT)
MA-RAG: Multi-Agent Retrieval-Augmented Generation via Collaborative Chain-of-Thought Reasoning [36.4] MA-RAGは、複雑な情報探索タスクにおける固有の曖昧さと推論の問題に対処する。
エンドツーエンドの微調整や分離されたコンポーネント拡張に依存する従来のRAGメソッドとは異なり、MA-RAGは特別なAIエージェントの協調的なセットを編成する。
本結果は,検索強化システムにおける協調的,モジュール型推論の有効性を浮き彫りにしたものである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:19:57 GMT)
BurstDeflicker: A Benchmark Dataset for Flicker Removal in Dynamic Scenes [36.4] 本稿では,3つの補完的なデータ取得戦略を用いて構築したスケーラブルなベンチマークであるBurstDeflickerを紹介する。
まず,フリック除去の目標を再定義するRetinexベースの合成パイプラインを開発する。
第2に、異なるシーンから4000個の現実世界のフリック画像をキャプチャし、実際のフリックアーティファクトの空間的および時間的特性をよりよく理解するのに役立つ。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:46:34 GMT)
GenoArmory: A Unified Evaluation Framework for Adversarial Attacks on Genomic Foundation Models [36.1] ゲノミック・ファンデーション・モデル(GFM)に対する最初の統合逆攻撃ベンチマークを提案する。
我々は,4つの広く採用されている攻撃アルゴリズムと3つの防衛戦略を用いて,最先端の5つのGFMの対角的ロバスト性を評価する。
GFMの安全性を向上させるために設計された新しい逆サンプルデータセットであるGenoAdvを紹介する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:03:20 GMT)
Blind Video Super-Resolution based on Implicit Kernels [36.0] Blind Super- resolution (BVSR) は、未知のシナリオにおいて低解像度の映像から高解像度の映像を生成することを目的とした低レベルのビジョンタスクである。
本稿では,暗黙的ニューラル表現によってパラメータ化されるマルチスケールカーネルを構成するImplicit Kernels(BVSR-IK)に基づく新しいモデルを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:23:05 GMT)
SwarmSys: Decentralized Swarm-Inspired Agents for Scalable and Adaptive Reasoning [35.8] SwarmSysは,Swarmインテリジェンスにインスパイアされた分散マルチエージェント推論のためのクローズドループフレームワークである。
我々は,SwarmSysが記号的推論,研究合成,科学プログラミングのタスクにおいて,ベースラインを一貫して上回っていることを示す。
これらの知見は、スケーラブルで堅牢で適応的なマルチエージェント推論のための、有望なパラダイムとして、Swarmにインスパイアされたコーディネーションを強調している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:28:22 GMT)
Clustering Result Re-guided Incomplete Multi-view Spectral Clustering [35.4] 我々は、再ガイドされた不完全なマルチビュースペクトルクラスタリング(CRG_IMSC)を提案する。
CRG_IMSCは、抽出した特徴に非負の制約を課することにより、クラスタリング結果を直接取得する。
スペクトルクラスタリングの結果に応じて接続行列を構築し、自己表現の残余を最小化する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:15:29 GMT)
Efficient Compositional Multi-tasking for On-device Large Language Models [35.0] テキストベースの合成マルチタスクの問題について検討し、各テスト例では複数のタスクを同時に実行する。
私たちのコントリビューションは、実世界のマルチタスクシナリオにおける大規模言語モデルの能力を向上し、複雑なリソース制約のあるユースケースに適用可能にするための基礎を築いてきました。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:28:47 GMT)
Translution: Unifying Self-attention and Convolution for Adaptive and Relative Modeling [34.8] 本稿では、自己認識の適応的識別能力と、畳み込みの相対的符号化能力を一体化する操作であるTranslutionを紹介する。
コンピュータビジョンと自然言語処理タスクの実験から、Translutionは自己意図よりも精度が高いことが示されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:54:10 GMT)
Text2Token: Unsupervised Text Representation Learning with Token Target Prediction [34.0] 教師なしテキスト表現学習(TRL)は、ウェブの未ラベルテキストによる検索とレコメンデーションを改善するのに有用である。
最近の実証的研究により、高品質な表現は入力テキストのキートークンと一致していることがわかった。
TRL, Text2Token のための教師なし生成フレームワークを開発した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:00:45 GMT)
Quantum Lower Bounds by Sample-to-Query Lifting [33.8] 本稿では,量子サンプル対クエリリフト定理を用いて,量子クエリの下界を証明するための新しい手法を提案する。
位相/振幅推定やハミルトニアンシミュレーションなど,いくつかの既知の下界に対する統一的な証明を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:28:09 GMT)
Answer-Consistent Chain-of-thought Reinforcement Learning For Multi-modal Large Langauge Models [33.4] 本稿では,GRPOアルゴリズムを補助的整合性チェックで修正するAnswer-Consistent Reinforcement Learningを提案する。
我々は、オリジナルとポストシャッフルの両方の回答が一致して正しい場合にのみ高い報酬を与える一貫性検証報酬を設計する。
我々は、ACREを挑戦的なビデオ推論ベンチマークとマルチモーダル数学推論ベンチマークで評価し、平均2.2%と1.5%の改善を達成した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:32:52 GMT)
SANTA: Separate Strategies for Inaccurate and Incomplete Annotation Noise in Distantly-Supervised Named Entity Recognition [33.0] 本稿では,2種類のノイズの異なる原因が,モデルアーキテクチャにおける異なる戦略の要求を引き起こすことを論じる。
メモリスムースなFocal Loss と Entity-aware KNN を用いて,これら2種類のノイズを別々に処理するためのSANTAを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:39:51 GMT)
Thinking Inside the Mask: In-Place Prompting in Diffusion LLMs [33.0] 拡散大言語モデル (dLLM) は、その双方向の注意機構と反復的改善プロセスを通じて、新たな機会を提示する。
我々は、プレフィックスのみのプロンプトをdLLM用に特別に設計されたインプレースプロンプトに変換する新しいフレームワークICEを紹介する。
GSM8Kでは4.12$times$スピードアップ、MMLUでは276.67$times$アクセラレーションで最大17.29%の精度向上を実現した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:43:03 GMT)
B2N3D: Progressive Learning from Binary to N-ary Relationships for 3D Object Grounding [32.8] 本稿では,3次元オブジェクトのグラウンド化のための新しいプログレッシブリレーショナル学習フレームワークを提案する。
我々は、世界規模で参照記述に一致する視覚的関係を識別するために、バイナリからn-aryへの関係学習を拡張した。
n-ary関係で生成されたシーングラフでは、ターゲットをさらにローカライズするために、ハイブリッドアテンション機構を備えたマルチモーダルネットワークを使用する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:17:12 GMT)
Safety-Aligned Weights Are Not Enough: Refusal-Teacher-Guided Finetuning Enhances Safety and Downstream Performance under Harmful Finetuning Attacks [32.7] ファインタニング・アズ・ア・サービス(F: Finetuning-as-a-Service)は、ユーザが自身のデータを使ってLarge Language Models(LLM)をカスタマイズできる機能である。
プライマリワークは、まず安全に整合したモデルを構築し、次にユーザデータ上でモデルを微調整することで、この問題を緩和しようとします。
本稿では,Refusal-Teacher(Ref-Teacher)誘導ファインタニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:41:14 GMT)
PANTHER: Generative Pretraining Beyond Language for Sequential User Behavior Modeling [32.4] 本稿では,ユーザ行動の事前学習と下流適応を統一するハイブリッドな生成識別フレームワークPANTHERを提案する。
PANTHERはWeChat Payのオンライン展開と運用をフルに行い、HitRate@1.5%で25.6%のアップを達成している。
パブリックベンチマークでのクロスドメイン評価は、強力な一般化を示し、最大21%のHitRate@1がトランスフォーマーベースラインを越えている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:24:19 GMT)
HealthFlow: A Self-Evolving AI Agent with Meta Planning for Autonomous Healthcare Research [32.2] 本稿では,新たなメタレベルの進化機構を通じて制限を克服する,自己進化型AIエージェントであるHealthFlowを紹介する。
HealthFlowは、手続き的な成功と失敗を永続的で構造化された知識ベースに蒸留することで、ハイレベルな問題解決ポリシーを自律的に洗練する。
私たちの実験では、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを実証しています。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:58:06 GMT)
Homomorphic Mappings for Value-Preserving State Aggregation in Markov Decision Processes [32.2] ホモモルフィック・ポリシー・グラディエント(HPG)は、十分な条件下での最適な政策等価性を保証する。
EBHPGは集約によって引き起こされる計算効率と性能損失のバランスをとる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:40:03 GMT)
On the Role of Transformer Feed-Forward Layers in Nonlinear In-Context Learning [31.9] トランスフォーマーベースのモデルは、パラメータを更新せずに、いくつかのプロンプト例から目に見えないタスクに適応できる、コンテキスト内学習(ICL)の驚くべき能力を示す。
最近の研究は、トランスフォーマーがICLを実行する方法を示し、最適線形自己アテンション(LSA)機構が線形最小二乗目的に対して勾配勾配の1ステップを実現できることを示した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:44:57 GMT)
Toward Machine Translation Literacy: How Lay Users Perceive and Rely on Imperfect Translations [31.5] 本研究では,公立博物館において,言語・非言語利用者の機械翻訳への依存度と精度の誤差がバイリンガルおよび非言語利用者に与える影響を調査する。
評価戦略や代替手段の欠如が原因で,非バイリンガルユーザをMTに過度に頼っている場合が多いが,エラーの影響を経験することで,将来的な信頼性の再評価が促されることが判明した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:45:14 GMT)
Ancora: Accurate Intrusion Recovery for Web Applications [31.2] Ancoraは、侵入機器を使わずにWebアプリケーションに正確な侵入回復を行うシステムである。
Ancoraを10のWebアプリケーションと、最大150の接続を持つ20のCVEベースの攻撃シナリオで評価した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:51:11 GMT)
A Comprehensive Survey on Retrieval Methods in Recommender Systems [31.2] 本調査では,レコメンデータシステムの重要かつ見落とされがちな検索段階について検討する。
高精度かつ効率的なパーソナライズされた検索を実現するために,既存の作業を3つの重要な領域にまとめる。
特定の企業における検索実践のケーススタディを通じて、現在の産業応用を取り上げる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:05:11 GMT)
Active Confusion Expression in Large Language Models: Leveraging World Models toward Better Social Reasoning [31.1] 大規模言語モデル(LLM)は、認知的混乱、論理的矛盾、および客観的世界状態と主観的信念状態の衝突を示す。
本研究では,動的テキスト世界モデルを構築し,実体状態と時間的シーケンスを追跡する適応的世界モデル拡張推論機構を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:57:45 GMT)
Reliable Decision Making via Calibration Oriented Retrieval Augmented Generation [30.8] 大規模言語モデルが自信を持って誤った情報を提供すると、人間に最適な決定を下すことになる。
本稿では、RAG による決定が適切に校正されていることを保証するCalibrated Retrieval-Augmented Generation (CalibRAG)を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:50:14 GMT)
ProGress: Structured Music Generation via Graph Diffusion and Hierarchical Music Analysis [30.7] 本稿では,Schenkerian Analysis (SchA) を拡散モデリングフレームワークに組み込んだ新しい生成音楽フレームワークを提案する。
人間実験の結果は、既存の最先端手法よりも優れた性能を示唆している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:06:56 GMT)
Load Balancing Mixture of Experts with Similarity Preserving Routers [30.3] Sparse Mixture of Experts (MoE)モデルは、大規模なニューラルネットワークをトレーニングするためのスケーラブルで効率的なアーキテクチャを提供する。
トークン単位のリレーショナル構造を保持する新しいロードバランシング損失を導入する。
その結果, ルータの損失は36%, 収束速度は36%向上し, 冗長性が低下することがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:22:55 GMT)
BabyBabelLM: A Multilingual Benchmark of Developmentally Plausible Training Data [30.0] BabyBabelLMは、人がネイティブ言語を取得するまで、出生から観察する言語をモデル化するデータセットの集合である。
我々は、45言語毎に1億の英単語をカバーし、発達的に妥当な事前学習データをキュレートする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:50:47 GMT)
Survey of Natural Language Processing for Education: Taxonomy, Systematic Review, and Future Trends [29.9] 我々は、NLPの最近の進歩を、教育領域に関連する問題の解決に焦点をあててレビューする。
教育領域におけるNLPの分類について述べるとともに,質問応答,質問構築,自動評価,誤り訂正など,典型的なNLPの応用に注目した。
対象と言語に関する一般化、LLMベースの教育システムの導入、教育と学習のための適応学習、教育の解釈可能性、NLP技術の倫理的考察を含む今後の研究の5つの方向性を結論づける。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:51:21 GMT)
ImmerIris: A Large-Scale Dataset and Benchmark for Immersive Iris Recognition in Open Scenes [29.8] ImmerIrisはVRヘッドセットで収集された最大のデータセットで、564人の被験者の499,791枚の眼画像を収録している。
本稿では、最小限の調整で視線画像から学習する正規化自由パラダイムを提案する。
単純さにもかかわらず、このアプローチは正規化ベースの手法よりも一貫して優れている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:43:38 GMT)
Think in Safety: Unveiling and Mitigating Safety Alignment Collapse in Multimodal Large Reasoning Model [29.6] 5つのベンチマークでMLRM(Multimodal Large Reasoning Model)11の安全性評価を行う。
分析の結果、異なるベンチマークで異なる安全性パターンが明らかになった。
これは、モデル固有の推論能力を活用して安全でない意図を検出することで、MLRMの安全性問題に対処する潜在的アプローチである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:30:40 GMT)
On-device System of Compositional Multi-tasking in Large Language Models [29.6] 本稿では,要約と翻訳を含む構成的マルチタスクシナリオに特化して設計された新しいアプローチを提案する。
本手法では,要約と翻訳の併用により学習可能なプロジェクション層を付加する。
構成タスクをシームレスに実行可能なAndroidアプリを開発することにより,デバイス上の環境下での本手法の実用性を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:49:22 GMT)
RLFR: Extending Reinforcement Learning for LLMs with Flow Environment [29.4] RLVR(Reinforcement Learning with Verifiable Rewards)は、大規模言語モデル(LLM)における推論能力向上のための有望なフレームワークとして登場した。
本稿では, モデル潜水剤の流れ場を, オフ・ポリティクス・高品質データとオン・ポリティクス・リジェクション・サンプリングデータから構築し, その内部の政策潜水剤の速度偏差を定量化し, 報酬信号として機能するRLFRを提案する。
言語およびマルチモーダル推論ベンチマークの実験は、フロー報酬の信頼性を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:00:25 GMT)
From Generic to Specialized: A Subspecialty Diagnostic System Powered by Self-Supervised Learning for Cervical Histopathology [29.4] 本稿では,Cervical Sub-Path (CerS-Path) 診断システムについて紹介する。
11万のスライドから1億9000万の組織パッチを自己教師付きで学習し、頸部特異的な特徴抽出装置を構築する。
250万のイメージテキストペアによるマルチモーダルエンハンスメント、続いて複数の下流診断機能との統合。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:22:35 GMT)
Intelligent Agents with Emotional Intelligence: Current Trends, Challenges, and Future Prospects [29.2] Affective Computingは、人間の感情を認識し、誘発し、表現できるインテリジェントなシステムを設計することを目的としている。
本稿では,感情システム開発における課題と課題を特定し,分析する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:40:36 GMT)
Multi-View Graph Learning with Graph-Tuple [29.1] 効率的なグラフニューラルネットワーク(GNN)のためのマルチビューグラフタプルフレームワークを提案する。
グラフタプルフレームワークはグラフを1つのグラフの代わりに非結合部分グラフに分割し、主要な局所的な相互作用とより弱い長距離接続をキャプチャする。
我々は2つの科学的領域の枠組みをインスタンス化し、特徴量を持つクーロン行列からの分子特性予測と幾何学的点雲からの宇宙パラメータ推定を行う。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:57:03 GMT)
STRAP: Spatio-Temporal Pattern Retrieval for Out-of-Distribution Generalization [29.1] 本稿では,時空間探索型パターン学習フレームワークSTRAPを提案する。
推論中、STRAPは現在の入力と類似性に基づいてライブラリから関連するパターンを検索し、プラグイン・アンド・プレイ・プロンプト機構を介してモデルに注入する。
複数の実世界のストリーミンググラフデータセットに対する実験によると、STRAPはSTOODタスクの最先端STGNNベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:13:36 GMT)
Effective programming of a photonic processor with complex interferometric structure [29.0] 非従来型アーキテクチャで再構成可能なフォトニック回路を用いて実装した変換のプログラミングを成功例として示す。
我々は、異なる初期データセットに依存した2つのアルゴリズムを用いて、複雑な干渉計の回路モデルを再構成し、必要なユニタリ変換をプログラムする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:04:40 GMT)
SecureWebArena: A Holistic Security Evaluation Benchmark for LVLM-based Web Agents [28.6] 大規模視覚言語モデル(LVLM)ベースのWebエージェントは、複雑なオンラインタスクを自動化する強力なツールとして登場しつつある。
既存のベンチマークは部分的カバレッジのみを提供し、通常は狭いシナリオに限定される。
LVLMベースのWebエージェントのセキュリティを評価するための,最初の総合的なベンチマークであるツールを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:18:12 GMT)
Robust Learning of Diffusion Models with Extremely Noisy Conditions [28.5] 条件拡散モデルは外部条件を取り入れることで生成的制御性を持つ。
本稿では,条件付き拡散モデルにおいて,非常にノイズの多い条件に対処する頑健な学習フレームワークを提案する。
提案手法は,クラス条件画像生成タスクとビズモータポリシー生成タスクの両方において,様々なノイズレベルにまたがる最先端性能を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:16:15 GMT)
Pre-Training and Personalized Fine-Tuning via Over-the-Air Federated Meta-Learning: Convergence-Generalization Trade-Offs [28.3] 本稿では、事前学習フェーズに参加するエージェントが共有無線チャンネルを介してサーバに接続される無線環境におけるメタpFLの一般化性能について検討する。
本稿では,新しいエージェントとタスクへの一般化と,一方で収束のトレードオフについて検討する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:21:56 GMT)
Improving Speech Emotion Recognition with Mutual Information Regularized Generative Model [28.1] クロスモーダル情報転送と相互情報正規化を支援するデータ拡張フレームワークを提案する。
このフレームワークはIEMOCAP, MSP-IMPROV, MSP-Podcastの3つのベンチマークデータセットでテストした。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:29:32 GMT)
MedAgentAudit: Diagnosing and Quantifying Collaborative Failure Modes in Medical Multi-Agent Systems [28.0] 大規模言語モデル(LLM)に基づくマルチエージェントシステムは,医療相談のシミュレーションにおいて有望であることを示す。
しかし、その評価は最終回答精度に制限されることが多い。
この慣行は、内部の協調プロセスを不透明な「ブラックボックス」として扱う
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:48:57 GMT)
Knowledge-Level Consistency Reinforcement Learning: Dual-Fact Alignment for Long-Form Factuality [27.7] 幻覚と事実性の欠如は、大きな言語モデルの信頼性にとって重要な障害である。
本稿では,政策モデルの表現された知識と基本モデルのパラメトリック知識との知識整合性に着目した新しい枠組みを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:51:40 GMT)
CLMN: Concept based Language Models via Neural Symbolic Reasoning [27.3] 概念言語モデルネットワーク(CLMN)は、パフォーマンスと解釈可能性の両方を維持するニューラルシンボリックフレームワークである。
CLMNは、連続的、人間可読な埋め込みとして概念を表現している。
Modelは、概念を意識した表現でオリジナルのテキスト機能を拡張し、解釈可能なロジックルールを自動的に誘導する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:58:44 GMT)
Preference-driven Knowledge Distillation for Few-shot Node Classification [27.2] グラフニューラルネットワーク(GNN)は、テキスト分散グラフ(TAG)を効率的に処理できる
LLMは、TAG上でゼロ/フェーショットの学習でうまく機能するが、スケーラビリティの課題に悩まされている。
本稿では,LLMと各種GNNの相補的強みを相乗化するための選好駆動型知識蒸留(PKD)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:48:47 GMT)
Generative Latent Video Compression [27.0] 本稿では,知覚的ビデオ圧縮の有効なフレームワークであるジェネレーティブ・ラテント・ビデオ圧縮(GLVC)を提案する。
GLVCは、ビデオフレームを知覚的に整列された潜在空間に投影するために、事前訓練された連続トークンを使用する。
GLVC は DISTS と LPIPS の指標で最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:28:49 GMT)
SMELLNET: A Large-scale Dataset for Real-world Smell Recognition [26.3] SmellNetは、自然界で多様な匂いをデジタル化する最初の大規模データベースである。
ScentFormerは、時間差分とスライディングウインドウを併用したTransformerベースのアーキテクチャである。
ScentFormerとSmellNetは、医療、食品、飲料、環境モニタリング、製造、エンターテイメントなど、現実世界の嗅覚アプリケーションの基礎を作った。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:40:53 GMT)
On the Surprising Effectiveness of a Single Global Merging in Decentralized Learning [26.2] 我々は、グローバルな一般化を改善するために、どのようにコミュニケーションをスケジュールするかを検討する。
単一のグローバルマージによって実装された最終段階における完全接続通信は、一般化性能を著しく向上させることができる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:58:05 GMT)
P-4DGS: Predictive 4D Gaussian Splatting with 90$\times$ Compression [26.1] 3D Gaussian Splatting (3DGS) は、シーン表現の忠実さとリアルタイムレンダリング性能が優れており、注目されている。
有望な結果を得たにもかかわらず、既存のアルゴリズムのほとんどは、動的シーンに固有の時間的および空間的冗長性を見落としている。
コンパクトな4次元シーンモデリングのための新しい動的3DGS表現であるP-4DGSを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:19:41 GMT)
Temporal Logic-Based Multi-Vehicle Backdoor Attacks against Offline RL Agents in End-to-end Autonomous Driving [26.1] 我々は、1台以上の車両の軌道をトリガーとして利用するエンド・ツー・エンドADシステムに対する新たなバックドア攻撃を導入する。
我々は、トリガーに似ているがバックドアを起動しないパッチトラジェクトリを組み込むことで、負のトレーニング戦略を開発する。
提案攻撃の柔軟性と効果を実証し、既存のエンドツーエンドADシステムの脆弱性を調査する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:46:17 GMT)
DUMP: Automated Distribution-Level Curriculum Learning for RL-based LLM Post-training [25.9] 本稿では,分布レベルの学習可能性の概念に基づくカリキュラム学習フレームワークを提案する。
我々のフレームワークは、高い平均的優位性(探索)または低いサンプル数(探索)で分布を優先順位付けする。
実験の結果,本フレームワークは収束速度と最終性能を大幅に改善することがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:08:06 GMT)
Don't Just Fine-tune the Agent, Tune the Environment [25.7] 合成データの微調整の監督は、過度な適合につながる。
標準的な強化学習は、重要なコールドスタート問題とトレーニング不安定性に苦慮している。
本研究は,静的軌道の教師付き微調整から動的環境探索へのパラダイムシフトを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:35:15 GMT)
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? [25.6] 人間は、様々な情報源からの知識を統合することで、顕著な構成的推論を示す。
本稿では,このスキルを再現する上でのトランスフォーマーの可能性を検証するための合成学習タスクを提案する。
数発のChain-of-Thoughtプロンプトにより、TransformersはFTCT上でコンストラクショナル推論を行うことができる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:08:16 GMT)
NaviMaster: Learning a Unified Policy for GUI and Embodied Navigation Tasks [25.2] NaviMasterはGUIナビゲーションを統一し、単一のフレームワーク内でナビゲーションを具体化する最初の統合エージェントである。
NaviMasterは,GUIナビゲーション,空間空き時間予測,具体化ナビゲーションにおいて,最先端のエージェントよりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:21:15 GMT)
TRIM: Achieving Extreme Sparsity with Targeted Row-wise Iterative Metric-driven Pruning [25.0] LLM(Large Language Models)は、その規模が大きいため、計算と記憶に重大な課題がある。
既存のワンショットプルーニング手法は、層間または各層内で均一なスペーサ性制約を適用することが多い。
この研究は、各層内の個々の出力次元(ロウ)に様々な空間比を適用する新しいアプローチを導入している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:28:13 GMT)
Adaptive Dual Reasoner: Large Reasoning Models Can Think Efficiently by Hybrid Reasoning [24.8] 本稿では,2つの推論モード – 高速思考とスロー思考 – をサポートするアダプティブデュアル推論手法を提案する。
ADRは、推論中の文脈的複雑さに基づいて、これらのモードを交互に扱う。
最先端アプローチ間の推論性能と効率の効果的なバランスを実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:14:17 GMT)
SGM: A Statistical Godel Machine for Risk-Controlled Recursive Self-Modification [24.3] 安全編集のための最初の統計アーキテクチャである統計ゴデルマシン(SGM)を紹介する。
SGMは証明に基づく要求を統計的信頼テスト(e-values, Hoeffding bounds)に置き換え、選択された信頼度レベルで優越性が証明された場合にのみ修正を認める。
また,提案するCTHS(Confirm-Triggered Harmonic Spending)も提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:09:37 GMT)
Jailbreaking Commercial Black-Box LLMs with Explicitly Harmful Prompts [24.2] 商用ブラックボックスモデルの脱獄は、今日最も困難で深刻なセキュリティ脅威の1つだ。
本稿では, 文脈シミュレーションを強化するD-Attackと, 疑似連鎖による攻撃を強化するDH-CoTの2つの開発者ロールベースの攻撃を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:00:50 GMT)
RIPRAG: Hack a Black-box Retrieval-Augmented Generation Question-Answering System with Reinforcement Learning [24.0] 本稿では,ターゲットRAGシステムをブラックボックスとして扱うエンドツーエンド攻撃パイプラインを提案する。
本手法は,ほとんどの複雑なRAGシステムに対する毒性攻撃を効果的に実行できることを実証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:23:20 GMT)
Local-Global Context-Aware and Structure-Preserving Image Super-Resolution [23.9] 安定拡散(Stable Diffusion)のような事前訓練されたテキスト・ツー・イメージモデルは、リアルな画像コンテンツを合成する強力な能力を示した。
本稿では,局所的およびグローバルな画素関係を効果的に維持する,文脈的に正確な画像超解像フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:17:31 GMT)
Tree Search for LLM Agent Reinforcement Learning [23.7] Tree-based Group Relative Policy Optimization (Tree-GRPO) は、木探索に基づくグループ化エージェントRL法である。
共通のプレフィックスを共有することで、ツリー検索サンプリングは、達成可能なロールアウトの数を増やす。
木レベルでの相対的政策最適化の目的は、ステップレベルの直接選好学習と同等であることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:55:47 GMT)
MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output [23.5] 既存のモデルは2つの問題に直面している。入力の場合、モデルはテキスト命令のみに依存し、画像の視覚的手がかりを直接理解できない。
マルチモーダル入力と画素接地によるマルチモーダル出力を視覚的に参照する統合医療ビジョン言語モデルを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:29:09 GMT)
Kernel Treatment Effects with Adaptively Collected Data [23.4] 本稿では,適応データ収集における分散推論のための最初のカーネルベース推論フレームワークを提案する。
本手法は,Hilbert-space Martingale CLTによる2つの頑健なスコアと分散安定化を組み合わせることで,正規性を確保する。
実験により、平均シフトとより高いモーメント差の両方に有効かつ効果的であることが示されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:01:21 GMT)
CTR-LoRA: Curvature-Aware and Trust-Region Guided Low-Rank Adaptation for Large Language Models [23.3] CTR-LoRAは、ランクスケジューリングと安定性を考慮した最適化を統合している。
複数のオープンソースバックボーン(7B-13B)の実験では、強力なPEFTベースラインよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:05:56 GMT)
VL Norm: Rethink Loss Aggregation in RLVR [23.2] RLVR(Reinforcement Learning with Verifiable Rewards)における動的生成長の特性に合わせた損失集約手法を提案する。
理論的にも経験的にも,様々な長さが政策損失に与える影響を解析することにより,最小分散非バイアス推定器として問題を再検討する。
我々の提案したVLノルムは、真の政策損失の偏りのない見積もりを提供するだけでなく、理論の勾配分散を最小化する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:50:09 GMT)
Beyond the limitation of a single query: Train your LLM for query expansion with Reinforcement Learning [23.1] Reasoning-augmented search agent, such as Search-R1, are trained to reason, search, and generate the final answer repeateratively。
我々は、強化学習によるクエリ拡張のネイティブ機能を備えたLLMベースの検索エージェントを訓練する。
シュレッシャーモデルの助けを借りて,小型の3B LLMでもクエリ拡張の強力な能力を実証できることが判明した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:23:30 GMT)
VividAnimator: An End-to-End Audio and Pose-driven Half-Body Human Animation Framework [22.5] VividAnimatorは、オーディオとスパースハンドポーズ条件によって駆動される高品質な半体アニメーションを生成するエンドツーエンドフレームワークである。
オンラインコードブックトレーニングの不安定性と高コストを克服するため、私たちは、リッチで高忠実な手テクスチャをエンコードするハンドクラリティー・コードブックを事前訓練しました。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:04:56 GMT)
CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms [22.5] textbfCardRewriterは、ドメイン固有の知識を取り入れたフレームワークで、ロングテールクエリの書き直しを強化します。
CardRewriterは、プロプライエタリなコンテンツをターゲットにしたクエリの書き換え品質を大幅に改善する。
中国最大のショートビデオプラットフォームであるKuaishouに毎日数億人のユーザーがサービスを提供している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:09:14 GMT)
Gradient-based Model Shortcut Detection for Time Series Classification [22.2] 深層学習時系列分類におけるポイントベースショートカット学習行動の調査と確立のための第一歩を踏み出した。
本稿では,テストデータやクリーントレーニングクラスに頼ることなく,他のクラスをベースとした簡易検出手法を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:21:33 GMT)
ReMix: Towards a Unified View of Consistent Character Generation and Editing [22.0] ReMixは、文字一貫性の生成と編集のための統一されたフレームワークである。
ReMixモジュールとIP-ControlNetという2つのコアコンポーネントで構成されている。
ReMixはパーソナライズされた生成、画像編集、スタイル転送、マルチ条件合成など、幅広いタスクをサポートしている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:31:56 GMT)
Gesplat: Robust Pose-Free 3D Reconstruction via Geometry-Guided Gaussian Splatting [22.0] 本稿では、3DGSベースのフレームワークであるGesplatを紹介し、ロバストな新しいビュー合成と、未提示のスパース画像からの幾何的に一貫した再構成を可能にする。
提案手法は,他のポーズフリー手法と比較して,前方および大規模の複雑なデータセット上でより堅牢な性能を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:13:46 GMT)
ADEPT: Continual Pretraining via Adaptive Expansion and Dynamic Decoupled Tuning [21.7] 大規模言語モデル(LLM)ドメイン適応のための従来の継続事前訓練(CPT)は、しばしば忘れることと限られたドメイン容量に悩まされる。
本稿では,ドメイン適応型CPTのための2段階フレームワークであるADEPT,Adaptive Expansion,Dynamic Decoupled Tuningを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:14:50 GMT)
Any-stepsize Gradient Descent for Separable Data under Fenchel-Young Losses [21.4] emphFenchel-Young損失の枠組みに基づく一般損失関数に対して任意のステップの勾配収束を示す。
我々は、自己有界性の代わりに損失関数の分岐マージンによって、これらのより良いレートが可能であると論じる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:44:33 GMT)
Benchmarking and Bridging Emotion Conflicts for Multimodal Emotion Reasoning [21.3] 現実的な感情対立下でMLLMを調べるための新しいベンチマークであるCA-MERを紹介する。
評価の結果,現在最先端の感情MLLMは感情衝突時の音声信号に過度に適応していることが明らかとなった。
バランスの取れたモダリティ統合を促進するパラメータ効率のよいフレームワークであるMoSEARを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:15:43 GMT)
Are Video Models Emerging as Zero-Shot Learners and Reasoners in Medical Imaging? [21.3] 4つのタスクからなるゼロショット設定において,大きな視覚モデル(LVM)を評価する。
このモデルはCTスキャンで解剖学的構造を記述し、セグメンテーション、デノナイジング、モーション予測における競合性能を達成することができる。
122例の4次元CTデータに対するLVMの評価を行い,3次元CTボリュームは1,820例以上であった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:19:03 GMT)
Think Twice to See More: Iterative Visual Reasoning in Medical VLMs [21.1] 私たちは、人間の専門家の反復的推論プロセスをエミュレートするフレームワークViTARを紹介します。
ViTARは、医療画像をインタラクティブなオブジェクトとして扱い、モデルが多段階の視覚的推論を行えるようにする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:39:57 GMT)
MMHOI: Modeling Complex 3D Multi-Human Multi-Object Interactions [21.0] 本稿では,12の日常シナリオの画像からなる大規模多目的インタラクションデータセットMMHOIを提案する。
MMHOIは、すべての人やオブジェクトに対して完全な3D形状とアノテーションを提供し、78のアクションカテゴリと14のインタラクション固有のボディパーツのラベルを提供する。
MMHOI-Netは、人間と物体の3次元空間、それらの相互作用、および関連する動作を共同で推定するエンド・ツー・エンドのトランスフォーマーベースのニューラルネットワークである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:18:43 GMT)
Weed Out, Then Harvest: Dual Low-Rank Adaptation is an Effective Noisy Label Detector for Noise-Robust Learning [20.8] Deloraはモデルトレーニングからサンプル選択を分離するフレームワークである。
サンプル選択のために、Deloraはクリーンでノイズの多いLoRAを導入してノイズの多いラベル検出器を確立する。
モデルトレーニングでは、慎重に選択されたサンプルを使用して、言語モデルをシームレスに微調整することができる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:16:28 GMT)
LLMSynthor: Macro-Aligned Micro-Records Synthesis with Large Language Models [20.8] LLM Synthorは、ターゲットのマクロ統計と一致した現実的なマイクロレコードを生成するマクロ認識シミュレータである。
合成データセットを反復的に構築し、合成アグリゲーションとターゲットアグリゲーションの差を最小限に抑える。
強力な現実主義、統計的忠実さ、実用性を実現し、経済学、社会科学、都市研究に広く応用されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:37:31 GMT)
Improving Hierarchical Representations of Vectorized HD Maps with Perspective Clues [20.7] 我々は、インスタンスとポイントの両レベルでの視点的特徴からヒントを利用するPerCMapを提案する。
PerCMapは、それぞれ67.1mAPと70.5mAPに到達し、ベンチマーク全体で強力で一貫したパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:29:29 GMT)
Pharmacist: Safety Alignment Data Curation for Large Language Models against Harmful Fine-tuning [20.4] 有害な微調整問題は、大規模言語モデルにおける微細チューニング・アズ・ア・サービスにとって重大な安全性上の課題である。
ワクチン、Repnoise、Booster、T-Vaccineは、アライメントフェーズにおけるモデルの堅牢性を高めることで有害な微調整問題を緩和する。
そこで我々は, 高品質で安全に重要なコアサブセットを元のアライメントデータから選択することで, 有害な微調整に対する防御を強化する安全アライメントデータキュレーションソリューションであるPharmacistを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:55:55 GMT)
Multi-Scale Diffusion Transformer for Jointly Simulating User Mobility and Mobile Traffic Pattern [20.2] MSTDiffはモバイルトラフィックとユーザトラジェクトリの同時シミュレーションのためのマルチスケール拡散変換器である。
トラフィックと軌道生成タスクの最先端のベースラインを超えている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:45:39 GMT)
TriangleMix: Accelerating Prefilling via Decoding-time Contribution Sparsity [20.1] トレーニング不要な静的アテンションパターンであるTriangleMixを提案する。
128Kの入力に対して、Triangle attentionは注意計算の15.3倍の高速化を実現し、典型的なダイナミックスパース法の高速化をはるかに上回っている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:15:39 GMT)
EvoEdit: Evolving Null-space Alignment for Robust and Efficient Knowledge Editing [19.8] 大規模言語モデル(LLM)は、時代遅れまたは誤った知識を正すために継続的な更新を必要とする。
既存のアプローチは主に位置対応のフレームワークに基づいている。
本稿では,連続的なヌル空間アライメントによる破滅的干渉を緩和する新しい編集戦略であるEvoEditを紹介する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:36:14 GMT)
Reasoning-Enhanced Large Language Models for Molecular Property Prediction [19.7] 分子特性予測は、薬物発見と物質科学にとって不可欠である。
既存のアプローチは、限定的な解釈可能性、クロスタスクの一般化の貧弱、化学的推論能力の欠如に悩まされている。
分子特性予測に化学推論を組み込んだ多モーダル大言語モデルMPPReasonerを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:05:45 GMT)
What Makes Looped Transformers Perform Better Than Non-Recursive Ones (Provably) [19.5] ループ変換器は複雑な推論タスクにおいて標準変換器より優れていることが多い。
我々はLooped-AttnがRiver-V-Valleyに対してランドスケープレベルの帰納バイアスをもたらすと推測する。
本稿では,Looped-Attnのトレーニングプロセスを高速化し,同等のパフォーマンスを実現するためのトレーニングフレームワークShiftを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:59:25 GMT)
Hope vs. Hate: Understanding User Interactions with LGBTQ+ News Content in Mainstream US News Media through the Lens of Hope Speech [19.4] われわれは、ユーザーがYouTubeでLGBTQ+ニュースコンテンツをどう扱うかを分析する。
LGBTQ+の健康を専門とする公衆衛生専門家と相談し,注釈研究を行った。
詳細なラベルと詳細なアノテータ統計情報を備えた3750のインスタンスのデータセットをリリースする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:29:40 GMT)
SimKey: A Semantically Aware Key Module for Watermarking Language Models [19.1] 透かしの堅牢性を強化するセマンティックキーモジュールであるSimKeyを紹介する。
SimKeyはセマンティック埋め込みよりも局所性に敏感なハッシュを使用して、パラフレーズ付きテキストが同じ透かしキーを生成する。
言い換えや翻訳に対する透かしの堅牢性を向上し、有害な内容が偽の帰属を防ぎます。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:07:54 GMT)
SyncLipMAE: Contrastive Masked Pretraining for Audio-Visual Talking-Face Representation [18.7] 本稿では、対話型ビデオのための自己教師型事前学習フレームワークSyncLipMAEを紹介する。
ラベル付けされていないオーディオ・ビジュアルストリームから同期認識と転送可能な顔のダイナミクスを学ぶ。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:12:44 GMT)
Disentangling Feature Structure: A Mathematically Provable Two-Stage Training Dynamics in Transformers [18.7] 本稿では, 変圧器における2段階トレーニングのダイナミクスについて理論的に検証する。
我々の知る限り、これはトランスにおける特徴レベルの2段階最適化プロセスに関する最初の厳密な結果である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:45:15 GMT)
Mediator-Guided Multi-Agent Collaboration among Open-Source Models for Medical Decision-Making [18.6] 多様な視覚言語モデル(VLM)の盲目の組み合わせは、誤った結果の解釈を増幅することができる。
医療マルチモーダル意思決定のためのメディエータ誘導型マルチエージェント協調フレームワークであるMedOrchを提案する。
我々は、異なるVLMエージェント内の協調が、個々のエージェントの能力を超えることができることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:01:05 GMT)
$k$-SVD with Gradient Descent [18.3] 任意の階数 $d geq 1$ の行列に対して、$k$-SVD を証明できるような、ステップサイズ選択のための単純で普遍的な規則を持つ勾配退化法を提案する。
我々の収束解析により、勾配法は魅力的な領域を持ち、この領域ではヘロン法のように振る舞う(バビロニア法)。
解析結果から,ネステロフの運動量に基づく加速度法により勾配法を拡張できることが示唆された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:05:36 GMT)
SatDreamer360: Multiview-Consistent Generation of Ground-Level Scenes from Satellite Imagery [18.1] 衛星画像から幾何的に一貫した地上レベルのパノラマを生成するフレームワークであるSatDreamer360を提案する。
実験により、SatDreamer360は衛星と地上のアライメントとマルチビューの整合性の両方において既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:45:03 GMT)
LinearRAG: Linear Graph Retrieval Augmented Generation on Large-scale Corpora [17.9] Retrieval-Augmented Generation (RAG) は大規模言語モデル(LLM)の幻覚を軽減するために広く用いられている。
既存のグラフベースのRAG法は、グラフ構築のための不安定でコストのかかる関係抽出に依存している。
信頼性の高いグラフ構築と正確な経路抽出を可能にする効率的なフレームワークであるLinearRAGを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:43:45 GMT)
Mitigating Hallucination in Multimodal Reasoning via Functional Attention Control [17.7] 幻覚は依然として持続的な失敗モードであり、誤った推論連鎖と視覚的内容の誤解釈として現れている。
本研究は,注目頭部が段階的分割を示し,浅い頭部が主に知覚に役立ち,深い頭部が象徴的推論に傾いていることを観察する。
本稿では,2段階の軽量で解釈可能な機能的頭部識別とクラス言語再スケーリングを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:54:41 GMT)
ALLOY: Generating Reusable Agent Workflows from User Demonstration [17.3] 大規模言語モデル(LLM)により、エンドユーザは自然言語を介して複雑なタスクを自律エージェントに委譲できる。
ユーザは、タスクの手続き的な要件を指定するのに苦労することが多い。
あるタスクに対する'successful'プロンプトは、同じタスクで再利用できないし、一般化できないこともある。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:30:34 GMT)
PIXEL: Adaptive Steering Via Position-wise Injection with eXact Estimated Levels under Subspace Calibration [17.2] ウェブ上での大規模言語モデル(LLM)のための位置対応型アクティベーションステアリングフレームワークを提案する。
PIXELは2つのビューからプロパティ整列部分空間を学習し、制約された幾何学的目的を通して介入強度を選択する。
PIXELは、モデル一般機能を維持しながら、属性アライメントを一貫して改善する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:13:34 GMT)
Automated Alignment of Math Items to Content Standards in Large-Scale Assessments Using Language Models [17.2] 本研究では,4つのドメインと19のスキルラベルを連携させる3つの自動パラダイムを評価する。
8つのBERTモデルとその変種をドメインおよびスキルアライメントの両方に微調整した。
アンサンブルモデルは最高の性能を持つ言語モデルを超えなかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:17:12 GMT)
Bridging Perspectives: Foundation Model Guided BEV Maps for 3D Object Detection and Tracking [16.9] カメラによる3Dオブジェクトの検出と追跡は、自律運転における認識に不可欠である。
現在の最先端のアプローチは、しばしば視点ビュー(PV)または鳥眼ビュー(BEV)の機能にのみ依存する。
PVとBEVの両方のカメラ画像機能を備えたハイブリッド検出・トラッキングフレームワークであるDualViewDistillを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:01:42 GMT)
CLIP-IN: Enhancing Fine-Grained Visual Understanding in CLIP via Instruction Editing Data and Long Captions [16.9] CLIP-IN(CLIP-IN)は、2つのコアイノベーションを通じてCLIPの微粒な認識を促進する新しいフレームワークである。
まず、画像操作用に設計された命令編集データセットを、ハードネガティブな画像テキストペアのユニークな情報源として活用する。
第二に、CLIP-INは長いキャプションを組み込み、回転する位置エンコーディングを利用して、標準のCLIPでしばしば見逃されるリッチなセマンティックコンテキストをキャプチャする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:51:14 GMT)
PointMAC: Meta-Learned Adaptation for Robust Test-Time Point Cloud Completion [16.9] ポイントクラウドの完成は、ロボティクスや拡張現実といった安全クリティカルなアプリケーションにおいて、堅牢な3D認識に不可欠である。
既存のモデルは静的推論を行い、トレーニング中に学んだ帰納バイアスに大きく依存する。
我々は,ポイントクラウド完了時の堅牢なテスト時間適応のためのメタ学習フレームワークであるPointMACを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:13:17 GMT)
NEP: Autoregressive Image Editing via Next Editing Token Prediction [16.7] 本稿では,自動回帰画像生成に基づくNext Editing-token Prediction(NEP)として画像編集を定式化することを提案する。
我々のモデルは、ゼロショット方式でその生成を反復的に精錬することで、テスト時間スケーリング(TTS)を自然にサポートします。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:20:29 GMT)
Diversity Augmentation of Dynamic User Preference Data for Boosting Personalized Text Summarizers [16.6] $mathrmPerAugy$は、新しいクロストラジェクトリシャッフルと要約コンテンツ摂動技術である。
個人化された要約フレームワークで一般的に使用される4つの最先端ベースライン(SOTA)ユーザエンコーダの精度を大幅に向上させることを示す。
聴覚による拡張データセットにおける誘導的多様性の役割のポストホック分析として,3つのデータセットの多様性指標を紹介した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:40:20 GMT)
MetaBreak: Jailbreaking Online LLM Services via Special Token Manipulation [16.5] 大規模言語モデルの微調整プロセス中に、構造化された会話に注釈を付けるために特別なトークンが作成されます。
攻撃プリミティブを4つ構築するために特別なトークンを利用することができることを示す。
本手法は,コンテンツモデレーションが展開されない場合,SOTAプロンプトエンジニアリングソリューションに匹敵するジェイルブレイク率を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:14:56 GMT)
Text-Based Approaches to Item Alignment to Content Standards in Large-Scale Reading & Writing Tests [16.5] 本研究では、自動項目アライメントのための微調整小言語モデル(SLM)の性能について検討した。
学習用入力データの種類とサイズが与える影響について検討した。
その結果、微調整されたSLMは埋め込みベースの教師あり機械学習モデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:43:08 GMT)
A Comparative Study of Android Performance Issues in Real-world Applications and Literature [16.3] 実世界のアプリケーションや文献におけるAndroidのパフォーマンス問題に関する大規模な比較研究を行っている。
以上の結果から,研究者,開発者,ユーザの主なパフォーマンス上の問題に,大きな違いがあることが判明した。
コミュニティにとって、これらのギャップを埋め、パフォーマンス問題の包括的な検出と解決を達成するための努力を強化することが重要です。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:39:22 GMT)
Teaching LLM to be Persuasive: Reward-Enhanced Policy Optimization for Alignment frm Heterogeneous Rewards [16.2] 我々は,大規模言語モデル(LLM)をビジネス開発(BD)エージェントとして展開し,オンライン旅行代理店(OTA)における説得的価格交渉を行う。
Reward-Enhanced Policy Optimization (REPO) は、LLMを不均一な報酬と整合する強化学習後学習フレームワークである。
RMとRJとRF信号を組み合わせることで、報酬のハッキングを抑え、交渉の質を向上させるため、簡単な拡張機構が提案されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:15:07 GMT)
The Achilles' Heel of LLMs: How Altering a Handful of Neurons Can Cripple Language Abilities [16.2] 大規模言語モデル(LLM)は自然言語処理の基礎となるツールとなっている。
近年の研究では、人間の脳内の生物学的ニューロンのごく一部が、コア認知機能に欠かせないことが判明している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:39:09 GMT)
Meronymic Ontology Extraction via Large Language Models [16.1] オンロジは、膨大な量の非構造化テキストを整理する手段として、今日のデジタル時代に欠かせないものとなっている。
本稿では,テキストからメロニメを抽出する完全自動手法を開発する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:54:38 GMT)
Adversarial Attacks on Downstream Weather Forecasting Models: Application to Tropical Cyclone Trajectory Prediction [16.1] 本稿では,DLWFモデルの上流予測を妨害し,対向軌道を生成する新しい手法であるCyc-Attackを提案する。
このような制約を克服するために, DLWFモデルの上流予測を摂動させ, 対角軌道を生成する新しい手法であるCyc-Attackを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:42:16 GMT)
Neural Surveillance: Live-Update Visualization of Latent Training Dynamics [16.0] SentryCamは、学習を通して隠された表現の進行を追跡する視覚化フレームワークである。
SentryCamは、最小レイテンシで進化する表現空間を高忠実に視覚化する。
本稿では,SentryCamのモデル監査の実用性について,トレーニング不安定性に関するケーススタディを通して実証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:24:37 GMT)
Transparent and Robust RAG: Adaptive-Reward Reinforcement Learning for Decision Traceability [15.9] Adaptive-Rewarded Evidence Navigation Agent (ARENA)は、RLを介してトレーニングされた透明で堅牢なRAGジェネレータフレームワークである。
構造化されたプロトコル、KL分散安定化および適応報酬計算モジュールに基づいて、ARENAはRAGジェネレータが鍵証拠を識別し、構造化推論を行い、解釈可能な決定トレースで回答を生成する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:41:27 GMT)
Dejavu: Post-Deployment Learning for Embodied Agents via Experience Feedback [15.9] 本稿では,デジャヴ(Dejavu)というポストデプロイ学習フレームワークを提案する。
EFN(Experience Feedback Network)を採用し、凍結したVision-Language-Actionポリシーを、検索した実行メモリで拡張する。
EFNは文脈的に成功した事前アクション体験と条件アクション予測を自動的に識別する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:43:58 GMT)
An information theorist's tour of differential privacy [15.9] 差分プライバシーは 確率分布の違いでリスクを測る
微分プライベートアルゴリズムは、基礎となるデータと解析の出力の間のチャネルである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:54:05 GMT)
Concise Reasoning in the Lens of Lagrangian Optimization [15.9] 本稿では,PALU(Principald Strategy, Performance-Aware length update)を導入する。
原理的アルゴリズムとして、PALUは制約付き最適化問題として簡潔推論を定式化する。
PALUは、DeepSeek-Distill-Qwen-1.5Bに適用すると、出力長を65%削減し、精度を15%向上させる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:16:28 GMT)
Unilaw-R1: A Large Language Model for Legal Reasoning with Reinforcement Learning and Iterative Inference [15.6] 法的な推論に適した大規模言語モデルであるUnilaw-R1を紹介する。
軽量な7ビリオンパラメータスケールにより、Unilaw-R1はデプロイメントコストを大幅に削減する。
法律分野では、不十分な法的知識、信頼できない推論論理、弱いビジネス一般化の3つの主要な課題に取り組む。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:17:22 GMT)
Hierarchical Bayesian Flow Networks for Molecular Graph Generation [15.5] GraphBFNは、分布のパラメータに基づいて動作するベイズフローネットワークに基づく、新しい階層的な粗大きめのフレームワークである。
提案手法は,QM9およびZINC250k分子グラフ生成ベンチマーク上で,新しい最先端結果を設定することにより,優れた性能と高速な生成を実現することを実証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:27:55 GMT)
EpiCache: Episodic KV Cache Management for Long Conversational Question Answering [15.3] 長時間会話型質問応答のためのトレーニング不要なKVキャッシュ管理フレームワークであるEpiCacheを紹介した。
EpiCacheはブロックワイズプリフィルを通じてキャッシュの成長を制限し、エピソードKV圧縮を通じてトピック関連コンテキストを保存する。
3つのLongConvQAベンチマークで、EpiCacheは40%の精度向上を実現し、4-6倍の圧縮でほぼ完全なKVの精度を維持し、レイテンシ/メモリを2.4倍/3.5倍に削減した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:04:23 GMT)
Imbalance-Robust and Sampling-Efficient Continuous Conditional GANs via Adaptive Vicinity and Auxiliary Regularization [15.3] データ不均衡を扱うための2つの新しいコンポーネントを備えた拡張CcGANフレームワークを提案する。
CcGANフレームワークのネイティブワンステップジェネレータは、CCDMよりも30x-2000倍高速な推論を可能にする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:24:51 GMT)
Learning to Guarantee Type Correctness in Code Generation through Type-Guided Program Synthesis [15.3] TyFlowは、型システムを学ぶためのモデルを導くために、コード生成内で型推論を内部化する新しいシステムである。
型システム学習の複雑さを表現そのものにオフロードすることで、モデルは計算資源をより高いレベルのプログラムセマンティクスにリダイレクトすることができる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:43:36 GMT)
Bridging Graph and State-Space Modeling for Intensive Care Unit Length of Stay Prediction [14.9] ICU LOS予測のための多視点グラフニューラルネットワーク(GNN)を用いた状態空間シーケンスモデリングを統一した新しいニューラルネットワークであるS$2$G-Netを提案する。
大規模なMIMIC-IVコホートデータセットの実験では、S$2$G-Netはシーケンスモデルより一貫して優れていた。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:32:54 GMT)
How AI Companionship Develops: Evidence from a Longitudinal Study [14.7] 筆者らは, エージェントの心理モデルから, 対人体験, 社会的相互作用, およびAI仲間の心理的影響まで, 心理的経路について検討した。
その結果,AIコンパニオン開発における縦断モデルが提案され,人間-AIコンパニオン研究の実証的手法が実証された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:36:47 GMT)
IONext: Unlocking the Next Era of Inertial Odometry [14.6] 我々は,CNNを用いた新しい慣性眼振背骨, Next Era of Inertial Odometry (IONext) を提案する。
IONextは、最先端(SOTA)トランスフォーマーとCNNベースのメソッドを一貫して上回っている。
例えばRNINデータセットでは、IONextは代表モデルのiMOTと比較して平均ATEを10%、平均RTEを12%削減する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:41:03 GMT)
Quantum Teleportation in Non-equilibrium Environments and Fixed-point Fidelity [14.3] 温度や化学ポテンシャルの異なる非平衡環境における量子テレポーテーションについて検討する。
固定点の忠実度をテレポーテーションと呼ぶが、特に固定点の忠実度は2つの歪んだ量子ビットと非平衡環境を組み合わせることで向上することができる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:16:45 GMT)
CoIDO: Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization [14.3] マルチモーダルな大規模言語モデルは、視覚と言語機能を調整するための命令チューニングに大きく依存している。
既存のデータ選択方法は重要かつ多様なサブセットを選択することを目的としているが、それらはしばしば2つの重大な欠点に悩まされる。
我々は,これらの課題を克服するために,データの重要度と多様性を共同で最適化する,新しいデュアルオブジェクトフレームワークであるCoIDOを紹介する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:41:21 GMT)
HTMformer: Hybrid Time and Multivariate Transformer for Time Series Forecasting [14.2] トランスフォーマーに基づく手法は時系列予測において顕著な結果を得た。
既存のTransformerは、時間的依存関係を過度に強調する傾向があるため、シーケンスモデリングに制限がある。
変換器の性能は,効率的な表現の学習に使用される埋め込み法に大きく依存していることがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:57:07 GMT)
AP2O: Correcting LLM-Generated Code Errors Type by Type Like Humans via Adaptive Progressive Preference Optimization [14.1] 本稿では,LLMを適応的かつ体系的にガイドし,コード生成のためのコードエラーを低減する手法であるAP2O-Coderを提案する。
広範な実験を通じて、私たちのAP2O-Coderは、好みの少ないデータを使用しながら、pass@kでコード生成性能を最大3%改善します。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:25:56 GMT)
Navigating the Labyrinth: Path-Sensitive Unit Test Generation with Large Language Models [13.9] 単体テストはソフトウェアの品質保証には不可欠だが、テストの記述とメンテナンスは時間がかかり、エラーが発生しやすい。
このギャップを埋めるために、コード知識とLLMのセマンティック機能を組み合わせることで、パスに敏感なフレームワークであるJUnitGenieを紹介します。
JUnitGenieを実世界の10のJavaプロジェクトから2,258の複雑な焦点メソッドで評価する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:22:01 GMT)
Beyond Fertility: Analyzing STRR as a Metric for Multilingual Tokenization Evaluation [13.8] 7つの言語と2つのドメインにまたがる6つの広く使われているトークンを解析する。
単一トークンとして保存される単語の割合を計測する単一トークン保持率(STRR)を提案する。
以上の結果から,STRRは不妊を補完し,より平等な多言語トークン化器の設計のための実践的ガイダンスを提供することがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:22:31 GMT)
HUME: Measuring the Human-Model Performance Gap in Text Embedding Task [13.8] HUME:Human Evaluation Framework for Text Embeddingsを紹介する。
我々は、再分類、分類、クラスタリング、意味的テキスト類似性にまたがる16のMTEBデータセットにおける人的パフォーマンスを測定した。
人間の平均的な性能は77.6%であり、最高の埋め込みモデルでは80.1%である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:56:53 GMT)
INR-Bench: A Unified Benchmark for Implicit Neural Representations in Multi-Domain Regression and Reconstruction [13.7] Inlicit Neural Representations (INR)は、連続性と無限分解能の利点により、様々な信号処理タスクで成功している。
これらの要因をよりよく理解するために、ニューラル・タンジェント・カーネル(NTK)理論の洞察を利用する。
InR-BenchはマルチモーダルINRタスクに特化して設計された最初の総合ベンチマークである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:57:13 GMT)
CharCom: Composable Identity Control for Multi-Character Story Illustration [13.6] CharComは、構成可能なLoRAアダプタを通じて、キャラクタ一貫性のあるストーリーイラストアを実現するフレームワークである。
マルチシーンの物語の実験では、CharComはキャラクタの忠実度、セマンティックアライメント、時間的コヒーレンスを著しく向上させる。
混み合ったシーンでは堅牢であり、最小限のオーバーヘッドでスケーラブルなマルチキャラクタ生成を可能にし、ストーリーイラストやアニメーションのような現実世界のアプリケーションに適している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:36:20 GMT)
DynaSpec: Context-aware Dynamic Speculative Sampling for Large-Vocabulary Language Models [13.2] 近年, LLM語彙のスケーリングにより, トークンの数が大幅に増加した。
完全な語彙に対する検証はターゲットモデルにほとんど影響しないが、ドラフトの出力ヘッドのO(|V|d)パラメータは遅延ボトルネックとなる。
我々は、コンテキスト依存の動的ショートリスト機構であるDynaSpecを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:38:07 GMT)
Robot Learning with Super-Linear Scaling [13.1] CASHERは、データ収集と学習をシミュレーションでスケールアップするためのパイプラインであり、パフォーマンスは人間の努力と超直線的にスケールする。
そこで我々は,CASHERにより,人的努力を伴わないビデオスキャンにより,事前学習したポリシーを目標シナリオに微調整できることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:14:26 GMT)
A Systematic Study on Generating Web Vulnerability Proof-of-Concepts Using Large Language Models [13.0] 本稿では,Webアプリケーション脆弱性に対するLarge Language Models(LLMs)ベースのPoC生成に関する実証的研究について紹介する。
以上の結果から, LLMは公共データのみを用いて, 8%~34%の症例で作業用PoCを自動生成できることがわかった。
さらなる分析によると、コードコンテキストを補完することで成功率が17%-20%向上し、関数レベルが9%-13%改善した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:15:38 GMT)
One4Many-StablePacker: An Efficient Deep Reinforcement Learning Framework for the 3D Bin Packing Problem [12.5] 3次元ビンパッキング問題(3D-BPP)は物流や倉庫に広く応用されている。
我々は,新しい強化学習フレームワークOne4Many-StablePacker(O4M-SP)を提案する。
O4M-SPは、実際には一般的なサポートと重みの制約を取り入れつつ、単一のトレーニングプロセスで様々なビン次元を処理できる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:47:49 GMT)
Broad nonlocal spectrum in the Pb-InSb hybrid three terminals for potential realization of Kitaev chains [12.4] 本稿では,最初の3端子Pb-ハイブリドデバイスを提示し,このプラットフォーム上で非局所微分伝導分光を行う。
単項-二重項遷移を行う複数のAndreev束縛状態(ABS)を観察する。
非局所的なシグネチャのロバスト性はAl基デバイスの動作温度よりもはるかに高い温度(1K)まで持続する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:59:39 GMT)
DREAM: A Benchmark Study for Deepfake REalism AssessMent [12.4] 本稿では,Deepfake Realism AssessMentの略であるDREAMという総合ベンチマークを提案する。
多様な品質のディープフェイクビデオデータセットと、140,000のリアリズムスコアと3500人のアノテーションから得られたテキスト記述を含む大規模なアノテーションで構成されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:41:49 GMT)
Native Hybrid Attention for Efficient Sequence Modeling [12.3] ネイティブハイブリッドアテンション(NHA)は、線形およびフルアテンションの新たなハイブリッドアーキテクチャである。
単一のtextttsoftmaxアテンション操作は、すべてのキーと値に適用される。
実験結果から,NHAはリコール集約・コモンセンス推論タスクにおいてトランスフォーマーを上回ることがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:31:02 GMT)
Deep conditional distribution learning via conditional Föllmer flow [12.0] 本研究では,条件F"ollmer Flow"という条件分布を学習するための常微分方程式(ODE)に基づく深部生成手法を提案する。
効率的な実装のために、我々は、深層ニューラルネットワークを用いて非パラメトリックに速度場を推定するオイラー法を用いて流れを判別する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:51:42 GMT)
Vicinity-Guided Discriminative Latent Diffusion for Privacy-Preserving Domain Adaptation [11.7] 識別性粘度拡散(DVD)は、ソースフリードメイン適応の実践的な変種のためのフレームワークである。
DVDは、各ソース特徴のラベル情報をその潜在近傍にエンコードする。
標準的なSFDAベンチマークにおいて,DVDは最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:35:10 GMT)
Hybrid OCR-LLM Framework for Enterprise-Scale Document Information Extraction Under Copy-heavy Task [11.7] この作業は、OCRエンジンとLLM(Large Language Models)を戦略的に組み合わせて、反復的な文書抽出タスクに固有の正確性と効率のトレードオフを最適化する。
3つの抽出パラダイム(ダイレクト、リプレース、テーブルベース)にまたがる25のコンフィギュレーションを、4つのフォーマットにまたがるIDドキュメント上で実装し、評価する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:40:34 GMT)
Rethinking Entropy Interventions in RLVR: An Entropy Change Perspective [11.7] エントロピー崩壊は政策の多様性の急激な喪失であり、探検と爆発の不均衡から起因し、一般化の欠如につながっている。
最近のエントロピー・インターベンション法は、色覚エントロピーの崩壊を防ぐことを目的としているが、その基盤となるメカニズムは明らかになっていない。
エントロピー変化を考慮した再重み付け方式,すなわち,再重み付け(STEER)によるトークンレベルのエントロピーチェンジEの安定化を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:17:38 GMT)
MemPromptTSS: Persistent Prompt Memory for Iterative Multi-Granularity Time Series State Segmentation [11.6] 永続的なプロンプトメモリを導入した反復的多粒度セグメンテーションのためのフレームワークを提案する。
MemPromptTSSは、単一反復推論による単一および複数粒度のセグメンテーションにおいて、最高のベースラインよりも23%と85%の精度向上を実現している。
これらの結果から,MemPromptTSSを実世界のアプリケーションのための実用的で効果的なフレームワークとして確立した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:02:36 GMT)
OBsmith: Testing JavaScript Obfuscator using LLM-powered sketching [11.6] JavaScriptの難読化装置は、知的財産を保護し、リバースエンジニアリングに抵抗するために広くデプロイされている。
既存の評価は難読化に対する抵抗を測り、難読化剤が解答なしのセマンティクスを保存するかどうかという批判的な疑問を残している。
我々は,大規模な言語モデルを用いてJavaScriptの難読化を体系的にテストする新しいフレームワークOBsmithを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:02:42 GMT)
Transformer Model Detects Antidepressant Use From a Single Night of Sleep, Unlocking an Adherence Biomarker [11.6] 抗うつ剤の非依存は広範に広がり、再発、入院、自殺リスク、避けられるコストの数十億ドルを駆逐する。
一晩の睡眠から抗うつ薬の摂取を検出する最初の非侵襲バイオマーカーを提示する。
トランスフォーマーベースのモデルは、消費者向けウェアラブルまたは非接触ワイヤレスセンサーからの睡眠データを分析して、抗うつ剤の摂取を推測し、家庭におけるリモート、無努力、日々の付着性評価を可能にする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:58:34 GMT)
LLM-Friendly Knowledge Representation for Customer Support [11.5] 本稿では,大規模言語モデル(LLM)をAirbnbの顧客サポート業務の複雑さをナビゲートするフレームワークに統合することで,実践的なアプローチを提案する。
本稿では,新しい改質手法であるインテント,コンテキスト,アクション(ICA)フォーマットを用いて,ポリシーや構造をよりLLMに変換する手法を提案する。
我々は、人間の介入を最小限に抑えたトレーニングデータを作成するための合成データ生成戦略を開発し、コスト効率の良いモデル微調整を可能にした。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:24:50 GMT)
Monotone and Conservative Policy Iteration Beyond the Tabular Case [11.5] RPI(Reliable Policy Iteration)とCRPI(Reserveal RPI)を紹介する。
RPIとCRPIは、ポリシーイテレーション(PI)と保守PI(CPI)の変種である
RPIは,評価値の教科書のテクスタイトモノトニクスを復元し,それらの推定値が真のリターンを確実にテクスタイトローダーバウンドすることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:01:41 GMT)
Learning to Throw-Flip [11.4] 本稿では,ロボットが所望の着地ポーズに対して,オブジェクトを正確に「スローフリップ」することができる方法を提案する。
我々は寄生虫の回転を効果的に分離する投球運動の族を設計する。
私たちのフレームワークは、数十の試行において、ポーズターゲットにオブジェクトを投げる(pm$5 cm, $pm$45 °)ことができる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:18:09 GMT)
Multimodal Alignment and Fusion: A Survey [11.3] このサーベイは、機械学習分野におけるマルチモーダルアライメントと融合の進歩に関する包括的概要を提供する。
我々は、両構造の観点から、アライメントと融合の鍵となるアプローチを体系的に分類し、分析する。
この調査は、クロスモーダルなミスアライメント、計算ボトルネック、データ品質の問題、モダリティギャップといった重要な課題を強調します。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:22:25 GMT)
Formally Verified Certification of Unsolvability of Temporal Planning Problems [11.1] 本稿では,時間計画の不解決性検証へのアプローチを提案する。
提案手法は,計画問題をタイムドオートマトンネットワークにエンコードし,ネットワーク上で効率的なモデルチェッカーを使用し,続いて認証チェッカーを用いてモデルチェッカーの出力を認証する手法である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:57:25 GMT)
Learning Joint Embeddings of Function and Process Call Graphs for Malware Detection [11.0] ソフトウェアシステムはグラフとして表現することができ、機能やプロセス間の依存関係をキャプチャする。
本稿では,Function Call Graphs (FCG) とProcess Call Graphs (PCG) を構築し,共同埋め込みを学習するためのパイプラインを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:24:51 GMT)
Revisiting the UID Hypothesis in LLM Reasoning Traces [10.8] 大規模言語モデル(LLM)は、ステップバイステップのChain-of-Thought(CoT)推論を用いてしばしば問題を解決する。
推論トレース内の情報フローを分析するために,エントロピーに基づくメトリクスを導入する。
LLMにおける推論の成功は、全世界的に一様ではない。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:19:17 GMT)
Robust Federated Finetuning of LLMs via Alternating Optimization of LoRA [10.8] ファインチューンなLoRAアダプタに交互に最適化を施した,フェデレートされたフレームワークであるRoLoRAを提案する。
理論解析と広範な実験の両方を用いて,RoLoRAの先行的アプローチに対する利点を実証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:17:27 GMT)
Fairness Without Labels: Pseudo-Balancing for Bias Mitigation in Face Gender Classification [10.7] 顔の性別分類モデルは、しばしば、トレーニングデータに存在する人口統計バイアスを反映し、増幅する。
半教師付き学習において,そのようなバイアスを軽減するためのシンプルで効果的な戦略である擬似バランスを導入する。
本手法は,レースバランスデータセットからのラベルなし画像のみを用いて,擬似ラベル選択時の人口収支を強制する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:08:40 GMT)
MADS: Multi-Agent Dialogue Simulation for Diverse Persuasion Data Generation [10.6] エージェントによるマルチターン対話を生成するスケーラブルなフレームワークMADS(Multi-Agent Dialogue Simulation)を提案する。
MADSには3つの調整されたエージェントがある: ユーザエージェントは、Zodiac SignsやMBTIタイプのようなパーソナライズ記号を活用することで、多様なペルソナ駆動の振る舞いをシミュレートするように設計されている。
さらに,ユーザによるCoA(Chain-of-Attitude)モデリングとLLMのパーサーション評価を通じて,その有効性を検証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:50:36 GMT)
Stochastic Process Learning via Operator Flow Matching [10.5] 我々は関数空間上でのプロセスの事前学習のための演算子フローマッチング(OFM)を開発した。
OFM は任意の点集合の値の確率密度を与える。
本手法は, プロセス学習, 機能回帰, 事前学習における最先端モデルより優れている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:39:16 GMT)
Prepared for the Unknown: Adapting AIOps Capacity Forecasting Models to Data Changes [10.4] 能力管理は、ソフトウェア組織がリソースを効果的に割り当て、運用上の要求を満たすために重要である。
データ駆動分析と機械学習(ML)予測モデルは、データが進化するにつれて関連性を維持するために頻繁にトレーニングする必要がある。
本研究では,周期的再学習と比較して検出されたデータの変化に基づいて,時系列に対する再学習能力予測モデルの効果について検討する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:21:20 GMT)
Hyper-STTN: Hypergraph Augmented Spatial-Temporal Transformer Network for Trajectory Prediction [10.2] 本稿では,ハイパーグラフを用いた空間時間変換ネットワークHyper-STTNを提案する。
並行して、空間時間変換器を用いて、空間次元と時間次元をまたいだ歩行者のペアワイズ遅延相互作用を学習する。
公共の歩行者運動データセットの実験では、Hyper-STTNは最先端のベースラインやアブレーションモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:05:58 GMT)
A Representation Learning Approach to Feature Drift Detection in Wireless Networks [10.1] 本稿では,特徴分布の変化を検知し,モデルの再学習をトリガーする手法であるALRTを提案する。
ALERTには、表現学習、統計的テスト、ユーティリティアセスメントの3つのコンポーネントが含まれている。
文献で利用可能な10種類の標準ドリフト検出法に対して,提案手法の優位性を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:08:12 GMT)
Mapping the Urban Mobility Intelligence Frontier: A Scientometric Analysis of Data-Driven Pedestrian Trajectory Prediction and Simulation [10.0] 本研究は,データ駆動型歩行者軌道予測と群集シミュレーションに関する総合的な科学的分析を行う。
結果は、人工知能、都市情報学、および群衆行動モデリングの強い収束性を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:58:40 GMT)
A Mathematics-Guided Approach to Floating-Point Error Detection [9.8] 浮動小数点プログラムエラーは、特に軍事的応用のような重要な領域において、深刻な結果をもたらす可能性がある。
そこで本研究では,数学的ガイダンスに基づいて誤りを誘発する入力を検出するMGDEという手法を提案する。
二次収束特性を示すNewton-Raphson法を用いることで,高効率かつ効率的な結果が得られる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:38:14 GMT)
Lost in the Middle: An Emergent Property from Information Retrieval Demands in LLMs [9.8] 大きな言語モデル(LLM)は、重要な情報が長いコンテキストの中間にあるときにしばしば劣化する。
我々は,この行動が情報損失の欠陥を示すだけでなく,事前学習中に異なる情報検索要求に適応することを提案する。
このU字型性能曲線は、LLMが長期記憶と短期記憶の要求をシミュレートする2つの単純な記憶パラダイムでスクラッチから訓練されるときに現れることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:22:53 GMT)
A Style-Based Metric for Quantifying the Synthetic-to-Real Gap in Autonomous Driving Image Datasets [9.8] 我々は、自律運転システムにおける合成と現実のギャップを定量化するための体系的な枠組みを確立する。
本稿では,新しい評価指標として,SEDD(Style Embedding Distribution Discrepancy)を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:09:41 GMT)
IntrinTrans: LLM-based Intrinsic Code Translator for RISC-V Vector [9.7] 既存のベクトル化された内在的コードをRVV内在的に変換することは、実用的で効果的なアプローチである。
現在のクロスアーキテクチャの翻訳は手書きの書き換えに大きく依存している。
IntrinTransは、コンパイルとテストのフィードバックを利用して、アーキテクチャ間で固有のコードを自動的に翻訳するマルチエージェントアプローチである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:52:01 GMT)
LDPKiT: Superimposing Remote Queries for Privacy-Preserving Local Model Training [9.6] 我々は,非敵対的,プライバシ保護モデル抽出のためのフレームワーク LDPKiT を提案する。
LDPKiTは、およそ分布内サンプルを生成し、局所微分プライバシー(LDP)の下で効果的な知識伝達を可能にする
Fashion-MNIST、SVHN、PathMNISTの実験では、LDPKiTはプライバシーを維持しながら実用性を一貫して改善している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:01:53 GMT)
Ignition Phase : Standard Training for Fast Adversarial Robustness [9.5] AET(Adversarial Evolution Training)は、経験的リスク最小化(ERM)フェーズを従来のATに付与するフレームワークである。
AETは、同等または優れた堅牢性をより高速に達成し、クリーンな精度を改善し、トレーニングコストを8~25%削減する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:48:30 GMT)
Artificial intelligence as a surrogate brain: Bridging neural dynamical models and data [9.3] 人工知能(AI)の最近の進歩は、脳の計算的側面を構築する方法を変えつつある。
我々は、フォワードモデリング、逆問題解決、モデル評価を統合したAIベースの代理脳を構築する統一的な枠組みを導入する。
我々は、学習した代理脳が、力学系解析、仮想摂動、モデル誘導神経刺激のシミュレーションプラットフォームとして機能していることを強調した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:23:10 GMT)
Lightweight Joint Optimization of General-Purpose Vision-Language Models and Retrievers for RAG-Based Medical Diagnosis [9.2] 医用診断用LVLMを併用したマルチモーダル検索モデルを開発した。
異なるトップ検索された画像は、しばしば同じターゲットに対して異なる予測をもたらす。
本モデルは,臨床分類とVQAタスクに関する医学的に事前訓練されたモデルと競合する結果を得る。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:29:18 GMT)
OFP-Repair: Repairing Floating-point Errors via Original-Precision Arithmetic [9.2] 浮動小数点プログラムでは、いくつかのエラーは原精度算術を用いて修正できるが、他のエラーは高精度の計算を必要とする。
現在の修理ツールのほとんどは、専門的な専門知識の開発と要求に要する時間を要する高精度の実装に依存している。
ACESOのデータセットでは,4つの指標に対して3,7,3,8桁の改善を実現している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:31:22 GMT)
pEBR: A Probabilistic Approach to Embedding Based Retrieval [9.2] 埋め込みベースの検索は、クエリとアイテムの両方の共有セマンティック表現空間を学習することを目的としている。
我々は,textbfprobabilistic textbfEmbedding-textbfBased textbfRetrieval (textbfpEBR) フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:57:08 GMT)
ViFusionTST: Deep Fusion of Time-Series Image Representations from Load Signals for Early Bed-Exit Prediction [9.1] ベッド関連の転倒は、病院や長期医療施設で大きな怪我の原因となっている。
本研究は, ベッド脚下に装着した低負荷セルを1個だけ使用して, 早期のベッド出口意図を予測できることを示す。
ラインプロットとテクスチャマップを並列に処理するデュアルストリームスウィントランスであるViFusionTSTを導入する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:16:00 GMT)
Collaborative Learning of Semantic-Aware Feature Learning and Label Recovery for Multi-Label Image Recognition with Incomplete Labels [8.9] 本稿では,セマンティック・アウェアな特徴学習とラベル・リカバリ手法の協調学習を提案する。
CLSLは,非完全ラベルを用いた最先端の多ラベル画像認識法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:43:43 GMT)
Simulating Three-dimensional Turbulence with Physics-informed Neural Networks [8.8] 乱流は、科学において最も計算的に要求される問題の一つである。
適切な設計のPINNは2次元と3次元の両方で完全に乱流をシミュレートできることを示す。
以上の結果から,ニューラルネットワークの解法は複雑なカオス系を処理可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:25:27 GMT)
Enabling High-Quality In-the-Wild Imaging from Severely Aberrated Metalens Bursts [8.6] 超薄型ナノフォトニックメタレンカメラを用いた高精細・高精細・高精細・高精細画像撮影の課題に挑戦する。
従来の光学より数倍薄いメタレンをペアリングする、ワイヤ内イメージングのためのエンドツーエンドのソリューションを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:41:04 GMT)
SPFT-SQL: Enhancing Large Language Model for Text-to-SQL Parsing by Self-Play Fine-Tuning [8.5] セルフプレイファインチューニング(SPIN)は、弱い大きな言語モデル(LLM)を競合する相互作用を通じて強力な言語に変換することができる。
本研究では,SPFT-tuningと呼ばれるテキスト・ツー・タスクに適した,新たなセルフプレイ・ファイン・チューニング手法を提案する。
自己再生の微調整フェーズにおいて,不適切な出力を相手モデルからインセンティブを与える誤り駆動損失法を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:01:48 GMT)
TC-GS: A Faster Gaussian Splatting Module Utilizing Tensor Cores [8.4] 本稿では,アルゴリズムに依存しない汎用モジュールTC-GSを統合し,Core(TCU)を3DGSに適用する。
提案手法は,既存のガウス加速度アルゴリズムを2.18倍高速化し,最大5.6倍の高速化を実現するとともに,レンダリング品質を維持している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:58:24 GMT)
A3RNN: Bi-directional Fusion of Bottom-up and Top-down Process for Developmental Visual Attention in Robots [8.3] 本研究では,ロボット学習におけるトップダウン(TD)とボトムアップ(BU)の発達的相互作用について検討した。
本稿では,2方向のアテンションアーキテクチャを用いて,予測的TD信号とサリエンシに基づくBUキューを統合する新しいアテンションモデルである$A3 RNN$を提案する。
実験の結果, 注意行動は, 順応探索から予測方向まで, 訓練を通して進化することが示された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:58:08 GMT)
Measuring What Matters: Connecting AI Ethics Evaluations to System Attributes, Hazards, and Harms [8.3] 過去10年間で、AIシステムの社会的および倫理的影響を評価するための措置のエコシステムが出現した。
ほとんどの測定基準は、公正性、透明性、プライバシー、信頼という4つの原則に重点を置いており、主にモデルまたは出力システムコンポーネントを評価します。
システム要素間の相互作用を考慮に入れている測度はほとんどなく、それぞれの危害タイプに対して、限られたハザードのセットのみが考慮される。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:52:21 GMT)
Doc2SAR: A Synergistic Framework for High-Fidelity Extraction of Structure-Activity Relationships from Scientific Documents [8.2] 我々は200の科学的文書の厳密な注釈付きベンチマークであるDocSAR-200を紹介する。
また、ドメイン固有のツールとMLLMを統合した新しいフレームワークDoc2SARを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:26:10 GMT)
StreetLens: Enabling Human-Centered AI Agents for Neighborhood Assessment from Street View Imagery [8.2] ユーザ設定可能な人間中心ワークフローであるStreetLensを紹介し、関連する社会科学の専門知識を視覚言語モデルに統合する。
StreetLensは分析プロセスのコアにドメイン知識を配置する。
また、前回の調査データの統合をサポートし、ロバスト性を高め、評価された特性の範囲を広げる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:18:39 GMT)
Learning Operators through Coefficient Mappings in Fixed Basis Spaces [8.0] 本稿では,所定の基底関数によって誘導される係数空間の演算子を学習するFB-C2CNetを提案する。
FB-C2CNetは高い精度と計算効率を実現し、実用的な演算子学習タスクに強力な可能性を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:47:48 GMT)
CacheClip: Accelerating RAG with Effective KV Cache Reuse [8.0] CacheClipは、高速TTFTとハイジェネレーション品質の両方を実現する新しいフレームワークである。
本手法は,(1)選択的KVキャッシュ再計算のための補助モデル誘導トークン選択,(2)冗長な注意シンクを排除するための共有プレフィックス,(3)局所コヒーレンスを維持するためのグループ化戦略の3つの手法を統合する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:28:26 GMT)
Breaking the Likelihood Trap: Consistent Generative Recommendation with Graph-structured Model [8.0] 推薦システムの最終段階として、リグレードはリアルタイムの推論、正確性、多様性を要求する。
本稿では,新しい生成的推薦フレームワークであるConsistent Graph-structured Generative Recommendation (Congrats)を提案する。
大規模なビデオ共有アプリKuaishouは、毎日3億人のアクティブユーザーを抱えている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:21:01 GMT)
Think as a Doctor: An Interpretable AI Approach for ICU Mortality Prediction [7.8] 本稿では,ICUの意思決定プラクティスの3つの要素をすべてその推論プロセスに統合しつつ,本質的な解釈性を実現する新しいICU死亡予測フレームワークを提案する。
ProtoDoctorには2つの重要なイノベーションがある: Prognostic Clinical Course IdentificationモジュールとDemographic Heterogeneity Recognitionモジュール。
ProtoDoctorは予測精度で最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:57:07 GMT)
CLoD-GS: Continuous Level-of-Detail via 3D Gaussian Splatting [7.8] 連続的なLoD機構を直接3DGS表現に統合するフレームワークであるCLoD-GSを紹介する。
CLoD-GSは、単一のモデルからスムーズで高品質なレンダリングを実現し、さまざまなパフォーマンス目標に対して高忠実度な結果を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:48:11 GMT)
Lightweight Baselines for Medical Abstract Classification: DistilBERT with Cross-Entropy as a Strong Default [7.7] 我々は医学的抽象分類のための軽量なレシピを再考する。
BERT ベースと DistilBERT に標準クロスエントロピー,クラス重み付きクロスエントロピー,フォーカス損失保持トークン化シーケンス長の3つの目標を付与した。
まず、コンパクトエンコーダとクロスエントロピーから始めて、より重いモデルに移行する前にキャリブレーションとタスク固有のチェックを追加します。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:05:21 GMT)
CURE: Concept Unlearning via Orthogonal Representation Editing in Diffusion Models [7.7] CUREは、事前訓練された拡散モデルの重み空間で直接動作する、トレーニング不要の概念未学習フレームワークである。
スペクトル消去器は、安全な属性を保持しながら、望ましくない概念に特有の特徴を特定し、分離する。
CUREは、対象とする芸術スタイル、オブジェクト、アイデンティティ、明示的なコンテンツに対して、より効率的で徹底的な除去を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:54:57 GMT)
Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective [7.4] 大規模言語モデル(LLM)トレーニングのエスカレートスケールとコストは、下流タスク性能の正確な事前トレーニング予測を必要とする。
現在の予測手法には精度と信頼性が欠けている。
本稿では,下流性能予測のためのクラスタリングオンディフルティ(COD)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:19:44 GMT)
A Graph Laplacian Eigenvector-based Pre-training Method for Graph Neural Networks [7.4] 構造に基づく事前学習手法は、基礎となるグラフ構造に依存した下流アプリケーションには不十分だが不可欠である。
グラフラプラシアンの低周波固有ベクトルの予測に基づくグラフニューラルネットワーク(GNN)のための新しい事前学習モジュールであるラプラシア固有ベクトル学習モジュール(LELM)を提案する。
LELMはオーバースムーシングを克服する新しいアーキテクチャを導入し、GNNモデルが長距離相互依存性を学習できるようにする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:30:08 GMT)
Reinforcement Fine-Tuning of Flow-Matching Policies for Vision-Language-Action Models [7.3] VLA(Vision-Language-Action)モデルは、大規模なデモンストレーションを活用することで、強力な一般化を示している。
本研究では,FPOアルゴリズムを提案する。FPOアルゴリズムは,条件付きフローマッチングの目的に対して,サンプルごとの変化を生かして,重要サンプリングを再構築する。
LIBEROベンチマークのFPOとALOHAシミュレーションタスクを、教師付き、嗜好的、拡散的、自己回帰的オンラインRLに対して評価する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:11:18 GMT)
Attention based End to end network for Offline Writer Identification on Word level data [7.2] 注意駆動型畳み込みニューラルネットワーク(CNN)に基づく著者識別システムを提案する。
このシステムは、単語画像から抽出された断片として知られる画像セグメントを利用して、ピラミッドベースの戦略を用いて訓練されている。
提案アルゴリズムの有効性を3つのベンチマークデータベースで評価した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:38:24 GMT)
LLMs are All You Need? Improving Fuzz Testing for MOJO with Large Language Models [7.2] 大規模言語モデル(LLM)は、多種多様な効果的なテストインプットの自動生成によって、ソフトウェアテスト、特にファズテストに革命をもたらした。
MoJOは、PythonのユーザビリティとCとC++の効率を融合した高性能なAIプログラミング言語である。
MoJOFuzzerは、新興プログラミング言語のゼロショット学習環境向けに設計された最初の適応LDMベースのファジングフレームワークである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:37:18 GMT)
CauchyNet: Compact and Data-Efficient Learning using Holomorphic Activation Functions [7.0] CauchyNetは、Cauchyの積分式にインスパイアされた、新しいニューラルネットワークである。
実数値データを複雑な平面に埋め込むことで、CauchyNetは複雑な時間的依存関係を効率的にキャプチャする。
予測精度で最先端のモデルを一貫して上回る。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:21:15 GMT)
Progressive Scale Convolutional Network for Spatio-Temporal Downscaling of Soil Moisture: A Case Study Over the Tibetan Plateau [7.0] 土壌水分(SM)は、水文学および気象学の過程において重要な役割を果たす。
粗いマイクロ波データと微細な補助変数を組み合わせることで高分解能SMを得ることができる。
SMの低分解能SMAPのダウンスケーリング過程に対する高時間分解能ERA5-Land変数の検証を行った。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:55:17 GMT)
YOLOv11-Litchi: Efficient Litchi Fruit Detection based on UAV-Captured Agricultural Imagery in Complex Orchard Environments [6.9] 本稿では,UAVを用いたリッチ検出のための軽量で堅牢な検出モデルであるYOLOv11-Litchiを紹介する。
YOLOv11-Litchiのパラメータサイズは6.35MBで、YOLOv11ベースラインよりも32.5%小さい。
このモデルは57.2FPSのフレームレートを実現し、リアルタイム検出要求を満たす。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:44:00 GMT)
The Hybrid Multimodal Graph Index (HMGI): A Comprehensive Framework for Integrated Relational and Vector Search [6.8] 本稿では,ベクトルデータベースとグラフデータベースのギャップを埋める新しいフレームワークであるHybrid Multimodal Graph Index (HMGI)を紹介する。
HMGIは、意味的類似性検索と関係性コンテキストを直接統合することにより、複雑な関係性の多いクエリシナリオにおいて純粋なベクトルデータベースより優れていることを目指している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:06:26 GMT)
Reliable quantum master equation of the Unruh-DeWitt detector [6.8] 本論文では,Unruh-DeWitt検出器に適用した量子マルコフマスター方程式の妥当性範囲を推定する手法を提案する。
我々は、緩和されたファン・ホーブ極限(すなわち、深夜極限)を提案し、オープン量子力学の標準導出過程から生じる誤差順序の摂動的推定を与える。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:18:52 GMT)
Revisit What You See: Disclose Language Prior in Vision Tokens for LVLM Decoding [6.6] LVLM(Large Vision-Language Models)は、視覚認識と言語理解を統合することで、マルチモーダルタスクにおける強力なパフォーマンスを実現する。
テキスト生成のガイドとして視覚トークンを参照するトレーニング不要な復号法であるReVisiTを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:17:33 GMT)
Denoising Diffusion as a New Framework for Underwater Images [6.2] 画像強調の研究は効果があることが証明されているが、それ自身の限界も示している。
ここでの課題の1つは、多様性の欠如とこれらのデータセットに含まれる画像の品質の低さである。
一方,制御ネットを用いた画像の強化により,対応するデータセットの品質を評価・向上することが推奨されている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:22:32 GMT)
Improving cosmological reach of a gravitational wave observatory using Deep Loop Shaping [6.0] ミラー安定化制御は感度改善の大きな障害である。
Deep Loop Shapingは周波数領域報酬を用いた強化学習手法である。
制御器は10-30Hz帯の制御ノイズを30倍以上低減し, 量子限界による設計目標を超えるサブバンドの最大100倍まで低減した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:29:07 GMT)
ViConEx-Med: Visual Concept Explainability via Multi-Concept Token Transformer for Medical Image Analysis [5.9] ViConEx-Medは、視覚的概念の説明可能性のためのトランスフォーマーベースのフレームワークである。
提案手法は,高い予測精度を維持しつつ,概念レベルのローカライズマップを生成する。
人工的および実世界の医療データセットの実験は、ViConEx-Medが従来のコンセプトベースモデルより優れていることを示した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:24:47 GMT)
A Multi-Strategy Framework for Enhancing Shatian Pomelo Detection in Real-World Orchards [5.8] 本研究は,シャチのポメロ検出の精度に影響を与える4つの重要な課題を明らかにする。
これらの課題を軽減するため,本稿ではマルチストラテジー・フレームワークを提案する。
提案するネットワークは,他の最先端検出手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:30:48 GMT)
Human-aligned AI Model Cards with Weighted Hierarchy Architecture [5.8] LLM(Large Language Models)の普及は、専門的なドメイン特化モデルのエコシステムの肥大化につながった。
Model CardsやFactSheetsといった既存のドキュメントフレームワークは、レポートの標準化を試みるが、多くの場合は静的で、質的である。
我々は、静的開示からアクション可能な人間対応のドキュメントに移行する新しいアプローチである包括的責任AIモデルカードフレームワーク(CRAI-MCF)を紹介します。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:08:49 GMT)
Generative Modeling of Aerosol State Representations [5.8] エアロゾル-雲-放射相互作用は、地球の気候システムで最も不確実な構成要素である。
本稿では,特定質量および数濃度分布の深部変分オートエンコーダモデルを学習するためのフレームワークを提案する。
数百の原次元を10の潜伏変数に圧縮することにより、効率的なストレージと処理が可能になる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:38:30 GMT)
Q-Adapter: Visual Query Adapter for Extracting Textually-related Features in Video Captioning [5.8] MLLM(Multimodal Large Language Models)の拡張を目的とした軽量ビジュアルアダプタモジュールを提案する。
Q-Adapterは、学習可能なクエリトークンとゲーティング層をVisionに導入し、外部の監視に頼ることなく、スパース、キャプション関連機能の効果的な抽出を可能にする。
MSR-VTT と MSVD の2つの有名なビデオキャプションデータセットに対して,Q-Adapter の評価を行った。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:58:21 GMT)
An Asymptotically Optimal Coordinate Descent Algorithm for Learning Bayesian Networks from Gaussian Models [5.7] 線形ガウス構造方程式モデルに基づいて連続観測データからネットワークを学習する問題について検討する。
本稿では,$ell$penalized max chanceの最適目標値に収束する新しい座標降下アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:57:33 GMT)
SparseUWSeg: Active Sparse Point-Label Augmentation for Underwater Semantic Segmentation [5.6] セマンティックセグメンテーションのための新しいフレームワークであるSparseUWSegを紹介する。
SparseUWSegは、アノテータを誘導し、ポイントラベルの価値を最大化するアクティブサンプリング戦略を採用している。
2つの多様な水中データセットの実験は、最先端アプローチに対するSparseUWSegの利点を示している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:56:48 GMT)
TCMA: Text-Conditioned Multi-granularity Alignment for Drone Cross-Modal Text-Video Retrieval [5.5] 無人航空機(UAV)は、リアルタイムで高解像度のデータ収集のための強力なプラットフォームとなっている。
これらのビデオから関連コンテンツの効率的な検索は、都市管理、緊急対応、セキュリティ、災害救助の応用に不可欠である。
我々は,2,864本の動画と14,320本の細粒度,セマンティックなキャプションを含むDVTMDデータセットを構築した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:38:01 GMT)
On some practical challenges of conformal prediction [5.5] コンフォーマル予測(Conformal prediction)は、予測領域を作成するためのモデルのない機械学習手法である。
本稿は、非整合測度の単調性、可塑性関数の単調性、および共形予測領域の正確な決定に関する新たな知見を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:36:28 GMT)
Flexible manipulation of bipartite and multipartite EPR steerings [5.5] バイパートとマルチパートの量子ステアリングは、様々な量子タスクのための重要なリソースである。
5つの下向きHermitian Gaussianモードのフレキシブルなステアリング操作方式を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:18:26 GMT)
Robust Exploratory Stopping under Ambiguity in Reinforcement Learning [5.4] あいまいさ下での最適停止問題に対する連続時間頑健な強化学習フレームワークの提案と解析を行う。
この枠組みでは、エージェントは、曖昧さの下での堅牢な意思決定と未知の環境に関する学習という、2つの目的によって動機付けられた停止ルールを選択する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:38:06 GMT)
Bluetooth Fingerprint Identification Under Domain Shift Through Transient Phase Derivative [5.4] RFFP(Deep Learning-based Radio frequency fingerprinting)は、物理層セキュリティ技術として実現されている。
Bluetooth Low Energy (BLE) デバイスでは、これらの課題に対処することが特に重要である。
本研究では,BLEデバイスにおける周波数ホッピング効果を初めて検討し,新しい,低コストなドメイン適応型特徴抽出法を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:39:38 GMT)
Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows [5.4] 本稿では,予測困難により誘導されるクエリ固有多エージェントを生成するDifficulty-Aware Agentic Orchestration (DAAO)を提案する。
DAAOは、精度と推論効率の両方において、従来のマルチエージェントシステムを上回る。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:33:57 GMT)
Distributionally Robust Control with End-to-End Statistically Guaranteed Metric Learning [5.3] 我々は、新しいエンドツーエンド有限ホライズン・ワッサーシュタイン DRC フレームワークを提案する。
これは、異方性ワッサースタインメトリクスの学習と下流制御タスクを閉ループ方式で統合する。
提案手法は,最先端手法と比較して,クローズドループ性能とロバスト性に優れることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:40:49 GMT)
Vision4PPG: Emergent PPG Analysis Capability of Vision Foundation Models for Vital Signs like Blood Pressure [5.2] ウェアラブルおよび臨床機器における光胸腺撮影(S)センサーは、非侵襲的でリアルタイムな方法で貴重な生理的洞察を提供する。
本研究は,PSGの視力モデルと最先端の時系列FMを比較検討することにより,従来より改善されている。
私たちは臨床医に、計算的にも効率的な、新しい強力なツールセットを提供しています。
PEFT(Efficient Fine-Tuning)技術。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:13:30 GMT)
Can Compact Language Models Search Like Agents? Distillation-Guided Policy Optimization for Preserving Agentic RAG Capabilities [5.2] 強化学習(Reinforcement Learning)は、言語モデルからエージェントRAG行動を引き出す主要なアプローチとして登場した。
コンパクトモデルは初期性能が劣り、粗末な報酬と不安定な訓練をもたらす。
我々はこれらの困難を克服するために蒸留誘導政策最適化(DGPO)を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:36:34 GMT)
Automated detection of underdiagnosed medical conditions via opportunistic imaging [5.2] オポチュニティCTは、診断情報を抽出するために定期的なCT画像を再取得する。
画像表現型とそれに対応する文書との相違点を明らかにするため,2,674個のCTスキャンを解析した。
サルコニア,肝脂肪症,腹水と診断されたスキャンのわずか0.5%,3.2%,30.7%がICDで診断された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:34:18 GMT)
Data-light Uncertainty Set Merging with Admissibility [5.1] 本稿では、多種多様かつ潜在的に依存する不確実性集合を単一の統一集合にマージする、Synthetics, Aggregation, and Test Inversion (SAT) アプローチを紹介する。
SATは初期セットと制御レベルのみが利用可能である場合、不確実セットを統合するという課題によって動機付けられている。
主要な理論的貢献はSATの特性の厳密な解析であり、決定論的集合の融合の文脈における許容性を含む。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:18:57 GMT)
Revisiting Trust in the Era of Generative AI: Factorial Structure and Latent Profiles [5.1] 信頼は、人々が人工知能(AI)を採用し、どのように依存するかを形作る最も重要な要素の1つです。
既存の研究の多くは、システムの信頼性、正確性、使いやすさに重点を置いて、機能の観点から信頼度を測定している。
本研究では,GenAIにおける信頼の合理性と関係性の両方を捉えるための新しい尺度であるHuman-AI Trust Scale(HAITS)を導入し,検証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:39:53 GMT)
Semi-disentangled spatiotemporal implicit neural representations of longitudinal neuroimaging data for trajectory classification [5.0] Inlicit Neural Representation (INRs) を用いて、被験者特異的長手T1強調MRIデータを連続関数としてモデル化し、脳全体の老化軌跡を表現するための、新しい完全なデータ駆動方式を提案する。
従来のディープラーニングベースラインモデル(73.7%)を上回り,脳老化軌跡分類タスクの81.3%の精度を実現した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:27:43 GMT)
Attack via Overfitting: 10-shot Benign Fine-tuning to Jailbreak LLMs [5.0] 最近の研究では、10組の有害な質問応答ペアの微調整が、脱獄を成功させる可能性があることが示されている。
10組のQAペアしか持たない細調整でLLMをジェイルブレイクできることを実証した。
本手法は,攻撃効率と攻撃ステルスの両面で有意な優位性を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:33:56 GMT)
Scheming Ability in LLM-to-LLM Strategic Interactions [4.9] 大規模言語モデル(LLM)エージェントは、さまざまな状況下で自律的にデプロイされる。
2つのゲーム理論フレームワークによるフロンティアLSMエージェントの能力と妥当性について検討する。
試験用4機種(GPT-4o、Gemini-2.5-pro、Claude-3.7-Sonnet、Llama-3.3-70b)
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:42:29 GMT)
Depth One Quantum Alternating Operator Ansatz as an Approximate Gibbs Distribution Sampler [4.7] 本研究では,QAOA(Quantum Alternating Operator Ansatz)の熱サンプリング特性について検討した。
我々は、標準的な横フィールドXミキサーとGroverミキサーの2つの異なるQAOAミキサーに焦点を当てる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:37:08 GMT)
SenseShift6D: Multimodal RGB-D Benchmarking for Robust 6D Pose Estimation across Environment and Sensor Variations [4.7] SenseShift6Dは、13のRGB露光、9のRGBゲイン、自動露光、4つのディープキャプチャモード、5つの照明レベルを物理的に掃除する最初のデータセットである。
5つの一般的な家庭用オブジェクトに対して、166.4k RGBと16.7kの深度画像を取得する。
我々のデータセット上での最先端モデルによる実験により、テスト時にマルチモーダルセンサ制御を適用すると、かなりの性能向上が得られます。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:58:53 GMT)
Quantum Computing as a Service -- a Software Engineering Perspective [4.6] 量子コンピューティング・アズ・ア・サービス(QC)はサービス指向の哲学の解決策と見なされている。
本研究は,QCを実現するためのソフトウェア工学的な視点を提供するための,プロセス中心のアーキテクチャ駆動型アプローチについて検討する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:03:01 GMT)
System Password Security: Attack and Defense Mechanisms [4.2] 近年,システムパスワードを標的としたパスワードクラッキング攻撃は,情報システムのセキュリティに深刻な脅威をもたらしている。
本稿では,一般的なパスワードクラッキング手法の解析に焦点をあて,システムパスワードのセキュリティに関する体系的研究を行う。
また、アカウントロックアウトポリシー、多要素認証、リスク適応認証など、広く採用されている防御機構も評価している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:01:58 GMT)
BrainForm: a Serious Game for BCI Training and Data Collection [4.2] TextitBrainFormは、コンシューマハードウェアと最小限のセットアップを使用したデータ収集用に設計された、ゲーミフィケードなBrain-Computer(BCI)トレーニングシステムである。
本研究では,2つの視覚刺激テクスチャの繰り返しセッションにおける制御スキルの発達と性能効果について検討した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:17:04 GMT)
Grounded AI for Code Review: Resource-Efficient Large-Model Serving in Enterprise Pipelines [4.2] 本稿では,静的解析結果とAST誘導文脈抽出とを組み合わせた,基底型PRネイティブレビューシステムを提案する。
このアプローチは、競争力のある違反削減を維持しながら、サブ分間の第一フィードバックを達成する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:08:45 GMT)
Near-Optimal Real-Time Personalization with Simple Transformers [4.1] 単純な変換器は複雑なユーザの好みを捉えることができる。
そこで我々は,単純な変換器に基づく推薦タスクを高速に最適化するアルゴリズムを開発した。
本アルゴリズムは, 準線形時間における準最適性能を実現する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:49:41 GMT)
Understanding the Impact of Sampling Quality in Direct Preference Optimization [4.1] 我々は、DPO(Direct Preference Optimization)において、より高い品質のデータをどのように活用してパフォーマンスを向上させるかを検討する。
解析の結果、DPOの解空間と収束挙動は、データ生成分布の支持と品質に依存することがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:06:10 GMT)
Stroke Locus Net: Occluded Vessel Localization from MRI Modalities [4.0] Stroke Locus Netは、MRIスキャンのみを使用して、検出、セグメンテーション、閉塞された血管ローカライゼーションのためのエンドツーエンドのディープラーニングパイプラインである。
以上の結果から,脳卒中のT1MRIにおける閉塞血管の局所化は有望な結果であり,より高速でより知能的な脳卒中診断の可能性が示唆された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:30:17 GMT)
A Comprehensive Survey on Knowledge Distillation [3.9] 知識蒸留(KD)は、上記の問題に対処するために提案された顕著な手法の1つである。
本研究は, 蒸留源, 蒸留方法, 蒸留アルゴリズム, 蒸留の応用, 既存の方法との比較など, さまざまな側面からKDをレビューすることを含む。
本調査では, 拡散モデルのKD, 3次元入力, 基礎モデル, 変圧器, LLMなどの重要なサブカテゴリについて検討した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:04:00 GMT)
Seeing Hate Differently: Hate Subspace Modeling for Culture-Aware Hate Speech Detection [3.7] 我々は、データの空間性、文化的絡み合い、曖昧なラベリングを分析する。
個人の憎しみの部分空間を構成する文化認識フレームワークを提案する。
実験により,本手法は平均1.05%の最先端性能を示した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:07:20 GMT)
Uncovering Singularities in Feynman Integrals via Machine Learning [3.6] 記号回帰に基づく機械学習フレームワークを導入し,多ループFeynman積分の完全記号アルファベットを抽出する。
還元よりも解析構造を対象とすることで、この手法は様々な積分の族に広く適用され、解釈可能である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:16:33 GMT)
AI-assisted Programming May Decrease the Productivity of Experienced Developers by Increasing Maintenance Burden [3.6] GitHub CopilotのようなジェネレーティブAIソリューションは、ソフトウェア開発者の生産性を高めることが示されている。
GitHub Copilotの導入に伴い、オープンソースソフトウェア(OSS)プロジェクトにおける開発者の活動を分析します。
生産性は確かに増加する。しかし、生産性の増加は、主に経験の少ない(周辺)開発者によって引き起こされる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 10:58:58 GMT)
Efficient Attention via Pre-Scoring: Prioritizing Informative Keys in Transformers [3.6] 本稿では,HyperAttentionを適用する前に重要なキーを優先するプリスコリング機構を提案する。
ChatGLM2(131kトークンコンテキスト)の実験では、コンプレックスが12から8.3に減少し、標準のHyperAttentionを上回っている。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:13:54 GMT)
Privacy-aware Gaussian Process Regression [3.3] 提案手法は,データ所有者がプライバシ上の懸念から構築した高忠実度教師あり学習モデルを共有することを望まない場合に利用することができる。
提案手法の鍵となる考え方は,ガウス過程モデルの予測分散が予め定義されたプライバシーレベルに達するまで,データに合成ノイズを加えることである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:56:47 GMT)
Forecasting Clinical Risk from Textual Time Series: Structuring Narratives for Temporal AI in Healthcare [3.3] 本稿では, タイムスタンプによる臨床所見が予測の主入力となるテキスト時系列からの予測問題について紹介する。
我々は、細調整されたデコーダベースの大規模言語モデルやエンコーダベースのトランスフォーマーなど、多様なモデル群を評価する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:00:36 GMT)
The discrete adiabatic quantum linear system solver has lower constant factors than the randomized adiabatic solver [3.3] 方程式の線形系の解は、他の多くの量子アルゴリズムの基礎である。
最近の結果は、条件番号 $kappa$ と許容可能なエラー $epsilon$ の両方で最適なスケーリングのアルゴリズムを提供する。
ここでは, ランダム行列の数値実験により, 定数係数は, 前回の結果から得られた上限値の約1,200倍小さいことを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:09:03 GMT)
An Unsupervised Time Series Anomaly Detection Approach for Efficient Online Process Monitoring of Additive Manufacturing [3.3] 製造サイクルの類似性を把握し,セマンティックセグメンテーションを行う,教師なし異常検出アルゴリズムを提案する。
本手法の有効性は実世界のセンサデータを用いて実験的に検証した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:14:05 GMT)
DeepVARwT: Deep Learning for a VAR Model with Trend [3.1] 本稿では,トレンドと依存構造を最大限に推定するために,ディープラーニング手法を用いた新しい手法を提案する。
この目的のためにLong Short-Term Memory (LSTM) ネットワークが使用される。
シミュレーション研究と実データへの適用について述べる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:24:50 GMT)
Scaling Traffic Insights with AI and Language Model-Powered Camera Systems for Data-Driven Transportation Decision Making [3.0] 本研究では,大規模かつ高分解能な縦解析のためのエンドツーエンドAIベースのフレームワークを提案する。
局所都市シーンで訓練された微調整されたYOLOv11モデルにより,マルチモーダルトラフィック密度と分類基準をリアルタイムで抽出する。
2025年のニューヨーク市の混雑価格の早期展開で、約1000台の交通カメラから900万枚以上の画像を使ってシステムを検証した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:18:42 GMT)
Agentic LMs: Hunting Down Test Smells [3.0] テストの臭いはテストスイートの信頼性を低下させ、メンテナンスを複雑にする。
本研究は, 比較的少人数のモデルを用いて, 試験臭の検出能力について検討した。
実世界のJavaプロジェクトの5つの一般的な臭いを150件以上のインスタンスで1つ、2つ、4つのエージェントで評価します。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:10:36 GMT)
Using Preformed Resistive Random Access Memory to Create a Strong Physically Unclonable Function [2.9] 本稿では,Resistive Random Access Memory (ReRAM) PUFベースのプロトコルを提案する。
最後に,本プロトコルをPhysical ReRAMデバイス上でハードウェア上で実験し,PUFとして優れた性能特性を示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:56:12 GMT)
Causal-Guided Dimension Reduction for Efficient Pareto Optimization [2.9] CaDROは、観測と干渉のハイブリッドなプロセスを通して因果写像を構築し、目的に対する因果効果によってパラメータをランク付けする。
低インパクトパラメータは高品質なソリューションの値に固定されるが、クリティカルなドライバは引き続き検索でアクティブである。
増幅器、レギュレータ、RF回路にまたがって、CaDROはNSGA-IIよりも10$times$速く収束する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:41:04 GMT)
Universal Manipulation of Quantum Synchronization in Spin Oscillator Networks [2.8] オープン多体システムにおいて量子シンクロナイゼーション(QS)をチューニングするための普遍的でスケーラブルな手法を提案する。
解析により,QSはスピンフリップフロップ過程とその高次相関のみから発生し,異方性相互作用は非同期コヒーレンスを誘導することを示した。
提案機構は、XYZ相互作用と光ポンピングを用いて実験的に実現可能であり、複雑な量子ネットワークや物質の動的相におけるプログラム可能な同期制御のための一般的なフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:55:37 GMT)
Tight Robustness Certificates and Wasserstein Distributional Attacks for Deep Neural Networks [2.8] Wassersteinの分散ロバスト最適化(WDRO)は、対向ロバスト性のためのフレームワークを提供する。
予備的なアプローチを導入し、正確なリプシッツ証明の概念を採用して、WDROの上界を締め付ける。
また,最悪の分布候補を直接構築する新しいワッサースタイン分布攻撃(WDA)を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:59:31 GMT)
Leveraging Large Language Models for Cybersecurity Risk Assessment -- A Case from Forestry Cyber-Physical Systems [2.8] 安全クリティカルなソフトウェアシステムでは、サイバーセキュリティ活動が不可欠になる。
多くのソフトウェアチームでは、サイバーセキュリティの専門家は完全に欠席しているか、少数の専門家しか代表していない。
これにより、脆弱性や脅威を評価する上で、サイバーセキュリティの専門家やエンジニアをサポートするツールの必要性が生じる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:52:40 GMT)
BenchPress: A Human-in-the-Loop Annotation System for Rapid Text-to-SQL Benchmark Curation [2.8] BenchPressは、ドメイン固有のテキスト間ベンチマークの作成を高速化するために設計された、ループ内の人間システムである。
検索拡張生成(LLM)とLLMを使用して、複数の自然言語記述を提案する。
人間の専門家は、これらのドラフトを選択し、ランク付けし、編集し、正確さとドメインアライメントを保証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:50:12 GMT)
FOSSIL: Regret-Minimizing Curriculum Learning for Metadata-Free and Low-Data Mpox Diagnosis [2.6] 小さく不均衡なバイオメディカルデータセットにおける深層学習は、不安定な最適化と低い一般化によって制限されている。
FOSSILは,サンプルの難易度に応じてトレーニングの重み付けを適応的にバランスさせる,後悔を最小限にした重み付けフレームワークである。
その結果、FOSSILは、データ不足下での医用画像の難読化学習のための一般化可能、データ効率、解釈可能なフレームワークとして位置づけられた。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:00:59 GMT)
Integrating Structure-Aware Attention and Knowledge Graphs in Explainable Recommendation Systems [2.6] 本稿では,知識グラフと構造認識型アテンション機構を統合した,説明可能なレコメンデーションモデルを実装した。
このモデルはグラフニューラルネットワーク上に構築され、マルチホップ隣の集約戦略が組み込まれている。
Amazon Booksデータセットで実施された実験は、提案したモデルの優れた性能を検証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:39:34 GMT)
Multi Class Parkinsons Disease Detection Based on Finger Tapping Using Attention-Enhanced CNN BiLSTM [2.5] 注意喚起型CNN BiLSTMを用いた指タッピングに基づくマルチクラスパーキンソン病検出システムを提案する。
CNN, BiLSTM, および多クラスPD重度分類のための注意機構を統合したハイブリッドディープラーニングフレームワークを提案する。
このモデルは5つの重度クラスを区別する上で強い性能を示した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:02:14 GMT)
A Lightweight and Robust Framework for Real-Time Colorectal Polyp Detection Using LOF-Based Preprocessing and YOLO-v11n [2.5] 本研究では,ポリプ検出のための新しい,軽量で効率的なフレームワークを提案する。
ノイズの多いデータをフィルタリングするLocal Outlier Factorアルゴリズムと、YOLO-v11nディープラーニングモデルを組み合わせる。
従来のYOLO法と比較して精度と効率が向上した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:57:28 GMT)
Audit-of-Understanding: Posterior-Constrained Inference for Mathematical Reasoning in Language Models [2.5] AoU(Audit-of-Understanding)は,3つのフェーズを通じて,検証済みの前提に対する推論を制約するフレームワークである。
AoUは後天的に制約された推論であり、選択的予測と拒絶学習に繋がる。
コントリビューションは, (i) 完全検証の理論的保証, (ii) 不完全監査の過剰リスク境界, (iii) トラクタビリティ解析の3つである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:10:28 GMT)
Random State Approach to Quantum Computation of Electronic-Structure Properties [2.4] 実物質の電子構造を計算するためのランダム状態量子アルゴリズムを提案し,実装する。
グラフェン, ツイスト二層グラフェン準結晶, フラクタル格子の電子状態の密度と空間分布を数値計算してこれらのアルゴリズムを検証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:51:23 GMT)
On the validity of intermediate tracing in multiple quantum interactions [2.4] 適切な条件下では、相互作用する直前に複合システムにシステムを追加することができ、相互作用が完了すると、このシステムをトレースすることができる。
複合システム'と他のシステム'との新しい相互作用は、この相互作用の前にシステムの1つを追跡しなければ、より大きな複合システム'を生成する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:15:18 GMT)
Is Misinformation More Open? A Study of robots.txt Gatekeeping on the Web [2.4] 評価可能なニュースサイトと誤報サイトがロボット.txtファイルの設定方法に異なるかどうかを検討する。
回答可能なサイトの60.0%は、ロボット.txtファイル内の偽情報サイトの9.1%に対して、少なくとも1つのAIクローラを禁止している。
我々の研究は、大規模言語モデルで利用可能なトレーニングデータを形成することができるコンテンツアクセシビリティの非対称性の増大に注目した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:47:14 GMT)
Follow My Lead: Logical Fallacy Classification with Knowledge-Augmented LLMs [2.3] 大規模言語モデル(LLM)は、重大な推論のギャップに悩まされる。
この制限はデフォルトのSystem 1処理に起因しており、高速で直感的である。
このギャップを埋めるために、低コストで命令ベースの介入を検討します。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:02:11 GMT)
Agro-Consensus: Semantic Self-Consistency in Vision-Language Models for Crop Disease Management in Developing Countries [2.3] 発展途上国の農業病管理は、専門家の植物病理学者に限られているため、重大な課題に直面している。
本研究は,農業用画像キャプションにおける視覚言語モデル(VLM)の信頼性向上を目的とした,費用対効果の高い自己整合性フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:41:07 GMT)
Beyond Ethics: How Inclusive Innovation Drives Economic Returns in Medical AI [2.2] 我々は、包括的医療AI開発がコンプライアンス要件を超えたビジネス価値をいかに生み出すかを示す。
包括的イノベーションが引き起こす4つのメカニズムを特定します。
医療AIインクルーシブ・イノベーション・フレームワーク(HAIIF)について紹介する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:52:16 GMT)
{S\textsuperscript{2}M\textsuperscript{2}}: Scalable Stereo Matching Model for Reliable Depth Estimation [2.2] Stextsuperscript2Mtextsuperscript2は、Middlebury v3とETH3Dベンチマーク上の新しい最先端技術を確立する。
提案設計では, 高い長範囲対応性を持つマルチレゾリューショントランスフォーマを統合し, 実現可能な一致の確率を集中する新たな損失関数を学習する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:41:27 GMT)
Cryo-RL: automating prostate cancer cryoablation planning with reinforcement learning [2.2] Cryo-RLは,マルコフ決定プロセスとして凍結計画をモデル化する強化学習フレームワークである。
エージェントは、手作業で設計したプランを必要とせず、最適なクリーモローブ配置につながるクリーモアブレーション戦略を学ぶ。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:07:57 GMT)
A Novel Hybrid Grey Wolf Differential Evolution Algorithm [2.2] 本稿では,GWOと2種類のDEのハイブリッド化に基づく新しいアルゴリズム,すなわちGWO-DEアルゴリズムを提案する。
様々な数値ベンチマーク関数を適用して新しいアルゴリズムを評価する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:36:10 GMT)
CrunchLLM: Multitask LLMs for Structured Business Reasoning and Outcome Prediction [2.1] 本稿では,スタートアップ成功予測のためのドメイン適応LLMフレームワークであるbfCrunchLLMを紹介する。
本手法は,Crunchbaseスタートアップの成功予測の精度を80%以上向上させる。
この研究は、LLMをドメイン対応の微調整と構造化された非構造化データ融合に適合させることが、起業家的成果の予測モデリングをどのように進めるかを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:54:51 GMT)
Chord Colourizer: A Near Real-Time System for Visualizing Musical Key [2.0] 本稿では、音声信号の音楽的キーを検出し、新しいグラフィカルユーザインタフェース(GUI)を通して視覚的に表現する近リアルタイムシステムを提案する。
このシステムはアイザック・ニュートンのオリジナルカラーホイールに基づく音符に色を割り当て、ピッチと色調の歴史的つながりを保っている。
また、3Dプリントされた星型ディフューザーを使ってArduinoで制御されたLEDディスプレイを統合し、物理的な周囲のメディア表現を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:24:32 GMT)
Reducing Cognitive Overhead in Tool Use via Multi-Small-Agent Reinforcement Learning [2.0] ツールの使用から推論を明示的に分離するフレームワークであるMSARLを提案する。
MSARLでは、Reasoning Agentが問題とツール呼び出しを分解し、複数のツールエージェントが特定の外部ツールを専門にしている。
コード実行による数学的問題解決において、MSARLは単一エージェントベースラインに対する推論安定性と最終回答精度を大幅に改善する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:24:16 GMT)
ArtPerception: ASCII Art-based Jailbreak on LLMs with Recognition Pre-test [2.0] ArtPerceptionは、ASCIIアートを戦略的に活用し、最先端(SOTA)LLMのセキュリティ対策を回避した、新しいブラックボックスジェイルブレイクフレームワークである。
フェーズ1は、ASCIIアート認識のための最適なパラメータを経験的に決定するために、1回、モデル固有の事前試験を行う。
フェーズ2は、これらの洞察を活用して、非常に効率的でワンショットの悪意のあるジェイルブレイク攻撃を起動する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:28:37 GMT)
Benefits and Limitations of Using GenAI for Political Education and Municipal Elections [1.9] ジェネレーティブ人工知能(GenAI)は、教育のあらゆる領域における課題と機会を提示する。
北ライン=ヴェストファーレンの市政選挙に対抗して、ドルトムントの若きAI指導者たちは自問自答した。
それぞれの可能性と限界を探るため、異なるGenAIアプローチを組み合わせた実験を行った。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:53:38 GMT)
Accurate and Noise-Tolerant Extraction of Routine Logs in Robotic Process Automation (Extended Version) [1.9] 最終的な目標は、ロボットプロセスの自動化を可能にするルーチン型モデルを見つけることだ。
ルーチン型モデルの発見には、ルーチンログのプロビジョニングが必要である。
本稿では,ルーチンログの抽出を目的としたクラスタリング手法を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:53:29 GMT)
Inclusive, Differentially Private Federated Learning for Clinical Data [1.8] Federated Learning(FL)は、センシティブな患者データを集中化せずに、臨床AIモデルをトレーニングするための有望なアプローチを提供する。
実際の採用は、プライバシやリソース制約、コンプライアンスに関する課題によって妨げられています。
本稿では,定量的クライアントコンプライアンススコアに基づいて適応的にノイズを調整することでDPを向上する新しいFLフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:35:25 GMT)
Belief Graphs with Reasoning Zones: Structure, Dynamics, and Epistemic Activation [1.7] 信念は、エッジがサポートと矛盾を符号化する有向、符号付き、重み付きグラフのノードである。
信頼は、前述と構造認識の影響を混合する収縮伝播プロセスによって得られる。
提案手法は, 人工署名グラフ上に, 植込みゾーン, レポートゾーン回復, 衝撃下での安定性, 実行時の安定性に関する実証的プロトコルを概説する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:02:00 GMT)
Bridging Neural ODE and ResNet: A Formal Error Bound for Safety Verification [1.7] ニューラル常微分方程式(Neural ordinary differential equation,neural ODE)は、単一の残差ブロックを持つ残差ネットワーク(ResNet)の連続的な深度一般化として一般的に記述される機械学習モデルである。
本研究では,2つのモデル間の近似誤差を限定することにより,これらのモデル間のより公式な関係を確立する。
得られたエラーバウンドによって、検証ツールを2回実行することなく、モデルの1つを検証プロキシとして使用することが可能になります。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:27:21 GMT)
The Contingencies of Physical Embodiment Allow for Open-Endedness and Care [1.7] 物理的脆弱性と死亡は、しばしば、人工エージェントの開発において避けられる障害と見なされる。
我々は、この格差における生活条件の役割を理解することは、より堅牢で適応的で、人工エージェントを育むのに役立つと論じる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:06:32 GMT)
Are LLMs Empathetic to All? Investigating the Influence of Multi-Demographic Personas on a Model's Empathy [1.6] 本研究では,大言語モデルの認知的・情緒的共感が,人口統計学的属性の交差によって定義されるユーザ・ペルソナによってどのように異なるかを検討する。
本研究は, 年齢, 文化, 性別の組み合わせで構築した, 315人の独特なペルソナの交叉分析について紹介する。
儒教文化など,特定の集団に対して顕著な不適応を伴って,現実世界の共感傾向を広く反映していることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:04:57 GMT)
CoRGI: Verified Chain-of-Thought Reasoning with Post-hoc Visual Grounding [1.6] textbfCoRGI(textbfChain textbffof textbfReasoning with textbfGrounded textbfInsights)は、チェーンオブ思考出力のポストホック検証により、推論信頼性を高めるフレームワークである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:17:00 GMT)
Hydrogen production from blended waste biomass: pyrolysis, thermodynamic-kinetic analysis and AI-based modelling [1.6] 本研究は, 熱分解による食品系バイオマスの熱化学的変換を調査し, 持続可能なエネルギー・廃棄物管理戦略の進展に寄与する。
主な目的は, 使用済みコーヒー場 (SCG) や日付種子 (DS) などの未利用バイオマス資源の持続的水素生産の可能性を探ることである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:51:41 GMT)
Serialized EHR make for good text representations [1.6] SerialBEHRTはSciBERTを拡張したドメイン整列基盤モデルである。
我々は, 抗生物質感受性予測の課題において, その効果を評価した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:16:15 GMT)
The Visual Iconicity Challenge: Evaluating Vision-Language Models on Sign Language Form-Meaning Mapping [1.6] ビジュアル・イコニシティ・チャレンジ(Visual Iconicity Challenge)は、視覚言語モデルを評価するための心理言語学的尺度である。
オランダの手話におけるゼロおよび少数ショット設定において,13の最先端のVLMを評価した。
より強い音韻形式予測モデルでは、人間の象徴性判断と相関する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:14:03 GMT)
Leveraging Twitter Data for Sentiment Analysis of Transit User Feedback: An NLP Framework [1.4] トランジットサーベイを通じてユーザフィードバックを収集する従来の方法は、しばしば時間がかかり、リソースが集中し、コストがかかる。
我々は,Twitterのようなソーシャルメディアプラットフォームで利用可能な膨大な,豊富な,安価なデータを活用する,新しいNLPベースのフレームワークを提案する。
提案フレームワークは,ユーザフィードバックの収集と分析を,コストと時間を要するユーザフィードバック調査を必要とせずに効率化する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:11:00 GMT)
Observational entropy of quantum correlations and entanglement [1.4] ローカル計測(LO)、ローカル通信(LOCC)に基づく計測、分離可能な計測(SEP)など、様々な局所性制限を持つ観測者について検討する。
エントロピーギャップは、状態の絡み合いや非古典性に関するよく知られた尺度と関係があることが示される。
バイパルタイト純状態の場合、すべての局所的なエントロピーギャップはエントロピーを再現し、一般のマルチパルタイト状態ではエントロピーの相対エントロピーによって下界となる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 06:50:55 GMT)
Question-Driven Analysis and Synthesis: Building Interpretable Thematic Trees with LLMs for Text Clustering and Controllable Generation [1.4] 二分木を対話的に構築するための再帰的テーマ分割(RTP)を導入する。
ツリーの各ノードは、データを意味的に分割する自然言語の質問であり、完全に解釈可能な分類である。
RTPの質問駆動階層はBERTopicのような強力なベースラインからのキーワードベースのトピックよりも解釈可能であることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:03:11 GMT)
"Over-optimizing" for Normality: Budget-constrained Uncertainty Quantification for Contextual Decision-making [1.3] 重み付きサンプル平均近似(wSAA)を用いた文脈最適化の不確実性定量化について検討する。
我々は、wSAAの中央極限定理を確立し、最適条件予測コストに対するアルゴリズム正規性に基づく信頼区間を構築する。
我々は、予算制約付き推定器の収束率をわずかに低下させ、過度に最適化する'(命名規則よりも多くのイテレーションを実行する)が、この過ちを軽減し、正規性を保っていることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:09:59 GMT)
"Haet Bhasha aur Diskrimineshun": Phonetic Perturbations in Code-Mixed Hinglish to Red-Team LLMs [1.3] 我々は,テキストおよび画像生成タスクにおいて,コードミキシングと音声の摂動をジェイルブレイクLLMに活用する新しい戦略を導入する。
本研究では,LLMにおける安全性フィルタを効果的に回避する手法を提案する。
我々の解釈可能性実験は、音声による摂動が単語のトークン化に影響を与え、ジェイルブレイクが成功することを示した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:22:55 GMT)
Language steering in latent space to mitigate unintended code-switching [1.1] 大きな言語モデル(LLM)は意図しないコードスイッチングを示し、下流タスクの信頼性を低下させる。
並列翻訳におけるPCAによる言語方向を識別する軽量な推論時間法である潜在空間言語ステアリングを提案する。
提案手法は,計算オーバーヘッドの少ないセマンティクスを保ちながら,コードスイッチングを緩和する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:49:38 GMT)
Mathematics with large language models as provers and verifiers [1.1] ChatGPT は6つの IMO 問題のうち5つを解き、[Cohen, Journal of Sequences, 2025] の 6 個の数論の3分の1を閉じる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:35:25 GMT)
Exploring the Potential of Citiverses for Regulatory Learning [1.1] Citiverseは没入型仮想環境を提供することで、規制的な学習を支援する可能性を秘めている。
本稿では,規制学習のための実験空間として,シチバースの可能性を探るための科学と政治の課題を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:37:17 GMT)
Reduction-induced Variation of Partial Von Neumann Entropy [1.0] 混合状態QEとその対策は、理論と実用の両方において重要な役割を担っている。
本稿では, 部分フォン・ノイマンエントロピーの還元誘起変分法を提案し, 任意の二部体状態におけるQEを定量化する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:44:35 GMT)
A Vision-Based Shared-Control Teleoperation Scheme for Controlling the Robotic Arm of a Four-Legged Robot [1.0] 本研究は,視覚に基づくポーズ推定パイプラインを活用することで,直感的な遠隔操作を提案する。
このシステムはこれらの手首の動きをロボットアームのコマンドにマッピングし、ロボットの腕をリアルタイムで制御する。
軌道プランナは、障害物とロボットアーム自体との衝突を検出し防止することにより、安全な遠隔操作を保証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:33:28 GMT)
Tracking the Spatiotemporal Evolution of Landslide Scars Using a Vision Foundation Model: A Novel and Universal Framework [1.0] 本研究では,視覚基盤モデルを用いた大規模地すべり跡の進化追跡のための普遍的枠組みを提案する。
提案フレームワークは,地すべり跡の連続的かつ正確な識別を保証するために,知識誘導型自己伝播パラダイム内で機能する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:49:18 GMT)
LOOPerSet: A Large-Scale Dataset for Data-Driven Polyhedral Compiler Optimization [1.0] LOOPerSetは、220,000のユニークな合成多面体プログラムから得られた2800万のラベル付きデータポイントを含む新しいパブリックデータセットである。
LOOPerSetのスケールと多様性は、学習したコストモデルをトレーニングし評価するための貴重なリソースとなります。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:27:02 GMT)
Towards Safe Maneuvering of Double-Ackermann-Steering Robots with a Soft Actor-Critic Framework [0.7] ダブルアッカーマン操舵ロボット(DASMR)の安全かつ高精度な操作のための強化学習フレームワークを提案する。
我々のフレームワークは、HER(Hindsight Experience Replay)とCrossQオーバーレイを利用して、障害物を避けながら、操作効率を高める。
重い四輪操舵ローバーによるシミュレーションの結果、学習方針は障害物を避けつつ、目標位置の97%までしっかりと到達できることがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:30:37 GMT)
A Synthetic Dataset for Manometry Recognition in Robotic Applications [0.7] 手続き的レンダリングとAI駆動のビデオ生成を統合したハイブリッドデータ合成パイプラインを提案する。
YOLOベースの検出器は、合成データセットに基づいて訓練され、実際のデータと合成データを組み合わせた。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:18:23 GMT)
Optimizing Grasping in Legged Robots: A Deep Learning Approach to Loco-Manipulation [0.7] 本稿では,腕を備えた四足歩行の把握能力を高めるための枠組みを提案する。
そこで我々は,ジェネシスシミュレーション環境内にパイプラインを構築し,共通物体の把握試行の合成データセットを生成する。
このデータセットは、オンボードのRGBとディープカメラからのマルチモーダル入力を処理するU-Netのようなアーキテクチャで、カスタムCNNのトレーニングに使用された。
四脚ロボットの完全な枠組みを検証した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:20:50 GMT)
Autonomous UAV Flight Navigation in Confined Spaces: A Reinforcement Learning Approach [0.7] オフ・ポリティクスの手法は、高価で安全でない現実世界の微調整を最小化するための重要な特徴である、高いサンプル効率を約束する。
オン・ポリティクス法は、しばしばより優れた訓練安定性を示すが、これはハザード・センス環境における信頼性の高い収束に不可欠である。
この研究は、高精度で安全クリティカルなナビゲーションタスクにおいて、確立されたオン・ポリティクスの信頼性の高い収束は、オフ・ポリティック・アルゴリズムの特異なサンプル効率よりも決定的であることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:30:57 GMT)
Electron Lateral Trapping Induced by Non-Uniform Thickness in Solid Neon Layers [0.6] 固体ネオン層の有限厚さと非均一性が電子トラップに及ぼす影響について検討した。
電子の側方トラップ電位を生成するナノ基板機構を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 21:56:24 GMT)
Rademacher Meets Colors: More Expressivity, but at What Cost ? [0.5] グラフニューラルネットワーク(GNN)の表現力は、グラフ同型テストとの対応によって一般的に理解される。
この研究は、色付けアルゴリズムのレンズを通して表現性と一般化をリンクすることで、このトレードオフの理論的な説明を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:24:07 GMT)
SAM2LoRA: Composite Loss-Guided, Parameter-Efficient Finetuning of SAM2 for Retinal Fundus Segmentation [0.5] 本稿では,基底画像のセグメンテーションにセグメンテーション任意のモデル2(SAM2)を適用したパラメータ効率の良い微調整手法を提案する。
SAM2LoRAはイメージエンコーダとマスクデコーダの両方に低ランクのアダプタを統合し、オリジナルのトレーニング可能なパラメータの5%未満を必要とする。
血管のDiceスコアは最大0.86点、光学ディスクのセグメンテーションは0.93点、AUCスコアは最大0.98点、AUCスコアは0.99点である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:07:44 GMT)
Equivalent Linear Mappings of Large Language Models [0.5] 我々は変換器の特性を利用して全ての演算を$A(x) cdot x$と表現し、$A(x)$は入力依存の線形変換を表し、$x$は線形経路を保存する。
この線形構造を公開するために、入力シーケンスに関して勾配の成分を戦略的に切り離し、推論中に計算された値で$A(x)$項を凍結する。
この分離されたヤコビアンは入力トークンごとに1つの線形作用素で出力を再構成し、これは Qwen 3 と Gemma 3 と Llama 3 に対して Qwen 3 14B まで示される。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:29:51 GMT)
Fundamental precision limits in finite-dimensional quantum thermal machines [0.5] 我々は、基本精度限界、相対的分散とオープン量子熱機械の観測可能な観測値の期待に対する力学非依存境界を導出する。
本研究は,量子熱機械の精度に関する基礎的限界について考察した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:58:08 GMT)
End-to-end Automatic Speech Recognition and Speech Translation: Integration of Speech Foundational Models and LLMs [0.4] 音声翻訳(英: Speech Translation、ST)とは、ある言語からの音声信号を他の言語の対応するテキストに変換することを含む機械翻訳タスクである。
本稿では,事前学習した音声エンコーダとLarge Language Models(LLM)を併用して,音声認識(ASR)とSTの両方を同時に実行するためのエンドツーエンドアーキテクチャについて検討する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:10:30 GMT)
Quantum Kernel Methods: Convergence Theory, Separation Bounds and Applications to Marketing Analytics [0.2] 本研究は、NISQ体制における実際の消費者分類タスクに量子カーネル法を適用することの実現可能性について研究する。
量子カーネル支援ベクトルマシン(Q-SVM)と量子特徴抽出モジュール(QFE)を組み合わせたハイブリッドパイプラインを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:11:41 GMT)
Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals [0.2] セグメント化出力の人為的補正による介入学習を可能にする,ループ内対話型フレームワークを提案する。
筆者らのフレームワークは,挑戦的な立方体データに対して最大9mIoUポイントのセグメンテーション精度を向上させることを実証している。
この研究は、精度が高く、データセットバイアスに頑健で、データ効率が良く、都市気候モニタリングや自動運転といった現実世界の領域に適応可能なセグメンテーションシステムを構築するための、研究者や実践者のための実践的なフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:16:41 GMT)
A Solvable Semi-infinite Fock-state-lattice SSH Model: the Stable Topological Zero Mode and the Non-Hermitian Bound Effect [0.1] 従来のSSHモデルよりも安定な位相零モードが見出され, 異方性条件下での固有領域壁の境界状態から導かれる。
パリティタイム相転移は、部分空間における力学の振動と定常の交叉によって観測される。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:39:21 GMT)
BACE: Behavior-Adaptive Connectivity Estimation for Interpretable Graphs of Neural Dynamics [0.1] 本稿では,位相特異的な指向的な地域間接続を学習するエンド・ツー・エンド・エンド・フレームワークである振舞い適応接続性推定(BACE)を紹介する。
BACEは、各解剖学的領域内の多くの微小接触を、地域ごとの時間エンコーダを介して集約する。
それぞれの行動フェーズに固有の学習可能な隣接性を適用し、予測目標に基づいてトレーニングされる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:48:36 GMT)
Prismo: A Decision Support System for Privacy-Preserving ML Framework Selection [0.1] プライバシ保護機械学習(PPML)フレームワークは、機械学習アプリケーションにおける機密情報を保護するために開発された。
PPMLアプリケーションシナリオの最適パラメータとフレームワークの選択を支援するために設計されたオープンソースレコメンデーションシステムであるPrismoを提案する。
複数のユースケースを通じてPrismoの有効性を評価し、異なるデプロイメントシナリオで最適なソリューションを提供する能力を実証した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:27:15 GMT)
Evolution of wartime discourse on Telegram: A comparative study of Ukrainian and Russian policymakers' communication before and after Russia's full-scale invasion of Ukraine [0.1] 本研究では、ロシア・ウクライナ戦争中のテレグラムにおけるエリート主導の政治コミュニケーションについて検討する。
我々は、2022年のロシア侵攻後のコミュニケーション量、テーマコンテンツ、アクターエンゲージメントの変化を分析した。
われわれの調査結果は、政策立案者が戦時コミュニケーションの課題にどのように適応するかを明らかにし、戦時中のオンライン政治談話のダイナミクスに関する重要な洞察を提供した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:17:52 GMT)
Learning Representations of Event Time Series with Sparse Autoencoders for Anomaly Detection, Similarity Search, and Unsupervised Classification [0.0] イベント時系列は、不規則な時間間隔で発生する離散イベントのシーケンスである。
これらは高エネルギー天体物理学、計算社会科学、サイバーセキュリティ、金融、医療、神経科学、地震学などの領域でよく見られる。
本稿では,イベント時系列の2次元および3次元テンソル表現と,物理的に意味のある潜在表現を学習するスパースオートエンコーダを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:41:10 GMT)
Unveiling Gamer Archetypes through Multi modal feature Correlations and Unsupervised Learning [0.0] プロファイリングゲーマーは、適応型ゲームデザイン、行動理解、デジタル幸福に対する重要な洞察を提供する。
本研究では、心理測定、行動分析、機械学習を組み合わせて、基礎となるゲーマーのペルソナを明らかにする統合されたデータ駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:46:44 GMT)
Uncertainty-Aware Post-Detection Framework for Enhanced Fire and Smoke Detection in Compact Deep Learning Models [0.0] 既存のビジョンベースの手法は、効率性と信頼性のバランスをとる上で困難に直面している。
YOLOv5nやYOLOv8nといったディープラーニングモデルは、UAV、CCTVシステム、IoTデバイスへのデプロイに広く採用されている。
本稿では,統計的不確実性と領域関連視覚的手がかりの両方を用いて,検出信頼度を再スケールする不確実性検出後フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:36:57 GMT)
The algorithmic regulator [0.0] 規制の定理は、ある条件下では、任意の最適コントローラーは、それが規制するシステムのモデルを具現化しなければならないと述べる。
この原理は、自由エネルギー原理(Free-Energy Principle)やコルモゴロフ/アルゴリトミックエージェント理論(Kolmogorov/Algorithmic Agent theory)のような神経科学と予測的脳理論の基盤となっている。
Delta$が大きければ大きいほど、高い相互アルゴリズム情報を持つワールドレギュレータペアが好まれる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:54:08 GMT)
The Quantum Paldus Transform: Efficient Circuits with Applications [0.0] 本稿では、第2量子化におけるフェルミオン系スピンフリーハミルトニアンをブロック対角化するための効率的な量子アルゴリズム、Quantum Paldus Transformを提案する。
私たちの研究は、パウリの排他原理によって抽出可能な第二量子化のための量子シュア変換の一般化と見なすことができる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:18:34 GMT)
The Mechanical Yes-Man: Emancipatory AI Pedagogy in Higher Education [0.0] 生成AIの統計論理と因果推論の欠如は、真の学習に必要な認知プロセスを脅かす。
この論文は、教育における生成AIに対する技術最適化的アプローチと制限的アプローチの両方を批判する。
それは、検証、熟達、そして共同調査に基礎をおく解放的教育を提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:29:06 GMT)
The Ethics Engine: A Modular Pipeline for Accessible Psychometric Assessment of Large Language Models [0.0] この研究は、大規模言語モデルの心理測定評価を研究ツールに変換するモジュール型のPythonパイプラインであるEthics Engineを提示する。
このパイプラインは、インフラストラクチャ設計がAI研究への参加をいかに拡大するかを示すものだ。
このようなツールは、科学的な厳格さを維持しながら技術的障壁を低くすることで、AI研究の景観を根本的に変えている、と私たちは主張する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:09:51 GMT)
Symmetry-induced failures of tomographic locality: Constructing foil theories by twirling [0.0] 我々は、トモグラフィーの局所性の原理に反する理論を生成するためのスキームを開発する。
トモグラフィー・ローカリティの失敗は、ツワール世界において至るところで見られる。
この結果は、量子理論を公理化して立脚させる研究者の必要性も示している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:39:33 GMT)
Supervised Manifold Learning for Functional Data [0.0] 多様体学習の観点から分類の話題を考察する。
低次元表現を学習するためにラベル情報を考慮に入れた新しい近接測度を提案する。
実際に,本手法といくつかの古典的分類器を組み合わせることで,高い競争力を持つ分類性能が得られることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:18:19 GMT)
Spin exchange of two spin-1/2 atoms [0.0] 量子チェシャー・キャット効果(英: quantum Cheshire cat effect)は、量子力学において重要な現象であり、キャリヤからの物理的性質の分離性を明らかにする。
この研究は、2部量子チェシャー猫効果におけるフェルミオン系の実現可能性について理論的に確認する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:03:19 GMT)
SLEAN: Simple Lightweight Ensemble Analysis Network for Multi-Provider LLM Coordination: Design, Implementation, and Vibe Coding Bug Investigation Case Study [0.0] SLEANは、.txtテンプレートを使用してLLM間の単純なプロンプトブリッジとして機能し、デプロイに深い技術知識を必要としない。
独立した分析、相互批判、仲裁によって形成される3フェーズプロトコルは、有害なAI生成コード提案をフィルタリングする。
ファイル駆動でプロバイダに依存しないアーキテクチャは、特別なコーディング専門知識のないデプロイメントを可能にします。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:24:04 GMT)
Reinforcement learning-based statistical search strategy for an axion model from flavor [0.0] 標準モデルを超えて新しい物理を探求するための強化学習に基づく探索戦略を提案する。
我々は、大域的な$U(1)$フレーバー対称性を持つ最小のアクシオンモデルに焦点を当てる。
学習エージェントはクォークとレプトンの代入金$U(1)$を見つけることに成功している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:09:02 GMT)
RATLIP: Generative Adversarial CLIP Text-to-Image Synthesis Based on Recurrent Affine Transformations [0.0] 条件付きアフィン変換(CAT)は、画像中のコンテンツ合成を制御するために、GANの異なる層に適用されている。
まず、各レイヤがグローバル情報にアクセスできるようにするために、CATとRAT(Recurrent Neural Network)をモデル化する。
次に、リカレントニューラルネットワークにおける情報忘れの特性を軽減するために、RAT間のシャッフルアテンションを導入する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 03:11:48 GMT)
Quasiparticle pairing encoding of atomic nuclei for quantum annealing [0.0] 我々は、ペアリングヌクレオンモードに基づく符号化方式を解析する。
以上の結果から,CNOTゲート数において最大3桁の計算上の利点が示された。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:50:32 GMT)
Quantum modeling of radical pair magnetic sensor based on electric dipole moment [0.0] 網膜におけるクリプトクロムタンパク質の光還元は、地磁気場を通る鳥類のナビゲーションのメカニズムとしてよく知られている。
フラビンアデニンジヌクレオチド(FAD)による青色光の吸収は、クロム中の電子の分布を変化させることができる。
ラジカル対中の電子のスピンダイナミクスと空間的位置との結合について検討した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 12:58:38 GMT)
Probabilistic Hyper-Graphs using Multiple Randomly Masked Autoencoders for Semi-supervised Multi-modal Multi-task Learning [0.0] マスク付きオートエンコーダ(PHG-MAE)を用いた確率的ハイパーグラフの導入
PHG-MAEはニューラルグラフに関する古典的な研究を統合する新しいモデルである。
アンサンブルの上に知識蒸留を施すことができ、性能が損なわれないことを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:05:34 GMT)
Possible Futures for Cloud Cost Models [0.0] クラウドは計算の風景を人工知能と機械学習(AI/ML)に最適化したものに変えつつある
我々は、発見と科学の継続的なサポートのために、クラウドコストモデルの歴史、現在、そして将来の可能性について論じる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:25:51 GMT)
Polynomials and asymptotic constants in a resurgent problem from 't Hooft [0.0] G(z)=sum_n=1inftysqrtn,zn$ for $|z|1$ が与えられたとき、分岐カット $zin[1,,infty)$ を除いて、その解析的連続性は $|z|ge1$ である。
解は両側収束和$G(z)=frac12sqrtpisum_n=inftyinfty (2pirm in-log(z))-3/2で与えられる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:27:45 GMT)
Parameter-Efficient and Personalized Federated Training of Generative Models at the Edge [0.0] FedGen-Edgeは、軽量クライアントサイドアダプタから凍結してトレーニング済みのグローバルバックボーンを分離し、アダプタのみをフェデレートするフレームワークである。
言語モデリング(PTB)と画像生成(CIFAR-10)では、FedGen-Edgeは強いベースラインよりも低いパープレキシティ/FIDと高速収束を実現している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:33:15 GMT)
Ortho-Fuse: Orthomosaic Generation for Sparse High-Resolution Crop Health Maps Through Intermediate Optical Flow Estimation [0.0] AIによる作物の健康マッピングシステムは、従来のモニタリング手法よりも大きな利点がある。
伝統的なフォトグラム再構成は、十分な特徴対応を確立するために、画像間の70-80%のオーバーラップを必要とする。
オーソファス(Ortho-Fuse)は、オーソモザイクを発生させるための光学的フローベースフレームワークである。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 22:33:34 GMT)
Ordinal Scale Traffic Congestion Classification with Multi-Modal Vision-Language and Motion Analysis [0.0] 本稿では,オープンボキャブラリ視覚言語推論(CLIP),オブジェクト検出(YOLO-World),およびMOG2ベースのバックグラウンドサブトラクションによる動作解析を組み合わせたマルチモーダルフレームワークを提案する。
このシステムは1(自由流)から5(密集)までの順序スケールでの混雑レベルを予測し、意味的に整列し、時間的に一貫した分類を可能にする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:59:59 GMT)
Operationalizing AI: Empirical Evidence on MLOps Practices, User Satisfaction, and Organizational Context [0.0] 本稿では、G2.comから8000以上のAI開発プラットフォームのユーザレビューを分析する。
9つの確立された機械学習オペレーションに対するレビューの感情を測定する。
9つのプラクティスのうち7つは、ユーザの満足度と大きなポジティブな関係を示している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:57:14 GMT)
Opacity-Gradient Driven Density Control for Compact and Efficient Few-Shot 3D Gaussian Splatting [0.0] 本稿では,3DGSの最適化を最適化し,効率を優先するフレームワークを提案する。
我々は、標準位置勾配を、不透明度勾配をレンダリングエラーの軽量プロキシとして利用する新しい密度化トリガに置き換える。
3ビューのLLFFデータセットでは、我々のモデルはFSGSよりも40%以上コンパクト(32k対57kプリミティブ)であり、Mip-NeRF 360データセットでは約70%の削減を実現している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:33:50 GMT)
On the Noisy Road to Open Quantum Dynamics: The Place of Stochastic Hamiltonians [0.0] 進化はオープン量子系の力学へのいくつかのアプローチを支える。
定式化において、オープンシステム問題は、結合されたシステム環境から効果的なシステムのみの記述に還元される。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:40:29 GMT)
On continuum and resonant spectra from exact WKB analysis [0.0] 散乱問題の幾何学的構造を解明するために、複素スケーリング法(CSM)と正確なWKB解析を併用する。
逆ローゼンポテンシャルのS行列を導出し、その基礎となる複素幾何学的特徴を明らかにする。
我々の分析は、散乱断面積とスペクトル理論を橋渡しし、量子共鳴と散乱現象に関する新しい幾何学的な洞察を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:15:20 GMT)
Observation of Power Superbroadening of Spectral Line Profiles on IBM Quantum [0.0] パワーワイドニング(英: Power Wideening)とは、駆動場の強度が増大するにつれて、2状態の量子遷移におけるスペクトル線プロファイルの拡大を指す。
我々は、同じパルス領域の長方形パルスよりもはるかに広い出力を示す複数の形状パルスを提示する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:31:52 GMT)
Neural variational inference for cutting feedback during uncertainty propagation [0.0] 提案手法は,フィードバックをカットするためのニューラルネットワークに基づく変分推論手法であるNeVI-Cutを提案する。
上流データやモデルへのアクセスを必要とせずに、上流分析からのサンプルを直接利用します。
我々はNeVI-Cutの推定値について理論的に保証し、任意のカットポストを近似する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 16:03:28 GMT)
Monogamy of Gaussian quantum steering and entanglement in a hybrid qubit-cavity optomagnonic system with coherent feedback loop [0.0] 量子相関のモノガミーは 量子情報処理の基本的な原理です
本研究では, 量子ステアリングと真の三部体の絡み合いのモノガミーについて検討した。
その結果,コヒーレントフィードバックループは熱効果下での絡み合いや量子ステアリングを促進できることがわかった。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:39:27 GMT)
MRI Brain Tumor Detection with Computer Vision [0.0] 本研究では,MRIによる脳腫瘍の自動検出とセグメント化におけるディープラーニング技術の応用について検討した。
我々は、脳腫瘍を効果的に分類するために、基本的なロジスティック回帰、畳み込みニューラルネットワーク(CNN)、Residual Networks(ResNet)など、いくつかの機械学習モデルを採用している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 15:07:52 GMT)
Local active error correction from simulated confinement [0.0] 我々は、励起間の整合性相互作用をシミュレートすることにより、トポロジカル符号におけるフォールトトレラントな誤り訂正を行うという古い考え方を洗練する。
我々は、シンドロームを計測し、近隣のプロセッサにメッセージをブロードキャストし、受信したメッセージを使って励起を移動するためのローカルな古典プロセッサの配列を用いて閉じ込めを実装する。
結果のリアルタイムデコーダのダイナミクスは幾何学的に局所的であり、時空では均一であり、グローバルな制御を一切行わない自己組織型である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:59:19 GMT)
KG-MAS: Knowledge Graph-Enhanced Multi-Agent Infrastructure for coupling physical and digital robotic environments [0.0] 本稿では,知識グラフ強化マルチエージェントインフラストラクチャを紹介する。
KG-MASは、多種多様な物理的およびデジタルロボット環境を結合するための堅牢でスケーラブルで柔軟なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:41:47 GMT)
J-RAS: Enhancing Medical Image Segmentation via Retrieval-Augmented Joint Training [0.0] 本稿では,探索モデルとセグメンテーションモデルを統合したガイド画像セグメンテーションのジョイントトレーニング手法を提案する。
どちらのモデルも最適化されており、セグメンテーションモデルは取得した画像とマスクのペアを利用して解剖学的理解を深めることができる。
2つのベンチマークデータセット上で、U-Net、TransUNet、SAM、SegFormerを含む複数のセグメンテーションバックボーンにわたるJ-RASを検証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:53:28 GMT)
Interoperability and Explicable AI-based Zero-Day Attacks Detection Process in Smart Community [0.0] 本稿では,6Gモバイル通信,インターネット・オブ・エコノミクス(IoE),人工知能(AI),スマートコントラクトを組み込んだWPA3プロトコルベースのWiFi-8が連携して,既知の攻撃ベクトルを防止し,ゼロデイ攻撃に対する保護を実現する方法について説明する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:47:03 GMT)
Information flow in multilayer perceptrons: an in-depth analysis [0.0] 多層パーセプトロンの層に沿って情報がどのように流れるかを分析することは、人工ニューラルネットワークの分野で最も重要なトピックである。
情報行列の概念は考案され、最適化戦略のエトロジーを理解するための形式的な枠組みとして使用される。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:38:06 GMT)
Hybrid Quantum Systems: Coupling Single-Molecule Magnet Qudits with Industrial Silicon Spin Qubits [0.0] Terbium bis (phthalocyaninato) (TbPc$$) はそのようなシステムを実証する。
ハイブリッド量子メモリでは、TbPc$$が主記憶素子として機能し、半導体量子ビットは読み出しとカップリングを提供する。
工業的に製造されたシリコン-酸化物-半導体(SiMOS)スピン量子ビットを用いて、TbPc$$分子のアンサンブルの電子スピン遷移を検出する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 08:41:04 GMT)
Hybrid Deep Learning Approaches for Classifying Autism from Brain MRI [0.0] 脳画像と機械学習を組み合わせることで、ASDに関連付けられたより客観的なパターンを特定するのに役立つかもしれない。
このプロジェクトは、ABIDE IデータセットからMRIデータを用いて、ASDと制御参加者を分類するための2つのアプローチをテストする。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 13:43:46 GMT)
How an Equi-ensemble Description Systematically Outperforms the Weighted-ensemble Variational Quantum Eigensolver [0.0] 我々は、多体励起状態の変分原理の一般化に焦点をあて、アンサンブル変分量子固有解法(VQE)を導いた。
等価アンサンブルと重み付きアンサンブルという2つのアンサンブルVQE手法の性能を比較し,その等価アンサンブルが進むべき道であると結論付けた。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:12:54 GMT)
Fused Lasso Improves Accuracy of Co-occurrence Network Inference in Grouped Samples [0.0] 共起ネットワーク推論アルゴリズムは、通常、単一の環境ニッチから収集されたサンプル内の微生物の関連を分析する。
我々は,マイクロバイオーム・コミュニティ・ネットワークの推論において,完全に新しいアルゴリズムであるfuserを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:53:13 GMT)
Fractional Aharonov-Bohm effect for retarded potentials [0.0] アハロノフ・ボーム効果は第二量子場理論を用いて導出される。
この結果は、電磁界の遅延が無視できる場合のアハロノフ・ボーム効果の通常の表現と一致している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:30:51 GMT)
Features of preparable entangled states in Gaussian quantum networks [0.0] 絡み合った状態の決定論的準備は 量子ネットワークの実現の鍵となる要素の1つです
ここでは、3種類の基本ガウス量子ネットワークで絡み合った状態が準備できる条件下で理論的に解析する。
このことは、ネットワーク構造が準備可能な絡み合ったガウス状態の集合に強い制約を課していることを示している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 11:16:26 GMT)
FMANet: A Novel Dual-Phase Optical Flow Approach with Fusion Motion Attention Network for Robust Micro-expression Recognition [0.0] 微妙な顔の動きを捉えるのが難しいため、微小な表情認識は困難である。
本稿では,マイクロ圧縮相とマイクロ圧縮相の運動力学を統合記述子に統合した総合的な動き表現を提案する。
次に、二相解析と等級変調を学習可能なモジュールに内部化する、新しいエンドツーエンドニューラルネットワークアーキテクチャであるFMANetを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:44:02 GMT)
Exploring Compositional Generalization (in COGS/ReCOGS_pos) by Transformers using Restricted Access Sequence Processing (RASP) [0.0] 本研究では,トランスフォーマーデコーダが構成一般化(COGS)と意味論的に等価なReCOGS_posを実行できることを示す。
我々の RASP モデルは COGS と ReCOGS_pos 上の構造一般化分割の完全スコアに近い。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 18:25:12 GMT)
Experience-Efficient Model-Free Deep Reinforcement Learning Using Pre-Training [0.0] 強化学習エージェントは通常、ポリシーを学ぶために環境相互作用の大規模なサンプルに依存する。
ネットワークの一部を同様の物理で異なる環境に事前学習することは、エージェントがターゲット環境を高い効率で学習するのに役立ちます。
我々は,PPOPTが,報奨と一般訓練安定性の両面において,小規模なトレーニングサンプルにおいて,ベースラインの古典的PPOよりも優れていたことを実証した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:15:18 GMT)
Entanglement dynamics via Geometric phases in Trapped-ions [0.0] メルマー・ソレンセンゲートは多粒子系における制御相互作用の実装法として広く用いられている。
量子プロセストモグラフィ(QPT)やベル状態トモグラフィ(BST)といった一般的な手法は、MSゲートの性能を評価するために一般的に用いられる。
我々は,MSゲートにおける性能評価と雑音識別のためのツールとして,幾何位相を利用することを提案する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 02:27:55 GMT)
Enhancing quantum computations with the synergy of auxiliary field quantum Monte Carlo and computational basis tomography [0.0] 本稿では,計算基底トモグラフィー(CBT)を量子古典的補助場量子モンテカルロ法(QC-AFQMC)に組み込むハイブリッドアルゴリズムであるQC-CBT-AFQMCを紹介する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:21:41 GMT)
Egocentric Visual Navigation through Hippocampal Sequences [0.0] 海馬の配列は内因性リカレント回路から発生し, 容易に入力できなくても活動が伝播することを示す。
我々は神経生物学にインスパイアされた最小のシーケンスジェネレータを実装し、エゴセントリックな視覚ナビゲーションのためのアクター批判学習者と組み合わせる。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 01:38:23 GMT)
Effects of the Cyber Resilience Act (CRA) on Industrial Equipment Manufacturing Companies [0.0] CRA(Cyber Resilience Act)は、厳格なサイバーセキュリティ要件を満たすことを保証することで、デジタル製品やサービスのセキュリティを強化することを目的とした、欧州連合(EU)の新たな規制である。
本稿では,産業機器メーカーがCRAに準拠する準備中に期待する課題について,包括的調査を通じて検討する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:23:40 GMT)
Deliberative Dynamics and Value Alignment in LLM Debates [0.0] 大規模言語モデルを用いたマルチターン設定における検討的ダイナミクスと値アライメントについて検討する。
我々は、Redditの"Am I the Asshole"コミュニティから1000のジレンマで注文効果を検証し、検証する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 04:06:07 GMT)
DeepFusionNet: Autoencoder-Based Low-Light Image Enhancement and Super-Resolution [0.0] 低光と暗い画像は、オートエンコーダを使用して明るい色に変換される。
DeepFusionNetアーキテクチャはこれらの課題に対処する。
SSIMは92.8%、PSNRは26.30で、パラメータは250万である。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 09:04:22 GMT)
Debate, Deliberate, Decide (D3): A Cost-Aware Adversarial Framework for Reliable and Interpretable LLM Evaluation [0.0] 本稿では、役割特化エージェント間の構造的議論を組織化する、費用対効果のある多エージェントフレームワークであるDebate, Deliberate, Decide(D3)を紹介する。
我々は,反復的議論の下で信頼性と収束性を特徴付けるスコアギャップの確率論的モデルを開発する。
我々は,人間の判断に対する最先端の合意,匿名化による位置バイアスと冗長性バイアスの低減,そして,適切な費用対精度のフロンティアを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 20:38:04 GMT)
Curved Boolean Logic: A Contextual Generalization of Propositional Logic with Algorithmic Consequences [0.0] CBLは、一つのグローバルな評価に拡張しない局所的な真理代入を許すことで命題論理を一般化する。
等価なシャーフと排他性グラフのセマンティクスと、フラットリミットで保守的な文脈対応の証明計算を与える。
iid, AR(1)関連, 対向的有界摂動による雑音をモデル化し, ベンジャミン・ホックバーグFDR制御による変分に基づく重要度を提供する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 07:06:25 GMT)
Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence [0.0] コーディネート焦点として機能する最大効用を持つ解は、精度よりもエージェント間で発見可能な選択圧力がはるかに高いことを示す。
この枠組みを熱力学的コーディネート理論 (TCT) と呼び、協調には急進的な情報損失が必要であることを示す。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 17:17:57 GMT)
ConsistencyAI: A Benchmark to Assess LLMs' Factual Consistency When Responding to Different Demographic Groups [0.0] 本稿では,大規模言語モデル(LLM)の現実的整合性を測定するための独立したベンチマークであるConsistencyAIを紹介する。
実験では、19のLSMを質問し、15のトピック毎に5つの事実を要求した。
回答を文埋め込み, 対人コサイン類似度を計算し, 対人コサイン類似度の重み付け平均を計算し, 事実整合性スコアを算出した。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 23:32:02 GMT)
Bridging Semantics & Structure for Software Vulnerability Detection using Hybrid Network Models [0.0] 我々は複雑な相互作用ネットワークとして制御とデータフローの関係を捉えている。
本フレームワークでは,グラフ表現と軽量(4B)局所LLMを組み合わせる。
提案手法は,グラフ注意ネットワークによる埋め込みよりも93.57%の精度で8.36%向上する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 19:32:00 GMT)
Bounds on Eventually Universal Quantum Gate Sets [0.0] qubit に対して、我々の結果は、$n$-qubit ゲート集合が最終的に普遍であれば、$16n$ qubit システムで作用するときに普遍性を示すことを意味する。
我々の証明は、有限線型群の不変性と、ユニタリな2$-設計であるすべての有限群に対する分類結果に依存する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 00:05:41 GMT)
Automatic Speech Recognition in the Modern Era: Architectures, Training, and Evaluation [0.0] 音声認識は、ディープラーニングの進歩によって、過去10年間に大きく変化してきた。
この調査は、従来のハイブリッドシステムから、現在支配的なエンドツーエンドのニューラルアーキテクチャへの進化をグラフ化して、ASRの現代を包括的に概観する。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 05:38:45 GMT)
Agentic Vehicles for Human-Centered Mobility [0.0] 本稿ではエージェントAIシステムを統合し、複雑な環境下での推論、適応、相互作用を行うエージェントAI(AgV)の概念を紹介する。
それは、AgVがいかにして従来の自律性を補完し、形を変えて、モビリティサービスがユーザと社会的ニーズに整合していることを保証するかを示唆している。
論文参考訳(メタデータ) (Sat, 11 Oct 2025 14:14:34 GMT)