LSVOS 2025 Challenge Report: Recent Advances in Complex Video Object Segmentation [186.1] 本報告では,ICCV 2025とともに開催された第7回大規模ビデオオブジェクト(LSVOS)チャレンジの概要について述べる。
2025年版は新たに導入されたコンプレックスVOS (MOSEv2) が特徴である。
データセットとプロトコルを要約し、トップパフォーマンスのソリューションを強調し、新興トレンドを抽出します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:02:09 GMT)
Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning [124.5] Vlaser - 相乗的具体的推論機能を備えたビジョン・ランゲージ・アクション・モデルを紹介する。
Vlaserは、様々な具体的推論ベンチマークで最先端のパフォーマンスを達成する。
提案手法は,WidowXベンチマークの最先端結果と,Google Robotベンチマークの競合性能を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:51:22 GMT)
UALM: Unified Audio Language Model for Understanding, Generation and Reasoning [124.2] 統一音声言語モデル (Unified Audio Language Model, UALM) は、音声理解、テキスト音声生成、マルチモーダル推論を単一モデルで統一することを目的としている。
最初にUALM-Genを提示する。これは音声トークンを直接予測し,最先端の拡散モデルに匹敵する言語モデルである。
UALM-Reasonは、テキストと音声の両方を中間的思考ステップで活用し、複雑な生成作業を容易にするマルチモーダル推論モデルである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:55:01 GMT)
Muddit: Liberating Generation Beyond Text-to-Image with a Unified Discrete Diffusion Model [118.5] テキストと画像の両モードをまたいで高速かつ並列に生成できる,統一的な離散拡散変換器であるMudditを導入する。
Mudditは、スクラッチからトレーニングされた以前の統一拡散モデルとは異なり、トレーニング済みのテキストからイメージまでのバックボーンから、強力な視覚的事前情報を軽量のテキストデコーダに統合する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:17:52 GMT)
SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer [116.2] SANA-Videoは、720×1280の解像度と分長のビデオを効率よく生成できる小さな拡散モデルである。
2つのコア設計により、効率的な、効果的で、長いビデオ生成が保証されます。
コストの安いSANA-Videoは、現代の最先端の小さな拡散モデルと比較して、競争性能を達成している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:12:27 GMT)
LLM-Specific Utility: A New Perspective for Retrieval-Augmented Generation [110.6] Retrieval-augmented Generation (RAG)は、外部知識を取り入れた大規模言語モデル(LLM)を強化する。
既存の研究はしばしばユーティリティをジェネリック属性として扱い、異なるLLMが同じ通路から異なる利益をもたらすという事実を無視している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:57:45 GMT)
WebThinker: Empowering Large Reasoning Models with Deep Research Capability [109.9] WebThinkerは、LEMがウェブを自律的に検索し、ウェブページをナビゲートし、推論プロセス中にレポートをドラフトすることを可能にするディープリサーチエージェントである。
また、Autonomous Think-Search-and-Draft戦略を採用しており、モデルが推論、情報収集、レポート作成をリアルタイムでシームレスにインターリーブすることができる。
我々のアプローチは複雑なシナリオにおけるLEMの信頼性と適用性を高め、より有能で多目的な深層研究システムへの道を開く。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:40:15 GMT)
Discovering and Reasoning of Causality in the Hidden World with Large Language Models [109.6] 我々はCausal representatiOn AssistanT(COAT)と呼ばれる新しいフレームワークを開発し、因果発見に有用な測定変数を提案する。
大規模言語モデル (LLM) と因果関係を直接推論する代わりに、COAT は中間因果発見結果から LLM へのフィードバックを構築し、提案した変数を洗練させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:34:20 GMT)
IVEBench: Modern Benchmark Suite for Instruction-Guided Video Editing Assessment [108.9] IVEBenchは、命令誘導ビデオ編集アセスメント用に特別に設計されたベンチマークスイートである。
様々な600の高品質なソースビデオのデータベースからなり、7つのセマンティックディメンションにまたがり、32フレームから1,024フレームの動画をカバーしている。
IVEBenchは、映像品質、命令順守、映像忠実度を含む3次元評価プロトコルを確立する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:27:08 GMT)
VeriCite: Towards Reliable Citations in Retrieval-Augmented Generation via Rigorous Verification [107.8] 証拠を厳格に検証し,回答の帰属性を高めるために設計された,VeriCiteと呼ばれる新しいフレームワークを紹介する。
我々は,5つのオープンソースLCMと4つのデータセットを対象とした実験を行い,VeriCiteが回答の正しさを維持しつつ,引用品質を大幅に向上できることを実証した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:38:54 GMT)
DocReward: A Document Reward Model for Structuring and Stylizing [107.0] DocRewardはドキュメントの構造とスタイルに基づいてドキュメントを評価するドキュメント報酬モデルである。
ブラッドリー・テリーの損失を利用して文書を採点し、注釈付きランキングに矛盾する予測を罰する訓練を受けている。
GPT-5の37.7%の勝利率に比べて60.8%の勝利率を達成した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:36:32 GMT)
REACT3D: Recovering Articulations for Interactive Physical 3D Scenes [96.3] REACT3Dは静的な3Dシーンを一貫した幾何学を持つシミュレーション可能なインタラクティブなレプリカに変換するフレームワークである。
室内の様々な場面における検出・分離・調音計測における最先端性能について検討した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:37:59 GMT)
Future-Aware End-to-End Driving: Bidirectional Modeling of Trajectory Planning and Scene Evolution [96.3] 将来的なシーンの進化と軌道計画を共同でモデル化する,新たなエンドツーエンドフレームワークであるSeerDriveを紹介する。
本手法はまず,周辺環境の動態を予測するために,将来の鳥眼ビュー(BEV)の表現を予測する。
2つの重要な要素がこれを可能にする:(1)予測されたBEV機能を軌道プランナーに注入する将来対応計画、(2)反復的なシーンモデリングと車両計画。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:41:47 GMT)
Agent Learning via Early Experience [93.8] 言語エージェントの長期的な目標は、彼ら自身の経験から学び、改善することであり、最終的には複雑な現実世界のタスクにおいて人間より優れています。
現在のエージェントのほとんどは、専門家データによる教師付き微調整に依存しており、スケールと一般化が不十分である。
本研究では,(1)環境力学における政策の基盤として収集された状態を利用するインプリシット・ワールド・モデリング,(2)エージェントが最適な行動から学習し,推論と意思決定を改善するための自己回帰という2つの手法について検討する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:25:00 GMT)
Demystifying Reinforcement Learning in Agentic Reasoning [90.4] エージェント推論における強化学習のデミスティフィケーションのための包括的かつ体系的な調査を行う。
i) 縫合された合成軌道を、実際のエンドツーエンドのツール・ツー・ユース・トラジェクトリに置き換えることで、より強力なSFTが得られる。
探索フレンドリーな技術は、高いクリップ、過剰な報酬形成、適切なポリシーエントロピーの維持といったエージェントRLにとって不可欠であり、訓練効率を向上させることができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:57:15 GMT)
Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [90.2] 3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:55:25 GMT)
Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement [90.0] LH-VAEを導入し、視覚的意味的制約や進行的劣化による意味的堅牢性を高める。
Latent Harmonyは、UHD修復のためのVAEを再定義する2段階のフレームワークである。
実験により、Latent HarmonyはUHDおよび標準解像度タスクにまたがって最先端のパフォーマンスを実現し、効率、知覚品質、再現精度を効果的にバランスさせることが示されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:30:40 GMT)
Situat3DChange: Situated 3D Change Understanding Dataset for Multimodal Large Language Model [89.9] Situat3DChangeは、状況に応じた3つの変更理解タスクをサポートする広範なデータセットである。
我々は、環境変化の1万1千人の人間の観察を利用して、共有精神モデルを確立する。
我々はSCReasonerを提案し、同じシーンから一対の点雲と小さな変化を比較するという課題に対処する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:17:18 GMT)
Holistic Agent Leaderboard: The Missing Infrastructure for AI Agent Evaluation [87.5] 数百のタスクで並列評価をオーケストレーションする,標準化された評価ハーネスを提供する。
モデル、足場、ベンチマークにまたがる3次元解析を行う。
私たちの分析では、ほとんどのランで精度を低下させる高い推論努力など、驚くべき洞察が示されています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:22:28 GMT)
The Illusion of Progress? A Critical Look at Test-Time Adaptation for Vision-Language Models [87.0] 視覚言語モデル(VLM)上でのTTA手法評価のための総合ベンチマークであるTTA-VLMを紹介する。
本ベンチマークでは,8つのエピソードなTTAメソッドと7つのオンラインTTAメソッドを,統一的かつ再現可能なフレームワーク内に実装し,広く使用されている15のデータセットで評価する。
1)既存のTTA手法は,従来の先駆的手法と比較して限られた利得が得られること,2)現在のTTA手法は訓練時の微調整手法との連携が不十分であること,3)モデルの信頼性を低下させるコストがしばしば発生すること,などが判明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:09:11 GMT)
MC#: Mixture Compressor for Mixture-of-Experts Large Models [86.6] Mixture-of-Experts (MoE)は、大きな言語モデル(LLM)と視覚言語モデル(VLM)をスパースアクティベーションによって拡張することで効果的にスケールする。
静的量子化と動的エキスパートプルーニングを組み合わせたフレームワークであるMC#(Mixture-Compressor-sharp)を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:12:46 GMT)
ODI-Bench: Can MLLMs Understand Immersive Omnidirectional Environments? [86.4] ODI-Benchは全方位画像理解に特化して設計された新しい総合的ベンチマークである。
プロプライエタリモデルやオープンソースモデルを含む20のMLLMをベンチマークする大規模な実験が実施されている。
さらに,全方位環境におけるMLLMの理解能力を大幅に向上させる訓練不要なOmni-CoTを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:51:47 GMT)
RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.8] ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:17:45 GMT)
A Survey on Agentic Multimodal Large Language Models [84.2] エージェントマルチモーダル大言語モデル(Agentic MLLMs)に関する総合的な調査を行う。
我々は,エージェントMLLMの新たなパラダイムを探求し,その概念的基盤を明確にし,従来のMLLMエージェントとの特徴を区別する。
コミュニティのためのこの分野の研究をさらに加速するため、エージェントMLLMを開発するためのオープンソースのトレーニングフレームワーク、トレーニングおよび評価データセットをコンパイルする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:07:01 GMT)
MaterialRefGS: Reflective Gaussian Splatting with Multi-view Consistent Material Inference [83.4] より物理的な環境モデルを用いた多視点一貫した物質推定がガウススプラッティングによる正確な反射の学習の鍵となることを示す。
本手法は照明と幾何学の両方を忠実に復元し,新しいビュー合成における最先端のレンダリング品質を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:29:20 GMT)
Holistic Evaluation of Multimodal LLMs on Spatial Intelligence [82.2] GPT-5は、これまでで最も強力なAIモデルと言われているが、空間知能タスクの幅広い範囲において、人間のパフォーマンスに欠けていた。
我々はまた、人間にとって直感的であるが、最も先進的なマルチモーダルモデルでさえも失敗する様々なシナリオの集合に対して質的な評価を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:08:38 GMT)
Information-Preserving Reformulation of Reasoning Traces for Antidistillation [81.0] 本稿では, 推理トレースの消毒対策に関する情報保存手法を提案する。
この修正を行うために、小さな補助モデルが訓練され、最小の計算オーバーヘッドが生じる。
実験では、一部が、異なるサイズとタイプを持つ学生モデルの蒸留を一貫して破壊することを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:42:11 GMT)
QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs [80.8] 大規模言語モデル(LLM)のための量子化強化学習フレームワークQeRLを提案する。
QeRLは、NVFP4量子化とローランド適応(LoRA)を組み合わせた問題に対処する。
実験によると、QeRLはロールアウトフェーズで1.5倍以上のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:55:09 GMT)
FlexAC: Towards Flexible Control of Associative Reasoning in Multimodal Large Language Models [80.6] マルチモーダルな大規模言語モデル(MLLM)は、忠実さと創造性の間に固有のトレードオフに直面します。
既存の方法には、この推論強度を調節する柔軟性がない。
本稿では,連想推論を柔軟に制御する機構を備えたMLLMを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:22:12 GMT)
Part II: ROLL Flash -- Accelerating RLVR and Agentic Training with Asynchrony [78.7] ROLL Flashは、ROLLを拡張し、非同期RLポストトレーニングをネイティブにサポートするシステムである。
ROLL Flashは同期RLポストトレーニングよりもリソース利用とスケーラビリティを著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:41:27 GMT)
Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models [78.4] ビデオ理解はコンピュータビジョンにおける最も困難なフロンティアである。
近年,映像理解タスクにおいて,映像多時間モデルが顕著に出現している。
Surveyは、ビデオ-LMM能力を向上するための統一的なフレームワークを研究者や実践者に提供することを目的としている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:09:06 GMT)
Are Large Reasoning Models Interruptible? [77.5] LRM(Large Reasoning Models)は複雑な推論において優れているが、伝統的に静的な「凍った世界」設定で評価されている。
静的な設定で高い精度を達成できる最先端のLEMでさえ、割り込みやコンテキストの変化に晒された場合、予測不能に失敗する可能性があることを示す。
我々の分析ではさらに、漏れの原因、パニック、自己疑念など、いくつかの新しい障害モードを明らかにしている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:35 GMT)
DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training [76.8] DiT360は、パノラマ画像生成のための視点とパノラマデータを用いたハイブリッドトレーニングを行う、DiTベースのフレームワークである。
提案手法は,11の定量的指標間で境界の整合性と画像の忠実度を向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:15 GMT)
TalkCuts: A Large-Scale Dataset for Multi-Shot Human Speech Video Generation [76.5] 本研究では,マルチショット音声ビデオ生成を支援する大規模データセットであるTalkCutsを提案する。
TalkCutsは、クローズアップ、ハーフボディ、フルボディビューを含む様々なカメラショットを備えた、500時間以上の高品質な人間の音声ビデオクリップを提供する。
このデータセットには、詳細なテキスト記述、2Dキーポイント、3D SMPL-Xモーションアノテーションが含まれ、10k以上のアイデンティティをカバーし、マルチモーダル学習と評価を可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:46:39 GMT)
QUITO-X: A New Perspective on Context Compression from the Information Bottleneck Theory [75.8] 問題をモデル化するために情報ボトルネック理論(IB)を導入する。
IBにおける相互情報に近似するクロスアテンションに基づく手法を提案する。
提案手法は,最先端技術と比較して25%の圧縮率向上を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:51:33 GMT)
Revela: Dense Retriever Learning via Language Modeling [75.2] Revelaは、言語モデリングによる自己教師型レトリバー学習のための統合トレーニングフレームワークである。
我々はRevelaをドメイン固有(CoIR)、推論集約(BRIGHT)、一般ドメインベンチマーク(BEIR)で評価する。
BEIRの教師なし SoTA を1000倍のトレーニングデータと10倍の計算量で実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:40:43 GMT)
When Agents Trade: Live Multi-Market Trading Benchmark for LLM Agents [74.6] Agent Market Arena (AMA)は、LLM(Large Language Model)ベースのトレーディングエージェントを評価するための、初めてのリアルタイムベンチマークである。
AMAは、検証済みのトレーディングデータ、専門家チェックされたニュース、および統一されたトレーディングフレームワーク内に多様なエージェントアーキテクチャを統合する。
GPT-4o、GPT-4.1、Claude-3.5-haiku、Claude-sonnet-4、Gemini-2.0-flashにまたがる薬剤を評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:54:09 GMT)
Improving AI Efficiency in Data Centres by Power Dynamic Response [74.1] 近年、人工知能(AI)の着実に成長が加速し、洗練されたモデルの開発が進められている。
AIの潜在能力を最大限に活用するためには、堅牢で信頼性の高い電力インフラの確保が不可欠だ。
しかし、AIデータセンターは電力に非常に飢えており、彼らの電力管理の問題が注目されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:08:21 GMT)
ParetoQ: Improving Scaling Laws in Extremely Low-bit LLM Quantization [73.6] 本稿では,1ビット,1.58ビット,2ビット,3ビット,4ビットの量子化設定に対して厳密な比較を行う統一フレームワークを提案する。
3次、2ビット、3ビット量子化は、サイズと精度のトレードオフにおいて同等のパフォーマンスを維持していることを示す。
ハードウェアの制約を考慮すると、2ビット量子化はメモリの削減とスピードアップに有望な可能性を秘めている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:42:17 GMT)
High-resolution Photo Enhancement in Real-time: A Laplacian Pyramid Network [73.2] 本稿では,LLF-LUT++と呼ばれるピラミッドネットワークについて紹介する。
具体的には,ダウンサンプリング画像のグローバル音節特性を活かした画像適応型3D LUTを利用する。
LLF-LUT++は、HDR+データセット上でPSNRが2.64dB改善されただけでなく、4K解像度の画像を1つのGPUでわずか13msで処理することで、さらに削減されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:52:32 GMT)
Enabling Doctor-Centric Medical AI with LLMs through Workflow-Aligned Tasks and Benchmarks [72.9] 大きな言語モデル(LLM)の台頭は、臨床ガイダンスを提供することで医療に変化をもたらしたが、患者への直接の展開は安全性のリスクをもたらす。
我々は,患者と直接対話するのではなく,経験豊富な医師と協力する臨床助手としてLLMを再配置することを提案する。
我々は、22の臨床的タスクと27の専門分野にわたる92,000のQ&Aインスタンスからなる大規模な中国の医療データセットであるDoctorFLANを構築した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:18:27 GMT)
CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images [69.9] 本稿では,コード駆動型Chain-of-ThoughtパラダイムであるCodePlot-CoTを提案する。
そこで我々はまず,視覚推論を用いた数学問題のための大規模バイリンガルデータセットとベンチマークであるMath-VRを構築した。
我々のモデルは,提案したコード駆動推論パラダイムの有効性を十分に検証し,ベースモデルよりも最大で21%向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:55 GMT)
Beyond 'Templates': Category-Agnostic Object Pose, Size, and Shape Estimation from a Single View [69.6] 物体の6Dポーズ、サイズ、形状を視覚入力から推定することは、コンピュータビジョンの基本的な問題である。
一つのRGB-D画像から6次元のポーズ,サイズ,密な形状を同時に予測する統合されたカテゴリ非依存フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:49:15 GMT)
Why Is Spatial Reasoning Hard for VLMs? An Attention Mechanism Perspective on Focus Areas [69.6] 機械的解釈可能性のレンズによる空間的推論の課題について検討する。
空間的推論の成功は、実際の物体の位置と注意を一致させるモデルの能力と強く相関している。
本研究の目的は,ADAPTVISを用いて,信頼性の高い地域への注意を喚起することである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:34:17 GMT)
From $f(x)$ and $g(x)$ to $f(g(x))$: LLMs Learn New Skills in RL by Composing Old Ones [68.7] LLMは、既存のスキルを組み込むことで、RL中に真に新しいスキルを身につけることができることを示す。
実験により、ソースタスクで得られた構成スキルが、異なるターゲットタスクに転送されることを示す。
この転送は、ターゲットに対する構成的なトレーニングなしでも行われ、ターゲットの原子スキルに関する事前の知識のみを必要とする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:03:40 GMT)
People use fast, flat goal-directed simulation to reason about novel problems [68.6] 私たちは、人々が初めてゲームをする方法に体系的かつ適応的に合理的であることを示します。
直感型ゲーマー」と呼ばれる計算認知モデルを用いて,これらの能力を説明する。
私たちの研究は、人々が新しい問題に遭遇するとき、どのように素早く評価し、行動し、提案するかに関する新しい洞察を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:12:08 GMT)
LongLive: Real-time Interactive Long Video Generation [68.5] LongLiveはリアルタイムおよびインタラクティブなロングビデオ生成のためのフレームレベルの自動回帰フレームワークである。
LongLiveは1つのNVIDIA H100上で20.7 FPSを持続し、短いビデオと長いビデオの両方でVBenchで強力なパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:41:26 GMT)
Neon: Negative Extrapolation From Self-Training Improves Image Generation [67.7] 我々は,自己学習からの劣化を,自己改善のための強力な信号に変える新しい学習方法Neonを紹介する。
Neonは、新しい実際のデータを必要としない単純なポストホックマージを通じて、驚くほど簡単に実装でき、1kの合成サンプルで効果的に動作し、通常1%未満のトレーニング計算を使用する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:13:35 GMT)
Self-ensemble: Mitigating Confidence Mis-calibration for Large Language Models [67.6] 大規模言語モデルでは,複数問合せ質問に対する信頼度歪みが問題となる。
この問題を解決するために自己組織化を提案する。
3つのLLMおよびデータセットの実験結果から,自己アンサンブルが信頼歪問題に包括的に対処できることが示されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:06:12 GMT)
OmniBal: Towards Fast Instruction-Tuning for Vision-Language Models via Omniverse Computation Balance [67.4] 視覚言語命令チューニングモデルにおける大規模3D並列トレーニングは、異なるデバイス間で不均衡な計算負荷をもたらす。
我々は、データ、モデル、メモリの観点から計算負荷を再均衡させ、デバイス間でよりバランスのとれた計算を実現する。
提案手法の有効性と一般化性は,様々なモデルやデータセットにまたがってさらに検証される。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:44:44 GMT)
PhysHSI: Towards a Real-World Generalizable and Natural Humanoid-Scene Interaction System [67.3] PhysHSIはシミュレーショントレーニングパイプラインと現実世界のデプロイメントシステムで構成される。
シミュレーションでは,自然のヒューマノイドとシーンの相互作用データを模倣するために,逆運動に基づくポリシー学習を採用する。
実世界の展開には、LiDARとカメラ入力を組み合わせた粗粒度オブジェクトローカライズモジュールを導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:11:37 GMT)
Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model? [66.6] RLVR(Reinforcement Learning with Verifiable Rewards)は近年,大規模言語モデル(LLM)の推論性能の向上に成功している。
本研究はRLVRの現状を批判的に考察する。
現在のトレーニング設定では、根本的な新しい推論パターンが生まれていないことが分かりました。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:37:46 GMT)
Towards Real-Time Fake News Detection under Evidence Scarcity [66.6] 本稿では,リアルタイムフェイクニュース検出のための新しいフレームワークである評価アウェア・セレクション・オブ・エキスパートズ(EASE)を提案する。
EASEは、利用可能な証拠の十分性を評価した意思決定プロセスに適合する。
本稿では,新興ニュースのモデル一般化を限られた証拠で評価するための新しいベンチマークであるRealTimeNews-25を紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:11:46 GMT)
What Layers When: Learning to Skip Compute in LLMs with Residual Gates [66.2] GateSkipは、デコーダのみのLMにおけるトークンワイド層スキップを可能にする残差ストリームゲーティング機構である。
各Attention/MLPブランチは、残ストリームに再入力する前に、ブランチの出力を凝縮するシグモイドリニアゲートを備えている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:31:50 GMT)
InternSVG: Towards Unified SVG Tasks with Multimodal Large Language Models [65.5] 統合データベンチマークモデルスイートであるInternSVGファミリを提示する。
SAgogeはSVGタスクのための最大かつ最も包括的なマルチモーダルデータセットである。
本稿では,SVG 固有の特殊トークンを用いた SVG 理解,編集,生成のための統合型 MLLM である InternSVG を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:38:04 GMT)
Evaluating Language Models' Evaluations of Games [65.5] 我々は,AIシステムのゲーム評価を評価する新しいパラダイムを提唱する。
私たちは100ドル以上の新しいボードゲームと450以上の人間の判断の大規模なデータセットを活用しています。
本結果から,推論モデルは,非推論言語モデルよりもゲーム評価において,一般に人々と一致していることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:45:37 GMT)
EmoDebt: Bayesian-Optimized Emotional Intelligence for Strategic Agent-to-Agent Debt Recovery [65.3] 大規模言語モデル(LLM)エージェントは、負債収集のような感情に敏感なドメインの悪用に対して脆弱である。
EmoDebtは、ネゴシエーションにおける感情を表現するモデルの能力を、シーケンシャルな意思決定問題として再設計する感情インテリジェンスエンジンである。
提案したベンチマーク実験により,EmoDebtは戦略的堅牢性を実現し,非適応的,感情に依存しないベースラインを著しく上回った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:14:24 GMT)
ExpVid: A Benchmark for Experiment Video Understanding & Reasoning [65.2] 科学実験ビデオ上でMLLMを体系的に評価する最初のベンチマークであるExpVidを紹介する。
ExpVid 上で 19 個のMLLM を評価し, 粗粒度認識に優れる一方で, 詳細さの曖昧化, 時間経過による状態変化の追跡, 実験手順と科学的成果のリンクに苦慮していることがわかった。
この結果から,特に高次推論において,プロプライエタリモデルとオープンソースモデルとの顕著なパフォーマンスギャップが明らかとなった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:45:28 GMT)
Scenario-Wise Rec: A Multi-Scenario Recommendation Benchmark [65.1] 6つの公開データセットと12のベンチマークモデルと、トレーニングと評価パイプラインで構成されるベンチマークである textbfScenario-Wise Rec を紹介します。
このベンチマークは、研究者に先行研究から貴重な洞察を提供することを目的としており、新しいモデルの開発を可能にしている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:40:46 GMT)
Deep Research Brings Deeper Harm [64.7] LLM(Large Language Models)上に構築されたDeep Research (DR)エージェントは、複雑な多段階の研究を行うことができる。
これは特に、バイオセキュリティのような高度な知識集約ドメインにおいて関係している。
エージェントの計画に悪意あるサブゴールを注入するプランインジェクション(Plan Injection)と、有害なクエリを学術研究の質問として再編成するIntent Hijack(Intent Hijack)という2つの新しいジェイルブレイク戦略を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:05:00 GMT)
Unifying Deductive and Abductive Reasoning in Knowledge Graphs with Masked Diffusion Model [64.3] 帰納的推論と帰納的推論は知識グラフを解析するための重要なパラダイムである。
DARKと呼ばれる知識グラフにおける帰納的・帰納的推論のための統一的なフレームワークを提案する。
DARKは, 帰納的推論タスクと帰納的推論タスクの両方において, 最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:34:57 GMT)
Contrastive Representation Regularization for Vision-Language-Action Models [64.1] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルの表現正規化であるロボット状態認識コントラスト損失(RS-CL)を紹介する。
特に、RS-CLは、状態間の相対的な距離をソフト・インスペクションとして使用することにより、ロボットの受容状態とより密に表現する。
実験の結果,RS-CLは最先端VLAモデルの操作性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:50:27 GMT)
Specialization after Generalization: Towards Understanding Test-Time Training in Foundation Models [64.0] 最近の研究は、テストタイムトレーニング(TTT)として知られる特定のタスクに対して、テストタイムでモデルをトレーニングし続けるというアイデアを探求している。
本稿では,TTTがグローバルトレーニングよりもはるかに小さな分布内テスト誤差を達成できるモデルを提案する。
我々は、ImageNet上でスパースオートエンコーダをトレーニングすることで、モデルの主要な仮定を実証的に検証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:29:09 GMT)
TabVLA: Targeted Backdoor Attacks on Vision-Language-Action Models [63.5] バックドア付きVLAエージェントは、プレインジェクトされたバックドアによって隠蔽的にトリガーされ、敵のアクションを実行することができる。
我々は,VLAモデルに対するターゲットバックドア攻撃について検討し,ブラックボックスファインチューニングによる攻撃を可能にする新しいフレームワークであるTabVLAを紹介した。
我々の研究は、バックドア操作をターゲットにしたVLAモデルの脆弱性を強調し、より高度な防御の必要性を強調します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:45:48 GMT)
Test-Time Alignment for Large Language Models via Textual Model Predictive Control [63.5] Textual Model Predictive Control (TMPC) は、推論時に大規模言語モデルを調整するために適応された新しい予測計画フレームワークである。
TMPCは、談話レベル翻訳、長文応答生成、プログラム合成の3つの異なるセグメンテーション特性を持つタスクで評価される。
その結果、TMPCはパフォーマンスを継続的に改善し、一般性を強調している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:51:05 GMT)
Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.5] 本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。
提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。
我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:46:32 GMT)
ParaCook: On Time-Efficient Planning for Multi-Agent Systems [62.5] 大規模言語モデル(LLM)は、長期の現実世界のタスクを計画するための強力な推論能力を示す。
時間効率の協調計画のためのベンチマークであるParaCookを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:47:07 GMT)
Bag of Tricks for Subverting Reasoning-based Safety Guardrails [62.1] 推論に基づくガードレールを覆い隠すジェイルブレイク手法の袋を提示する。
攻撃対象は白、グレー、ブラックボックスの設定で、無駄なテンプレート操作から完全に自動化された最適化までさまざまです。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:16:44 GMT)
From <Answer> to <Think>: Multidimensional Supervision of Reasoning Process for LLM Optimization [62.1] DRM(Dimension-level Reward Model)は、大規模言語モデルのための新しい監視フレームワークである。
DRMは3つの基本的、相補的、解釈可能な次元に沿って推論プロセスの品質を評価する。
実験の結果、DRMは効果的な監視信号を提供し、LCMの最適化を誘導し、推論能力を向上することが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:29:15 GMT)
Connecting Giants: Synergistic Knowledge Transfer of Large Multimodal Models for Few-Shot Learning [61.7] 少数ショット学習は、限られたトレーニングサンプルで新しいクラスを分類するという課題に対処する。
本稿では,大規模マルチモーダルモデルから多様かつ相補的な知識を効果的に伝達する新しいフレームワーク,Synergistic Knowledge Transferを提案する。
単純な数ショットのビジョンエンコーダと組み合わせても、SynTransは現在の最先端手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:06:23 GMT)
EvoEmo: Towards Evolved Emotional Policies for Adversarial LLM Agents in Multi-Turn Price Negotiation [61.6] 既存のLarge Language Models (LLM)エージェントは、そのような交渉における感情の機能的役割をほとんど見落としている。
本稿では,交渉における動的感情表現を最適化する進化的強化学習フレームワークであるEvoEmoを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:04:56 GMT)
Making Mathematical Reasoning Adaptive [61.5] 大規模言語モデル(LLM)における適応推論を実現するためのAdaRフレームワークを提案する。
AdaRは可変値によって論理的に等価なクエリを合成し、これらのデータに基づいてRLVRでモデルを訓練し、スプリアス論理をペナルライズする。
実験により, AdaRはロバスト性や一般化を向上し, 数学的推論の大幅な改善を実現していることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:08:12 GMT)
Where on Earth? A Vision-Language Benchmark for Probing Model Geolocation Skills Across Scales [61.0] 視覚言語モデル (VLM) は急速に進歩しているが, オープンワールド環境における画像位置決め能力は, 網羅的に評価されていない。
我々は、視覚認識、ステップバイステップ推論、エビデンス利用を評価するVLM画像位置情報の総合ベンチマークであるEarthWhereを提示する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:12:21 GMT)
Scale-Invariant Regret Matching and Online Learning with Optimal Convergence: Bridging Theory and Practice in Zero-Sum Games [60.9] ゼロサムゲームにおける理論と実践の間、何十年にもわたってかなりのシャズムが一階法によって浸食されてきた。
我々は、IREG-PRM$+$と呼ぶPRM$+$の新しいスケール不変かつパラメータフリーな変種を提案する。
ベンチマークゲームでは, PRM$+$と同等でありながら, 最適収束保証を$T-1/2$, $T-1$とする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:08:52 GMT)
DAWP: A framework for global observation forecasting via Data Assimilation and Weather Prediction in satellite observation space [60.7] 完全な観測空間でAIWPを動作させるためのDAWPフレームワークを提案する。
AIDAモジュールは、不規則な衛星観測トークンを同化するためにマスク多モードオートエンコーダを適用している。
我々はAIDAがAIWPのロールアウトと効率を大幅に改善し、地球規模の降水分解予測に適用できる有望な可能性を秘めていることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:13:35 GMT)
LLMs4All: A Systematic Review of Large Language Models Across Academic Disciplines [60.6] ChatGPTのようなLLM(Large Language Models)ベースのアプリケーションは、人間のような会話を生成する能力を示している。
本稿では,最先端のLDMの概要と,幅広い学術分野への統合について述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:19:49 GMT)
Source-Free Object Detection with Detection Transformer [59.3] Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:35:04 GMT)
One More Glance with Sharp Eyes: Rethinking Lightweight Captioning as a Practical Visual Specialist [58.9] 125M-パラメータ言語モデルを用いて,軽量キャプションモデルを構築した。
単文で評価するが、詳細なキャプションタスクで評価する。
シャープ・イード・リファインメント (Sharp-Eyed Refinement) という新しいキャプション・フレームワークを開発し, 粗い記述をより正確なキャプションに書き換えることでキャプションの質を高める。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:25:01 GMT)
Learning to Make MISTAKEs: Modeling Incorrect Student Thinking And Key Errors [58.7] 本稿では,推論誤りの高品質な合成例を構成する新しい手法であるMISTAKEを提案する。
3つの教育課題において,MISTAKEを評価した結果,(1)誤答のシミュレーションにおいて高い精度が得られた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:10:38 GMT)
SMC++: Masked Learning of Unsupervised Video Semantic Compression [58.3] ビデオセマンティクスを特に保持するMasked Video Modeling (MVM) を利用した圧縮フレームワークを提案する。
MVMは、マスクされたパッチ予測タスクを通じて一般化可能なセマンティクスを学ぶのに熟練している。
また、簡単なテクスチャの詳細やビットコストの浪費、セマンティックノイズなど、意味のない情報をエンコードすることもできる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:12:10 GMT)
Domain-Specific Data Generation Framework for RAG Adaptation [58.2] Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:59:49 GMT)
MRFD: Multi-Region Fusion Decoding with Self-Consistency for Mitigating Hallucinations in LVLMs [57.9] MRFD (Multi-Region Fusion Decoding) は、領域間の一貫性をモデル化することにより、現実のグラウンド化を改善する訓練自由復号法である。
MRFDは、クロスアテンションを用いて正常な領域を特定し、それぞれの初期応答を生成し、Jensen-Shannon Divergenceに基づいて信頼性ウェイトを算出する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:52:34 GMT)
Breaking the Compression Ceiling: Data-Free Pipeline for Ultra-Efficient Delta Compression [57.7] UltraDeltaはデータフリーのデルタ圧縮パイプラインで、超高圧縮と強力なパフォーマンスを実現する。
UltraDeltaは、冗長性を最小化し、情報を最大化し、層間、層内、大域的な寸法で性能を安定させるように設計されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:33:00 GMT)
COMAL: A Convergent Meta-Algorithm for Aligning LLMs with General Preferences [57.7] 本稿では,言語モデルアライメントのためのメタアルゴリズムである Convergent Meta Alignment Algorithm (COMAL) を提案する。
我々は, メタアルゴリズムが最終回において正確なナッシュポリシーに収束する理論解析を行い, 一連の合成および選好最適化データセット上での有効性を実証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:34:15 GMT)
Aligning Perception, Reasoning, Modeling and Interaction: A Survey on Physical AI [57.4] 我々は、物理的原則と具体的推論プロセスの両方において、学習の基礎となるインテリジェントなシステムを提唱する。
我々は、物理現象を説明でき、将来の状態を予測できる次世代の世界モデルを構想する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:00:01 GMT)
LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Models via Likelihood Preference [57.1] ビデオ拡散モデルにおける直感的な物理を評価するトレーニング不要な方法であるLikePhysを紹介した。
現在のビデオ拡散モデルにおける直観的物理理解のベンチマークを行う。
経験的結果は、現在のモデルが複雑でカオス的な力学に苦しむにもかかわらず、モデルキャパシティと推論設定スケールとしての物理理解の改善傾向が明らかであることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:19:07 GMT)
Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments [56.8] MicroG-4Mは微小重力下での人間の活動のセマンティック理解のための最初のベンチマークである。
データセットには、50のアクションを含む4,759のクリップ、1,238のコンテキスト豊富なキャプション、そして7000以上の質問対の宇宙飛行士の活動とシーン理解が含まれている。
MicroG-4Mは、細粒度多ラベルアクション認識、時間的ビデオキャプション、視覚的質問応答の3つのコアタスクをサポートする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:22:34 GMT)
The Hidden Link Between RLHF and Contrastive Learning [56.5] RLHF(Reinforcement Learning from Human Feedback)とDPO(Simple Direct Preference Optimization)は相互情報(MI)の観点から解釈可能であることを示す。
このフレームワーク内では、RLHFとDPOの両方を、ベースモデルから派生した正と負のサンプルに基づいて対照的な学習を行う方法として解釈することができる。
そこで本稿では,DPO で観測される選択的傾向の後期的低下を軽減するための相互情報最適化 (MIO) を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:12:00 GMT)
Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data [56.4] RefAlignは、報酬モデルや参照モデルに依存しない汎用的なREINFORCEスタイルのアライメントアルゴリズムである。
報酬モデルや参照モデルに依存しない汎用REINFORCEスタイルアライメントアルゴリズムである textitRefAlign を導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:00:17 GMT)
Editable-DeepSC: Reliable Cross-Modal Semantic Communications for Facial Editing [56.1] 顔編集のための新しい意味コミュニケーション手法であるEditable-DeepSCを提案する。
実験により、Editable-DeepSCは、伝送帯域を大幅に節約しつつ、優れた編集を実現できることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:17:15 GMT)
J-ORA: A Framework and Multimodal Dataset for Japanese Object Identification, Reference, Action Prediction in Robot Perception [55.8] J-ORAは、詳細なオブジェクト属性アノテーションを提供することで、ロボット知覚のギャップを埋める新しいデータセットである。
3つの重要な認識タスク、オブジェクト識別、参照解決、および次のアクション予測をサポートする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:53:46 GMT)
Catch Your Breath: Adaptive Computation for Self-Paced Sequence Production [55.8] 我々は,言語モデルが入力トークン毎に使用する計算ステップの数を動的かつ自律的に拡張できるような,教師付きトレーニング目標のクラスを探索する。
任意のトークンに対して、モデルは don't know> 出力を出力することで、追加の計算ステップを要求できる。
CYBモデルでは精度が向上し,トークンレベルの複雑性とコンテキストに処理時間を適用することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:07:05 GMT)
Rediscovering Entropy Regularization: Adaptive Coefficient Unlocks Its Potential for LLM Reinforcement Learning [55.6] 本稿では,3つのコンポーネントによる探索と利用のバランスをとるフレームワークを提案する。
複数の数学的推論ベンチマークの実験は、AERが一貫してベースラインを上回り、推論精度と探索能力の両方を改善していることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:10:26 GMT)
OneRec-Think: In-Text Reasoning for Generative Recommendation [55.5] OneRec-Thinkは、対話、推論、パーソナライズされたレコメンデーションをシームレスに統合する統合フレームワークである。
提案した"Think-Ahead"アーキテクチャは,クアイショーの産業展開を効果的に実現し,app Stay Timeの0.159%のアップを実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:20:13 GMT)
LLM$\times$MapReduce-V3: Enabling Interactive In-Depth Survey Generation through a MCP-Driven Hierarchically Modular Agent System [55.3] LLM x MapReduce-V3 は、長期サーベイ生成のための階層的モジュラーエージェントシステムである。
システムは研究の視点を捉えて包括的な骨格を生成し、それを詳細な調査へと発展させる。
人間の評価から,本システムはコンテンツ深度と長さの両方において,代表的ベースラインを超越していることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:38:37 GMT)
DeepResearchGuard: Deep Research with Open-Domain Evaluation and Multi-Stage Guardrails for Safety [55.3] ディープリサーチフレームワークは一般的に、信頼性、一貫性、幅、深さ、安全性などのレポート品質の重要な側面を見落としている。
DeEPRESEARCHGUARDは、4段階の安全ガードと参照とレポートのオープンドメイン評価を備えた総合的なフレームワークである。
我々は,GPT-4o,Gemini-2.5-flash,DeepSeek-v3,o4-miniなど,最先端のLLMのさまざまな評価を行った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:11:21 GMT)
J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning [54.9] 意思決定前にLLM審査員に思考を教えるための強化学習フレームワークであるJ1を紹介する。
私たちのコアコントリビューションは、検証不可能で検証可能なプロンプトのすべての判断タスクを、検証可能な報酬を持った統一フォーマットに変換することです。
次に、RLを用いて8B、32B、70Bのスケールで思考判断を訓練し、彼らが最先端のパフォーマンスを得ることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:06:51 GMT)
dInfer: An Efficient Inference Framework for Diffusion Language Models [54.8] 拡散に基づく大規模言語モデル (dLLM) は自己回帰(AR) LLM に代わる有望な代替品として登場した。
本稿では、dLLM推論のための効率的かつ効率的なフレームワークであるdInferについて述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:39:59 GMT)
Generative AI for Biosciences: Emerging Threats and Roadmap to Biosecurity [54.7] 生物科学における生成人工知能(GenAI)は、バイオテクノロジー、医学、合成生物学を変革している。
この概要は、バイオサイエンスにおけるGenAIの現状と、脱獄攻撃やプライバシーリスクから、自律的なAIエージェントによって引き起こされるデュアルユースな課題まで、出現する脅威ベクターの概要を概説する。
我々は、厳格なデータフィルタリング、開発中の倫理原則との整合性、有害な要求をブロックするためのリアルタイム監視など、GenAIの安全性に対する多層的なアプローチを提唱する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:24:41 GMT)
Do LLMs "Feel"? Emotion Circuits Discovery and Control [54.6] 本研究では、感情表現を引き起こす内部メカニズムと、生成したテキストにおける感情の制御について検討する。
これは、大きな言語モデルで感情回路を発見し、検証する最初の体系的な研究である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:24:24 GMT)
GeoVLMath: Enhancing Geometry Reasoning in Vision-Language Models via Cross-Modal Reward for Auxiliary Line Creation [54.5] ソリッド幾何学における補助線形推論に適したオープンソースのLVLMであるGeoVLMathを提案する。
我々は,LVLMの表現強度に整合性を持たせるために,補助線構成のテキスト記述を生成する。
この報酬に基づいて構築されたGeoVLMathは、固体幾何学における補助線形推論に適したオープンソースのLVLMである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:33:51 GMT)
XQuant: Achieving Ultra-Low Bit KV Cache Quantization with Cross-Layer Compression [54.3] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる顕著な機能を示している。
量子化は、歴史的情報を保持しながらメモリ消費を減らすための有望な解決策として現れてきた。
超低等価ビット幅KVキャッシュ量子化を実現するトレーニングフリーでプラグアンドプレイのフレームワークであるXQuantを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:17:21 GMT)
BLEnD-Vis: Benchmarking Multimodal Cultural Understanding in Vision Language Models [54.2] 視覚言語モデル(VLM)における日常的文化的知識の堅牢性を評価するためのベンチマークであるBLEnD-Visを紹介する。
BLEnD-Visは16の領域にまたがる文化的根拠を持つ313の質問テンプレートを構築し、3つの整列した複数選択形式を生成する。
その結果得られたベンチマークは、4,916の画像と、人間のアノテーションで検証された21,000以上のMultiple-choice Question (MCQ)インスタンスで構成されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:10:05 GMT)
Beyond Survival: Evaluating LLMs in Social Deduction Games with Human-Aligned Strategies [54.1] Werewolfのようなソーシャル推論ゲームは、言語、推論、戦略を組み合わせている。
我々は,100時間以上のビデオ,32.4M発声トークン,15の規則変種を含む高品質で人間認証されたWerewolfデータセットをキュレートした。
本稿では,勝利派戦略を2段階の真理として活用する新たな戦略調整評価法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:33:30 GMT)
Evaluating Retrieval-Augmented Generation Systems on Unanswerable, Uncheatable, Realistic, Multi-hop Queries [54.0] 実世界のユースケースでは、複雑なクエリを持つRAGシステムが存在し、関連する情報がコーパスから欠落したり、不完全であったりすることが多い。
既存のRAGベンチマークは、マルチホップやスコープ外の質問に対して、現実的なタスクの複雑さを反映することはめったにない。
un$underlinec$heatable, $underliner$ealistic, $underlineu$nanswerable, $underlinem$ulti-hopの自動生成のための最初のパイプラインを提示する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:38:04 GMT)
Evolving LLMs' Self-Refinement Capability via Synergistic Training-Inference Optimization [53.9] 自己精製(Self-Refinement)とは、モデルが自身のレスポンスを改訂し、改善された出力を生成する能力を指す。
EVOLVEは、反復的なトレーニングを通じて自己精製の進化を導き、追跡するためのフレームワークである。
固有モデル能力のより広範な自己改善を実現するために自己改善を活用する可能性を実証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:24:10 GMT)
LiDAR-GS:Real-time LiDAR Re-Simulation using Gaussian Splatting [53.6] 都市景観におけるLiDARスキャンをリアルタイムかつ高忠実に再現するLiDAR-GSを提案する。
この手法は,公開可能な大規模シーンデータセットのレンダリングフレームレートと品質の両面において,最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:28:29 GMT)
Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language Models [53.3] 大きな言語モデル(dLLM)に強化学習を適用する上で重要な課題は、その可能性関数の抽出性である。
本稿では,ELBOに基づく目的の特別に構築された下界を最大化するメモリ効率のRLアルゴリズムを提案する。
実験によると、BGPOは数学の問題解決、コード生成、計画タスクにおいて、dLLMの以前のRLアルゴリズムよりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:47:50 GMT)
VCB Bench: An Evaluation Benchmark for Audio-Grounded Large Language Model Conversational Agents [53.3] 大規模音声言語モデル (LALM) は多モード対話システムを大幅に強化した。
既存のベンチマークは主に英語中心であり、合成音声に依存しており、包括的で差別的な評価を欠いている。
我々はVoice Chat Bot Bench(VCB Bench)を紹介します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:45:52 GMT)
Qiboml: towards the orchestration of quantum-classical machine learning [53.3] 本稿では,量子および古典的機械学習をオーケストレーションするオープンソースソフトウェアライブラリであるQibomlを紹介する。
多様なシミュレーションオプション、ノイズ認識シミュレーション、リアルタイムエラー軽減とキャリブレーションなどの機能を紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:00:00 GMT)
Analyzing and Internalizing Complex Policy Documents for LLM Agents [53.1] 大規模言語モデル(LLM)ベースのエージェントシステムは、多様なビジネスルールをコードするコンテキスト内ポリシー文書に依存している。
これは、パフォーマンスを保ちながら、ポリシー文書をモデルプリエントに組み込む内部化手法の開発を動機付けます。
CC-Genは4つのレベルにまたがる制御可能な複雑度を持つエージェントベンチマークジェネレータである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:30:07 GMT)
ARM: Adaptive Reasoning Model [53.0] 本稿では,そのタスクに基づいて適切なフォーマットを適応的に選択できる推論モデルであるAdaptive Reasoning Model (ARM)を提案する。
Ada-GRPOはARMが高いトークン効率を実現し、Long CoTのみに依存するモデルに匹敵するパフォーマンスを維持しながら、トークンを平均30%、最大70%削減する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:13:52 GMT)
STAR: A Benchmark for Astronomical Star Fields Super-Resolution [52.9] 54,738個のフラックス一貫性の星体画像対を含む大規模SRデータセットSTARを提案する。
本稿では,Flux-Invariant Super Resolution (FISR)モデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:45:48 GMT)
Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models [52.7] EqMは、平衡力学の観点から構築された生成モデリングフレームワークである。
時間条件の速度を統一された平衡景観に置き換えることで、EqMは流れとエネルギーベースのモデルの間により緊密な橋渡しを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:39:31 GMT)
StreamAgent: Towards Anticipatory Agents for Streaming Video Understanding [52.6] 本稿では,今後のタスク関連情報を含むと思われる時間間隔と空間領域を予測できるStreamAgentを提案する。
我々は,重要な出来事の時間的進行を予測するために,予測エージェントに期待を促すことによって,質問の意味論と歴史的観察を統合する。
提案手法は,応答精度とリアルタイム効率において既存の手法よりも優れており,実世界のストリーミングシナリオの実用的価値を強調している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:15:14 GMT)
Open Vocabulary Multi-Label Video Classification [52.4] この問題をオープン語彙多ラベルビデオ分類として定式化し、CLIPなどの事前学習VLMを適用してこの問題を解決する方法を提案する。
本稿では,LLMにCLIPテキストエンコーダのソフト属性を生成して,新しいクラスを認識できるようにする,エンドツーエンドのトレーニング可能なアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:00:16 GMT)
Attributing Response to Context: A Jensen-Shannon Divergence Driven Mechanistic Study of Context Attribution in Retrieval-Augmented Generation [52.4] 我々は、コンテキストに対する属性応答(ARC-JSD)のための新しいJensen-Shannon Divergence駆動方式を提案する。
ARC-JSDは、追加の微調整、勾配計算、サロゲートモデリングなしで、重要な文脈文の効率的かつ正確な識別を可能にする。
TyDi QA, Hotpot QA, Musique など,様々なスケールの命令調整 LLM を用いたRAG ベンチマークの評価により,精度が向上し,計算効率が向上した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:40:21 GMT)
FFT-Accelerated Auxiliary Variable MCMC for Fermionic Lattice Models: A Determinant-Free Approach with $O(N\log N)$ Complexity [52.3] 量子多体系のシミュレーションを劇的に高速化するマルコフ連鎖モンテカルロ(MCMC)アルゴリズムを導入する。
我々は,量子物理学のベンチマーク問題に対するアルゴリズムの有効性を検証し,既知の理論結果を正確に再現する。
我々の研究は、大規模確率的推論のための強力なツールを提供し、物理学に着想を得た生成モデルのための道を開く。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:57:21 GMT)
PhoniTale: Phonologically Grounded Mnemonic Generation for Typologically Distant Language Pairs [51.7] 大規模言語モデル (LLM) は、学習者の第一言語 (L1) から類似したキーワードを活用して、L2語彙の獲得を支援することで、キーワード・メニーモニックを生成するために使われている。
本稿では,IPAに基づく音韻的適応と音節認識アライメントを実行し,L1キーワードシーケンスを検索する新しい言語間メタモニック生成システムであるPhoniTaleを提案する。
以上の結果から,PhoniTaleは従来の自動手法を一貫して上回り,人手によるメニーモニックに匹敵する品質を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:35:48 GMT)
In-Context Learning Is Provably Bayesian Inference: A Generalization Theory for Meta-Learning [51.6] 本稿では,ICLリスクをベイズギャップとポストリアバリアンスの2つのコンポーネントに分割する基本的リスク分解を導入する。
一様アテンション変換器の場合、このギャップの非漸近上界を導出し、事前学習プロンプトの数への依存を明確にする。
後方変動は本質的なタスクの不確実性を表すモデルに依存しないリスクである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:42:31 GMT)
SCOOP'D: Learning Mixed-Liquid-Solid Scooping via Sim2Real Generative Policy [51.5] 我々は,OmniGibson(NVIDIA Omniverseをベースとした)のシミュレーションを用いて,スクーピングデモの収集を行うSCOOP'Dを提案する。
学習したポリシーを現実世界のさまざまなシナリオに適用し、さまざまなアイテム量、アイテム特性、コンテナタイプでそのパフォーマンスをテストする。
SCOOP'Dはすべてのベースラインとアブリケーションを上回り、これはロボットスクーピングスキルを取得するための有望なアプローチであることを示唆している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:11:34 GMT)
Multiview Manifold Evidential Fusion for PolSAR Image Classification [51.4] 我々は,PolSAR多様体学習とエビデンス融合を統合アーキテクチャに統合する新しいフレームワークを提案する。
実世界の3つのPolSARデータセットの実験により、提案手法は、精度、堅牢性、解釈可能性において、既存のアプローチよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:05:51 GMT)
MEET-Sepsis: Multi-Endogenous-View Enhanced Time-Series Representation Learning for Early Sepsis Prediction Representation Learning for Early Sepsis Prediction [50.7] セプシス(Sepsis)は、集中治療室(ICUs)の高死亡にともなう致命的な感染症である。
早期かつ正確な敗血症予測(SP)は、時間的介入には重要であるが、微妙な早期症状と急激な死亡率の増大により、依然として困難である。
本稿では,拡張された特徴ビューを構築するための多言語ビュー表現強化(MERE)機構と,時間的表現学習のためのCDTAモジュールを提案する。
提案したMEET-Sepsis フレームワークは,SOTA 法で要求される ICU モニタリング時間の 20% のみを用いて,競合予測の精度を実現し,大幅に向上した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:38:29 GMT)
Human Uncertainty-Aware Data Selection and Automatic Labeling in Visual Question Answering [50.6] HaDolaは4つの段階(識別、自己アノテーション、エラートリガー、トレーニング)で動作し、有害なサンプルを反復的に識別し、情報的なものを優先順位付けし、小さなシードセットからブートストラップする。
提案手法は,高コストなHUアノテーションへの依存を大幅に低減し,VLMの精度と校正性を向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:35:30 GMT)
Data or Language Supervision: What Makes CLIP Better than DINO? [50.6] CLIPは高レベルのセマンティクスをキャプチャしますが、DINOは色やスタイルといった低レベルの機能に対してより応答性があります。
ビジョン言語モデルに統合されると、CLIPはテキスト集約的なタスクで優れ、DINOはビジョン中心のタスクで若干優れています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:34:58 GMT)
Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm [50.5] 本稿では,新しい選択型サンプル選択フレームワークを提案する。
個々のサンプル品質の評価から、異なるサンプルのコントリビューション値の比較へと焦点をシフトする。
われわれのアプローチをより大きな医療データセットで検証し、現実の応用における実用性を強調した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:37:25 GMT)
Protein as a Second Language for LLMs [50.3] 『Protein-as-Second-Language』の枠組みは、新しいシンボリック言語における文としてアミノ酸配列を再構成する。
属性予測,記述的理解,拡張推論にまたがる79,926個のタンパク質-QAインスタンスのバイリンガルコーパスをキュレートする。
提案手法は,オープンソース LLM と GPT-4 間で一貫した利得を提供し,最大 17.2% のROUGE-L 改善を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:21:45 GMT)
Representation-Based Exploration for Language Models: From Test-Time to Post-Training [50.1] 強化学習(RL)は、言語モデルの能力を拡張することを約束する。
現在のRL技術が新しい行動の発見を促進するのか、あるいは単にベースモデルにすでに存在するものを研ぎ澄ましているのかは不明だ。
我々は、意図的な探索の価値を調査し、新しい多様な行動を発見するためのモデルを明確にインセンティブ付けする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:49:05 GMT)
Reinforced sequential Monte Carlo for amortised sampling [49.9] 我々は、最大エントロピー強化学習(MaxEnt RL)により訓練されたシーケンシャルモンテカルロ(SMC)とニューラルシーケンシャルサンプリングとの接続を述べる。
本稿では,提案関数とツイスト関数の安定な連成訓練手法と,トレーニング信号のばらつきを低減するための適応重み付け方式について述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:11 GMT)
HAMUR: Hyper Adapter for Multi-Domain Recommendation [49.9] マルチドメインレコメンデーション(HAMUR)のための新しいモデルHyper Adapterを提案する。
HamURは2つのコンポーネントから構成される。
HamURは暗黙的にドメイン間の共有情報をキャプチャし、アダプタのパラメータを動的に生成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:32:10 GMT)
ROFI: A Deep Learning-Based Ophthalmic Sign-Preserving and Reversible Patient Face Anonymizer [49.9] 本稿では,眼科の深層学習に基づくプライバシー保護フレームワークROFIを紹介する。
弱い教師付き学習と神経同一性翻訳を用いて、ROFIは疾患の特徴を保持しながら顔の特徴を匿名化する。
診断感度は100%で、コホートが3つある11の眼疾患に対して高い合意(Kappa > 0.90$)を達成している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:12:23 GMT)
Emergent Misalignment via In-Context Learning: Narrow in-context examples can produce broadly misaligned LLMs [49.6] In-context Learning(ICL)において、創発的不整合(EM)が出現することを発見した。
3つのデータセットにまたがって、3つのフロンティアモデルは、64の狭義のインコンテキストの例に対して2%から17%のレートで、256の例で最大58%の一致したレスポンスを生成します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:23:56 GMT)
Hierarchical Balance Packing: Towards Efficient Supervised Fine-tuning for Long-Context LLM [49.3] 長期コンテキスト大規模言語モデル(LLM)のトレーニングは、長期コンテキストと短コンテキストデータによるハイブリッドトレーニングが、ワークロードの不均衡につながることが多いため、難しい。
既存の作業では、主にデータパッキングを使用してこの問題を軽減するが、不均衡な注意計算や通信オーバーヘッドの無駄を考慮できない。
本稿では,これらの非効率性に対処する新しいバッチ構築法とトレーニングレシピを設計する階層的バランスパッキング(HBP)を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:38:44 GMT)
Learning Diffusion Models with Flexible Representation Guidance [49.3] 本稿では,表現指導を拡散モデルに組み込むための体系的枠組みを提案する。
拡散モデルにおける表現アライメントを強化するための2つの新しい戦略を導入する。
画像、タンパク質配列、分子生成タスクにわたる実験は、優れた性能を示し、訓練を加速する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:40:50 GMT)
CTIArena: Benchmarking LLM Knowledge and Reasoning Across Heterogeneous Cyber Threat Intelligence [48.6] サイバー脅威インテリジェンス(CTI)は現代のサイバーセキュリティの中心であり、進化する脅威を検出し緩和するための重要な洞察を提供する。
大規模言語モデル(LLM)の自然言語理解と推論能力により、CTIに適用することへの関心が高まっている。
異種マルチソースCTI上でLLM性能を評価するための最初のベンチマークであるCTIArenaを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:10:17 GMT)
NeMo: Needle in a Montage for Video-Language Understanding [48.2] ビデオ大言語モデル(VideoLLM)の最近の進歩は、ビデオ言語理解における複雑な時間的推論のための新しい評価プロトコルとベンチマークを求めている。
我々は,ビデオLLMの批判的推論能力を評価するために,NeMo(Needle in a Montage)という新しいタスクを導入した。
タスクを中心としたビデオ言語ベンチマークであるNeMoBenchを紹介します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:23:19 GMT)
VA-GS: Enhancing the Geometric Representation of Gaussian Splatting via View Alignment [48.1] 3D Gaussian Splattingは、リアルタイムな新規ビュー合成のための効率的なソリューションとして最近登場した。
ビューアライメントによる3次元ガウス多様体の幾何学的表現を強化する新しい手法を提案する。
本手法は, 表面再構成と新しいビュー合成の両面において, 最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:44:50 GMT)
Find Your Optimal Teacher: Personalized Data Synthesis via Router-Guided Multi-Teacher Distillation [47.8] PerSynは、各学生モデルに適したデータを作成するために、新しいRoute、Generateのパラダイムの下で運用されている。
モデルファミリとスケールの異なる実験は、PerSynが一貫して優れたパフォーマンスまたは同等のパフォーマンスを達成していることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:36:36 GMT)
Z0-Inf: Zeroth Order Approximation for Data Influence [47.7] トレーニングデータの影響を推定するための高効率ゼロ階近似を導入する。
提案手法は, 微調整された大規模言語モデルに対して, 自己影響を推定し, 列車試験の影響を推定する上で, 自己影響を推定する上で優れた精度を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:30:37 GMT)
Camouflaged Image Synthesis Is All You Need to Boost Camouflaged Detection [47.7] 本研究では,カモフラージュデータの合成フレームワークを提案する。
提案手法では,既存の物体検出モデルのトレーニングに使用可能な,現実的なカモフラージュ画像の生成に生成モデルを用いる。
我々のフレームワークは3つのデータセット上で最先端の手法より優れています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:43:56 GMT)
ACADREASON: Exploring the Limits of Reasoning Models with Academic Research Problems [47.5] Acadreasonベンチマークは、LLMとエージェントが学術的知識を習得し、推論する能力を評価するために設計されている。
コンピュータ科学、経済学、法学、数学、哲学を含む5つの高レベル分野にまたがる50の専門的注釈付き学術問題で構成されている。
その結果、ほとんどのLPMは20点以下であり、最先端のGPT-5でも16点しか獲得できなかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:30:36 GMT)
Cost-aware Stopping for Bayesian Optimization [47.0] 本稿では,様々な評価コストに適応し,チューニングが不要なベイズ最適化のためのコスト対応停止則を提案する。
我々は,最先端の取得関数と組み合わせた場合,停止規則によって得られる期待累積評価コストを拘束する理論的な保証を証明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:20:11 GMT)
A Comprehensive Evaluation on Quantization Techniques for Large Language Models [46.8] 後学習量子化(PTQ)は、大規模言語モデル(LLM)のメモリフットプリントと計算オーバーヘッドを大幅に削減する。
我々は、最先端の手法を幅広く検討し、同じ条件下で総合的な評価を行い、公正な比較を行う。
最新のMXFP4およびNVFP4データフォーマットとその性能評価を行った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:29:25 GMT)
TypePilot: Leveraging the Scala Type System for Secure LLM-generated Code [46.7] 大規模言語モデル(LLM)は、様々なプログラミング言語のコード生成タスクにおいて顕著な習熟度を示している。
それらのアウトプットには微妙だが重要な脆弱性があり、セキュリティに敏感なシステムやミッションクリティカルなシステムにデプロイすると重大なリスクが生じる。
本稿では,LLM生成コードのセキュリティとロバスト性を高めるために設計されたエージェントAIフレームワークであるTypePilotを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:44:01 GMT)
Scaling Long-Horizon LLM Agent via Context-Folding [46.7] エージェントが作業コンテキストを積極的に管理することを可能にするフレームワークであるContext-Foldingを紹介します。
エージェントは、サブトラックに手続き的に分岐してサブタスクを処理し、完了時に折り畳み、結果の簡潔な要約を保持しながら中間ステップを崩壊させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:00:58 GMT)
Generating Multi-Image Synthetic Data for Text-to-Image Customization [46.3] テキスト・ツー・イメージ・モデルのカスタマイズにより、ユーザーは新しい概念やオブジェクトを挿入し、目に見えない設定で生成することができる。
既存のメソッドは、比較的高価なテストタイム最適化に依存するか、マルチイメージの監督なしにシングルイメージのデータセットにエンコーダをトレーニングする。
これらの課題に対処するための簡単なアプローチを提案する。我々はまず、既存のテキスト・ツー・イメージモデルと3Dデータセットを活用して高品質なSynthetic Customizationデータセットを作成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:38:43 GMT)
Audio-Maestro: Enhancing Large Audio-Language Models with Tool-Augmented Reasoning [45.9] ツール拡張オーディオ推論フレームワークであるAudio-Maestroを紹介する。
音声によるモデルは、外部ツールを自律的に呼び出し、タイムスタンプされた出力を推論プロセスに統合することができる。
実験により、Audio-Maestroは一般的な音声推論性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:25:34 GMT)
DND: Boosting Large Language Models with Dynamic Nested Depth [45.8] 市販LCMの性能を向上させる新しい手法であるDynamic Nested Depth(DND)を紹介する。
DNDはルーターでより重要なトークンを特定し、追加の処理のためにそれらを返送する。
様々なベンチマークにおいて、このアプローチは密度の高いQwen3-1.7Bを1.88%、MoE Qwen3-30B-A3Bを0.87%向上させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:22:57 GMT)
FOSSIL: Harnessing Feedback on Suboptimal Samples for Data-Efficient Generalisation with Imitation Learning for Embodied Vision-and-Language Tasks [45.7] この研究は、模倣学習で訓練されたエージェントが最適と準最適の両方から堅牢な表現を学習する方法を探求する。
入力シーケンスの一部として言語フィードバックの埋め込みをTransformerベースのポリシーに組み込む。
独自のBabyAI-XGen環境における視覚・言語タスクの具体化について,本手法を検証した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:55:21 GMT)
Training and Evaluating with Human Label Variation: An Empirical Study [45.6] HLV(Human label variation)は、ラベル付きインスタンスが単一根拠真理を持つという標準的な仮定に挑戦する。
ファジィ集合理論を利用したHLVの新しい評価指標を提案する。
分離されたアノテーションやソフトラベルのトレーニングは、メトリクス間で最高のパフォーマンスを発揮します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:38:52 GMT)
Balancing Synthetic Data and Replay for Enhancing Task-Specific Capabilities [45.6] 本稿では,新しいタスクに言語モデルを適用する際のリプレイ比構成と計算予算の相互作用について検討する。
実験では、タスク固有のパフォーマンスと一般的な知識の保持のバランスをとる最適な構成が示される。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:51:24 GMT)
COCO-Tree: Compositional Hierarchical Concept Trees for Enhanced Reasoning in Vision Language Models [45.5] COCO-Tree」は、VLMの言語的推論を改善するために、慎重に設計されたニューロシンボリックな概念木でVLMの出力を増強する新しいアプローチである。
COCO-Treeのビームサーチインスパイアされた推論プロセスは、構成性能を高め、VLM予測の背後にある理論的根拠を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:07:13 GMT)
ChipGPT: How far are we from natural language hardware design [44.4] この研究は、自然言語仕様からハードウェアロジック設計を生成するLLMを探索する自動設計環境の実証を試みる。
LLMをベースとしたスケーラブルな4段階ゼロコード論理設計フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:16:34 GMT)
mmWalk: Towards Multi-modal Multi-view Walking Assistance [44.2] mmWalkは、マルチビューセンサーとアクセシビリティ指向の機能を統合して、屋外安全なナビゲーションを可能にするシミュレーションされたマルチモーダルデータセットである。
本データセットは,120個のシナリオ分類された歩行軌跡と62kの同期フレームから構成される。
VQAベンチマークであるmmWalkVQAを生成し、9つのカテゴリに69万以上の視覚的質問応答三つ子を配置し、安全かつ情報的な歩行支援を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:25:52 GMT)
Graph Neural Network-Based Multicast Routing for On-Demand Streaming Services in 6G Networks [43.9] 本稿では,GNNベースのマルチキャストルーティングフレームワークを提案する。
提案手法は、計算複雑性を著しく低減しつつ、最適な動的プログラムベースの解を近似する。
また,大規模および動的ネットワークトポロジへの強力な一般化も確認し,6Gマルチメディア配信シナリオにおけるリアルタイム展開の可能性を強調した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:00:45 GMT)
A Vision-Language Pre-training Model-Guided Approach for Mitigating Backdoor Attacks in Federated Learning [43.8] 視覚言語事前学習モデルのゼロショット学習機能を利用したFLバックドアディフェンスフレームワークCLIP-Fedを提案する。
本計画では, 防衛効果に課される非IIDの限界を克服し, 事前集約・後防衛戦略を統合する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:55:09 GMT)
RL in the Wild: Characterizing RLVR Training in LLM Deployment [43.8] Reinforcement Learning with Verifiable Rewards (RLVR)は、その推論と理解能力を高めるために、ここ数ヶ月で急増している。
しかし、その複雑なデータフローと多様なタスクは、RLトレーニングシステムに重大な課題をもたらす。
システムの観点からは、RLVRの理解は限られている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:01:17 GMT)
$Δ\mathrm{Energy}$: Optimizing Energy Change During Vision-Language Alignment Improves both OOD Detection and OOD Generalization [43.8] 我々はDeltaEnergyという新しいエネルギーベースのOODスコアを導入する。
DeltaEnergyはバニラエネルギーベースのOODスコアを大幅に上回り、OOD検出に対する信頼性の高いアプローチを提供する。
EBMは、OODの検出を増強するだけでなく、ドメインに一貫性のあるヘッセンを生成することが理論的に証明されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:36:58 GMT)
SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models [43.7] サンドウィッチ政策グラディエント(SPG)
実験の結果,SPGはELBOやワンステップ推定に基づいてベースラインを著しく上回ることがわかった。
具体的には、GSM8Kの3.6%、MATH500の2.6%、カウントダウンの18.4%、スドクの27.0%で、dLLMの最先端RL法よりも精度が向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:58:46 GMT)
Efficient Edge Test-Time Adaptation via Latent Feature Coordinate Correction [43.5] エッジデバイス(TED)に適した新しいテスト時間適応(TTA)手法を提案する。
TEDは共分散行列適応進化戦略(CMA-ES)を用いて、ラテントの主部分空間においてフォワードのみの座標最適化を用いる
TEDは最先端のパフォーマンスを実現し、$textitreduceの計算複雑性を最大63倍に向上させ、現実のエッジアプリケーションに実用的でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:08:52 GMT)
Beyond single-model XAI: aggregating multi-model explanations for enhanced trustworthiness [43.3] 本稿では,複数のモデルから抽出した特徴量集約を用いて,ロバスト性の役割について検討する。
予備的な結果は、複数のモデルの予測能力を活用しながら、アプリケーションの信頼性を高める可能性を示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:55:45 GMT)
Point Prompting: Counterfactual Tracking with Video Diffusion Models [43.1] 予め訓練したビデオ拡散モデルでは、時間とともに動いたときに視覚的にポイントをマークするように促すことで、ゼロショットポイント追跡を行うことができることを示す。
これらの「創発的」トラックは、以前のゼロショット法よりも優れており、隠蔽を通して持続し、しばしば専門的な自己監督モデルと競合する性能を得る。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:46 GMT)
Autoencoding-Free Context Compression for LLMs via Contextual Semantic Anchors [43.0] 現在の文脈圧縮法は、文脈に依存しない圧縮トークンを訓練し、文脈意味論を圧縮する自動符号化タスクに依存している。
本稿では,自動符号化タスクベース圧縮から,この圧縮機能を備えたアーキテクチャへ移行する新しい手法であるSemantic-Anchor Compression (SAC)を提案する。
SACは、様々な圧縮比で既存の文脈圧縮手法より一貫して優れている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:26:21 GMT)
DreamMakeup: Face Makeup Customization using Latent Diffusion Models [43.0] 本稿では,DreamMakupを紹介した。DreamMakupは,新しいトレーニングフリー拡散モデルに基づくMakeup Customization法である。
提案モデルは,既存のGANベースおよび最近の拡散ベースフレームワークよりも顕著に改善されていることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:29:23 GMT)
BlackIce: A Containerized Red Teaming Toolkit for AI Security Testing [42.8] BlackIceは、LLM(Large Language Models)とML(Classic Machine Learning)モデルをレッドチーム化するために設計されたオープンソースのコンテナ化ツールキットである。
BlackIceは、Responsible AIとSecurityテスト用に慎重に選択された14のオープンソースツールをバンドルした、再現可能なバージョン管理Dockerイメージを提供する。
コンテナイメージのアーキテクチャ、ツールの選択に使用されるプロセス、それらがサポートする評価のタイプについて説明する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:20:16 GMT)
Reasoning as Representation: Rethinking Visual Reinforcement Learning in Image Quality Assessment [42.8] 強化学習(RL)により訓練された推論に基づく画像品質評価(IQA)モデルは非常に一般化されている。
本稿では、RLトレーニングを通じて、冗長な視覚表現をコンパクトでクロスドメインなテキスト表現に変換するために、MLLMが推論能力を活用することを検証し、精査する。
RLで学習したこれらの一般化可能なテキスト表現と画像を直接整合させるために、コントラスト学習を利用する新しいアルゴリズムであるRALIを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:11:08 GMT)
PACEbench: A Framework for Evaluating Practical AI Cyber-Exploitation Capabilities [42.6] 我々は,実践的なAIサイバー探索ベンチマークであるPACEbenchを紹介する。
PACEbenchは、シングル、ブレンド、チェーン、防御脆弱性のエクスプロイトにまたがる4つのシナリオで構成されている。
PACEagentは,多相偵察,解析,利用の支援により,ヒトの浸透試験をエミュレートする新しいエージェントである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:50:25 GMT)
AwareCompiler: Agentic Context-Aware Compiler Optimization via a Synergistic Knowledge-Data Driven Framework [42.6] 本稿では,コンパイラ最適化のためのエージェントフレームワークである textbfAwareCompiler を紹介する。
構造化知識統合とデータセット構築、知識駆動適応パス生成、データ駆動ハイブリッドトレーニングパイプラインの3つの重要なイノベーション。
標準ベンチマークの実験結果は、AwareCompilerがパフォーマンスと効率の両方で既存のベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:02:36 GMT)
VLMGuard-R1: Proactive Safety Alignment for VLMs via Reasoning-Driven Prompt Optimization [42.5] VLMGuard-R1は、ユーザ入力を推論誘導リライタによって洗練するプロアクティブフレームワークである。
VLMGuard-R1はSIUOベンチマークで5つのモデルの平均安全性を43.59%向上させた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:07:46 GMT)
Benchmarking Correctness and Security in Multi-Turn Code Generation [41.8] MTSecは,マルチターン符号化シナリオにおける正当性とセキュリティを評価する最初のベンチマークである。
MT-Secでは32のオープンソースモデルとクローズドソースモデルと3つのエージェントスキャフォールディングを評価した。
エージェント生成スキャフォールディングは単一ターンコード生成性能を高めるが,マルチターン評価にはあまり有効ではないことがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:20:46 GMT)
Beyond the noise: intrinsic dimension estimation with optimal neighbourhood identification [41.7] 内在次元(ID)は教師なし学習と特徴選択における鍵となる概念である。
現実世界のほとんどのデータセットでは、IDはデータが分析されるスケールに依存する。
提案手法では,スイーツスポットを選択するための自動プロトコル,すなわち,IDが有意義で有用である範囲を適切に選択する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:28:39 GMT)
A\textsuperscript{2}FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning [41.4] 本稿では,アダプティブ・エージェント・ファンデーション・モデル(Atextsuperscript2FM)を提案する。
Atextsuperscript2FMはBrowseCompで13.4%、AIME25で70.4%、HLEで16.7%を達成している。
特に、適応実行は正しい解答コストあたり0.00487ドルを、推論に対して45.2%、エージェントに対して33.5%のコストで通過させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:08:25 GMT)
Class Prototypes based Contrastive Learning for Classifying Multi-Label and Fine-Grained Educational Videos [41.0] 本稿では,オンラインビデオにおける教育コンテンツの検出手法を提案する。
我々は、リテラシーと数学という、広く使われている2つの教育コンテンツクラスに焦点を当てている。
評価のために,教育研究者によるきめ細かい授業クラスをラベル付けした教育ビデオを用いた APPROVE というデータセットを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:36:26 GMT)
Enhancing LLM Reasoning via Non-Human-Like Reasoning Path Preference Optimization [40.8] 信頼誘導推論経路優先最適化(CGPO)を提案する。
CGPOは、軌道ドリフトを緩和するために、自己生成非人間的な推論パスガイダンスを適用している。
提案手法は,強いモデルや人手による注釈付きデータを用いた手法と比較して,ほとんどの場合において優れた性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:51:16 GMT)
Beyond the Crowd: LLM-Augmented Community Notes for Governing Health Misinformation [40.8] 我々は、より高速で信頼性の高い健康情報ガバナンスのために、コミュニティノートを強化するためにCrowdNotes+を提案する。
私たちはHealthNotesを通じてフレームワークをインスタンス化します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:57:23 GMT)
Chart-RVR: Reinforcement Learning with Verifiable Rewards for Explainable Chart Reasoning [40.6] 我々は、LVLM(Large Vision-Language Models)を微調整するフレームワークであるChart-RVRを、チャート推論のためにより堅牢で説明可能なフレームワークとして提示する。
本フレームワークは, 正しいチャート型分類, (ii) 忠実なチャートテーブル再構築, (iii) プロセス適合性の3つの報酬を最大化する。
結果のモデルであるChart-RVR-3Bシリーズは、ドメイン内とOOD設定にまたがる6つのチャート推論ベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:25:35 GMT)
AndesVL Technical Report: An Efficient Mobile-side Multimodal Large Language Model [40.5] AndesVLはQwen3のLLMと様々なビジュアルエンコーダに基づいて0.6Bから4Bパラメータを持つモバイル側のMLLMのスイートである。
幅広いオープンソースベンチマークでファーストレベルのパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:04:38 GMT)
Uncertainty Quantification for Retrieval-Augmented Reasoning [40.4] Retrieval-augmented reasoning (RAR)は、検索と生成に複数の推論ステップを用いる検索強化世代(RAG)の最近の進化である。
不確実性定量化(Uncertainty Quantification、UQ)は、システムの出力の信頼性を推定する方法を提供する。
本稿では,RARの新しいUQ手法であるRetrieval-Augmented Reasoning(R2C)を紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:55:28 GMT)
Speech Enhancement and Dereverberation with Diffusion-based Generative Models [40.2] 本稿では,微分方程式に基づく拡散過程について概説する。
提案手法により,30段階の拡散しか行わず,高品質なクリーン音声推定が可能であることを示す。
大規模なクロスデータセット評価では、改良された手法が近年の識別モデルと競合することを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:53:34 GMT)
DMAS-Forge: A Framework for Transparent Deployment of AI Applications as Distributed Systems [40.1] DMAS-Forgeは,AIエージェントを分散システムとしてデプロイし,テストするためのフレームワークである。
我々は、DMAS-Forgeのビジョン、設計原則、プロトタイプを提示する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:31:38 GMT)
GIR-Bench: Versatile Benchmark for Generating Images with Reasoning [40.1] 統一マルチモーダルモデルは、画像理解と生成の両方で大きな言語モデルの推論能力を統合する。
textbfGIR-Benchは3つの相補的な視点で統一されたモデルを評価する包括的なベンチマークである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:50:44 GMT)
Reliable Cross-modal Alignment via Prototype Iterative Construction [40.1] クロスモーダルアライメントは重要なマルチモーダルタスクであり、異なるモーダル間のセマンティックギャップを橋渡しすることを目的としている。
従来の方法では、埋め込みは意味情報のみを含むと暗黙的に仮定し、アライメント中の非意味情報の影響を無視している。
組込み相互作用におけるスタイル干渉を抑制する新しいフレームワークであるPICOを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:08:27 GMT)
VIDEE: Visual and Interactive Decomposition, Execution, and Evaluation of Text Analytics with Intelligent Agents [39.4] VIDEEは、インテリジェントエージェントによる高度なテキスト分析を行うための、エントリーレベルのデータアナリストをサポートするシステムである。
VIDEEの有効性を評価するための2つの定量的実験を行い、一般的なエージェントエラーを分析した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:16:18 GMT)
Coordinated Strategies in Realistic Air Combat by Hierarchical Multi-Agent Reinforcement Learning [39.4] 本稿では,これらの課題に対処するために,新しい3次元マルチエージェント空気戦闘環境と階層型マルチエージェント強化学習フレームワークを導入する。
提案手法は,異種エージェントのダイナミックス,カリキュラム学習,リーグプレイ,新たに適応したトレーニングアルゴリズムを組み合わせる。
実験の結果,我々の階層的アプローチは,複雑なドッグファイトシナリオにおける学習効率と戦闘性能を両立させることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:44:51 GMT)
Ontolearn-A Framework for Large-scale OWL Class Expression Learning in Python [39.3] Ontolearnは、大きな知識グラフ上でOWLクラス表現を学習するためのフレームワークである。
学習したOWLクラス式は、知識グラフのインスタンスを分類するために使用することができる。
Ontolearnはリモートのトリプルストア上で簡単に操作できる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:04:06 GMT)
Train-before-Test Harmonizes Language Model Rankings [39.0] 既存の言語モデルベンチマークは、類似のスキルを捉えることを目的としたベンチマークであっても、矛盾するモデルランキングを提供する。
評価の前に、各モデルに同一のベンチマーク固有の微調整を提供することにより、モデルポテンシャルを比較する。
列車前テストで得られたモデルランキングは,全てのベンチマークで顕著に一致していることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:21:52 GMT)
FSA: An Alternative Efficient Implementation of Native Sparse Attention Kernel [38.7] Flash Sparse Attention (FSA)は、幅広い人気のある言語モデルにわたる効率的なNSAを実現する代替カーネル実装である。
バニラのNSAカーネル実装と比較して、FSAは(i)最大3.5倍、平均1.6倍のカーネルレベルのレイテンシ低減を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:46:58 GMT)
Audio-Guided Visual Perception for Audio-Visual Navigation [38.7] Audio-Visual Embodied Navigationは、エージェントが聴覚的手がかりを使用して未知の3D環境の音源に自律的にナビゲートできるようにすることを目的としている。
この制限は、聴覚信号と対応する視覚領域との明確なアライメント機構の欠如に起因する。
本稿では、ポリシーを記憶可能な音響指紋から空間誘導に変換するAGVPフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:06:45 GMT)
Understanding the Generalization of Stochastic Gradient Adam in Learning Neural Networks [38.1] アダムの一般化にどのように影響するかに関する最初の理論的特徴を示す。
以上の結果から,AdamとAdamWはともに適切な重みの減衰を伴って貧弱なテスト誤差解に収束するが,そのミニバッチ変種はほぼゼロのテスト誤差を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:48:22 GMT)
Deconstructing Attention: Investigating Design Principles for Effective Language Modeling [37.9] トランスフォーマー言語モデルは、ドット積の注意機構によって広く評価されている。
この研究は、これらの原則を緩和する制御された変種を設計することで、注意を体系的に分解する。
驚くべきことに、単独で失敗する変種でさえ、標準的な注意を引いた時に堅牢なパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:42:14 GMT)
Empirical Study on Robustness and Resilience in Cooperative Multi-Agent Reinforcement Learning [37.9] 信頼できるマルチエージェント強化学習システムを構築するには、堅牢性を理解する必要がある。
我々は,MARLにおける協調性,堅牢性,レジリエンスを評価するため,82,620以上の実験からなる大規模実験を行った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:24:01 GMT)
APLOT: Robust Reward Modeling via Adaptive Preference Learning with Optimal Transport [37.2] 報酬モデル(RM)は、強化学習(Reinforcement Learning)を通じて、大規模言語モデル(LLM)と人間の嗜好の整合において重要な役割を果たす。
本稿では,適応的マージン機構によりBT系RMを効果的に強化する手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:13:28 GMT)
How Reinforcement Learning After Next-Token Prediction Facilitates Learning [37.0] 本研究では,1つのタスクをコードする短い鎖と長い鎖の配列の混合分布から学習する。
次点予測後の強化学習が自己回帰変換器の一般化を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:04:00 GMT)
Efficient Approximate Posterior Sampling with Annealed Langevin Monte Carlo [36.9] スコアベース生成モデルの文脈における後部サンプリングの問題について検討する。
我々は,KLの発散前とFisherの発散後とにおいて,ノイズの後部に近い分布から抽出できることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:05:04 GMT)
Automatic Music Sample Identification with Multi-Track Contrastive Learning [36.6] 自動サンプル識別の課題に取り組む。
我々は、多トラックデータセットを活用して、正の人工ミックスを生成する自己教師型学習アプローチを採用する。
このような手法は,従来の最先端のベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:17:08 GMT)
FormCoach: Lift Smarter, Not Harder [36.5] FormCoachは、常にオンで対話的なAIトレーニングパートナで、微妙なフォームエラーを見つけ出し、リアルタイムで調整された修正を提供する。
我々は、Webインターフェースと最先端のビジョン言語モデル(VLM)を用いて、1,700人のエキスパートによる注釈付きユーザ参照ビデオペアのデータセット上で、この機能を実証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:14:50 GMT)
Diffusion-Link: Diffusion Probabilistic Model for Bridging the Audio-Text Modality Gap [36.2] Diffusion-Linkは拡散に基づくモダリティブリッジングモジュールである。
オーディオ埋め込みをテキスト埋め込み分布にマッピングする。
これは、拡散に基づくモダリティブリッジによる自動オーディオキャプションへの最初の応用である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:25:33 GMT)
Arbitrary Entropy Policy Optimization: Entropy Is Controllable in Reinforcement Fine-tuning [36.0] 本稿では, エントロピーボーナスをREINFORCEポリシー勾配に置き換えることで, エントロピー崩壊を解消するArbitrary Entropy Policy Optimization (AEPO)を提案する。
AEPOは、ポリシー勾配を正規化として、分布を正規化として、REINFORCEを正規化として統合し、最適化を歪ませることなく正確なエントロピー制御を可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:52:25 GMT)
AFRIDOC-MT: Document-level MT Corpus for African Languages [35.9] AFRIDOC-MTは、英語と5つのアフリカ語をカバーする文書レベルのマルチ並列翻訳データセットである。
データセットは334の健康と271の情報技術に関するニュースドキュメントで構成されており、全て英語からこれらの言語に翻訳されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:02:49 GMT)
Pre to Post-Treatment Glioblastoma MRI Prediction using a Latent Diffusion Model [35.9] 本稿では, 術前MRIと腫瘍の局在から, 結合型条件付き潜時拡散モデルを提案する。
本モデルは,Central Franccois Baclesseで収集した140名のGBM患者からなる局所的データセットを用いて訓練および試験を行った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:32:06 GMT)
Diffusion Transformers with Representation Autoencoders [35.4] 事前学習された自己エンコーダが拡散過程の遅延空間に画素をマッピングする潜在生成モデリングは拡散変換器(DiT)の標準戦略となっている。
ほとんどのDiTはオリジナルのVAEエンコーダに依存しており、いくつかの制限が課されている。
本研究では、VAEをトレーニングされたデコーダと組み合わせた事前訓練された表現エンコーダに置き換え、Representation Autoencoders (RAE) と呼ぶものを形成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:51:39 GMT)
The 2025 OpenAI Preparedness Framework does not guarantee any AI risk mitigation practices: a proof-of-concept for affordance analyses of AI safety policies [35.4] OpenAI 'Preparedness Framework Version 2' (2025年4月) は、余裕のメカニズムと条件モデルとMIT AI Risk Repositoryを用いて分析する。
この安全ポリシーは、少数のAIリスクの評価を要求し、意図せずに「致命的な危害」を可能にする'Medium'機能を備えたシステムのデプロイを奨励する。
これらの結果は、AIリスクの効果的な緩和には、現在の業界自己規制を超えて、より堅牢なガバナンス介入が必要であることを示唆している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:00:51 GMT)
Near-Optimal Second-Order Guarantees for Model-Based Adversarial Imitation Learning [35.4] エージェントがオフラインの専門家によるデモンストレーションから学び、報酬と対話するオンライン対人模倣学習(AIL)について研究する。
モデルベースAILアルゴリズム(MBAIL)を提案する。
MB-AILは,オンラインインタラクション(対数的要因まで)において,限られた専門家によるデモンストレーションにより,最小限のサンプル複雑性が得られることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:33:29 GMT)
ReLook: Vision-Grounded RL with a Multimodal LLM Critic for Agentic Web Coding [35.3] ReLookはエージェント的で視覚的な強化学習フレームワークである。
エージェントが堅牢な生成-診断-リファインループをクローズする権限を与える。
ヴィジュアライズされたフロントエンドコード生成において、一貫して強力なベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:05:50 GMT)
Optimal and efficient inference tools for field tracking with precessing spins [35.2] スピン前磁力計(スピン前磁力計、英: Spin-precession magnetometer、SPM)は、電子、核、色中心、ミューオンスピンを観測する。
揺らぎや未知の過渡的な信号を正確に追跡することは十分であることを示す。
本手法は非線形散逸ダイナミクスを応用した他のセンサにも容易に適用できる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:44:33 GMT)
Robust Ego-Exo Correspondence with Long-Term Memory [35.0] 我々は,エゴセントリックな視点とエゴセントリックな視点のオブジェクトレベル対応を確立するための新しい枠組みを提案する。
提案手法は,Mixture-of-Experts (MoE) にインスパイアされた,デュアルメモリアーキテクチャと適応型機能ルーティングモジュールを備える。
挑戦的なEgoExo4Dベンチマークの実験では、LM-EECと呼ばれる手法により、新しい最先端の結果が得られた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:54:12 GMT)
Survey Response Generation: Generating Closed-Ended Survey Responses In-Silico with Large Language Models [35.0] 本稿では,各種調査応答生成手法が予測された調査応答に与える影響を系統的に検討する。
個別レベルとサブ集団レベルのアライメントにおいて,サーベイ応答生成法に有意な差が認められた。
以上の結果から,制約生成手法は全体としては最良であり,推論出力が常にアライメントを改善するわけではないことが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:29:19 GMT)
FaStFACT: Faster, Stronger Long-Form Factuality Evaluations in LLMs [34.9] nameは、Large Language Models(LLMs)からの長文世代の実性を評価するためのフレームワークである
nameはまず、信頼に基づく事前検証と統合されたチャンクレベルのクレーム抽出を使用する。
検索と検証のために、クロールされたWebページから文書レベルの証拠を収集する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:00:15 GMT)
MosaicDiff: Training-free Structural Pruning for Diffusion Model Acceleration Reflecting Pretraining Dynamics [34.7] 我々は,拡散事前学習力学と後学習サンプリング加速度を一致させるMosaicDiffという新しいフレームワークを導入する。
提案手法は, 出力品質を損なうことなく, サンプリングにおける大幅な高速化を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:51:04 GMT)
Deep Edge Filter: Return of the Human-Crafted Layer in Deep Learning [34.6] 我々は、モデル一般化性を改善するために、ディープニューラルネットワーク機能にハイパスフィルタを適用する新しいアプローチであるディープエッジフィルタを導入する。
Vision、Text、3D、Audioといったさまざまなドメインにわたる実験結果は、一貫したパフォーマンス改善を示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:56:55 GMT)
High-Resolution Spatiotemporal Modeling with Global-Local State Space Models for Video-Based Human Pose Estimation [34.5] ビデオに基づく人間のポーズ推定には高分解能時間表現のモデル化が不可欠である。
現在の最先端の手法は、大域的および局所的動的モデリングのバランスをとるのが難しいのが普通である。
本稿では,VHPEのグローバルおよびローカルな高解像度表現を個別に学習するために,Mambaコンテキストを拡張したフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:18:27 GMT)
SaraCoder: Orchestrating Semantic and Structural Cues for Resource-Optimized Repository-Level Code Completion [34.4] そこで本研究では,リソース最適化検索拡張手法であるSaraCoderを提案する。
限られたコンテキストウィンドウにおいて、情報の多様性と代表性を最大化する。
我々の研究は、複数の次元にわたる検索結果を体系的に洗練することは、より正確でリソース最適化されたリポジトリレベルのコード補完システムを構築するための新しいパラダイムを提供することを証明している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:16:49 GMT)
Ev4DGS: Novel-view Rendering of Non-Rigid Objects from Monocular Event Streams [34.0] Ev4DGSは、明示的な観測空間において、厳密でない変形物体の新たなビューレンダリングのための最初のアプローチである。
提案手法は,(1)推定モデルの出力と2次元事象観測空間との損失,(2)事象から生成された2次元マスクからトレーニングされた粗い3次元変形モデルを通して,変形可能な3次元ガウススティング表現を回帰する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:55 GMT)
Bolster Hallucination Detection via Prompt-Guided Data Augmentation [34.0] 本稿では,幻覚検出のためのデータ拡張として,prompt-guided Data Augmented haLlucination dEtection (PALE)を導入した。
このフレームワークは、プロンプトガイダンスの下で、真理と幻覚の両方のデータを比較的低コストで生成することができる。
実験では、PALEは優れた幻覚検出性能を達成し、競争ベースラインを6.55%で上回った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:06:15 GMT)
SyncHuman: Synchronizing 2D and 3D Generative Models for Single-view Human Reconstruction [33.9] 光リアリスティックな3Dフルボディの人間の再構築は、映画やビデオゲームの応用には不可欠である。
最近のアプローチでは、SMPL推定とSMPL条件画像生成モデルを利用して、新しい視点を幻覚させる。
2次元多視点生成モデルと3次元ネイティブ生成モデルを組み合わせた新しいフレームワークSyncHumanを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:20:43 GMT)
Massive Activations are the Key to Local Detail Synthesis in Diffusion Transformers [33.8] Diffusion Transformers (DiT) は視覚生成の強力なバックボーンとして登場した。
近年の観察では, 内部特徴マップにemphMassive Activations (MA) が出現している。
ローカルなディテール忠実度を高めるためにtextbfDetail textbfGuidance (textbfDG) を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:39:13 GMT)
Unlocking the Potential of Diffusion Language Models through Template Infilling [33.7] Diffusion Language Models (DLMs) は、自動回帰言語モデルに代わる有望な代替品として登場した。
DLMの生成プロセスに適した条件付け手法であるテンプレート埋め込み(TI)を提案する。
TIは, 生成品質を維持しつつ, 効率的な高速化を実現するため, マルチトークン生成設定においてさらなる優位性を提供することを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:33:41 GMT)
BabyVLM: Data-Efficient Pretraining of VLMs Inspired by Infant Learning [33.6] ヒトの幼児は、最小限の入力から視覚的推論スキルを急速に発達させる。
最近の取り組みは、SAYCamのような幼児にインスパイアされたデータセットを活用している。
包括的ドメイン評価ベンチマークと合成トレーニングデータセットからなる新しいフレームワークであるBabyVLMを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:33:45 GMT)
LLMAtKGE: Large Language Models as Explainable Attackers against Knowledge Graph Embeddings [33.5] 知識グラフの埋め込みに対するアドリアック攻撃は、トリプルを削除または挿入することで、モデルがリンク予測能力を破壊することを目的としている。
最近のブラックボックス法では、攻撃性能を高めるためにテキスト情報と構造情報を組み込むことが試みられている。
本稿では,攻撃対象を選択し,人間可読な説明を生成する新しいフレームワークであるLLMAtKGEを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:29:17 GMT)
Creativity or Brute Force? Using Brainteasers as a Window into the Problem-Solving Abilities of Large Language Models [33.3] 我々は、モデルが使用する推論戦略のタイプをより深く調査するために、長い物語形式で書かれたブレインティーザに基づくベンチマークを導入する。
ブレインティーザは、創造的な洞察を使った数ステップのソリューションや、より残酷な力を使ったより長いソリューションなど、複数のアプローチで解決することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:33:51 GMT)
Stabilizing MoE Reinforcement Learning by Aligning Training and Inference Routers [33.2] 我々は,MoEモデルのトレーニングと推論の整合性を解析し,ルーティング行動における顕著な相違点を同定する。
本稿では、推論エンジンからのルーティング分布を記録し、トレーニング中にリプレイするRollout Replay Routing (R3)を提案する。
R3は、トレーニング速度を損なうことなく、トレーニング推論ポリシーKLのばらつきを著しく低減し、極端な不一致を緩和する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:11:27 GMT)
Unify Variables in Neural Scaling Laws for General Audio Representations via Embedding Effective Rank [33.1] 一般的な音声表現表現の質は、オーディオ長、埋め込み次元、モデル深さ、モデルアーキテクチャ、データボリュームなどの変数に共同で影響される。
本研究では,埋め込み有効ランク(RankMe)を統一計量として利用することにより,一般的な音声表現のスケーリング法則を体系的に研究する。
実験の結果,RangeMeと表現品質との間には一貫したパワー-ロー関係がみられ,音声表現学習におけるモデル性能の評価・予測のための信頼性の高いプロキシとして有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:58:50 GMT)
VideoAds for Fast-Paced Video Understanding [33.1] 広告ビデオ上でMLLMのパフォーマンスをベンチマークするための最初のデータセットであるVideoAdsを紹介する。
VideoAdsは、複雑な時間構造を持つよく計算された広告ビデオで構成されており、テキストに手動で注釈付けされた多様な質問が伴っている。
オープンソースのMLLMであるQwen2.5-VL-72Bは、ビデオ広告で73.35%の精度を実現し、GPT-4oとGemini-1.5 Proを上回っている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:33:41 GMT)
Refining Hybrid Genetic Search for CVRP via Reinforcement Learning-Finetuned LLM [32.9] 大型言語モデル (LLM) は、車両ルーティング問題 (VRP) の自動化デザイナーとして、ますます使われている。
この作業は、小さくて専門的なLLMが微調整された場合、先進的な解法の中で専門家が作り上げたものを超えるコンポーネントを生成できることを実証することによって、パラダイムに挑戦する。
高速クロスオーバー演算子を生成するために,小型LLMを微調整する新しい強化学習フレームワークRFTHGSを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:08:58 GMT)
Enhancing Long Chain-of-Thought Reasoning through Multi-Path Plan Aggregation [32.9] 我々は、生の長いCoTを分析し、計画と実行ステップからなる推論階層を明らかにする。
本研究の目的は,計画探索と集約による単一パス推論を増強するMPPA(Multi-Path Plan Aggregation)を提案することである。
これを解決するために, Twisted Sequential Monte Carlo (TSMC) を利用するプロセスレベルの優先度最適化スキームであるStep-DPOを導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:02:41 GMT)
DebugTA: An LLM-Based Agent for Simplifying Debugging and Teaching in Programming Education [32.7] プログラミングと指導(DT)タスクでは、学生は誤ったコードを修正する支援を受ける。
DebugTA, 標準コード検索専用ツール, 参照コード調整用変数置換, リアルタイムコード解析用外部コンパイラを提案する。
DebugTAは、計算コストを大幅に削減しつつ、教育効率を継続的に改善することを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:17:18 GMT)
SocioBench: Modeling Human Behavior in Sociological Surveys with Large Language Models [32.7] 大規模言語モデル(LLM)は、人間の社会的行動や相互作用をシミュレートする強力な可能性を示すが、実際の社会的態度との整合性を評価するための大規模で体系的なベンチマークは欠如している。
国際社会調査プログラム(ISSP)の年次収集標準化調査データから得られた総合的なベンチマークであるSocioBenchを紹介する。
このベンチマークは、30カ国以上から480,000件以上の実応答記録を収集し、10の社会学的ドメインと40以上の人口統計特性にまたがっている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:22:20 GMT)
Differentiable Fast Top-K Selection for Large-Scale Recommendation [32.4] カスケードランキングは、Top-K項目選択のための大規模情報検索システムにおいて広く採用されているパラダイムである。
Top-Kオペレータは非微分可能であり、エンドツーエンドのトレーニングを妨げる。
我々は、最適な$O(n)$時間複雑性を達成する新しい微分可能なTop-K演算子であるDFTopKを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:40:49 GMT)
MoMaps: Semantics-Aware Scene Motion Generation with Motion Maps [31.9] 本稿では,実世界の映像から意味的かつ機能的に意味のある3D動画を学習する上での課題について論じる。
既存の生成画像モデルから生成可能な3次元シーン動作のための画素対応モーションマップ表現を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:56:19 GMT)
DTEA: Dynamic Topology Weaving and Instability-Driven Entropic Attenuation for Medical Image Segmentation [31.5] スキップ接続は、グローバルコンテキストをマージし、エンコーダとデコーダのセマンティックギャップを減らすために使用される。
本稿では,セマンティックトポロジ再構成(STR)とエントロピー摂動ゲーティング(EPG)モジュールを用いた新しいスキップ接続フレームワークを特徴とするDTEAモデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:50:41 GMT)
MIEO: encoding clinical data to enhance cardiovascular event prediction [31.5] 臨床データから知識を抽出し、臨床事象を予測する機械学習手法が用いられている。
有望なアプローチでは、ラベル付きデータの低可用性と、欠落した値につながるデータという、少なくとも2つの大きな問題に悩まされる。
本研究は,これらの課題に効率的に対処するための自己教師付きオートエンコーダを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:47:49 GMT)
Comparison and optimisation of hybridization algorithms for onboard classical and quantum accelerometers [31.5] 本研究では,原子間干渉法と古典的慣性センサを組み合わせた量子慣性センサとを併用した2種類のハイブリッド化アルゴリズムについて検討した。
近年の空中運動で収集された加速度データに実装し、従来のセンサのバイアスとスケールファクター誤差を評価する。
本研究では,2つの加速度計の測定値の相関性の改善と,従来のセンサのバイアス推定における誤差の大幅な低減を実証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:33:08 GMT)
Dynamic Optimizations of LLM Ensembles with Two-Stage Reinforcement Learning Agents [31.3] 本稿では,LLMをルートおよびアンサンブルする2段階のRLエージェントフレームワークであるRL-Focalを紹介する。
焦点多様性により、報酬意識と政策適応型アンサンブル選択と推論融合を効果的に促進することにより、タスク間のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:17:23 GMT)
MGE-LDM: Joint Latent Diffusion for Simultaneous Music Generation and Source Extraction [31.3] MGE-LDMは、同時音楽生成、ソース計算、クエリ駆動ソース分離のための統合潜在拡散フレームワークである。
遅延空間における条件付き塗装タスクとして分離と計算の両方を定式化することにより、任意の楽器源の柔軟でクラスに依存しない操作を支援する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:49:43 GMT)
TraceAegis: Securing LLM-Based Agents via Hierarchical and Behavioral Anomaly Detection [31.2] エージェントの実行トレースを利用して潜在的な異常を検出する,プロファイランスに基づく分析フレームワークであるTraceAegisを提案する。
階層的制約と行動的制約の両方に対して実行トレースを検証することで、TraceAegisは異常な動作を効果的に検出することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:35:06 GMT)
Your Pre-trained LLM is Secretly an Unsupervised Confidence Calibrator [31.2] ポストトレーニングされた言語モデル(PoLM)は、しばしば過剰な自信に悩まされ、正しい出力と間違った出力の両方に高い信頼を割り当てる。
PoLMの校正における大きな障害は、個々の下流タスクのためのラベル付きデータの不足である。
本稿では,時間後信頼度校正におけるパラメータを最適化するために,DACA(Disagreement-Aware Confidence Alignment)を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:59:08 GMT)
PULSE: Practical Evaluation Scenarios for Large Multimodal Model Unlearning [31.2] LMMのための現実的な未学習シナリオのためのPULSEプロトコルを提案する。
そして、これらの次元に沿って既存の未学習手法を評価する。
以上の結果から,いくつかの技術は微調整によって習得した知識を学べるが,事前学習中に学習した情報の除去に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:16:25 GMT)
DITING: A Multi-Agent Evaluation Framework for Benchmarking Web Novel Translation [31.2] DIINGは、Webノベル翻訳のための最初の総合的な評価フレームワークである。
AgentEvalは専門家による検討をシミュレートし、語彙オーバーラップを超えて翻訳品質を評価する。
誤りラベルとスカラー品質スコアを付加した300文対のメタ評価データセットであるMetricAlignを開発した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:51:38 GMT)
LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning [30.6] 大規模言語モデル(LLM)は、思考の連鎖生成を通じて推論能力を示す。
連続潜在表現の表現性を統一する新しい推論フレームワークであるLaDiRを提案する。
LaDiRは、既存の自己回帰的、拡散的、潜伏的推論方法よりも、精度、多様性、解釈性を一貫して改善する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:01:12 GMT)
MATH-Beyond: A Benchmark for RL to Expand Beyond the Base Model [30.6] そこで,MATH-Beyond (MATH-B) は,大規模なサンプリング予算の下で,最大8Bパラメータのオープンソースモデルを破るために構築されたベンチマークである。
これらの問題はDAPO-Math-17KデータセットとDeepScaleRデータセットのサブセットから引き出されるため、それらは標準の高校数学と同程度である。
我々はMATH-Bがより深い推論能力をもたらす探査駆動のRLアプローチを触媒することを期待している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:30:54 GMT)
Collaborative Shadows: Distributed Backdoor Attacks in LLM-Based Multi-Agent Systems [30.5] マルチエージェントシステム(MAS)に対応した最初の分散バックドアアタックを提示する。
我々の攻撃は、良質なタスクの性能を低下させることなく、95%以上の攻撃成功率を達成する。
この作業は、エージェントのコラボレーションを活用する新しいバックドアアタックサーフェスを公開し、単一エージェント保護を超えた移動の必要性を強調している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:34:05 GMT)
Contrastive Local Manifold Learning for No-Reference Image Quality Assessment [30.3] LML-IQAは、局所多様体学習とコントラスト学習を組み合わせた革新的な非参照IQA(NR-IQA)アプローチである。
提案手法はまず各画像から複数のパッチを抽出し,最も視覚的に有意な領域を同定する。
8つのベンチマークデータセットに対する実験は、最先端の手法よりも大きなパフォーマンス向上を示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:07:02 GMT)
Sculpting Latent Spaces With MMD: Disentanglement With Programmable Priors [30.2] 最大平均離散性(MMD)に基づく手法であるProgrammable Prior Frameworkを導入する。
我々の研究は、表現工学の基礎となるツールを提供し、モデル識別可能性と因果推論のための新しい道を開く。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:26:01 GMT)
ManiAgent: An Agentic Framework for General Robotic Manipulation [30.2] 汎用操作のためのエージェントアーキテクチャであるManiAgentを紹介する。
複数のエージェントは、環境認識、サブタスク分解、アクション生成を行うためのエージェント間通信を含む。
ManiAgentはSimplerEnvベンチマークで86.8%、現実世界のピック・アンド・プレイスタスクで95.8%の成功率を達成した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:34:48 GMT)
TTF-VLA: Temporal Token Fusion via Pixel-Attention Integration for Vision-Language-Action Models [29.9] Vision-Language-Action (VLA)モデルは、ロボット操作タスクに固有の貴重な時間情報を捨て、各タイミングで視覚入力を独立に処理する。
本稿では,VLA推論品質を向上させるために,歴史的および現在の視覚表現を統合した訓練不要なTTFを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:18:34 GMT)
Conformal Inference for Time Series over Graphs [29.7] 我々は,グラフ時系列に適した逐次予測フレームワークを開発した。
重要な技術的革新は、グラフ構造を活用して、ノード間のペアの依存関係をキャプチャすることだ。
提案手法は, 楕円体予測セットの体積をグラフに依存しない相対的に指数関数的に縮退させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:32:09 GMT)
Video-STR: Reinforcing MLLMs in Video Spatio-Temporal Reasoning with Relation Graph [29.7] Video-STRは様々なベンチマークで最先端の結果を達成し、ML-Benchではベースモデルを13%上回っている。
コード、モデル、データはリリースされます。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:26:56 GMT)
What Generative Search Engines Like and How to Optimize Web Content Cooperatively [29.7] Google AI概要やChatGPTといったジェネレーティブエンジンは、ユーザエクスペリエンスを大幅に強化する。
これらの急速な採用は、コンテンツプロバイダがより牽引力を得ようとしているため、ジェネレーティブエンジン最適化(GEO)の必要性も引き起こしている。
本稿では,検索したコンテンツを用いて応答生成を行う際に,生成エンジンの好みを自動的に学習するフレームワークであるAutoGEOを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:10:26 GMT)
DemoHLM: From One Demonstration to Generalizable Humanoid Loco-Manipulation [29.5] シミュレーションにおける1つのデモから,実ロボット上でのヒューマノイドロコ操作のためのフレームワークであるDemoHLMを提案する。
全身のコントローラーは、全身のモーションコマンドを関節トルクにマッピングし、ヒューマノイドロボットのための全方向移動手段を提供する。
実験では, 合成データ量と政策性能との間に正の相関が認められた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:49:40 GMT)
The Interpretable and Effective Graph Neural Additive Networks [29.5] Graph Neural Additive Network (GNAN) は、一般化加法モデルの解釈可能なクラスの拡張である。
GNANは完全に解釈可能で、機能とグラフレベルでのグローバルとローカルの両方の説明を提供する。
我々は、さまざまなタスクやデータセットの一連の例において、GNANの知性を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:56:08 GMT)
Detecting and Mitigating Insertion Hallucination in Video-to-Audio Generation [29.4] Video-to-Audio世代は、ビデオのための自動サウンドに顕著な進歩を遂げた。
我々は、この現象を挿入幻覚と呼び、データセットバイアスによって引き起こされるシステム的リスクとみなす。
この問題の有病率と重症度を定量化する2つの新しい指標を導入する。
IHを緩和する新しいトレーニングフリー推論時間法であるPosterior Feature Correctionを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:22:24 GMT)
Self-Filtered Distillation with LLMs-generated Trust Indicators for Reliable Patent Classification [29.3] 本稿では,特許分類に適したフレームワークであるSelf-Filtered Distillationを紹介する。
LLM生成の合理性は、地道的な監督よりも信頼の信号として扱う。
本手法は, ラベルに基づく学習, 従来の蒸留の精度, 安定性, 解釈可能性に優れる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:04:30 GMT)
AMiD: Knowledge Distillation for LLMs with $α$-mixture Assistant Distribution [29.3] 自己回帰型大規模言語モデル (LLM) は、多くのタスクにおいて著しく改善されているが、高い計算とメモリコストが伴っている。
知識蒸留(KD)は、分布的アライメントを通じて、大きな教師から小さな学生に知識を移すことによって、この問題を緩和する。
これらの課題を克服するために、最近、いくつかのアプローチが暗黙的または明示的にアシスタントディストリビューションを組み込むことが提案されている。
本稿では,KD の統一フレームワークである AMiD を用いた$alpha$-mixture assistant distribution と $alpha$-mixture distillation を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:05:27 GMT)
PHANTOM RECALL: When Familiar Puzzles Fool Smart Models [29.2] GPT、Gemini、Claudeといった大規模言語モデル(LLM)は古典論理パズルの解法に長けていることが多い。
最近の証拠は、これらのモデルは第一原理から推論するのではなく、記憶されたテンプレートにしばしば依存していることを示している。
パズルの精度がほぼ完璧であるにもかかわらず、モデルは修正されていないものに対して人間を著しく過小評価している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:09:50 GMT)
A Statistical Theory of Contrastive Learning via Approximate Sufficient Statistics [29.2] 我々はデータ拡張に基づくコントラスト学習を解析するための新しい理論フレームワークを開発した。
我々は,SimCLRなどのコントラスト損失を最小化すれば,ほぼ十分エンコーダが得られることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:52:47 GMT)
Demystifying Numerosity in Diffusion Models -- Limitations and Remedies [29.1] Numerosityは、FLUXやGPT-4oのような最先端のテキスト・画像生成モデルの課題であり続けている。
拡散モデルは本質的に、データセットとモデルサイズをスケールアップすることで、テキストプロンプトによって指定されたオブジェクトの正しい数を生成することができるのか?
我々は,2つの補完的なデータセットからなるクリーンな合成数奇性ベンチマークを構築した: 制御されたスケーリング研究のためのGrayCount250と,複雑な自然主義的なシーンを特徴とするNaturalCount6である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:07:24 GMT)
LaMoGen: Laban Movement-Guided Diffusion for Text-to-Motion Generation [28.7] 本研究は,テキスト誘導運動生成モデルにラガンエフォートと形状成分の定量化手法をシームレスに統合することにより,人間の動作生成の解釈および表現的制御を実現することを目的とする。
提案手法は,ターゲットラバンタグによる動作特性の操作により,動作の同一性を保ちながら,多様な表現的動作特性が得られる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:36:32 GMT)
PESTalk: Speech-Driven 3D Facial Animation with Personalized Emotional Styles [28.6] PESTalkは、音声から直接パーソナライズされた感情スタイルを持つ3D顔アニメーションを生成する新しい方法である。
これは、時間と周波数ドメインの両方のオーディオ機能をキャプチャするDual-Stream Emotion Extractor (DSEE)を導入することで、既存のアプローチの重要な制限を克服している。
また、音声プリント特性に基づいて個々の表現パターンをモデル化する感情スタイルモデリングモジュール(ESMM)も導入している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:21:38 GMT)
DiffStyleTS: Diffusion Model for Style Transfer in Time Series [28.5] スタイル転送は、ある信号の内容と別の信号のスタイルを組み合わせる。
DiffTSSTは,時系列をコンテンツやスタイル表現に分解する拡散ベースのフレームワークである。
DiffTSSTが効果的なスタイル転送を実現することを質的かつ定量的に示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:30:10 GMT)
Deep Learning-based Intrusion Detection Systems: A Survey [28.5] 侵入検知システム(IDS)は長い間、サイバーセキュリティコミュニティでホットな話題だった。
ディープラーニング(DL)技術の導入により、IDSは一般化可能性の向上により大きな進歩を遂げた。
この調査は、データ収集、ログストレージ、ログ解析、グラフ要約、攻撃検出、攻撃調査など、DL-IDSの全ステージを体系的にレビューする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:06:52 GMT)
Macroeconomic Forecasting and Machine Learning [28.5] 我々は、マクロ経済リスクの全プロファイルをリアルタイムで正確に予測する。
縮退による規則化はモデル複雑性を制御するのに不可欠であるが、非線形性の導入は予測精度の限られた改善をもたらす。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:56:51 GMT)
Into the Unknown: Towards using Generative Models for Sampling Priors of Environment Uncertainty for Planning in Configuration Spaces [28.4] 事前は部分的な可観測性の下での計画には不可欠だが、実際は入手が困難である。
本稿では, 大規模事前学習モデルを用いて, ゼロショット方式で事前生成を行う確率論的パイプラインを提案する。
我々は、ロボットが観測されていない対象物にナビゲートする必要がある戸口を通して部分的に見える部屋のMatterport3Dベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:08:48 GMT)
Instruction-aware User Embedding via Synergistic Language and Representation Modeling [28.3] InstructUEは、汎用および命令対応のユーザ表現を生成する、命令対応ユーザ埋め込み基盤モデルである。
InstructUEは、ユーザ予測、マーケティング、レコメンデーションシナリオなど、複数のドメインにわたる既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:15:34 GMT)
ADARL: Adaptive Low-Rank Structures for Robust Policy Learning under Uncertainty [28.3] 我々は、ロバスト性を改善する二段階最適化フレームワークであるtextbfAdaptive Rank Representation (AdaRL) を提案する。
下位レベルでは、AdaRLは、センチュロイドモデルの周りにあるワッサーシュタイン球からサンプリングされた力学を用いて、固定ランク制約の下でポリシー最適化を行う。
上層では、偏微分トレードオフのバランスをとるためにランクを適応的に調整し、ポリシーパラメータを低階多様体に投影する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:05:34 GMT)
Probing emergent prethermal dynamics and resonant melting on a programmable quantum simulator [28.3] 急激なクエンチに続く孤立量子系の力学は、物質科学、高エネルギー物理学、量子化学の多くの分野において中心的な役割を果たす。
ここでは、プログラム可能な中性原子量子シミュレータを用いて、最大180量子ビットのスピンモデルにおけるクエンチダイナミクスを探索する。
我々はその頑丈さを、長時間の急激な時間スケールで安定しているフロッケ型予熱定常状態に遡る。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:58:04 GMT)
Interpretable Machine Learning for Cognitive Aging: Handling Missing Data and Uncovering Social Determinant [28.2] アルツハイマー病(AD)の早期発見は神経変性効果が不可逆的であるため重要である。
NIH NIAが支援するPrePARE Challenge Phase 2データセットを用いて,健康の社会的要因から認知能力を予測する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:04:10 GMT)
Agents of Change: Self-Evolving LLM Agents for Strategic Planning [28.2] HexMachinaは、環境発見と戦略改善を分離する継続的学習マルチエージェントシステムである。
制御されたカタナトロン実験では、HexMachinaはスクラッチから学び、最強の人造ベースラインを上回るプレイヤーを進化させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:57:19 GMT)
Frequency Domain Unlocks New Perspectives for Abdominal Medical Image Segmentation [27.9] 低コントラスト画像のフォアグラウンド領域にフォーカスするために設計されたフォアグラウンド・アウェア・スペクトラム(FASS)フレームワーク。
我々のフレームワークは、低コントラスト画像のセグメンテーションを大幅に強化し、より多彩で複雑な医療画像のシナリオに応用するための道を開く。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:44:43 GMT)
Latent Refinement Decoding: Enhancing Diffusion-Based Language Models by Refining Belief States [27.8] 本稿では、Latent Refinement Decoding (LRD) と予測フィードバックループを備えた2段階のフレームワークについて紹介する。
LRDは最大10.6倍のスピードアップを提供しながら精度を向上し、並列シーケンス生成の強力な代替手段となる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:38:13 GMT)
FedHybrid: Breaking the Memory Wall of Federated Learning via Hybrid Tensor Management [27.7] フェデレートラーニング(FL)は、複数のデバイスが共同で共有モデルをトレーニングできる新しい学習パラダイムとして登場した。
FLのモバイルデバイスへの展開を妨げる、基本的で一般的な課題の1つは、メモリ制限である。
本稿では,トレーニング中のメモリフットプリントを効果的に削減する新しいフレームワークであるtextitFedHybridを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:43:55 GMT)
When Machine Unlearning Meets Retrieval-Augmented Generation (RAG): Keep Secret or Forget Knowledge? [27.7] 大規模言語モデル(LLM)は、トレーニング中に機密情報や有害なコンテンツを不注意に学習し、保持することができる。
本稿では,Retrieval-Augmented Generation (RAG)技術に基づく軽量な行動学習フレームワークを提案する。
われわれはChatGPT, Gemini, Llama-2-7b-chat, PaLM 2 など,オープンソースおよびクローズドソースモデルの広範な実験を通じて,我々のフレームワークを評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:20:51 GMT)
Blade: A Derivative-free Bayesian Inversion Method using Diffusion Priors [27.5] 我々は,相互作用する粒子のアンサンブルを用いて,ベイズ反転の正確かつよく校正された後部を生成できるBladeを紹介した。
ブレイドは、様々な逆問題に対する既存の微分自由ベイズ反転法と比較して優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:19:44 GMT)
MammoDINO: Anatomically Aware Self-Supervision for Mammographic Images [27.5] 自己教師あり学習(SSL)は、一般的な領域でエンコーダの視覚訓練に変化をもたらしたが、医用画像では未利用のままである。
マンモグラフィーのための新しいSSLフレームワークであるMammoDinoを,140万枚のマンモグラフィー画像で事前訓練した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:44:23 GMT)
ID-Booth: Identity-consistent Face Generation with Diffusion Models [27.5] 我々はID-Boothと呼ばれる新しい生成拡散に基づくフレームワークを提案する。
このフレームワークは、事前訓練された拡散モデルの合成能力を保ちながら、アイデンティティ一貫性のある画像生成を可能にする。
本手法は、画像の多様性を向上しつつ、競合する手法よりもアイデンティティ間の一貫性とアイデンティティ間の分離性を向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:34:37 GMT)
Learning Visual Hierarchies in Hyperbolic Space for Image Retrieval [27.4] ユーザ定義のマルチレベル複雑な視覚階層を,明示的な階層ラベルを必要とせずに,双曲空間にエンコードする学習パラダイムを導入する。
実験により,階層的検索タスクの大幅な改善が示され,視覚的階層を捉える上でのモデルの有効性が示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:13:01 GMT)
Revisiting Model Interpolation for Efficient Reasoning [27.3] 2つの重みを直接補間する最も単純なマージ法を再検討する。
我々は、モデルが推論軌道に異なる振る舞いを持つ3段階の進化パラダイムに従うことを観察する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:30:01 GMT)
SR-Scientist: Scientific Equation Discovery With Agentic AI [27.0] SR-Scientistは、単純な方程式の提案者から自律的なAI科学者まで、LLM(Large Language Models)を実装するフレームワークである。
具体的には、コードインタプリタをデータ解析と方程式評価のための一連のツールにラップする。
実証的な結果から、SR-Scientistはデータセットにおいて、絶対的に6%から35%のマージンでベースライン法を上回ります。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:35:23 GMT)
Catch-Only-One: Non-Transferable Examples for Model-Specific Authorization [26.7] 最近のAI規制では、不正使用に抵抗しながらイノベーションに役立つデータを求めている。
本研究では,データに依存しない入力側利用制御機構であるNon-transferable Example (NEs)を提案する。
我々は、認可されたモデルの効用を保証し、許可されていないモデルの偏差を定量化する形式的境界を確立する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:43:11 GMT)
Are Large Language Models Effective Knowledge Graph Constructors? [26.6] 知識グラフ(KG)は知識集約的なタスクに不可欠であり、大型言語モデル(LLM)における幻覚の低減に有望であることを示す。
本稿では,複数のレベルで情報を整理し,セマンティックにリッチで構造化されたKGの作成を可能にする階層的抽出フレームワークを提案する。
現状のLLMを用いて知識グラフを抽出・構築し,構造的・意味的両面から包括的に評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:37:48 GMT)
ACE-G: Improving Generalization of Scene Coordinate Regression Through Query Pre-Training [26.6] シーン座標回帰(SCR)は、視覚的再局在化のための有望な学習ベースのアプローチとして確立されている。
本稿では,座標回帰器と地図表現を汎用変換器とシーン固有の地図コードに分離する。
この分離により、数万のシーンでトランスフォーマーを事前トレーニングすることができます。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:45:17 GMT)
OVS Meets Continual Learning: Towards Sustainable Open-Vocabulary Segmentation [26.0] Open-Vocabulary (OVS)は、トレーニングデータセットに存在しないクラスをセグメントすることを目的としている。
本研究では,Mixture-of-Expertsフレームワークに基づく新しい連続学習手法であるConOVSを提案する。
ConOVSは、事前トレーニング、インクリメンタル、ゼロショットテストデータセットで、既存のメソッドを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:59:16 GMT)
Adaptive UAV-Assisted Hierarchical Federated Learning: Optimizing Energy, Latency, and Resilience for Dynamic Smart IoT [25.9] 本稿では,エネルギー制約付き動的展開型UAVを用いたHFLアーキテクチャについて検討する。
本稿では,学習構成,帯域割り当て,デバイス・ツー・UAVアソシエーションを統合することで,グローバルなトレーニングコストを最小化するための新しいアプローチを提案する。
多様な実世界のデータセットの実験は、このアプローチを検証し、通信障害時のコスト削減とロバストなパフォーマンスを実証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:50:18 GMT)
Leveraging Predictive Equivalence in Decision Trees [25.8] 決定木は解釈可能な機械学習に広く使われている。
本稿では,予測等価性を示さない決定木の表現について述べる。
決定木は、機能値のテスト時間不足に対して驚くほど堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:29:55 GMT)
Introducing Spotlight: A Novel Approach for Generating Captivating Key Information from Documents [25.8] 本稿では,文書の最も説得力のある側面を強調することで,簡潔で魅力的な物語を生成する,情報抽出のための新しいパラダイムであるSpotlightを紹介する。
我々の総合的な評価は、得られたモデルは、精度の高いキー要素を識別するだけでなく、可読性を高め、元のドキュメントのエンゲージメント値を高めることを実証している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:23:41 GMT)
Compositional Zero-Shot Learning: A Survey [25.6] 合成ゼロショット学習(CZSL)は、コンピュータビジョンにおいて重要なタスクであり、モデルが推論中に既知の属性とオブジェクトの見知らぬ組み合わせを認識できるようにする。
我々は,現在最先端のCZSL手法を体系的に検討し,絡み合いに基づく分類を導入した。
我々はこれらの手法の詳細な比較分析を行い、それらの中核となる利点と異なる問題設定における制限を強調した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:54:47 GMT)
Secret-Protected Evolution for Differentially Private Synthetic Text Generation [25.6] SecPE(Secret-Protected Evolution)は、シークレット・アウェア・プロテクションによってプライベート・プロテクションを拡張する新しいフレームワークである。
SecPE が$(mathrmp, Mathrmr)$- Secret Protection を満たすことを示す。
その結果、SecPEはより実用的で効果的なプライバシー保護型合成テキスト生成を解放できることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:05:42 GMT)
CGBench: Benchmarking Language Model Scientific Reasoning for Clinical Genetics Research [25.6] ジェネレーティブ言語モデル(LM)は、臨床的に作用可能な洞察への基礎研究の翻訳を容易にする。
CGBenchは、科学出版物のLMの推論能力をテストするベンチマークである。
我々は8つの異なるLMを試験し、モデルが有望である一方で、文学的解釈にかなりのギャップがあることを見出した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:28:51 GMT)
Downgrade to Upgrade: Optimizer Simplification Enhances Robustness in LLM Unlearning [25.5] 大言語モデル(LLM)は、既存のモデルから望ましくないデータや知識の影響を外科的に除去することを目的としている。
最近の知見は、ウェイト量子化や微調整のような未学習操作が、意図した忘れを迅速に中和できることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:38:53 GMT)
InfiniHuman: Infinite 3D Human Creation with Precise Control [25.4] InfiniHumanは、既存の基礎モデルを蒸留して、リッチな注釈付き人間データを生成するフレームワークである。
InfiniHumanDataには、前例のない多様性にまたがる111KのIDが含まれている。
InfiniHumanGenは高速でリアルで正確に制御可能なアバター生成を可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:29:55 GMT)
Test-Time Adaptation by Causal Trimming [25.4] テストタイム適応は、分散シフトの下でモデルの堅牢性を改善することを目的としている。
因果トリミング(TACT)によるテスト時間適応の導入
TACTは、因果的特徴を保存し、非因果的特徴を変動させるデータ拡張を適用している。
それは一貫して最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:22:38 GMT)
MergeBench: A Benchmark for Merging Domain-Specialized LLMs [25.3] MergeBenchは、スケールでのモデルマージを評価するために設計された評価スイートである。
2Bから9BスケールのLlamaやGemmaファミリなど、最先端のオープンソース言語モデルの上に構築されている。
マルチタスク性能, 忘れられたこと, 実行効率にまたがる8つの代表的なマージ手法を評価した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:19:14 GMT)
LLM Reasoning for Machine Translation: Synthetic Data Generation over Thinking Tokens [25.3] シンキングトークン」は、LRMが機械翻訳をより良く実行するのに役立ちません。
合成CoT説明によるモデル微調整は、標準入力出力微調整よりは良くない。
以上の結果から,教師が目標翻訳を洗練したり,並列コーパスを拡張することは,CoTの説明を「思考」MTモデルに蒸留するよりも影響が大きいことが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:41:01 GMT)
Normalize Filters! Classical Wisdom for Deep Vision [25.2] 本稿では,フィルタ正規化を提案し,次に学習可能なスケーリングとシフト,すなわちバッチ正規化を提案する。
提案手法は, 人工および自然強度変動ベンチマークにおいて, 大幅な改善を実現する。
解析の結果,非正規化フィルタは性能を低下させるが,フィルタ正規化は学習を正規化することがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:54:20 GMT)
Automatic Synthesis of High-Quality Triplet Data for Composed Image Retrieval [25.1] Composed Image Retrieval (CIR)は、マルチモーダル(image+text)クエリを使ってターゲット画像を取得することを目的としている。
完全合成データセットであるComposeed Image Retrieval on High-quality Synthetic Triplets (CIRHS)とともに,自動三重項生成のためのスケーラブルパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:01:23 GMT)
Self-Exploring Language Models for Explainable Link Forecasting on Temporal Graphs via Reinforcement Learning [24.7] 時間グラフ(ReaL-TG)のための推論強化学習法を提案する。
ReaL-TGはグラフモデルを微調整して説明可能なリンク予測を行う強化学習フレームワークである。
LLM-as-a-Judgeシステムとランキングメトリクスを組み合わせた新しい評価プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:09:16 GMT)
SMART: Self-Generating and Self-Validating Multi-Dimensional Assessment for LLMs' Mathematical Problem Solving [24.7] 大規模言語モデル(LLM)は、様々な数学的なベンチマークで顕著な結果を得た。
最終回答か推論プロセスに焦点をあてた共通評価手法は、問題解決手順全体を評価するのに失敗する。
この結果から,現在のLCMの真の弱点が明らかとなり,新たな指標であるオールパススコア(All-Pass Score)のモチベーションが得られた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:00:07 GMT)
PoU: Proof-of-Use to Counter Tool-Call Hacking in DeepResearch Agents [24.5] Retrieval-augmented Generation (RAG) エージェントは、外部ツールを通じて、自律的な情報検索機能を備えた大規模言語モデルを拡張する。
以前見過ごされた障害モードであるTool-Call Hacking(ツールコールハッキング)を識別します。
提案するProof-of-Use(PoU)フレームワークは,検索された証拠,推論トレース,最終回答間の因果関係の検証を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:45:37 GMT)
ContextGen: Contextual Layout Anchoring for Identity-Consistent Multi-Instance Generation [24.5] マルチインスタンス生成のための新しいDiffusion TransformerフレームワークであるContextGenを紹介する。
ContextGenは、制御精度、アイデンティティの忠実度、全体的な視覚的品質において、既存の手法よりも優れた新しい最先端の手法を設定できることを示します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:21:19 GMT)
Direct Multi-Token Decoding [24.3] 我々は,大規模言語モデル(LLM)の推論パラダイムとして,DMTD(Direct Multi-Token Decoding)を導入する。
投機的復号法とは異なり,提案手法では追加パラメータや補助ルーチンやポストジェネレーション検証は導入されない。
微調整のDMTD Qwen3-4Bモデルはすでに有望な結果を示しており、2倍のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:42:37 GMT)
Discursive Circuits: How Do Language Models Understand Discourse Relations? [24.2] スパース回路は RST や SDRT などの未知の談話フレームワークによく応用できることを示す。
下位層は語彙意味論やコア推論のような言語的特徴を捉え、上位層は談話レベルの抽象化をエンコードする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:45:49 GMT)
Trust Region Reward Optimization and Proximal Inverse Reward Optimization Algorithm [24.1] 逆強化学習(IRL)は、専門家によるデモンストレーションを説明するための報酬関数を学習する。
現代のIRL法は報酬と政策最適化を交互に行う逆数式(minimax)を用いることが多い。
最近の非敵対的IRLアプローチは、エネルギーベースの定式化を通じて報酬と政策を共同学習することで安定性を向上させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:33:42 GMT)
Learning-based Sketches for Frequency Estimation in Data Streams without Ground Truth [24.1] 伝統的なスケッチは、厳密なメモリ制約の下でのみ粗い見積もりを提供する。
キーごとの周波数推定のための実践的な学習パラダイムであるUCL-sketchを提案する。
設計では、2つの重要なイノベーションを紹介している: (i) 基礎的な真実(GT)を必要としない同等の学習に基づくオンライントレーニングメカニズムと、 (ii) 構造化推定バケットを活用して実世界のデータストリームにスケールする高度にスケーラブルなアーキテクチャ。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:58:34 GMT)
From Static to Adaptive Defense: Federated Multi-Agent Deep Reinforcement Learning-Driven Moving Target Defense Against DoS Attacks in UAV Swarm Networks [23.9] UAV群における能動的DoS緩和のための新しい枠組みを提案する。
我々は、リーダースイッチング、ルート突然変異、周波数ホッピングを含む軽量かつ協調的なMTD機構を設計する。
我々のアプローチは最先端のベースラインを大きく上回っている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:45:46 GMT)
Towards Fast and Scalable Normal Integration using Continuous Components [23.8] 表面正規化はコンピュータビジョンの基本的な問題である。
連続成分の相対スケールの推定として正規積分を再送する。
我々のフレームワークは、最先端の成果をほんの数秒で達成します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:17:16 GMT)
Dynamic Network-Based Two-Stage Time Series Forecasting for Affiliate Marketing [23.8] 本稿では,製品プロモーションにおけるプロモーターの貢献度を正確に評価し,予測することの課題に対処する。
本研究では,プロモーターの間接的貢献を評価するための新しい指標である伝搬尺度を設計する。
当社のモデルをAlimamaプラットフォームに10万ドル以上のプロモーターで展開し、GMVの9.29%の改善と売上の5.89%の増加を達成した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:21:29 GMT)
An approach for systematic decomposition of complex llm tasks [23.8] 大きな言語モデル(LLM)は、既存の分解手法がエージェントや手動分解に依存しているため、複雑なタスクに対する信頼性の問題に悩まされる。
この研究は、制約問題としてタスクをモデル化し、分解を導くための形式的な複雑さ対策を活用する、新しい体系的な分解フレームワークを導入している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:03:13 GMT)
A Vision for Access Control in LLM-based Agent Systems [23.6] 本稿では、バイナリアクセス制御からより洗練された情報ガバナンスモデルへのパラダイムシフトを論じる。
本稿では,情報フロー管理の動的なコンテキスト認識プロセスとしてACを再構成する新しいフレームワークであるエージェントアクセス制御(AAC)を紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:57:09 GMT)
A Practical Review of Mechanistic Interpretability for Transformer-Based Language Models [23.4] 機械的解釈可能性(MI)は、その内部計算をリバースエンジニアリングすることでニューラルネットワークモデルを理解しようとする、新たな解釈可能性のサブフィールドである。
タスク中心の観点から総合的な調査を行い、MI研究質問やタスクの分類を整理する。
分類学における各課題に対する技術,評価方法,重要な知見とともに,MIにおける研究の基本的対象について概説する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:51:22 GMT)
Enhancing Diffusion-Based Sampling with Molecular Collective Variables [23.4] 拡散に基づくサンプリングは、エネルギーやログ密度だけで複雑な高次元分布をサンプリングすることを学ぶ。
我々は、集合変数(CVs)として知られる原子座標のベスポーク、情報豊か、低次元射影に沿ったシーケンシャルバイアスを導入する。
拡散型サンプリング装置を用いた反応性サンプリングを初めて実施し, 原子間ポテンシャルによる結合破壊と生成をほぼ第一原理精度で観測した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:44:54 GMT)
MVIGER: Multi-View Variational Integration of Complementary Knowledge for Generative Recommender [23.3] 本稿では,入力プロンプトテンプレートや項目インデックスタイプの変化によって生成される出力の不整合に着目した。
本稿では,これらの情報ソースの選択を,事前学習可能なカテゴリ付き潜在変数としてモデル化する,統一的な変分フレームワークMVIGERを提案する。
実世界の3つのデータセットに対するMVIGERの有効性を検証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:26:21 GMT)
Spec-Driven AI for Science: The ARIA Framework for Automated and Reproducible Data Analysis [23.3] ARIAは、自動および解釈可能なデータ分析のための、仕様駆動のヒューマン・イン・ザ・ループ・フレームワークである。
ARIAは、Command、Context、Code、Data、Orchesttion、AI Moduleという6つのレイヤを統合している。
ARIAは透明で協調的で再現可能な科学的発見のための新しいパラダイムを確立している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:32:43 GMT)
Query-Specific GNN: A Comprehensive Graph Representation Learning Method for Retrieval Augmented Generation [23.1] マルチホップ質問は、合成された答えを形成するために複数の知識目標を識別する必要がある。
既存の手法はしばしば、複雑な意味構造を持つ質問を完全に理解するのに苦労する。
マルチホップ質問検索のための新しいグラフ表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:41:15 GMT)
When Thinking Backfires: Mechanistic Insights Into Reasoning-Induced Misalignment [23.1] Reasoning-induced Misalignment (RIM) は推論能力が強化されたときに現れる。
RIMは推論やトレーニング中に特定のタイプの推論パターンが導入されたときに発生する。
トレーニング中、安全クリティカルニューロンの推論と安全性の間には、アクティベーションの絡み合いが著しく高いことが判明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:53:43 GMT)
Large Language Models Are Effective Code Watermarkers [23.1] ウォーターマーキングは、ソース属性に対する有望なソリューションとして登場した。
CodeMark-LLMはそのセマンティクスや可読性を損なうことなく、ソースコードに透かしを埋め込む。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:40:24 GMT)
Generate, Transduct, Adapt: Iterative Transduction with VLMs [23.0] GTA-CLIPは,言語と視覚空間における共同翻訳のための言語モデルからの監督を取り入れた新しい手法である。
アプローチは反復的であり, (i) 言語モデルをクエリすることで属性空間を漸進的に探索すること, (ii) 属性拡張型トランスダクティブ推論手順, (iii) データセット内の推論ラベルに基づいて言語と視覚エンコーダを微調整すること,の3段階からなる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:53:09 GMT)
Reconstructing 12-Lead ECG from 3-Lead ECG using Variational Autoencoder to Improve Cardiac Disease Detection of Wearable ECG Devices [22.8] 可変オートエンコーダ(VAE)方式であるWearECGを提案する。
我々のモデルには、ECG信号の時間的および空間的依存をよりよく捉えるためのアーキテクチャの改善が含まれている。
大規模プレトレーニングECGモデルであるECGFounderを,40以上の心条件を含む多ラベル分類タスクで微調整する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:14:37 GMT)
Iterative Amortized Inference: Unifying In-Context Learning and Learned Optimizers [22.7] 償却学習は、新しい問題への迅速な一般化を可能にするために、タスク間で共有される計算や帰納的バイアスを再利用する考え方である。
現在のアプローチでは、推論でタスクデータを処理する能力が制限されることが多いため、大規模なデータセットへのスケールアップに苦労している。
ミニバッチよりも解を段階的に洗練するモデルである反復的償却推論を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:40:47 GMT)
GenCNER: A Generative Framework for Continual Named Entity Recognition [22.7] 従来の名前付きエンティティ認識(NER)は、テキストの参照を事前に定義されたエンティティタイプに識別することを目的としている。
NERのための既存の継続学習(CL)手法は、破滅的な忘れ込みと非エンテント型のセマンティックシフトの課題に直面している。
我々は,CNERの欠点を軽減するための簡易かつ効果的な生成フレームワークであるGenCNERを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:15:31 GMT)
GapDNER: A Gap-Aware Grid Tagging Model for Discontinuous Named Entity Recognition [22.7] 医学分野において、1つの名前の実体は一連の非隣接トークンから構成され、他の実体と重複することがある。
従来の方法では、エンティティフラグメントや内部トークンを接続することで、不連続なエンティティを認識する。
本稿では,GapDNER という不連続名前付きエンティティ認識のための効果的な Gap-aware グリッドタグモデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:40:14 GMT)
Perspective-aware 3D Gaussian Inpainting with Multi-view Consistency [22.7] 本稿では,視点認識型コンテンツ伝搬と多視点インペイント画像間の整合性検証を活用することで,3次元ガウス塗装の進展を図った新しいアプローチであるPAInpainterを提案する。
提案手法は,SPIn-NeRFデータセットとNeRFillerデータセットのPSNRスコアが26.03dB,29.51dBの優れた3次元塗装品質を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:10:39 GMT)
Aligning Deep Implicit Preferences by Learning to Reason Defensively [22.5] 優先推論のギャップを埋めるために,批判駆動推論アライメント(CDRA)を提案する。
CDRAはスカラー報酬マッチングタスクから構造化推論プロセスにアライメントを再構成する。
実験により、CDRAは、堅牢な推論を実行しながら、ユーザの真の嗜好を発見し、整合するのに優れていることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:26:47 GMT)
Defects4C: Benchmarking Large Language Model Repair Capability with C/C++ Bugs [22.5] 自動プログラム修復(APR)は、ソフトウェアシステムの品質と信頼性を高める上で重要な役割を果たす。
C/C++の広範な使用と関連する脆弱性の頻度にもかかわらず、C/C++プログラムの修復に関する研究には大きなギャップが残っている。
C/C++プログラムの修正に特化して設計されたベンチマークであるDefects4Cを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:49:28 GMT)
LiTransProQA: an LLM-based Literary Translation evaluation metric with Professional Question Answering [22.5] LITRANSPROQAは,LLMをベースとした文献翻訳評価のための質問応答フレームワークである。
LITRANSPROQAはこのループに人間を統合し、プロの文芸翻訳家や研究者の洞察を取り入れている。
LITRANSPROQAは,文芸に富んだXCOMET-XLが限界ゲインを産み出す一方で,現在の指標を著しく上回っている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:31:45 GMT)
PhySIC: Physically Plausible 3D Human-Scene Interaction and Contact from a Single Image [22.3] PhySICは物理的に妥当なヒューマン・シーンインタラクションとコンタクト再構築のためのフレームワークである。
単一のRGB画像から、メトリック一貫性のあるSMPL-Xヒューマンメッシュ、密集したシーン表面、および共有座標フレーム内のコンタクトマップを復元する。
PhySICは効率的で、人間の共同最適化にわずか9秒、エンドツーエンドに27秒以下しか必要としない。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:29:51 GMT)
The Curious Case of Factual (Mis)Alignment between LLMs' Short- and Long-Form Answers [22.2] 大きな言語モデル (LLMs) は「アインシュタインはいつ生まれたのか?」と正確に答えることができるが、アインシュタインの生涯について書く際にも同じ日付を提供することができなかった。
モデルでは,実際の問合せの精度は高いが,単純な問合せと複雑な問合せの信頼性の差はよく分かっていない。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:00:58 GMT)
Adversarial Attacks Leverage Interference Between Features in Superposition [22.2] 敵の脆弱性は、ニューラルネットワークの効率的な情報符号化から生じる可能性があると我々は主張する。
具体的には、スーパーポジションが、敵が活用できる潜在表現の配列を生成する方法を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:02 GMT)
LADM: Long-context Training Data Selection with Attention-based Dependency Measurement for LLMs [21.9] LLM(Large Language Models)の分野では、長いコンテキストモデリングがますます注目を集めている。
意識に基づく依存度測定(LADM)を用いたLong-contextデータ選択フレームワークを提案する。
LADMは大規模マルチドメイン事前学習コーパスから高品質の長文データを効率的に識別することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:55:40 GMT)
Revisiting Chain-of-Thought Prompting: Zero-shot Can Be Stronger than Few-shot [21.5] In-Context Learning(ICL)は、大規模言語モデル(LLM)の重要な創発的能力である
近年の研究では、特に数学タスクにおける推論能力を高めるために、ICLを例に、Chain-of-Thought (CoT)を導入している。
Qwen2.5シリーズのような最近の強力なモデルでは、従来のCoTの例を付加してもZero-Shot CoTに比べて推論性能は向上しない。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:55:14 GMT)
DUAL: Learning Diverse Kernels for Aggregated Two-sample and Independence Testing [21.1] 本稿では,異なるカーネル間の共分散に基づいて,カーネルの多様性を明示的に組み込んだ集計統計モデルを提案する。
これは、トレーニングフェーズの情報を活用して、個々のパフォーマンスの高いカーネルを選択する、選択推論によるテストフレームワークのモチベーションである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:30:42 GMT)
Towards Unsupervised Training of Matching-based Graph Edit Distance Solver via Preference-aware GAN [20.9] グラフ編集距離 (Graph Edit Distance, GED) は、様々なアプリケーションで広く使われている基本的なグラフ類似度尺度である。
最近の最先端ハイブリッドGEDソルバは有望な性能を示した。
GED計算のための新しい教師なしGANベースのフレームワークであるGEDRankerを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:53:27 GMT)
InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition [20.8] InstructSAMは、命令駆動オブジェクト認識のためのトレーニング不要のフレームワークである。
我々は、地球観測のための最初のインストラクトCDSベンチマークであるEarthInstructを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:36:15 GMT)
AgentAda: Skill-Adaptive Data Analytics for Tailored Insight Discovery [20.7] 我々はAgentAdaを紹介した。AgentAdaは、新しい分析スキルを学び、利用して、より専門的な洞察を引き出すことができる最初の分析エージェントだ。
ユーザーがどのデータ分析方法を適用するかを手動で決める既存の方法とは異なり、AgentAdaは分析を行うために必要なスキルを自動的に識別する。
我々は、AgentAdaが既存のツールよりも洞察に富んだ分析を提供しており、48.78%が分析を好み、27.67%は未熟練のエージェントであることを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:15:54 GMT)
An Overview of the JPEG AI Learning-Based Image Coding Standard [20.6] JPEG AIは、Joint Photographic Experts Groupが開発した、新たな学習ベースのイメージコーディング標準である。
JPEG AIの最初のバージョンでは、人間の視覚タスクに焦点を当てており、既存の標準に比べてBDレートが大幅に削減されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:44:43 GMT)
Towards Robust and Realible Multimodal Fake News Detection with Incomplete Modality [20.6] MFND(Multimodal fake news detection)は、ソーシャルメディアプラットフォーム上で巨大なマルチモーダルフェイクコンテンツが出現し、緊急の課題となっている。
我々は、MMLNet(Multi-expert Modality-Incomplete Learning Network)と呼ばれる、新しい汎用的で堅牢なマルチモーダル融合戦略を提案する。
MMLNetを2つの言語にまたがる3つの実世界のベンチマークで評価し、最先端の手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:48:53 GMT)
SWIFT: Semantic Watermarking for Image Forgery Thwarting [20.6] 我々は、画像キャプションを表す高次元実ベクトルを埋め込んで抽出するために、HiDDeNディープラーニング透かしアーキテクチャを変更した。
本手法は良性編集と良性編集の両方において有意に改善する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:17:33 GMT)
DeRIS: Decoupling Perception and Cognition for Enhanced Referring Image Segmentation through Loopback Synergy [20.6] RISを認知と認知という2つの重要な構成要素に分解する新しいフレームワークであるDeRISを提案する。
以上の結果から,従来のモデルでは知覚障害ではなく,マルチモーダル認知能力が不十分であることが示唆された。
本稿では,ターゲット存在判定に関連する長期分布問題に対処するため,単純な非参照型サンプル変換データ拡張を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:39:10 GMT)
Tensor-Network-Based Unraveling of Non-Markovian Dynamics in Large Spin Chains via the Influence Martingale Approach [20.4] 大規模1次元量子システムにおいてマルコフ力学と非マルコフ力学の両方をシミュレーションする効率的なアルゴリズムを開発する。
この枠組みは、最大100スピン量子ビットからなる1次元逆場イジング鎖に対して示されるように、非マルコフ系における開系力学のシミュレーションを可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:33:02 GMT)
AB-UPT: Scaling Neural CFD Surrogates for High-Fidelity Automotive Aerodynamics Simulations via Anchored-Branched Universal Physics Transformers [20.4] CFDシミュレーションのためのニューラルサロゲート構築のための新しいモデリング手法としてAB-UPTを導入する。
AB-UPTは,3万3千万から1億5000万のメッシュセルからなる自動車CFDシミュレーションにおいて,表面および体積場の最先端予測精度が得られることを示す。
特に、提案されたモデルは1日以内で1つのGPUでトレーニングでき、業界標準のサーフェスとボリュームフィールドを数秒で予測できる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:45:57 GMT)
The Social Cost of Intelligence: Emergence, Propagation, and Amplification of Stereotypical Bias in Multi-Agent Systems [20.4] 大規模言語モデル(LLMs)におけるバイアスは、社会集団全体でのステレオタイピングと不公平な扱いにおいて、引き続き永続的な課題である。
内部特殊化, 基礎となるLCM, エージェント間通信プロトコルが, バイアス堅牢性, 伝搬, 増幅に与える影響について検討した。
以上の結果から,マルチエージェントLPMシステムにおける公平性とレジリエンスを規定する重要な要因が示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:56:42 GMT)
From Reasoning LLMs to BERT: A Two-Stage Distillation Framework for Search Relevance [20.1] eコマース検索システムは,大規模言語モデルの直接適用を防止するために,厳格なレイテンシ要件に直面している。
本稿では,LLM から軽量で展開しやすい学生モデルへ推論機能を移行するための2段階推論蒸留フレームワークを提案する。
我々のフレームワークは、複数のメトリクスをまたいだ大幅な改善を実現し、その有効性と実用的価値を検証します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:46:43 GMT)
Stronger Together: On-Policy Reinforcement Learning for Collaborative LLMs [20.1] マルチエージェントシステム(MAS)と強化学習(RL)は,大規模言語モデル(LLM)のエージェント能力を高めるために広く利用されている。
政治上のRLをMASに適用することはまだ未熟であり、ユニークな課題を提示している。
我々は,エージェントとターンワイドなグループ化RLアルゴリズムをMASに適合させるAT-GRPOと,単一・複数政治体制をサポートするトレーニングシステムを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:55:09 GMT)
Context Guided Transformer Entropy Modeling for Video Compression [20.1] 条件付きエントロピーモデルは、時間的・時間的複雑さを効果的に活用し、ビデオの冗長性を減少させる。
我々は,赤時間的コンテキストと依存性重み付き空間文脈を条件とした現在のフレームの確率質量関数を推定するコンテキスト案内変換器(CGT)エントロピーモデルを提案する。
実験結果から, CGTモデルではエントロピーのモデル化時間を約65%削減し, 従来の条件付きエントロピーモデルと比較して11%のBD-Rate削減を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:50:44 GMT)
torchsom: The Reference PyTorch Library for Self-Organizing Maps [20.0] torchsomはPythonライブラリで、PyTorchの自己組織化マップ(SOM)のリファレンス実装を提供する。
これはPyTorchバックエンドに依存しており、(i)GPUアクセラレーションによるSOMの高速かつ効率的なトレーニングを可能にし、(ii)PyTorchエコシステムとの簡単でスケーラブルな統合を可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:40:00 GMT)
Sparse Robust Classification via the Kernel Mean [20.0] すべての重みを等しくすると、概念的に単純な分類規則が導かれる。
ここでは、この単純な分類規則の一貫性、堅牢性、およびスパーシフィケーションについて考察する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:35:50 GMT)
Visual Affordance Prediction: Survey and Reproducibility [20.0] Affordancesは、カメラで観察されるように、エージェントがオブジェクトに対して実行可能な潜在的なアクションである。
視覚的アプライアンス予測は、検出の把握、アプライアンス分類、アプライアンスセグメンテーション、ポーズ推定といったタスクに対して異なる方法で定式化される。
本稿では,対象物についての完全な情報と,目的物に対するエージェントのインタラクションを考慮し,視覚的可視性予測の統一的な定式化を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:03:25 GMT)
Revisiting Node Affinity Prediction in Temporal Graphs [19.9] ノード親和性予測のための時空間グラフニューラルネットワークの訓練における課題を分析する。
仮想状態を用いたノード親和性予測モデルであるNAViSを開発する。
ノード親和性予測のための新しい損失関数を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:39:12 GMT)
Project-Level C-to-Rust Translation via Synergistic Integration of Knowledge Graphs and Large Language Models [19.9] Cコードを安全なRustに変換することは、メモリ安全性を確保する効果的な方法である。
新しいC-Rust Pointer Knowledge Graphは、グローバルの観点からポインタセマンティクスを提供する。
我々の実験では、翻訳されたRustの安全でない使用量を99.9%削減している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:09:35 GMT)
Asking Clarifying Questions for Preference Elicitation With Large Language Models [19.8] 大規模言語モデル(LLM)は、オープンエンドの対話インタフェースでユーザと対話するリコメンデーションシステムを実現する。
ユーザの好みを明らかにするシーケンシャルな質問に対して,LLMをトレーニングするための新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:32:31 GMT)
PD-Diag-Net: Clinical-Priors guided Network on Brain MRI for Auxiliary Diagnosis of Parkinson's Disease [19.7] パーキンソン病 (PD) は、患者の生活の質を著しく低下させる一般的な神経変性疾患である。
PD-Diag-Netは、生のMRIスキャンから直接リスクアセスメントと補助診断を行う。
実験の結果,PD-Diag-Netは早期診断で86%,96%以上精度が得られた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:00:09 GMT)
Query Complexity of Classical and Quantum Channel Discrimination [19.7] 量子チャネル識別のクエリ複雑性について検討する。
目標は、所望のエラー確率に到達するために必要なチャネルの最小数を決定することである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:15:40 GMT)
MeTA-LoRA: Data-Efficient Multi-Task Fine-Tuning for Large Language Models [19.6] マルチタスク適応におけるデータ効率を大幅に向上する2段階最適化フレームワークであるMeTA-LoRAを紹介する。
マルチタスク学習と多言語学習の両方のシナリオにおいて、我々の手法は従来の全データLoRAファインチューニング手法の性能と一致するか、上回っている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:37:40 GMT)
Evaluating Reasoning Faithfulness in Medical Vision-Language Models using Multimodal Perturbations [19.5] 視覚言語モデル(VLM)は、しばしばチェーン・オブ・シント(CoT)の説明を生み出す。
胸部X線視覚質問応答(VQA)の臨床的基盤として,制御されたテキストと画像修正を用いてCoT忠実度を探索するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:28:22 GMT)
LLM Knowledge is Brittle: Truthfulness Representations Rely on Superficial Resemblance [19.5] サンプルの提示が事前学習中に見られたものとあまり似ないようになると,文の真偽表現が崩壊することを示す。
これらの結果から、脆性ベンチマークのパフォーマンスが説明できる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:13:56 GMT)
SPADE: Spatial Transcriptomics and Pathology Alignment Using a Mixture of Data Experts for an Expressive Latent Space [19.4] 本研究では,空間転写学データと病理組織学を統合し,画像表現学習を指導する基礎モデルSPADEを紹介する。
SPADEは20のダウンストリームタスクで評価され、ベースラインモデルと比較して非常に優れた数ショット性能を示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:34:26 GMT)
Does LLM Focus on the Right Words? Diagnosing Language Bias in LLM-based Recommenders [19.3] Group Distributionally Robust Optimization-based Tuning (GDRT) は、トークングループ間で一貫したモデルパフォーマンスを、補助トークンとの関連性に応じて実施する、新しい微調整パラダイムである。
3つの公開データセットで実施された大規模な実験は、GDRTが言語バイアスを効果的に軽減し、推奨精度を大幅に改善することを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:35:26 GMT)
Robust Photoplethysmography Signal Denoising via Mamba Networks [19.1] 光胸腺撮影はウェアラブルの健康モニタリングに広く用いられているが、その信頼性はノイズやモーションアーティファクトによって劣化することが多い。
本稿では生理情報の保存に重点を置いたPSGの深層学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:47:44 GMT)
Agora: Trust Less and Open More in Verification for Confidential Computing [19.1] 本稿では,この課題を克服するために設計された新しいバイナリ検証サービスであるAGORAを紹介する。
あるタスクは信頼できないエンティティに委譲でき、対応するバリデーターは信頼されたコンピューティングベースに確実に格納される。
ブロックチェーンベースの新たな報奨金タスクマネージャを通じて、クラウドソーシングを使用して、定理証明者の信頼を取り除く。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:46:18 GMT)
Enhancing Large Language Model Reasoning via Selective Critical Token Fine-Tuning [18.9] 大規模言語モデル (LLM) は主に、数学的推論のようなドメイン固有のタスクに事前訓練されたモデルを適用するために、教師付き微調整 (SFT) に依存している。
標準SFTは全てのトークンを一様に罰し、臨界トークンの小さなサブセットだけが推論の正しさを決定することを無視する。
本稿では, 機能的に欠かせないトークンのみを, 対向的摂動によって更新する, 単純かつ効果的なアプローチであるCritical Token Fine-tuning(CFT)を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:25:36 GMT)
Judge Before Answer: Can MLLM Discern the False Premise in Question? [18.9] 疑似前提問題のベンチマークを構築するために,完全に自動化されたパイプラインを導入する。
本手法は,施設の特定に必要な能力に応じて,施設を3つの主要タイプと13のサブタイプに体系的に分類する。
本ベンチマークに基づいて,MLLMの強靭性を強化し,虚偽の前提を検出するための認識強化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:17:00 GMT)
Redundancy as a Structural Information Principle for Learning and Generalization [18.8] 不効率ではなく,情報組織の基本的特性としての冗長性を再定義する。
冗長性は上と下の両方に有界であり、最適平衡をもたらすことを示す。
これらの結果は、コミュニケーションの世界と学習の有限世界を橋渡しする測定可能で調整可能な量として冗長性を確立する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:55:37 GMT)
Detecting Gender Stereotypes in Scratch Programming Tutorials [18.7] プログラミングコースにおけるジェンダーステレオタイプはしばしば気付かないが、若い学習者の興味や学習に悪影響を及ぼす可能性がある。
文字,内容,指示,プログラミング概念を考慮した性別バイアス評価フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:04:26 GMT)
Repurposing Annotation Guidelines to Instruct LLM Annotators: A Case Study [18.7] 既存のアノテーションガイドラインは、テキストアノテーションタスクのための大きな言語モデル(LLM)アノテーションを指示するために再利用することができる。
本稿では,ガイドラインをLCMの明確な指示に変換するモデレーション指向のガイドライン検索手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:07:58 GMT)
A Flexible Multi-Agent Deep Reinforcement Learning Framework for Dynamic Routing and Scheduling of Latency-Critical Services [18.7] 既存のネットワーク制御ソリューションの多くは平均遅延性能のみを目標としており、厳格なEnd-to-End(E2E)ピークレイテンシ保証を提供していない。
本稿では,MA-DRL(Multi-Agent Deep Reinforcement Learning)の最近の進歩を生かして,適用期限内にパケットを確実に届けることの課題に対処する。
本稿では,集中型ルーティングと分散スケジューリングアーキテクチャを活用したMA-DRLネットワーク制御フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:38:10 GMT)
Ensembling Large Language Models to Characterize Affective Dynamics in Student-AI Tutor Dialogues [18.5] 本研究は、教師対話における大規模感情センシングのための最初のアンサンブル・LLMフレームワークを紹介する。
我々は、PyTutor(AI教師)と、米国の3つの機関における261人の学部生の間で交わされた16,986の会話型ターンの2つのセミメータについて分析した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:43:56 GMT)
Rethinking Reward Miscalibration of GRPO in Agentic RL [18.5] 結果に基づく報酬は、これらの欠陥のある中間ステップに対して期待される負の優位性を保証することを示す。
我々は,善悪行為の埋め込みを分離するために,善悪行為を分類するアクターの訓練を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:28:52 GMT)
Saten: Sparse Augmented Tensor Networks for Post-Training Compression of Large Language Models [18.3] 微調整中の低ランクテンソル化大言語モデル(LLM)について検討し,その性能向上を目的とした疎拡張テンソルネットワーク(Saten)を提案する。
実験により,ソルテンはテンソル化言語モデルにおける精度と圧縮効率を両立させ,最先端性能を実現することを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:57:05 GMT)
Forward-Forward Autoencoder Architectures for Energy-Efficient Wireless Communications [18.2] フォワードフォワード(FF)学習は、バックプロパゲーション(BP)アルゴリズムの効率的な代替手段である。
そのいくつかの利点の中で、FF学習は通信チャネルの差別化を必要としない。
付加的な白色ガウス雑音とレイリーブロック消音チャネルに対するそれらの性能を数値的に評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:54:50 GMT)
A Black-Box Debiasing Framework for Conditional Sampling [18.1] 条件付きサンプリングはベイズ統計学および生成モデルにおける基本的な課題である。
本稿では,このようなナイーブなプラグインアプローチの精度を向上させるブラックボックスデバイアス方式を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:11:27 GMT)
Evaluating Open-Source Vision-Language Models for Multimodal Sarcasm Detection [18.1] マルチモーダル・サルカズムを検出する能力に基づいて、7つの最先端の視覚言語モデル(VLM)を評価した。
また、サーカシックインスタンスの説明を生成する際のモデルの能力についても評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:05:21 GMT)
Can Tool-Integrated Reinforcement Learning Generalize Across Diverse Domains? [18.1] 多様な領域にまたがるツール強化強化学習の一般化はいまだ検討されていない。
本稿では,ドメインに依存しない学習とスキルマイグレーションを促進するためのツール一般化強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:19:13 GMT)
DKPMV: Dense Keypoints Fusion from Multi-View RGB Frames for 6D Pose Estimation of Textureless Objects [18.0] 我々は,高密度キーポイントレベルの融合を実現するパイプラインDKPMVを提案する。
我々は,注目集約と対称性を考慮した学習により,キーポイントネットワークを強化した。
ROBIデータセットの実験により、DKPMVは最先端のマルチビューRGBアプローチより優れていることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:45:55 GMT)
Unified Multi-Modal Interactive & Reactive 3D Motion Generation via Rectified Flow [18.0] マルチモーダルな2人動作生成のためのフレームワークであるDualFlowを紹介する。
テキスト、音楽、先行の動作シーケンスを含む様々な入力で動きを合成する。
時間的にコヒーレントでリズミカルに同期した動作を生成し、マルチモーダルな人間の動作生成において最先端の動作を設定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:22:56 GMT)
$How^{2}$: How to learn from procedural How-to questions [17.9] エージェントがハウツー質問をし、回答を保存し、対話型環境での生涯学習のために再利用することを可能にする、メモリエージェントフレームワークである$How2$を紹介した。
我々は、インベントリアイテムを操作することで、エージェントが組み立てタスクを完了しなければならないMinecraftの工芸環境であるPlancraftにおいて、我々のアプローチを評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:35:20 GMT)
Protenix-Mini+: efficient structure prediction model with scalable pairformer [17.8] Protenix-Mini+はProtenixモデルの軽量でスケーラブルなバージョンである。
許容範囲のパフォーマンス劣化の範囲内では、計算効率を大幅に改善する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:54:35 GMT)
TranSUN: A Preemptive Paradigm to Eradicate Retransformation Bias Intrinsically from Regression Models in Recommender Systems [17.8] そこで本研究では,モデルから内在的にバイアスを除去するプリエンプティブ・パラダイムを提案する。
理論的に保証された不偏性を提供するために, 共同バイアス学習法を用いて新しいTranSUN法を提案する。
総合的な実験結果から,様々な領域のデータにまたがる手法の優位性が示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:05:05 GMT)
Phys2Real: Fusing VLM Priors with Interactive Online Adaptation for Uncertainty-Aware Sim-to-Real Manipulation [17.8] Phys2Realは、視覚言語モデル(VLM)を推論した物理パラメータ推定と、不確実性を考慮した融合による対話的適応を組み合わせた、リアルからシミュレート・トゥ・リアルなRLパイプラインである。
提案手法は,(1)3次元ガウススプラッティングによる高忠実度幾何再構成,(2)物理パラメータによるVLM推定,(3)相互作用データからのオンライン物理パラメータ推定の3要素からなる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:51:23 GMT)
How Effective Are Time-Series Models for Rainfall Nowcasting? A Comprehensive Benchmark for Rainfall Nowcasting Incorporating PWV Data [17.7] RainfallBench(レインフォールベンチ)は、降雨用に設計されたベンチマークである。
このデータセットは、6つの必須変数の15分間隔で記録された5年間の気象観測から導かれる。
我々はRainfallBenchで6つの主要なアーキテクチャで20以上の最先端モデルを評価した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:17:07 GMT)
ABLEIST: Intersectional Disability Bias in LLM-Generated Hiring Scenarios [17.5] 大規模言語モデル(LLMs)は、特に障害者(PwD)に対する雇用のような高い領域におけるアイデンティティに基づく差別の永続性について精査されている。
我々は、多様な障害、性別、国籍、およびキャストプロファイルにまたがる2,820人の雇用シナリオにまたがる6つのLCMの総合的な監査を行う。
微妙な交叉障害と偏見を捉えるために,障害研究の文献に根ざした5つの交叉障害と3つの交叉障害のセットであるABLEISTを導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:18:23 GMT)
Neural Weight Compression for Language Models [17.5] ニューラルウェイト圧縮(NWC)は,ニューラルモデル重み圧縮アルゴリズムである。
NWCは、特に4-6ビットの精度で、競争または最先端の精度圧縮トレードオフを達成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:16:20 GMT)
HatLLM: Hierarchical Attention Masking for Enhanced Collaborative Modeling in LLM-based Recommendation [17.3] HatLLMは、シーケンシャルレコメンデーションのための大規模言語モデル(LLM)の階層的なアテンションマスキング戦略である。
HatLLM は既存の LLM ベースの手法よりも大きなパフォーマンス向上(平均 9.13% )を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:05:03 GMT)
Learning to Watermark: A Selective Watermarking Framework for Large Language Models via Multi-Objective Optimization [17.2] 既存の透かし技術は、しばしば透かし検出性と生成されたテキスト品質の間のトレードオフに直面している。
本稿では,新しい選択型透かしフレームワークであるLearning to Watermark (LTW)を紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:07:38 GMT)
Ego-Vision World Model for Humanoid Contact Planning [17.1] 本稿では,学習世界モデルとサンプリングベースモデル予測制御を組み合わせたフレームワークを提案する。
本システムは,プロプレセプションとエゴ中心の深度画像から,堅牢でリアルタイムな接触計画を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:47:39 GMT)
SAGE: A Top-Down Bottom-Up Knowledge-Grounded User Simulator for Multi-turn AGent Evaluation [17.1] マルチターンアジェント評価のための新しいユーザシミュレーションフレームワークであるSAGEを提案する。
SAGEには、理想的な顧客プロファイルのようなビジネスロジックに根ざしたトップダウンの知識が組み込まれています。
このアプローチはより現実的で多様なインタラクションを生み出し、最大で33%のエージェントエラーを識別する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:52:17 GMT)
A Survey on Automatic Credibility Assessment Using Textual Credibility Signals in the Era of Large Language Models [17.1] ソーシャルメディアと生成AIの時代、オンラインコンテンツの信頼性を自動的に評価する能力はますます重要になっている。
信頼性評価は、様々な信頼性信号を最終的な信頼性ラベル/スコアに集約することに依存する。
複数の信頼性信号を同時に検出し、集約するアプローチは少ない。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:25:29 GMT)
Personality Editing for Language Models through Adjusting Self-Referential Queries [17.1] PALETTE(Personality Adjustment by LLM SElf-TargeTed queries)は,Large Language Models(LLMs)における人格編集の新しい手法である。
本手法では,心理的構成に根ざした自己参照文を事実知識と類似して扱う調整クエリを導入し,人格関連応答の直接編集を可能にする。
PALETTEは微調整とは異なり、パーソナリティ次元を横断するパーソナリティアライメントの大幅な改善を達成するために、12の編集サンプルしか必要としない。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:53:27 GMT)
Multimodal Disease Progression Modeling via Spatiotemporal Disentanglement and Multiscale Alignment [16.8] $textttDiPro$は、リージョン対応のアンタングルメントとマルチタイムアライメントによる課題に対処する新しいフレームワークである。
MIMICデータセットの実験では、$textttDiPro$が時間的臨床的ダイナミクスを効果的に抽出できることが示されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:02:36 GMT)
DiaCDM: Cognitive Diagnosis in Teacher-Student Dialogues using the Initiation-Response-Evaluation Framework [16.5] DiaCDMは、対話における生徒の認知状態を評価するツールである。
我々は,対話に適した診断枠組みを設計するために,IRE(Initiation-Response-evaluation)フレームワークを教育理論から応用した。
3つの実世界の対話データセットの実験により、DiaCDMは診断精度を大幅に向上するだけでなく、結果の解釈可能性も向上することを確認した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:30:07 GMT)
MPCitH-based Signatures from Restricted Decoding Problems [16.4] MPCitHとVOLE-in-the-Headフレームワークに制限付き復号問題を埋め込む。
競合する署名サイズを実現する構造的簡易なモデリングを提案する。
我々はNISTコンペティションにおいて最小のMPCitHベースの候補に匹敵する署名サイズを得る。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:09:32 GMT)
A Comprehensive Survey of Website Fingerprinting Attacks and Defenses in Tor: Advances and Open Challenges [16.1] Torネットワークは、複数のリレーを介してインターネットトラフィックをルーティングすることで、強力な匿名性を提供する。
Torはトラフィックを暗号化してIPアドレスを隠すが、Webサイトフィンガープリント(WF)攻撃のようなトラフィック分析攻撃には弱いままである。
本稿では,既存のWF研究を,データセット,アタックモデル,防衛機構の3つの重要な領域に分類する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:03:05 GMT)
Can LLMs Handle WebShell Detection? Overcoming Detection Challenges with Behavioral Function-Aware Framework [16.0] WebShellの攻撃は、重大なサイバーセキュリティの脅威となる。
従来のMLとDLメソッドは、広範囲なトレーニングデータの必要性などの課題によって、しばしば妨げられる。
コード関連タスクの強力な代替手段として、大規模言語モデルが登場しました。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:58:10 GMT)
LearnLens: LLM-Enabled Personalised, Curriculum-Grounded Feedback with Educators in the Loop [16.0] LearnLensはLLMベースのモジュラーシステムで、科学教育において個人化されたカリキュラムに沿ったフィードバックを生成する。
既存のシステムにおける重要な課題に対処し、スケーラブルで高品質なフィードバックを提供し、教師と学生の両方に力を与える。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:06:55 GMT)
Hallucinate at the Last in Long Response Generation: A Case Study on Long Document Summarization [15.8] 幻覚は、生成された長い反応の後半部分に不均等に集中する傾向がある。
我々は、長いシーケンス上での注意と復号のダイナミクスに関連する潜在的寄与要因について検討する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:24:08 GMT)
R-WoM: Retrieval-augmented World Model For Computer-use Agents [15.8] 大規模言語モデル(LLM)は、デジタル環境におけるエージェントの意思決定を強化する世界モデルとして機能する。
未来予測と報奨推定という,世界モデルの2つのコア機能について,三つの課題を通して検討する。
本稿では,外部チュートリアルから得られた現実的,最新の知識を取り入れたRetrieval-augmented World Model (R-WoM)を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:52:04 GMT)
A Framework for Low-Effort Training Data Generation for Urban Semantic Segmentation [15.5] 合成データセットは都市景観認識モデルの訓練に広く利用されているが、リアルなレンダリングでさえ、実際の画像に顕著なギャップがあることを示している。
本稿では,不完全な擬似ラベルのみを用いて,既成拡散モデルを対象ドメインに適応させる新しいフレームワークを提案する。
合成データセットのセマンティックマップから高忠実で目標に沿った画像を生成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:12:29 GMT)
FedLoRA-Optimizer: Federated LoRA Fine-Tuning with Global and Local Optimization in Heterogeneous Data Scenarios [15.4] Low-Rank Adaptation (LoRA)は、事前訓練されたモデルの効率的な微調整を可能にする。
既存の連合LoRA技術は、チューニング行列のきめ細かい解析を見落としている。
細粒度化したLoRAチューニング手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:06:36 GMT)
AMSbench: A Comprehensive Benchmark for Evaluating MLLM Capabilities in AMS Circuits [15.4] AMSbenchはマルチモーダル大言語モデル(MLLM)を評価するためのベンチマークスイートである。
本評価は,現在のMLLMにおいて重要な限界を浮き彫りにしたものである。
これらの結果は、MLLMの理解を深め、回路固有の知識を効果的に適用する必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:48:52 GMT)
WaveletDiff: Multilevel Wavelet Diffusion For Time Series Generation [15.3] WaveletDiffは、時系列データ固有の多重解像度構造を利用するために、ウェーブレット係数上で拡散モデルを直接訓練する新しいフレームワークである。
最先端の時間領域と周波数領域の生成手法を5つの異なるパフォーマンス指標で比較すると、一貫して性能が向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:47:33 GMT)
StoryBox: Collaborative Multi-Agent Simulation for Hybrid Bottom-Up Long-Form Story Generation Using Large Language Models [15.2] 本稿では,ハイブリッドボトムアップ・ロングフォーム・ストーリー・ジェネレーションと呼ばれる,ロングフォーム・ストーリー・ジェネレーションに対する新しいアプローチを提案する。
本手法では,エージェントが動的サンドボックス環境内で相互作用し,その動作と相互作用が創発的な事象を発生させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:57:32 GMT)
Diffusion-DFL: Decision-focused Diffusion Models for Stochastic Optimization [15.1] 決定中心学習(DFL)は、予測器を訓練することで予測モデリングと最適化を統合し、下流の意思決定目標を最適化する。
本稿では,不確かさパラメータの分布を表すために拡散モデルを訓練するDFL法を提案する。
我々の拡散DFLアプローチは、決定品質の強いベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:31:17 GMT)
Beyond [cls]: Exploring the true potential of Masked Image Modeling representations [15.1] Masked Image Modeling (MIM) は視覚表現の自己監督学習(SSL)のための有望なアプローチとして登場した。
しかし、MIMのアウト・オブ・ボックス性能は競合するアプローチよりも劣る。
ほとんどのユーザは、大量のデータ、高いGPU消費、特別なユーザー知識を必要とするため、微調整はできません。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:50:31 GMT)
TCP: a Benchmark for Temporal Constraint-Based Planning [15.0] 時間的推論と計画は、大きな言語モデルにとって不可欠な機能である。
両機能を共同で評価する時間制約に基づく計画ベンチマークを導入する。
我々は、最先端のLCMを評価し、最強のモデルでさえTCPに苦しむことを発見した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:45:30 GMT)
Rethinking the Residual Distribution of Locate-then-Editing Methods in Model Editing [15.0] モデル編集は、大規模言語モデルの知識をターゲットとする更新を可能にする。
location-then-editメソッドはまず重要なレイヤを識別し、ターゲットの編集に基づいて最後のクリティカルレイヤで残余を計算する。
これらの手法のコアメカニズムである残留分布は、編集精度を損なう重みシフト誤差をもたらす。
そこで我々は,位置列編集手法を強化するBLUE戦略を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:45:48 GMT)
Investigating Identity Signals in Conversational Facial Dynamics via Disentangled Expression Features [14.9] 本研究は,表情の純粋動的成分のみで個人を識別できるかどうかを考察する。
FLAMEの3次元形状モデルを用いて,顔の形状と表情のダイナミックスとの明確な絡み合いを実現する。
本研究は, 社会的認知と臨床評価に影響を及ぼす, 対話型顔力学における人特有の特徴を明らかにするものである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:06:25 GMT)
LogiNumSynth: Synthesizing Joint Logical-Numerical Reasoning Problems for Language Models [14.8] LogiNum Synthは、共同論理的推論において習熟を必要とするタスクを合成する自然言語問題シンセサイザーである。
推論の世界豊かさ、論理的推論深度、数値計算の複雑さに対するきめ細かい制御をサポートする。
診断ツールと、統合推論スキルの進歩のための目標監督のソースの両方として機能する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:01:02 GMT)
Evaluating noises of boson sampling with statistical benchmark methods [14.8] 量子計算の利点を慎重に示すためには,ノイズレベルを知ることが重要である。
相関器や雲などの統計的ベンチマーク手法を用いて,暗黒数で補正した光子偏微分率と光子損失のノイズを定量化する。
以上の結果から, ボソンサンプリングのノイズ評価には, 統計的ベンチマーク手法が有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:00:07 GMT)
FM-IRL: Flow-Matching for Reward Modeling and Policy Regularization in Reinforcement Learning [14.8] Flow Matching (FM) は、複雑な分布をモデル化する際、顕著な能力を示している。
FMベースの政策は、本質的に環境相互作用と探索の欠如によって制限されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:31:50 GMT)
Vision-LLMs for Spatiotemporal Traffic Forecasting [14.7] 大規模言語モデル(LLM)は、グリッドベースのトラフィックデータの複雑な空間的依存関係をモデル化するのに本質的に苦労する。
本稿では,視覚言語融合問題として時間的予測を行う新しいフレームワークであるST-Vision-LLMを提案する。
また,ST-Vision-LLMでは,長期予測精度が15.6%向上し,クロスドメインシナリオでは30.04%以上向上した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:15:56 GMT)
Gelina: Unified Speech and Gesture Synthesis via Interleaved Token Prediction [14.7] 本稿では,テキストから音声と共同音声のジェスチャーを共同で合成する統合フレームワークであるGelinaを紹介する。
Gelinaはマルチスピーカーとマルチスタイルのクローンをサポートし、音声入力からジェスチャーのみの合成を可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:51:26 GMT)
Cog-Rethinker: Hierarchical Metacognitive Reinforcement Learning for LLM Reasoning [14.6] LLM推論のための新しい階層的メタ認知的RLフレームワークであるCog-Rethinkerを提案する。
我々のCog-Rethinkerは主にRLトレーニングのロールアウト手順に焦点を当てています。
問題解決において人間の認識を活用することにより、ゼロ精度の問題をサブプロブレムに分解するようポリシーに促す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:16:21 GMT)
Contrastive Dimension Reduction: A Systematic Review [14.6] コントラスト次元低減法(Contrastive dimension reduction, CDR)は、コントロール(背景)グループに対して、治療(地上)グループに特有の信号の抽出または濃縮を目的としている。
本稿では,既存のCDR手法について概観する。
我々は、既存のCDR手法における重要な応用と課題を強調し、オープンな質問と今後の方向性を特定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:58:46 GMT)
TetriServe: Efficient DiT Serving for Heterogeneous Image Generation [14.5] Diffusion Transformer (DiT) モデルは、反復的なデノゲーションステップによって高品質な画像を生成するのに優れている。
しかし、厳格なサービスレベルオブジェクト(SLO)の下でそれらを提供するのは、高い計算コストのために難しいです。
本稿では、高効率な画像生成のためにこの戦略を実装したDiTサービスシステムTetriServeを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:16:25 GMT)
Bridging Developer Instructions and Code Completion Through Instruction-Aware Fill-in-the-Middle Paradigm [14.4] Instruction-aware Fill-in-the-Middle (IFIM)を導入し、コード補完モデルを強化する。
IFIMは明示的な命令セクションを入力に組み込んで、モデルが三つ子から学習できるようにする。
その結果、IFIMは命令フォロー機能を大幅に改善し、Pass@1スコアは84.6%から93.6%に向上した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:21:45 GMT)
Text-Enhanced Panoptic Symbol Spotting in CAD Drawings [14.4] CAD自動化や設計検索といった下流アプリケーションを実現する上で、パノプティカルシンボルスポッティングは重要な役割を担っている。
既存の手法は主にCAD図面内の幾何学的プリミティブに焦点を当てている。
テキストアノテーションを組み込んだパノプティカルシンボルスポッティングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:41:15 GMT)
QLENS: Towards A Quantum Perspective of Language Transformers [14.3] 本稿では、Transformer生成プロセスにおける物理に基づく視点開発のための新しい試みであるQLENSを紹介する。
QLENSの下では、Transformerはモデルの出力単位から派生したヒルベルト空間の潜在活性化を状態ベクトルに変換することによって研究される。
モデルの最終確率分布は、特定の測定演算子を用いてボルン則を終状態に適用することにより得られる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:53:05 GMT)
Learning Shared Representations from Unpaired Data [14.2] 共有表現は、ほとんどペアリングされていないデータから学習可能であることを示す。
コンピュータビジョンと自然言語処理領域の実証的な結果は、その可能性を支持する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:35:27 GMT)
Learned Display Radiance Fields with Lensless Cameras [14.2] 本研究では,レンズレスカメラとインプシットニューラル表現に基づくアルゴリズムを共同設計し,様々な視点から表示特性を捉える。
我々のパイプラインは、46.6deg X 37.6degのビューングコーンからディスプレイから放出される光電界の効率的な再構成を可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:18:28 GMT)
Event-Aware Prompt Learning for Dynamic Graphs [14.2] イベント対応動的グラフプロンプト学習フレームワークであるEVPを提案する。
本稿では,これらのイベントの微粒化特性を下流タスクと整合させるイベント適応機構を提案する。
次に,歴史的知識をノード表現に効果的に統合するイベント集約機構を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:37:53 GMT)
Q-Router: Agentic Video Quality Assessment with Expert Model Routing and Artifact Localization [14.1] ビデオアセスメント(VQA)は、人間の判断に沿った映像の品質を予測することを目的としている。
マルチ層ルーティングモデルシステムを用いた汎用VQAのためのエージェントフレームワークQ-C-Benchを提案する。
Q-C-ベンチは、様々なベンチマークで最先端のVQAモデルと一致または超え、一般化と解釈性を大幅に改善する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:16:11 GMT)
Lightweight Facial Landmark Detection in Thermal Images via Multi-Level Cross-Modal Knowledge Transfer [13.9] 熱画像における顔のランドマーク検出は、難解な照明条件に適用するために重要である。
モデル圧縮から高忠実度RGB-熱的知識伝達を分離する新しいフレームワークを提案する。
実験により,本手法は,特に従来の手法よりも優れる公立熱FLDベンチマークに新たな最先端の手法を設定できることが確認された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:19:56 GMT)
ChatThero: An LLM-Supported Chatbot for Behavior Change and Therapeutic Support in Addiction Recovery [13.9] 物質使用障害(SUD)は何百万人もの人に影響を与え、再発は一般的である。
ケアへのアクセスは制限されており、回復支援の課題に貢献する。
textbfChatTheroは、革新的な低コスト、マルチセッション、ストレスアウェア、メモリパーシスタントな自律言語エージェントである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:15:35 GMT)
LPCVAE: A Conditional VAE with Long-Term Dependency and Probabilistic Time-Frequency Fusion for Time Series Anomaly Detection [13.8] 時系列異常検出は信号処理分野において重要な課題である。
本稿では,長期依存性と確率的時間-周波数融合を有する変分オートエンコーダを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:27:04 GMT)
SAVeD: Learning to Denoise Low-SNR Video for Improved Downstream Performance [13.8] 低信号対雑音比ビデオはコンピュータビジョンモデルに重大な課題をもたらす。
下流作業用ビデオ(SAVeD)における時空間増強とデノナイジングについて述べる。
SAVeDは、生ノイズデータのみを用いて低SNRセンサ映像をノイズ化する、新しい自己教師方式である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:16:27 GMT)
Learning the Structure of Connection Graphs [13.7] 接続グラフ(CG)は、ネットワークトポロジーと変換を結合することで従来のグラフモデルを拡張し、グローバルな幾何学的一貫性の表現を可能にする。
本稿では,ラプラシアン接続と基礎となるラプラシアンをリンクするスペクトル特性を強制する,一貫した仮定の下での最大擬似構造に基づく原理的枠組みを提案する。
本稿では,ネットワークトポロジ,エッジウェイト,幾何学的構造を共同推論するブロック最適化手法であるStructured Connection Graph Learning (SCGL)アルゴリズムを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:33:31 GMT)
Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges [13.5] 大型言語モデル(LLM)は、自然言語を使って情報を統合し、指示に従い、推論と計画の形式を実行することができる。
マルチモーダルなデータストリームと複数のシステムにまたがるオーケストレーションによって、ラジオロジーはコンテキストに適応し、繰り返しながら複雑なタスクを自動化するエージェントの恩恵を受けるのに一意に適している。
本稿では, LLMエージェントシステムの設計を概観し, 主要なアプリケーションを強調し, 計画とツール使用の評価方法について議論し, エラーカスケード, ツール使用効率, 健康IT統合といった課題の概要を述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:11:22 GMT)
Enhancing XAI Narratives through Multi-Narrative Refinement and Knowledge Distillation [13.5] カウンターファクトな説明は、予測を変える最小限の変更を強調することによって、モデル行動に関する洞察を提供する。
その可能性にもかかわらず、これらの説明はしばしば複雑で技術的であり、非専門家が解釈することを困難にしている。
本稿では,大規模・小規模の言語モデルを用いた新しいパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:50:02 GMT)
Systematic Prevention of On-Core Timing Channels by Full Temporal Partitioning [13.3] 本稿では,脆弱なミクロ構造体をクリアするために必要なメカニズムを提供する,時間的フェンス命令フェンス.tを紹介する。
我々は、seL4マイクロカーネルの実験バージョンに fence.tを実装し、64ビットRISC-VコアであるCVA6を実装した。
すべての非構造コアコンポーネントの完全かつ体系的なISAサポートの消去が、最も効果的な実装であることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:32:37 GMT)
LLM-Empowered Agentic MAC Protocols: A Dynamic Stackelberg Game Approach [13.3] ゲーム理論のLLMを用いたマルチエージェントDRL(MARL)フレームワークを提案する。
基地局と各種ユーザ機器間のアップリンク伝送は、動的マルチフォローラー・スタックルバーグゲーム(MFSG)としてモデル化される。
このゲームの中で、LLM駆動エージェントは、近似ポリシー最適化(PPO)を通じて調整され、適応的セマンティックMACプロトコルを合成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:47:24 GMT)
ELMO: Efficiency via Low-precision and Peak Memory Optimization in Large Output Spaces [13.2] エクストリームマルチラベル分類のための低精度トレーニングフレームワークを提案する。
低精度トレーニングと提案されたメモリ最適化を組み合わせることで、GPUメモリ使用量の大幅な削減が可能になる。
例えば、最適化SOTA法で要求される39.7 GiBと比較して、GPUメモリの6.6 GiBしか持たない300万ラベルのXMCモデルを訓練する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:59:13 GMT)
GRAVITY: A Framework for Personalized Text Generation via Profile-Grounded Synthetic Preferences [13.0] GRAVITYは、合成されたプロファイル付き嗜好データを生成するためのフレームワークである。
好みのペアを合成して、パーソナライズされたコンテンツ生成をガイドする。
我々は,400人のAmazonユーザを対象に,書籍記述におけるGRAVITYを評価した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:23:46 GMT)
MoEs Are Stronger than You Think: Hyper-Parallel Inference Scaling with RoE [13.0] トークンレベルでの予測品質を改善する補完的なフレームワークであるハイパー並列スケーリングを導入する。
この概念をMixture-of-Experts(MoE)モデルで実装し、Roster of Experts(RoE)と呼ぶ。
RoEはトレーニング不要な推論アルゴリズムで、単一のMoEをMoEのダイナミックアンサンブルに変換する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:48:37 GMT)
Flows, straight but not so fast: Exploring the design space of Rectified Flows in Protein Design [12.8] Rectified Flows (ReFlow) は,所定の目標品質の NFE を大幅に削減できることを示す。
タンパク質のバックボーン生成のための事前訓練SE(3)フローマッチングモデルの低NFE性能を改善するためにReFlowを適用した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:36:40 GMT)
Tight Regret Upper and Lower Bounds for Optimistic Hedge in Two-Player Zero-Sum Games [12.6] ゼロサムゲームにおいて、楽観的なヘッジに基づく学習力学は、最もよく知られた後悔の上界の1つを達成する。
本研究は,楽観的ヘッジを後悔した$m$および$n$への依存の最適性について検討する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:52:01 GMT)
Chronological Passage Assembling in RAG framework for Temporal Question Answering [12.6] 物語テキストに特化した新しいRAGフレームワークであるChronoRAGを提案する。
このアプローチは、分散文書情報をコヒーレントかつ構造化されたパスに精製する、2つの重要な側面に焦点を当てる。
我々はNarrativeQAとGutenQAdatasetの実験を通してChronoRAGの有効性を実証的に実証した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:11:35 GMT)
Posterior Sampling for Continuing Environments [12.5] 強化学習のための後部サンプリングの拡張(PSRL)を開発する。
我々は、統計的に妥当な環境モデルを維持し、予測される$gamma$-discounted returnをそのモデルで最大化するポリシーに従う。
私たちの研究は、ランダムな探索によって再サンプリングアプローチを形式化し、厳格に分析する最初のものです。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:49:37 GMT)
MS-Mix: Unveiling the Power of Mixup for Multimodal Sentiment Analysis [12.5] マルチモーダル感性分析(MSA)は異種データソースからの情報を統合することで人間の感情を識別・解釈することを目的としている。
混合に基づく拡張は、一助課題の一般化を改善するが、MSAへの直接適用は重要な課題をもたらす。
マルチモーダル環境で自動的にサンプルミキシングを最適化する,適応的で感情に敏感な拡張フレームワークであるMS-Mixを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:23:32 GMT)
Valid Survey Simulations with Limited Human Data: The Roles of Prompting, Fine-Tuning, and Rectification [12.5] 本研究では,大規模言語モデルを用いて調査応答を生成する合成手法と,人口推定を損なう補正手法の相互作用について検討する。
その結果, 合成だけではかなりのバイアス(24~86%)が生じるのに対し, 改質と組み合わせることで5%未満のバイアスが減少し, 有効試料径が最大14%増加することがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:48:07 GMT)
K-ASTRO: Structure-Aware Adaptation of LLMs for Code Vulnerability Detection [12.5] K-ASTROは、大規模言語モデルからのセマンティック埋め込みと抽象構文木(AST)の構造的特徴を組み合わせた軽量なトランスフォーマーモデルで、コード脆弱性検出の効率と精度を向上させる。
提案手法では,突然変異検査にインスパイアされたASTベースの拡張手法,拡張AST機能を組み込んだ構造認識型アテンション機構,コードセマンティクスと構文を統一する共同適応パイプラインを導入している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:24:55 GMT)
sketch2symm: Symmetry-aware sketch-to-shape generation via semantic bridging [12.4] スケッチから幾何学的に一貫した3Dを生成する2段階生成法であるSketch2Symmを提案する。
本手法では,スケッチ・ツー・イメージ変換によるセマンティック・ブリッジングを導入し,スパース・スケッチ表現を充実させる。
提案手法は,既存のスケッチベース再構築手法に比べて,シャンファー距離,アースモーバー距離,Fスコアの面で優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:49:45 GMT)
The Easy Path to Robustness: Coreset Selection using Sample Hardness [12.4] 本稿では,サンプルの対向的脆弱性をテキスト硬度にリンクするフレームワークを提案し,トレーニングにおける平均入力勾配基準(AIGN)を用いて定量化する。
本稿では,AIGNの低いサンプルのみを保持するコアセット選択アルゴリズムであるEasyCoreを提案する。
我々は、EasyCore選択されたデータに基づいてトレーニングされたモデルが、競合するコアセット法でトレーニングされたモデルよりもはるかに高い逆精度を実現することを実証的に示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:28:16 GMT)
Information upper bounds in composite quantum systems [12.3] 量子系の本質的な情報は、量子状態を定義するために必要な情報を指す。
2-qubit 系の後部情報内容の上限は, 正確には 2 に等しいことを示す。
後続情報によって定義される$n$-qubitシステムの本質的な情報は、$n$classical bitsによって境界づけられていることが判明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:40:38 GMT)
Quantum and Classical Communication Complexity of Permutation-Invariant Functions [12.3] 置換不変ブール関数の量子的およびランダムな通信複雑性は(対数係数まで)2次同値であることを示す。
本研究は,通信複雑性に対するクエリ複雑性に関する最近の研究を拡張したものである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:29:16 GMT)
Mixup Helps Understanding Multimodal Video Better [12.3] マルチモーダルモデルは、学習を支配し、弱いモダリティの貢献を抑制する強力なモダリティを過度に適合させる傾向がある。
本稿では,多モード特徴量レベルでのMultimodal Mixup(MM)戦略を適用し,オーバーフィッティングを緩和する手法を提案する。
また,学習目標に対する相対的貢献に基づいて,各モードの混合比を動的に調整するバランスド・マルチモーダル・ミックスアップ(B-MM)を導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:53:25 GMT)
LouisKV: Efficient KV Cache Retrieval for Long Input-Output Sequences [12.1] キーバリュー(KV)キャッシュは、自動回帰モデルにおける冗長な計算の削減に成功している。
メモリオーバーヘッドが大幅に増加し、長時間のシナリオでの実際のデプロイメントが制限される。
既存のKV検索手法は,ページ単位の検索やページ単位の粗いKV管理によって,顕著な効率性と精度のボトルネックに悩まされている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:28:30 GMT)
A Comprehensive Review of Recommender Systems: Transitioning from Theory to Practice [12.0] Recommender Systems(RS)は、パーソナライズされたアイテムの提案を提供することで、ユーザーエクスペリエンスを高める上で重要な役割を果たす。
この調査は、2017年から2024年までのRSの進歩を包括的にレビューする。
この調査の第一の目的は、理論を実践と橋渡しすることである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:05:23 GMT)
Self-Training with Dynamic Weighting for Robust Gradual Domain Adaptation [12.0] 動的重み付き自己学習法(STDW)を提案する。
STDWは、GDA(Gradual Domain Adaptation)における堅牢性向上を目指す
本手法では,トレーニング中のソースとターゲットドメインの損失寄与を適応的にバランスする動的重み付け機構を導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:13:23 GMT)
Secret communication games and a hierarchy of quasiparticle statistics in 3 + 1D topological phases [11.9] 秘密通信チャレンジゲームの一群は、3次元トポロジカルフェーズにおける創発的準粒子統計の階層を自然に定義している。
勝利戦略は、最近提案された$R$-パラ粒子の特別なクラスを利用して、2人のプレイヤー間の非ローカルな秘密通信を可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:15:41 GMT)
PaperArena: An Evaluation Benchmark for Tool-Augmented Agentic Reasoning on Scientific Literature [11.8] 本研究では,大規模言語モデル(LLM)に基づくエージェントの評価ベンチマークであるPaperArenaを提案する。
研究上の疑問から、エージェントは推論や適切なツールとのインタラクションを通じて、複数の論文にまたがる多様なフォーマットを統合する必要がある。
実験の結果、高度に確立されたエージェントを駆動する最も先進的なLCMでさえ、平均精度は38.78%に過ぎなかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:10:39 GMT)
Basis-independent Coherence in Noninertial Frames [11.8] 比較的加速された観測者によって観測された自由ディラック場の2つのモード間の基底非依存の量子コヒーレンスについて検討する。
その結果, (i) モードAとBI間の基底非依存のコヒーレンスは, 加速度の増加とともに減少するが, 無限加速度の極限でも有限であり, (ii) ゼロ加速度では, モードA$と$B_II$のコヒーレンスは, 基底依存のコヒーレンスとは対照的にゼロであり, (iii) モードBIとBII間の基底非依存のコヒーレンスは, 加速度によらず一定であり, 凍結現象を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:25:02 GMT)
PrivTuner with Homomorphic Encryption and LoRA: A P3EFT Scheme for Privacy-Preserving Parameter-Efficient Fine-Tuning of AI Foundation Models [11.7] ファインチューニング(FT)は、トレーニング済みのAIファンデーションモデルを、より小さなターゲットデータセットでトレーニングすることでカスタマイズする手法である。
完全同型暗号化(FHE)を組み込んだPrivTunerスキームをLoRAに実装し,プライバシ保護を実現する。
実験により,我々のアルゴリズムは,異なるプライバシー要件に適応しながら,エネルギー消費を大幅に削減できることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:48:45 GMT)
Emergent continuous symmetry and ground-state factorization induced by long-range interactions [11.5] 破壊対称性の位相における低層励起が連続対称性を得る理論を提案する。
創発的連続対称性と保存則の顕著な結果は、基底状態における量子相関をゼロに制限することである。
我々の発見は、完全連結系と格子一般化における量子相転移の普遍的な特徴である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:20:32 GMT)
Uncertainty-Aware, Risk-Adaptive Access Control for Agentic Systems using an LLM-Judged TBAC Model [11.5] 本稿では,大規模言語モデル(LLM)を自律的かつリスクを意識した判断として利用することにより,タスクベースアクセス制御(TBAC)モデルを拡張した高度なセキュリティフレームワークを提案する。
このモデルは、エージェントの意図に基づいてアクセス制御決定を行うだけでなく、ターゲットリソースに関連する固有のテキストbfriskを明示的に考慮することによって、アクセス制御を決定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:52:33 GMT)
Precise Mobile Manipulation of Small Everyday Objects [11.5] 我々は,小型物体の操作を伴う精密な作業にモバイルマニピュレータが取り組むことができるクローズドループフレームワークであるServoing with Vision Models (SVM)を開発した。
SVMは最先端のビジョン基盤モデルを使用して、視覚サーボのための3Dターゲットを生成し、新しい環境で多様なタスクを可能にする。
72の異なるオブジェクトインスタンスを含む6つの建物にまたがる10の環境における大規模評価実験を行った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:08:12 GMT)
From Data to Rewards: a Bilevel Optimization Perspective on Maximum Likelihood Estimation [11.4] 生成モデルは現代の機械学習のバックボーンを形成し、テキスト、ビジョン、マルチモーダルアプリケーションにおける最先端システムを支える。
これらのアプローチは明示的な報酬信号に依存しており、実際には利用できないことが多く、高品質なデータセットのみがアクセス可能である場合に生成モデルをどのように整合させるかという問題を解き放つ。
そこでは、報酬関数を外部問題の最適化変数として扱い、政策勾配の目的が内部レベルを定義する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:24:41 GMT)
FG-CLIP 2: A Bilingual Fine-grained Vision-Language Alignment Model [11.4] FG-CLIP 2(FG-CLIP 2)は、英語と中国語の微妙なアライメントを促進するために設計された視覚言語モデルである。
提案手法は, 領域テキストマッチングや長大キャプションモデリングなど, きめ細かい監督手法を利用する。
長文検索とバウンディングボックスの分類を特徴とする中国語マルチモーダル理解のための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:32:07 GMT)
EEMS: Edge-Prompt Enhanced Medical Image Segmentation Based on Learnable Gating Mechanism [11.4] EEMSはエッジ・アウェア・エンハンスメント・ユニット(EAEU)とマルチスケール・プロンプト・ジェネレーション・ユニット(MSPGU)を組み合わせた。
EAEUは、多周波数特徴抽出によるエッジ認識を強化し、境界を正確に定義する。
MSPGUは、プロンプト誘導アプローチを用いて、高レベルの意味的特徴と低レベルの空間的特徴を統合する。
Dual-Source Adaptive Gated Fusion Unit (DAGFU)は、EAEUのエッジ機能をMSPGUのセグメンテーション機能と統合し、セグメンテーション精度と堅牢性を向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:21:57 GMT)
Embedding the Teacher: Distilling vLLM Preferences for Scalable Image Retrieval [11.2] 本稿では,強力な vLLM の選好ランクを埋め込み型システムに抽出するフレームワークを提案する。
ペルソナ主導の製品レコメンデーションタスクの実験では,本手法が既存の埋め込みベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:30:07 GMT)
SNAP: Towards Segmenting Anything in Any Point Cloud [11.2] インタラクティブな3Dセグメンテーションのための統一モデルである textbfSNAP (textbfSegment atextbfNything in textbfAny textbfPoint cloud) を提案する。
本手法は,屋内・屋外・空域にまたがる7つのデータセットをトレーニングすることにより,ドメイン間の一般化を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:07:00 GMT)
Evaluating multiple models using labeled and unlabeled data [11.2] Semi-Supervised Model Evaluation (SSME) は、ラベル付きデータとラベルなしデータの両方を用いて機械学習分類器を評価する手法である。
本研究では,(1)医療,(2)コンテンツモデレーション,(3)分子特性予測,(4)画像アノテーションの4つの領域において,ラベル付きデータセットの取得が非現実的であることを示す。
その結果,SSMEは競合する手法よりも精度が高く,ラベル付きデータのみを用いた場合に比べて誤差が5.1倍,競合する手法では2.4倍減少することがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:24:48 GMT)
Analytical Control of Quantum Coherence: Markovian Revival via Basis Engineering and Exact Non-Markovian Criteria [11.1] マルコフ環境はゼーマンエネルギーが$omega_k > pi/ (2t_max)$を満たすときにコヒーレンス回復を示すことができる。
非マルコフ環境に対しては、周期的かつ完全回復の正確な条件を提供する。
我々の結果は厳密な量子シミュレーションによって検証され、量子メモリの強化、センシング、エラー軽減のための戦略を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:46:27 GMT)
A Large-Language-Model Assisted Automated Scale Bar Detection and Extraction Framework for Scanning Electron Microscopic Images [11.1] マルチモーダルかつ自動スケールバー検出・抽出フレームワークを提案する。
オブジェクト検出、テキスト検出、およびLarge Language Model (LLM)エージェントによるテキスト認識を同時に提供する。
提案手法は,SEM画像におけるスケールバーの検出と抽出の効率と精度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:50:54 GMT)
Accurate and Diverse LLM Mathematical Reasoning via Automated PRM-Guided GFlowNets [10.9] モンテカルロ木探索を用いたプロセス・リワード・モデル(PRM)を提案する。
次に、生成フローネットワーク(GFlowNets)を推論ステップレベルで運用するように適応します。
経験的評価は、挑戦的な数学的ベンチマークにおいて、精度と解の多様性の両方が強く改善されていることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:39:21 GMT)
Evaluating the Explainability of Vision Transformers in Medical Imaging [10.9] 本研究では、異なるビジョントランスフォーマーアーキテクチャと事前学習戦略の説明可能性を評価する。
末梢血細胞分類と乳房超音波画像分類の2つの医療画像の定量的および定性的な解析を行った。
以上の結果から,DINOとGrad-CAMを組み合わせることで,データセット間の最も忠実で局所的な説明が可能になることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:53:26 GMT)
One Stone with Two Birds: A Null-Text-Null Frequency-Aware Diffusion Models for Text-Guided Image Inpainting [10.8] テキスト誘導画像のインペイントは、テキストプロンプトに従ってマスクされた領域を再構築することを目的としている。
我々は、テキスト誘導画像のインペイントのための、textbfNTN-Diffと呼ばれるNull-text-null周波数対応拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:49:07 GMT)
Lecture Notes on Verifying Graph Neural Networks [10.8] まず、グラフニューラルネットワークと一階述語論理や次数修飾論理などの論理との接続を思い出す。
次に、グラフニューラルネットワークの検証タスクを解決するために、線形不等式に数えるモーダル論理を提案する。
本稿では,その論理の満足度問題に対するアルゴリズムについて述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:57:20 GMT)
HoMer: Addressing Heterogeneities by Modeling Sequential and Set-wise Contexts for CTR Prediction [10.8] 逐次的および集合的コンテキストをモデル化するためのホモジニアス指向トランスフォーマーであるHoMerを提案する。
HoMerは、AUCメトリックで工業ベースラインを0.0099向上させ、CTR/RPMのようなオンラインビジネスメトリクスを1.99%/2.46%向上させています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:47:03 GMT)
Automatically Generating Questions About Scratch Programs [10.7] 確立したプログラム理解モデルをカバーするScratchコードに対して,30種類の質問セットを提案する。
我々は、LitterBox静的解析ツールを拡張して、与えられたScratchプログラムの対応する質問を自動的に生成する。
600,913のプロジェクトのデータセットでは、54,118,694の質問を自動的に生成しました。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:34:12 GMT)
Comparative Explanations via Counterfactual Reasoning in Recommendations [10.7] 提案手法は,提案する勧告に対する比較対実的説明法(CoCountER)である。
CoCountERはソフトスワップ操作に基づいて反ファクトデータを生成し、任意のペアの比較項目のレコメンデーションの説明を可能にする。
実証実験により、我々のアプローチの有効性が検証された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:31:03 GMT)
DSPO: Stable and Efficient Policy Optimization for Agentic Search and Reasoning [10.7] textbfDynamic-filter textbfSequence-level textbfPolicy textbfOptimization (DSPO)を導入する。
DSPOは、シーケンスレベルの最適化と動的サンプルフィルタリングによる堅牢なエージェントトレーニングのために設計された改良されたRLアルゴリズムである。
我々は、RLを通して純粋にモデルをトレーニングし、マルチターン探索と推論をインターリーブし、教師付きデモデータの必要性を回避した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:20:43 GMT)
Measuring Physical-World Privacy Awareness of Large Language Models: An Evaluation Benchmark [10.6] EAPrivacyは、エンボディエージェントの物理世界のプライバシー意識を定量化するために設計された総合評価ベンチマークである。
EAPrivacyは、4層にわたる手続き的に生成されたシナリオを使用して、エージェントの機密性のあるオブジェクト処理能力のテスト、環境の変化への適応、タスクの実行とプライバシの制約のバランス、社会的規範との矛盾の解決を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:24:22 GMT)
Not All Bits Are Equal: Scale-Dependent Memory Optimization Strategies for Reasoning Models [10.6] 4ビット量子化は、非推論モデルとスケールにわたるゼロショットタスクのメモリ最適選択として登場した。
モデルサイズではなくKVキャッシュがメモリを支配できるような推論モデルでは,この万能処方は失敗することを示す。
8ビットの4Bパラメータ未満の有効サイズを持つモデルでは、より長い生成ではなく、メモリをより多くの重みに割り当てることで、精度が向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:14:28 GMT)
Generative AI for Software Project Management: Insights from a Review of Software Practitioner Literature [10.5] 我々は、ブログ、記事、業界レポートを含む47の公開実践資料を用いて、グレーの文献レビューを行った。
ソフトウェアプロジェクトマネージャは、主に、GenAIを"PM代替"ではなく、"アシスタント"、"コパイロット"、"フレンド"だと認識している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:35:17 GMT)
AIReg-Bench: Benchmarking Language Models That Assess AI Regulation Compliance [10.5] AIシステムが所定のAI規則(AIR)に準拠しているかどうかを評価するために、LLM(Large Language Models)の使用に対する関心が高まっている。
最初のベンチマークデータセットであるAIReg-Benchを紹介します。これは、LLMがEU AI Act(AIA)のコンプライアンスをどの程度うまく評価できるかをテストするために設計されたものです。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:10:53 GMT)
Incentivize Contribution and Learn Parameters Too: Federated Learning with Strategic Data Owners [10.5] データ収集と分散アルゴリズムの実行はクライアントにとってコストがかかるため,プロセスへの参加とコントリビューションのためのエージェントのインセンティブを検討する。
本稿では,現在ある文献と区別する,同時パラメータ学習と貢献の真相的動機付けの問題に対処する。
実(フェデレートされた)データセット(CIFAR-10、FEMNIST、Twitter)による大規模な実験は、これらのアルゴリズムが実際に非常に高速に収束し、優れた福祉保証と、すべてのエージェントのモデルパフォーマンスが向上していることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:24:17 GMT)
Effectiveness of Counter-Speech against Abusive Content: A Multidimensional Annotation and Classification Study [10.5] CSの有効性分類のための新しい計算フレームワークを提案する。
我々のフレームワークは、明瞭さ、エビデンス、感情的魅力、反感、オーディエンス適応、フェアネスの6つの中核的な次元を定義しています。
さらに,マルチタスクと依存性ベースの2つの分類戦略を提案し,高い結果を得た。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:41:38 GMT)
Conjecturing: An Overlooked Step in Formal Mathematical Reasoning [10.4] 結論を導かない限り、多くの数学的問題は直接形式化できない。
本研究では,大規模言語モデルの導出能力を測定するためにConjectureBenchを開発した。
提案手法は,GPT-4.1と7とDeepSeek-V3.1の13のPutnamBench問題において,最初のエンドツーエンドの自動形式化を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:29:49 GMT)
SHERLOCK: Towards Dynamic Knowledge Adaptation in LLM-enhanced E-commerce Risk Management [10.3] 電子商取引会社は、不審な事件のリスク調査を行い、発覚した詐欺パターンを特定している。
ケース分析の膨大な量は、リスク管理アナリストにかなりの負荷を課します。
本稿では,大規模言語モデル(LLM)の推論機能を活用し,リスク調査におけるアナリストの支援を行うSHERLOCKフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:26:39 GMT)
Constrained Identifiability of Causal Effects [10.2] 本研究では,異なる種類の制約が存在する場合の因果的影響の同定について検討する。
制約の集合を古典的な識別可能性の定義への別の入力とする制約付き識別可能性の概念を定式化する。
我々は、このACベースのアプローチが、古典的識別可能性をテストするための既存のアルゴリズムと同程度に完全であることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:00:07 GMT)
Evolution in Simulation: AI-Agent School with Dual Memory for High-Fidelity Educational Dynamics [10.2] 大規模言語モデル(LLM)ベースのエージェントは、複雑な人間のシステムや相互作用をシミュレートし理解するためにますます重要になっている。
エージェントを利用して複雑な教育力学をシミュレーションする自己進化機構を中心に構築されたAI-Agent School(AAS)システムを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:27:53 GMT)
KOTOX: A Korean Toxic Dataset for Deobfuscation and Detoxification [10.2] オンラインコミュニケーションの急速な拡大に伴い、有害コンテンツは社会問題としてますます重要になっている。
LLM(Large Language Models)は、低リソース言語における有害な表現の識別と中和に苦慮することが多い。
我々は,脱臭・脱毒のための韓国毒素データセットtextbfKOTOXを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:12:37 GMT)
Inpainting the Neural Picture: Inferring Unrecorded Brain Area Dynamics from Multi-Animal Datasets [10.1] 我々は、記録されていない脳領域のダイナミクスを推測するためのマスク付きオートエンコーディングアプローチであるNeuroPaintを紹介した。
記録された領域の重複部分集合を持つ動物を訓練することで、NeuroPaintは個人間で共有された構造に基づいて、行方不明領域の活動を再構築することを学ぶ。
実験結果から, 部分的な観察により動物全体にわたって訓練されたモデルが, 記録されていない領域のダイナミックスをインペイントできることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:45:06 GMT)
Efficient and Robust Spatial-to-Fiber Coupling forMultimode Quantum Networks via CascadedAdaptive Feedback Control [10.1] 我々は、量子絡み込みソース作成経路に統合されたカスケード適応フィードバック制御システムを開発する。
単一モードファイバー(SMF)カップリングエフィシニートは20秒で70%以上増加し、75秒後に最も効率的で安定な伝送状態に入る。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:30:30 GMT)
TabAttackBench: A Benchmark for Adversarial Attacks on Tabular Data [10.1] アドリアックは入力データに対する知覚不能な摂動を通じて誤った予測を誘導する。
本研究では,データセットに対する敵攻撃を,有効性と非受容性の両方に関して評価するベンチマークを紹介する。
ベンチマークの結果は、より認識不能な敵攻撃を設計するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:56:19 GMT)
ProofFlow: A Dependency Graph Approach to Faithful Proof Autoformalization [10.0] 現在のアプローチでは、オリジナルの人間による議論の意味的意味と論理的構造を保存できない。
本稿では,構造的忠実度を主目的とする新しいパイプラインであるProofFlowを紹介する。
我々は184人の学部レベルの問題に対して,ステップバイステップのソリューションを手動でアノテートした新しいベンチマークを提示する。
また,構文的正しさ,意味的忠実度,構造的忠実度を評価するための新しい合成指標ProofScoreを導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:20:11 GMT)
Discrete-Time Diffusion-Like Models for Speech Synthesis [10.0] 本稿では,拡散様離散時間過程について検討し,新しい変種を提案する。
実験により、離散時間プロセスは、広く普及している連続的なプロセスと同等の主観的および客観的な音声品質を提供することが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:19:10 GMT)
On Convolutions, Intrinsic Dimension, and Diffusion Models [10.0] 多様体仮説は、画像データのような高次元の周囲空間における関心のデータは未知の低次元部分多様体上にあると主張する。
DMは低次元の支援で分布を学習できることが知られている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:59:41 GMT)
Coupled Degradation Modeling and Fusion: A VLM-Guided Degradation-Coupled Network for Degradation-Aware Infrared and Visible Image Fusion [9.9] VLM誘導劣化結合型核融合ネットワーク(VGDCFusion)を提案する。
我々のVGDCFusionは、様々な劣化した画像シナリオ下で、既存の最先端の融合アプローチよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:26:33 GMT)
SemCSE-Multi: Multifaceted and Decodable Embeddings for Aspect-Specific and Interpretable Scientific Domain Mapping [9.9] SemCSE-Multiは、科学的な抽象物の多面的な埋め込みを生成するための教師なしのフレームワークである。
提案手法は,アスペクト固有の要約文を生成し,埋め込みモデルを訓練する教師なしの手順に依存する。
埋め込みを関連する側面の自然言語記述に復号する埋め込み復号パイプラインを導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:38:20 GMT)
Statistical Guarantees for High-Dimensional Stochastic Gradient Descent [9.7] 定常学習速度SGDとASGDの高次元状態における厳密な統計的保証を提供する。
提案フレームワークは,多種多様な高次元学習アルゴリズムを解析するための新しいツールキットを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:27:56 GMT)
Automated Machine Learning for Unsupervised Tabular Tasks [9.7] LOTUSは、複数の教師なし機械学習タスクに対してモデル選択を実行する方法である。
我々は、LOTUSが複数の教師なしMLタスクのモデル選択に向けた、非常に有望な第一歩であることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:27:23 GMT)
Surface-Aware Distilled 3D Semantic Features [9.6] ポーズアライメント、アニメーション、モーショントランスファー、そして3D再構成といった多くの3Dタスクは、3D形状間の対応を確立することに依存している。
これらの曖昧さに頑健な表面認識型埋め込み空間を学習し、3次元形状の家族全体の共有マッピングを容易にする。
2D-to-3D や 3D-to-3D のテクスチャ転送を含む下流アプリケーションを実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:58:01 GMT)
CNSocialDepress: A Chinese Social Media Dataset for Depression Risk Detection and Structured Analysis [9.6] CNSocialDepressは、中国のソーシャルメディア投稿からうつ病リスクを検出するためのベンチマークデータセットである。
このデータセットには233人のユーザーから44,178通のテキストが含まれており、その中に心理学の専門家が10,306件のうつ病関連セグメントを注釈付けしている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:14:18 GMT)
TopoAlign: A Framework for Aligning Code to Math via Topological Decomposition [9.6] TopoAlignは、広く利用可能なコードリポジトリをMath LLMのトレーニングリソースとしてアンロックするフレームワークである。
TopoAlignはコードをdocstring、main関数、Dependency関数に分解し、これらのコンポーネントを形式的なステートメントを構造的にミラーするアナログに再組み立てする。
我々は、DeepSeek-MathとHeraldの2つの最先端モデルをトレーニングし、minif2f、Patnam、ProofNetベンチマークで評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:09:36 GMT)
LIDDIA: Language-based Intelligent Drug Discovery Agent [9.6] LIDDIAは、サイリコの薬物発見過程をインテリジェントにナビゲートできる自律エージェントである。
大きな言語モデルの推論能力を活用することで、LIDDIAは、自律的な薬物発見のための低コストで高度に適応可能なツールとして機能する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:56:21 GMT)
PanoTPS-Net: Panoramic Room Layout Estimation via Thin Plate Spline Transformation [9.4] 部屋の3Dレイアウトを正確に推定することは、コンピュータビジョンにおいて重要な課題である。
本稿では,パノラマ画像から部屋のレイアウトを推定する新しいモデルであるパノTPS-Netを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:40:49 GMT)
Integrating Sequential and Relational Modeling for User Events: Datasets and Prediction Tasks [9.4] ユーザイベントモデリングは、eコマース、ソーシャルメディア、ファイナンス、サイバーセキュリティ、その他のドメインにまたがるユースケースを含む、多くの機械学習アプリケーションにおいて中心的な役割を果たす。
これらの2種類のイベントは通常、個人イベントのシーケンスベースのメソッドとリレーショナルイベントのグラフベースのメソッドを使用して、別々にモデル化される。
実際のシステムでは、両方のイベントタイプをキャプチャする必要があるが、以前の作業ではこれらを一緒に考えることはめったにない。
これは多くの場合、ユーザ動作がシーケンスまたはグラフとして単一の形式化によって適切に表現できるという便利な単純化によるものである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:13:03 GMT)
KnowRL: Teaching Language Models to Know What They Know [9.3] 本稿では,モデルの内部で実現可能性境界の理解を深める,シンプルだが強力なフレームワークであるKnowRLを提案する。
我々のフレームワークは、(i)イントロスペクション(i)モデルが判断するタスクを生成・分類する)と(ii)コンセンサスに基づく報酬(ii)の2つのコンポーネントを組み合わせています。
シードセットが小さかったり,外部監視がなかったりしても,精度は28%,F1では12%向上した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:47:14 GMT)
A Joint Learning Approach to Hardware Caching and Prefetching [9.3] 孤立して訓練された政策は、いまだに同時に配置される際の準最適性能を達成する可能性がある。
本稿では,2つのポリシーで使用される特徴の共有表現開発に基づく共同学習手法を提案する。
本稿では,共同エンコーダをベースとした共有表現と,埋め込みの対照的な学習に基づく2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:11:02 GMT)
Can LLMs Express Personality Across Cultures? Introducing CulturalPersonas for Evaluating Trait Alignment [9.3] 行動に富んだ文脈で人格表現を評価するための,人間による検証のための最初の大規模ベンチマークであるCulturalPersonasを紹介する。
我々のデータセットは、6つの異なる国で3000のシナリオベースの質問にまたがっており、地域価値に根ざした日々のシナリオを通してパーソナリティを引き出すように設計されている。
以上の結果から,CulturalPersonasは国固有の人格分布との整合性を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:40:16 GMT)
ChoirRec: Semantic User Grouping via LLMs for Conversion Rate Prediction of Low-Activity Users [9.3] ChoirRecは、Large Language Models(LLM)のセマンティック機能を活用してセマンティックユーザグループを構築する新しいフレームワークである。
堅牢なユーザ間の知識伝達のために設計されたデュアルチャネルアーキテクチャにより、ChoirRecは3つのコンポーネントから構成される。
当社は、産業規模のeコマースプラットフォームであるTaobaoで、大規模なオフラインおよびオンライン実験を実施しています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:54:57 GMT)
DDFusion:Degradation-Decoupled Fusion Framework for Robust Infrared and Visible Images Fusion [9.2] 本稿では,分解脱結合核融合(DDFusion)フレームワークを提案する。
DDFusionはクリーンかつ劣化した条件下で優れた核融合性能を達成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:48:24 GMT)
Benchmarking Deep Learning Models for Laryngeal Cancer Staging Using the LaryngealCT Dataset [9.2] The Cancer Imaging Archive (TCIA)の6つのコレクションから収集した1029個のCTスキャンのベンチマークであるLaryngealCTについて紹介する。
喉頭を含む一様1mm等方体積の興味を臨床専門家が検証した弱教師付きパラメータ探索フレームワークを用いて抽出した。
3D CNN (AUC-0.881, F1-macro-0.821) と ResNet18 (AUC-0.892, F1-macro-0.646) はそれぞれ2つのタスクで他のモデルを上回った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:25:19 GMT)
Large Language Models and Operations Research: A Structured Survey [9.2] 大規模言語モデル(LLM)は、意味理解、構造化生成、推論制御を通じて制限に対処する可能性を示している。
LLMは、自然言語記述を数学的モデルや実行可能なコードに変換し、ベンチマークを生成し、アルゴリズムを進化させ、最適化タスクに取り組むことができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:40:13 GMT)
Dimension-Free Minimax Rates for Learning Pairwise Interactions in Attention-Style Models [9.1] 単層アテンション型モデルにおけるペアワイズ相互作用の収束率について検討する。
ミニマックスレートが$M-frac2beta2beta+1$でサンプルサイズが$M$であることを証明する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:00:04 GMT)
NSPDI-SNN: An efficient lightweight SNN based on nonlinear synaptic pruning and dendritic integration [9.1] スパイキングニューラルネットワーク(スパイキングニューラルネットワーク、英: Spiking Neural Network、SNN)は、生体ニューロンを模擬したニューラルネットワークである。
本研究では,非線形プルーニングとデンドライトを併用した効率的な軽量SNN法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:27:05 GMT)
Personalized Bayesian Federated Learning with Wasserstein Barycenter Aggregation [9.0] FedWBAはローカル推論とグローバルアグリゲーションの両方を強化する新しいPBFL法である。
我々はFedWBAの地域的およびグローバルな収束保証を提供する。
実験により、FedWBAは予測精度、不確実性校正、収束率においてベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:09:17 GMT)
Error Propagation Mechanisms and Compensation Strategies for Quantized Diffusion [8.9] 拡散モデルは、前例のない品質と創造性のベンチマークを確立することによって、画像合成を変革した。
大規模なデプロイメントは、計算集約的な反復的デノゲーションプロセスによる課題に直面している。
拡散モデルにおける誤差伝播を数学的に定式化する理論的枠組みを開発する。
時間ステップを考慮した累積誤差補償方式を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:53:33 GMT)
Next Interest Flow: A Generative Pre-training Paradigm for Recommender Systems by Modeling All-domain Movelines [8.9] 本稿では,eコマースレコメンデータシステムのための新しい生成事前学習パラダイムを提案する。
我々のモデルは,ユーザの将来の意図を表す密度の高いベクトル列であるNext Interest Flowを予測することを学ぶ。
パイプライン全体を実装した統合フレームワークである All-domain Moveline Evolution Network (AMEN) を提示する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:13:17 GMT)
G2L:From Giga-Scale to Cancer-Specific Large-Scale Pathology Foundation Models via Knowledge Distillation [8.8] 本稿では,ギガスケールモデルのパラメータのわずか15%である大規模ファンデーションモデルの性能向上戦略を提案する。
提案手法は, ギガスケールモデルから大規模モデルへの知識蒸留に適用し, 対象がんの1Kパススライスを応用した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:08:59 GMT)
Algorithmic Primitives and Compositional Geometry of Reasoning in Language Models [8.7] モデル推論の基盤となるアルゴリズムプリミティブのトレースとステアリングのためのフレームワークを導入する。
提案手法は推論トレースを内部のアクティベーションパターンに関連付け,アルゴリズムプリミティブを残留ストリームに注入することで評価する。
トラベリングセールスパーソン問題(TSP)、3SAT、AIME、グラフナビゲーションの4つのベンチマークを考察する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:36:43 GMT)
Detecting gravitational waves with spin systems [8.6] 我々は、スピン系を用いて、この未探索周波数状態における重力波を検出することを提案する。
重力波に対するスピンの反応を導出し、よく知られたゲルツェンシュテイン効果、計量誘起相互作用、重力スピンホール効果の3つの異なる効果を同定する。
提案手法はキロヘルツからギガヘルツの範囲での重力波の観測が可能であり、予測感度は$sqrtS_happrox10-20mathrmHz-1/2$に達する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:58:10 GMT)
CrisiText: A dataset of warning messages for LLM training in emergency communication [8.5] 今回紹介するCrisiTextは,13種類の危機シナリオを対象とした警告メッセージ生成のための,最初の大規模データセットだ。
データセットには、このようなイベントの前後で民間人を支援することを目的とした40万以上の警告メッセージが含まれている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:43:09 GMT)
Doc2Query++: Topic-Coverage based Document Expansion and its Application to Dense Retrieval via Dual-Index Fusion [8.5] クエリ生成によるドキュメント拡張(DE)は、スパース検索において語彙ミスマッチに取り組むが、制限に直面している。
ドキュメントの潜在トピックをまず推測することでクエリ生成を構造化するDEフレームワークであるDoc2Query++を紹介します。
本稿では,テキストとクエリ信号を分離し,高密度設定における性能を向上させるDual-Index Fusion戦略を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:34:52 GMT)
Simple and Effective Specialized Representations for Fair Classifiers [8.5] 本稿では,特徴関数距離に基づく公平な分類手法を提案する。
特徴関数を利用することで,従来の手法に比べて安定で効率的な解が得られる。
本手法はロバスト性および計算効率を保ち,実世界の応用のための実用的な解法である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:14:09 GMT)
Mixing Times and Privacy Analysis for the Projected Langevin Algorithm under a Modulus of Continuity [8.5] 我々は、予測ランゲヴィンアルゴリズム(LA)の混合時間とノイズグラディエントDescent(SGD)のプライバシー曲線について検討する。
射影LAに対する新しい混合時間境界を導出するが、これはいくつかの重要な場合において、次元自由かつ多対数的である。
サブサンプルノイズSGDアルゴリズムのプライバシー曲線の上限を新たに設定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:47:25 GMT)
NanoTag: Systems Support for Efficient Byte-Granular Overflow Detection on ARM MTE [8.5] バッファオーバーフローやUse-after-freeといったメモリ安全性のバグは、本番環境でのソフトウェア安全性の問題の主要な原因である。
ArmのMemory Tagging Extension (MTE)は、ハードウェアのこれらのバグをはるかに少ないオーバーヘッドで検出する、有望な代替手段を提供する。
ARM MTEを用いて,修正されていないバイナリのメモリ安全性のバグをバイト単位で検出するシステムであるNanoTagを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:36:10 GMT)
Edge Delayed Deep Deterministic Policy Gradient: efficient continuous control for edge scenarios [8.4] 我々はEdge Delayed Deep Deterministic Policy Gradient (EdgeD3)と呼ばれるエッジシナリオに適した新しい強化学習アルゴリズムを導入する。
本研究では,エッジ遅延Deep Deterministic Policy Gradient (EdgeD3)と呼ばれるエッジシナリオに適した新しい強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:26:46 GMT)
rareboost3d: a synthetic lidar dataset with enhanced rare classes [8.4] 我々はRareBoost3Dという新しい合成点クラウドデータセットを紹介した。
このデータセットは、現実世界のデータセットで稀なオブジェクトクラスに対して、はるかに多くのインスタンスを提供する。
また,CSC損失というドメイン間セマンティックアライメント手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:02:33 GMT)
Hierarchical Qubit-Merging Transformer for Quantum Error Correction [8.3] 量子誤り訂正方式は論理情報を保護するために物理的誤りを効果的に解決しなければならない。
本稿では,新規かつ汎用的な復号化フレームワークであるHQMTを提案する。
HQMTは、専用量子ビットマージ層を統合することで、表面符号の論理的誤り率を著しく低くする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:31:46 GMT)
Culturally-Aware Conversations: A Framework & Benchmark for LLMs [8.3] LLMの文化的適応を測定する既存のベンチマークは、さまざまな文化的背景を持つユーザと対話する際に、これらのモデルが直面する実際の課題と不一致である。
社会文化的理論を基礎として,我々の枠組みは,状況的,関係的,文化的文脈によって言語様式がどう形成されるかを定式化した。
我々は,この枠組みに基づいて,文化的に多彩なラッカーによって注釈付けされたベンチマークデータセットを構築し,NLPにおける異文化間評価のための新しいデシラタセットを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:06:14 GMT)
Enhancing the Quality of 3D Lunar Maps Using JAXA's Kaguya Imagery [8.2] Kaguya TCの画像は、全世界で10m/ピクセルで入手できるが、ステレオマッチングエラーとJPEGベースの圧縮アーティファクトによる高度不正確さに悩まされている。
本稿では,カグヤTC画像から生成された3Dマップの品質向上手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:14:42 GMT)
On the Optimal Representation Efficiency of Barlow Twins: An Information-Geometric Interpretation [8.2] 自己教師付き学習は、ラベル付きデータなしで意味のある表現を学習することで、目覚ましい成功を収めた。
本稿では,表現効率を定量化する新しい情報幾何学フレームワークを提案する。
この枠組みでは,バーロウ・ツインズ法の理論解析を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:41:27 GMT)
On the Potential of Quantum Computing in Classical Program Analysis [8.1] 量子コンピューティングを用いて古典的プログラムを解析するQEXについて述べる。
プログラム状態の重ね合わせとトレースデータの依存関係を絡み合いを通じて符号化する量子回路を合成することにより、QEXはプログラムの振る舞いを同時に探索することができる。
この研究は、古典的なプログラム分析に量子コンピューティングを使用する最初の提案である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:24:08 GMT)
DITTO: A Spoofing Attack Framework on Watermarked LLMs via Knowledge Distillation [8.0] 我々は、悪意あるモデルが信頼された被害者モデルの本物の透かしを含むテキストを生成できる高度な攻撃である、透かしの脅威を導入する。
透かし付き教師モデルから知識を抽出することにより,攻撃者が被害者モデルの透かし信号を盗み,複製することができる。
この研究は、テキストオーサシップの検証において重要なセキュリティギャップを明らかにし、専門家が模倣したものと真正な透かしを区別できる技術へのパラダイムシフトを要求する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:53:40 GMT)
Investigating Large Language Models' Linguistic Abilities for Text Preprocessing [7.9] 本稿では,Large Language Models (LLMs) を用いた各種前処理タスクの実行について検討する。
LLMに基づく前処理を,ヨーロッパの6言語における複数のテキスト分類タスクにまたがる従来のアルゴリズムと比較する。
以上の結果から, LLMは従来のストップワード除去法, 補綴法, 造語法をそれぞれ97%, 82%, 74%の精度で再現可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:53:44 GMT)
The Matthew Effect of AI Programming Assistants: A Hidden Bias in Software Evolution [7.8] 私たちは、AI支援プログラミングがソフトウェアエコシステムとどのように相互作用するかを調べるために、何千ものアルゴリズムプログラミングタスクと何百ものフレームワーク選択タスクで大規模な実験を行います。
プログラミング言語やフレームワークが普及すればするほど、LLM生成コードの成功率が高くなります。
この現象は、AIシステムが既存の人気階層を強化し、多様性とイノベーションを妨げる一方で、支配的なツールへの収束を加速する可能性を示唆している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:51:00 GMT)
RepoSummary: Feature-Oriented Summarization and Documentation Generation for Code Repositories [7.7] RepoSummaryは機能指向のコードリポジトリ要約アプローチである。
同時にリポジトリドキュメンテーションを自動的に生成する。
機能機能から対応するコード要素へのより正確なトレーサビリティリンクを確立する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:16:44 GMT)
Do Psychometric Tests Work for Large Language Models? Evaluation of Tests on Sexism, Racism, and Morality [7.7] 大規模言語モデル(LLM)における心理的構成物の評価に心理学的検査がますます用いられるようになる
本研究では、セクシズム、人種差別、道徳という3つの構成要素に対する人間の心理測定検査の信頼性と妥当性を評価する。
心理測定テストのスコアは一致せず、ダウンストリームタスクにおけるモデル行動と負の相関関係にある場合もあり、生態学的妥当性は低い。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:43:49 GMT)
Prompt-Guided Spatial Understanding with RGB-D Transformers for Fine-Grained Object Relation Reasoning [7.7] 我々は,Track 3 2025 AI City Challengeで導入された物理AI空間情報ウェアハウスデータセットに,専用の空間推論フレームワークを導入する。
提案手法は,入力プロンプトに直接マスク次元をバウンディングボックス座標の形で埋め込むことにより,空間的理解を高める。
私たちの包括的なパイプラインは73.0606の最終的なスコアを獲得し、全体の4位を公開リーダボードに位置づけています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:51:20 GMT)
Online Selective Generation with Adversarial Bandit Feedback [7.6] 大規模な言語生成モデルは人間とますます相互作用するが、その偽造された反応は懸念を引き起こす。
この幻覚効果を軽減するために、選択的生成と呼ばれる解答を選択的に棄却することは、解答が不確実である場合に幻覚を効果的に制御する方法を提供する。
適応的相手の下で部分的フィードバックを伴う選択生成のためのオンライン学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:48:23 GMT)
TDADL-IE: A Deep Learning-Driven Cryptographic Architecture for Medical Image Security [7.6] MRIやCTなどのデジタル医療画像は、遠隔医療やクラウドストレージにおける患者のデータを保護するために強力な暗号化を要求する。
カオスシステムは、その感度と特徴のために画像暗号化に人気があるが、既存の方法には十分なセキュリティがないことが多い。
本稿では,3つのキー要素をベースとした3次元拡散アルゴリズムとディープラーニング画像暗号化システム(TDADL-IE)を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:47:55 GMT)
DyKnow-RAG: Dynamic Knowledge Utilization Reinforcement Framework for Noisy Retrieval-Augmented Generation in E-commerce Search Relevance [7.6] DyKnow-RAGは、グループ相対ポリシー最適化に基づいて構築された動的ノイズ-RAGフレームワークである。
2つのロールアウトグループ(外部コンテキストと単一の取得チャンク)をトレーニングし、後続駆動によるグループ間アドバンテージスケーリングを適用する。
タオバオの生産関連システムに配備され、生の交通に供されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:08:59 GMT)
Adversarial Robustness in One-Stage Learning-to-Defer [7.4] Learning-to-Defer(L2D)は、入力を予測者または外部の専門家にルーティングすることで、ハイブリッドな意思決定を可能にする。
有望ではあるが、L2Dは敵の摂動に対して非常に脆弱であり、予測を反転させるだけでなく、遅延決定を操作できる。
第一段階のL2Dでは, 分類と回帰の両方を網羅し, 対向ロバスト性に関する最初の枠組みを紹介した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:55:55 GMT)
Task-Specific Dual-Model Framework for Comprehensive Traffic Safety Video Description and Analysis [7.4] 交通安全分析は複雑な映像理解を必要とし、行動パターンを捉え、事故防止のための記述を生成する。
本稿では,タスク固有の最適化を通じて,VideoLLaMAとQwen2.5-VLの相補的強みを戦略的に活用する,ユニークなデュアルモデルフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:18:23 GMT)
Network-Optimised Spiking Neural Network (NOS) Scheduling for 6G O-RAN: Spectral Margin and Delay-Tail Control [7.4] 本研究は,ネットワーク最適化スパイキング(NOS)による6G無線アクセスのための遅延対応スケジューラを提案する。
小信号解析は遅延依存しきい値$k_star(Delta)$とスペクトルマージン$delta = k_star(Delta) - gHrho(W)$を生成し、トポロジ、コントローラゲイン、遅延を1つの設計パラメータに圧縮する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:28:28 GMT)
Faster Convergence of Riemannian Stochastic Gradient Descent with Increasing Batch Size [7.3] バッチサイズの増加は、一定のバッチサイズを使用するよりも早く収束する。
バッチサイズの増加はRSGDの複雑さを減少させることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:54:32 GMT)
Quantifying Information Disclosure During Gradient Descent Using Gradient Uniqueness [7.2] 本稿では,学習モデルの公開からの情報開示量に対する上限から導かれる,漸進的一意性(emphgradient uniqueness)という原則的開示指標を提案する。
本稿では,勾配の特異性監視に基づく簡易な防御法について検討し,DP-SGDなどの古典的手法に匹敵するプライバシーを達成できることを見出した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:57:27 GMT)
RV-HATE: Reinforced Multi-Module Voting for Implicit Hate Speech Detection [7.2] RV-HATEは、各ヘイトスピーチデータセットのデータセット固有の特徴を考慮に入れた検出フレームワークである。
このフレームワークは強化学習を使用して、与えられたデータセットに対する各モジュールのコントリビューションを決定するウェイトを最適化する。
提案手法は暗黙のヘイトスピーチに効果的に対処し,従来の静的手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:21:51 GMT)
Hallucination Detection via Internal States and Structured Reasoning Consistency in Large Language Models [7.2] 内部状態探索と整合検証は、大きな言語モデルにおける幻覚を検出するために用いられる。
両手法のギャップを埋める統一的なフレームワークを開発する。
私たちのフレームワークは一貫して、強力なベースラインをはるかに上回ります。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:31:21 GMT)
Characterizing Web Search in The Age of Generative AI [7.1] 従来のウェブ検索エンジンであるGoogleと、2つのプロバイダ(GoogleとOpenAI)の4つの生成検索エンジンを比較した。
生成検索エンジンは、モデルパラメータに含まれる内部知識に依存する程度によって異なる。
本稿では,ジェネレーティブAI時代におけるWeb検索の評価基準の再検討の必要性を強調した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:04:03 GMT)
Actor-Enriched Time Series Forecasting of Process Performance [7.1] 本研究では,時系列としてモデル化されたアクター行動情報を組み込むことで,スループット時間(TT)予測モデルの予測性能が向上するかどうかを検討する。
実生活のイベントログを用いて、アクター中心の機能、すなわちアクターの関与、継続頻度、中断頻度、ハンドオーバ行動、これらの行動の持続時間を含む時系列を構築する。
その結果,アクターに富んだモデルは,RMSE,MAE,R2といったTT機能のみを含むベースラインモデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:10:06 GMT)
A Simple and Efficient One-Shot Signature Scheme [7.0] ワンショットシグネチャ(OSS)は強力でユニークな量子暗号プリミティブである。
我々は、任意の長さのメッセージに署名できる新しい、単純で、直接的で効率的なワンショット署名スキームを構築した。
シュムエリ=ザンドリー構成とは異なり、このスキームは完全正当性を達成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:53:00 GMT)
A Primer on SO(3) Action Representations in Deep Reinforcement Learning [7.0] 表現誘発幾何学が探索と最適化に強く影響を与えることを示す。
その結果,局所的なフレーム内の接ベクトルとして行動を表現することで,アルゴリズム間で最も信頼性の高い結果が得られることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:49:21 GMT)
Conceptualizing Smart City Applications: Requirements, Architecture, Security Issues and Emerging Trends [6.8] スマートシティの出現と持続可能な開発は、世界的な都市化の形で受け入れられている。
スマートシティの市民は、スマートリビング環境、ユビキタス接続、サービスへのシームレスアクセス、スマートガバナンスによるインテリジェントな意思決定、リソース管理の最適化といったメリットを享受することができる。
スマートシティの広く受け入れられたことにより、データセキュリティの問題、認証、不正アクセス、デバイスレベルの脆弱性、持続可能性といった問題が発生している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:43:49 GMT)
Why Ask One When You Can Ask $k$? Learning-to-Defer to the Top-$k$ Experts [6.8] 我々は、Top-k$ Learning-to-Deferの最初のフレームワークを紹介します。
クエリを$k$のコスト効率の高いエンティティに割り当てる。
また、クエリ毎に最適な専門家数を学ぶ適応型変種であるTop-$k(x)$ Learning-to-Deferを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:36:20 GMT)
One-Stage Top-$k$ Learning-to-Defer: Score-Based Surrogates with Theoretical Guarantees [6.8] 最初の1段階のTop-k$ Learning-to-Deferフレームワークを紹介します。
我々は、最もコスト効率の良いエンティティラベルや専門家1人当たりのインプットを$k$で選択するスコアベースの共有モデルを学ぶ。
CIFAR-10とSVHNの実験により、我々の1段階のTop-$k$法がTop-1deferralを厳密に上回っていることを確認した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:35:17 GMT)
Output Format Biases in the Evaluation of Large Language Models for Code Translation [6.8] 出力フォーマットのバリエーションを理解し、対処することが重要です。
非コード要素は評価指標に干渉し、モデルの性能と比較のバイアスのある評価をもたらす。
混合形式出力からソースコードを効果的に抽出する,プロンプトエンジニアリングと正規表現の戦略的組み合わせを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:19:11 GMT)
Variational Mixture of Graph Neural Experts for Alzheimer's Disease Biomarker Recognition in EEG Brain Networks [6.7] 既存のEEGベースの手法は、フルバンド周波数解析によって制限される。
本稿では,周波数特異的バイオマーカー同定を統合したグラフニューラルネットワーク専門家(VMoGE)の変分混合を提案する。
VMoGEは、最先端のメソッドよりもAUCが+4%から+10%改善したことにより、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:37:18 GMT)
Decoupled Multimodal Fusion for User Interest Modeling in Click-Through Rate Prediction [6.7] ユーザ関心モデリングのためのIDベースの協調表現とマルチモーダル表現とのきめ細かい相互作用を可能にするために,Decoupled Multimodal Fusion (DMF)を提案する。
我々は、異なる埋め込み空間にまたがるセマンティックギャップをブリッジするターゲット認識機能を構築し、それらをサイド情報として活用し、ユーザ関心モデリングの有効性を高める。
DMFは国際的なeコマースプラットフォームの製品レコメンデーションシステムにデプロイされ、CTCVRの5.30%とGMVの7.43%の相対的な改善を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:06:26 GMT)
Anti-Phishing Training (Still) Does Not Work: A Large-Scale Reproduction of Phishing Training Inefficacy Grounded in the NIST Phish Scale [6.7] フィッシング(英: phishing)として知られる電子メールで配信される社会工学的攻撃は、永続的なサイバーセキュリティの脅威を表している。
多くの組織は、コンプライアンス要件によって強制されるフィッシングで従業員を訓練するが、このトレーニングの現実的な効果については議論が続いている。
我々は、エビデンスベースのサイバーセキュリティ政策に貢献するために、米国拠点の金融技術企業で大規模な再生調査を行った。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:25:16 GMT)
Schrödinger bridge for generative AI: Soft-constrained formulation and convergence analysis [6.6] いわゆるソフト拘束型シュリンガー橋問題(SCSBP)について検討する。
ペナルティが大きくなるにつれて、制御関数と値関数の両方が線形速度で古典的SBPのものと収束することが証明される。
これらの結果から,ソフト拘束ブリッジの定量的収束保証が得られた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:29:15 GMT)
Offline Reinforcement Learning with Generative Trajectory Policies [6.5] 生成モデルは、オフラインの強化学習のための強力なポリシーのクラスとして登場した。
遅くて反復的なモデルは計算コストが高く、一貫性ポリシのような高速で単一ステップのモデルは、しばしば性能の低下に悩まされる。
提案するジェネレーティブ・トラジェクトリ・ポリティクス(GTP)は,基礎となるODEのソリューションマップ全体を学ぶための,より汎用的な政策パラダイムである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:06:28 GMT)
Strategic Tradeoffs Between Humans and AI in Multi-Agent Bargaining [6.5] 我々は,人間,大言語モデル,ベイズエージェントの動的交渉条件における結果と行動力学を比較した。
パフォーマンスの同等性は、プロセスとアライメントの根本的な違いを隠蔽する可能性がある。
この研究は、より応用され、変数リッチな環境における将来の研究のベースラインを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:19:28 GMT)
Adapting and Evaluating Multimodal Large Language Models for Adolescent Idiopathic Scoliosis Self-Management: A Divide and Conquer Framework [6.4] 若年性特発性強皮症(AIS)に対するMLLM(Multimodal Large Language Models)の総合的評価を行った。
診断用テキストを用いた約3,000個の後部X線データベースを構築し,Divide and Conquer フレームワークを用いて5つのMLLMを評価した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:02:07 GMT)
Failure Prediction at Runtime for Generative Robot Policies [6.4] 実行中の早期の障害予測は、人間中心で安全クリティカルな環境でロボットをデプロイするために不可欠である。
本稿では,フェールデータを必要としない生成ロボットポリシーの故障予測フレームワークであるFIPERを提案する。
その結果、FIPERは実際の障害と良質なOOD状況とをよく区別し、既存の手法よりも正確に早期に障害を予測できることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:29:31 GMT)
Modeling AI-Driven Production and Competitiveness A Multi-Agent Economic Simulation of China and the United States [6.3] 人工知能(AI)技術の急速な発展に伴い、社会経済システムは「人間とAIの共創」の新たな段階に入った。
本稿では,中国と米国におけるマクロ経済のアウトプット進化のシミュレーションに基づく比較を行った。
その結果、AIが独立した生産主体として機能する場合には、社会的なアウトプットの全体的な成長速度は従来の人間工学モデルよりもはるかに高いことがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:28:14 GMT)
Exploring and Leveraging Class Vectors for Classifier Editing [6.3] 微調整中にクラス固有の表現調整をキャプチャするクラスベクトルを導入する。
タスクベクトルは重み空間のタスクレベル変化をエンコードするが、クラスベクトルは各クラス適応を潜在空間で切り離す。
クラスベクタが各クラスのセマンティックシフトをキャプチャし、これらのベクタに沿って潜在機能をステアリングするか、あるいはそれらを重み空間にマッピングして決定境界を更新することで、分類器の編集が実現できることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:57:51 GMT)
WebRouter: Query-specific Router via Variational Information Bottleneck for Cost-sensitive Web Agent [6.3] LLMを組み込んだWebエージェントは、Web自動化に強力な機能を提供するが、コストパフォーマンスのトレードオフに直面している。
情報理論の観点から学習した,コスト対応のクエリ専用ルータであるWebを紹介する。
WebはGPT-4oベースラインに比べて、運用コストを87.8%削減し、精度は3.8%しか低下しない。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:05:43 GMT)
Online Auction Design Using Distribution-Free Uncertainty Quantification with Applications to E-Commerce [6.2] コンフォーマルオンラインオークションデザイン(COAD, Conformal Online Auction Design, コンフォーマルオンラインオークションデザイン)は, 既知分布に依存しない入札値の不確実性を定量化し, 収益を最大化するメカニズムである。
COADには入札者とアイテムの両方の機能が含まれており、過去のデータを使ってオンラインオークションのインセンティブに適合するメカニズムを設計している。
我々は,現実のeBayオークションデータへのアプリケーションを通して,COADの実践的有効性を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:01:55 GMT)
Scalable Policy-Based RL Algorithms for POMDPs [6.2] 我々は、POMDPモデルを有限状態マルコフ決定プロセス(MDP)に近似することにより、部分観測可能強化学習(PORL)問題を解決するアプローチを検討する。
近似誤差はこの履歴の長さとともに指数関数的に減少することを示す。
我々の知識を最大限に活用するために、我々の有限時間境界は、真の力学がマルコフ的でない設定に標準的TD学習を適用する際に導入された誤差を明示的に定量化する最初のものである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:52:44 GMT)
Codiscovering graphical structure and functional relationships within data: A Gaussian Process framework for connecting the dots [6.2] 科学領域内外のほとんどの問題は、以下の3段階の関数近似の複雑さの1つに分類できる。
これらのハイパーグラフは計算知識を整理、通信、処理するための自然なプラットフォームを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:30:04 GMT)
High-Probability Bounds For Heterogeneous Local Differential Privacy [6.1] 局所差分プライバシー(LDP)に基づく統計的推定について検討する。
我々は、少なくとも1-βの確率を保持するような$ell$-normの有限サンプル上限を開発する。
我々はさらに$ell_infty$-distanceで分布学習を研究し、不均一なプライバシー要求の下で高い確率保証を持つアルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:54:44 GMT)
Causal Explanation of Concept Drift -- A Truly Actionable Approach [6.0] モデルに基づくドリフト説明を因果説明に拡張し,提案した説明の動作可能性を高める。
我々は,本フレームワークの実用性を実証し,いくつかのユースケースについて説明戦略を評価した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:36:55 GMT)
Information Topology [6.0] 本稿では,情報理論と代数的トポロジーを統合するフレームワークであるEmphInformation Topologyを紹介する。
スタートポイントは、順不変で予測的構造(サイクル)から点的に、順序に敏感な揺らぎ(ドット)を分離するエンファンドットサイクル二分法である。
次に,Shannonキャパシティのトポロジ的双対であるエンフォロジーキャパシティを,システムによって支えられる独立した情報サイクルの数として定義する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:44:27 GMT)
On Inherited Popularity Bias in Cold-Start Item Recommendation [6.0] 協調フィルタリング(CF)は、目に見えない、または'コールド'アイテムの予測に苦労する。
コールドスタートシステムは人気バイアスを継承しうることを示すが、これは推奨システムの不公平性の一般的な原因である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:44:13 GMT)
Leveraging LLMs for Semi-Automatic Corpus Filtration in Systematic Literature Reviews [5.9] 本稿では,複数の大規模言語モデル(LLM)を活用し,記述的プロンプトに基づいて論文を分類し,共同で決定するパイプラインを提案する。
プロセス全体は、オープンソースのビジュアルアナリティクスWebインターフェースであるLLMSurverを介して、人間によって管理され、インタラクティブに制御されます。
その結果、パイプラインは、単一アノテータよりもエラー率を低くしながら、手作業を大幅に削減することを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:48:29 GMT)
Template-Based Text-to-Image Alignment for Language Accessibility: A Study on Visualizing Text Simplifications [5.8] 本稿では,簡略化されたテキストからアクセス可能な画像を生成するための構造化視覚言語モデルを提案する。
我々は5つのプロンプトテンプレートを設計し、それぞれがアクセシビリティ制約を順守しながら、異なる空間配置を踏襲した。
その結果, Basic Object Focusプロンプトテンプレートが最もセマンティックアライメントが高いことがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:03:36 GMT)
Zero-shot Face Editing via ID-Attribute Decoupled Inversion [5.7] 本稿では,ID-Attribute Decoupled Inversionに基づくゼロショット顔編集手法を提案する。
我々は、顔表現をIDと属性の特徴に分解し、それらを共同条件として、逆拡散過程と逆拡散過程の両方を導出する。
本手法は,領域固有の入力を必要とせず,テキストプロンプトのみを用いた複雑な多属性顔編集タスクをサポートし,DDIMインバージョンに匹敵する速度で動作する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:34:40 GMT)
Topological Alignment of Shared Vision-Language Embedding Space [5.6] ToMCLIPは、トポロジ保存制約で埋め込み空間を整列するトポロジ対応フレームワークである。
マルチリンガル表現の構造コヒーレンスの向上,CIFAR-100でのゼロショット精度の向上,およびxFlickr&COでのマルチリンガル検索性能の向上を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:36:38 GMT)
Who are you, ChatGPT? Personality and Demographic Style in LLM-Generated Content [5.5] 生成型大規模言語モデル(LLM)は、様々な領域にまたがって人間のようなテキストを生成することで、日常生活の中心となっている。
成長する研究機関は、これらのモデルが言語にパーソナリティや人口動態のような特徴を示すかどうかを調査している。
本稿では,自己申告アンケートに頼らずに LLM の個性を評価するための新しいデータ駆動手法を提案する。
代わりに自動パーソナリティと性別分類器を適用して、Redditから収集されたオープンエンドの質問に対する回答をモデル化する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:06:17 GMT)
On the Interplay between Musical Preferences and Personality through the Lens of Language [5.5] 音楽は個人のアイデンティティの強力な反映として機能し、しばしばより深い心理的特徴と一致している。
個人の音楽嗜好が、ビッグファイブの性格特性(開放性、良心性、外向性、理解性、神経性)のレンズを通して自然言語に痕跡を残すかどうかを検討する。
その結果,5つのジャンルのファン間での人格差が顕著であった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:01:33 GMT)
QDER: Query-Specific Document and Entity Representations for Multi-Vector Document Re-Ranking [5.5] 本稿では,知識グラフのセマンティクスをマルチベクタモデルに統合することで,アプローチを統一するニューラルリグレードモデルQDERを紹介する。
QDERの重要なイノベーションは、クエリとドキュメントの関係のモデリングである。
まず、これらの微粒化表現を学習注意パターンで変換し、精密マッチングに慎重に選択した数学的操作を適用する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:31:06 GMT)
Efficient and accurate tensor network algorithm for Anderson impurity problems [5.4] アンダーソン不純物モデル (AIM) は、強い相関効果を研究するために凝縮物質物理学において基本的な重要性を持つ。
AIMを解くための急激で急激な数値戦略は、ファインマン・ヴァーノン影響関数(IF)を表現することである。
IFのハイブリッド化関数を$n$指数関数の和として近似できる場合,MPSとしてIFを体系的に構築できる,効率的かつ正確な手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:30:03 GMT)
REGENT: Relevance-Guided Attention for Entity-Aware Multi-Vector Neural Re-Ranking [5.3] 現在のニューラルリランカは、複雑な情報要求と、長くコンテンツに富んだドキュメントに悩まされることが多い。
本稿では,人体を「意味骨格」として用い,人間のような理解を模倣した神経再分類モデルREGENTを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:31:42 GMT)
Re-uploading quantum data: A universal function approximator for quantum inputs [5.3] 量子ビットが任意の入力状態の新たなコピーと逐次相互作用する量子データ再ロードアーキテクチャを解析する。
我々のフレームワークは、量子データを直接操作する量子機械学習モデルを設計するための、量子ビット効率で表現力のあるアプローチを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:00:58 GMT)
Enhancing Zero-Shot Anomaly Detection: CLIP-SAM Collaboration with Cascaded Prompts [5.2] 本稿では,産業用異常検出におけるゼロショット異常セグメンテーションタスクのための新しい2段階フレームワークを提案する。
SAMのオブジェクトセグメンテーションへの傾きを軽減するために,Co-Feature Point Prompt Generationモジュールを提案する。
SAM のセグメンテーション結果をさらに最適化するために,SAM (CPS) モジュール用の Cascaded Prompts を導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:53:49 GMT)
Task-Optimized Convolutional Recurrent Networks Align with Tactile Processing in the Rodent Brain [5.2] 触覚は神経科学では理解されておらず、視覚や言語に比べて人工システムでは効果が低い。
本稿では,現実的な触覚入力シーケンスに基づいてトレーニングされたタスク最適化時間ニューラルネットワークの空間を探索する新しいAttender-Decoder(EAD)フレームワークを提案する。
我々は,畳み込みリカレントニューラルネットワーク(ConvRNN)を,触覚分類のための純粋に前向きおよび状態空間アーキテクチャに優れたエンコーダとして同定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:44:11 GMT)
Cognitive Load Traces as Symbolic and Visual Accounts of Deep Model Cognition [5.2] 深層モデルの中間レベル解釈可能性フレームワークとしてtextbfCognitive Load Traces (CLTs) を提案する。
CLTは、モデル内部資源割り当てを定量化する象徴的、時間的に変化する関数として定義される。
推論と計画ベンチマークの実験は、CLTがエラー発生を予測し、認知戦略を明らかにし、負荷誘導による介入を可能にすることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:04:19 GMT)
Bridging Gaps in Hate Speech Detection: Meta-Collections and Benchmarks for Low-Resource Iberian Languages [5.1] ヘイトスピーチは、社会的結束と個人の幸福に対する深刻な脅威となる。
主に英語に焦点を当てており、リソースや低リソース言語のベンチマークが制限されている。
本研究では,統一されたラベルとメタデータで標準化されたスペイン語のヘイトスピーチデータセットのメタコレクションをコンパイルする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:58:02 GMT)
Exploring Facial Biomarkers for Depression through Temporal Analysis of Action Units [5.0] 抑うつの有無で分類された被験者の映像データから表情を分析した。
その結果,グループ間の悲しみと幸福に関連するAUの強度に有意な差が認められた。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:39:53 GMT)
Multi-Scale Manifold Alignment for Interpreting Large Language Models: A Unified Information-Geometric Framework [4.9] 我々は,LLM表現を局所的,中間的,大域的多様体に分解する情報幾何学的フレームワークであるマルチスケールマニフォールドアライメント(MSMA)を提案する。
我々は一貫した階層パターンを観察し、MSMAが複数の推定値の下でアライメントの指標を改善することを発見した。
異なるスケールでの制御された介入は、語彙の多様性、文構造、談話のコヒーレンスに区別され、アーキテクチャに依存した効果をもたらす。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:09:37 GMT)
Empirical Investigation of Latent Representational Dynamics in Large Language Models: A Manifold Evolution Perspective [4.9] 本稿では,低次元意味多様体上で進化する連続軌跡として,大規模言語モデル(LLM)の生成をモデル化する概念的フレームワークである動的マニフォールド進化論(DMET)を紹介する。
この理論は、3つの解釈可能な測度-状態連続性(C$)、誘引子コンパクト性(Q$)、トポロジカル持続性(P$)を通じて潜在力学を特徴づけ、滑らかさ、安定性、表現進化の構造を共同で捉える。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:56:25 GMT)
Automating Structural Engineering Workflows with Large Language Model Agents [4.9] $textbfMASSE$は、構造工学のための最初のマルチエージェントシステムである。
大規模言語モデル(LLM)ベースのエージェントと実世界のエンジニアリングを効果的に統合する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:38:46 GMT)
Joint Discriminative-Generative Modeling via Dual Adversarial Training [4.9] 本稿では,差別的堅牢性と安定な生成学習の両面において,敵対的学習原則を取り入れた新しい学習枠組みを提案する。
CIFAR-10, CIFAR-100, ImageNetによる実験により, 競合生成性能を維持しつつ, 既存のハイブリッドモデルに対する対角的ロバスト性を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:07:22 GMT)
SceneTextStylizer: A Training-Free Scene Text Style Transfer Framework with Diffusion Model [4.8] SceneTextStylizerは、シーンイメージ中のテキストを柔軟かつ高忠実に転送するためのトレーニング不要な拡散ベースのフレームワークである。
本手法は,テキストの読みやすさとスタイル整合性の両方を保ちながら,テキスト領域に特化して,プロンプト誘導型スタイル変換を実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:11:57 GMT)
Punctuation-aware treebank tree binarization [4.8] 句読点対応のツリーバンクバイナライゼーションパイプラインは、2ナライゼーションの前に兄弟ノードとして句読点を保存する。
ペン・ツリーバンクでは、句読点認識前処理により、頭部の予測精度が73.66%(コリンズ規則)から91.85%に向上した。
すべてのコード、構成ファイル、ドキュメントがリリースされ、他のコーパスへのレプリケーションと拡張が可能である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:02:38 GMT)
DeepMartingale: Duality of the Optimal Stopping Problem with Expressivity [4.8] 我々はDeepMartingaleと呼ばれる新しいディープラーニング手法を導入し、離散監視の最適停止問題の双対性を連続的に研究する。
我々は、DeepMartingale から導かれる上界が非常に穏やかな仮定の下で収束することを証明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:00:03 GMT)
Quantum phase transition of sub-Ohmic spin-boson models: An approach by the multiple Davydov D2 Ansatz [4.8] サブOhmic spin-bosonモデルにおける基底状態特性と量子相転移について検討した。
モデルでは, (i) 対角カップリングの単一浴, (ii) 対角カップリングと対角カップリングの2つの独立した浴, (iii) 対角カップリングと対角カップリングの同時結合の単一浴の3つの変種について検討した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:21:09 GMT)
Discrepancy Detection at the Data Level: Toward Consistent Multilingual Question Answering [4.7] 我々は,多言語QA知識ベースにおける事実・文化的相違を検出するために,ループ内ファクトチェックパイプラインであるMINDを提案する。
MINDは、地域や文脈によって異なる文化的にセンシティブな質問に対する多様な答えを強調している。
MINDを母子保健領域におけるバイリンガルQAシステムを用いて評価し,事実的・文化的矛盾に言及したバイリンガル質問のデータセットを公表した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:48:26 GMT)
Robust Adversarial Reinforcement Learning in Stochastic Games via Sequence Modeling [4.7] 対戦ゲームにおけるDTの堅牢性を高めるために設計された最初のフレームワークについて,我々は,CART(Reserve Adversarially Robust Decision Transformer)を紹介した。
CARTは、より正確なミニマックス値推定を実現し、様々な対戦ゲームにおいて、優れた最悪のケースリターンを継続的に達成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:35:53 GMT)
Joint Source-Environment Adaptation of Data-Driven Underwater Acoustic Source Ranging Based on Model Uncertainty [4.7] 事前訓練されたディープラーニングモデルを新しい未知の環境に適用することは、水中の音像定位において大きな課題である。
事前学習したモデルの性能は、トレーニングデータとテストデータのミスマッチに悩まされているが、一般的に、ミスマッチがより多い環境では、高い不確実性を示す。
本研究では,不確実なサンプルのラベル付けを改善するために,特定のサンプルを用いて新しい環境にモデルを適応させる手法を実装した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:00:41 GMT)
CoDefend: Cross-Modal Collaborative Defense via Diffusion Purification and Prompt Optimization [4.6] MLLM(Multimodal Large Language Models)は、画像キャプション、視覚的質問応答、モーダル間推論といったタスクにおいて顕著な成功を収めている。
彼らのマルチモーダルな性質は敵の脅威に晒され、攻撃者はモダリティまたは共同で有害な、誤解を招く、あるいは政策に違反するアウトプットを誘導することができる。
敵の訓練や入力の浄化といった既存の防衛戦略は、顕著な制限に直面している。
本稿では,2対の逆方向のクリーンな画像データセットをファインチューン拡散モデルに活用する,教師付き拡散に基づくDenoisingフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:44:54 GMT)
FedIA: A Plug-and-Play Importance-Aware Gradient Pruning Aggregation Method for Domain-Robust Federated Graph Learning on Node Classification [4.5] ドメインスキュー下でのフェデレーショングラフラーニング(FGL) -- emphTwitch GamersやマルチリンガルのemphWikipediaネットワークなどのプラットフォームで見られる — は、クライアントモデルを互換性のない表現に向けて推進し、不安定かつ非効率なアグリゲーションをレンダリングする。
基礎線法を実証的に解析した結果, 勾配次元の大部分が領域固有の分散によって支配されることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:41:25 GMT)
XGrasp: Gripper-Aware Grasp Detection with Multi-Gripper Data Generation [4.5] XGraspは、リアルタイムグリップアウェアグリップ検出フレームワークである。
複数のグリップパ構成を効率的に扱う。
既存のグリップ認識手法に比べて推論速度が大幅に向上する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:13:25 GMT)
LSP-ST: Ladder Shape-Biased Side-Tuning for Robust Infrared Small Target Detection [4.5] LSP-ST(Ladder Shape-Biased Side-Tuning)を提案する。
学習可能なパラメータは4.72Mしかなく、LSP-STは複数の赤外線小ターゲット検出ベンチマークで最先端のパフォーマンスを達成している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:09:07 GMT)
Reveal-Bangla: A Dataset for Cross-Lingual Multi-Step Reasoning Evaluation [4.5] 本稿では,英語Revealデータセットから派生した,手動で翻訳したBangla多段階推論データセットを提案する。
英語中心およびバングラ語中心の多言語小言語モデルの制御評価を行う。
以上の結果から,より困難な非バイナリ問題に対して,推論コンテキストが有用であることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:43:47 GMT)
A Theorem-Proving-Based Evaluation of Neural Semantic Parsing [4.4] 我々は、グラフマッチングと自動定理証明とのペアリングによる評価を再評価する。
提案手法は,グラフマッチング,一階述語論理定理証明器によるソースとターゲットの論理式間の双方向の包含,および整形性を用いて出力を評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:09:38 GMT)
Isolated Channel Vision Transformers: From Single-Channel Pretraining to Multi-Channel Finetuning [4.4] 大規模MCIデータセットのための簡易かつ効果的な事前学習フレームワークを提案する。
分離チャネル ViT (IC-ViT) と呼ばれるこの手法は,画像チャネルを個別にパッチし,マルチモーダルなマルチチャネルタスクの事前学習を可能にする。
JUMP-CPとCHAMMI、衛星画像用So2Sat-LCZ42など、様々なタスクとベンチマークの実験により、提案されたIC-ViTはパフォーマンス改善の4-14ポイントを提供することが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:18:43 GMT)
Cracking CodeWhisperer: Analyzing Developers' Interactions and Patterns During Programming Tasks [4.3] 我々は、LLMベースのコード生成ツールであるAmazonのCodeWhispererと開発者がどのように関わるかを調査する。
参加者10名を対象に2つのユーザスタディを行った。
1)インクリメンタルコードの改良,2)自然言語コメントを用いた明示的な指示,3)モデル提案によるベースライン構造化,4)外部ソースによる統合的使用,の4つの行動パターンを識別する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:22:12 GMT)
Robustness and Regularization in Hierarchical Re-Basin [4.3] 本稿では,標準的なMergeManyアルゴリズムを大幅に上回る階層モデルマージ手法を提案する。
我々の新しいアルゴリズムでは、Re-Basinは結合されたモデルに逆方向と頑健な摂動を誘導し、その効果はより強くなる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:42:48 GMT)
Draw with Thought: Unleashing Multimodal Reasoning for Scientific Diagram Generation [4.2] そこで我々は,MLLMを指導し,図形を編集可能なmxGraph XMLコードに再構成する学習自由フレームワークDaw with Thought (DwT)を提案する。
DwTはモデル微調整なしで解釈可能で制御可能な出力を可能にする。
Plot2XMLは、ゴールドスタンダードのXMLアノテーションを備えた247の現実世界の科学図のベンチマークです。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:29:31 GMT)
Meta-Guardian: An Early Evaluation of an On-device Application to Mitigate Psychography Data Leakage in Immersive Technologies [4.2] VR(Virtual Reality)やAR(Augmented Reality)、MR(Mixed Reality)といった没入型技術は、リアルタイムな生体計測と行動追跡を通じてユーザインタラクションを再定義している。
本研究は,生体情報(VRヘッドセットを含む)を伝送や記憶前にリアルタイムに識別・フィルタリングする,新たなプライバシ保護システムアーキテクチャを提案する。
このフレームワークは、開発者がプライバシ・バイ・デザインの原則を様々なヘッドセットやアプリケーションに没入的な体験に組み込むことを可能にすることを目的としている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:27:33 GMT)
From Prompts to Packets: A View from the Network on ChatGPT, Copilot, and Gemini [4.2] 本研究では,3つの主要なチャットボット(ChatGPT,Copilot,Gemini)が,テキストおよび画像生成用のAndroidモバイルアプリからアクセスした場合に発生するトラフィックを詳細に調査する。
トラヒック,フロー,プロトコルレベルでのトラフィック特性を微粒化し,マルチモーダルマルコフ連鎖を用いたパケット列ダイナミクスをモデル化する。
本稿では,アプリケーション固有のトラフィックパターン,特にボリューム,アップリンク/ダウンリンクプロファイル,プロトコルの採用について述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:58:54 GMT)
Panda: A pretrained forecast model for chaotic dynamics [4.2] カオスシステムは本質的に小さなエラーに敏感である。
Pandaを2倍104ドルのカオス力学系のデータセットでトレーニングします。
パンダは、再訓練せずに偏微分方程式を予測できる能力を開発した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:55:16 GMT)
Agentic large language models improve retrieval-based radiology question answering [4.2] Radiology Retrieval and Reasoning (RaR)は、放射線学的質問応答のための多段階の検索および推論フレームワークである。
RaRはゼロショットプロンプトや従来のオンラインRAGよりも平均診断精度が有意に向上した。
RaRの検索は幻覚を減少させ(平均9.4%)、臨床的に関連のあるコンテキストを46%の症例で検索した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:42:11 GMT)
Assessing the Role of Communication in Modular Multi-Core Quantum Systems [4.2] モジュラー量子コンピューティングアーキテクチャにおける古典的コミュニケーションの役割を評価するためのシミュレータであるqcommを紹介する。
我々は、古典的な通信帯域幅、相互接続型、および量子回路マッピング戦略が全体の実行時間に与える影響を定量化するために、広範囲にわたる実験的解析を行う。
以上の結果から,古典的コミュニケーションは一般的に実行時間に支配的な貢献者ではないが,最適化シナリオにおいてその影響がますます重要になっていることが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:41:41 GMT)
Early Detection and Reduction of Memorisation for Domain Adaptation and Instruction Tuning [4.1] 我々は、一般的な評価データセット上で1.4B-70BパラメータにまたがるPythia、Llama3、Mistralモデルを微調整する。
最初の数回は暗記が劇的に増加し、しばしば検証の難易度や評価性能が最適化される前に顕著に増加することが判明した。
我々は,n-gram-aware loss regulariserを導入し,最大40%までテストしたモデルファミリー全体の記憶を減少させることを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:12:46 GMT)
Towards Distribution-Shift Uncertainty Estimation for Inverse Problems with Generative Priors [4.1] 遺伝子モデルは、逆問題を解決するためのデータ駆動の先駆体として強い可能性を示してきた。
本稿では,分散シフトに敏感なインスタンスレベルのキャリブレーションのない不確実性指標を提案する。
提案するインジケータは,任意の計算画像逆問題に対して効率的に計算可能である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:58:26 GMT)
Prompt4Trust: A Reinforcement Learning Prompt Augmentation Framework for Clinically-Aligned Confidence Calibration in Multimodal Large Language Models [4.0] Prompt4Trustは,MLLMにおける信頼度校正をターゲットとした即時強化のための,最初の強化学習フレームワークである。
従来のキャリブレーション技術とは異なり、Prompt4Trustは安全で信頼性の高い臨床診断に最も重要なキャリブレーションの側面を特に優先している。
実験では,より大きなMLLMに対してゼロショットの一般化が期待できることを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:06:53 GMT)
Multi-Functional RIS-Enabled in SAGIN for IoT: A Hybrid Deep Reinforcement Learning Approach with Compressed Twin-Models [4.0] 宇宙空間におけるモノのインターネットのための統合ネットワーク(SAGIN)について検討した。
MF-RISは同時に無線エネルギーを増幅し、回収することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:17:47 GMT)
How to Get Actual Privacy and Utility from Privacy Models: the k-Anonymity and Differential Privacy Families [4.0] プライバシモデルは、プライバシ保護データパブリッシングと統計開示制御に導入された。
定義に問題があるため、適切な保護保証の提供に失敗する可能性がある。
k-匿名性のセマンティックな再構築は、ユーティリティを失うことなく、より堅牢なプライバシを提供することができる、と我々は主張する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:41:12 GMT)
PAC-Bayesian Bounds on Constrained f-Entropic Risk Measures [3.9] 本稿では,f-発散による分布シフトとサブグループ不均衡をより細かく制御できる制約付きf-エントロピーリスク対策を導入する。
古典的および分解されたPAC-ベイジアン一般化境界をこのリスクの族に導出する。
我々は,自己バウンディングアルゴリズムを設計し,自己バウンダリを直接最小化し,サブグループレベルで保証されたモデルを生成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:02:13 GMT)
Dominant spin-spin relaxation mechanism at clock transition of the $Ho_{x}Y_{1-x}W_{10}$ complex at different concentrations [3.9] 時計転移時のスピン量子ビットは、周囲の核スピンに対して顕著な非感受性を示す。
最近の実験で、デコヒーレンス時間とスピン量子ビットの密度の相関が明らかになった。
スピン量子ビットの密度を最適化することにより、コヒーレンス特性を高め、量子デバイスの性能向上の道を開くことができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:29:16 GMT)
Mitigating Model Drift in Developing Economies Using Synthetic Data and Outliers [3.9] 本研究では, 予期せぬ衝撃に対するモデル安定性を向上させるために, ほとんど探索されていないアプローチである合成外圧器の使用について検討する。
実験の結果, 基本モデルと比較して, ごく少量の合成異常値を加えると安定性が向上することがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:30:24 GMT)
Rethinking How We Discuss the Guidance of Student Researchers in Computing [3.7] ファセット・フレームワーク内でのコンピューティングにおける学生研究者の指導について検討する。
指導の言語を拡大・曖昧化することにより、この手法は教員の責任の広さを明らかにしている。
私は、アドバイスやメンタリングのような特異な用語に対する過度な信頼は、教員の責任の完全な範囲を曖昧にしていると論じます。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:27:04 GMT)
RAG-Pull: Imperceptible Attacks on RAG Systems for Code Generation [3.7] 我々は,クエリや外部コードリポジトリに隠された文字を挿入する新たなブラックボックス攻撃であるRAG-Pullを開発する。
クエリとコードの摂動だけでは、検索を攻撃者が制御するスニペットにシフトできる一方で、クエリとターゲットの組み合わせによる摂動は、ほぼ完璧に成功する。
RAG-Pullの最小限の摂動は、モデルの安全性のアライメントを変更し、安全でないコードに対する嗜好を増大させ、LCMに対する新たな攻撃のクラスを開放する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:27:26 GMT)
Accelerated stochastic first-order method for convex optimization under heavy-tailed noise [3.6] 本研究では,重み付き雑音下での次数推定を行う凸関数と,凸関数の和によって目的関数が与えられる凸合成最適化問題について検討する。
我々は,バニラアルゴリズムがクリッピングや正規化などの付加的な変更を伴わずに,これらの問題に対して最適な複雑性を達成できることを実証した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:45:05 GMT)
Landscape of scattering universality with general dispersion relations [3.6] 相互作用と系の状態密度の相互作用によって支配される新しい普遍散乱現象の豊かな風景を明らかにする。
我々の発見は、原子配列とフォトニック結晶の分散関係がこれらの普遍的な振る舞いを探求する基盤となる合成量子システムに直接関係している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:02:02 GMT)
Mon CHÉRI: Mitigating Uninitialized Memory Access with Conditional Capabilities [3.5] CやC++のような言語におけるメモリセーフティの脆弱性の最大10%は、und変数に由来する。
この研究は、メモリ問題とメモリ問題に対する適切なソフトウェア緩和の頻度と欠如に対処する。
我々は、CHERI機能モデルを拡張して、以前の操作に基づいたメモリアクセスポリシーを可能にする「条件付き機能」を含むようにします。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:03:20 GMT)
Simplifying Optimal Transport through Schatten-$p$ Regularization [3.5] そこで我々はSchatten-$p$ノルム正規化を用いた最適輸送における低ランク構造回復のための新しい枠組みを提案する。
合成および実データに関する実験は、この手法の効率性、スケーラビリティ、低ランク輸送構造を復元する能力を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:22:28 GMT)
TBRD: TESLA Authenticated UAS Broadcast Remote ID [3.5] FAAは、無人航空機が位置、オペレーターの位置、アイデンティティをリアルタイムで放送することを要求するリモートID命令を導入した。
現在の標準では認証機構が不明確であり、スプーフィング、リレー、リプレイ攻撃が可能である。
本稿では,既存の標準やUAS機能と整合したリモートIDメッセージの認証システムを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:41:04 GMT)
CryptOracle: A Modular Framework to Characterize Fully Homomorphic Encryption [3.5] 本稿では,FHE のオープンソースライブラリ OpenFHE の詳細な特徴について述べる。
我々は,(1)ベンチマークスイート,(2)ハードウェアプロファイラ,(3)予測性能モデルからなるモジュラー評価フレームワークであるCryptOracleを紹介する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:04:18 GMT)
Lightweight CNN-Based Wi-Fi Intrusion Detection Using 2D Traffic Representations [3.5] 深層学習に基づくWi-Fi環境用ネットワーク侵入検知システム(NIDS)を提案する。
ネットワークトラフィックを2次元のデータ表現に変換し、畳み込みニューラルネットワーク(CNN)アーキテクチャに基づいたDLモデルのトレーニングに使用する。
実験結果から,提案手法は低推論時間で競合検出性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:59:24 GMT)
Semi-Unsupervised Microscopy Segmentation with Fuzzy Logic and Spatial Statistics for Cross-Domain Analysis Using a GUI [3.5] 本研究では,画像のモダリティと画像タイプにまたがる1時間キャリブレーション支援の非教師なしフレームワークを導入することにより,低コストで軽量なアノテーションのないセグメンテーション手法を提案する。
このフレームワークは,局所平均からの空間標準偏差による背景決定を行う。不確実な画素はファジィ論理,累積2乗シフトの結節強度,統計的特徴,および余分な偏差校正によって解決される。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:17:13 GMT)
Algorithmic Implementation: An Introduction to a Low-Cost, GUI-Based, Semi-Unsupervised Microscopy Segmentation Framework [3.5] 本稿では,標準CPUデスクトップを搭載した低予算研究室向けに設計された,新しい顕微鏡画像解析フレームワークを提案する。
Pythonベースのプログラムは、高度なコンピュータビジョンと機械学習パイプラインを通じて、カルチャー内の生きた、保存されていない細胞のサイトメトリー分析を可能にする。
プログラミングスキルを必要としないユーザフレンドリでクロスプラットフォームなGUIを通じてアクセスでき、開発者によるプログラム制御と統合のためのスクリプティングインターフェースを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:04:45 GMT)
Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics [3.5] 構造化状態空間モデリングをKAN(Kolmogorov-Arnold Networks)と統合するフレームワークを提案する。
SKANODEは、全トレーニング可能なkanをユニバーサル関数近似器として使用し、仮想センシングを行い、変位や速度などの解釈可能な物理量に対応する潜在状態を回復する。
シミュレーションおよび実世界のシステムに関する実験は、SKANODEが優れた予測精度を達成し、物理に一貫性のある力学を発見し、複雑な非線形挙動を明らかにすることを示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:37:03 GMT)
Investigating Memory in RL with POPGym Arcade [3.5] 本稿では,Atariにインスパイアされた,ハードウェアアクセラレーションによる,ピクセルベースの環境のコレクションであるPOPGym Arcadeを紹介する。
各環境は完全かつ部分的に観測可能な変種を提供し、観測可能性に関する反実的な研究を可能にする。
公正な比較には制御された研究が必要であることが分かり、無関係な歴史に対して価値関数が信用を損なうような病理を同定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:58:21 GMT)
Scalable Quantum Monte Carlo Method for Polariton Chemistry via Mixed Block Sparsity and Tensor Hypercontraction Method [3.5] 大規模分子系とアンサンブルのための縮小スケーリング補助場量子モンテカルロ(AFQMC)フレームワークを提案する。
我々は、低ランクのコレスキーブロックを圧縮するために、チョレスキー分解とテンソルハイパーコントラクションのブロック間隔を用いる。
この混合スキームは、好適なプレファクタで立方体CPU時間のスケーリングを実現し、AFQMCの精度を維持できることを実証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:15:41 GMT)
Improving Knowledge Graph Embeddings through Contrastive Learning with Negative Statements [3.5] 我々は,明示的に宣言された否定文を知識埋め込み学習プロセスに統合する新しいアプローチを導入する。
提案手法は汎用知識グラフとドメイン固有知識グラフの両方で評価され,リンク予測と3重分類タスクに着目した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:21:37 GMT)
AlphaZero Neural Scaling and Zipf's Law: a Tale of Board Games and Power Laws [3.4] 我々は,言語モデルスケーリングのモデルを用いて,強化学習アルゴリズムAlphaZeroのパワーロースケーリングについて検討した。
学習と推論データにおけるゲーム状態は,環境のツリー構造から生じることが知られているZipfの法則と一致している。
また、逆スケーリング(逆スケーリング)は、サイズを改良するモデルの失敗は、エンドゲーム状態が最も頻繁な状態である特異なZipf曲線と相関していることも見出した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:51:27 GMT)
Neutral Agent-based Adversarial Policy Learning against Deep Reinforcement Learning in Multi-party Open Systems [3.4] マルチパーティオープンシステムにおける様々なタスクシナリオにまたがる中立的エージェントベースアプローチを提案する。
本稿では,Starcraft II と自律走行シミュレーションプラットフォーム Highway-env に基づく SMAC プラットフォーム上で提案手法を評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:53:22 GMT)
Robust ML-based Detection of Conventional, LLM-Generated, and Adversarial Phishing Emails Using Advanced Text Preprocessing [3.3] テキスト前処理パイプラインを拡張したロバストなフィッシングメール検出システムを提案する。
提案手法は,広く採用されている自然言語処理(NLP)の特徴抽出技術と機械学習アルゴリズムを統合する。
フィッシングと正規のEメールの両方からなる公開データセット上で、我々のモデルを評価し、検出精度94.26%、F1スコア84.39%を達成した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:34:19 GMT)
The Minimal Search Space for Conditional Causal Bandits [3.2] 因果知識は意思決定問題を支援するのに使える。
本稿では、最適条件介入を含むことが保証される最小限のノードのグラフィカルな特徴について述べる。
次に、この最小のノード群を特定するために、O(|V| + |E|)$の時間複雑性を持つ効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:52:22 GMT)
Provably faster randomized and quantum algorithms for $k$-means clustering via uniform sampling [3.2] 本稿では、単純なランダム化されたミニバッチの$k$-meansアルゴリズムと、古典的アルゴリズムにインスパイアされた量子アルゴリズムについて述べる。
我々の改善は、$k$-means問題の特定の対称性を保存する一様サンプリングの注意深い使用による。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:44:52 GMT)
On the Mathematical Relationship Between Layer Normalization and Dynamic Activation Functions [3.1] 動的タン(DyT)が理論的基礎を欠いていることを示す。
DyISRUは、DyTよりも正確に外れ値の正規化効果を再現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:43:46 GMT)
FreshBrew: A Benchmark for Evaluating AI Agents on Java Code Migration [3.0] 我々は、プロジェクトレベルのJavaマイグレーションでAIエージェントを評価するための新しいベンチマークであるFreshBrewを紹介する。
我々は、いくつかの最先端のLCMをベンチマークし、それらの性能を既存のルールベースのツールと比較する。
228リポジトリのこのベンチマークにおけるAIエージェントの評価は、最高のパフォーマンスモデルである2.5 Gemini Flashがプロジェクトの52.3%を17.5%に移行できることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:55:18 GMT)
AI Alignment Strategies from a Risk Perspective: Independent Safety Mechanisms or Shared Failures? [3.0] AIアライメント研究は、AIシステムが害を起こさないようにする技術を開発することを目的としている。
すべてのアライメントテクニックには障害モードがあり、そのテクニックが安全を提供するのに失敗する見込みのない状況である。
リスク軽減戦略として、AI安全コミュニティは、ディフェンス・イン・ディープス・フレームワークをますます採用している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:16:59 GMT)
Saudi Sign Language Translation Using T5 [3.0] 本稿では,サウジアラビア手話(SSL)翻訳におけるT5モデルの適用について,新しいデータセットを用いて検討する。
SSLデータセットには3つの挑戦的なテストプロトコルが含まれている。
実験では,米国手話(ASL)データに対する事前学習の効果を,YouTubeASLデータセット上で事前学習したT5モデルとSSLデータセット上で直接学習したモデルとを比較して検討した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:18:34 GMT)
LH2Face: Loss function for Hard High-quality Face [2.9] ほとんどの顔認識アルゴリズムは、ソフトマックス分類とコサイン類似性に基づいている。
ハードハイクオリティフェイス(LH2Face)のためのロス関数という新しいロス関数の提案
我々のLH2Faceは、ハードな高品質の顔データセットのスキームよりも優れており、IJB-Bデータセットの49.39%の精度を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:05:40 GMT)
Reasoning on a Spectrum: Aligning LLMs to System 1 and System 2 Thinking [2.9] 大きな言語モデル(LLM)は印象的な推論能力を示すが、構造化されたステップバイステップの推論に依存しているため、限界が示される。
この作業は、ステップバイステップの推論が常に最適であるという仮定に挑戦し、タスク要求に基づいた推論戦略を適用する必要性を強調します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:48:10 GMT)
Efficient Group Lasso Regularized Rank Regression with Data-Driven Parameter Determination [2.8] 高次元回帰は、しばしば重み付きノイズと外れ値に悩まされ、最小二乗法の信頼性を著しく損なう。
頑健性を改善するため、非滑らかなウィルコクソンスコアに基づくランク目標を採用し、構造化群空間正規化を取り入れた。
また、データ駆動のシミュレーションに基づくチューニングルールを導入し、その結果の予測値に有限サンプル誤差を限定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:45:58 GMT)
Enhanced Sampling for Efficient Learning of Coarse-Grained Machine Learning Potentials [2.8] 我々は、データ生成の自由度に偏りを生じさせ、非偏りのあるポテンシャルに関して力を再計算する。
この戦略は、平衡データを生成するのに必要なシミュレーション時間を同時に短縮し、正しいPMFを保ちながら、遷移領域におけるサンプリングを強化する。
本研究は,CGの精度と信頼性を向上させるために,力マッチングのための改良されたサンプリングを有望な方向として活用することを支援する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:40:13 GMT)
ViDRiP-LLaVA: A Dataset and Benchmark for Diagnostic Reasoning from Pathology Videos [2.8] 計算病理学における最初の大規模マルチモーダルモデル(LMM)であるViDRiP-LLaVAを提案する。
単一のパッチイメージ、自動的に分割された病理ビデオクリップ、手動で分割された病理ビデオを含む3つの異なるイメージシナリオを統合している。
ViDRiP-LLaVAは、詳細な組織学的記述を生成し、確定的なサインアウト診断を達成することによって、診断的推論で視覚的物語を橋渡しする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:50:05 GMT)
On the Feasibility of Exact Unitary Transformations for Many-body Hamiltonians [2.8] ユニタリ生成器の随伴作用が有限次元作用素空間内の線型写像を定義するとき、正確なユニタリ変換が生じることを示す。
この観点は、単一の統一原理の下での正確な変換の以前の異なる例をもたらす。
本稿では,一括結合クラスタとインボリュートリージェネレータのためのこのフレームワークについて述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:09:43 GMT)
ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks [2.7] 制御障壁関数 (CBF) は自律システムの安全クリティカル制御の有効な方法として実証されている。
ハミルトン・ヤコビ(HJ)の到達可能性解析に基づく観測条件付きニューラルCBFを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:32:55 GMT)
Pattern-based Knowledge Component Extraction from Student Code Using Representation Learning [2.7] この研究は、学生の学習に不可欠な粒度のコードパターンとアルゴリズム構造を識別する自動化され、スケーラブルで説明可能なフレームワークを提供することで、コンピュータサイエンス教育における知識モデリングを推進している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:56:25 GMT)
Learning Satellite Attitude Dynamics with Physics-Informed Normalising Flow [2.7] 宇宙機の姿勢力学の学習に物理インフォームドニューラルネットワークを組み込むことの利点について検討する。
バシリスクシミュレータで生成されたシミュレーションデータに基づいて複数のモデルを訓練する。
PINNベースのモデルは、制御精度とロバスト性の観点から、純粋にデータ駆動モデルよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:14:16 GMT)
Disorder-Induced Strongly Correlated Photons in Waveguide QED [2.7] 遷移周波数の障害は フォトン・アンチバンチングと ほぼ完璧なフォトン・ブロッキングを 引き起こす
我々の研究は、障害が光子相関生成に与える影響を強調し、障害が強い相関性を持つ光子を得る可能性を高めることを示唆している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:16:20 GMT)
On Thompson Sampling and Bilateral Uncertainty in Additive Bayesian Optimization [2.5] 条件付き独立性を利用することで、次元を尊重するトンプソンサンプリングを効率的に行うことができることを示す。
トンプソンサンプリングに対する加法近似は、正確な方法よりもバランスの悪い性能を持つが、この差はほとんど実用的ではない。
これは理論的な理解を後押しし、BUを無視する近似が非漸近的体制においても実際にBOに十分であることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:00:06 GMT)
Establishing Minimum Elements for Effective Vulnerability Management in AI Software [2.5] 本稿では,AI脆弱性管理の最小要素と人工知能脆弱性データベース(AIVD)の確立について論じる。
AI脆弱性の公開、分析、カタログ化、文書化のための標準化されたフォーマットとプロトコルを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:26:48 GMT)
What Slows Down FMware Development? An Empirical Study of Developer Challenges and Resolution Times [2.5] この研究は、クラウドベースのプラットフォームとオープンソースリポジトリにわたるFMware開発に関する、初めての大規模分析である。
我々は,(1)FMwareの最も一般的なアプリケーションドメイン,(2)開発者が直面する重要な課題,(3)解決すべき最大の努力を必要とする問題の3つの分野を通して,FMwareエコシステムを調査した。
この結果から,教育,コンテンツ作成,ビジネス戦略に強い焦点が当てられ,メモリ管理,依存性処理,トークン化設定といった技術的課題が持続していることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:26:48 GMT)
Enhancing Self-Supervised Learning with Semantic Pairs A New Dataset and Empirical Study [2.4] インスタンス識別は、データセット内の個々のインスタンスを別々のクラスとして扱う、自己教師付き表現学習パラダイムである。
モデル表現の一般化性を高めるためにセマンティックペアを利用するための技術基盤を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:09:06 GMT)
FastHMR: Accelerating Human Mesh Recovery via Token and Layer Merging with Diffusion Decoding [2.3] 我々は2つのHMR固有のマージ戦略を紹介する: エラー拘束層マージ(ECLM)とマスク誘導トケンマージ(Mask-ToMe)である。
複数のベンチマーク実験により,本手法は最大2.3倍の高速化を実現し,ベースラインの性能はわずかに向上した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:23:17 GMT)
Reproducibility: The New Frontier in AI Governance [2.1] AIの現在の出版速度は、弱いプロトコルを通じて強力な科学的標準が欠如していることと相まって、政策立案者の影響力を効果的に侵食し、意味のある政策とガバナンスのプロトコルを実践している、と我々は主張する。
我々は、他の科学分野における危機のレンズを通して、AI研究における今後の危機を評価する。
政策立案者や政府は、プロトコルをガバナンス兵器の中核的なツールとみなし、AI研究のより高い標準を要求しなければならない、と我々は主張する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:34:25 GMT)
Active Subspaces in Infinite Dimension [2.1] 活性部分空間解析の望ましい性質の多くは、無限次元の設定に直接及んでいることを示す。
この方法論をデプロイして視覚化を作成し、複雑なテスト問題に対するモデリングと最適化を改善します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:30:55 GMT)
CodeWatcher: IDE Telemetry Data Extraction Tool for Understanding Coding Interactions with LLMs [2.1] textitCodeWatcherは軽量で控えめなクライアントサーバシステムで、Visual Studio Codeエディタ内のきめ細かいインタラクションイベントをキャプチャするように設計されている。
textitCodeWatcherは、CGTによる挿入、削除、コピーペーストアクション、フォーカスシフトなどの意味のあるイベントをログする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:39:08 GMT)
Simulating Persuasive Dialogues on Meat Reduction with Generative Agents [2.1] 肉の減肉はヒトと惑星の健康に恩恵を与えるが、社会的規範は肉を共有食の中心に保ち続ける。
本稿では,大規模言語モデルに基づく生成エージェント間の肉の減肉に関するマルチラウンド対話のシミュレーション研究について述べる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:38:26 GMT)
Continual Release of Densest Subgraphs: Privacy Amplification & Sublinear Space via Subsampling [2.1] エッジ微分プライベート(DP)グラフアルゴリズムのサブ線形空間連続リリースモデルについて検討する。
我々の主な成果は、最高の静的DPアルゴリズムの加算誤差と一致する最初の連続リリースDSGアルゴリズムである。
グラフDP設定にグラフの密度化を導入し、エッジを追加して初期サブサンプリングをトリガーし、事前の作業によって生じる誤差や空間の余分な対数要素を除去する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:20:13 GMT)
Contrastive Representation Distillation via Multi-Scale Feature Decoupling [2.0] グローバルな特徴をマルチスケールな局所的特徴に体系的に分離する,モデルに依存しない蒸留フレームワークであるMSDCRDを提案する。
総合的な実験により,MSDCRDは同質な教師・学生設定だけでなく,異種アーキテクチャでも優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:21:44 GMT)
A Constrained Multi-Fidelity Bayesian Optimization Method [2.0] 本稿では,新しい獲得関数を持つ制約付きマルチ忠実ベイズ最適化(CMFBO)手法を提案する。
具体的には,1)解析的にクローズドな式を持つ,2)実装が容易な,3)実現可能な初期サンプルを必要としない,効率的な獲得関数を設計する。
獲得関数の異なる組み合わせを用いた合成試験問題に対するアルゴリズムの有効性を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:45:54 GMT)
A Review on Quantum Circuit Optimization using ZX-Calculus [2.0] ZX計算は、セマンティックス保存量子回路最適化を可能にする代替フレームワークとして登場した。
本稿では、ZXに基づく量子回路の最適化について概観し、最適化手法、ターゲットメトリック、量子コンピューティングアーキテクチャにより分類する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:24:30 GMT)
Proportion and Perspective Control for Flow-Based Image Generation [1.9] 芸術的制御に特化した2つの制御ネットを導入・評価する。
パーセンテージコントロールネットは、オブジェクトの位置とスケールを決定するためにバウンディングボックスを使用し、パーセンテージコントロールネットは、シーンの3D幾何学を制御するために、消滅するラインを使用している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:34:28 GMT)
Coherent Load Profile Synthesis with Conditional Diffusion for LV Distribution Network Scenario Generation [1.9] ロードプロファイリングのアプローチは、典型的なプロファイルを通じて需要をまとめることに依存することが多い。
最終的に高電圧レベルのネットワーク操作に影響を及ぼすサブステーション間の共振は、しばしば見過ごされる。
低電圧分布サブステーションレベルでの日々のアクティブおよび反応性パワープロファイルの合成のための条件拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:40:39 GMT)
EvoCAD: Evolutionary CAD Code Generation with Vision Language Models [1.9] EvoCAD(エボCAD)は、コンピュータ支援設計(CAD)オブジェクトをシンボル表現で生成する手法である。
オイラー特性によって定義される位相特性に基づく2つの新しい指標を導入し、3次元オブジェクト間の意味的類似性を捉える。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:12:02 GMT)
Vision-Language Cross-Attention for Real-Time Autonomous Driving [1.9] XYZ-Driveは、フロントカメラフレームを読み、25m$times$25mのオーバーヘッドマップと次のウェイポイントを出力し、ステアリングとスピードを出力する単一の視覚言語モデルである。
軽量な目標中心のクロスアテンション層では、融合トークンが部分的に微調整されたLLaMA-3.2 11Bモデルに入る前に、ウェイポイントトークンが関連する画像とマップパッチをハイライトすることができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:30:09 GMT)
Indoor Localization using Compact, Telemetry-Agnostic, Transfer-Learning Enabled Decoder-Only Transformer [1.9] Locarisは、屋内ローカライゼーションのためのデコーダのみの大規模言語モデル(LLM)である。
LLMをさまざまなWi-Fiデータセットで微調整することで、Locarisは生信号からデバイス位置への軽量で一般化可能なマッピングを学習する。
この結果から,コンパクトLLMは室内局所化のためのキャリブレーションフリー回帰モデルとして機能することが示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:47:18 GMT)
Living Off the LLM: How LLMs Will Change Adversary Tactics [1.9] 悪質なアクターは、土地攻撃から逃れるために、システムにすでに存在している合法的なツールやプロセスを使います。
本稿では,将来デバイス上でのLDMが,脅威アクターがLDMを陸上攻撃パイプラインの生活に組み込むことによって,セキュリティ上の問題となるかを検討する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:41:27 GMT)
Real-Time Position-Aware View Synthesis from Single-View Input [1.9] 本稿では,単一入力画像とターゲットカメラのポーズからリアルタイムのビュー合成を実現する軽量な位置認識ネットワークを提案する。
この作業は、リアルタイムのリアルタイムおよびインタラクティブなテレプレゼンスアプリケーションを実現するための一歩となる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:18:29 GMT)
One Size Does Not Fit All: Exploring Variable Thresholds for Distance-Based Multi-Label Text Classification [1.8] 距離に基づく教師なしテキスト分類では、ラベルとテキスト間の意味的類似性を使用してラベルの関連性を決定する。
類似度分布は、モデル、データセット、さらにはラベルセットの間で統計的に有意な差異を示す。
検証セットを用いてラベル固有の閾値を最適化する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:52:14 GMT)
Native Language Identification in Turkish: L1 Influence of Arabic, Persian, and Albanian [1.8] 本稿では,トルコ語に対するNative Language Identification (NLI) の最初の応用について述べる。
我々はアルバニア語、アラビア語、ペルシア語の母語話者によって書かれたテキストのコーパスを分析する。
我々のモデルは有望な結果を得ることができ、最も予測可能な特徴を分析してL1特異的な伝達効果を明らかにする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:54:07 GMT)
GrASP: A Generalizable Address-based Semantic Prefetcher for Scalable Transactional and Analytical Workloads [1.8] GrASPは、分析処理とトランザクション処理の両方のための学習ベースのプレファーである。
論理ブロックアドレスデルタを活用し、クエリ表現と結果エンコーディングを組み合わせることにより、プリフェッチ精度とスケーラビリティを向上させる。
実世界のデータセットとインダストリアルベンチマークの実験では、GrASPがトレーニングデータよりも250倍大きなデータセットに一般化されていることが示されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:03:23 GMT)
Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the triangular lattice [1.7] 我々は、三角-格子反強磁性ハイゼンベルクモデルの研究のために、リカレントニューラルネットワーク(RNN)波動関数アンゼを用いている。
我々は、ハミルトニアン変換によりシミュレーションの精度を著しく改善できることを見出した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:55:48 GMT)
Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets on the square lattice [1.7] 機械学習に基づく変分モンテカルロシミュレーションは、量子多体基底状態をターゲットにするための有望なアプローチである。
我々は、リカレントニューラルネットワーク(RNN)を変分アンセットとして使用し、そのリカレント特性を活用して、徐々に大きなシステムの基底状態をシミュレートする。
トレーニング時間を増やすことで,シミュレーションの結果の精度を体系的に向上できることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:48:12 GMT)
End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF: A Reproducibility Study [1.7] 本稿では,Ma と Hovycitemaend が提案するシーケンスラベリングのための最先端のニューラルネットワークアーキテクチャについて述べる。
オリジナルのBiLSTM-CNN-CRFモデルは、畳み込みニューラルネットワーク(CNN)による文字レベルの表現、BiLSTMによる単語レベルのコンテキストモデリング、条件付きランダムフィールド(CRF)を用いた構造化予測を組み合わせる。
提案手法は,CoNLL-2003 NER上で91.18%のF1スコアを達成し,シーケンスラベリングタスクにおけるモデルの有効性を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:49:21 GMT)
Chronologically Consistent Generative AI [1.7] 時系列的に一貫性のある命令追従型大規模言語モデル群を導入し,ルックアヘッドバイアスを排除した。
結果として得られるフレームワークは、(i) シンプルで会話型のチャットインターフェース、(ii) 再現性を保証する完全なオープンで固定されたモデルの重み付け、(iii) 予測精度の保守的な下限を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:45:24 GMT)
Phaedrus: Predicting Dynamic Application Behavior with Lightweight Generative Models and LLMs [1.7] Phaedrusは、さまざまな実行インスタンスにわたる動的プログラムの振る舞いを予測するように設計された、新しいテキストコンパイラ支援のディープラーニングフレームワークである。
実験の結果,textitPhaedrus は WPP 関数のプロファイルサイズを最大107倍に削減できることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:53:54 GMT)
Evaluating LLMs for Demographic-Targeted Social Bias Detection: A Comprehensive Benchmark Study [1.7] 汎用AIモデルのトレーニングに使用される大規模なウェブスクレイプテキストコーパスは、しばしば有害な人口統計学的対象の社会的バイアスを含んでいる。
本稿では、人口統計学的対象の社会的偏見を検出するためのLCMの能力を評価するための、英語テキストを対象とした総合的な評価フレームワークを提案する。
次に,学習の促進,文脈内学習,微調整など,スケールとテクニックをまたいだモデルを用いて,体系的な評価を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:04:15 GMT)
Quantifying Dataset Similarity to Guide Transfer Learning [1.6] クロスラーニングスコア(CLS)は、ドメイン間の双方向のパフォーマンスを通じて、データセットの類似度を測定する。
CLSは、転送が性能を改善するか低下するかを確実に予測できる。
CLSは高次元問題に対する高価な分布推定の問題を回避するため、効率的かつ高速に計算できる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:18:35 GMT)
Transfer Learning with Distance Covariance for Random Forest: Error Bounds and an EHR Application [1.6] 集中型ランダムフォレスト(CRF)を用いた非パラメトリック回帰における伝達学習手法を提案する。
シミュレーションでは,データ駆動型特徴分割選択を用いた標準ランダムフォレスト (SRF) 法についても数値的に検討した。
本手法は小層病院におけるICU患者の死亡率の予測に有意な効果を示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:31:56 GMT)
FRIREN: Beyond Trajectories -- A Spectral Lens on Time [1.6] 長期時系列予測モデルは、ドメインにまたがって適用可能な汎用的なソリューションとしてしばしば提示される。
幾何学的構造は動的に依存しない基礎モデルの正しい抽象化であると主張する。
現代の生成フローと古典的なスペクトル分析を結びつけることで、FRIRENは正確かつ解釈可能な長期的な予測を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:18:53 GMT)
Attacks by Content: Automated Fact-checking is an AI Security Issue [1.6] これまでの研究では、攻撃者が悪意のある指示を注入する間接的なプロンプトインジェクションが研究されてきた。
我々は、エージェントを操作するために命令の注入は必要ないと主張する。
隠れたコマンドを検出することに焦点を当てた既存の防御は、コンテンツによる攻撃に対して効果がない。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:18:48 GMT)
Formalizing Style in Personal Narratives [1.6] 著者が行う言語的選択のパターンとして,個人的物語のスタイルを形式化する新しいアプローチを提案する。
本フレームワークは,機能言語学,コンピュータ科学,心理学的観察という3つの領域を統合している。
我々はこの枠組みを、外傷後ストレス障害を持つ退役軍人のケーススタディを含む、数百の夢物語に適用する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:58:35 GMT)
Clip Your Sequences Fairly: Enforcing Length Fairness for Sequence-Level RL [1.5] FSPO (Fair Sequence Policy Optimization) は,LLMの列レベルの強化学習手法である。
シークエンスレベルISを用いたRL法について検討し,PPO/GRPOスタイルのクリッピングをシークエンスに移植した場合のミスマッチを同定した。
理論的には、LRE (Longth Reweighting Error) によって長さの公平性を形式化し、小さなLREがクリップとクリップの間に方向のコサインを保証することを証明します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:18:07 GMT)
Efficient In-Memory Acceleration of Sparse Block Diagonal LLMs [1.5] 構造化されたスパーシリティは、リソース制約のあるシステムに大規模言語モデル(LLM)をデプロイすることを可能にする。
本稿では,CIMアクセラレータ上での疎LLM推論を高速化するための新しいマッピングとスケジューリング手法を提案する。
提案手法はCIM利用率を50%以上向上させ,メモリフットプリントと浮動小数点演算回数の両面で4倍以上の削減を実現した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:25:48 GMT)
Context-Aware Model-Based Reinforcement Learning for Autonomous Racing [1.5] 自律運転のためのモデルベース強化学習アルゴリズムの性能と一般化能力について検討する。
本稿では,既存の文献であるcMaskの文脈対応拡張を提案する。
文脈認識アルゴリズムは, 文脈自由アプローチに対して, 分布外敵の振る舞いを一般化することを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:09:09 GMT)
Finite Key Rates for QKD Protocols with Data Filtering [1.4] 我々は、フィルタリングと破棄を含む一般的な量子暗号プロトコルのセキュリティの新たな証明を導出する。
拡張B92プロトコルのセキュリティの証明に我々の手法をどのように利用できるかを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:57:57 GMT)
Comparative Evaluation of Neural Network Architectures for Generalizable Human Spatial Preference Prediction in Unseen Built Environments [1.4] 構築された環境における人間の空間的嗜好を予測する能力は、サイバー物理社会基盤システムの開発に有効である。
深層学習モデルは、複雑な空間的および文脈的依存関係の学習において有望であることを示している。
どのニューラルネットワークアーキテクチャが、目に見えないレイアウトに最も効果的であるかは、まだ不明である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:04:48 GMT)
GRIP: A Unified Framework for Grid-Based Relay and Co-Occurrence-Aware Planning in Dynamic Environments [1.4] GRIP, Grid-based Relay with Intermediate Planning は,3つのスケーラブルなバリエーションを備えた,統一されたモジュール化されたフレームワークである。
GRIPは動的2Dグリッドの構築、オープンボキャブラリオブジェクトの接地、共起型シンボリックプランニング、ハイブリッドポリシーの実行を統合する。
AI2-THORとRobothorベンチマークの実証結果によると、GRIPは最大9.6%の成功率、パス効率の2倍以上の改善を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 00:13:37 GMT)
Analyzing Data Quality and Decay in Mega-Constellations: A Physics-Informed Machine Learning Approach [1.4] 本研究は,メガコンステレーション(スターリンク)のための公開エフェメリスデータの正確性と信頼性を批判的に評価する。
約1500基のStarlink衛星の2ヶ月の実際の軌道データを解析することにより、高精度数値アルゴリズムと公表されたエフェメリドの相違を識別する。
軌道離脱時の衛星の加速度プロファイルを抽出し、再突入時の非保存力の影響に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:28:23 GMT)
TorchCor: High-Performance Cardiac Electrophysiology Simulations with the Finite Element Method on GPUs [1.3] 本稿では,CEPシミュレーションのための高性能PythonライブラリTorchCorを紹介する。
TorchCorは、特に大きな3Dメッシュにおいて、CEPシミュレーションを著しく加速する。
製造された解析解と$N$-versionベンチマーク問題に対して、解法の精度を検証した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:19:05 GMT)
Buildings for Synthesis with Clifford+R [1.3] クリフォード+Rゲート集合の正確な合成問題について検討し、この群に対して基礎となるブルハト・ティッツ・ビルディングの明示的な構造を与える。
この過程において、クリフォード+Rゲート集合の算術的性質の代替的証明を与える。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:30:39 GMT)
Invisible Languages of the LLM Universe [1.3] 数百万の話者を持つ2000の言語は、デジタルエコシステムでは事実上見えません。
分析の結果,AIにおける英語の優位性は技術的必要ではなく,言語知識を体系的に排除する権力構造の人工物であることが判明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:00:15 GMT)
Automated Skill Decomposition Meets Expert Ontologies: Bridging the Granularity Gap with LLMs [1.3] 本稿では,Large Language Models (LLM) を用いた自動スキル分解について検討する。
我々のフレームワークは、パイプラインをプロンプトと生成から正規化とオントロジーノードとのアライメントまで標準化する。
出力を評価するために、コンテンツ精度を評価するために最適な埋め込みベースのマッチングを使用するF1スコアと、粒度を評価するために構造的に正しい配置を信用する階層型F1スコアの2つの指標を導入する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:03:06 GMT)
Curl Descent: Non-Gradient Learning Dynamics with Sign-Diverse Plasticity [1.3] 学習力学は、基本的には非段階的な「カール」のようなコンポーネントを含む可能性があることを示す。
小さなカール項は元の解多様体の安定性を保ち、勾配降下と同様の学習力学をもたらす。
この結果から,多様な学習規則を通した堅牢な学習を支援することのできる,特定のアーキテクチャを同定した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:45:32 GMT)
GS-Verse: Mesh-based Gaussian Splatting for Physics-aware Interaction in Virtual Reality [1.2] バーチャルリアリティ(VR)内の3Dコンテンツを物理的に操作する現在の技術は、しばしば重大な制限に直面している。
我々の手法は、オブジェクトのメッシュをガウススプティング表現と直接統合することで、これらの課題を克服するために設計された新しい手法である。
私たちのシステムは物理工学に依存しないように設計されており、開発者に堅牢なデプロイメントの柔軟性を与えます。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:36:47 GMT)
Gym-TORAX: Open-source software for integrating RL with plasma control simulators [1.2] Gym-TORAXは、強化学習環境の実装を可能にするPythonパッケージである。
Gym-TORAXは、プラズマ力学をシミュレートするためのTORAXをラップする体育館環境を作成する。
現在のバージョンでは、国際熱核実験炉(ITER)の上昇シナリオに基づいて、1つの環境が容易に利用可能である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:16:25 GMT)
Attention Factors for Statistical Arbitrage [1.2] 統計的仲裁は、類似資産間の時間的価格差を利用する。
我々は、要因を通じて類似資産を共同で識別し、不正を識別し、取引政策を形成する枠組みを開発する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:56:30 GMT)
ProSEA: Problem Solving via Exploration Agents [1.1] 本稿では,探索と計画の進化を通じて反復的な問題解決を実現するために設計されたモジュール型汎用マルチエージェントフレームワークであるProSEAを紹介する。
ProSEAは階層的なアーキテクチャで、管理者エージェントがドメイン固有の専門家エージェントを編成し、タスクを分解し、失敗した試みからの構造化されたフィードバックに基づいて適応的に再計画する。
挑戦的な FinanceBenchベンチマークの実験では、人間からのフィードバックがなくても、ProSEAは最先端のベースラインより優れ、推論に重きを置くタスク全体で堅牢なパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:01:07 GMT)
R-GAT: Cancer Document Classification Leveraging Graph-Based Residual Network for Scenarios with Limited Data [1.1] Residual Graph Attention Network (R-GAT)は、バイオメディカルテキストのセマンティックおよびリレーショナル依存関係をキャプチャするために、マルチヘッドアテンションと残差接続を統合している。
R-GATは、BioBERTやBioClinicalBERTのようなトランスフォーマーベースのモデルに匹敵する安定かつ競争的な性能を実現している。
将来の研究を支援し、促進するために、キュレートされたデータセットもリリースします。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 03:41:16 GMT)
Steering LLMs for Formal Theorem Proving [1.1] 我々は,非公式な推論トレースに関連する残効活性化における線形方向を同定する推論時間介入を開発する。
このメカニズムはまた、大規模言語モデルのアクティベーション空間において、推論がどのように内部的にエンコードされているかについての解釈可能な情報を与える。
1) LLM の証明合成を導くための新しいアクティベーションベースの介入,(2) この介入が2つの復号化戦略の下で性能を向上させることの実証である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:51:18 GMT)
MMAP: A Multi-Magnification and Prototype-Aware Architecture for Predicting Spatial Gene Expression [1.1] 空間転写学(Spatial Transcriptomics:ST)は、空間情報を保存しながら遺伝子発現の測定を可能にする。
近年、ヘマトキシリンとエオシン(H&E)による全スライディング画像(WSI)を用いて、ディープニューラルネットワークによる転写産物全体の遺伝子発現プロファイルを予測する研究が進められている。
しかし, 組織像から空間遺伝子発現を予測することは, 視覚的特徴と分子信号との差が大きいため, 依然として難しい問題である。
本研究では,MMAP (Multi-Magnification and Prototype-enhanced Architecture) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:41:09 GMT)
Multi-View Majority Vote Learning Algorithms: Direct Minimization of PAC-Bayesian Bounds [1.0] 我々は PAC-Bayesian 理論を多視点学習に拡張し、R'enyi divergence に基づいた新しい一般化境界を導入する。
これらの境界は、R'enyi の発散の柔軟性を生かして、伝統的な Kullback-Leibler の発散に基づく代替となる。
また,第1次および第2次オラクルPAC-Bayesian境界を提案し,Cバウンドをマルチビュー設定に拡張する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:20:54 GMT)
Classical representation of local Clifford operators [1.0] 局所クリフォード作用素を導入し、与えられた$n$-GPM集合をユニタリ共役下の別の集合に写像する。
この枠組みは、一般化ベル状態(GBS)の集合の局所ユニタリ同値(LU同値)に対処するために用いられる。
両部系$mathbbC6otimes mathbbC6$ の 4$-GBS 集合の 31 同値類が LU-同値性の下で確かに異なることを証明している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:19:53 GMT)
Efficient Entanglement Purification Circuit Design for Dual-Species Atom Arrays [1.0] エンタングルメント浄化プロトコル(EPP)は、ノイズ量子系において高忠実な絡み合った状態を生成する。
蒸留可能な入力状態に対する忠実度向上と有限蒸留速度を両立させ, 精製性能の向上を図った。
本稿では,2種のRydberg原子配列に配向したEPPの効率的な回路設計を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:22:12 GMT)
Argumentation-Based Explainability for Legal AI: Comparative and Regulatory Perspectives [1.0] 人工知能(AI)システムは、法的文脈においてますます多くデプロイされている。
いわゆる「ブラックボックス問題」は、自動意思決定の正当性を損なう。
XAIは透明性を高めるための様々な方法を提案している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:19:15 GMT)
RIP Twitter API: A eulogy to its vast research contributions [1.0] 2023年、Twitterはデータアクセスを厳しく制限し、学術アクセスプログラムを解体し、Enterprise APIの料金を月4万2000ドルに設定した。
この手数料を支払う資金が不足しているため、学者たちは研究を続けるのに苦労している。
本研究は,2006年から2024年までのTwitterデータを用いて,論文数,引用数,出版日,規律,主要な研究トピックを体系的に集計する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:13:28 GMT)
Uncertainty-Aware ControlNet: Bridging Domain Gaps with Synthetic Image Generation [1.0] この作業では、ラベルのないドメインからデータを使用して、コントロールネットをトレーニングする手法を導入している。
この不確実性は、ある画像が下流タスクのトレーニング分布の一部ではないことを示している。
ControlNetによって、ターゲットドメインから高い不確実性を持つ注釈付きデータを作成することができます。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:41:28 GMT)
The Impact of Sanctions on decentralised Privacy Tools: A Case Study of Tornado Cash [1.0] Tornado Cashは、トランザクションのプライバシを高めるために設計されたスマートコントラクトプロトコルである。
アメリカ合衆国財務省は2022年8月にトルネード・キャッシュに対する制裁を課した。
制裁後,取引量,ユーザ多様性,プロトコル利用の大幅な削減が図られている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:46:22 GMT)
Clustering Deposit and Withdrawal Activity in Tornado Cash: A Cross-Chain Analysis [1.0] Tornado Cashは分散型ミキサーで、暗号技術を使って預金者と引き出し者の間のチェーン上の道を切断する。
本稿では,3つのクラスタリング, (i) アドレス再利用, (ii) トランザクショナルリンク, (iii) 時間整合規則を提案する。
分析の結果, 5.1~12.6%の引き出しは, アドレス再利用や取引リンクを通じて, 既に起源の鉱床まで遡ることができることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:49:17 GMT)
Benchmarking foundation models for hyperspectral image classification: Application to cereal crop type mapping [0.9] 本研究は、ハイパースペクトル画像を用いた穀物作物マッピングの基礎モデル3つをベンチマークする。
成績は総合的精度(OA)、平均精度(AA)、F1スコアで測定した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:21:59 GMT)
Semantic knowledge guides innovation and drives cultural evolution [0.9] 累積的な文化進化により、人類社会は世代を超えてますます複雑な知識と技術を生み出すことができる。
本研究では,概念とその機能間の意味的知識構造的関連が,累積的革新のための認知的足場を実現することを実証する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:03:51 GMT)
Auction Design using Value Prediction with Hallucinations [0.9] 我々は,販売者がn人の買い手に対して不可分な商品を売って収益を最大化しようとする問題について検討する。
本稿では,これらの信号が買い手の真の価値を反映することがあるが,時には幻覚となるような枠組みを提案する。
我々の主な貢献は、この枠組みの下での最適オークションのキャラクタリゼーションである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:49:32 GMT)
Detection of Performance Changes in MooBench Results Using Nyrkiö on GitHub Actions [0.9] Moobenchは継続的にGitHub仮想マシン上で動作し、トレースエージェントのオーバーヘッドを測定したが、変更検出は行わなかった。
Nyrki"o 変更検出サービスに計測値のアップロードを追加することで,パフォーマンス変化の検出を可能にした。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:02:18 GMT)
FRACCO: A gold-standard annotated corpus of oncological entities with ICD-O-3.1 normalisation [0.9] FRACCO(FRACCO)は、フランスの1301症例の専門的な注釈付きコーパスである。
各文書には、形態学、地形学、組織分化に関する用語が注記されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:00:11 GMT)
The Magic Barrier before Thermalization [0.9] 熱化過程における線形SU(2)プラケット鎖のサブシステムにおける絡み合いスペクトルの反平坦性の時間依存性について検討した。
その結果, 絡み合いエントロピーが急速に増大する時期には, バリア状最大値が示されることがわかった。
非アーベルゲージ理論の熱化の定量的シミュレーションには量子計算が必要であると結論付けている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:47:22 GMT)
FBS Model-based Maintenance Record Accumulation for Failure-Cause Inference in Manufacturing Systems [0.9] 本研究では,診断知識オントロジーを構築し,FBSモデルに基づく保守記録蓄積手法を提案する。
提案手法によって蓄積された保守記録を用いた故障原因推定では,専門家が列挙した候補要因との一致が良好であった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:37:40 GMT)
On efficiently computable functions, deep networks and sparse compositionality [0.8] 固定された入出力精度のチューリング計算能力は,有界(有界bサイズ)DAG表現の存在を示唆することを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:05:18 GMT)
Personalized and Constructive Feedback for Computer Science Students Using the Large Language Model (LLM) [0.8] 本稿では,学生評価における言語モデル(LLM)の性能について,事前に定義されたルーリックとマーキング基準を用いて検討する。
我々は,既存のLCMによるマーキングアセスメント,追跡,評価(LLM-MATE)の力を活用して,学生の学習を促進することを目的としている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:59:30 GMT)
OptiFLIDS: Optimized Federated Learning for Energy-Efficient Intrusion Detection in IoT [0.8] IoT環境では、セキュリティを確保するために効果的な侵入検知システム(IDS)が不可欠である。
従来の機械学習ベースのIDSモデルは一般的に大規模なデータセットを必要とするが、プライバシやセキュリティ上の懸念からデータ共有は制限されることが多い。
本稿では,モデル複雑性とエネルギー消費を低減するため,局所訓練中にプルーニング技術を適用したOptiFLIDSを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:48:26 GMT)
Intermediate chiral edge states in quantum Hall Josephson junctions [0.8] 量子ハル状態における局所ポテンシャル障壁によって変調された超伝導体-量子ホール-超伝導接合の輸送について検討した。
この方法では、中間カイラルエッジ状態(ICES)が寄与するSQHSジョセフソン接合の導電率の変化を評価することができる。
また、これらのSQHSジョセフソン接合における有界領域における格子効果を研究するために、我々の理論的枠組みを拡張できることが示されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:04:39 GMT)
Interoperability From OpenTelemetry to Kieker: Demonstrated as Export from the Astronomy Shop [0.8] 我々はOpenTelemetryのトレースデータをKeekerフレームワークに変換する方法について説明する。
これにより、例えばOpenTelemetryのインスツルメンテーションから木を呼び出すことができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:10:38 GMT)
Stabilizing the Staking Rate, Dynamically Distributed Inflation and Delay Induced Oscillations [0.7] 本研究では, インフレーションに基づく報酬システムの力学を解析し, ステークレートの安定化を図った新しい分布モデルを提案する。
我々の解法は発振を効果的に抑制し、目標離陸範囲内で収率を安定させる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:04:52 GMT)
Structural encoding with classical codes for computational-basis bit-flip correction in the early fault-tolerant regime [0.7] 本稿では,量子計算と古典的誤り訂正の機能を統合する新しいフレームワークを提案する。
このアプローチでは、古典的誤り訂正符号で定義されたコードワード部分空間内で量子計算を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:36:06 GMT)
Efficient Restarts in Non-Stationary Model-Free Reinforcement Learning [0.7] モデルフリーな非定常強化学習のための3つの効率的な再起動パラダイムを提案する。
RestartQ-UCBと比較して, 動的後悔を最大911ドル%減らすことができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:53:06 GMT)
Design and assembly of a cavity microscope with high numerical aperture for quantum simulations [0.6] 超低温原子を用いた量子シミュレーションのための空洞顕微鏡を提案する。
このシステムは、高精細な光学キャビティと、共通の光学軸を共有する一対の高精細な開口レンズを統合する。
2つのレンズは、それぞれ0.52ドルの数値開口を提供し、キャビティ軸に横切る全方向の最大光学アクセスを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:39:11 GMT)
A Taxonomy of Response Strategies to Toxic Online Content: Evaluating the Evidence [0.6] Toxic Online Content (TOC) には、有害で敵対的で、建設的な公開談話に害を与えるデジタルプラットフォーム上のメッセージが含まれている。
彼らの目標、用語、反応戦略、影響を評価する方法には幅広いバリエーションがある。
本稿では、より健全なオンライン公開談話を構築するために、あらゆる種類のオンラインスピーチを含むオンライン対応戦略の分類を同定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:22:36 GMT)
User Profiles of Sleep Disorder Sufferers: Towards Explainable Clustering and Differential Variable Analysis [0.6] 本研究では,睡眠障害プロファイルの異なる患者をグループ化するためのクラスタリング手法を提案する。
説明可能なアプローチを統合することで、これらの病理に影響を及ぼす重要な要因を特定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:23:17 GMT)
LLMs Reproduce Human Purchase Intent via Semantic Similarity Elicitation of Likert Ratings [0.6] 大規模言語モデル(LLM)は、合成消費者をシミュレートする代替手段を提供するが、数値評価を直接要求すると非現実的な応答分布を生成する。
本稿では,LLMからテキスト応答を抽出し,これらをLikert分布にマッピングする意味的類似度評価(SSR)を提案する。
このフレームワークは、従来の調査メトリクスと解釈可能性を維持しながら、スケーラブルな消費者調査シミュレーションを可能にする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:22:47 GMT)
Generalisation of automatic tumour segmentation in histopathological whole-slide images across multiple cancer types [0.6] このモデルは,大腸癌,子宮内膜癌,肺癌,前立腺癌患者の20万枚以上の全スライディング画像を用いて開発された。
単一癌型に特有なモデルとユニバーサルモデルを比較した場合, 性能の低下は認められなかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:18:15 GMT)
BanglaMATH : A Bangla benchmark dataset for testing LLM mathematical reasoning at grades 6, 7, and 8 [0.6] 本稿では,Arithmetic, Algebra, Geometry, Logical Reasoningなどのトピックにまたがる1.7kのBangla数学単語のデータセットであるBanglaMATHを紹介する。
Gemini 2.5 FlashとDeepSeek V3は、小学校の3学年で80パーセントの精度で強力なパフォーマンスを達成した唯一のモデルです。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:03:30 GMT)
ShishuLM: Lightweight Language Model with Hybrid Decoder-MLP Architecture and Paired Weight Sharing [0.6] 本稿では,パラメータカウントとキーバリュー(KV)キャッシュ要求の両方を削減できる,効率的な言語モデルアーキテクチャであるShishuLMを紹介した。
以上の結果から,ShshuLMは最大25%のメモリ要求を削減し,トレーニングと推論の両方で最大40%のレイテンシ向上を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:04:54 GMT)
Scaling Equilibrium Propagation to Deeper Neural Network Architectures [0.6] 活性化関数として$mathrmReLU$をクリップしたホップフィールドネットワークに残差(またはスキップ)接続を組み込んだホップフィールド・レスネットアーキテクチャを導入する。
Hopfield-Resnet13はCIFAR-10で93.92%の精度を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:06:01 GMT)
Open Quantum Dynamics Theory for Coulomb Potentials: Hierarchical Equations of Motion for Atomic Orbitals (AO-HEOM) [0.6] 熱浴中におけるクーロンポテンシャル系の量子力学について検討する。
我々は3次元回転不変系バス(3D-RISB)モデルを用いて原子軌道の数値的正確な「階層的運動方程式」を導出する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:26:38 GMT)
From Birdwatch to Community Notes, from Twitter to X: four years of community-based content moderation [0.5] Community Notes(以前はBirdwatchと呼ばれていた)は、2021年1月にXによって開始された最初の大規模クラウドソースコンテンツモデレーションイニシアチブである。
本稿では、コミュニティノートに関する文献の体系的なレビューと、コミュニティノートに関する今後の研究を支援するために、主要なキュレートされたデータセットと付随するソースコードを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:45:28 GMT)
When Language Model Guides Vision: Grounding DINO for Cattle Muzzle Detection [0.5] グラウンドディングDINOは、タスク固有のトレーニングや注釈付きデータなしで銃口を検出する視覚言語モデルである。
我々のモデルは平均平均精度(mAP)@0.5の76.8%を達成し、注釈付きデータを必要としない有望な性能を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:28:02 GMT)
TinyGraphEstimator: Adapting Lightweight Language Models for Graph Structure Inference [0.5] 本稿では,グラフ表現から直接グラフ理論パラメータを推定できる言語モデルについて検討する。
複数のランダムグラフモデルから生成された連結グラフの集合であるTinyGraphEstimatorデータセットを紹介する。
我々は、密度、クラスタリング、色数などのキーグラフパラメータを予測する能力に基づいて、いくつかの小さなオープンモデルを評価する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:00:15 GMT)
Bogoliubov quasi-particles in superconductors are integer-charged particles inapplicable for braiding quantum information [0.5] 数保存ハミルトニアンの下では、一体準粒子は通常、素粒子と同一の量子化された電荷と慣性質量を持つ。
本研究は、物理的熱化や緩やかな外場によるブレイド可能な量子状態の生成と操作における概念的課題を明らかにする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:28:06 GMT)
Multi-View Graph Feature Propagation for Privacy Preservation and Feature Sparsity [0.5] グラフニューラルネットワーク(GNN)は、関係データよりもノード分類タスクにおいて顕著な成功を収めている。
特徴行列は非常にスパースで、センシティブな情報を含んでいるため、パフォーマンスが低下し、プライバシーリスクが増大する。
本稿では,プライバシ保護を推進しつつ,特徴空間におけるノード分類を強化した新しい多視点特徴伝搬フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:42:00 GMT)
A Set-Sequence Model for Time Series [0.4] 本研究では,横断構造を直接学習し,表現性を向上し,手動の特徴工学を除去するモデルであるSet-Sequenceを提案する。
それぞれのステップで、置換不変のSetモジュールはユニットセットを要約し、Sequenceモジュールはその特徴と学習された要約の両方で条件付けられた各ユニットのダイナミクスをモデル化する。
合成感染タスクと2つの大規模な実世界のアプリケーションの中で、Set-Sequenceは強いベースラインを著しく上回り、シャープ比を高くし、AUCを改善し、解釈可能な断続サマリーを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:44:53 GMT)
Ontologies in Motion: A BFO-Based Approach to Knowledge Graph Construction for Motor Performance Research Data in Sports Science [0.4] 我々はMO|REデータから知識グラフを作成するためのビジョンを提示する。
私たちの目標は、モーターパフォーマンスデータのモデル化と、研究間での共有の方法を変えることです。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:21:33 GMT)
TextBandit: Evaluating Probabilistic Reasoning in LLMs Through Language-Only Decision Tasks [0.4] 大規模言語モデル(LLM)は、推論タスクを実行する能力がますます高まっていることが示されている。
しかし、不確実性の下でシーケンシャルな決定を行う能力は、自然言語のみを用いて探索されていない。
我々は,LLMが純粋にテキストフィードバックを用いて,マルチアームのバンディット環境と相互作用する新しいベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:44:48 GMT)
Rescaling-Aware Training for Efficient Deployment of Deep Learning Models on Full-Integer Hardware [0.3] 量子化対応トレーニング(QAT)は、トレーニング後の量子化に関連する精度の劣化を支援するが、推論中の整数再スケーリングの影響を見落としている。
超低ビット幅再スケーリングマルチプリカンドのための微調整法であるRescale-Aware Trainingを導入する。
実験により、再スケーラ幅を8倍に減らしても、完全な精度は最小限のインクリメンタルリトレーニングによって維持されることが示された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:55:34 GMT)
Causal Disentanglement Learning for Accurate Anomaly Detection in Multivariate Time Series [0.2] 本稿では,異常検出のための因果解離表現学習(CDRL4AD)を提案する。
まず、因果過程をモデル入力、時間的異質グラフ、因果関係として設計する。
第2に,異なる期間における因果関係を識別し,対応する因果関係を推定するために潜伏変数をアンタングルする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:26:20 GMT)
Don't Walk the Line: Boundary Guidance for Filtered Generation [0.2] そこで本稿では,分類器のマージンから独立して生成する強化学習ファインチューニング手法である境界誘導法を提案する。
ジェイルブレイクと曖昧なプロンプトのベンチマークでは、境界ガイダンスは出力の安全性と実用性の両方を改善している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:33:17 GMT)
Physics-Based Machine Learning Closures and Wall Models for Hypersonic Transition-Continuum Boundary Layer Predictions [0.2] 我々は、輸送モデルと境界条件を強化する物理制約付き機械学習フレームワークを開発する。
この2次元超音速平板流れをマッハ数とクヌーゼン数で評価した。
その結果,スキュート・ガウス分布関数壁モデルと組み合わせた無微量異方性粘度モデルにより,精度が大幅に向上した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:10:18 GMT)
The Enemy from Within: A Study of Political Delegitimization Discourse in Israeli Political Speech [0.2] 政治復調談話(PDD)の大規模計算研究について紹介する。
PDDは、政治的実体の規範的妥当性に対する象徴的な攻撃である。
我々は、クネセト語から引かれた10,410文からなるヘブライ語コーパスを使用する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:56:31 GMT)
Combining Euclidean and Hyperbolic Representations for Node-level Anomaly Detection [0.2] 我々はEuclideanとHyperbolic Graph Neural Networksを併用してノード表現の相補的な側面を捉えるフレームワークであるJanusを紹介する。
ヤヌスは浅い基底線と深い基底線を一貫して上回り、複数の幾何学的表現を組み合わせることでグラフの微妙で複雑な異常を識別するための堅牢で効果的なアプローチを実証的に示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:28:12 GMT)
Beyond Consensus: Mitigating the Agreeableness Bias in LLM Judge Evaluations [0.2] 新しいLarge Language Models(LLM)が数週間毎に利用可能になる。
LLMは高い精度で有効な出力を識別できるが、無効な出力を識別する能力は極めて乏しい。
我々は、欠落データに対して回復力のある最適なマイノリティ・ベト戦略を導入し、このバイアスを広範囲に緩和する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:19:23 GMT)
Local Timescale Gates for Timescale-Robust Continual Spiking Neural Networks [0.2] スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上でエネルギー効率の高い人工知能を約束する。
本稿では,2つの時間-コンスタントダイナミクスと適応的ゲーティング機構を組み合わせたニューロンモデルであるローカル・タイムスケール・ゲーティング(LT-Gate)を提案する。
以上の結果から,マルチタイムゲーティングはSNNにおける連続学習を大幅に向上させる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:31:07 GMT)
A novel quantum memory effect and thermal modulation in graviton-mediated entanglement [0.1] 我々は、量子化グラビトンが絡み合いを発生させ、波が通過した後でも永続的な量子メモリを残していることを示す。
実験によりグラビトンのマーカーを同定し、有限温度環境が重力の量子的性質を明らかにするのにどのように役立つかを研究するための枠組みを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:16:44 GMT)
Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products [0.1] データ、コンプライアンス、ビジネスプライバシのガバナンスは、特にヘルスケアや金融ビジネスにおいて重要である。
最近のAIエンタープライズAIアシスタントの出現により、ビジネス生産性が向上し、プライベートデータとコンプライアンスの保護が最優先事項となっている。
企業全体のAIアシスタントの実装により、ゼロデータ保持ポリシーを実装することで、ゼロデータ保持を実現することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:00:34 GMT)
Exploring the Spectral Edge in SYK Models [0.1] JT(Jackiw-Teitelboim)重力に関する以前の研究は、低温では熱処理されたエントロピーが負となり、焼成されたエントロピーから外れることを示した。
我々は、$mathcal N = 2$ 超対称SYKモデルでモデル化された物質で満たされた超対称ワームホールにおいて同様の効果を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:39:22 GMT)
Decoding non-invasive brain activity with novel deep-learning approaches [0.1] この論文は、脳波(EEG)や脳磁図(MEG)のような非侵襲的な電気生理学的脳信号の世界に展開する。
本研究の目的は、視覚刺激を知覚した時に脳に何が起こるか、あるいは隠れたスピーチ(インナースピーチ)に従事し、そのような刺激の復号性能を高めることである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:50:20 GMT)
Observation of ballistic plasma and memory in high-energy gauge theory dynamics [0.1] 高速量子シミュレータ上での高エネルギーゲージ理論における弾道プラズマの形成と長期記憶効果を観察する。
我々の観測は、多くの天体の傷跡によって説明できないが、電場と電流演算子の間のプラズマ振動の新しい理論によって捉えられる。
単純なゲージ理論の高エネルギー力学における実験的な驚きは、一般的な科学的発見のためのゲージ理論の高精度な量子シミュレーションの可能性を示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:46:31 GMT)
Tunable multi-photon correlations from a coherently driven quantum dot [0.1] 異なる光源によって生成された磁場を混合することは、非ガウス量子状態の工学における強力なアプローチとして現れている。
本研究では,コヒーレントレーザー場を用いた量子エミッタからの共鳴蛍光干渉による強度相関関数について検討した。
本研究では, 量子干渉と相関関数の正規化との微妙な相互作用から, 観測された束縛挙動が得られたことを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:51:01 GMT)
A Longitudinal Randomized Control Study of Companion Chatbot Use: Anthropomorphism and Its Mediating Role on Social Impacts [0.1] チャットボットが実際の人間関係を害したり、置き換えたりするのではないかという懸念が高まっている。
本研究では,人間とAIの相互作用が人間と人間の社会的成果に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:34:32 GMT)
The Adoption Paradox: A Comparative Analysis of Veterinary AI Adoption in China and the North America [0.0] 本研究は,中国と北米の獣医師における人工知能の認識,導入,応用について比較した。
AIの信頼性と正確性に関する懸念は、どちらのグループでも最大の障壁でした。
AIをグローバルな獣医の実践に責任を持って組み込むには、調整された地域固有の戦略が必要です。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:50:11 GMT)
Superior Molecular Representations from Intermediate Encoder Layers [0.0] 5種類の分子エンコーダにおける情報の流れを解析し,中間層がより汎用的な特徴を持つことを示す。
最適中間層からの凍結埋め込みを用いることで,最終層に比べて平均5.4%のダウンストリーム性能が28.6%向上することがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:11:30 GMT)
When Does Supervised Training Pay Off? The Hidden Economics of Object Detection in the Era of Vision-Language Models [0.0] 本稿では、教師付き検出とゼロショットVLM推論を比較した最初の総合的コスト効率解析について述べる。
監督されたYOLOは、標準カテゴリでゼロショットのGeminiに対して、91.2%の精度で68.5%の精度を達成した。
この利点は、投資額が5500万件を超えることを正当化し、1年間に15万1000枚の画像に匹敵する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:48:48 GMT)
W-Kernel and Its Principal Space for Frequentist Evaluation of Bayesian Estimators [0.0] 我々は、個々の観測の対数類似性を通して定義される後続共分散行列Wに焦点をあてる。
W の主空間は、最近提案されたベイズ的無限小ジャックニフ近似を用いて、頻繁な評価の中心でもある。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:00:34 GMT)
Validation of an Artificial Intelligence Tool for the Detection of Sperm DNA Fragmentation Using the TUNEL In Situ Hybridization Assay [0.0] 精子DNA断片化(SDF)は、従来の精液分析では評価に失敗する男性生殖評価において重要なパラメータである。
本研究では、位相コントラスト顕微鏡画像のディジタル解析により、SDFを検出するために設計された新しい人工知能(AI)ツールの有効性を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:32:11 GMT)
Theory of Three-Photon Transport Through a Weakly Coupled Atomic Ensemble [0.0] 非平衡量子系における多光子相互作用を理解することは、量子光学において顕著な課題である。
本研究では1次元導波路に弱結合した原子アンサンブルにおける3光子相互作用を探索するための解析的および図式的枠組みを開発する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:34:40 GMT)
The simplest 2D quantum walk detects chaoticity [0.0] 二次元閉領域(硬壁ビリヤード)における2つの空間座標に沿った1次元歩行を交互に行う単純なモデルを考える。
決定論的古典運動における境界形状によって引き起こされるカオス的あるいは規則的挙動は、量子化された問題に対するカオス的シグネチャに変換される。
ブニモヴィッチ・スタジアム - カオスビリヤード - のレベル統計は、パラメータ$delta simeq 0.1$のブロディ分布によって記述されている。
これは、弱いレベルの反発を示すとともに、固有関数の局在を向上し、平均参加率(PR)$simeq$ 1150であることを示している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:57:06 GMT)
The Quantum Measurement Problem: A Review of Recent Trends [0.0] 測定問題は1世紀近くもの間、物理学者や哲学者を悩ませてきた。
本稿では,計測問題の現状を概観し,よく理解されているものと未解決のものとを区別する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:09:37 GMT)
The PESCADO Method for Autonomous Systems: An Application to Photoionization at Near-optical Wavelengths [0.0] 水素のエネルギー差と放出角の光電子スペクトルを得るのに加え、吸収体がどのようにして、いつ、どのようにして検出器と見なされるかを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:32:51 GMT)
The Dirac equation and the Quantum Potential [0.0] 量子ポテンシャルがディラック方程式にどのように拡張できるかを考察する。
まず、ディラック方程式の幾何学と、これがクリフォード代数を用いてより明確になるかについて議論する。
Cl(2) のディラック波動関数を極形で書き直し、位相的非局所性により新しい振る舞いが生じることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:07:12 GMT)
Telecom-compatible cross-band quantum memory via dual photon modes dark-state polaritons [0.0] 量子メモリは、同期、量子リピータ、長距離エンタングルメント分布を可能にする量子ネットワークの重要な構成要素である。
アンサンブルをベースとしたほとんどの実現法は、795 nm in 8,7$Rbのような近赤外波長の暗黒状態の偏光子に依存しており、長いファイバー伝送が最適であるテレコムバンドとは遠く離れている。
ここでは、共有スピン波コヒーレンスにより、795nmと1324nmの2つのフォトニックモードをコヒーレントに結合する87$RbのDSPを同定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:29:18 GMT)
Task-Aware Reduction for Scalable LLM-Database Systems [0.0] 我々は、LCMのトークン予算を注目予算として扱い、タスク対応テキストの削減を、データシステムのための第一級設計原則である、と論じる。
ベンチマークの構築、適応型リダクションパイプラインの設計、トークンバジェット対応プリプロセッシングをデータベースや検索システムに統合するためのオープンな研究課題について概説する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:10:03 GMT)
Superradiance and Superabsorption Engine of $N$ Two-Level Systems: $N^{2}$-Power Scaling at Near-Unity Efficiency [0.0] そこで本研究では,(N)2レベル原子の試料のEmphcooperative SuperradianceとEmphsuperabsorptionを利用するサーマルエンジンを提案する。
このエンジンは、集合ポンプのサイクルを経て、単一のコールド貯水池を使用して動作し、その後に崩壊する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 23:35:14 GMT)
Structured Generative Modeling with the Thermodynamic Kolmogorov-Arnold Model [0.0] 構造的および帰納的バイアスを利用した熱力学コルモゴロフ・アルノルドモデル(T-KAM)を提案する。
T-KAMは、生成モデリングにおいてエレガントに一般的なトレードオフのバランスをとり、高速な推論、解釈可能性、安定したトレーニングを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:37:27 GMT)
Spin Environment of a Superconducting Qubit in High Magnetic Fields [0.0] 量子非破壊リードアウトとアクティブフィードバックを備えた超伝導量子ビットは、情報エンジンとして使用できる。
グラニュラーアルミニウムナノ接合フラクソニウム(グラルモニウム)のスペクトルとコヒーレンスをTesla以外の分野に耐性を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:30:05 GMT)
Spectroscopy of Sm$^{3+}$ Ions in the C$_{\rm s}$ Symmetry Centres of Hydrothermally Prepared K$_2$YF$_5$ Microcrystals [0.0] Sm$3+$ドープK$$YF$_5$マイクロ粒子の合成と分光特性について報告する。
粒子は熱水法により合成され, 粒子径は約20, mu$mとなった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:59:28 GMT)
Single-particle entanglement dynamics in complex systems [0.0] エントロピー力学を管理するシステムパラメータの1つの関数を同定する。
これは、機能によって特徴づけられる集合情報内容に対するエントロピーの感度を明らかにする。
この関数は、異なる量子状態の基礎となる接続の深い網と同様に、普遍性クラスを識別するためにも利用できる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:14:36 GMT)
Similarity Field Theory: A Mathematical Framework for Intelligence [0.0] 本稿では、実体間の類似性値の原則とその進化を定式化する数学的枠組みである「類似性場理論」を紹介する。
高いレベルでは、このフレームワークは、類似性に関する幾何学的な問題として、知性と解釈可能性を再設計する。
我々は、2つの定理を証明している: (i)非対称性は相互包含をブロックし、 (ii)安定性はアンカー座標または準位集合内の最終的な閉じ込めを必要とする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:42:31 GMT)
SeFEF: A Seizure Forecasting Evaluation Framework [0.0] 我々は,発作予測アルゴリズムの開発,評価,ドキュメントの効率化を目的としたPythonベースのフレームワークを紹介する。
このフレームワークは、データラベリング、クロスバリデーション分割、予測後処理、パフォーマンス評価、レポートを自動化する。
様々な予測水平線をサポートし、実装の詳細、トレーニングと評価設定、パフォーマンスメトリクスを文書化するモデルカードを含んでいる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:10:27 GMT)
Scalable and Explainable Enterprise Knowledge Discovery Using Graph-Centric Hybrid Retrieval [0.0] 現代の企業は、Jira、Gitリポジトリ、Confluence、wikiなどの異種システムに分散した膨大な知識を管理している。
本稿では,知識ベース言語拡張モデル(KBLam),DeepGraph表現,埋め込み型セマンティック検索を統合したモジュール型ハイブリッド検索フレームワークを提案する。
このフレームワークは、コード、プルリクエスト、コミット履歴を含む解析済みのリポジトリから統一された知識グラフを構築する。
大規模なGitリポジトリの実験では、統一推論層は、スタンドアロンのGPTベースの検索パイプラインと比較して、回答の妥当性を最大80%改善している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:56:36 GMT)
Rényi security framework against coherent attacks applied to decoy-state QKD [0.0] 我々は、コヒーレント攻撃下で量子鍵分布プロトコルの有限サイズセキュリティ証明のためのフレキシブルで堅牢なフレームワークを開発する。
提案手法は,最小限の要件を課しながら,幅広いプロトコルのクラスにわたる高い有限サイズ鍵レートを実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:30:54 GMT)
Reduced Effective Reorganization Energy for Adiabatic Electron Transfer [0.0] 我々はマーカス正規状態の断熱限界において、マーカス運動学は有効再編成エネルギーを減少させることで観測されると予測する。
この結果から, 閉鎖型Marcus-Hush-Chidsey型速度表現の導出が可能となった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:13:43 GMT)
Quechua Speech Datasets in Common Voice: The Case of Puno Quechua [0.0] Quechuasのようなアンダーリソース言語は、データとリソース不足に直面している。
本稿では,ケチュア語の共通音声への統合について検討する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:44:17 GMT)
Quantum-Theoretical Re-interpretation of Pricing Theory [0.0] ハイゼンベルクの観測可能な唯一の姿勢に触発され、潜伏した「情報」を価格状態間の観測可能な遷移に置き換える。
ヒルベルト空間表現を持つ離散価格格子上では、シフト演算子と価格のスペクトル計算は可観測周波数演算子と変換不変な畳み込み生成器を定義する。
非可換性は、仮定されるよりも観測可能なシフト代数から現れる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 07:24:54 GMT)
Quantum-Limited Acoustoelectric Amplification in a Piezoelectric-2DEG Heterostructure [0.0] 圧電材料上に積層された2次元電子ガス(2DEG)からなるヘテロ構造体におけるフォノン増幅の量子力学的記述を提供する。
印加ドリフト電圧は、2DEG電子の運動量状態の集団反転を効果的に生成し、フォノンの自然放出を引き起こす。
音波が発射されると、励起された電子は励起された放出によってフォノンを放出し、励起状態に戻る前に劣化した基底状態に戻る。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:51:17 GMT)
Quantum computing for heavy-ion physics: near-term status and future prospects [0.0] 我々は,高エネルギー核物理学における問題に対する量子情報科学の適用の最近の進歩について論じる。
我々は、新しい量子技術を用いた物質状態、ハードプローブ、スピン相関の研究に関する最近の結果を強調した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:41:29 GMT)
Quantum chaos and semiclassical behavior in mushroom billiards II: Structure of quantum eigenstates and their phase space localization properties [0.0] ブニモビキノコビリヤードの相空間における固有状態の局在について検討した。
情報エントロピーとPH関数の逆参加比による局所化の定量化を行う。
混合状態(純粋に正則でも完全カオスでもない)の固有状態の分数(英語版)は、有効半古典的パラメータのパワー・ローとして崩壊する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:50:36 GMT)
Quantum Synchronization of Perturbed Oscillating Coherences [0.0] このような振動モードを持つスピン系の一般的な弱い摂動に対する応答について検討する。
これらの摂動が対称性を破って1つの定常状態に導いたとしても、結果として生じる状態の位相相関は同期のシグネチャを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:41:08 GMT)
Quantum State-Aware Query Complexity: Krylov Compression and Polynomial Query Duality [0.0] この状態認識の観点は、量子クエリによるKrylov/Favard近似という最悪のケース境界を洗練させ、状態依存のスペクトル構造が均一な設計よりも大幅に節約できるかを説明している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:00:03 GMT)
Quantum Information Processing with Spatially Structured Light [0.0] 空間構造光を用いた量子光学回路の進歩を概観する。
我々は,マルチプレーン光変換,複雑な散乱媒体,マルチモード,マルチコアファイバなどのプラットフォームに基づく回路を強調した。
本稿では,多次元および多モード量子状態の操作と測定への応用について論じる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:48:06 GMT)
Probing arbitrary polarized photon pairs undergoing double Compton scatterings by a dedicated MC simulator validated with experimental data [0.0] 2光子系の偏光度における量子相関は広く研究されている。
バイパルタイト光子の初期偏光状態をシミュレートできるGeant4ベースのモンテカルロ・ウィーン=ワルシャウモデルを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:58:28 GMT)
Part-of-speech tagging for Nagamese Language using CRF [0.0] 本稿では,ナガメ語における自然言語処理(NLP)の重要な課題である音声タグ付けについて検討する。
16,112個のトークンの注釈付きコーパスを作成し、条件ランダムフィールド(Conditional Random Fields, CRF)として知られる機械学習技術を適用した。
CRFを用いて、全体のタグ付け精度は85.70%、精度は86%、f1スコアは85%である。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:54:53 GMT)
PAGE: Prompt Augmentation for text Generation Enhancement [0.0] PAGE(Prompt Augmentation for text Generation Enhancement)は、自然言語生成モデルを支援するために設計されたフレームワークである。
補助的な生成モデルを必要としない、代わりに、異なるタスクに容易に適応できる、よりシンプルでモジュール化されたアーキテクチャを提案する。
本稿では,その提案とコンポーネント,アーキテクチャについて述べるとともに,要件工学の領域における概念実証について報告する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 21:31:04 GMT)
Optimal spatial searches with long-range tunneling [0.0] グラバーの最適スケーリングは、長距離相互作用粒子の格子上に低次元で到達可能であることを示す。
我々の研究は、長距離システムの臨界度と短距離システムの臨界度を正確に関連付けている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:03:17 GMT)
Operand Quant: A Single-Agent Architecture for Autonomous Machine Learning Engineering [0.0] Operand Quantは、自律機械学習エンジニアリングのための単一エージェントアーキテクチャである。
MLE-ベンチマーク(2025年)では、オリンド・クァンタムが新しい最先端(SOTA)の結果を達成し、合計で75の問題に対して0.3956 +/- 0.0565のメダルを獲得した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:54:02 GMT)
One-dimensional tunneling of the two-body bound state [0.0] 我々は、2つの結合した非単位原子によって形成された1次元二量体を、その一方が原点に位置するゼロレンジポテンシャルと相互作用するときに考える。
二量体局所化波動関数と散乱波動関数を計算することにより、2体境界状態崩壊のない系の特性を同定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:52:10 GMT)
On the Speed-up of Wave-like Dark Matter Searches with Entangled Qubits [0.0] 我々は、異なるエラーレジーム間の絡み合った量子ビットプロトコルの帯域幅とスキャンレート性能を解析する。
位相ベースのエンタングルプロトコルの読み出しは、クビット数とは無関係に探索帯域を保存する。
この分析をダークフォトンサーチに適用すると、約100量子ビットの絡み合った状態が競合する可能性があることが分かる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:00:11 GMT)
On Experiments [0.0] 科学的プロセスは、実験の結果を、私たちが生きている世界に関する知識に変える手段です。
これを行うには、正確な数学的言語で科学過程を定式化する必要がある。
この資料は、過去の偉大な思想家や、より近代的な貢献に基づいている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:48:38 GMT)
Observation of anomalous tunneling in collective excitations via a cloud experiment platform for Bose-Einstein condensates [0.0] OqtantはクラウドでアクセスできるBose-Einstein Condensatesのプラットフォームである。
異常トンネルがBECの集合励起に及ぼす影響を観察する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:32:17 GMT)
Nonlinear discretizations and Newton's method: characterizing stationary points of regression objectives [0.0] 正確な曲率情報に依存すると、ニューラルネットワークのトレーニングが確実に失敗することを示す。
障害モードは、非線形離散化の幾何学と損失ランドスケープにおける定常点の分布の両方について洞察を与える。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:29:52 GMT)
Non-perturbatively slow spread of quantum correlations in non-resonant systems [0.0] 我々は、強い障害は、ユニタリ量子力学の下での弾道情報伝達の非摂動的に小さな速度につながることを示す。
我々はまた、絡み合いが対数的にゆっくりと広がる「先熱多体局在状態」の存在を証明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:29:36 GMT)
Non-Hermitian Realization of Quantum Dynamics on Embedded Manifolds [0.0] 一般の時間周期的想像ポテンシャルによって駆動される量子粒子のフロケハミルトニアンは、ストロボスコープの時間において全く同じであることを示す。
我々は、正弦波駆動と革命のトーラスの構成を説明し、このフレームワークが曲面空間量子力学の実験設計をガイドする方法を概説する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:55:16 GMT)
Newton-Puiseux Analysis for Interpretability and Calibration of Complex-Valued Neural Networks [0.0] 複雑なニューラルネットワーク(CVNN)は、心電図(ECG)、レーダー/ソナー、無線の位相/四分法(I/Q)ストリームなどの位相感受性信号を扱うのに適している。
訓練されたCVNNの局所的決定幾何を,小型のキンク対応サロゲートに適合させて検討するNewton-Puiseuxフレームワークを提案する。
我々のフェーズアウェア分析は、制御された$C2$合成ベンチマークを超える2つのケーススタディにおいて、センシティブな方向を特定し、予測エラーを強化する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:27:15 GMT)
Neural networks for neurocomputing circuits: a computational study of tolerance to noise and activation function non-uniformity when machine learning materials properties [0.0] NNアーキテクチャとトレーニング体制の機能における回路ノイズとNAFの不均一性の影響について検討する。
NNは一般にノイズ耐性が低く、モデル精度はノイズレベルで急速に低下している。
実際に実現されたNAFの形状を用いてNNを再訓練することにより、活性化関数の不均一性の効果を緩和できることを実証した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:27:08 GMT)
Nepali Sign Language Characters Recognition: Dataset Development and Deep Learning Approaches [0.0] 本研究では,ネパール手話(NSL)の最初のベンチマークデータセットを紹介する。
認識性能を評価するため、データセット上でMobileNetV2とResNet50アーキテクチャを微調整し、それぞれ90.45%と88.78%の分類精度を達成した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:29:08 GMT)
NV3D: Leveraging Spatial Shape Through Normal Vector-based 3D Object Detection [0.0] 本稿では, ボクセル近傍から取得した局所的特徴を, ボクセルベース毎の正規ベクトルとして利用する新しいモデルNV3Dを提案する。
この情報的特徴により、NV3Dは、車、歩行者、サイクリストを含む、表面と関連するターゲットエンティティの関係を決定できる。
提案手法は,KITTIデータセットを用いて学習し,車と自転車の空間形状による検出において優れた性能を示した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:13:06 GMT)
N-output Mechanism: Estimating Statistical Information from Numerical Data under Local Differential Privacy [0.0] ローカル微分プライバシー(LDP)は、機密データ収集において重要なプライバシー上の懸念に対処する。
既存の LDP 機構は、非常に小さな (|Omega| in 2, 3$) か無限出力空間に最適化される。
数値データを$N$の離散出力にマッピングする一般化されたフレームワークである textbfN-output 機構を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:06:59 GMT)
Modeling AdaGrad, RMSProp, and Adam with Integro-Differential Equations [0.0] 本稿では,AdaGrad,RMSProp,Adam最適化アルゴリズムの連続時間定式化を提案する。
我々はこれらの方程式の数値シミュレーションを行い、安定性と収束解析を行い、それらの妥当性を元のアルゴリズムの正確な近似として示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:50:24 GMT)
Medical Interpretability and Knowledge Maps of Large Language Models [0.0] LLMは, 4つの異なる解釈可能性技術を用いて, 医療知識を表現・処理する方法について検討した。
患者の年齢, 症状, 疾患, 薬物に関する知識を格納した5つのLCMの知識マップを粗い解像度で提示する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:34:05 GMT)
Learning by Steering the Neural Dynamics: A Statistical Mechanics Perspective [0.0] 我々は、ニューラルネットワークが完全に局所的な分散学習をサポートする方法について研究する。
そこで本研究では,任意のバイナリ再帰ネットワークを用いた教師あり学習のための生物学的に妥当なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 22:28:34 GMT)
LLMBridge: Reducing Costs in a Prompt-Centric Internet [0.0] LLMBridgeは、開発途上国や教育など、コストを意識したユーザ向けに設計されたプロキシである。
モデル選択、コンテキスト管理、セマンティックキャッシングの3つの主要な最適化をサポートしている。
WhatsAppベースのQ&Aサービスと大学の教室環境です。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:40:32 GMT)
Knowledge-Guided Machine Learning Models to Upscale Evapotranspiration in the U.S. Midwest [0.0] エバポ蒸散(ET)は陸上と大気の相互作用において重要な役割を担っているが、その正確な定量化は依然として困難である。
本研究は,ツリーベースおよび知識誘導型機械学習(ML)技術とマルチスペクトルリモートセンシングデータ,格子状気象データ,ECデータを統合し,米国中西部のETをスケールアップする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:15:40 GMT)
How many samples to label for an application given a foundation model? Chest X-ray classification study [0.0] 特定ROC-AUC閾値に必要なトレーニングサイズを予測するために,パワー・ロー・フィット(Power-law fits)の評価を行った。
XrayCLIP と XraySigLIP は,ResNet-50 ベースラインよりもラベル付きサンプルの方がはるかに少ない性能を実現している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:53:55 GMT)
How Gravity Can Explain the Collapse of the Wavefunction [0.0] 物質と重力を統一する基本理論が波動関数の崩壊のように見えるものをもたらす理由について、簡単な議論を述べる。
結果のモデルはローカルでパラメータフリーで、テスト可能な予測を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:13:27 GMT)
Harvesting Contextuality from the Vacuum [0.0] 量子文脈性 (quantum contextuality) とは、特定の測定シナリオがそれらの統計のグローバルな記述を含まないという概念である。
文脈性は非局所的絡み合いと魔法の概念を一般化し、ウィグナー負性に対する非古典性の概念と同等のものであることが示されている。
本稿では、文脈性収穫のプロトコルを導入し、Unruh-DeWittモデルが量子テクスチュアリティを収穫できることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:58:22 GMT)
Generative Deep Learning Framework for Inverse Design of Fuels [0.0] 燃料の高速な逆設計を可能にするために、生成的深層学習フレームワークが開発された。
GDB-13データベースのサブセットは、修正されたRONデータベースに富んだもので、モデルトレーニングに使用される。
次に、独立回帰モデルを用いてRON予測を洗練させ、VAE潜在空間を効率的にナビゲートする微分進化アルゴリズムを用いる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 20:56:22 GMT)
General model and modulation strategies for Sagnac-based encoders [0.0] サニャックループに基づく変調器は、環境変動に対して固有の安定性を提供する。
サニャック変調器の包括的モデルを提案し、強度と偏光変調の両方を捉える。
本研究では,サニャック変調器を次世代フォトニック・量子通信システムのための汎用的で安定なプラットフォームとして確立した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 19:32:35 GMT)
French on London and Bauer, and QBism [0.0] 私は、現象学からインスピレーションを得る量子力学の解釈を、スティーブン・フレンチによって記述されたロンドン・バウアー=フレンチ解釈(以下、LBF)とQBismの2つを比較した。
私は、QBismとLBFの相違点に特に注意を払うとともに、QBismは現象学における重要な考えと矛盾しているかもしれないというフランスの主張も挙げる。
私は、QBismはLBFにおける量子測度の概念とは相容れないというフランスの主張と一致する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:42:08 GMT)
Free Independence and Unitary Design from Random Matrix Product Unitaries [0.0] ユニタリランダム性は、量子情報の基本的タスクと量子カオスの理論の両方を支える。
ランダム・マトリックス・ユニタリ・アンサンブルにおける自由度の発生について検討する。
局所観測可能物質は、カオス多体系における熱化を正確に予測するものである。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:44:08 GMT)
FinVet: A Collaborative Framework of RAG and External Fact-Checking Agents for Financial Misinformation Detection [0.0] FinVetは2つのRetrieval-Augmented Generationパイプラインと外部ファクトチェックを統合する新しいフレームワークである。
証拠に裏付けられた評決、情報源の属性、信頼度スコア、証拠が不十分な場合に明確な不確実性フラグを提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:31:49 GMT)
Fighting Exponentially Small Gaps by Counterdiabatic Driving [0.0] 急激な小間隙を通した断熱路の加速における近似逆断熱駆動(CD)の効率について検討した。
その結果, 1次量子相転移に伴うボトルネックを克服する上で, 局所的なCD法が与える影響は限定的であることがわかった。
基底状態と第1励起状態を結ぶ近似フルCDを用いた量子ブラキストロン反断熱駆動(QBCD)を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 06:55:19 GMT)
Fairness Metric Design Exploration in Multi-Domain Moral Sentiment Classification using Transformer-Based Models [0.0] この研究は、BERTとDistilBERTを、ドメイン内およびクロスドメインプロトコルを備えたマルチラベル設定で評価する。
ラベル毎の分析では、全体のスコアによって隠された公平性違反が明らかになる。
本稿では,道徳的基礎検出のドメイン間安定性を定量化するMFC(Moral Fairness Consistency)指標を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:05:57 GMT)
FUSE: Fast Semi-Supervised Node Embedding Learning via Structural and Label-Aware Optimization [0.0] 3つの相補的目的を共同で最適化する高速半教師あり組込みフレームワークを提案する。
標準ベンチマークにおいて,本手法は最先端手法と同等以上の分類精度を一貫して達成する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:39:58 GMT)
Exploring Artificial Intelligence and Culture: Methodology for a comparative study of AI's impact on norms, trust, and problem-solving across academic and business environments [0.0] 本稿では,人工知能(AI)と人間の認知,問題解決,文化適応の両面的関係を検討するための厳密な枠組みを提案する。
私たちは、AI知識、知覚能力、信頼軌道、文化的反応を追跡する3波長手設計を採用しています。
私たちは、初期抵抗、探索的採用、文化的埋め込みのフェーズを通じてAIの培養をトレースし、独自の信頼曲線とコンテキストによる問題解決戦略を明らかにします。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:31:31 GMT)
Explainability, risk modeling, and segmentation based customer churn analytics for personalized retention in e-commerce [0.0] 本研究は、特徴貢献を定量化するための説明可能なAIを統合した3成分フレームワーク、時間と時間の間のチャーンリスクのモデルへの生存分析、取引行動による顧客分割のためのRAMプロファイリングを推進した。
これらの手法を組み合わせることで、チャーンドライバの帰属、介入窓の推定、ターゲットアクションのセグメントの優先順位付けが可能となり、顧客の信頼度を低下させる戦略を支援することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 16:44:24 GMT)
Experimental Demonstration of the PBR Test on a Superconducting Processor [0.0] 我々は、IBMの156量子ビットHeron2 Marrakesh量子プロセッサにPusey-Barrett-Rudolph(PBR)のノーゴー定理を実験的に実装した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:46:52 GMT)
Exact WKB method for radial Schrödinger equation [0.0] 我々は、現代の復活の観点から、ラジアルシュリンガー問題に対する正確なWKB量子化を再考する。
単純な回転点と正則特異点での接続公式を用いて、非自明なサイクルデータがスペクトルを与えることを示す。
我々の分析は、放射状条件において、数学的モノドロミーデータと物理的境界条件がいかに細かであるかを明らかにし、復活に基づく量子化における経路選択に関する最近の議論に対処する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:34:27 GMT)
Evaluating the effects of preprocessing, method selection, and hyperparameter tuning on SAR-based flood mapping and water depth estimation [0.0] ガロンヌ川(フランス)での2019年と2021年の2回の洪水について評価を行った。
スペックルフィルタの選択は、数平方キロメートルのバリエーションで洪水範囲の推定を変化させる。
洪水マッピング手法の選択とチューニングも性能に影響する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:54:42 GMT)
Error mitigation for partially error-corrected quantum computers [0.0] 本稿では,部分的に誤り訂正された量子コンピュータにおける量子エラー軽減手法を提案する。
連続的な時空トレードオフにおける誤差キャンセルのサンプリングの複雑さを、論理的アンシラ量子ビットが任意に軽減できることを示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 02:02:22 GMT)
Error Correction in Dynamical Codes [0.0] 我々は、一連の測定で定義される量子エラー訂正符号の一般的な枠組みを問う。
本研究では,このプロトコルを用いてエラーシンドロームに関する情報を追跡し,動的コードの距離を決定するアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 05:34:21 GMT)
Enhancing Maritime Domain Awareness on Inland Waterways: A YOLO-Based Fusion of Satellite and AIS for Vessel Characterization [0.0] 内陸水路におけるMDA(Maritime Domain Awareness)は,協調システムの脆弱性によって問題視されている。
本稿では,高解像度衛星画像と自動識別システム(AIS)の容器軌道データとを融合する新しい枠組みを提案する。
You Only Look Once (YOLO) v11オブジェクト検出モデルは、船舶タイプ、バージカバー、運用状況、バージカウント、旅行方向によって、船舶やバージを検出し、特徴付けるために使用される。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:19:58 GMT)
Enforcing convex constraints in Graph Neural Networks [0.0] 本稿では,入力依存制約を満たすグラフニューラルネットワークフレームワークであるProjNetを紹介する。
我々はCADの収束結果を確立し,大規模入力を効率的に処理するニューラル高速化実装を開発した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 10:10:46 GMT)
Emergence of hybrid computational dynamics through reinforcement learning [0.0] 強化学習と教師付き学習がニューラルネットワークを根本的に異なる計算ソリューションへと導くことを示す。
また,RL彫刻は暗黙の正則化の強力な形態を通じて,機能的にバランスのとれた神経集団を彫刻することを示した。
本結果は,創発的計算の第一決定因子として学習アルゴリズムを確立した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:53:59 GMT)
Electron-positron pair creation in a supercritical static asymmetric potential well [0.0] 亜臨界非対称ポテンシャル井戸における境界状態の位置を決定するための解析公式を導出し、2つの方法で超臨界非対称ポテンシャル井戸に拡張する。
2つの方法のうちの1つは、境界状態の位置を予測できるだけでなく、ペア生成率も提供する。
超臨界非対称ポテンシャル井戸と超臨界ソーターポテンシャルからなる超臨界非対称ポテンシャル井戸におけるペア生成率は、それぞれのポテンシャルによって生成されるペア生成率の和を超えることが判明した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 04:33:46 GMT)
Early-Warning of Thunderstorm-Driven Power Outages with a Two-Stage Machine Learning Model [0.0] 雷雨による停電は、ほとんどの嵐が損傷を起こさないため予測が困難であり、対流過程は急速にカオス的に発生し、利用可能な公開データはノイズと不完全である。
我々は,ミシガンの夏期早期警戒モデル,雷雨関連停電をオープンソース(EAGLE-I,気象用24-48R)のみを用いて開発した。
我々は、アメリカ合衆国エネルギー省のオークリッジ国立研究所(Oak Ridge National Laboratory)が管理している、公開されたMETA-I機能停止データセット(2014-2022)を使用します。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:41:56 GMT)
ENIGMA: The Geometry of Reasoning and Alignment in Large-Language Models [0.0] エントロピー多言語モデルアライメント(ENIGMA)について述べる。
組織の方針や原則を、モデルの情報多様体に移動する方向として扱うことで、推論、アライメント、ロバスト性を改善する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:13:09 GMT)
Decentralization: A Qualitative Survey of Node Operators [0.0] ブロックチェーンノードオペレータから‘分散化’と‘分散化劇場’の定義を求めます。
ほとんどのオペレータは、技術的な軸とガバナンス軸に広く存在するものとして、分散化を考えています。
私たちの重要な発見は、分散化だけでは台帳の不変性やシステム的堅牢性に影響を与えないということです。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:07:53 GMT)
Cross-Scale Reservoir Computing for large spatio-temporal forecasting and modeling [0.0] 本稿では,高解像度データセットの予測のための新しい貯水池計算手法を提案する。
粗い層からの多分解能入力を組み合わせることで、我々のアーキテクチャは局所的および大域的両方のダイナミクスをよりよく捉えることができる。
長期予測において標準的な並列貯水池モデルを上回っている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 09:43:29 GMT)
Countermind: A Multi-Layered Security Architecture for Large Language Models [0.0] 本稿では,多層型セキュリティアーキテクチャであるCountermindを提案する。
アーキテクチャは、すべての入力を構造的に検証し変換するように設計された強化された周辺装置と、出力が発生する前にモデルのセマンティック処理経路を制約する内部ガバナンス機構を提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:41:18 GMT)
Convergence Analysis of Galerkin Approximations for the Lindblad Master Equation [0.0] 本稿では、無限次元ヒルベルト空間上のリンドブラッドマスター方程式の数値近似を解析する。
空間的離散化には古典的なガレルキン法を用い、離散化された解の正確な解への収束について検討する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:53:56 GMT)
Contemporary Perspectivism as a Framework of Scientific Inquiry in Quantum Mechanics and Beyond [0.0] 提案する内的理論的アプローチの規範に従って,現代パースペクティビズムの概念的,方法論的,意味的な枠組みを開発する。
量子論のパースペクティビストフレームワークと、ロヴェルリの量子力学のリレーショナル解釈の比較評価を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:17:13 GMT)
CoSPED: Consistent Soft Prompt Targeted Data Extraction and Defense [0.0] 本稿では,Consistent Soft Promptを対象とするデータ抽出・防衛のためのCoSPEDを提案する。
動的損失、追加損失、共通損失、自己整合復号戦略など、革新的なコンポーネントをいくつか紹介する。
抽出機構の解析により,ソフト・プロンプトによる攻撃に対する効果的な軽減戦略を直接的に提供することができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:26:47 GMT)
Bright Single-Photon Emission from Individual Tin-Vacancy Centers in Multi-Cone Diamond Waveguides [0.0] スズ空洞(SnV)中心は、ゼロフォノン線からの高放射効率のため、特に有望である。
ここではダイヤモンドナノピラーに組み込まれた単一SnV中心からの高光子抽出を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:19:50 GMT)
Bound on entanglement in neural quantum states [0.0] 我々は、$n$スピンに作用するフィードフォワード神経量子状態が任意の部分領域の絡み合いエントロピーに従うことを証明した。
これは行列積状態に対する領域法則のNQS類似性を確立し、$O(1)$非線形性を持つNQSに対する体積法則の絡み合いを規定する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:00:13 GMT)
Beyond touch-based HMI: Control your machines in natural language by utilizing large language models and OPC UA [0.0] 本稿では,人間と機械のより自然なインターフェースへのエージェントベースのアプローチを提案する。
現在、操作におけるインタラクションのための最先端メディアであるタッチインタラクションの代わりに、提案手法により、オペレータがマシンと通信したり、テキストを送信したりすることができる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 11:46:47 GMT)
BenthiCat: An opti-acoustic dataset for advancing benthic classification and habitat mapping [0.0] 本稿では,カタルーニャ(スペイン)沿岸で収集された約100万個のサイドスキャン・ソナー (SSS) タイルからなる,完全なマルチモーダルデータセットを提案する。
SSSタイルの約num36000は、分類モデルの教師付き微調整を可能にするためにセグメンテーションマスクで手動で注釈付けされている。
センサーデータはすべてモザイクとともにリリースされ、さらなる探索とアルゴリズム開発をサポートする。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 18:02:35 GMT)
Back-reflection in dipole fields and beyond [0.0] 量子反射は、電磁場の不均一性から生じる量子真空の魅力的な記号である。
バックリフレクションチャネルにおける量子反射の現実的な実装を追求するため、ダイポールパルスを用いた光間散乱の最初の数値計算を行った。
主信号信号は, 主に4波混合による後方反射チャネルに関連していることがわかった。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 12:14:20 GMT)
Astigmatism-free 3D Optical Tweezer Control for Rapid Atom Rearrangement [0.0] 光ツイーザを用いた原子再構成の最も一般的な方法は、AODの周波数チャーピングに依存する。
トウィーザー形状の変形とツイーザー軌道の歪みにより原子輸送速度を緩和するために3次元アコスト光偏向レンズ(3D-AODL)を用いる。
我々は、少なくとも200$mu$m $times$200$mu$m $times$136$mu$mの立方体体積内での非制限3D運動を実証した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:23:40 GMT)
An Eulerian Perspective on Straight-Line Sampling [0.0] 本研究では, 生成モデリングのための動的測度輸送, 特に, 特定のソースとターゲット分布をブリッジするプロセスによって誘導される流れについて検討する。
我々は、どのプロセスが直線流を生成するか、すなわち、点加速度が消滅し、従って一階法と完全に統合可能なフローを問う。
本研究では、条件加速度と重み付き共分散(レイノルズ)テンソルのばらつきのバランスとして、直線性の簡潔なPDE特性を提供する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:33:58 GMT)
An Encoder-Integrated PhoBERT with Graph Attention for Vietnamese Token-Level Classification [0.0] トークンレベルの分類処理のために,事前学習されたトランスフォーマーエンコーダ(PhoBERT)とグラフ注意ネットワークを統合した,TextGraphFuseGATという新しいニューラルネットワークを提案する。
提案モデルは,PhoBERTが生成したトークン埋め込み上に完全に連結したグラフを構築し,GAT層が豊富なトークン間の依存関係をキャプチャすることを可能にする。
PhoNER-COVID19, PhoDisfluency, VietMed-NER, VietMed-NERの3つのベンチマークデータセットについて検討した。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:39:09 GMT)
Accelerating Sparse Ternary GEMM for Quantized ML on Apple Silicon [0.0] 本稿では,AppleのMシリーズプロセッサ向けに最適化されたSparse Ternary GEMMカーネルを提案する。
本稿では、メモリの局所性を改善するために、新しいブロッキングおよびインターリーブされたスパースデータフォーマットを含む、アーキテクチャを意識した一連の最適化を提案する。
我々のベクトル化実装は、25%の間隔を持つ大きな行列に対して最大5.59倍の性能向上をもたらし、様々な間隔レベルにわたって安定している。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 15:54:30 GMT)
AI-Driven anemia diagnosis: A review of advanced models and techniques [0.0] 貧血は、世界中の何百万人もの個人に影響を及ぼす広範な健康問題であり、正確な診断とタイムリー診断は、貧血の効果的な管理と治療に不可欠である。
人工知能技術、すなわち機械学習(ML)とディープラーニング(DL)による貧血の検出、分類、診断への関心が高まっている。
本稿では, この分野での最近の進歩を体系的に概観し, 貧血検出に応用した各種モデルに焦点をあてる。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:22:45 GMT)
A minimal and universal representation of fermionic wavefunctions (fermions = bosons + one) [0.0] フェルミオン波動関数を効率的に表現することは、量子物理学、化学、材料科学において中心的な問題である。
拡大空間上で定義された連続対称函数にそれらを持ち上げることで、連続的非対称函数の普遍的かつ正確な表現を導入する。
この結果は、フェルミオン波動関数の効率的な表現のための厳密な数学的基礎を提供し、多電子系に対するスケーラブルで体系的に実装可能なニューラルネットワークソルバを実現する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 14:03:47 GMT)
A Symmetric-Key Cryptosystem Based on the Burnside Ring of a Compact Lie Group [0.0] 我々は、コンパクトリー群$G$のバーンサイド環$A(G)$で代わりに線形作用が起こる対称鍵暗号系を提案する。
任意の有限長のメッセージは$A(G)$の有限サポート元としてエンコードされ、$k$のBurnside製品を介して暗号化される。
有限ランク部分加群 $W_Lsubset A(O(2))$ 上でのみ作用が制限されることを示し、そのようなデータから鍵の情報理論的非識別性を示す。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 01:57:22 GMT)
A Multi-lingual Dataset of Classified Paragraphs from Open Access Scientific Publications [0.0] CC-BYライセンスの学術出版物から抽出した833k節のデータセットを提示する。
パラグラフは主に英語とフランス語で書かれており、さらにヨーロッパの言語が表現されている。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 13:10:47 GMT)
A Monte Carlo approach to bound Trotter error [0.0] 演算子のスペクトルノルムは等価な符号プロブレムフリー作用素のスペクトルノルムによって上界化可能であることを示す。
このモンテカルロをベースとした境界は、しばしば非常に厳密であり、場合によっては正確なものであることを実証する。
均一な電子ガスに対して、文献からトロタライズを行うコストを桁違いに削減する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:03:13 GMT)
A Conservative Theory of Semiclassical Gravity [0.0] 半古典重力は、安定な決定連鎖のメンバーと相互作用する場合のみ、量子系が重力場を放出することを考えると、一貫した理論であると主張する。
これらはデコヒーレンスとテスト関数によってモデル化された量子システム間の非重力相互作用の連鎖である。
本稿では,量子システムによる重力場の条件付き放出を行う新しいテスト可能なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 17:55:37 GMT)
A Comprehensive Forecasting-Based Framework for Time Series Anomaly Detection: Benchmarking on the Numenta Anomaly Benchmark (NAB) [0.0] 時系列異常検出は、現代のデジタルインフラにとって重要である。
本稿では,従来の手法をディープラーニングアーキテクチャと統合した予測ベースのフレームワークを提案する。
Numenta Anomaly Benchmark の最初の完全評価を行う。
論文参考訳(メタデータ) (Mon, 13 Oct 2025 08:31:42 GMT)