Prompting is not Enough: Exploring Knowledge Integration and Controllable Generation on Large Language Models [89.7] オープンドメイン質問応答(OpenQA)は自然言語処理(NLP)の基盤である。
我々は,知識統合と制御可能生成を探求し,OpenQAの性能向上を目的としたGenKIという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:49:19 GMT)
Language Models Can Learn from Verbal Feedback Without Scalar Rewards [88.8] 本稿では,言語フィードバックを条件付け信号として扱うことを提案する。
テキスト・画像生成における言語先行性に着想を得て,フィードバック条件ポリシーを導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:58:27 GMT)
Learning to Summarize by Learning to Quiz: Adversarial Agentic Collaboration for Long Document Summarization [87.0] SummQは長期文書要約のための新しい逆多重エージェントフレームワークである。
提案手法では,包括的な要約を作成し,評価するために協調作業を行う要約ジェネレータとレビュアーを用いる。
広範に使用されている3つの文書要約ベンチマーク上でSummQを評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:37:45 GMT)
HBO: Hierarchical Balancing Optimization for Fine-Tuning Large Language Models [87.0] 多様なデータセット上の微調整された大きな言語モデルは、データの不均衡と不均一性による課題を引き起こす。
本稿では,LLMがデータアロケーションを自律的に調整できる新しい手法である階層的バランシング最適化(HBO)を紹介する。
我々は,多言語およびマルチタスク設定において,9つのタスクにまたがる3つのLLMバックボーン上でHBOを評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:33:17 GMT)
ExpertSteer: Intervening in LLMs through Expert Knowledge [87.0] アクティベーションステアリングは、大規模言語モデルの生成プロセスを制御するための有望な方法を提供する。
本稿では、任意の専門的モデルを用いてステアリングベクトルを生成する新しいアプローチであるExpertSteerを提案する。
3つのLSMを4つの異なる領域にわたる15の人気のあるベンチマークで包括的な実験を行う。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:35:13 GMT)
Demystifying Multilingual Chain-of-Thought in Process Reward Modeling [87.0] プロセス報酬モデル(PRM)を多言語設定に拡張するという課題に対処する。
我々は、7つの言語にまたがるデータセット上で多言語PRMを訓練し、それを英語から翻訳する。
本結果は,学習言語数と英語データ量の両方に対する多言語PRMの感度を強調した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:20:20 GMT)
DVD-Quant: Data-free Video Diffusion Transformers Quantization [86.9] DVD-Quantは、ビデオDiTのための新しいデータフリー量子化フレームワークである。
先進的なDiTモデルの完全精度ベースラインよりも約2$times$のスピードアップを実現している。
DVD-Quantは、ビデオ品質を損なうことなくW4A4 PTQ for Video DiTsを有効にする最初の製品である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:59:20 GMT)
Fine-tuning Done Right in Model Editing [83.8] 大規模な言語モデルを適応するための基礎的な手法であるファインチューニングは、長い間モデル編集には有効ではないと考えられてきた。
ミニバッチ最適化により、標準的な幅優先パイプライン(エポックベース)に微調整を復元する。
我々は、復元された微調整フレームワーク上に構築された、シンプルで効果的なローカライズド編集手法であるLocFT-BFを導出する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:53:13 GMT)
WoW: Towards a World omniscient World model Through Embodied Interaction [83.4] 世界モデルの正当性的な物理的直観は、現実世界との広範囲で因果的に豊かな相互作用に基礎を置いていなければならない。
このWoWは、200万のロボットインタラクショントラジェクトリに基づいてトレーニングされた、ジェネレーティブな世界モデルである。
WoWBenchは、ビデオの物理的一貫性と因果推論に焦点を当てた新しいベンチマークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:59:07 GMT)
Dynamic Novel View Synthesis in High Dynamic Range [78.7] 現在の手法は主に静的なシーンに焦点を当てており、すべてのシーン要素が静止していて生きていないことを暗黙的に仮定している。
HDR-4DGSは,革新的な動的トーンマッピングモジュールを備えたガウススプラッティング方式のアーキテクチャである。
実験により、HDR-4DGSは、定量的性能と視覚的忠実度の両方において、既存の最先端手法を超越していることが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:29:22 GMT)
Local models and Bell inequalities for the minimal triangle network [78.5] 非局所的な相関は、量子情報や量子基底における驚くべき現象を引き起こす。
最も単純なシナリオの一つとして、最小三角形ネットワークにおけるパーティの置換の下での分布不変性について検討する。
連立結果を持つ三角形ネットワークにおける古典量子ギャップの存在についての知見を提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:01:22 GMT)
Drag4D: Align Your Motion with Text-Driven 3D Scene Generation [77.8] Drag4Dはインタラクティブなフレームワークで、テキスト駆動の3Dシーン生成にオブジェクトの動き制御を統合する。
このフレームワークにより、ユーザーは単一の画像から生成された3Dオブジェクトに対して3Dトラジェクトリを定義し、それらを高品質な3D背景にシームレスに統合することができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:23:45 GMT)
DS-STAR: Data Science Agent via Iterative Planning and Verification [76.9] DS-STARは,様々なデータフォーマットからコンテキストを自動探索し抽出する新しいデータサイエンスエージェントである。
具体的には,(1)非構造化型を含む多種多様なデータ形式からコンテキストを自動的に探索・抽出するデータファイル解析モジュール,(2)LLMベースの審査員が各段階で解析計画の十分性を評価する検証ステップ,(3)単純で実行可能な計画から始まる逐次計画機構,(3)DS-STARの満足度が検証されるまでそのフィードバックに基づいて反復的に洗練する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:38:12 GMT)
Towards an AI Musician: Synthesizing Sheet Music Problems for Musical Reasoning [69.8] 本稿では,ビートやインターバルをプログラム関数として扱うような,コア音楽理論のルールを扱う新しいアプローチを提案する。
このアプローチは、テキストと視覚の両方で検証可能な楽譜の質問を生成する。
SSMR-Benchの評価結果は,楽譜の解釈における重要な役割を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:37:24 GMT)
VideoScore2: Think before You Score in Generative Video Evaluation [69.4] VideoScore2は、視覚的品質、テキスト・ツー・ビデオのアライメント、物理的/常識的一貫性を明確に評価する多次元、解釈可能、そして人間によるアライメントフレームワークである。
我々のモデルは、27,168人の注釈付きビデオを含む大規模なデータセットVideoFeedback2で訓練されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:09:03 GMT)
UniErase: Towards Balanced and Precise Unlearning in Language Models [69.0] 大規模言語モデル(LLM)は、古い情報問題に対処するために反復的な更新を必要とする。
UniEraseは、知識の未学習と能力保持の間の精度とバランスの取れたパフォーマンスを示す、新しいアンラーニングフレームワークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:52:07 GMT)
Front-Loading Reasoning: The Synergy between Pretraining and Post-Training Data [68.9] LLMの推論能力を高めるための主流パラダイムは、高品質な推論集約的なデータによるポストトレーニングを中心に展開される。
新興文献では、学習中期にも推論データが組み込まれていることが示唆されているが、事前学習におけるそうしたデータの役割はいまだ不明である。
我々は,学習の異なる段階に導入した場合のLLM性能に,スケール,多様性,品質がどのような影響を及ぼすかについて,最初の系統的研究を行った。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:08:51 GMT)
LongLive: Real-time Interactive Long Video Generation [68.5] LongLiveはリアルタイムおよびインタラクティブなロングビデオ生成のためのフレームレベルの自動回帰フレームワークである。
LongLiveは1つのNVIDIA H100上で20.7 FPSを持続し、短いビデオと長いビデオの両方でVBenchで強力なパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:48:24 GMT)
Structured Sparse Transition Matrices to Enable State Tracking in State-Space Models [68.3] 状態空間モデル(SSM)における遷移行列の構造的スパースパラメトリゼーションを提案する。
我々の方法PD-SSMは、遷移行列をカラム1ホット行列(P$)と複素数値対角行列(D$)の積としてパラメータ化する。
このモデルは、様々なFSA状態追跡タスクにおいて、現代のSSMの多種多様なバリエーションを著しく上回っている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:46:30 GMT)
Shadow-FT: Tuning Instruct Model via Training on Paired Base Model [67.2] 大規模言語モデル(LLM)は、様々なタスクのさらなる微調整の恩恵を一貫して受けている。
本稿では,対応するベースモデルを活用してインストラクタモデルをチューニングするための新しいシャドウ-FTフレームワークを提案する。
提案するShadow-FTは,追加パラメータを導入せず,実装が容易で,性能が大幅に向上する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:43:47 GMT)
On the Within-class Variation Issue in Alzheimer's Disease Detection [66.7] Alzheimer's Disease (AD) 検出では、ADと非ADの個人を区別するために、機械学習の分類モデルを使用している。
そこで本研究では,サンプルスコア推定器を用いて,認知的スコアと整合した標本特異的なソフトスコアを生成できることを確認した。
ソフトターゲット蒸留(SoTD)とインスタンスレベルの再分散(InRe)の2つの簡易かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:56:49 GMT)
Review of Hallucination Understanding in Large Language and Vision Models [65.3] 本稿では,多様なアプリケーションにまたがる画像とテキストの幻覚を特徴付けるフレームワークを提案する。
我々の調査によると、幻覚はデータ分布や遺伝バイアスの予測可能なパターンから生じることが多い。
この調査は、現実世界の生成AIシステムにおける幻覚に対するより堅牢で効果的なソリューションを開発する基盤を提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:23:08 GMT)
High-Quality Sound Separation Across Diverse Categories via Visually-Guided Generative Modeling [65.0] DAVIS(Diffusion-based Audio-VIsual separation framework)を提案する。
本フレームワークは、混合音声入力と関連する視覚情報に基づいて、ノイズ分布から直接、所望の分離音スペクトルを合成することによって機能する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:46:00 GMT)
A conversion theorem and minimax optimality for continuum contextual bandits [65.0] 本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。
目標は、受信したコンテキストのすべての基盤関数を最小化することです。
サブ線形の静的な後悔を達成するアルゴリズムを拡張して、サブ線形の文脈的後悔を実現することができることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:09:09 GMT)
QoNext: Towards Next-generation QoE for Foundation Models [63.8] ファウンデーションモデルの既存の評価は、本当に重要なこと、つまりインタラクション中のユーザの経験を捉えるのに失敗します。
基礎モデルの評価にQuality of Experienceの原則を適用する最初のフレームワークであるQoNextを紹介します。
我々はQoE指向のデータベースを構築し、測定可能なシステムパラメータから知覚されたユーザエクスペリエンスを推定する予測モデルを訓練する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:26:52 GMT)
LEO-VL: Efficient Scene Representation for Scalable 3D Vision-Language Learning [63.2] 主なボトルネックは、現在のシーン表現がパフォーマンスと効率のバランスをとるのに苦労していることです。
本稿では,トークンのオーバーヘッドを大幅に低減し,認識能力の強い,効率的なシーン表現であるコンデンス機能グリッド(CFG)を提案する。
実世界の4つの屋内ドメインと、キャプションや対話といった5つのタスクにまたがる700k3D-VLデータに基づいて訓練された3D VLMであるLEO-VLを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:16:53 GMT)
Unlocking the Essence of Beauty: Advanced Aesthetic Reasoning with Relative-Absolute Policy Optimization [63.2] 強化学習(RL)を用いた包括的審美的推論フレームワークAes-R1を提案する。
Aes-R1はパイプライン、AesCoTを統合し、高品質なチェーン・オブ・プリーティングデータの構築とフィルタリングを行う。
実験により、Aes-R1は背骨の平均PLCC/SRCCを47.9%/34.8%改善することが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:55:00 GMT)
KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model [63.1] KaLM-Embedding-V2は、汎用的でコンパクトな埋め込みモデルである。
0.5Bのコンパクトなサイズでモデルを実装し,固定長埋め込みを実現する。
トレーニングデータでは, プレトレーニング用20種, 微調整用100種, コントラスト蒸留用100種をキュレートする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:08:11 GMT)
No More Manual Guides: Automatic and Scalable Generation of High-Quality Excel Tutorials [63.1] 既存のチュートリアルは、専門家が手作業で作成し、ソフトウェアリリース毎に頻繁な更新が必要で、相当なコストがかかる。
自然言語タスク記述から直接Excelチュートリアルを自動生成する最初のフレームワークを提案する。
我々のフレームワークは、最先端のベースラインよりもタスク実行の成功率を8.5%向上させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:21:39 GMT)
ResT: Reshaping Token-Level Policy Gradients for Tool-Use Large Language Models [62.8] 大規模言語モデル(LLM)は受動的生成を超越し、外部ツールを呼び出すことで目標指向エージェントとして機能する。
textbfReshaped textbfToken-level policy gradients (textbfResT) for tool-use task。
textbfResTは最先端の結果を達成し、以前のメソッドを最大8.76%$で上回っている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:38:27 GMT)
CoFFT: Chain of Foresight-Focus Thought for Visual Language Models [61.3] フォレスト・フォーカス思考の連鎖(英語: Chain of Foresight-Focus Thought, CoFFT)は、人間の視覚的認知をエミュレートすることによって視覚的推論を強化する訓練のないアプローチである。
これらの段階は反復的に機能し、推論が視覚的焦点を導き、視覚的焦点がその後の推論を知らせる相互依存サイクルを生成する。
Qwen2.5-VL、InternVL-2.5、Llava-Nextを使った複数のベンチマークでの実証結果では、3.1-5.8%が一貫したパフォーマンス向上を示し、計算オーバーヘッドは増大した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:46:30 GMT)
Backdoor Attribution: Elucidating and Controlling Backdoor in Language Models [61.3] 微調整された大規模言語モデル(LLM)は、データ中毒によるバックドア攻撃に対して脆弱である。
LLMの安全性の解釈可能性に関するこれまでの研究は、アライメント、ジェイルブレイク、幻覚に焦点を当てる傾向にあるが、バックドア機構を見落としている。
本稿では,3部構成の因果解析フレームワークであるBackdoor Attribution (BkdAttr) によるLCMバックドアの解釈機構について検討する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:45:25 GMT)
ControlEvents: Controllable Synthesis of Event Camera Datawith Foundational Prior from Image Diffusion Models [61.2] 本稿では,多様な制御信号によって誘導される高品質なイベントデータを合成するために,拡散に基づく生成モデルを提案する。
視覚認識, 2次元骨格推定, 3次元身体ポーズ推定のためのイベントデータを合成することで, 本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:22:07 GMT)
MTRec: Learning to Align with User Preferences via Mental Reward Models [60.3] 我々は、実際のユーザの好みに合わせてデザインされたシーケンシャルなレコメンデーションフレームワークであるMTRecを提案する。
ユーザの満足度を定量化するためのメンタル報酬モデルを導入し,それを学習するための分散逆強化学習手法を提案する。
実験により、MTRecは様々なレコメンデーションモデルに大幅な改善をもたらすことが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:10:48 GMT)
A Tale of Two Experts: Cooperative Learning for Source-Free Unsupervised Domain Adaptation [59.9] Source-Free Unsupervised Domain Adaptation (SFUDA)は、ソースデータにアクセスすることなく、ターゲットドメインにソース学習モデルを適用するという現実的な課題に対処する。
既存のSFUDA手法は、ソースモデルの予測のみを利用するか、大きなマルチモーダルモデルを微調整する。
本稿では、補完的な洞察と対象データの潜在構造を利用するためのエキスパート協調学習(EXCL)を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:39:50 GMT)
Where MLLMs Attend and What They Rely On: Explaining Autoregressive Token Generation [59.4] マルチモーダル大規模言語モデル(MLLM)は、視覚入力と自然言語出力の整合性を示す。
しかし、生成したトークンが視覚的モダリティに依存する範囲は、いまだに理解されていない。
MLLMにおける自己回帰トークン生成を説明するための軽量なブラックボックスフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:38:42 GMT)
DivLogicEval: A Framework for Benchmarking Logical Reasoning Evaluation in Large Language Models [58.4] 本稿では,多種多様な文からなる自然文からなる古典論理ベンチマークDivLogicEvalを提案する。
また,より信頼性の高い評価を実現するために,大規模言語モデルに固有のバイアスやランダム性の影響を緩和する新たな評価指標を導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:57:51 GMT)
TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them [58.0] 自動評価器(LLM-as-a-judge)としての大規模言語モデル(LLM)は、現在の評価フレームワークにおいて重大な矛盾を明らかにしている。
スコア比較不整合とペアワイズ・トランジティビティ不整合という2つの基本的不整合を同定する。
我々は2つの重要なイノベーションを通じてこれらの制限に対処する確率的フレームワークであるTrustJudgeを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:33:48 GMT)
A2R: An Asymmetric Two-Stage Reasoning Framework for Parallel Reasoning [57.7] モデルポテンシャルと実際の性能の間のギャップを埋めるために設計された非対称な2段階推論フレームワーク。
A2R-Efficientは、Qwen3-4BとQwen3-8Bシンセサイザーを組み合わせた「小型から大型」の派生型である。
その結果、A2Rはパフォーマンス・ブートスティングのフレームワークであるだけでなく、現実世界のアプリケーションに対して効率的かつ実用的なソリューションであることがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:27:03 GMT)
Wide-In, Narrow-Out: Revokable Decoding for Efficient and Effective DLLMs [57.7] Diffusion Large Language Models (DLLM) は、自動回帰モデルの魅力的な代替品として登場した。
既存のDLLMは、高速な並列復号化によって性能が著しく低下する、厳しい品質と速度のトレードオフに悩まされている。
本稿では,DLLMの復号化を可能にするトレーニング不要復号アルゴリズムであるWide-In, Narrow-Out (WINO)を紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:15:45 GMT)
WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents [57.2] 本稿では,モデルに基づく探索と反復的,長短のクエリ進化を用いた体系的データ生成手法であるWebExplorerを紹介する。
我々のモデルは、128Kのコンテキスト長と最大100のツール呼び出しスイッチをサポートし、長期の問題解決を可能にします。
8Bサイズのモデルとして、WebExplorer-8Bは、RLトレーニング後の平均16ターンを効果的に探索することができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:31:59 GMT)
From Bias to Balance: Exploring and Mitigating Spatial Bias in LVLMs [57.0] LVLM(Large Vision-Language Models)は、様々なマルチモーダルタスクにおいて大きな成功を収めている。
画像内の異なる場所に同じキー情報を置くと、モデルがどのように反応するかに焦点を当てる。
本研究では,すべての画像トークンに同一位置埋め込みを割り当てるシンプルかつ効果的な機構であるBaPAを導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:07:03 GMT)
MrGuard: A Multilingual Reasoning Guardrail for Universal LLM Safety [56.8] 大規模言語モデル(LLM)は、ジェイルブレイクのような敵の攻撃を受けやすい。
この脆弱性は、多言語セーフティアライメントされたデータが制限される多言語設定で悪化する。
素早い分類のための多言語ガードレールを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:05:35 GMT)
Rethinking the Embodied Gap in Vision-and-Language Navigation: A Holistic Study of Physical and Visual Disparities [56.7] VLN-PEは、人間型、四足型、車輪型ロボットをサポートする物理的に現実的なVLNプラットフォームである。
われわれは,エゴ中心のVLN手法を,様々な技術パイプラインにまたがる物理ロボット設定において初めて評価した。
以上の結果から,ロボット観測空間の制限,環境光の変動,衝突や落下などの物理的課題による性能劣化が明らかとなった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:50:31 GMT)
Explaining multimodal LLMs via intra-modal token interactions [55.3] MLLM(Multimodal Large Language Models)は、様々な視覚言語タスクにおいて顕著な成功を収めているが、その内部決定機構は十分に理解されていない。
モーダル内相互作用を利用した解釈可能性の向上を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:39:13 GMT)
EmoBench-UA: A Benchmark Dataset for Emotion Detection in Ukrainian [55.1] EmoBench-UAはウクライナのテキストで感情を検出するための最初の注釈付きデータセットである。
その結果,ウクライナ語のような非主流言語における感情分類の課題が浮き彫りになった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:31:00 GMT)
WaveMind: Towards a Conversational EEG Foundation Model Aligned to Textual and Visual Modalities [55.0] 脳波信号は認知過程と固有の神経状態の両方を同時に符号化する。
我々は、EEG信号とその対応するモダリティを統一意味空間にマッピングし、一般化された解釈を実現する。
結果として得られたモデルは、柔軟でオープンな会話をサポートしながら、堅牢な分類精度を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:21:51 GMT)
Single-weight Model Editing for Post-hoc Spurious Correlation Neutralization [54.9] ニューラルネットワークのトレーニングは、トレーニング損失を最小限に抑えるショートカットとして、最も単純な機能を利用する傾向がある。
これらの特徴のいくつかは、ターゲットラベルと急激な相関関係があり、モデルによる誤った予測につながる可能性がある。
本稿では,一重の修正を行なえる独特な厳密なクラス除去手法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:01:42 GMT)
BEVTrack: A Simple and Strong Baseline for 3D Single Object Tracking in Bird's-Eye View [54.5] 3Dシングルオブジェクトトラッキング(SOT)はコンピュータビジョンの基本課題であり、自律運転のようなアプリケーションにおいて重要な役割を果たす。
BEVTrackは、シンプルだが効果的な動きに基づくトラッキング手法である。
我々は,BEVTrackが200FPSで動作しながら最先端の結果を達成し,リアルタイム適用性を実現していることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:03:08 GMT)
StableToken: A Noise-Robust Semantic Speech Tokenizer for Resilient SpeechLLMs [54.2] 音声トークン化器は、意味不明な音響摂動に対して頑健ではない。
この不安定性は、脆い単一パス量子化アーキテクチャと遠い訓練信号の2つの欠陥に由来する。
コンセンサス駆動機構による安定性を実現するトークンライザであるStableTokenを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:32:51 GMT)
Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection [54.2] Neptune-Xは、海洋オブジェクト検出のためのデータ中心の生成-選択フレームワークである。
X-to-Maritime(X-to-Maritime)は、多様で現実的な海洋シーンを合成する多モード条件生成モデルである。
提案手法は,海上シーン合成における新しいベンチマークを設定し,検出精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:42:36 GMT)
Large Material Gaussian Model for Relightable 3D Generation [54.1] 物理ベースレンダリング(PBR)素材を用いた高品質な3Dコンテンツ作成のための新しいフレームワークを提案する。
また,本手法は,ベースライン法に比べて視覚的魅力が向上するだけでなく,材料モデリングも向上し,下流レンダリングの実用化を可能にした。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:35:12 GMT)
Investigating Redundancy in Multimodal Large Language Models with Multiple Vision Encoders [54.0] 選択したエンコーダがマスクされた場合, 性能は良好に低下し, 広範にエンコーダの冗長性が明らかとなった。
我々は、OCRやChartのようなタスクにおいて、単一のエンコーダが90%以上のCURで支配できる強力な特殊化を観察する。
特定のエンコーダを使用すると、特定のタスクカテゴリにおいて最大16%の精度が得られ、全体のパフォーマンスがフルモデルよりも3.6%向上する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:45:03 GMT)
Stuffed Mamba: Oversized States Lead to the Inability to Forget [53.5] Mambaベースのモデルは、内蔵の忘れ物機構であっても、以前のトークンを効果的に忘れるのに苦労していることを示す。
モデルの学習に必要な最小トレーニング長は状態サイズと線形に一致し,5桁パスキーの精度向上のための最大コンテキスト長は状態サイズと指数関数的に一致した。
我々の研究は、将来のRNN設計は、状態サイズ、トレーニング期間、長いコンテキストタスクにおいて堅牢なパフォーマンスを達成するためのメカニズムを忘れることの間の相互作用を考慮しなければならないことを示唆している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:31:28 GMT)
Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective [52.4] 強化学習(RL)法は大規模言語モデル(LLM)の計画能力を大幅に向上させた
本研究では,RLの利点と制約をグラフに基づく抽出により検討する。
我々の理論的分析から, 教師付き微調整(SFT)は共起性に基づく突発性解を導入しうるが, RLは探索によって正しい計画を立てる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:39:48 GMT)
Attributing Response to Context: A Jensen-Shannon Divergence Driven Mechanistic Study of Context Attribution in Retrieval-Augmented Generation [52.4] 我々は、コンテキストに対する属性応答(ARC-JSD)のための新しいJensen-Shannon Divergence駆動方式を提案する。
ARC-JSDは、追加の微調整、勾配計算、サロゲートモデリングなしで、重要な文脈文の効率的かつ正確な識別を可能にする。
TyDi QA, Hotpot QA, Musique など,様々なスケールの命令調整 LLM を用いたRAG ベンチマークの評価により,精度が向上し,計算効率が向上した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:58:14 GMT)
On Robustness of Vision-Language-Action Model against Multi-Modal Perturbations [52.1] 視覚-言語-アクション(VLA)モデルでは、現実世界の摂動に対する堅牢性は、デプロイに不可欠である。
本稿では,VLA入力と出力の摂動に対するロバストVLAを提案する。
LIBEROの実験では、ロバストVLAは、pi0バックボーンで12.6%、OpenVLAバックボーンで10.4%のベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:42:23 GMT)
Ringleader ASGD: The First Asynchronous SGD with Optimal Time Complexity under Data Heterogeneity [51.6] 本稿では,並列計算の理論的下界を実現する最初の非同期アルゴリズムであるリングリーダーASGDを紹介する。
我々の分析により、リングリーダーASGDは任意の勾配と時間変化速度の下で最適であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:19:15 GMT)
On the Complexity Theory of Masked Discrete Diffusion: From $\mathrm{poly}(1/ε)$ to Nearly $ε$-Free [49.3] マスク付き離散拡散(マスク付き離散拡散)は、トークンが識別される前に特別なマスクシンボルによって劣化するテキスト生成のフレキシブルパラダイムである。
その結果,Eulerサンプルは,$tildeO(d2epsilon-3/2)$離散スコア評価で,総変量(TV)の$epsilon$-精度を達成できることが判明した。
そこで我々は,有界スコアの仮定を取り除き,偏りのない離散スコア近似を保ったMask-Aware Truncated Uniformization (MATU) アプローチを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:50:17 GMT)
AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning [49.2] 我々は、原子レベルで正確な異種知識推論を行うための大規模な言語モデルのためのフレームワークAtomRを紹介する。
AtomRは複雑な質問を、各葉ノードが原子知識演算子に対応する推論木に分解する。
推論実行段階では、AtomRは各原子知識演算子を実行し、弾力的に異種源から原子レベルの知識を選択し、取得し、操作する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:16:28 GMT)
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning [49.2] 家庭環境下で活動する身体的エージェントは、曖昧で特定されていない人間の指示を解釈しなければならない。
LLM生成報酬を用いたオンライン強化学習(RL)を用いた視覚言語行動(VLA)ポリシーとして,マルチモーダル大規模言語モデル(MLLM)を微調整する新しいアプローチを提案する。
以上の結果から,RLを微細化したMLLMは,すべてのベースラインを顕著なマージン(10.4~16.5%)で上回り,新規なシーンやタスクに適していることが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:06:34 GMT)
Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.2] 生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:40:47 GMT)
Thinking with Sound: Audio Chain-of-Thought Enables Multimodal Reasoning in Large Audio-Language Models [49.1] 本稿では,Large Audio-Language ModelsとAudio CoTを併用したThinking-with-Sound(TwS)を提案する。
TwSにより、モデルは音声信号で積極的に考えることができ、数値解析やマルチモーダル推論によるデジタル操作を行うことができる。
実験によると、最先端のLALMはMELD-Hard1kで劇的に性能が低下しており、クリーンオーディオに比べて精度が50%以上低下している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:27:59 GMT)
StateX: Enhancing RNN Recall via Post-training State Expansion [49.0] 我々は、トレーニング後RNNの状態を効率的に拡張するためのトレーニングパイプラインであるStateXを紹介する。
最大1.3Bパラメータのモデル実験により、StateXはトレーニング後の高コストや他の能力の妥協なしに、RNNのリコールとコンテキスト内学習能力を効率的に向上することを示した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:55:22 GMT)
Detecting and Interpreting NSFW Prompts in Text-to-Image Models through Uncovering Harmful Semantics [48.9] 悪意のあるユーザは、T2I(text-to-image)モデルを使用してNot-Safe-for-Work(NSFW)イメージを生成する。
我々は,NSFWプロンプトを検出するために,T2Iモデルの隠れ状態を利用するフレームワークであるHiddenGuardを提案する。
実験の結果,HiddenGuardは商用およびオープンソースのモデレーションツールよりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:15:59 GMT)
Color Names in Vision-Language Models [48.8] 視覚言語モデル(VLM)におけるカラー命名機能の最初の体系的評価について述べる。
以上の結果から,VLMは古典的な研究から色に対して高い精度が得られる一方で,拡張された非原型カラーセットでは性能が著しく低下することが示唆された。
我々は、すべてのモデルに一貫して現れる21の共通色項を特定し、2つの異なるアプローチを明らかにした。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:04:18 GMT)
The Lie of the Average: How Class Incremental Learning Evaluation Deceives You? [48.8] クラスインクリメンタルラーニング(CIL)では、モデルが学習済みのクラスを忘れずに、新しいクラスを継続的に学習する必要がある。
我々は、ロバストなCIL評価プロトコルは、性能分布全体を正確に特徴付け、推定するべきであると論じる。
我々は,タスク間類似度を用いて,極端なクラスシーケンスを適応的に識別し,サンプリングする評価プロトコルEDGEを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:00:15 GMT)
Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy [48.7] 本稿では,精密で一貫したビデオ編集のための3Dプロキシを組み込んだ新しいフレームワークであるShape-for-Motionを紹介する。
我々のフレームワークは、ポーズ編集、回転、スケーリング、翻訳、テクスチャ修正、オブジェクト合成など、ビデオフレーム間の精密で物理的に一貫性のある操作をサポートしています。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:29:19 GMT)
RedNote-Vibe: A Dataset for Capturing Temporal Dynamics of AI-Generated Text in Social Media [48.6] ソーシャルメディアAIGT分析のための最初の縦長(5年)データセットであるRedNote-Vibeを紹介する。
このデータセットはXiaohongshuプラットフォームから提供されており、LLM以前の期間から2025年7月までのユーザエンゲージメントメトリクスとタイムスタンプが含まれている。
ソーシャルメディアの文脈でAIGTを検出するために,解釈可能なアプローチである心理言語AIGT検出フレームワーク(PLAD)を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:36:45 GMT)
video-SALMONN 2: Caption-Enhanced Audio-Visual Large Language Models [47.7] ビデオ記述と質問応答(QA)に新たなSOTA(State-of-the-art)を設定できる音声視覚大言語モデルであるVideo-SALMONN 2を提案する。
我々の中核的な貢献はマルチラウンド直接選好最適化(MrDPO)であり、完全性と事実的精度を両立させるキャプション品質の目標と組み合わせている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:30:12 GMT)
Rate-Distortion Optimized Communication for Collaborative Perception [47.7] 本稿では,多エージェント協調のための実用的速度歪み理論を導入し,特に性能・コミュニケーションのトレードオフを解析するために定式化した。
本稿では,コミュニケーション効率のよい協調認識フレームワークRDcommを提案する。
3Dオブジェクト検出とBEVセグメンテーションの実験により、RDcommはDAIR-V2XとOPV2Vの最先端精度を実現し、通信容量を最大108倍に削減した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:21:32 GMT)
PartSAM: A Scalable Promptable Part Segmentation Model Trained on Native 3D Data [47.6] 大規模3次元データに基づいてトレーニングされた最初のプロンプト可能なパートセグメンテーションモデルであるPartSAMを提案する。
PartSAMはエンコーダ・デコーダアーキテクチャを採用しており、三面体をベースとしたデュアルブランチ・エンコーダが空間的に構造化されたトークンを生成する。
大規模監視を実現するために,500万以上の3次元形状部品対をキュレートしたループ型アノテーションパイプラインを導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:52:35 GMT)
MS-GS: Multi-Appearance Sparse-View 3D Gaussian Splatting in the Wild [47.5] 野生の写真コレクションは、しばしば限られた量の画像を含んでおり、複数の外観を示す。
3DGS を用いたスパースビューシナリオにおけるマルチアジュアンス機能を備えた新しいフレームワーク MS-GS を提案する。
我々は,MS-GSが様々な難解な視界とマルチアジュアンス条件下でレンダリングを実現することを実証した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:42:25 GMT)
PipelineRL: Faster On-policy Reinforcement Learning for Long Sequence Generation [47.5] 大規模言語モデル(LLM)の推論能力を高めるために強化学習(RL)がますます活用されている。
本稿では、ハードウェア効率と政治上のデータとの良好なトレードオフを実現するために設計されたPipelineRLを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:28:08 GMT)
The Invisible Leash: Why RLVR May or May Not Escape Its Origin [47.5] RLVRの現在の実践がモデルの推論境界を真に拡張するかどうかは不明である。
現在の訓練条件下では、RLVRはサポート制約付き最適化メカニズムとして動作することができる。
RLVRは精度を確実に向上させるが、探索は徐々に狭くなり、正しく表現されていない解を見落としてしまう可能性がある。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:52:44 GMT)
Taxonomy, Opportunities, and Challenges of Representation Engineering for Large Language Models [47.4] RepEはモデルの内部表現を直接操作する。
より効果的で、解釈可能で、データ効率が良く、モデルの振る舞いを柔軟に制御できる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:29:51 GMT)
Intentional Gesture: Deliver Your Intentions with Gestures for Speech [47.3] Intentional-Gestureは、ハイレベルなコミュニケーション機能に基づく意図推論タスクとしてジェスチャ生成をキャストする新しいフレームワークである。
我々のフレームワークは、デジタル人間と具体化されたAIにおいて、表現力のあるジェスチャー生成のためのモジュラー基盤を提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:02:17 GMT)
Reasoning Under Uncertainty: Exploring Probabilistic Reasoning Capabilities of LLMs [47.2] 我々は,大規模言語モデル(LLM)の推論能力について,初めて包括的な研究を行った。
我々は,3つの注意深く設計されたタスク,モード識別,最大推定,サンプル生成のモデルを評価する。
経験的評価を通じて、より小さなモデルと大きなモデルの間に明らかなパフォーマンスギャップがあることを実証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:28:16 GMT)
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking [46.6] 特殊エンティティリンク(EL)モデルは、ユニークな知識ベース(KB)エンティティへのマッピングで十分に訓練されている。
広範に事前訓練された大型言語モデル(LLM)は、一般的でないエンティティの幅広い知識を持っている。
LLMデータ拡張による特殊ELモデルを拡張した最初のフレームワークであるLLMAEL(LLMAEL)を紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:30:48 GMT)
AgentPack: A Dataset of Code Changes, Co-Authored by Agents and Humans [46.6] コード編集のための微調整された大きな言語モデルは、一般的にコミットのマイニングやプルリクエストに依存しています。
我々は、Claude Code、OpenAI Codex、Cursor Agentが共著した1.3Mコード編集コーパスであるAgentPackを紹介する。
AgentPackで微調整されたモデルは、以前の人間のみのコミットコーパスで訓練されたモデルより優れていることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:28:22 GMT)
What Do They Fix? LLM-Aided Categorization of Security Patches for Critical Memory Bugs [46.3] 我々は、LLM(Large Language Model)と細調整された小言語モデルに基づく2つのアプローチを統合するデュアルメタルパイプラインであるLMを開発した。
LMは、OOBまたはUAFの脆弱性に対処する最近のLinuxカーネルのパッチ5,140のうち111つを、手作業による検証によって90の正の正が確認された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:06:36 GMT)
Quantization Meets Reasoning: Exploring and Mitigating Degradation of Low-Bit LLMs in Mathematical Reasoning [45.6] 低ビット後の量子化は、より厳しい設定で69.81%の数学的推論を損なう。
デプロイクリティカルな2つの問題に,プロセスレベルの精度で対処する。
われわれの設定では、332のキュレートされたサンプルと1つのGPUで3~5分計算すると、完全な精度のベースラインに向かって4ビットの重み計算が引き起こされる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:27:57 GMT)
Self-alignment of Large Video Language Models with Refined Regularized Preference Optimization [45.6] 大規模ビデオ言語モデル(LVLM)は、微細な時間的理解と幻覚に苦慮し、単純なビデオ質問応答タスクでも単純な誤りを犯すことが多い。
本稿では,LVLMが自己の誤りから学習できる自己調整フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:21:18 GMT)
From Parameters to Behavior: Unsupervised Compression of the Policy Space [45.3] 我々は、ポリシーパラメータ空間 $Theta$ を低次元潜在空間 $mathcalZ$ に圧縮する、新しい教師なしのアプローチを開発する。
学習された多様体は、潜時空間$mathcalZ$におけるポリシーグラディエント操作によるタスク固有の適応を可能にする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:42:52 GMT)
SecP-Tuning: Efficient Privacy-Preserving Prompt Tuning for Large Language Models via MPC [45.3] 大規模言語モデル(LLM)は多くの分野に革命をもたらしたが、医療やファイナンスといったプライバシーに敏感な分野の特殊タスクへの適応には制約が残っている。
セキュアなマルチパーティ計算(MPC)ベースのプライバシ保護機械学習は、モデルパラメータとデータのプライバシに関する理論的保証を提供する。
提案するSecP-Tuningは,LLMの効率的なプライバシ保護プロンプトチューニングを目的とした,最初のMPCベースのフレームワークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:13:33 GMT)
VoiceAssistant-Eval: Benchmarking AI Assistants across Listening, Speaking, and Viewing [45.2] VoiceAssistant-Evalは、13のタスクカテゴリにまたがる10,497のキュレートされた例で構成されている。
実用性を示すため,21のオープンソースモデルとGPT-4o-Audioを評価した。
プロプライエタリなモデルは、オープンソースモデルより普遍的に優れているわけではない。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:59:59 GMT)
Distillation-Enabled Knowledge Alignment Protocol for Semantic Communication in AI Agent Networks [45.0] 大規模人工知能(AI)エージェントのための蒸留対応知識アライメントプロトコル(DeKAP)を提案する。
DeKAPは、各エージェントの専門知識をパラメータ効率の低い低ランク行列に蒸留し、それらをネットワーク全体に割り当て、エージェントが複数のタスクに対して整合した知識を同時に維持できるようにする。
我々は、大規模な整数線形計画問題として、アライメント損失、通信オーバーヘッド、ストレージコストの結合最小化を定式化する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:25:29 GMT)
SUV: Scalable Large Language Model Copyright Compliance with Regularized Selective Unlearning [44.9] SUVは、大規模言語モデルが著作権のあるコンテンツを記憶することを防ぐために設計された選択的なアンラーニングフレームワークである。
私たちは、冗長な著作権のあるコンテンツを、プラウシブルで一貫性のある代替品に置き換えます。
我々は,500冊の有名な書籍の大規模データセットを用いて,我々のアプローチを検証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:16:11 GMT)
FormalML: A Benchmark for Evaluating Formal Subgoal Completion in Machine Learning Theory [44.6] 大規模言語モデル (LLM) は、最近、形式定理の証明において顕著な進歩を見せている。
しかし、数学者の実践的なアシスタントとして機能する能力は、複雑な証明の中で欠落したステップを埋めるものであり、まだ解明されていない。
機械学習の基礎理論に基づいて構築された、リーン4ベンチマークであるFormalMLを紹介します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:40:14 GMT)
StreetReaderAI: Making Street View Accessible Using Context-Aware Multimodal AI [44.4] 初めてアクセス可能なストリートビューツールであるStreetReaderAIを紹介します。
StreetReaderAIを使えば、視覚障害者は目的地を事実上検査したり、オープンワールドで探索したり、2200億枚以上の画像を実質的にツアーすることができる。
以上の結果から,POI調査と遠隔経路計画を支援する上で,アクセス可能な街路ビューの価値が示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:19:50 GMT)
Generator-Assistant Stepwise Rollback Framework for Large Language Model Agent [44.3] 大規模言語モデル(LLM)エージェントは通常、ステップバイステップの推論フレームワークを採用し、与えられたタスクを達成するための思考と行動のプロセスをインターリーブする。
本稿では,ジェネレータ・アシスタント・ステップワイド・ロールバック(GA-Rollback)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:48:59 GMT)
InftyThink: Breaking the Length Limits of Long-Context Reasoning in Large Language Models [44.3] InftyThinkは、モノリシック推論を中間的な要約を伴う反復的なプロセスに変換するパラダイムである。
本手法では, 計算コストを抑えながら, 推理深度を推定できる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:25:38 GMT)
RuCCoD: Towards Automated ICD Coding in Russian [42.6] 本研究は, バイオメディカルリソースが限られているロシア語におけるクリニカルコーディングの自動化の実現可能性について検討した。
我々は,1万以上のエンティティと1500以上のユニークなICDコードを含む電子健康記録からの診断フィールドを含む,ICD符号化のための新しいデータセットを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:49:44 GMT)
S2J: Bridging the Gap Between Solving and Judging Ability in Generative Reward Models [42.6] 生成報酬モデル(GRM)は報酬モデルや評価に広く採用されている。
従来の研究は主に、選好データセットに基づいて、判断の正しさを監督として最適化することで、専門的なGEMの訓練に重点を置いてきた。
この問題に対処するためのS2J(Solve-to-Judge)アプローチを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:21:17 GMT)
Learn the Ropes, Then Trust the Wins: Self-imitation with Progressive Exploration for Agentic Reinforcement Learning [41.9] エージェントLLMを学習するためのカリキュラムベースの自己アニメーション学習(SIL)レシピであるSPEARを提案する。
具体的には,本手法は,本質的な報奨を生かして,技術レベルの探究を促進するためのカリキュラムを取り入れている。
さらにトレーニングを安定させるために、リプレイバッファでの経験の利点を再検討し、潜在的ポリシードリフトに対処する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:20:38 GMT)
VidBridge-R1: Bridging QA and Captioning for RL-based Video Understanding Models with Intermediate Proxy Tasks [41.9] VidBridge-R1は、"Reason-Then-Respond"パラダイムの競合を効果的に橋渡しする、世界初の多目的ビデオ推論モデルである。
大規模な実験により、VidBridge-R1は1つのモデルにおいて、QAとキャプションの両方で大きなパフォーマンス向上を達成することが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:33:17 GMT)
Fairness-Aware Reinforcement Learning (FAReL): A Framework for Transparent and Balanced Sequential Decision-Making [41.5] 実世界のシーケンシャルな決定問題の等価性は、公平性を意識した方法で実施することができる。
複数のトレードオフを探索できるフレームワークを提案する。
フレームワークは複数のシナリオでより公平なポリシーを学習し、パフォーマンスの報酬をわずかに損なうだけであることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:42:14 GMT)
A Unifying Framework for Parallelizing Sequential Models with Linear Dynamical Systems [41.4] 固定点法を用いて逐次過程を並列に評価するためのいくつかの手法が提案されている。
これらの手法は線形力学系に基づく共通フレームワーク内で理解可能であることを示す。
この統一的な見解は、これらのテクニックの背後にある共通原則を強調し、特定の固定ポイントメソッドが最も効果的である可能性を明確にする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:27:02 GMT)
Mamba-Driven Topology Fusion for Monocular 3D Human Pose Estimation [41.1] 本研究では,マンバ駆動トポロジフュージョンによる3次元ポーズ推定手法を提案する。
具体的には,提案した骨認識モジュールは球面座標系における骨ベクトルの方向と長さを推定する。
また、シーケンス内の時間的関係と空間的関係の両方をモデル化する時空間リファインメントモジュールを設計する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:22:42 GMT)
ConQuER: Modular Architectures for Control and Bias Mitigation in IQP Quantum Generative Models [41.0] 瞬時量子(IQP)回路に基づく量子生成モデルは、複素分布の学習において非常に有望である。
現在の実装は、生成した出力に対する制御性の欠如と、期待される特定のパターンに対する深刻な生成バイアスに悩まされている。
モジュール回路アーキテクチャによる両課題に対処する制御可能な量子生成フレームワーク ConQuER を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:32:41 GMT)
InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models [40.4] 本稿では、連続的な事前学習と教師付き微調整をシームレスに統合するエンドツーエンドのFP8トレーニングレシピを提案する。
我々は,FP8をBF16の実用的で堅牢な代替品として確立し,大規模モデルトレーニングをさらに民主化するためのコードをリリースする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:16:49 GMT)
WildSpeech-Bench: Benchmarking End-to-End SpeechLLMs in the Wild [40.2] マルチモーダル大規模言語モデル (LLM) は直接音声対話の強力な機能を示している。
既存の評価手法は、しばしばテキストベースのベンチマークに適応し、音声の特徴や課題を見下ろしている。
本稿では,実践会話におけるエンドツーエンドの音声LLMを体系的に評価するために設計された,最初の総合的ベンチマークを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:14:14 GMT)
VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation [40.2] 制御可能なイメージ・ツー・ビデオ(I2V)生成は、参照画像をユーザ指定の制御信号でガイドされたコヒーレントなビデオに変換する。
我々は、カメラモーション、オブジェクトモーション、照明方向の独立制御とジョイント制御をサポートする統合I2VフレームワークであるVidCRAFT3を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:44:52 GMT)
APRIL: Active Partial Rollouts in Reinforcement Learning to Tame Long-tail Generation [40.1] 強化学習(RL)は、大規模事前訓練言語モデル(LLM)の進展の基盤となっている。
強化学習におけるアクティブ部分ロールアウト(APRIL)を提案する。
APRILはロールアウト要求をオーバープロビジョンし、ターゲットのレスポンス数が到達したら終了し、将来のステップで継続するために不完全なレスポンスをリサイクルする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:20:15 GMT)
MLP Memory: A Retriever-Pretrained Memory for Large Language Models [39.9] 本稿では,明示的な文書アクセスを伴わずに検索パターンを内部化するパラメトリックモジュールを提案する。
我々のアーキテクチャでは、この事前学習されたメモリを単純な確率でデコーダと統合し、5つの質問応答ベンチマークで12.3%、9つの一般的なNLPタスクで5.2ポイントの絶対ゲインを達成した。
本研究は,学習パターンが効果的な推論と効果的な知識アクセスのギャップをパラメトリックに埋めることを示した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:52:08 GMT)
ExPLAIND: Unifying Model, Data, and Training Attribution to Study Model Behavior [39.6] ポストホックの解釈可能性のメソッドは、通常、モデルの振る舞いをそのコンポーネント、データ、または独立した訓練軌跡に関連付ける。
これらの観点をすべて統合した統合フレームワークであるExPLAINDを紹介します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:38:34 GMT)
Navigate the Unknown: Enhancing LLM Reasoning with Intrinsic Motivation Guided Exploration [39.5] そこで,本研究では,高密度報酬を付与し,RLに基づくパラダイムにおける探索を増幅するために,固有モチベーションギルド探索比N meThOd foR LLM推論(i-MENTOR)を提案する。
4つの公開データセットにわたる実験は、i-MENTORの有効性を示し、AIME 2024で22.23%改善した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:18:44 GMT)
Sign-SGD is the Golden Gate between Multi-Node to Single-Node Learning: Significant Boost via Parameter-Free Optimization [39.4] Sign-SGDは、単一ノードトレーニングにおけるメモリ効率のよいアプローチであり、分散学習における勾配圧縮技術である。
理論的な観点から有効段数を自動的に決定することは不可能である。
我々は、一つのノードと複数のノードの学習、モメンタムを組み込んだ手法にアプローチを拡張します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:03:47 GMT)
Leveraging Coordinate Momentum in SignSGD and Muon: Memory-Optimized Zero-Order [39.3] ダウンストリームタスクに事前訓練されたモデルを適用するには、微調整大型言語モデル(LLM)が不可欠である。
従来の一階述語アルゴリズムは、モデルサイズであまりスケールしない、禁止的なメモリと計算コストを発生させる。
メモリと計算効率の代替としてゼロオーダー(ZO)最適化法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:29:26 GMT)
CHRONOBERG: Capturing Language Evolution and Temporal Awareness in Foundation Models [39.2] 本稿では,250年にわたる英語本文の時間的構造化コーパスであるCHRONOBERGを紹介する。
言語モデルをCHRONOBERGで逐次訓練し,ダイアクロニックシフトをエンコードする方法を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:56:16 GMT)
Pixel Motion Diffusion is What We Need for Robot Control [38.9] DAWNは言語条件のロボット操作のための統合拡散ベースのフレームワークである。
高レベルの動き意図と低レベルのロボット動作を、構造化されたピクセルの動き表現を介してブリッジする。
DAWNは、挑戦的なCALVINベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:59:59 GMT)
Understanding the Effects of Miscalibrated AI Confidence on User Trust, Reliance, and Decision Efficacy [38.4] ミススカラーAIの信頼性は、ユーザの適切な信頼を損なうとともに、AI支援による意思決定の有効性を低下させる。
コミュニケーションAIの信頼度調整レベルは、AIの誤校正を検出するのに役立ちます。
しかし、そのようなコミュニケーションは、未調整のAIに対するユーザの信頼を低下させるため、信頼性が低いため、意思決定の有効性は向上しない。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:48:29 GMT)
Hilbert: Recursively Building Formal Proofs with Informal Reasoning [38.4] 大規模言語モデル(LLM)は、驚くべき数学的推論能力を示しているが、そのソリューションには自動検証できないエラーが含まれていることが多い。
非公式な推論と形式的検証の相補的な強みを組み合わせたエージェントフレームワークであるHilbertを紹介する。
我々のシステムは4つのコンポーネントを編成する: 数学的推論に優れる非公式のLLM、リーン4の戦術に最適化された特殊なLLM、形式検証器、意味定理検索器。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:24:23 GMT)
Evaluating and Improving Cultural Awareness of Reward Models for LLM Alignment [38.2] リワードモデル(RM)は、大きな言語モデルと多様な文化の整合に不可欠である。
既存のRM評価は、文化的に関連するデータセットが不足しているため、文化的意識を評価するには不十分である。
文化意識リワードモデリングベンチマーク (CARB) を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:56:06 GMT)
SIU3R: Simultaneous Scene Understanding and 3D Reconstruction Beyond Feature Alignment [38.2] エンド・ツー・エンドのインボディード・インボディード・システム開発において,同時理解と3次元再構築が重要な役割を担っている。
提案するSIU3Rは,非ポーズ画像からの一般化可能な同時理解と3次元再構成のための,アライメントのない最初のフレームワークである。
具体的には、SIU3Rは、ピクセル整列した3D表現でタスクの再構築と理解をブリッジし、複数の理解タスクを一組の学習可能なクエリに統一する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:45:01 GMT)
The First Impression Problem: Internal Bias Triggers Overthinking in Reasoning Models [38.1] 推論モデルは、冗長な推論ステップを特徴とする過度な思考を示すことが多い。
我々は、入力問題によって引き起こされる内部バイアスを、そのような行動の鍵となる引き金とみなす。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:01:19 GMT)
Exploring Solution Divergence and Its Effect on Large Language Model Problem Solving [37.9] より高度な解の発散は、様々なモデルにまたがるより良い問題解決能力に肯定的に関係していることを示す。
SFT戦略とRL戦略の両方をサポートする新しい指標として解の発散を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:27:50 GMT)
Learning What To Hear: Boosting Sound-Source Association For Robust Audiovisual Instance Segmentation [37.9] 既存の手法は2つの根本的な問題から生じる視覚バイアスに悩まされている。一様加法融合は、クエリが異なる音源に特化することを防ぎ、視覚のみの訓練目的は、クエリが任意の有意なオブジェクトに収束することを許している。
クロスアテンションを用いた音声中心クエリ生成を提案し、各クエリは異なる音源に選択的に参加し、音声固有の先行情報を視覚的復号化することができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:31:17 GMT)
Improving LLM-as-a-Judge Inference with the Judgment Distribution [37.8] 言語モデルを用いて、テキスト品質(LLM-as-a-judge)に関する人間の嗜好を近似する手法が、多くのタスクに適用可能な標準のプラクティスとなっている。
判定分布の平均値を取ると、すべての評価設定においてモード(グレディ復号化)を連続的に上回ることがわかった。
さらに, 評価分布から嗜好を導出する新たな手法について検討し, リスク回避を取り入れた手法により, 性能が向上することを見出した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:21:52 GMT)
Learning Personalized Driving Styles via Reinforcement Learning from Human Feedback [37.8] 生成軌道モデルのための人間のフィードバック駆動微調整フレームワークであるTrajHFを紹介する。
TrajHFは、マルチ条件デノイザと強化学習を人間のフィードバックで組み込んで、マルチモーダル軌道生成を洗練させる。
TrajHFは、NavSimベンチマークの最先端に匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:25:56 GMT)
On the Value of Cross-Modal Misalignment in Multimodal Representation Learning [37.8] マルチモーダル表現学習は、モダリティ間でキューを整列させることにより、強力な表現を学習することを目的としている。
最近の研究により、現実世界のデータセットは、しばしばモダクティブなミスアライメントを示すことが明らかになっている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:09:38 GMT)
SRHand: Super-Resolving Hand Images and 3D Shapes via View/Pose-aware Neural Image Representations and Explicit 3D Meshes [36.9] SRHand (Super-Resolution Hand) は、低解像度画像から手の詳細な3次元形状とテクスチャ画像の再構成方法である。
具体的には、粗い入力画像のアップサンプリングにより、詳細ハンドを事前に学習する幾何学的認識型暗黙画像関数(GIIF)を導入する。
提案手法は,手動データセットに適応した最先端画像アップサンプリング手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:34:34 GMT)
Privacy Mechanism Design based on Empirical Distributions [36.3] ポイントワイド最大リーク(ポイントワイド最大リーク、英: Pointwise maximal leakage、PML)は、定量的情報フローからの脅威モデルに基づく、アウトカムごとのプライバシー対策である。
本稿では,このデータ生成分布を実証的に推定したPMLプライバシ評価とメカニズム設計のためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:46:59 GMT)
TAPTRv3: Spatial and Temporal Context Foster Robust Tracking of Any Point in Long Video [36.3] 通常のビデオではうまく機能するが、長いビデオでは失敗する傾向にあるポイントトラッキングフレームワークであるTAPTRv3を提案する。
空間的および時間的文脈の両方を用いて、空間的および時間的次元に沿ってより優れた特徴クエリを実現する。
TAPTRv3は、挑戦的なデータセットの大部分でTAPTRv2をはるかに上回り、最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:17:26 GMT)
Deepfakes: we need to re-think the concept of "real" images [36.2] 私たちは、現在の作業と以前の作業は、生成アルゴリズムと“フェイク”データサンプルに集中しすぎている、と論じています。
基本的に現在の「フェイク」検出手法の開発と評価は、非常に古い「リアル」画像の低解像度データセットに頼っている。
少なくとも、"本物の"イメージと新しいベンチマークデータセットの明確な技術的定義が必要です。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:40:13 GMT)
Unveiling the Potential of Diffusion Large Language Model in Controllable Generation [36.1] 最先端の自己回帰型大規模言語モデル(LLM)でさえ、構造化された出力を生成するために必要な場合、信頼性が低い。
現在の拡散型大規模言語モデル(dLLM)に触発されて、アーキテクチャ上の違いが次世代の制御可能生成をアンロックする鍵であることに気付いた。
本稿では,dLLMが安定して構造化された出力を生成できる新しいフレームワークであるSelf-Adaptive Scaffoldingを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:46:39 GMT)
MCGM: Multi-stage Clustered Global Modeling for Long-range Interactions in Molecules [36.0] MCGM(Multi-stage Clustered Global Modeling)は、幾何学的GNNに階層的グローバルコンテキストを与える軽量なプラグアンドプレイモジュールである。
AQMでは、MCGMはニューラルP3Mよりも20%少ないパラメータを使用しながら、最先端の精度(エネルギーは17.0 meV、力は4.9 meV/AA)を達成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:06:47 GMT)
A Law of Data Reconstruction for Random Features (and Beyond) [35.9] 大規模なディープラーニングモデルは、トレーニングセットの一部を記憶することが知られている。
モデル内のパラメータs$p$が、トレーニングサンプルs$n$よりも大きい場合、これを実現できることを示す。
我々の結果はデータ再構成の法則を明らかにしており、トレーニングデータセット全体が$p$が$dn$を超えると、回復できる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:29:23 GMT)
You Can't Steal Nothing: Mitigating Prompt Leakages in LLMs via System Vectors [35.8] 大規模言語モデル(LLM)は様々なアプリケーションで広く採用されており、多様なタスクにカスタマイズされたシステムプロンプトを活用している。
本稿では,そのようなリスクを明らかにするために,単純かつ効果的なプロンプトリーク攻撃を提案する。
本稿では,システムプロンプトを生テキストではなく内部表現ベクトルとして符号化するSysVecを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:17:38 GMT)
Think-on-Graph 3.0: Efficient and Adaptive LLM Reasoning on Heterogeneous Graphs via Multi-Agent Dual-Evolving Context Retrieval [35.7] Think-on-Graph 3.0 (ToG-3) は、制約を克服するためにMulti-Agent Context Evolution and Retrieval (MACER) メカニズムを導入した新しいフレームワークである。
我々の中心となる革新は、チャンク・トリプレット・コミュニティ・ヘテロジニアスグラフ指数の動的構築と洗練である。
マルチエージェントシステムは、エビデンス検索、回答生成、十分性、そして決定的に進化するクエリとサブグラフの反復的なプロセスに関与する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:13:10 GMT)
GraphSearch: An Agentic Deep Searching Workflow for Graph Retrieval-Augmented Generation [35.7] textscGraphSearchは、GraphRAGの二重チャネル検索を備えた新しいエージェントディープ検索ワークフローである。
textscGraphSearchは、従来の戦略よりも解答精度と生成品質を一貫して改善する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:45:56 GMT)
Self-Guidance: Boosting Flow and Diffusion Generation on Their Own [35.6] 自己誘導(SG)は、低品質サンプルの生成を抑えることにより、生成画像の品質を著しく向上させることができる。
SGは、異なる雑音レベルにおける元の拡散または流れモデルのサンプリングスコア関数に依存する。
我々は、異なるアーキテクチャでテキスト・ツー・イメージとテキスト・ツー・ビデオ生成に関する広範な実験を行う。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:47:13 GMT)
Automated Facility Enumeration for Building Compliance Checking using Door Detection and Large Language Models [35.4] ビルコンプライアンスチェック(BCC)は、建設施設が規制基準を満たすことを保証するための重要なプロセスである。
その重要性にもかかわらず、この問題はほとんど文献で見過ごされてきた。
大規模言語モデル(LLM)の最近の進歩は、自動化を強化する新たな機会を提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:31:47 GMT)
No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping [35.3] ゼロ分散プロンプトから学習信号を抽出する新しいアルゴリズムであるゼロ分散プロンプト(RL-ZVP)を導入する。
RL-ZVPは、応答を対比することなく、直接正しさを報償し、エラーを罰する。
6つの数学推論ベンチマークで、RL-ZVPはGRPOよりも最大8.61ポイント、パスレート7.77ポイントの大幅な改善を実現している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:03:54 GMT)
A Machine Learning Pipeline for Multiple Sclerosis Biomarker Discovery: Comparing explainable AI and Traditional Statistical Approaches [35.2] 多発性硬化症(MS)におけるバイオマーカー発見のための機械学習パイプラインを提案する。
頑健な前処理の後、ベイズ探索により最適化されたXGBoost分類器を訓練した。
以上の結果より,SHAPとDEAの重なり合いと特異なバイオマーカーの両者が明らかとなり,相補的強度が示唆された。
この研究は、説明可能なAI(xAI)と従来の統計手法を組み合わせることの価値を強調し、疾患のメカニズムについて深い洞察を得る。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:31:34 GMT)
Position IDs Matter: An Enhanced Position Layout for Efficient Context Compression in Large Language Models [34.9] 文脈情報を圧縮するために特別なトークンを使うことは、大規模言語モデル(LLM)の一般的な慣習である。
位置IDの調整のみでLLMの文脈圧縮能力を向上させる手法であるtextbfEnhanced Position Layout (EPL) を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:19:34 GMT)
AMANDA: Agentic Medical Knowledge Augmentation for Data-Efficient Medical Visual Question Answering [34.9] LLMエージェントを介して医療知識を増強するトレーニングフリーエージェントフレームワークであるAMANDAを提案する。
8つのMed-VQAベンチマークの実験では、ゼロショットと少数ショットのMed-VQA設定の両方で大幅に改善されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:22:25 GMT)
SurvDiff: A Diffusion Model for Generating Synthetic Data in Survival Analysis [34.9] 生存分析は、転移、疾患再発、または患者の死亡などの時間と時間の結果をモデル化することによって臨床研究の基盤となる。
SurvDiffは、生存分析において合成データを生成するために特別に設計されたエンドツーエンドの拡散モデルである。
シュルブディフは、複数の医療データセットにおける分布的忠実度と下流評価指標の両方において、最先端の世代ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:50:29 GMT)
Error Analysis of Discrete Flow with Generator Matching [34.8] 我々は、離散フローモデルの理論的性質を研究するために、計算理論に基づく統一的な枠組みを開発する。
具体的には、遷移速度の異なる2つの連続時間マルコフ連鎖に関する2つの経路測度のKLばらつきを導出する。
遷移速度推定と早期停止から生じる誤差を包括的に分析する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:41:45 GMT)
DeHate: A Stable Diffusion-based Multimodal Approach to Mitigate Hate Speech in Images [34.8] 本稿では,デジタルコンテンツにおけるヘイトを識別するためのマルチモーダルデータセットを提案する。
我々は,Digital Attention Analysis Module (DAAM)と組み合わせた透かし,安定性向上,安定拡散技術を適用した。
この組み合わせは、画像内の憎しみのある要素をピンポイントし、それによって詳細な憎しみの注意マップを生成するのに役立ちます。
マルチモーダルデハティフィケーションタスク用に設計された視覚言語モデルであるDeHaterを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:42:59 GMT)
From Formal Language Theory to Statistical Learning: Finite Observability of Subregular Languages [34.4] 我々は,すべての標準正規言語クラスが決定述語で表される場合,線形に分離可能であることを証明した。
合成実験は、雑音のない条件下での完全分離性を確認し、一方、英語形態学における実データ実験は、学習された特徴がよく知られた言語的制約と一致することを示した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:17:15 GMT)
Multimodal Slice Interaction Network Enhanced by Transfer Learning for Precise Segmentation of Internal Gross Tumor Volume in Lung Cancer PET/CT Imaging [34.4] PET/CT画像における肺腫瘍内腫瘍容積(IGTV)は肺がんに対する最適な放射線治療に重要である。
我々は,MAMBAを用いたマルチモーダル対話型知覚ネットワークを用いた伝達学習手法を提案する。
2.5Dセグメンテーションフレームワーク内にスライス相互作用モジュール(SIM)を導入し,スライス間関係を効果的にモデル化する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:48:08 GMT)
A Flux-Tunable cavity for Dark matter detection [34.3] 超伝導3次元マイクロ波空洞と直流束可変SQUIDを結合させて電子的に調整可能な空洞構造を構築する。
キャビティ内で高いコヒーレンスを維持するために設計されたフラックス配信システムを用いて、量子制限しきい値以下の暗黒物質探索を行う。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:52:57 GMT)
MOSS-ChatV: Reinforcement Learning with Process Reasoning Reward for Video Temporal Reasoning [34.2] マルチモーダル大言語モデル(MLLM)の重要機能としてビデオ推論が登場した
既存のMLLMは、最終回答が正しい場合でも、中間的推論がビデオダイナミクスから漂流するプロセスの不整合を示すことが多い。
動的時間ウォーピング(DTW)に基づくプロセス報酬を備えた強化学習フレームワークであるMOSS-ChatVを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:41:48 GMT)
Leveraging Model Guidance to Extract Training Data from Personalized Diffusion Models [34.2] 拡散モデル(DM)は強力な画像生成ツールとなっている。
多くの人がオンラインで微調整されたチェックポイントをアップロードし、CivitaiやHuggingFaceといったコミュニティを育てている。
オンラインで共有されているこれらの微調整されたDMからトレーニングデータを抽出するか?
微調整データを抽出するフレームワークであるFineXtractを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:37:14 GMT)
Expanding Reasoning Potential in Foundation Model by Learning Diverse Chains of Thought Patterns [34.2] 我々は,基礎モデルの推論可能性について,疑問に正しく答えるために必要な独立した試みの数の逆として初めて定義する。
次に、高価値推論パターンを付加した多種多様なデータを活用し、推論可能性を拡張することを提案する。
85A6B Mixture-of-Experts (MoE) モデルは, AIME 2024 と 2025 の挑戦に対して 9.58% 改善可能である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:10:45 GMT)
DiTraj: training-free trajectory control for video diffusion transformer [34.1] 軌道制御は、制御可能なビデオ生成におけるユーザフレンドリなタスクを表す。
提案するDiTrajは,DiTに適したテキスト・ビデオ生成におけるトラジェクトリ制御のためのトレーニングフリーフレームワークである。
提案手法は,映像品質とトラジェクトリ制御性の両方において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:53:31 GMT)
DriveAgent-R1: Advancing VLM-based Autonomous Driving with Active Perception and Hybrid Thinking [34.0] 本稿では,計画のためのアクティブな認識が可能な最初の自律運転エージェントであるDriveAgent-R1を紹介する。
複雑なシナリオでは、DriveAgent-R1は視覚的推論を行うためのツールを積極的に呼び出し、その決定を視覚的証拠にしっかりと基礎づける。
本稿では,人間ドライバーの認知パターンにインスパイアされたハイブリッド思考フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:14:08 GMT)
Quantum-limited optical delay sensing across an enhanced dynamic range by frequency-resolving two-photon interference [34.0] ホン・ウー・マンデル干渉計は高精度センシングの有効なツールであるが、ダイナミックレンジと測定精度の基本的なトレードオフに直面している。
この制限を克服するため、2つの干渉光子の周波数をサンプリングし、時間領域の感度を高める。
これにより、未解決推定値の最大20倍の光学遅延推定のダイナミックレンジが向上する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:01:00 GMT)
Robot Learning from Any Images [33.9] このフレームワークは、任意のWildイメージを対話型で物理対応のロボット環境に変換するものだ。
従来の方法とは異なり、RoLAは追加のハードウェアやデジタルアセットを必要とせずに、単一のイメージ上で直接動作する。
我々は、スケーラブルなロボットデータ生成と拡張、インターネットイメージからのロボット学習、マニピュレータとヒューマノイドのためのシングルイメージのリアルタイムシステムなど、RoLAの汎用性を実証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:10:34 GMT)
Learnable Kernel Density Estimation for Graphs [33.5] グラフ密度推定の鍵となる課題は、構造パターンと意味的バリエーションの両方を捉えることである。
本研究は,グラフのカーネル密度推定を学習するLGKDEフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:51:37 GMT)
Closing the Oracle Gap: Increment Vector Transformation for Class Incremental Learning [33.2] クラスインクリメンタルラーニング(CIL)は,従来学習していたクラスを忘れずに,新しいクラスの知識を逐次取得することを目的としている。
線形モード接続性(LMC)に関する最近の知見から着想を得て,インクリメントベクトル変換(IVT)を提案する。
IVTは、モデルのパラメータを、以前のタスク最適に線形接続を維持する変換されたソリューションに定期的にテレポートする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:31:59 GMT)
Large Pre-Training Datasets Don't Always Guarantee Robustness after Fine-Tuning [29.7] 我々は、微調整モデルにおけるロバストネスの保存性を評価するために、ロバストネス継承ベンチマーク(ImageNet-RIB)を提案する。
微調整は事前訓練されたモデル間の堅牢性を低下させる。
最大および最も多様なデータセットで事前訓練されたモデルは、小さなデータセットを微調整した後、より大きなロバスト性損失と低い絶対ロバスト性の両方を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:57:05 GMT)
Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity [29.6] N-gramノベルティは、トレーニングデータ以外のテキストを生成する言語モデルの能力を評価するために広く利用されている。
我々は,この創造性の概念とn-gramの新規性との関係を,人間とAIが生成したテキストの密読を通して検討する。
我々は,n-gramの新規性は,専門家が判断する創造性と肯定的に関連しているのに対し,n-gramの新規性によるトップクァアタイル表現の91%は創造性とは判断されないことがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:59:05 GMT)
Customizing Visual Emotion Evaluation for MLLMs: An Open-vocabulary, Multifaceted, and Scalable Approach [29.5] この矛盾は, 既存の評価手法の制約に起因していると論じる。
これらの制約を克服する感情文判断タスクを提案する。
人間の努力を最小限に抑えて感情中心の文を効率的に構築する自動パイプラインを考案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:30:39 GMT)
REMA: A Unified Reasoning Manifold Framework for Interpreting Large Language Model [29.4] 推論多様体(Reasoning Manifold)は、すべての正しく推論された世代に対応する内部表現によって形成される潜在低次元幾何学構造である。
誤りと正しい推論サンプルに対応する内部モデル表現の空間的関係を定量的に比較することにより,障害の起源を説明するフレームワークであるREMAを構築した。
多様な言語およびマルチモーダルモデルおよびタスクに関する実験は、推論多様体の低次元の性質と誤った推論表現と正しい推論表現の間の高い分離性を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:02:27 GMT)
CircuitSense: A Hierarchical Circuit System Benchmark Bridging Visual Comprehension and Symbolic Reasoning in Engineering Design Process [29.4] エンジニアリング設計は、システム仕様からコンポーネント実装までの階層的な抽象化を通して行われる。
MLLM(Multi-modal Large Language Models)は自然画像のタスクに優れるが、技術図から数学的モデルを抽出する能力はいまだ解明されていない。
textbfCircuitSenseは、コンポーネントレベルのスキーマからシステムレベルのブロックダイアグラムにまたがる8,006以上の問題を通じて、この階層の回路理解を評価するベンチマークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:32:14 GMT)
Astraea: A Token-wise Acceleration Framework for Video Diffusion Transformers [29.1] ビデオ拡散変換器(vDiTs)は、テキストからビデオへの生成において大きな進歩を遂げているが、その計算要求は、実用的な展開において大きな課題となっている。
Astraeaは,vDiTをベースとしたビデオ生成の最適に近い構成を,パフォーマンス目標下で検索するフレームワークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:32:05 GMT)
Context and Diversity Matter: The Emergence of In-Context Learning in World Models [29.1] 本研究では,文脈内環境学習(ICEL)について検討し,ゼロショット性能から世界モデルの成長と限界へ注目を移す。
我々は,(1)世界モデルの文脈内学習を形式化し,環境認識と環境学習という2つの中核的なメカニズムを同定し,(2)そのメカニズムの出現を露呈する2つのメカニズムのエラー上限を導出する,(3)世界モデルに異なるICL機構が存在することを実証的に確認する,という3つの貢献である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:50:32 GMT)
GoalRank: Group-Relative Optimization for a Large Ranking Model [28.8] 我々は、常に最適なランキングポリシーに対する厳密な近似誤差を達成するジェネレータのみのモデルが存在すると論じる。
ジェネレータのみのランキングフレームワークであるGoalRankを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:32:16 GMT)
Think Smart, Not Hard: Difficulty Adaptive Reasoning for Large Audio Language Models [28.6] 大規模音声言語モデル(LALM)は、顕著な推論能力を示している。
LALMの難易度適応推論法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:49:14 GMT)
Generation Properties of Stochastic Interpolation under Finite Training Set [28.5] 規則的な条件下では、決定論的生成過程はトレーニングサンプルを正確に回収し、生成過程は追加のノイズを伴うトレーニングサンプルとして現れる。
提案手法は,推定誤差が存在する場合,一様雑音とガウス雑音の混合によるトレーニングサンプルの凸結合を効果的に生成することを示した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:13:03 GMT)
GeoSketch: A Neural-Symbolic Approach to Geometric Multimodal Reasoning with Auxiliary Line Construction and Affine Transformation [28.5] GeoSketchは、幾何学的推論をインタラクティブな知覚・推論・アクションループとして再キャストする、ニューラルシンボリックなフレームワークである。
階層的な意思決定、実行可能な視覚行動、象徴的な検証を統一することにより、GeoSketchは静的解釈から動的相互作用へのマルチモーダル推論を前進させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:12:04 GMT)
DanceText: A Training-Free Layered Framework for Controllable Multilingual Text Transformation in Images [28.5] DanceTextは、画像の多言語テキスト編集のためのトレーニング不要のフレームワークである。
複雑な幾何学的変換をサポートし、シームレスに前景と背景の統合を実現する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:03:49 GMT)
$γ$-Quant: Towards Learnable Quantization for Low-bit Pattern Recognition [28.3] パターン認識のための非線形量子化のタスク特化学習として$gamma$-Quantを提案する。
学習可能な量子化が可能な生データは,12ビットのデータと同等に4ビットで処理できることを実証した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:03:55 GMT)
Beyond Formula Complexity: Effective Information Criterion Improves Performance and Interpretability for Symbolic Regression [28.3] 記号回帰は与えられたデータを記述するための正確で解釈可能な公式を発見する。
有効情報基準(EIC)は、公式を特定の内部構造を持つ情報処理システムとして扱う。
EICは108人の専門家による公式解釈可能性の選好と70.2%の合意を示し、式中の不合理な構造を測定することで、実際に公式の解釈可能性を反映していることを示した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:32:43 GMT)
Detecting (Un)answerability in Large Language Models with Linear Directions [28.2] 大きな言語モデル(LLM)は、必要な情報がなくても、しばしば疑問に対して自信を持って反応し、幻覚的な答えをもたらす。
抽出質問応答(QA)に着目した解答可能性検出の問題点について検討する。
本稿では,モデルのアクティベーション空間の方向を特定するための簡単な手法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:04:32 GMT)
ECHO: Toward Contextual Seq2Seq Paradigms in Large EEG Models [28.2] 大規模脳波モデル(LEM)は、エンコーダ中心のアーキテクチャを大規模未ラベルデータに事前訓練し、普遍的な表現を抽出することでこの問題に対処する。
脳波モデリングをシーケンス・ツー・シーケンス・ラーニングとして再構成する新しいデコーダ中心のLEMパラダイムであるECHOを導入する。
ECHOは、最先端のシングルタスクEMをマルチタスク設定で一貫して上回り、より優れた一般化と適応性を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:37:34 GMT)
Leveraging LLM Agents for Automated Video Game Testing [27.9] Tests MMORPGs(Massively Multiplayer Online Role-Playing Games)は、ゲーム開発において重要な作業である。
これらの課題に対処するため,知的MMORPGテストのための効果的なLLM駆動エージェントフレームワークであるTITANを提案する。
我々はTITANのプロトタイプを実装し、PCとモバイルプラットフォームにまたがる2つの大規模商用MMORPG上で評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:31:21 GMT)
RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation [27.8] Repository Planning Graph (RPG)は、統一グラフ内の機能、ファイル構造、データフロー、関数をエンコードする。
ZeroRepoは、提案レベルの計画、実装レベルの構築、テストバリデーションを備えたグラフ誘導コード生成という、グラフ駆動のフレームワークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:50:53 GMT)
ART-DECO: Arbitrary Text Guidance for 3D Detailizer Construction [27.7] 粗い3D形状プロキシを高品質なアセットに即時に変換できるニューラルネットワークである3Dディファレンサを導入する。
我々のモデルはテキストプロンプトを用いて訓練され、形状クラスを定義し、生成した詳細の外観ときめ細かいスタイルを特徴付ける。
我々の精細化器は単一形状に最適化されておらず、生成モデルを蒸留した結果であり、再学習せずに再利用でき、任意の形状を生成することができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:03:04 GMT)
Learning from Delayed Feedback in Games via Extra Prediction [26.9] 本研究は,ゲーム学習における時間遅延フィードバックの問題を提起し,解決するものである。
この矛盾を克服するために、将来の報奨の予測はアルゴリズム(通常はOptimistic Follow-the-Regularized-Leader (OFTRL))に組み込まれる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:46:21 GMT)
Online Multi-Agent Control with Adversarial Disturbances [26.9] 本研究では, 対向障害を考慮した多エージェント線形力学系におけるオンライン制御について検討する。
本研究は,ゲームにおけるオンライン学習によるオンライン制御のブリッジ化の第一歩として,個人のパフォーマンス保証の堅牢性を確立した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:12:28 GMT)
UrbanFeel: A Comprehensive Benchmark for Temporal and Perceptual Understanding of City Scenes through Human Perspective [26.7] UrbanFeelは、3つの認知的に進歩的な次元にまたがる、慎重に構築された視覚的質問からなる。
Gemini-2.5 Proは、人間のエキスパートレベルに近づいているため、全体的なパフォーマンスが最高である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:38:57 GMT)
ProPerSim: Developing Proactive and Personalized AI Assistants through User-Assistant Simulation [26.5] タイムリーでパーソナライズされたレコメンデーションを作成できるAIアシスタントを開発するためのタスクおよびシミュレーションフレームワークであるProPerSimを紹介する。
ProPerAssistantは、ユーザのフィードバックを通じて継続的に学習し、適応する検索強化された、嗜好に整合したアシスタントである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:57:27 GMT)
A Benchmark for Localizing Code and Non-Code Issues in Software Projects [26.5] 46の人気のあるGitHub Pythonプロジェクトから1,100のイシューのデータセットであるMULocBenchを紹介します。
既存のベンチマークと比較すると、MULocBenchはイシュータイプ、根本原因、ロケーションスコープ、ファイルタイプに大きな多様性を提供する。
このベンチマークを用いて、最先端のローカライズ手法と5つのLCMベースのプロンプト戦略の性能を評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:05:20 GMT)
Mamba Integrated with Physics Principles Masters Long-term Chaotic System Forecasting [26.5] PhyxMambaは、Mambaベースの状態空間モデルと物理インフォームドの原理を統合し、カオスシステムの長期的な振る舞いを予測するフレームワークである。
我々はPhyxMambaが優れた予測精度を提供し、短期的な歴史的観測から重要な統計を忠実に捉えていることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:35:24 GMT)
DialSim: A Dialogue Simulator for Evaluating Long-Term Multi-Party Dialogue Understanding of Conversational Agents [26.3] 対話シミュレーションに基づく評価フレームワークであるDialSimを紹介する。
ダイアルシム(DialSim)では、エージェントが台詞付き会話におけるキャラクターの役割を仮定し、対話履歴のみを用いて自発的な質問に答える能力を評価する。
このフレームワークをサポートするために,LongDialQAを導入した。
DialSimを用いたLLMを用いた会話エージェントの評価では,大局的なコンテキストウィンドウやRAG機能を持つモデルでさえ,長期にわたる多人数インタラクションに対する正確な理解の維持に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:04:26 GMT)
DualFocus: Depth from Focus with Spatio-Focal Dual Variational Constraints [26.3] DFFフレームワークであるDualFocusは、フォーカス変動によって引き起こされる焦点スタックの特異な勾配パターンを利用する。
DualFocus は深度精度と知覚品質の両方で最先端の手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:15:36 GMT)
EditGRPO: Reinforcement Learning with Post -Rollout Edits for Clinically Accurate Chest X-Ray Report Generation [26.2] 放射線学レポート生成には、高度な医用画像解析、効果的な時間的推論、正確なテキスト生成が必要である。
本研究は,臨床動機による報酬生成を最適化するために設計された複合政治強化学習(RL)アルゴリズムであるEditGRPOを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:19:00 GMT)
RAU: Reference-based Anatomical Understanding with Vision Language Models [26.1] 視覚言語モデル(VLM)を用いた参照型解剖学的理解のためのフレームワークであるRAUを紹介する。
まず,VLMが参照画像と対象画像の相対的空間的推論により解剖学的領域の同定を学習することを示す。
次に, VLM由来の空間的手がかりをSAM2の細粒度セグメンテーション能力とシームレスに統合できることを実証した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:32:03 GMT)
Diagnosing and Mitigating Modality Interference in Multimodal Large Language Models [26.0] マルチモーダル大規模言語モデルでは,非関連信号とタスク関連情報を区別することが困難である。
無関係なモダリティからの急激な情報は、しばしば大幅な性能低下をもたらすことを示す。
本稿では,摂動と対向的摂動を併用した摂動に基づくデータ拡張を含む,MLLMを微調整する新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:54:35 GMT)
Introducing Multimodal Paradigm for Learning Sleep Staging PSG via General-Purpose Model [25.9] 睡眠ステージングは、睡眠障害を診断し、神経学的健康を評価するために不可欠である。
既存の自動手法は、一般的に複雑なポリソノグラフィ(PSG)信号から特徴を抽出し、ドメイン固有のモデルを訓練する。
臨床診断の実践をエミュレートするために,大規模な多モード汎用モデルを活用する睡眠ステージングの新しいパラダイムを導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:14:43 GMT)
R-Capsule: Compressing High-Level Plans for Efficient Large Language Model Reasoning [25.9] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)が明確なステップバイステップの合理性を引き出すことによって、複雑な推論に対処するのに役立つ。
提案するReasoning Capsule (R-Capsule) は,遅延推論の効率と明示的なCoTの透明性の両立を目的としたフレームワークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:53:41 GMT)
Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning [25.7] Proximal Policy Optimization (PPO)は、大規模言語モデル(LLM)の機能を改善するためのフレームワークである。
PPOは監督された微調整よりも一貫して優れており、GLUEでは平均6.3ポイント向上している。
本研究は,LLMを強化学習問題とみなすことで,新たなタスクに適応する上で有望な方向性を示すものである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:43:55 GMT)
MIRAGE: Multi-hop Reasoning with Ambiguity Evaluation for Illusory Questions [25.7] 実世界のマルチホップ質問回答(QA)は、推論プロセス自体と分離できないあいまいさを伴うことが多い。
この曖昧さは、一つの質問から複数の推論パスが現れるという、明確な課題を生み出します。
本稿では,MultI-hop Reasoning with AmbiGuity Evaluation for Illusory Questions (MIRAGE)を紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:31:01 GMT)
Memory-QA: Answering Recall Questions Based on Multimodal Memories [25.7] メモリQA(Memory-QA)は,従来記憶されていたマルチモーダルメモリからの視覚的コンテンツに関するリコール質問に応答する,新しい実世界のタスクである。
このタスクは、タスク指向メモリの作成、時間的および場所的情報のメモリ内で有効活用、複数のメモリを描画してリコール問題に答える能力など、ユニークな課題を提起する。
我々はPensieveという包括的パイプラインを提案し、メモリ固有の拡張、時間と位置を意識したマルチシグナル検索、マルチメモリQA微調整を統合した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:04:32 GMT)
Semantic Consistent Language Gaussian Splatting for Point-Level Open-vocabulary Querying [25.3] オープン語彙の3Dシーン理解は、自然言語による操作など、ロボット工学の応用にとって不可欠である。
既存の3Dガウススプラッティングの問合せ方法は、矛盾しない2Dマスクの監視にしばしば苦労する。
本稿では,セグメンテーションマスク上でのトラッキングを行い,意味的に一貫した基盤構造を確立するための新しいポイントレベルのクエリフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:36:37 GMT)
Jailbreaking on Text-to-Video Models via Scene Splitting Strategy [25.3] SceneSplitは、有害な物語を複数のシーンに断片化し、それぞれが個々に良心する新しいブラックボックスジェイルブレイク手法である。
以上の結果から,Luma Ray2は77.2%,Haluoは84.1%,Veo2は78.2%であり,既存のベースラインを大きく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:54:23 GMT)
Evaluating Uncertainty Quantification Methods in Argumentative Large Language Models [25.0] 我々は,異なるUQ手法を用いる場合のクレーム検証タスクにおいて,ArgLLMsの性能を評価する実験を行う。
これらの結果から,ArgLLMsでは直接的プロンプトが有効なUQ戦略であることが示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:59:09 GMT)
Speak Your Mind: The Speech Continuation Task as a Probe of Voice-Based Model Bias [24.9] 音声継続 (SC) は、意味的文脈と話者識別を保ちながら、音声プロンプトのコヒーレントな拡張を生成するタスクである。
本研究は,性差と発声タイプが継続行動にどのように影響するかを調査し,SCにおけるバイアスの最初の体系的評価を行った。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:43:25 GMT)
Bridging Draft Policy Misalignment: Group Tree Optimization for Speculative Decoding [24.7] グループツリー最適化(GTO)を導入し、デコード時ツリーポリシーとトレーニングを整合させる。
ドラフトツリーリワードの増加は、受け入れ長とスピードアップを確実に改善することを示す。
GTOは、効率的な大規模言語モデル推論のための実用的で一般的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:55:35 GMT)
Self-Supervised Point Cloud Completion based on Multi-View Augmentations of Single Partial Point Cloud [24.3] ポイント雲の完成は、部分的な観測から完全な形状を再構築することを目的としている。
既存の自己教師付き手法は、自己教師付き信号の限られた能力のために不満足な予測を生成する。
単一部分点雲の多視点拡張に基づく新しい自己教師型信号群を設計する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:53:55 GMT)
TreeMind: Automatically Reproducing Android Bug Reports via LLM-empowered Monte Carlo Tree Search [24.2] そこで我々は,大規模言語モデルとモンテカルロ木探索アルゴリズムを統合し,バグ再現における戦略的UI探索を実現する新しい手法であるTreeMindを提案する。
私たちの知る限りでは、これは、外部の意思決定とセマンティック推論を組み合わせた、信頼性のあるバグ再現のための最初の作業です。
広範に使用されている3つのベンチマークから、実世界の93のAndroidバグレポートのデータセットに基づいて、TreeMindを評価した。実験の結果、再現成功率の4つの最先端のベースラインを著しく上回っていることが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:50:13 GMT)
Avoiding $\mathbf{exp(R_{max})}$ scaling in RLHF through Preference-based Exploration [24.2] RLHF(Reinforcement Learning from Human Feedback)は,大規模言語モデル(LLM)アライメントのための重要な手法として登場した。
本稿では、オンラインRLHFの設定と、サンプル効率の向上に焦点をあてる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:18:48 GMT)
MolSpectLLM: A Molecular Foundation Model Bridging Spectroscopy, Molecule Elucidation, and 3D Structure Generation [24.1] MolSpectLLMはQwen2.5-7Bで事前訓練された分子基盤モデルであり、分子3D構造と実験的分光を統一する。
分子スペクトルを明示的にモデル化することで、MollSpectLLMはNMR、IR、MSベンチマークで平均0.03の精度でスペクトル関連タスクにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:37:44 GMT)
ProRe: A Proactive Reward System for GUI Agents via Reasoner-Actor Collaboration [24.0] ProReは汎用推論エージェントとドメイン固有評価エージェントを利用するプロアクティブ報酬システムである。
ProReは報酬精度を最大5.3%、F1スコアを19.4%向上させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:29:36 GMT)
Fuzzy Reasoning Chain (FRC): An Innovative Reasoning Framework from Fuzziness to Clarity [23.1] Fuzzy Reasoning Chain(FRC)フレームワークは、セマンティックプリエントと連続したファジィメンバーシップの学位を統合する。
FRCは、解釈性と堅牢性を改善した微妙で曖昧な表現を管理するための一般的なメカニズムを提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:36:38 GMT)
JanusVLN: Decoupling Semantics and Spatiality with Dual Implicit Memory for Vision-Language Navigation [23.0] Vision-and-Language Navigationでは、自然言語命令と連続的なビデオストリームによってガイドされた、目に見えない環境をナビゲートするために、エンボディエージェントが必要である。
VLNの最近の進歩は、マルチモーダル大規模言語モデルの強力な意味理解によって推進されている。
本稿では,空間幾何学的,視覚的セマンティックメモリを分離,コンパクト,固定サイズのニューラル表現としてモデル化した,二重暗黙的ニューラルメモリを備えた新しいVLNフレームワークであるJanusVLNを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:29:37 GMT)
REFINE-CONTROL: A Semi-supervised Distillation Method For Conditional Image Generation [22.9] 条件付き画像生成モデルは、テキストベースの制御を活用して、カスタマイズされた画像を生成することで、目覚ましい結果を得た。
しかしながら、これらのモデルの高いリソース要求と、十分に注釈付けされたデータの不足により、エッジデバイスへのデプロイメントが妨げられている。
これらの課題を克服するための半教師付き蒸留フレームワークであるRefine-Controlを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:59:40 GMT)
EgoVIS@CVPR: What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.9] 状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。
我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。
本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:20:27 GMT)
Investigating Faithfulness in Large Audio Language Models [22.9] 忠実さは、チェーンオブ思想表現がモデルの決定過程を正確に反映しているかどうかを測り、信頼性のある説明として使用することができる。
本稿では,複数のLALMが生成するCoTの忠実度を,対象とする介入を適用して検討する。
上記のいくつかのデータセットやタスクにわたる介入を経た上で、私たちの実験は、LALMが一般的に、根底にある意思決定プロセスに忠実であるように見えるCoTを生成することを示唆しています。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:58:22 GMT)
InstructPro: Natural Language Guided Ligand-Binding Protein Design [22.9] InstructProは、自然言語命令とリガンド式からタンパク質を設計する生成モデルのファミリーである。
トレーニングと評価を可能にするために,960万(関数記述,リガンド,タンパク質)の大規模データセットであるInstructProBenchを開発した。
InstructPro-1Bは2.46%と3.14%、InstructPro-3Bは5.06%と3.93%である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:58:26 GMT)
Training-Free Bayesianization for Low-Rank Adapters of Large Language Models [22.8] TFB(Training-Free Bayesianization)は、トレーニングなしでトレーニングされた低ランクアダプタをベイズアダプタに変換するフレームワークである。
TFBは既存の手法よりも優れた不確実性推定と一般化を実現する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:37:00 GMT)
Intercept Cancer: Cancer Pre-Screening with Large Scale Healthcare Foundation Models [22.6] CATCH-FM, CATch carcinoma early with Healthcare Foundation Models。
Caught-FMは、過去の医療記録に基づいて、リスクの高い患者をスクリーニングするために特定する。
本分析は,様々な患者分布におけるCATCH-FMのロバスト性,ICD符号空間での操作の利点,非自明ながんリスク因子を捕捉する能力を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:50:53 GMT)
Abductive Logical Rule Induction by Bridging Inductive Logic Programming and Multimodal Large Language Models [22.5] Inductive Logic Programming(ILP)とMultimodal Large Language Models(MLLM)をブリッジするILP-CoTを提案する。
このタスクには、論理的事実の発見と、少数の構造化されていないテキストや視覚的な入力から論理的ルールの誘導の両方が含まれる。
本手法は,MLLMのルール構造提案に基づいて,探索空間を切断したILPタスクを自動生成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:56:19 GMT)
Pose-free 3D Gaussian splatting via shape-ray estimation [22.4] ポーズフリーでフィードフォワードのガウススプレイティングフレームワークであるSHAREを紹介する。
関節形状とカメラ線推定によりあいまいさを克服する。
提案手法はポーズフリーな一般化可能なガウススプラッティングにおけるロバストな性能を実現する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:08:53 GMT)
AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.4] 本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。
本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:51:17 GMT)
D-Artemis: A Deliberative Cognitive Framework for Mobile GUI Multi-Agents [22.3] D-ArtemisはGUIエージェントのための新しい検討フレームワークである。
D-Artemisは、詳細なアプリ固有のチップ検索メカニズムを使用して、意思決定プロセスに通知する。
また、TACチェックモジュールとACA(Action Correction Agent)が協調して動作し、実行障害のリスクを軽減している。
実行後状態反映エージェント(SRA)は認知ループを完了し、経験から戦略的学習を可能にする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:56:19 GMT)
Evaluating Memory in LLM Agents via Incremental Multi-Turn Interactions [22.2] メモリエージェントに不可欠な4つのコア能力、すなわち、正確な検索、テスト時間学習、長距離理解、選択的忘れの4つを特定した。
既存のベンチマークは、限られたコンテキスト長に依存するか、書籍ベースのQAのような静的で長いコンテキスト設定用に調整されている。
メモリエージェント用に特別に設計された新しいベンチマークであるMemoryAgentBenchを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:31:14 GMT)
Bridging Fairness and Explainability: Can Input-Based Explanations Promote Fairness in Hate Speech Detection? [22.2] 本研究では,ヘイトスピーチ検出における説明可能性と公平性の関係について,最初の系統的研究を行った。
バイアス付き予測の同定,(2)公正モデルの選択,(3)モデルトレーニング時のバイアス軽減の3つの重要な側面について検討する。
入力に基づく説明は, 偏りのある予測を効果的に検出できるが, 候補の中から公平なモデルを選択するには信頼性が低い。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:53:20 GMT)
Goal-Guided Efficient Exploration via Large Language Model in Reinforcement Learning [21.5] 本稿では,RLエージェントを効率的に探索するための構造化ゴールプランナとゴール条件アクションプルーナーを紹介する。
本手法をCrafter と Craftax-Classic で評価し,SGRL が既存の最先端手法と比較して優れた性能を発揮することを示す実験結果を得た。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:45:41 GMT)
ASCoT: An Adaptive Self-Correction Chain-of-Thought Method for Late-Stage Fragility in LLMs [21.4] CoT(Chain-of-Thought)の促進により,LLM(Large Language Models)の推論機能が大幅に向上した。
CoT鎖の後半で導入されたエラーは、当初と同一のエラーよりも、最終回答が著しく破損する可能性が高い。
本稿では、この脆弱性に対処するために、適応自己補正連鎖法(ASCoT)を導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:53:35 GMT)
Benchmarking and Mitigate Psychological Sycophancy in Medical Vision-Language Models [21.4] 視覚言語モデルは、しばしば、証拠に基づく推論よりも、社会的手がかりや認識された権威を記述したユーザーとの整合性に優先順位を付ける、幻想的行動を示す。
本研究は, 新規な臨床評価基準を用いて, 医用視覚質問応答における臨床症状について検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:02:22 GMT)
SynerGen: Contextualized Generative Recommender for Unified Search and Recommendation [21.3] 生成シーケンスモデルは、自動回帰的にランク付けされたアイテムを自動生成することで、検索とランキングの統一を約束している。
textitSynerGenは、パーソナライズされた検索とレコメンデーションの両方のための単一の生成バックボーンを提供することで、この重要なギャップを埋める新しい生成レコメンデーションモデルである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:27:04 GMT)
Beyond Classification Accuracy: Neural-MedBench and the Need for Deeper Reasoning Benchmarks [21.2] 近年の視覚言語モデル (VLM) の進歩は, 標準医学ベンチマークにおいて顕著な性能を発揮しているが, その真の臨床推論能力は未だ不明である。
我々はニューラルメドベンチ(Neural-MedBench)について紹介する。これは、神経学におけるマルチモーダルな臨床推論の限界を調査するためのコンパクトで推論集約的なベンチマークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:20:01 GMT)
Decentralized Stochastic Nonconvex Optimization under the Relaxed Smoothness [21.1] 分散正規化勾配勾配(DNS)という新しいアルゴリズムを提案する。
DNSは各ローカルエージェントで$bold$ilonポイントを達成することができる。
以上より, $mathcal O(m-1(L_fsigma2Delta_fepsilon-4 + sigma2epsilon-2 + L_f-1)$ per agent。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:08:27 GMT)
From Long to Lean: Performance-aware and Adaptive Chain-of-Thought Compression via Multi-round Refinement [21.0] CoT(Chain-of-Thought)推論は複雑なタスクのパフォーマンスを改善するが、冗長性による遅延が大幅に増加する。
マルチラウンド適応チェイン・オブ・ソート圧縮(MACC)を提案する。
本手法は,最先端のベースラインに対して平均5.6%の精度向上を実現する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:02:48 GMT)
SingRef6D: Monocular Novel Object Pose Estimation with a Single RGB Reference [20.9] 本稿では,単一のRGB画像のみを参照として必要とする軽量パイプラインであるSingRef6Dを提案する。
まず,Depth-Anything v2上に新たな最適化損失を発生させるトークンスケーラを用いた微調整機構を提案する。
第2に,Deep-Aware matching(深度対応マッチング)を導入し,難解な材料や照明条件のマッチング処理を可能にした。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:14:41 GMT)
HiCoLoRA: Addressing Context-Prompt Misalignment via Hierarchical Collaborative LoRA for Zero-Shot DST [20.9] Zero-shot Dialog State Tracking (zs-DST)は、タスク指向のダイアログシステム(TOD)がコストのかかるデータアノテーションなしで新しいドメインに一般化できるようにするために必須である。
HiCoLoRAは、堅牢なプロンプトアライメントを通じてゼロショットスロット推論を強化するフレームワークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:05:22 GMT)
The Internet of Us [20.9] インターネット・オブ・Us(英語: Internet of Us, IoU)は、より豊かで深い社会関係を促進できるオンラインの多様性に配慮したソーシャルインタラクションである。
社会設定における多様性の多面的側面と、IoUの恩恵を享受するために必要となる多分野的な作業について論じる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:52:48 GMT)
Learning with errors may remain hard against quantum holographic attacks [20.8] 近年の研究では、絡み合いのエントロピーはLearning with Errors (LWE)と同じくらい難しく、量子重力とAdS/CFTとの緊張を生み出すことが示されている。
これは、ホログラフィック双対を構築し、極端の表面を測定することで、LWEを解くためのパラドックス的な経路を示唆している。
ホログラフィックエントロピーは、難解なホログラフィック辞書を必要とせず、量子計算の限界と一致していることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:38:27 GMT)
Towards Minimal Causal Representations for Human Multimodal Language Understanding [20.4] 従来の可能性よりも因果原理を活用する因果多様情報ボトルネック(CaMIB)モデルを導入する。
因果的特徴のグローバルな整合性を確保するため,器用変数制約を組み込む。
マルチモーダル感情分析、ユーモア検出、およびサルカズム検出の実験は、OODテストセットとともに、CaMIBの有効性を実証した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:04:23 GMT)
From Grunts to Lexicons: Emergent Language from Cooperative Foraging [20.2] マルチエージェントフォーエイジングゲームにおける言語の出現について検討する。
エージェントは、他のエージェントや環境に関する部分的な知識だけで、共有グリッドの世界で動作します。
エンドツーエンドの深層強化学習を使用して、エージェントはアクションとコミュニケーション戦略の両方をゼロから学ぶ。
我々は,それぞれの特性を定量化し,人口規模,社会動態,時間的依存など,創発的言語の特定の側面を形作る要因がどのように異なるかを分析する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:22:11 GMT)
EgoInstruct: An Egocentric Video Dataset of Face-to-face Instructional Interactions with Multi-modal LLM Benchmarking [20.2] 対面指導のエゴセントリックな新しいビデオデータセットを提案する。
我々は,2つの基本的なタスクに対して,命令的相互作用の包括的理解に向けた第一歩となる基本的アノテーションを提供する。
画像,音声,テキストを共同処理するMLLMを最近導入した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:52:26 GMT)
Can DPO Learn Diverse Human Values? A Theoretical Scaling Law [20.1] 嗜好学習は、人間のフィードバックに基づいて、好ましくない反応と好ましくない反応を区別するモデルを訓練する。
本稿では,値の多様性とサンプル量とともに一般化がいかにスケールするかを解析するための新しい理論的枠組みを提案する。
我々のフレームワークは、有限個の勾配ステップの後、モデルがどのように一般化するかを厳格に評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:16:19 GMT)
Persistent Autoregressive Mapping with Traffic Rules for Autonomous Driving [20.1] PAMR(Persistent Autoregressive Mapping with Traffic Rules)は、車線ベクトルと交通ルールの自己回帰協調構築を行う新しいフレームワークである。
提案手法では,時間セグメント内のシーンの処理を行うMap-Rule Co-Constructionと,ルール一貫性を維持するMap-Rule Cacheという2つの重要なメカニズムを導入している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:33:36 GMT)
What Makes LLM Agent Simulations Useful for Policy? Insights From an Iterative Design Engagement in Emergency Preparedness [20.0] 社会シミュレーションにLarge Language Modelsをエージェント(LLMエージェント)として使うことへの関心が高まっているが、実際の採用は限られている。
LLMエージェントのシミュレーションは、政策にどのように役立つのか?
我々は,様々な緊急シナリオ下での大規模な集まりにおいて,群衆の動きとコミュニケーションをシミュレートする13,000個のLDMエージェントを反復的に開発した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:51:34 GMT)
Transport Based Mean Flows for Generative Modeling [20.0] フローマッチング生成モデルは、連続データ生成の強力なパラダイムとして現れています。
これらのモデルは、多数のシーケンシャルサンプリングステップを必要とするため、推論が遅い。
最近の研究はサンプリングステップの数を減らして推論を加速させようとしている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:12:19 GMT)
FailureAtlas:Mapping the Failure Landscape of T2I Models via Active Exploration [19.9] FailureAtlasは、T2Iモデルの大規模な障害状況を自律的に探索し、マッピングするように設計されたフレームワークである。
我々の手法は、これまで未知のエラースライスを数十万も発見する。
FailureAtlasは、より堅牢な生成AIの開発をガイドする、診断優先の新しい方法論を確立している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:23:23 GMT)
Learning to summarize user information for personalized reinforcement learning from human feedback [19.9] Preference Learning Using Summarization (PLUS) は、強化学習を用いて、各ユーザの好みのテキストベースの要約を生成する。
ユーザサマリゼーションモデルと報酬モデルの両方を同時にトレーニングし、オンラインのコ適応ループを作成する。
PLUSはユーザの好みを多様に把握し,報奨モデルの精度を11~77%向上することを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:32:18 GMT)
PilotRL: Training Language Model Agents via Global Planning-Guided Progressive Reinforcement Learning [19.5] 大規模言語モデル(LLM)はエージェント指向タスクの処理において顕著な進歩を見せている。
現在のアプローチは主に教師付き微調整に依存しており、しばしばモデルが確立されたタスク完了軌跡を記憶させる。
適応的グローバルプランベースエージェントパラダイムであるAdaPlanを導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:04:34 GMT)
Following the TRACE: A Structured Path to Empathetic Response Generation with Multi-Agent Models [19.5] 共感的応答生成は、より人間らしく支持的な会話エージェントを作成するための重要なタスクである。
既存の手法は、専門モデルの分析的深さと大規模言語モデルの生成的頻度との間の中心的なトレードオフに直面している。
我々は,共感を構造化認知プロセスとしてモデル化する新しいフレームワークであるTRACEを提案し,そのタスクを解析と合成のためのパイプラインに分解する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:20:37 GMT)
Partial Parameter Updates for Efficient Distributed Training [19.4] 低コミュニケーション分散トレーニングのためのメモリ効率と計算効率の手法を提案する。
本手法は,同一のトークンと帯域幅の予算の下で,従来の低通信方式の難易度と一致する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:39:44 GMT)
LUMINA: Detecting Hallucinations in RAG System with Context-Knowledge Signals [19.4] Retrieval-Augmented Generation (RAG) は、検索した文書に応答を接地することで、大規模言語モデル(LLM)における幻覚を軽減することを目的としている。
しかし、RAGベースのLLMは、正確で十分なコンテキストが提供されても、まだ幻覚的である。
本稿では,RAGシステムにおける幻覚を検出する新しいフレームワークLUMINAを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:57:46 GMT)
Frequency-Domain Refinement with Multiscale Diffusion for Super Resolution [19.3] 周波数領域誘導型マルチスケール拡散モデル(FDDiff)を提案する。
FDDiffは、高周波情報補完プロセスをよりきめ細かいステップに分解する。
これは、高忠実度超解像結果で先行生成法より優れる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:03:06 GMT)
Unifying Symbolic Music Arrangement: Track-Aware Reconstruction and Structured Tokenization [19.3] 自動マルチトラック音楽アレンジメントのための統合フレームワークを提案する。
中心となるのは、トークンレベルのアンタングルされたコンテンツとスタイルで動作するセグメントレベルの再構築目標である。
トラックワイズ・モデリングを支援するため,マルチトラック・シンボリック・ミュージックのための構造化トークン化手法であるREMI-zを導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:10:50 GMT)
MUCAR: Benchmarking Multilingual Cross-Modal Ambiguity Resolution for Multimodal Large Language Models [19.2] MLLM(Multimodal Large Language Models)は多くの視覚言語タスクにおいて大きな進歩を見せている。
マルチランガルおよびクロスモーダルシナリオ間のマルチモーダル曖昧性解決を明示的に評価するために設計された新しいベンチマークであるMUCARを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:51:36 GMT)
Global Convergence in Neural ODEs: Impact of Activation Functions [19.2] 活性化関数の性質,特に滑らかさと非線形性は,運動力学の訓練に重要であることを示す。
理論的知見は数値実験によって検証され、解析を支援し、ニューラルネットワークのスケーリングのための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:54:48 GMT)
GPU Temperature Simulation-Based Testing for In-Vehicle Deep Learning Frameworks [19.2] 本研究では,温度変化環境下での初めての自動車深層学習フレームワークテスト手法であるHeatherGuardianを提案する。
具体的には、温度感受性演算子をターゲットにしたモデル変異ルールを使用してテスト入力モデルを生成し、Newtonの冷却則に基づいてGPU温度変動をシミュレートし、リアルタイムGPU温度に基づいてGPU周波数を制御する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:30:39 GMT)
We Think, Therefore We Align LLMs to Helpful, Harmless and Honest Before They Go Wrong [19.1] Adaptive Multi-Branch Steering (AMBS) は、統合された効率的な多目的アライメントのための2段階の1-Nフレームワークである。
AMBSは、複数の7B LLMバックボーン間のHHHアライメントを一貫して改善する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:52:21 GMT)
The Measurement Imbalance in Agentic AI Evaluation Undermines Industry Productivity Claims [19.1] 本稿では,エージェントAIシステムに対する現在の評価手法が,業界生産性の主張に疑問を呈するシステム的不均衡を示すことを示す。
84論文(2023年-2025年)の体系的レビューでは,技術指標が評価を支配している評価の不均衡が明らかとなった。
バランスの取れた4軸評価モデルを提案し、このパラダイムシフトをリードするようコミュニティに呼びかける。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:21:40 GMT)
JudgeAgent: Knowledge-wise and Dynamic LLM Evaluation with Agent-as-Interviewer [19.1] 大規模言語モデル(LLM)のための動的評価パラダイムであるエージェント・アズ・インタービューアを提案する。
現在のベンチマークや動的相互作用のパラダイムとは異なり、エージェント・アズ・インタービューアはエージェントを使用して動的マルチターン質問生成においてより広く深い知識を得るために知識ツールを呼び出します。
我々は、知識駆動型合成をエージェントのツールとして活用し、戦略指導として難易度スコアリングを利用する知識ワイドな動的評価フレームワークであるJiceAgentを開発する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:22:22 GMT)
UISim: An Interactive Image-Based UI Simulator for Dynamic Mobile Environments [19.0] UISimは、スクリーンイメージから携帯電話環境を純粋に探索するための動的でインタラクティブなプラットフォームを提供する、画像ベースの新しいUIシミュレータである。
初期電話画面イメージとユーザアクションが与えられたら、まず次のUI状態の抽象的なレイアウトを予測し、次に視覚的に一貫した新しいイメージを合成する。
実験の結果、UISimは、現実的で一貫性のあるその後のUI状態を生成する際に、エンド・ツー・エンドのUI生成ベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:02:00 GMT)
Unlocking the Power of Mixture-of-Experts for Task-Aware Time Series Analytics [19.0] 時系列分析は、天気予報、金融詐欺検出、IoTシステムの欠落データに対する計算、行動認識のための分類など、さまざまな現実世界のアプリケーションで広く利用されている。
MoEは強力なアーキテクチャでありながら、タスクに依存しないルータとチャネル相関をモデル化する能力の欠如により、時系列分析における汎用タスクへの適応に依然として不足している。
PatchMoEと呼ばれる新しいMoEベースの時系列フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:44:46 GMT)
MO-GRPO: Mitigating Reward Hacking of Group Relative Policy Optimization on Multi-Objective Problems [18.9] グループ相対政策最適化は、正確な報酬モデルが利用できる場合に有効なアルゴリズムであることが示されている。
報奨関数を値のばらつきに応じて自動的に重み付けする単純な正規化法により,GRPOの拡張であるMO-GRPOを提案する。
また、MO-GRPOは、全ての報酬関数が優先順序を保ちながら損失関数に等しく寄与することを保証していることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:32:22 GMT)
NeuroScalar: A Deep Learning Framework for Fast, Accurate, and In-the-Wild Cycle-Level Performance Prediction [18.9] 本稿では,生産ハードウェア上での高忠実なインザワイルドシミュレーションのための新しいディープラーニングフレームワークを提案する。
我々のコアコントリビューションは、仮説プロセッサ設計のためのサイクルレベルの性能を予測するために、マイクロアーキテクチャに依存しない機能に基づいて訓練されたDLモデルである。
このフレームワークは,大規模なハードウェアA/Bテストと正確な性能解析を可能にすることを実証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:36:06 GMT)
Mental Health Impacts of AI Companions: Triangulating Social Media Quasi-Experiments, User Perspectives, and Relational Theory [18.7] 我々は,AICCがウェルビーイングをどのように形成し,ユーザがこれらの経験をどう感じたかを検討した。
発見は、感情と悲しみの表現、読みやすさ、対人的な焦点の混合効果を示した。
私たちは、健全なバウンダリを把握し、マインドフルエンゲージメントをサポートし、依存のない開示をサポートし、表面的な関係ステージを持つAIコンパニオンに対して、設計上の意味を提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:47:37 GMT)
Bézier Meets Diffusion: Robust Generation Across Domains for Medical Image Segmentation [18.6] 異なる医用画像モダリティにわたる堅牢な学習アルゴリズムのトレーニングは、大きなドメインギャップのために困難である。
教師なしドメイン適応(UDA)は、ソースドメインからの注釈付きイメージとターゲットドメインからのラベルなしイメージを使用して、ディープモデルをトレーニングすることでこの問題を軽減する。
既存のアプローチは、しばしばGANベースのスタイル転送に依存しているが、これらの手法は、高い可変性を持つ領域におけるクロスドメインマッピングの取得に苦慮している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:23:17 GMT)
Aurora: Towards Universal Generative Multimodal Time Series Forecasting [18.6] ドメイン間の一般化は時系列予測において非常に重要である。
最近の研究は、時系列基礎モデルとエンドツーエンドのマルチモーダル監視モデルの構築に重点を置いている。
本稿では,マルチモーダル入力とゼロショット推論をサポートするマルチモーダル時系列ファウンデーションモデルであるAuroraを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:56:20 GMT)
Causal-EPIG: A Prediction-Oriented Active Learning Framework for CATE Estimation [18.6] 本稿では,獲得関数が観測不能な因果量をターゲットにすべきとする因果的客観的アライメントの原理を紹介する。
我々はCausal-EPIGフレームワークを通じてこの原則を運用する。
基本的なトレードオフを具現化する2つの異なる戦略を導出します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:44:27 GMT)
Uncovering Alzheimer's Disease Progression via SDE-based Spatio-Temporal Graph Deep Learning on Longitudinal Brain Networks [18.5] 我々は、将来のアルツハイマー病(AD)の進行を予測するニューラルネットワークフレームワークを開発する。
筆者らの枠組みは, 地域的, 結合的重要性の低い確率を効果的に学習する。
以上の結果から,AD進行の早期・個別化予測における時間グラフ学習の可能性が示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:02:34 GMT)
UML-CoT: Structured Reasoning and Planning with Unified Modeling Language for Robotic Room Cleaning [18.5] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)の推論を改善するが、非構造化テキストへの依存は、エンボディされたタスクの解釈可能性と実行可能性を制限する。
本稿では,UML(Unified Modeling Language)を利用してシンボルCoTと実行可能なアクションプランを生成する構造的推論・計画フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:51:46 GMT)
StepORLM: A Self-Evolving Framework With Generative Process Supervision For Operations Research Language Models [18.5] 我々は、生成過程を監督する新しい自己進化フレームワークであるStepORLMを紹介する。
StepORLMの中核となるのは、ポリシーモデルと生成プロセス報酬モデル(GenPRM)が相互に反復的に改善される、共進化ループである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:39:10 GMT)
Order Matters! An Empirical Study on Large Language Models' Input Order Bias in Software Fault Localization [17.0] 本研究では,入力順序と文脈サイズが大規模言語モデル(LLM)の性能に及ぼす影響について検討する。
JavaプロジェクトのTop-1 FL精度は57%から20%に低下しますが、Pythonプロジェクトでは、コード順序を逆転すると38%から約3%に低下します。
入力を小さなコンテキストに分割することで、このバイアスを減らし、FLのパフォーマンスギャップを22%から6%に減らし、両方のベンチマークで1%に減らします。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:33:14 GMT)
Reimagining Agent-based Modeling with Large Language Model Agents via Shachi [16.6] 大規模言語モデル(LLM)によるマルチエージェントシステムにおける創発的行動の研究は重要な研究課題である。
エージェントのポリシーをコア認知コンポーネントに分解する形式的方法論とモジュラーフレームワークであるShachiを紹介する。
提案手法を総合的な10タスクベンチマークで検証し,新しい科学的探究を通じてその能力を実証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:38:59 GMT)
LongScape: Advancing Long-Horizon Embodied World Models with Context-Aware MoE [16.6] LongScapeは、チャンク内拡散とチャンク間自己回帰因果生成を組み合わせたハイブリッドフレームワークである。
私たちの中心となるイノベーションは、ロボットアクションのセマンティックコンテキストに基づいてビデオを分割するアクションガイド付き可変長チャンキングメカニズムです。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:47:05 GMT)
Dual Optimistic Ascent (PI Control) is the Augmented Lagrangian Method in Disguise [16.4] ラグランジアン上の双対楽観的な昇華は、増進ラグランジアン上の勾配降下昇華と同値であることを示す。
この発見により、ALMの堅牢な理論的保証を双対楽観的な設定に移行し、すべての局所解に線型収束することを証明できる。
我々の研究は、双対楽観的手法の実証的成功と理論的基礎の間に重要なギャップを埋める。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:41:20 GMT)
SBFA: Single Sneaky Bit Flip Attack to Break Large Language Models [16.4] Bit-Flip攻撃はディープニューラルネットワーク(DNN)を著しく損なう
SBFA(Sneaky Bit-Flip Attack)を提案する。
パラメータ感度の基準であるImpactScoreを用いて、反復的な検索とランキングによって達成される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:03:53 GMT)
Non-Linear Trajectory Modeling for Multi-Step Gradient Inversion Attacks in Federated Learning [16.2] グラディエント・インバージョン・アタック(GIA)に対する非線形パラメトリック・トラジェクトリ・モデリングを導入する最初の方法であるNL-SME(Non-Linear Surrogate Model Extension)を提案する。
提案手法は,SGDの曲線特性を制御点から捉えた学習可能な2次B'ezier曲線に置き換え,正規化とdvecスケーリング機構を併用して表現性を向上する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:04:25 GMT)
Fine-Grained Detection of Context-Grounded Hallucinations Using LLMs [16.2] コンテキストグラウンドド・幻覚(Context-grounded hallucination)は、モデル出力がソーステキストに対して検証できない情報を含む場合である。
このような幻覚を局在化するためのLCMの適用性について検討する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:03:24 GMT)
LLMs Behind the Scenes: Enabling Narrative Scene Illustration [16.0] 本研究では、物語のシーンを描写した画像を自動的に生成するストーリーシーンイラストアのタスクに焦点を当てる。
近年のテキスト・ツー・イメージ・モデルの発展により,LLMをテキスト・ツー・イメージ・モデルを促進するインタフェースとして利用するパイプラインが検討されている。
このパイプラインのバリエーションを顕著なストーリーコーパスに適用し、これらのストーリーのシーンのイラストを合成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:15:18 GMT)
An Exploratory Study on Fine-Tuning Large Language Models for Secure Code Generation [16.0] 脆弱性修正コミットのデータセット上で学習済みの大規模言語モデルがセキュアなコード生成を促進するかどうかを検討する。
オープンソースのリポジトリから、確認済みの脆弱性のコード修正を収集することで、セキュアなコード生成のための微調整データセット(14,622 C/C++ファイル)をクロールします。
C言語のセキュリティの最大改善は6.4%、C++言語の5.0%です。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:50:10 GMT)
Multi-View Hypercomplex Learning for Breast Cancer Screening [16.0] 多視点乳がん分類のための新しい学習パラダイムである多視点超複雑学習を導入する。
超複素代数のおかげで、我々のモデルは本質的にビュー内関係とビュー間関係の両方を捉えている。
我々のアプローチは、最先端のマルチビューモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:46:44 GMT)
Same Content, Different Representations: A Controlled Study for Table QA [15.9] リアルタイム設定におけるテーブル質問回答(Table QA)は、構造化されたデータベースとテキストフィールドを含む半構造化されたテーブルの両方で操作する必要がある。
既存のベンチマークは固定データ形式に結びついており、表現自体がモデルパフォーマンスに与える影響を体系的に検討していない。
コンテント定数を一定に保ちながら構造を変化させることによりテーブル表現の役割を分離する最初の制御された研究について述べる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:33:19 GMT)
RelMap: Enhancing Online Map Construction with Class-Aware Spatial Relation and Semantic Priors [15.8] 本稿では,オンラインHDマップ構築を改善するために,空間関係とセマンティック先行の両方を明示的にモデル化するエンドツーエンドフレームワークを提案する。
RelMapは、単一フレームと時間知覚の両方のバックボーンと互換性があり、nuScenesとArgoverse 2データセットの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:32:56 GMT)
Learning Unified Representation of 3D Gaussian Splatting [15.8] 十分に設計されたベクトル化表現は、3Dガウススプラッティングに固有の学習システムにとって不可欠である。
本稿では,ガウス原始体の固有情報をカプセル化した連続部分多様体場に基づく3DGSの埋め込み表現を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:44:59 GMT)
ZeroTuning: Unlocking the Initial Token's Power to Enhance Large Language Models Without Training [15.8] 我々はZeroTuningを紹介した。ZeroTuningは、初期トークンに頭部特異的な注意調整を適用することで、LCMの性能を向上させる訓練自由な方法である。
このトークンの注意ログに軽量バイアスを加えることで、下流の注意分布のエントロピーを単調に制御できることが理論的に示されている。
検証例を校正する教師ありモードと、モデルの出力エントロピーを直接最小化する教師なしモードの2つのバリエーションを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:55:57 GMT)
Efficient Prior Selection in Gaussian Process Bandits with Thompson Sampling [15.6] GPトンプソンサンプリング(GP-TS)に基づくGPバンディットの結合前選択と後悔の最小化のための2つのアルゴリズムを提案する: GP-TS(PE-GP-TS)とHyperPrior GP-TS(HP-GP-TS)である。
理論的にはアルゴリズムを解析し,それぞれの後悔に対する上限を確立する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:13:04 GMT)
Does AI Coaching Prepare us for Workplace Negotiations? [15.6] 私たちは、AIコーチのプロトタイプであるTruceyと、従来の交渉ハンドブックを比較します。
手帳の包括的でレビュー可能な内容は参加者の自信と準備に不可欠であった。
参加者はAIのリハーサル能力を評価したが、その指導はしばしば冗長で断片的であると感じた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:21:24 GMT)
ChaosNexus: A Foundation Model for Universal Chaotic System Forecasting with Multi-scale Representations [15.4] ChaosNexusは、カオス力学の多様なコーパスに基づいて事前訓練された基礎モデルである。
これは、合成ベンチマークと実世界のベンチマークの両方で最先端のゼロショットの一般化を実証している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:59:12 GMT)
Beyond Textual Context: Structural Graph Encoding with Adaptive Space Alignment to alleviate the hallucination of LLMs [15.3] SSKG-LLMは、KGの構造情報を大規模言語モデルの推論プロセスに効率的に統合する革新的なモデルアーキテクチャである。
我々は、広範囲にわたる実験を行い、かつ、KGの構造情報を組み込むことによって、LLMの事実推論能力を高める方法について、詳細な分析を行う。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:14:01 GMT)
STHN: Deep Homography Estimation for UAV Thermal Geo-localization with Satellite Imagery [15.1] 粗大から細い深部ホログラフィー推定手法を用いたUAV熱ジオローカライズ手法を提案する。
この方法は、UAVの最後の位置から半径512メートル以内で、信頼性の高い熱的位置決めを可能にする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:27:13 GMT)
MindCraft: How Concept Trees Take Shape In Deep Models [15.1] コンセプトツリー上に構築されたMindCraftフレームワークを紹介します。
概念木は階層的な概念の出現を再構築し、共有表現から線形に分離可能な部分空間へと正確に分岐する。
実証的な評価は、概念ツリーが意味的階層を回復し、潜在概念を歪め、複数のドメインにまたがって広く適用可能であることを示している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:39:52 GMT)
JGU Mainz's Submission to the WMT25 Shared Task on LLMs with Limited Resources for Slavic Languages: MT and QA [15.1] パラメータ効率を考慮したQwen2.5-3B-Instructモデルについて検討した。
我々のパイプラインは、追加の翻訳と複数選択質問応答(QA)データを統合する。
実験により、我々のモデルは両方のタスクのベースラインより優れています。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:35:38 GMT)
Navigating the Impact of Structured Output Format on Large Language Models through the Compass of Causal Inference [14.1] 大規模言語モデル(LLM)からの構造化出力は、生成された情報を処理する際の効率を向上した。
構造化フォーマットが完全性と事実的正確性を高めることを示唆する者もいる。
LLMの推論能力を制限し、標準評価指標の削減につながると主張する者もいる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:47:11 GMT)
Training-Free Synthetic Data Generation with Dual IP-Adapter Guidance [13.9] DIPSYは、数ショットの例を使って合成画像を生成するトレーニング不要のアプローチである。
我々の手法は最先端または同等のパフォーマンスを達成する。
本研究は,クラス識別特徴の生成に肯定的指導を施した二重画像の活用の有効性を強調した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:57:32 GMT)
See, Point, Fly: A Learning-Free VLM Framework for Universal Unmanned Aerial Navigation [13.9] 本稿では,視覚言語モデル(VLM)上に構築された,訓練不要な空中視覚・言語ナビゲーションフレームワークであるSee, Point, Fly(SPF)を紹介する。
SPFは任意の種類のフリーフォーム命令に基づいて任意の目標にナビゲートすることができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:59:59 GMT)
PoCGen: Generating Proof-of-Concept Exploits for Vulnerabilities in Npm Packages [13.9] 我々は,npmパッケージの脆弱性に対するPoCエクスプロイトを自律的に生成し,検証する新しいアプローチであるPoCGenを提案する。
PoCGenはSecBench$.jsデータセットの脆弱性の77%のエクスプロイトを生成することに成功した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:43:31 GMT)
Rethinking Large Language Model Distillation: A Constrained Markov Decision Process Perspective [13.6] 本稿では, 大規模言語モデル (LLM) の蒸留に制約付き強化学習問題として定式化することによって, 新たなアプローチを導入する。
本稿では,教師モデルからの逸脱を一定の閾値以下に抑えながら,タスク固有の報酬を最大化する最適化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:47:49 GMT)
Follow the Path: Reasoning over Knowledge Graph Paths to Improve LLM Factuality [13.5] 大規模な推論モデルから導出することで、推論トレースの事実性を向上する手法であるfs1を紹介する。
我々は、3.9Kの事実的根拠に基づく推論トレースに基づいて8つの命令調整型大規模言語モデル(LLM)を微調整する。
その結果,fs1調整モデルでは,命令調整モデルよりも6~14絶対点の並列サンプリングの方が優れていた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:25:25 GMT)
LABELING COPILOT: A Deep Research Agent for Automated Data Curation in Computer Vision [13.4] 本稿では,コンピュータビジョンのための初のデータキュレーションディープリサーチエージェントであるLabeling Copilotを紹介する。
大規模なマルチモーダル言語モデルを利用する中央オーケストレータエージェントは、多段階推論を使用して、3つのコア機能にまたがる特殊なツールを実行する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:55:26 GMT)
Vivid-VR: Distilling Concepts from Text-to-Video Diffusion Transformer for Photorealistic Video Restoration [13.4] 先進的なT2Vファンデーションモデルに基づいて構築されたDiTベースの生成ビデオ復元手法であるVivid-VRを提案する。
Vivid-VRは, 実世界のベンチマークと実世界のベンチマークの両方において, 既存のアプローチに対して良好に動作することを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:11:21 GMT)
Your RAG is Unfair: Exposing Fairness Vulnerabilities in Retrieval-Augmented Generation via Backdoor Attacks [13.3] Retrieval-augmented Generation (RAG)は、検索機構と生成モデルを統合することにより、現実のグラウンド化を促進する。
本稿では,2段階のバックドアアタックを通じてRAGの公平性の脆弱性を明らかにするシステムフレームワークであるBiasRAGを紹介する。
事前学習フェーズでは、クエリエンコーダが妥協され、ターゲットグループを意図した社会的バイアスに整合させ、長期的持続性を確保する。
デプロイ後の段階では、バックドアを強化するために、敵文書を知識ベースに注入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:33:36 GMT)
Align2Speak: Improving TTS for Low Resource Languages via ASR-Guided Online Preference Optimization [13.2] 自動回帰型多言語TSモデルを新しい言語に適用するためのフレームワークを提案する。
我々は、ターゲット言語の韻律的特徴を捉えるために、新しい言語の限られたペアデータに基づいて、このモデルを微調整する。
実験により、このパイプラインは低リソース言語で理解不能で話者一貫性のある音声を生成することが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:28:50 GMT)
Stage-wise Dynamics of Classifier-Free Guidance in Diffusion Models [13.0] CFGは拡散モデルにおける条件の忠実度向上に広く用いられているが、サンプリング力学への影響はよく分かっていない。
CFGをマルチモーダル条件下で解析し,サンプリングプロセスが3段階に展開することを示す。
実験はこれらの予測を支持し、早期の強いガイダンスが世界的な多様性を損なう一方で、後期の強いガイダンスはきめ細かい変化を抑制することを示した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:45:20 GMT)
In Their Own Words: Reasoning Traces Tailored for Small Models Make Them Better Reasoners [13.0] より大きな言語モデルから小さな言語モデルへの推論能力の転送は、しばしば反故意に失敗する。
より大きなモデルからのトレースの推論は、学生の分布下では低い確率のトークンを含む。
本稿では,学生に優しい推論トレースを生成するメカニズムであるReverse Speculative Decoding (RSD)を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:40:32 GMT)
HEAPr: Hessian-based Efficient Atomic Expert Pruning in Output Space [12.9] HEAPrは、専門家を小さく、識別不能な原子エキスパートに分解する、新しい刈り取りアルゴリズムである。
これは、原子専門家の固有の特性を利用して、2階の情報を専門家パラメータから原子専門家パラメータに変換する。
これは、様々な圧縮率とベンチマークで、既存のエキスパートレベルのプルーニング手法よりも優れています。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:00:46 GMT)
Where Did It Go Wrong? Attributing Undesirable LLM Behaviors via Representation Gradient Tracing [12.8] 大きな言語モデル(LLM)は目覚ましい機能を示しているが、そのデプロイメントは望ましくない振る舞いによってしばしば損なわれている。
本稿では,表現とその勾配を解析することによって,望ましくないLCMの挙動を診断する,新しい,効率的なフレームワークを提案する。
本手法は,有害な内容の追跡,バックドア中毒の検出,知識汚染の同定などのタスクに対して,系統的に評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:07:47 GMT)
What Is The Political Content in LLMs' Pre- and Post-Training Data? [12.7] 完全オープンソースモデルであるOLMO2の事前学習コーパスと後学習コーパスの解析を行った。
これらのコーパスから、我々は大きなランダムサンプルを描き、政治的指向のために自動的に文書を注釈付けし、それらのソースドメインとコンテンツを分析する。
次に、トレーニングデータの政治的コンテンツが、特定の政策問題に対するモデルのスタンスとどのように関連しているかを評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:00:51 GMT)
Voting-Bloc Entropy: A New Metric for DAO Decentralization [12.6] 分散型自治機構(DAO)は、スマートコントラクトを使用して、共通の目標に向かって作業するコミュニティを育成する。
本研究は,VBE(Voting-Bloc Entropy)と呼ばれる分散化を計測する新しいフレームワークを提案する。
VBEは、密接に一致した関心を持つ有権者が中央集権的な力として振る舞うという考えに基づいており、そのようにモデル化されるべきである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:46:07 GMT)
When Does Reasoning Matter? A Controlled Study of Reasoning's Contribution to Model Performance [12.6] Instruction Fine-Tuning (IFT) と様々なサイズの推論モデルを比較する。
我々の分析によると、推論はモデル性能を継続的に改善し、多くの場合、より大規模なIFTシステムに適合または超越している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:53:52 GMT)
In-Context Learning can Perform Continual Learning Like Humans [12.5] 大規模言語モデル(LLM)は、パラメータを更新することなく、ICL(In-context Learning)を介して新しいタスクに適応することができる。
マルチタスク環境におけるICLの保持特性について検討し,それを文脈内連続学習(ICCL)に拡張する。
ICCLは、人間に類似した方法で分散プラクティスの恩恵を受けており、維持のための「スイートスポット」の間隔を一貫して明らかにしている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:08:06 GMT)
Bridging Kolmogorov Complexity and Deep Learning: Asymptotically Optimal Description Length Objectives for Transformers [12.4] 本稿では,普遍性と最適記述長の目的に関する理論的概念を紹介する。
変動目的を構築・解析することで,そのような目的を抽出し,識別可能であることを示す。
より広義には、強力なアルゴリズム保証を持つ記述長目標を識別する理論的枠組みを提供することにより、より圧縮と一般化を達成するニューラルネットワークのトレーニングへの潜在的な道筋を概説する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:02:24 GMT)
Linear Causal Representation Learning by Topological Ordering, Pruning, and Disentanglement [12.4] 因果表現学習(CRL)は、因果推論や人工知能コミュニティからの関心が高まっている。
本研究では, 環境の不均一性やデータ生成分布について, より弱い仮定の下での線形CRLアルゴリズムを提案する。
合成実験と大規模言語モデルの解釈可能性解析により,新しいアルゴリズムの有効性を検証した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:35:42 GMT)
Chain or tree? Re-evaluating complex reasoning from the perspective of a matrix of thought [12.4] 思考のマトリックス(MoT)は、大規模言語モデル(LLM)のための新規で効率的な思考構造である
MoTは「カラムセル通信」機構を通じて水平次元と垂直次元の両方の問題を探索する。
我々のフレームワークは最先端の手法より優れており、推論時間はベースライン手法の14.4%に過ぎない。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:57:36 GMT)
Collaborative and Proactive Management of Task-Oriented Conversations [12.4] タスク指向対話システム (TOD) は、自然言語対話におけるユーザの好みに基づいたタスクを完了させる。
タスク完了には積極的な計画が不可欠だが、既存のTODの多くは効果的な目標認識計画を見落としている。
本稿では,対話管理への情報状態アプローチを中心に,タスク指向の会話を管理するモデルを作成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:18:13 GMT)
Extending coherence time beyond break-even point using only drives and dissipation [12.4] 量子エラー補正(QEC)は、環境への量子情報の損失を軽減することを目的としている。
本稿では,任意の誤り訂正符号に適用可能な量子チャネルシミュレーションに基づくAQECプロトコルを提案する。
これは、AQECで保護されたボソニックな論理量子ビットの破れ点を超えた最初の実験的実現である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:50:27 GMT)
pFedMMA: Personalized Federated Fine-Tuning with Multi-Modal Adapter for Vision-Language Models [12.3] pFedMMAは、視覚言語タスクにマルチモーダルアダプタを活用する最初のパーソナライズされた学習フレームワークである。
pFedMMAはパーソナライゼーションと一般化の間の最先端のトレードオフを実現し、近年のフェデレーション・プロンプト・チューニング手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:36:44 GMT)
Graph is a Natural Regularization: Revisiting Vector Quantization for Graph Representation Learning [12.2] 本稿では,ベクトル量子化をグラフデータに適用した場合に,コードブックの崩壊が一貫して起こることを示す最初の実証的研究を示す。
グラフトポロジと特徴的類似性を明示的な正規化信号として統合し,コードブックの利用率を高め,トークンの多様性を促進する新しいフレームワークであるRGVQを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:31:45 GMT)
UniVid: Unifying Vision Tasks with Pre-trained Video Generation Models [12.2] 広範なコーパスで訓練された大規模言語モデルは、単一の生成フレームワーク内で多様な言語タスクを統一することに成功した。
このようなモデリングには、モダリティやソースをまたいだタスク固有の事前トレーニングが必要です。
タスク固有の変更なしに様々な視覚タスクを処理するために,ビデオ拡散変換器を微調整するフレームワークであるUniVidを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:43:40 GMT)
Towards Efficient Online Exploration for Reinforcement Learning with Human Feedback [12.2] 人間のフィードバックによる強化学習は、大きな言語モデルと人間の好みを整合させる中心的なパラダイムとして現れてきた。
オンラインRLHFの探索原理について検討し、報酬モデルとポリシーの両方をデータ効率のよい方法で洗練しようとする。
そこで本研究では,報酬差の不確実性を抑えるために,嗜好クエリを指示する新たな探索手法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:57:17 GMT)
Capacity-Aware Planning and Scheduling in Budget-Constrained Multi-Agent MDPs: A Meta-RL Approach [12.1] 容量・予算制約型マルチエージェントMDP(CB-MA-MDP)について検討する。
本稿では,大規模システムに対して,引き続きトラクタブルな2段階のソリューションを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:27:30 GMT)
Implicit bias produces neural scaling laws in learning curves, from perceptrons to deep networks [12.1] 我々は,異なるノルムベースの複雑性尺度の関数として,パフォーマンスの進化を規定する2つの新しいテキスト力学的スケーリング法則を同定する。
我々の発見は、CNN、ResNets、MNIST、CIFAR-10、CIFAR-100で訓練されたVision Transformersで一致している。
我々は,ロジスティックな損失で訓練された単一層パーセプトロンを用いて解析支援を行い,新しい動的スケーリング法則を導出する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:31:07 GMT)
Rigidity-Aware 3D Gaussian Deformation from a Single Image [12.1] 単一の画像のみから3次元ガウス変形を導く新しいフレームワークであるDeformSplatを提案する。
また,3次元ガウス表現と2次元画素観測の領域ギャップを埋めるガウス対Pixelマッチングを提案する。
これら2つの手法を組み合わせることで,1つの画像から一貫した変形を再構成することができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:34:55 GMT)
Why Chain of Thought Fails in Clinical Text Understanding [11.9] チェーン・オブ・シークレット・プロンプト(CoT)はステップ・バイ・ステップの推論を導く。
大規模言語モデル(LLM)は、臨床医療にますます応用されている。
本研究は,臨床テキスト理解のためのCoTの大規模体系化研究である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:18:15 GMT)
Efficient Fine-Grained GPU Performance Modeling for Distributed Deep Learning of LLM [11.9] 大規模言語モデル(LLM)の訓練は、高性能コンピューティングにおける最も計算集約的なタスクの1つである。
我々は、数百のGPUに分散したマルチビリオンパラメータモデルのエンドツーエンドトレーニング時間を予測するためのフレームワークを提案する。
われわれのフレームワークは、Perlmutter(A100)で4.98%、Vista(GH200)で9.38%の低平均予測誤差を128GPUで20Bパラメータまで達成している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:38:25 GMT)
The QCET Taxonomy of Standard Quality Criterion Names and Definitions for the Evaluation of NLP Systems [11.9] 2つの評価が同等の時期を知らないということは、システム品質に関する信頼できる結論を引き出す能力が欠如しているということです。
NLPで報告された評価の3つの調査から品質基準名と定義の標準セットを導出するQCETを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:49:03 GMT)
From tests to effect sizes: Quantifying uncertainty and statistical variability in multilingual and multitask NLP evaluation benchmarks [11.9] モデルおよびデータ関連情報源の両方から,実験結果の変動が生じることを示す。
また,リーダーボードに使用される様々な量のサンプリング分布の計算に,再サンプリング手法がいかに有用かを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:37:55 GMT)
Recursive Training Loops in LLMs: How training data properties modulate distribution shift in generated data? [11.4] 大規模言語モデル(LLM)は、オンラインコンテンツの作成にますます利用されている。
この合成データに基づいて、次の世代のモデルのトレーニングが行われると、フィードバックループが生成される。
このようなループは、人間のデータの真の基盤となる分布を誤って表現するモデルである、分散シフトにつながることが示されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:11:25 GMT)
LLM-OptiRA: LLM-Driven Optimization of Resource Allocation for Non-Convex Problems in Wireless Communications [11.2] 無線通信における非リソース割り当て問題の解法を示す。
また、エラー訂正率を80%にする方法も示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:15:55 GMT)
"In my defense, only three hours on Instagram": Designing Toward Digital Self-Awareness and Wellbeing [11.2] WellScreenは軽量なプローブで、毎日の反射を足場にし、スマートフォンの使用を見積り、報告する。
推定値と実際の使用率の相違がデジタル認識と幸福を形作るかを検討した。
本研究は、自己認識と意図的なデジタルエンゲージメントを支援するための軽量な反射的介入の可能性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:35:50 GMT)
CoBel-World: Harnessing LLM Reasoning to Build a Collaborative Belief World for Optimizing Embodied Multi-Agent Collaboration [11.1] 大規模言語モデル(LLM)は、協調的なタスク解決のための有望な自律エージェントとして登場した。
我々は,LLMエージェントを協調的信念の世界に適合させる新しいフレームワークであるCoBel-Worldを提案する。
その結果,CoBel-Worldは通信コストを22~60%削減し,最強のベースラインに比べてタスク完了効率を4~28%向上した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:03:52 GMT)
Secure and Efficient Access Control for Computer-Use Agents via Context Space [11.1] CSAgentは、コンピュータ利用エージェントのためのシステムレベルの静的ポリシーベースのアクセス制御フレームワークである。
我々はCSAgentの実装と評価を行い、99.36%以上の攻撃に対して防御に成功し、パフォーマンスオーバーヘッドは6.83%に過ぎなかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:19:27 GMT)
Joint graph entropy knowledge distillation for point cloud classification and robustness against corruptions [10.5] 本研究は,textbfJoint textbfGraph textbfEntropy textbfKnowledge textbfDistillation (JGEKD)の分類戦略を提案する。
非独立かつ同一に分散された3Dポイントクラウドデータに適している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:09:58 GMT)
From Authors to Reviewers: Leveraging Rankings to Improve Peer Review [10.5] 近年,機械学習(ML)カンファレンスのレビュー品質が懸念されている。
本稿では,著者ではなくレビュアーからのランキング情報を活用するアプローチを提案する。
その結果, (i)レビュアーからの情報を取り入れたランキングは, 各論文の品質評価を著しく向上させることができ, 著者のみによるランキング情報の利用よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:16:09 GMT)
Do Data Valuations Make Good Data Prices? [10.5] データバリュエーションを、$textitmarket-designの視点で見直す。
低い支払いのために、Leave-One-OutやData Shapley-makeなどの一般的な評価方法が示されています。
我々は、メカニズム設計、すなわちMyersonとVickrey-Clarke-Grovesから確立された支払いルールを適用する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:21:43 GMT)
Not only a helper, but also a teacher: Interactive LLM Cascade [10.5] 大きな言語モデル(LLM)はその能力で大きく異なり、より大きなモデルは性能が良く、コストも高い。
LLMs Cascadeは弱い/チープから強い/拡張的なモデルへの難しいクエリをデファクトする。
Inter-Cascadeは、バックアップヘルパーから長期の教師まで、強力なモデルの役割を拡大します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:35:00 GMT)
On the Status of Foundation Models for SAR Imagery [10.5] 本稿では,SAR(Synthetic Aperture Radar)オブジェクト認識タスクにおける基礎的AI/MLモデルの実現可能性について検討する。
我々は、SARデータを用いた公開SSLモデルのセルフスーパービジョン微調整が実現可能であることを示す。
実験では、下流のタスク適応レシピで異なるバックボーンを使用することによるパフォーマンスのトレードオフをさらに分析した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:46:17 GMT)
Concept-SAE: Active Causal Probing of Visual Model Behavior [10.3] Concept-SAEは、概念トークンを意味的に基礎づけるフレームワークである。
まず、我々の二重スーパービジョンアプローチが、著しく忠実で空間的に局在したトークンを生み出すことを定量的に示す。
この検証された忠実さは,(1)内部概念と直接介入による予測の因果関係を探索し,(2)特定の層に敵対的脆弱性を体系的に局在させることにより,モデルの障害モードを探索する,という2つの重要な応用を可能にする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:51:03 GMT)
Online-Optimized RAG for Tool Use and Function Calling [10.3] 検索拡張生成(RAG)は、事前に指定されたツール/機能記述にユーザクエリを埋め込むことで、ツールの使用と関数呼び出しを駆動する。
Online-d RAGは、最小限のフィードバックを使用して、ライブインタラクションからの検索埋め込みに適応する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:20:04 GMT)
FreqDebias: Towards Generalizable Deepfake Detection via Consistency-Driven Frequency Debiasing [10.3] ディープフェイク検出器は、限られたトレーニングデータから得られたバイアスにより、しばしば新しい偽造タイプに一般化するのに苦労する。
本稿では,周波数領域における新しいタイプのモデルバイアスを同定する。
本稿では2つの相補的戦略を通じてスペクトルバイアスを緩和する周波数脱バイアスフレームワークであるFreqDebiasを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:37:29 GMT)
Spectral-inspired Operator Learning with Limited Data and Unknown Physics [10.1] スペクトルインスパイアされたニューラルオペレータ(SINO)は、明示的なPDE項を必要とせずに、わずか2-5軌道から複雑なシステムをモデル化することができる。
非線形効果をモデル化するために、SINOはスペクトル特性の乗法演算を行うPiブロックを用いており、エイリアスを抑制するためにローパスフィルタで補完される。
2次元PDEと3次元PDEのベンチマーク実験により、SINOは1-2桁の精度で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:09:49 GMT)
Fundamental Scaling Laws of Covert Communication in the Presence of Block Fading [10.1] 無線通信システムにおいて,信号フェードのようなチャネル障害は,隠蔽通信システムの効果的な実装と解析において課題となる。
本稿では,ブロックフェーディングチャネルで使用した$n$チャネルで隠蔽送信可能なビット数について,その計算結果を考慮し,カバート通信分野における初期処理を一般化する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:30:20 GMT)
MIRG-RL: Multi-Image Reasoning and Grounding with Reinforcement Learning [10.0] 現在、LVLM(Large Visual Language Models)は2つの重要な課題に直面している。
強化学習によるマルチイメージ推論とグラウンド化(MIRG-RL)の統一フレームワークを提案する。
具体的には、教師付き微調整と注釈付き軌跡と画像認識強化学習最適化を組み合わせた2段階の訓練パラダイムを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:43:22 GMT)
Beyond Johnson-Lindenstrauss: Uniform Bounds for Sketched Bilinear Forms [10.0] 我々は、スケッチされた双線型形式を解析し、関連する集合の幾何学的複雑さの観点から一様境界を導出する枠組みを開発する。
この統一解析は、J-L補題のような既知の結果を特別なケースとして回収し、RIP型保証を延長する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:15:29 GMT)
Kernel Regression of Multi-Way Data via Tensor Trains with Hadamard Overparametrization: The Dynamic Graph Flow Case [9.9] Kernel Regression via Trains with Hadamard overparametrization (KReTTaH)は、マルチウェイデータ計算を解釈可能な回帰ベースのフレームワークである。
KReTTaHは、最先端の代替品を一貫して上回っている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:00:05 GMT)
Generalized Tangent Kernel: A Unified Geometric Foundation for Natural Gradient and Standard Gradient [9.9] 自然勾配と標準勾配の両方を研究するための幾何学的視点と数学的枠組みを提供する。
自然勾配と標準勾配を統一する鍵となる道具は、ニューラルタンジェントカーネル(NTK)の一般化形式である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:00:01 GMT)
Position: Simulating Society Requires Simulating Thought [9.9] 大規模言語モデル(LLM)で社会をシミュレートするには、構造化され、修正可能で、追跡可能な認知的根拠を持つ推論が必要である。
本稿では,ジェネレーティブ・マインド(GenMinds,ジェネレーティブ・マインド)の概念的モデリングパラダイムを提案する。
これらの貢献は、社会シミュレーションのための思考(言語だけでなく)をシミュレートする表面レベルの模倣から生成エージェントへの、より広範なシフトを推進している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:20:04 GMT)
Generative Modeling and Decision Fusion for Unknown Event Detection and Classification Using Synchrophasor Data [9.9] 本稿では, 生成モデル, スライドウインドウ時間処理, 決定融合を統合し, 堅牢なイベント検出と分類を実現する新しいフレームワークを提案する。
実験結果は、最先端の精度、機械学習、ディープラーニング、エンベロープベースのベースラインを上回ることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:04:03 GMT)
LocationReasoner: Evaluating LLMs on Real-World Site Selection Reasoning [9.7] 実世界のサイト選択の文脈において,大規模言語モデルの推論能力を評価するために設計されたベンチマークであるLocationReasonerを紹介する。
このベンチマークは、様々な難易度を持つクエリを慎重に作成し、制約ベースの位置情報検索のための社内ツールを備えたサンドボックス環境によってサポートされている。
ボストン、ニューヨーク、タンパの現実世界のサイト選択データに対する大規模な評価は、最先端の推論モデルが、非合理的な先駆者に対して限定的な改善をもたらすことを明らかにしている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:39:37 GMT)
NeLLCom-Lex: A Neural-agent Framework to Study the Interplay between Lexical Systems and Language Use [9.7] NeLLCom-Lexは意味の変化をシミュレートするために設計されたニューラルネットワークフレームワークである。
i)人間のような命名行動や語彙を発達させ,(ii)コミュニケーションニーズに応じてその行動や語彙を変化させる要因について検討する。
教師付きおよび強化学習パイプラインを用いた実験では、既存の言語を「話す」ように訓練されたニューラルエージェントが、色命名における人間に似たパターンを著しく再現できることが示されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:25:59 GMT)
Resisting Contextual Interference in RAG via Parametric-Knowledge Reinforcement [9.7] Retrieval-augmented Generation (RAG)は、知識集約的なタスクのパフォーマンスを向上させるが、間違った、無関係、あるいは、検索されたテキストの矛盾によって脱線することができる。
本稿では,大規模言語モデルにパラメトリック知識を用いた強化学習フレームワークであるKnowledgeable-R1を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:11:36 GMT)
From Superficial Outputs to Superficial Learning: Risks of Large Language Models in Education [9.6] 大規模言語モデル(LLM)は、パーソナライズ、フィードバック、知識アクセスを可能にすることで教育を変革している。
しかし、これらのリスクに関する実証的な証拠は依然として断片化されている。
本稿では,コンピュータ科学,教育,心理学にまたがる70の実証的研究を体系的にレビューする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:59:36 GMT)
Optimizing Long-Form Clinical Text Generation with Claim-Based Rewards [9.5] 長期臨床テキスト生成のための評価統合強化学習フレームワークを提案する。
提案手法は,個別の報酬モデルを訓練したり,人手による参照に頼ることなく,現実的な接地と完全性を直接的に最適化する。
このフレームワークは現実世界の設定にスケーラブルで、ガイドラインの遵守や請求の好みといったカスタムの目的を組み込むことができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:53:08 GMT)
Hybrid Deep Learning for Hyperspectral Single Image Super-Resolution [9.5] 本稿では,標準的な2次元畳み込みアーキテクチャにシームレスに統合可能な新しいモジュールであるSpectral-Spatial Unmixing Fusion (SSUF)を紹介する。
SSUFはスペクトルアンミックスとスペクトル空間特徴抽出を組み合わせ、ResNetベースの畳み込みニューラルネットワークを誘導して再構成を改善する。
3つのパブリックリモートセンシングハイパースペクトルデータセットの実験は、提案したハイブリッドディープラーニングモデルが競合性能を達成することを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:28:07 GMT)
The Flood Complex: Large-Scale Persistent Homology on Millions of Points [9.4] 我々は、Alpha と Witness の複素構造の利点に触発されたFlood 複素体を紹介する。
我々の構成では、効率的なPH計算が可能であり、いくつかの望ましい理論的特性を持ち、GPU並列化に対応できる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:50:31 GMT)
UniMapGen: A Generative Framework for Large-Scale Map Construction from Multi-modal Data [9.4] 本稿では,大規模な地図構築のための新しい生成フレームワークUniMapGenを提案する。
UniMapGenは、車線を textbfdiscrete シーケンスとして表現し、より完全で滑らかなマップベクトルを生成する反復戦略を確立する。
UniMapGenはOpenSatMapデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:26:33 GMT)
ASSESS: A Semantic and Structural Evaluation Framework for Statement Similarity [9.3] ASSESS (Semantic and Structure Evaluation Framework for Statement similarity) を導入し、セマンティックおよび構造情報を総合的に統合し、連続的な類似度スコアを提供する。
厳密な検証のために,ミニF2F と ProofNet から派生した 524 のエキスパート注釈付き形式文ペアの新しいベンチマーク EPLA を提案する。
EPLAの実験では、TransTEDの類似性は既存の手法よりも優れており、最先端の精度と最高カッパ係数が達成されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:02:58 GMT)
RISK: A Framework for GUI Agents in E-commerce Risk Management [9.3] 電子商取引のリスク管理には、多段階のステートフルなインタラクションを通じて、多様な、深く埋め込まれたWebデータを集約する必要がある。
RISK(リンク)は、このドメインのためにGUIエージェントを構築し、デプロイするように設計された新しいフレームワークである。
RISK-Dataは8,492段のシングルステップと2,386段のマルチステップインタラクショントラジェクトリのデータセット、RISK-Benchは802段のシングルステップと320段のマルチステップトラジェクトリのベンチマークで、標準化された評価のために3つの困難レベルにまたがるベンチマーク、RISK-R1はR1スタイルの強化微調整フレームワークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:05:01 GMT)
BOW: Reinforcement Learning for Bottlenecked Next Word Prediction [9.2] 次単語予測(NWP)のRL式であるbottle next-Word Prediction(BOW)を提案する。
BOWはバニラNWPの代替であり、明示的な次の単語推論を誘発し、一般的な推論能力を強化する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:37:55 GMT)
CSF: Fixed-outline Floorplanning Based on the Conjugate Subgradient Algorithm Assisted by Q-Learning [9.2] 共役劣等化アルゴリズム(CSA)による非滑らかな解析フロアプランニングモデルを提案する。
MCNCおよびGSRCベンチマークの実験結果から、CSAQ(CSF)に基づく固定アウトラインフロアプランニングアルゴリズムが提案されていることが示されている。
また、CSFはハードモジュールのみを含むフロアプランニングシナリオにおける最先端のアルゴリズムと競合することを示した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:08:45 GMT)
Graph of Agents: Principled Long Context Modeling by Emergent Multi-Agent Collaboration [9.2] 本稿では,モデルに依存しない長期コンテキストモデリング問題を圧縮問題として定式化するフレームワークを提案する。
この目的を最大化する入力依存の協調構造を動的に構築するグラフ・オブ・エージェント(GoA)を提案する。
GoAはLongBenchの128KコンテキストウィンドウであるLlama 3.1 8Bを超え、有効コンテキスト長が劇的に増加した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:15:40 GMT)
SubZeroCore: A Submodular Approach with Zero Training for Coreset Selection [9.1] SubZeroCoreは、サブモジュールのカバレッジと密度を単一の統一された目的に統合する、トレーニング不要なコアセット選択方法である。
SubZeroCoreはトレーニングベースのベースラインと一致し、高いプルーニングレートで大幅に性能を向上し、計算オーバーヘッドを劇的に削減することを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:26:45 GMT)
HyperCore: Coreset Selection under Noise via Hypersphere Models [9.1] HyperCoreは、ノイズの多い環境のための堅牢で適応的なコアセット選択フレームワークである。
我々はHyperCoreが最先端のコアセット選択手法を一貫して超越していることを示します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:24:16 GMT)
MultiMat: Multimodal Program Synthesis for Procedural Materials using Large Multimodal Models [9.0] ビジュアルグラフ表現とテキストグラフ表現の両方を処理するプログラム合成フレームワークであるMultiMatを提案する。
我々は、生産品質の高い手続き資料の新しいデータセットに基づいてモデルをトレーニングし、制約付き木探索推論アルゴリズムと組み合わせる。
実験結果から, このマルチモーダルプログラム合成法は, 非条件および条件付きグラフ合成において, より効率的であることが示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:10:25 GMT)
Context-Specific Instruction: A Longitudinal Study on Debugging Skill Acquisition and Retention for Novice Programmers [9.0] バグローカライゼーションは重要なスキルであるが、初心者はしばしば体系的なアプローチを欠いている。
本研究は8週間の縦断的研究を行い,4つの条件(命令なし,抽象的ガイドラインなし,具体的ステップなし,文脈特有な指示なし)について検討した。
文脈固有の指導は、抽象的なガイドラインや文脈に依存しないステップよりも、スキルの獲得と保持が早くなると結論付けている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:42:10 GMT)
Two failure modes of deep transformers and how to avoid them: a unified theory of signal propagation at initialisation [9.0] ニューラルネットワークの適切な初期化を見つけることは、スムーズなトレーニングと優れたパフォーマンスを保証するために不可欠である。
トランスフォーマーでは、間違った初期化は、ランク崩壊、すべてのトークンが同様の表現に崩壊するランク崩壊、エントロピー崩壊、高度に集中した注意スコアが不安定になる2つの失敗モードの1つにつながる可能性がある。
ここでは、自己アテンション、層正規化、スキップ接続、勾配を有する深層変圧器による信号伝搬の解析理論を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:22:08 GMT)
SNR and Resource Adaptive Deep JSCC for Distributed IoT Image Classification [9.0] 我々は,IoTデバイスとエッジサーバ間での無線画像分類のための,新しいSNRおよび計算適応型分散CNNフレームワークを提案する。
既存の J SCC ベースの SNR 適応型多層化フレームワークと比較して,SNR が 10dB 以下である場合と比較して,分類精度が10% 向上する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:59:39 GMT)
Lifelong Learning with Behavior Consolidation for Vehicle Routing [8.9] 本稿では,ニューラルVRPソルバのための新しい生涯学習パラダイムについて検討する。
LLR-BCは、新しいタスクで訓練された問題解決者の行動とバッファリングされた課題とを整合させることにより、事前知識を効果的に統合する。
静電容量化車両経路問題と走行セールスマン問題の実験は、高性能ニューラルネットワークの訓練におけるLLR-BCの有効性を実証している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:03:48 GMT)
The Thinking Spectrum: An Emperical Study of Tunable Reasoning in LLMs through Model Merging [8.9] 本稿では,複数の推論ベンチマークにまたがるモデルマージ手法について,大規模な実験的検討を行った。
その結果, モデルマージは, 推論精度とトークン効率のトレードオフを校正するための, 効果的かつ制御可能な手法であることがわかった。
本研究は、この調整可能な空間を包括的に解析し、特定の推論プロファイルを持つLCMを作成するための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:12:13 GMT)
Ontological foundations for contrastive explanatory narration of robot plans [8.9] 本稿では、2つの競合する計画の比較について、モデリングと推論のアプローチに焦点を当てる。
競合する計画の違いを形式化し、推論するために、新しい存在論的モデルが提案されている。
計画間の異なる知識を活用し、対照的な物語の構築を容易にする新しいアルゴリズムが提示される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:37:47 GMT)
Influence-driven Curriculum Learning for Pre-training on Limited Data [8.9] 本研究では,従来の人中心難易度尺度を,モデルトレーニング中に観察されたような難易度に対応する指標に置き換えた上で,カリキュラム学習が競争力を持つかどうかを検討する。
私たちのカリキュラムでトレーニングされたモデルは、ランダムにトレーニングされたモデルをベンチマークで10ポイント以上向上させることができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:45:06 GMT)
EigenTrack: Spectral Activation Feature Tracking for Hallucination and Out-of-Distribution Detection in LLMs and VLMs [8.6] EigenTrackは大規模言語モデル(LLM)のための解釈可能なリアルタイム検出器である
表面誤差が現れる前に幻覚とOODドリフトを信号する表現構造における時間的シフトを追跡する。
既存のホワイトボックス検出器とは異なり、時間的コンテキストを保存し、グローバルシグナルを集約し、解釈可能な精度-遅延トレードオフを提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:38:41 GMT)
NanoTag: Systems Support for Efficient Byte-Granular Overflow Detection on ARM MTE [8.5] バッファオーバーフローやUse-after-freeといったメモリ安全性のバグは、本番環境でのソフトウェア安全性の問題の主要な原因である。
ArmのMemory Tagging Extension (MTE)は、ハードウェアのこれらのバグをはるかに少ないオーバーヘッドで検出する、有望な代替手段を提供する。
ARM MTEを用いて,修正されていないバイナリのメモリ安全性のバグをバイト単位で検出するシステムであるNanoTagを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:03:22 GMT)
Learning Admissible Heuristics for A*: Theory and Practice [8.4] ディープラーニングアプローチは、しばしば許容性を無視し、トレーニングデータ以外の一般化に関して制限された保証を提供する。
本稿では,これら2つの制約に対処する。まず,制約付き最適化問題として学習を行い,学習中に許容度を強制する損失関数であるクロスエントロピー適応性(CEA)を導入する。
ルービックキューブ領域では、圧縮されたパターンデータベース(PDB)のガイダンスよりもはるかに強いほぼ許容値が得られる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:51:26 GMT)
EgoVIS@CVPR: PAIR-Net: Enhancing Egocentric Speaker Detection via Pretrained Audio-Visual Fusion and Alignment Loss [8.3] エゴセントリックビデオにおけるアクティブな話者検出(ASD)は、不安定な視点、動きのぼやけ、オフスクリーン音声源などによる固有の課題を提示する。
本稿では,部分的に凍結したWhisperオーディオエンコーダと,微調整されたAV-HuBERTビジュアルバックボーンを統合する効果的なモデルであるPAIR-Netを紹介する。
実世界の自我中心の条件下では,事前学習音声の付加価値とアライメントに基づくアライメント・ベース・フュージョンが重要である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:22:00 GMT)
Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy [8.0] 我々は高解像度センサのクラウドとクラウドのシャドウ検出問題に機械学習を用いて対処する。
先進的なディープラーニングアーキテクチャ,すなわちUNet と Spectral Channel Attention Network (SCAN) の手法を用いて,従来の手法をデプロイし,評価する。
その結果,従来の手法は空間的・境界的定義に苦慮し,雲や雲の影の検出に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:44:55 GMT)
Physics-informed GNN for medium-high voltage AC power flow with edge-aware attention and line search correction operator [7.9] 物理インフォームドグラフニューラルネットワーク(PIGNN)は高速な交流電力フロー解法として登場した。
PIGNN-Attn-LSは電圧0.00033 p.uのRMSE、角度0.08$circ$のRMSEを達成し、それぞれPIGNN-MLPベースラインの99.5%と87.1%を上回っている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:09:26 GMT)
What Factors Affect LLMs and RLLMs in Financial Question Answering? [7.9] 本研究では,様々な手法が大規模言語モデル(LLM)に与える影響と,大規模言語モデル(RLLM)が財務的質問応答タスクに与える影響について検討する。
本研究は,金融質問応答におけるLCMの促進手法とエージェント・フレームワークにより,LCMの性能が向上することが示唆された。
RLLMはLong CoT機能を備えており、従来の手法の有効性を制限し、性能をさらに向上させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:02:45 GMT)
MMPB: It's Time for Multi-Modal Personalization [7.9] パーソナライズにおける視覚言語モデル(VLM)を評価するための,最初の広範囲なベンチマークであるMMPBを紹介する。
MMPBは10kイメージクエリペアで構成されており、人間、動物、物体、キャラクターの4つのカテゴリにまたがる111のパーソナライズ可能な概念を含んでいる。
我々は,概念注入,マルチターン対話,パーソナライズクエリといった3段階のプロトコルを用いてパーソナライズ性能を評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:24:48 GMT)
Do LLM Agents Know How to Ground, Recover, and Assess? A Benchmark for Epistemic Competence in Information-Seeking Agents [7.9] 本稿では,Large Language Model (LLM) 検索エージェントの能力を評価する最初のベンチマークであるSeekBenchを紹介する。
SeekBenchは、190のエキスパートアノテーション付きトレースで構成され、1,800以上のレスポンスステップがLLM検索エージェントによって生成される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:18:50 GMT)
Learning Equivariant Functions via Quadratic Forms [7.8] データから群に対応する二次形式 $xT A x$ を学習することにより、群(未知あるいは未知の)同変関数を学習する手法を提案する。
我々は、対応する一意対称行列とその固有の対角形を利用し、単純化され、効率的であるモデルを生み出す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:44:26 GMT)
Automatic Discovery of One Parameter Subgroups of $SO(n)$ [7.8] 我々は、$SO(3)$とより一般的には$SO(n)$の1-パラメータ部分群の自動発見のための新しいフレームワークを導入する。
この方法は、標準ジョルダン形式のスキュー対称行列を使い、$SO(n)$のリー代数を定義する。
提案手法の有効性は,振り子モデリング,慣性モーメント・オブ・慣性予測,トップクォークタグ付け,不変回帰といったタスクによって実証される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:31:38 GMT)
A Random Matrix Perspective of Echo State Networks: From Precise Bias--Variance Characterization to Optimal Regularization [7.7] 本研究では,重み付き線形教師託宣で設定した教師生徒を対象に,Echo State Networks (ESNs) の厳密な分析を行った。
入力統計値、オラクルベクトル、リッジ正規化パラメータの関数として、バイアス、分散、平均二乗誤差(MSE)の閉形式式を導出する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:47:39 GMT)
Sparse but Wrong: Incorrect L0 Leads to Incorrect Features in Sparse Autoencoders [7.4] 本研究では, L0 が SAE に与える影響について検討し, L0 が正しく設定されていない場合, SAE は LLM の基本的な特徴を乱すことができないことを示す。
本稿では,SAE に対する適切な L0 探索を,与えられたトレーニング分布上で導くためのプロキシ指標を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:13:02 GMT)
Neighborhood Sampling Does Not Learn the Same Graph Neural Network [7.3] 大規模グラフニューラルネットワークのトレーニングにおいて,近傍サンプリングは重要な要素である。
提案手法は,複数の近傍サンプリング手法と,それに対応する後方GPについて検討する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:28:13 GMT)
Enhancing Credit Risk Prediction: A Meta-Learning Framework Integrating Baseline Models, LASSO, and ECOC for Superior Accuracy [7.3] 本研究では,複数の相補的モデルを合成する包括的メタラーニングフレームワークを提案する。
我々は,全ての構成モデルにまたがる予測クラスに対して,置換特徴重要度分析を実装した。
その結果,我々の枠組みは,財務組織分類の精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:09:04 GMT)
A benchmark for vericoding: formally verified program synthesis [7.2] 私たちのベンチマークには12,504の正式な仕様が含まれており、Dafnyでは3,029、Verus/Rustでは2,334、Leanでは7,141です。
私たちは、リーンで27%、Verus/Rustで44%、Dafnyで82%のベリコード成功率を、既製のLLMを使っています。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:36:20 GMT)
Surgical Vision World Model [7.2] 動作制御可能な手術データを生成する最初の手術視覚世界モデルを提案する。
提案モデルでは, 動作制御可能な手術データを生成し, アーキテクチャ設計の検証を行う。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:33:43 GMT)
Personalized LLM Decoding via Contrasting Personal Preference [7.2] 本研究では,パラメータ効率のよい微細チューニング(PEFT)をユーザ固有のデータに適用した新しいデコード時間手法CoPeを提案する。
私たちの中核となる考え方は、各ユーザの暗黙の報酬信号の最大化によって、特にパーソナライズのために報酬誘導復号を利用することです。
実験の結果,CoPeは高い性能を示し,ROUGE-Lでは平均10.57%のパーソナライゼーションが向上した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:35:55 GMT)
The Emergence of Altruism in Large-Language-Model Agents Society [7.1] 社会シミュレーションのための大規模言語モデルを活用することは、計算社会科学のフロンティアである。
適応的エゴイスト(Adaptive Egoists)は自己利益を優先するが、社会的規範的メッセージボードの影響下で利他的行動が増加する。
社会シミュレーションにおいては,モデル選択は推論能力を選択することだけでなく,本質的な社会的行動論理を選択することである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:17:29 GMT)
Training-Free Defense Against Adversarial Attacks in Deep Learning MRI Reconstruction [7.1] 本稿では,MRI再建モデルに対する逆行性攻撃を再訓練せずに軽減するための新しいアプローチを提案する。
循環測定整合性の概念に基づいて,攻撃入力の周囲の小さな球において最小化される新たな緩和目標を考案する。
その結果,本手法は,異なるデータセット間での対向摂動の影響を著しく低減することがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:56:39 GMT)
Large language models management of medications: three performance analyses [7.1] 大規模言語モデル(LLM)は、医学的状態の診断に有用であるが、適切な薬局においてそれらの整合性を評価する研究はほとんどない。
本評価の目的は,GPT-4oを3種類のベンチマーク試験で試験することであった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:51:48 GMT)
Comparing Uncertainty Measurement and Mitigation Methods for Large Language Models: A Systematic Review [6.9] 大規模言語モデル(LLM)は多くの領域にまたがって変換されている。
不確実性定量化(英: Uncertainty Quantification, UQ)とは、不確実性の測定と、不確実性と正確性の間の不一致に対処するための校正技術である。
この調査は、LCMの校正方法と関連するメトリクスをレビューする最初の専用研究である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:08:32 GMT)
What Matters More For In-Context Learning under Matched Compute Budgets: Pretraining on Natural Text or Incorporating Targeted Synthetic Examples? [6.9] 本稿では、前向きコピー(インダクション)、後向きコピー(アンティ)、あるいはバランスの取れたミックスを事前学習ストリームに注入する軽量カリキュラムBi-Inductを紹介する。
我々は、0.13Bから1BのパラメータをイソFLOPでトレーニングし、 (i) 少数ショットICLベンチマーク、 (ii) ヘッドレベルテレメトリ、 (iii) 言語モデリングの難易度を評価した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:27:55 GMT)
Scaling Accessibility Education: Reflections from a Workshop Targeting CS Educators and Software Professionals [6.9] インドにおけるコンピュータサイエンス学部と産業界実践者の間で,アクセシビリティ実践の基礎的能力構築を目的とした1日間のワークショップを開催した。
参加者の大多数はワークショップを肯定的に評価し、多くの報告では信頼が高まり、アクセシビリティに対する認識が共有責任として変化した。
私たちは、インドのコンピューティング教育と専門分野におけるアクセシビリティの能力強化を目的とした将来のイニシアチブのガイドとして、実用的な洞察を提供しています。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:03:57 GMT)
AI Ethics Education in India: A Syllabus-Level Review of Computing Courses [6.9] 医療、ガバナンス、金融、教育といった分野にまたがる人工知能(AI)の広範な統合は、その倫理的意味についての精査を強めている。
倫理はコンピュータ科学(CS)教育においてより広く注目されているが、AI倫理の特定の教育的扱いはいまだに過小評価されていない。
本研究は,インドの主要機関におけるCSおよび同盟地域からの3,395件の公開アクセスシラビの大規模分析を通してのギャップを解消するものである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:24:01 GMT)
A critical review of methods and challenges in large language models [6.9] 大規模言語モデル(LLM)の詳細な分析について
リカレントニューラルネットワーク(RNN)からトランスフォーマーモデルへの進化を検査する。
コンテキスト内学習や様々な微調整アプローチといった最先端のテクニックを記述します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:07:34 GMT)
AI Noether -- Bridging the Gap Between Scientific Laws Derived by AI Systems and Canonical Knowledge via Abductive Inference [6.8] 現代科学の中核的な目標は、AIとコンピュータ処理の最近の進歩を活用して、科学的手法を自動化し、加速することである。
シンボリック回帰は解釈可能なモデルとデータに適合するが、これらのモデルは確立された理論の外に位置することが多い。
解: 公理と仮説が方程式として表現できる限り、公理を導出するのに十分である最小の公理の集合を生成するシステムを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:50:25 GMT)
Incorporating priors in learning: a random matrix study under a teacher-student framework [6.7] 正規化線形回帰は機械学習の中心であるが、その情報的先行を伴う高次元挙動はいまだに理解されていない。
本研究は,MAP回帰を最大化するためのトレーニングとテストのリスクを,初めて正確に評価するものである。
我々のフレームワークは、リッジ回帰、最小二乗、および事前インフォームド推定器を統一し、ランダム行列理論を用いて、閉形式リスク公式を生成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:47:15 GMT)
LiteGS: A High-performance Framework to Train 3DGS in Subminutes via System and Algorithm Codesign [6.7] 3D Gaussian Splatting (3DGS)は、3D表現において有望な代替手段として登場したが、それでも高いトレーニングコストに悩まされている。
本稿では、3DGSトレーニングパイプラインを体系的に最適化する高性能計算フレームワークであるLiteGSを紹介する。
実験の結果、LiteGSはオリジナルの3DGSトレーニングを最大13.4倍、同等または優れた品質で加速した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:24:20 GMT)
Latent Diffusion : Multi-Dimension Stable Diffusion Latent Space Explorer [6.7] 本稿では、カスタマイズ可能な潜在空間演算を拡散プロセスに統合するフレームワークであるWorknameを紹介する。
概念的および空間的表現の直接操作を可能にすることにより、この手法は生成芸術における創造可能性を広げる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:15:58 GMT)
Noise-to-Notes: Diffusion-based Generation and Refinement for Automatic Drum Transcription [6.5] オートマチック・ドラム・リテラル(ADT)は、伝統的に、オーディオ・スペクトログラムからドラムイベントを予測する識別タスクとして定式化されている。
ノイズ・トゥ・ノート(N2N)は、拡散モデルを利用して、音響条件付きガウス雑音を関連する速度でドラムイベントに変換するフレームワークである。
N2Nは、複数のADTベンチマークにまたがって、最先端のパフォーマンスを新たに確立する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:12:43 GMT)
Direct Bias-Correction Term Estimation for Propensity Scores and Average Treatment Effect Estimation [6.4] 本研究は平均治療効果(ATE)の推定について考察する。
我々は、直接バイアス補正項推定により、確率スコアを推定する。
本稿では,この直接バイアス補正項推定手法の一般的な枠組みを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:45:12 GMT)
PRIME: Large Language Model Personalization with Cognitive Dual-Memory and Personalized Thought Process [6.3] 大規模言語モデル(LLM)のパーソナライゼーションは、モデルのアウトプットを個人の独特な好みや意見と整合させることを目的としている。
本稿では,エピソードおよびセマンティックメモリ機構を用いた統一フレームワークPRIMEを提案する。
実験はPRIMEの有効性を長文と短文の両方のシナリオで検証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:13:38 GMT)
Transformers Can Learn Connectivity in Some Graphs but Not Others [6.2] 変換器は、各ノードを低次元のサブ空間に埋め込むことができる「グリッドのような」有向グラフ上で接続性を学ぶことができる。
基礎となるグリッドグラフの次元性は、接続タスクを学習するトランスフォーマーの能力の強い予測子であることがわかった。
モデルスケールの増大により、グリッドグラフ上の接続性を推測する一般化がますます向上する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:39:09 GMT)
AI for Scientific Discovery is a Social Problem [6.2] 主な障壁は社会と制度にあると我々は主張する。
コミュニティの障害,上流ニーズの一致しない研究優先,データの断片化,インフラストラクチャの不平等という,4つの相互接続的な課題を強調します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:57:09 GMT)
Learning Temporal Saliency for Time Series Forecasting with Cross-Scale Attention [6.0] パッチベースのクロスアテンション機構とマルチスケール処理を組み合わせた,革新的なアーキテクチャであるCrossScaleNetを提案する。
本評価は,時間的塩分濃度検出と予測精度の両方において優れた性能を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:43:51 GMT)
Evaluating the Limits of Large Language Models in Multilingual Legal Reasoning [5.9] この研究は、LLaMAとGeminiを多言語法的および非法的ベンチマークで評価する。
マルチリンガル・タスク多様性ベンチマークをサポートするために設計された,オープンソースのモジュール型評価パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:19:12 GMT)
Neo-Grounded Theory: A Methodological Innovation Integrating High-Dimensional Vector Clustering and Multi-Agent Collaboration for Qualitative Research [5.8] Neo Grounded Theory (NGT)は、定性的研究のスケール深さパラドックスを解決するために、ベクトルクラスタリングとマルチエージェントシステムを統合する。
NGTは168倍の速度向上(3時間対3週間)、優れた品質(0.904対0.883)、96%のコスト削減を達成した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:26:33 GMT)
PAPER: Privacy-Preserving ResNet Models using Low-Degree Polynomial Approximations and Structural Optimizations on Leveled FHE [5.8] 最近の研究は、完全同型暗号化(FHE)を用いた深層畳み込みニューラルネットワーク(CNN)の実行により、非インタラクティブなプライバシ保護推論をより実用的なものにしている。
また、非線形アクティベーションの高次近似にも依存しており、これは平文のReLUモデルと比較して乗算深度を増大させ、精度を2-5%削減する。
本研究では、プライバシ保護推論において広く採用されているベンチマークアーキテクチャであるResNetsに注目し、FHE非インタラクティブモデルとそれに対応するモデルの精度ギャップを埋める。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:10:23 GMT)
Data-driven Piecewise Affine Decision Rules for Stochastic Programming with Covariate Information [5.8] 非部分的決定(PADR)に埋め込まれた経験的リスク(M)手法を提案する。
提案手法は理論的整合性を持つ広範で非クラスな非制約問題に適用可能であることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:39:17 GMT)
Triple-BERT: Do We Really Need MARL for Order Dispatch on Ride-Sharing Platforms? [5.7] Triple-BERTは、ライドシェアリングプラットフォーム上の大規模オーダー車両用に特別に設計された集中型シングルエージェント強化学習(MARL)手法である。
提案手法は,共同動作確率を個々の運転者行動確率に分解する動作分解戦略を通じて,広い行動空間に対処する。
Triple-BERTは、現在の最先端技術よりも約11.95%改善され、4.26%のサービス注文が増加し、22.25%のピックアップ時間が短縮された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:15:18 GMT)
GTPO and GRPO-S: Token and Sequence-Level Reward Shaping with Policy Entropy [5.7] 本稿では,2つの新しいアルゴリズムによる報酬の微粒化を促進するメカニズムである動的エントロピー重み付けを提案する。
報酬形成のための政策のエントロピーを再取得することで、我々は真にトークン単位の信用割り当てを達成できる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:04:07 GMT)
SoK: Potentials and Challenges of Large Language Models for Reverse Engineering [5.6] リバースエンジニアリング(RE)はソフトウェアセキュリティの中心であり、脆弱性発見やマルウェア分析などのタスクを可能にする。
ディープラーニングの初期の進歩は、特にマルウェア検出と脆弱性分類のために、REの一部を自動化するようになった。
最近では、急速に成長する研究機関が、同様の目的にLarge Language Models (LLMs)を適用している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:26:51 GMT)
Large Language Models as Nondeterministic Causal Models [5.1] Chatzi et al. と Ravfogel et al. による最近の研究は、確率的大言語モデルの反事実を生成する手法を初めて開発した。
既存の手法は LLM の曖昧な解釈に依存していると私は主張する。
非決定論的因果モデルとして表現することで、LLMの意図した解釈に基づく、より単純な偽物を生成する方法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:59:41 GMT)
Asymptotic equipartition property of subadditive multipartite entanglement measures on pure states [5.1] 弱条件を許容する部分加法的絡み合い対策として, AEP を定式化する。
これは双極子の場合の極限における絡み合いエントロピーの特異性によって動機付けられる。
得られた正規化エンタングルメント対策は,両部エンタングルメントエントロピーの凸結合に還元されることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:11:34 GMT)
How Accurate Are LLMs at Multi-Question Answering on Conversational Transcripts? [5.1] 大きな言語モデル(LLM)は、同じ会話コンテキストに基づいて複数の質問に答えることができる。
この課題に対して、広範な実験を行い、プロプライエタリモデルとパブリックモデルの両方をベンチマークします。
GPT-4oのような強力なプロプライエタリなLLMは、全体的な性能が最も優れているが、最大80億のパラメータを持つ微調整されたパブリックなLLMは、GPT-4oを精度良く超える可能性がある。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:58:01 GMT)
A High-Capacity and Secure Disambiguation Algorithm for Neural Linguistic Steganography [5.0] ニューラル言語ステガノグラフィーは、統計的検出不能を保ちながら、情報を自然のテキストに埋め込むことを目的としている。
最近のSyncPoolは、あいまいな候補のグループに対して粗い粒度の同期機構を用いることで、この曖昧さに対処している。
本稿では,SyncPoolの容量制限を克服し,保証可能なセキュリティ保証を維持したルックアヘッド同期法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:56:32 GMT)
Estimating the Empowerment of Language Model Agents [5.0] EELMAはマルチターンテキストインタラクションから効果的なエンパワーメントを近似するアルゴリズムである。
我々はEELMAを言語ゲームとスケールアップしたWebブラウザのシナリオの両方で検証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:46:14 GMT)
How LLMs Fail to Support Fact-Checking [4.9] LLM(Large Language Models)は、オンラインの誤報を増幅するが、誤報に対処することを約束する。
我々は、政治的誤報に対処する3つのLDM(ChatGPT、Gemini、Claude)の能力を実証的に研究する。
以上の結果から,モデルが実際のニュースソースで回答を得るのに苦労し,左利きの情報源を引用する傾向が示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:10:11 GMT)
Axiomatic Choice and the Decision-Evaluation Paradox [4.9] 倫理的制約などの決定に関する言明である公理を用いて意思決定をモデル化する枠組みを導入する。
我々は,その構造的特性に基づいて決定公理の分類を定義し,決定を行うための公理の使用と,決定を評価するための公理の使用との間に緊張関係を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:50:55 GMT)
Causes and Consequences of Representational Similarity in Machine Learning Models [4.9] この研究は、データセットの重複とタスクの重複という2つの要因が下流モデルの類似性にどのように影響するかを考察する。
タスクとデータセットの重複が表現の類似性を高め、それらを組み合わせることで最も強い効果が得られます。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:20:39 GMT)
Critique-Guided Distillation for Efficient and Robust Language Model Reasoning [4.8] 専門家によるデモンストレーションで監督された微調整は、しばしば模倣問題に悩まされる。
教師が生成した説明的批判と洗練された反応でSFTを増強する多段階学習フレームワークであるCrytique-Guided Distillation (CGD)を提案する。
分析の結果,CGDは改良の不確実性を一貫して低減し,批判と反応の整合性を向上し,試料効率を向上することがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:35:43 GMT)
Can Code Language Models Learn Clarification-Seeking Behaviors? [4.8] ClarifyCoderは,合成データ生成と命令調整を行うフレームワークである。
ClarifyCoderは,あいまいなタスクに対して,コミュニケーション率63%,質問率52%を達成した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:13:28 GMT)
FoodSEM: Large Language Model Specialized in Food Named-Entity Linking [4.8] FoodSEMは、NEL(Non-entity Linking)と食品関連のオープンソース言語モデルのための、最先端の微調整された大型モデルである。
FoodSEMは、関連するモデルやシステムと比較して、最先端のパフォーマンスのモデルを実現している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:47:35 GMT)
DyRo-MCTS: A Robust Monte Carlo Tree Search Approach to Dynamic Job Shop Scheduling [4.7] 最先端の手法では、機械学習を使用してスケジューリングポリシーをオフラインで学習し、動的イベントに対する迅速な応答を可能にする。
新しい仕事の到着の予測不可能さは、不完全な問題情報に基づく決定が障害に弱いため、オンライン計画が複雑になる。
動作推定をMCTSに統合した動的ロバスト頑健性MCTS(DyRo-MCTS)手法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:35:51 GMT)
Preventing Model Collapse Under Overparametrization: Optimal Mixing Ratios for Interpolation Learning and Ridge Regression [4.7] モデル崩壊は、生成モデルが自身の合成出力を繰り返し訓練した後で劣化するときに起こる。
この反復スキームの下で最小$$$-normとリッジ回帰の正確な誤差式を導出する。
本分析により, 長期予測誤差を最小化する混合重量の興味深い特性が明らかとなった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:34:48 GMT)
Unveiling Many Faces of Surrogate Models for Configuration Tuning: A Fitness Landscape Analysis Perspective [4.7] チューニングにおけるモデルの有用性を評価するための精度の代替として,理論を提案する。
我々は,どのモデル-チューニングペアが最適かを推定する自動予測ツールであるModel4Tuneを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:25:19 GMT)
Learnable Conformal Prediction with Context-Aware Nonconformity Functions for Robotic Planning and Perception [4.7] Learnable Conformal Predictionは、固定スコアを軽量なニューラル関数に置き換えて、コンテキスト認識の不確実性セットを生成する。
CPの理論的保証を維持しつつ、予測セットのサイズを18%減らし、検出間隔を52%減らし、経路計画の安全性を72%から91%に改善し、オーバーヘッドを最小限に抑えている。
ハードウェア評価では、LCPは1%未満のメモリと15.9%の推論オーバーヘッドを追加したが、検出タスクでは39 FPSを維持し、アンサンブルの7.4倍のエネルギー効率を保っている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:44:58 GMT)
Not My Agent, Not My Boundary? Elicitation of Personal Privacy Boundaries in AI-Delegated Information Sharing [4.7] 差別的タスクを通じて個人のプライバシー境界を調査する,AIによるエレケーションアプローチを提案する。
本研究は,実世界のデータフローにおいて,プライバシ・プライバシ・プライバシ・プライオリティ・エコリケーション(プライバシ・プライバシ・プライバシ・プライバシ・プライバシ・プライバシ・エカシエーション)を満足させることの重要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:20:30 GMT)
JE-IRT: A Geometric Lens on LLM Abilities through Joint Embedding Item Response Theory [4.7] 本稿では,LLMと問合せの両方を共有空間に埋め込む幾何学的項目応答フレームワークであるJE-IRTを提案する。
質問埋め込みでは、方向は意味論を符号化し、基準は難易度を符号化するが、各質問の正しさはモデルと質問埋め込みの間の幾何学的相互作用によって決定される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:11:47 GMT)
Enhancing Vehicle Detection under Adverse Weather Conditions with Contrastive Learning [4.7] 軽量モデルを用いた車両検出のためのサイドロード-CL適応フレームワークを提案する。
提案したサイドロード-CL適応モデルにより,NVDデータセット上のmAP50で検出性能が3.8%から9.5%向上する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:55:41 GMT)
Extracting Actionable Insights from Building Energy Data using Vision LLMs on Wavelet and 3D Recurrence Representations [4.7] データの3次元グラフィカル表現に基づいて視覚言語大モデル(VLLM)を微調整するフレームワークを提案する。
連続ウェーブレット変換(CWT)と繰り返しプロット(RP)を用いた1次元時系列を3次元表現に変換する手法
これらの3Dエンコーディングにより、VLLMはエネルギー消費パターンを視覚的に解釈し、異常を検出し、エネルギー効率を推奨できる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:18:51 GMT)
Gaussian Process Priors for Boundary Value Problems of Linear Partial Differential Equations [4.3] 適切に配置されたシステムは数値解法やニューラル演算子によって処理されるが、データによって記述されたシステムはPINNやガウス過程によって処理されることが多い。
本稿では,GP事前構築のための新しい確率的枠組みである境界Ehrenpreis--Palamodov Gaussian Processes (B-GPs)を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:17:49 GMT)
Lightweight Structured Multimodal Reasoning for Clinical Scene Understanding in Robotics [4.3] 映像に基づくシーン理解のための軽量なエージェント・マルチモーダル・フレームワークを提案する。
チェーンオブ思考の推論、音声ビジョンの融合、動的ツールの実行をサポートする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:49:49 GMT)
Vision-Language Alignment from Compressed Image Representations using 2D Gaussian Splatting [4.2] 現代のビジョン言語パイプラインは、大量の画像テキストコーパスでトレーニングされたRGBビジョンエンコーダによって駆動される。
これらのパイプラインは、ピクセル領域から2つの構造的非効率を継承する: (i) エッジデバイスからクラウドへ高密度のRGB画像を送信することはエネルギー集約的でコストがかかり、 (ii) パッチベースのトークン化はシーケンス長を爆発させる。
2次元ガウス散乱(2DGS)をアライメントのための代替視覚基板として検討する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:41:57 GMT)
Green Prompt Engineering: Investigating the Energy Impact of Prompt Design in Software Engineering [4.1] 本稿では,グリーン・プロンプト・エンジニアリングを紹介し,エネルギー消費と性能に影響を及ぼす設計次元として言語学的複雑さを浮き彫りにする。
我々は,オープンソースの小言語モデルを用いた要件分類に関する実証的研究を行い,プロンプトの可読性を変化させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:19:33 GMT)
SADA: Safe and Adaptive Inference with Multiple Black-Box Predictions [4.1] 実世界のアプリケーションは、金標準実験の高コストと時間要件のためにラベル付きデータが不足していることが多い。
本稿では,複数のブラックボックス予測を安全かつ適応的に未知の品質で集約する手法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:02:54 GMT)
Shape-Informed Clustering of Multi-Dimensional Functional Data via Deep Functional Autoencoders [3.9] FAEclustは多次元関数データのクラスタ解析のための新しい機能的オートエンコーダフレームワークである。
本稿では, 成分関数間の複素非線形依存性をキャプチャするユニバーサル近似器エンコーダと, ユークリッド関数と多様体値関数の両方を正確に再構成できるユニバーサル近似器デコーダを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:10:23 GMT)
Observation-Free Attacks on Online Learning to Rank [3.9] 我々は、広く使われているオンライン学習アルゴリズムのいくつかを攻撃するための新しいフレームワークを提案する。
本フレームワークは,T-o(T)ラウンドのトップKレコメンデーションリストに表示されるようにターゲット項目のセットをプロモートすると同時に,学習アルゴリズムにおける線形後悔を同時に引き起こすように設計されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:06:42 GMT)
An Ontology for Unified Modeling of Tasks, Actions, Environments, and Capabilities in Personal Service Robotics [3.9] タスク,行動,環境,能力の統一表現を提供するために,既存のものを拡張したrobots and acTions(OntoBOT)のオントロジーを提案する。
1) これらの側面を結合体にまとめて、実行、アクション、環境、能力に関する正式な推論をサポートします。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:53:08 GMT)
Towards Agentic OS: An LLM Agent Framework for Linux Schedulers [3.8] 我々は、完全に自律的な大規模言語モデル(LLM)エージェントが、人間の関与なしにLinuxスケジューラを最適化できるフレームワークであるSchedCPを紹介した。
SchedCPは、Workload Analysis Engine、進化するSchduler Policy Repository、Execution Verifierの3つの主要なサービスを備えた安定したインターフェースを提供する。
評価の結果,SchedCPの性能改善は1.79倍,コスト削減は13倍であった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:10:59 GMT)
CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives [3.8] CLASHは345個のハイインパクトジレンマと3,795個の異なる値の個々の視点からなるデータセットである。
CLASHは、価値に基づく意思決定プロセスの批判的かつ未調査な側面の研究を可能にする。
GPT-5やClaude-4-Sonnetのような強力なプロプライエタリモデルでさえ、曖昧な決定に苦戦している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:40:31 GMT)
Scaling to Multimodal and Multichannel Heart Sound Classification: Fine-Tuning Wav2Vec 2.0 with Synthetic and Augmented Biosignals [3.8] 心臓血管疾患(CVD)は、毎年約1790万人が死亡し、世界中で主要な死因となっている。
近年, 心電図(ECG)信号と同期心電図(PCG)信号を用いて, CVDの異常心音の分類に深層学習が応用されている。
この作業は、従来の信号処理と拡散モデルであるWaveGradとDiffWaveを組み合わせて、Wav2Vec 2.0ベースの分類器を微調整する拡張データセットを作成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:27:14 GMT)
Freqformer: Frequency-Domain Transformer for 3-D Reconstruction and Quantification of Human Retinal Vasculature [3.7] 本稿では,グローバル空間コンテキストをキャプチャするトランスフォーマー層を統合した,デュアルブランチアーキテクチャを備えた新しいトランスフォーマーモデルであるFreqformerを紹介する。
Freqformerは1枚の深度平面OCTA画像を用いて訓練され、音量積分OCTAを基礎的真理として利用した。
Freqformerは既存の畳み込みニューラルネットワークとTransformerベースの手法を大幅に上回り、優れた画像メトリクスを実現した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:21:35 GMT)
Exploring the Relationships Between Physiological Signals During Automated Fatigue Detection [3.7] 生理的信号を用いた疲労検出は、輸送、医療、パフォーマンス監視といった領域において重要である。
本研究は,信号対間の統計的関係を調べ,分類ロバスト性を改善する。
EMG EEGの組み合わせによるXGBoostは最高のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:49:44 GMT)
SAGE: Scene Graph-Aware Guidance and Execution for Long-Horizon Manipulation Tasks [3.7] ロングホライゾン操作タスクは、拡張されたアクションシーケンスと複雑なオブジェクトの相互作用を含む。
長軸操作タスクにおけるSAGE(Scene Graph-Aware Guidance and Execution)の新たなフレームワークを提案する。
SAGE は,(1) VLM と LLM を用いて環境解析を行うシーングラフベースのタスクプランナと,(2) 対象のサブゴールグラフを対応する画像に変換する分離構造画像編集パイプラインから構成される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:14:55 GMT)
A Fully Automatic Framework for Intracranial Pressure Grading: Integrating Keyframe Identification, ONSD Measurement and Clinical Data [3.7] 頭蓋内圧(ICP)上昇は脳機能に深刻な脅威をもたらし、時間的介入の監視を必要とする。
OnSD測定と臨床データを統合したICPグレーティングのための完全自動2段階フレームワークを提案する。
評価精度は0.845 pm 0.071$, 独立試験精度0.786であり, 従来のしきい値法よりも優れていた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:18:06 GMT)
TimeMosaic: Temporal Heterogeneity Guided Time Series Forecasting via Adaptive Granularity Patch and Segment-wise Decoding [3.6] TimeMosaicは、時間的不均一性に対処することを目的とした予測フレームワークである。
TimeMosaicは、局所情報密度に応じて動的に粒度を調整するために適応パッチ埋め込みを採用している。
我々は,321億の観測値を持つ大規模コーパスを訓練し,最先端のTSFMと性能を比較検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:33:25 GMT)
Can Large Language Models Develop Gambling Addiction? [3.6] 本研究では,大規模言語モデルがヒトギャンブル中毒に類似した行動パターンを呈するか否かを検討する。
我々は,ヒトギャンブル中毒研究に基づく認知行動および神経レベルにおける意思決定の分析を行った。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:24:22 GMT)
A Survey on LLM-based Code Generation for Low-Resource and Domain-Specific Programming Languages [3.6] LLM(Large Language Models)は、人気のあるプログラミング言語のコード生成機能を示す。
低リソースプログラミング言語(LRPL)とドメイン特化言語(DSL)のパフォーマンスは依然として大きな課題です。
LRPLやDSLは金融や科学といった専門分野の開発効率を高めるため、これらの課題に対処することが不可欠である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:40:54 GMT)
Deep Learning-Based Cross-Anatomy CT Synthesis Using Adapted nnResU-Net with Anatomical Feature Prioritized Loss [3.6] マルチセンターSynthRAD2025データセットを用いて, MRからCTへの3D nnUNet適応とCTへのCBCTへのCT画像変換を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:22:15 GMT)
Benchmarking LLMs in Web API Integration Tasks [3.6] 本稿では,大規模な言語モデルによるWeb API呼び出しコード生成能力を評価するためのデータセットと評価パイプラインを提案する。
私たちの実験では、API呼び出しの生成が大きな課題となり、幻覚的なエンドポイント、誤った引数の使用、その他のエラーが発生します。
評価済みのオープンソースモデルはいずれも40%以上のタスクを解決できなかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:24:10 GMT)
The Dark Art of Financial Disguise in Web3: Money Laundering Schemes and Countermeasures [3.6] 調査の目的は、Web3におけるマネーロンダリングを促進するために利用される、ハイレベル戦略と基盤となるメカニズムの分類を概説することである。
犯罪者は、規制の弱いフレームワークとともに、Web3の匿名性を悪用し、不正な金融活動を隠蔽する方法について検討する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:47:58 GMT)
LLM-Augmented and Fair Machine Learning Framework for University Admission Prediction [3.5] この研究は、機械学習、ディープラーニング、および大規模言語モデルテクニックを融合させる包括的なフレームワークを提示している。
2000以上の学生の記録に基づいて、この研究はロジスティック回帰、ナイーブベイズ、ランダムな森林、ディープニューラルネットワーク、そして積み重ねられたアンサンブルをベンチマークした。
フレームワークは解釈可能で、公正を意識し、デプロイ可能である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:40:44 GMT)
GPU-Accelerated Loopy Belief Propagation for Program Analysis [3.5] 本稿では,プログラム解析のためのGPU高速化LPPアルゴリズムを提案する。
本稿では,依存関係解析アルゴリズムとともに,任意のユーザ定義更新戦略を指定する統一表現を提案する。
当社のアプローチでは,最先端のシーケンシャルアプローチよりも平均2.14タイム,最先端のGPUベースのアプローチよりも5.56タイムのスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:30:30 GMT)
A Source of Deterministic Entanglement for Matter-Wave Networks [3.5] 本稿では,Feshbach分子の解離制御による超低温中性原子の絡み合った対を生成するプロトコルについて述べる。
提案アーキテクチャは、自然に原子線回路やチップベースの物質波光学と統合される。
この方式は、ビームスプリッター、位相シフター、干渉計、トンネル接合、局所検出器の物質波光ネットワークに接続されたアレイ内の数百の平行絡み源にスケールすることができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:18:11 GMT)
Labeling Free-text Data using Language Model Ensembles [3.3] 本稿では,プライバシ制約下での自由テキストデータにおける所定のトピックのラベル付けを強化する枠組みを提案する。
我々は,摂食障害関連フォーラムから公開されているRedditデータと摂食障害患者の自由テキスト応答を用いて,アンサンブルアプローチを評価した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:57:27 GMT)
Small Dents, Big Impact: A Dataset and Deep Learning Approach for Vehicle Dent Detection [3.3] 本稿では、YOLOv8オブジェクト認識フレームワークを用いて、顕微鏡表面欠陥を検出するためのディープラーニングベースのソリューションを提供する。
この技術は検出精度に優れ、推論レイテンシも低く、リアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:47:11 GMT)
Mitigating Exponential Mixed Frequency Growth through Frequency Selection [3.2] アングル符号化は、古典的なデータを量子モデルに埋め込む機能マップ(FM)として人気がある。
すべての関連する周波数が理論上アクセス可能である場合でも、トレーニングの失敗は起こり得ることを示す。
パラメータ要求を減らすための実用的なソリューションとして周波数選択を導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:22:07 GMT)
Toward a Theory of Generalizability in LLM Mechanistic Interpretability Research [3.1] 機械的主張が一般化する5つの対応軸を提案する。
Pythiaモデルのランダムシードの事前学習における「ワンバックアテンションヘッド」の分析を行った。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:38:16 GMT)
Eliminating Exponential Key Growth in PRG-Based Distributed Point Functions [3.1] PRGベースのマルチパーティDPFは、パーティ数やフィールドサイズと指数関数的に増加するキーサイズのため、実用性に苦慮している。
我々の研究は、ボイルらによるPRGベースの多人数DPF方式を最適化することで、このボトルネックに対処する。
提案手法は,実用的な鍵サイズを持つ初のPRGベースのマルチパーティDPF方式であり,最もよく知られているマルチパーティDPFよりも最大3倍小さい鍵を提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:57:24 GMT)
Federated Learning of Quantile Inference under Local Differential Privacy [2.8] 局所微分プライバシー(LDP)下での量子推論の学習について検討する。
本稿では,局所勾配勾配(SGD)に基づく推定器を提案する。
我々は、推定器の正規性と機能中心極限定理を確立する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:56:39 GMT)
Ultralow-Temperature Cryogenic Transmission Electron Microscopy Using a New Helium Flow Cryostat Stage [2.8] CondenZeroの低温冷却システムは、超低温でのイメージングと分光のために設計されている。
このシステムは、振動減衰ステージに装着された外装デワーと、加圧低ノイズヘリウム輸送線とを含む。
7K未満の信頼性の高い低温操作を提供し、量子材料中の電子および磁気相変換を直接可視化するための低ドリフト経路を確立する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:09:55 GMT)
Exploiting the Asymmetric Uncertainty Structure of Pre-trained VLMs on the Unit Hypersphere [2.8] 本稿では,単位超球面上で事前学習された視覚言語モデルから確率的埋め込みを構築することを提案し,不確実な定量化を実現する。
確立されたベンチマークに対する確率的埋め込みの有効性を検証し,テキストおよび視覚データの不確実性構造における非対称性の性質を示す包括的アブレーション研究を行った。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:06:47 GMT)
GPT-4 for Occlusion Order Recovery [2.8] 本稿では,事前学習したGPT-4モデルの高度な性能を利用して注文を推定する手法を提案する。
入力画像と共に特別に設計されたプロンプトを提供することで、GPT-4は画像を分析し、順序予測を生成することができる。
その結果,意味的文脈,視覚的パターン,常識的知識を用いることで,モデルがより正確な順序予測を生成できることが示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:11:39 GMT)
Evaluating Open-Source Large Language Models for Technical Telecom Question Answering [2.8] 本稿では,2つのオープンソースのLarge Language Model,Gemma 3 27BとDeepSeek R1 32Bを,実例と推論に基づく質問に対して評価する。
我々は105組の質問応答対のベンチマークを構築し、語彙メトリクス、意味的類似性、LLM-as-a-judgeスコアを用いて性能を評価する。
その結果,Gemma は意味的忠実度と LLM 評価の正確性に優れており,DeepSeek では語彙整合性がわずかに高いことが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:29:15 GMT)
A Systematic Review: Affective Perception on Urban Facades [2.8] 建築ファサードは、都市環境における感情的な知覚を批判的に形成する。
建築環境に対する情緒的な反応への関心が高まりつつあるにもかかわらず、都市建築ファサードの情緒的な影響はいまだに未理論のままである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:18:02 GMT)
AntiFLipper: A Secure and Efficient Defense Against Label-Flipping Attacks in Federated Learning [2.7] フェデレートラーニング(FL)は、データを分散化してプライバシ保護モデルトレーニングを可能にする。
悪意のあるクライアントがラベルを操作してグローバルモデルに悪影響を及ぼすような、ラベルフリップ攻撃には依然として脆弱だ。
FLにおけるマルチクラスラベルフリップ攻撃に対する,新規かつ計算効率のよい防御手法であるAntiFLipperを紹介した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:36:52 GMT)
Slicing Wasserstein Over Wasserstein Via Functional Optimal Transport [2.6] ワッサーシュタイン距離は任意の距離空間上の確率測度の間の距離を定義する。
既存のWoW加速器はパラメトリックなメタ測定や高次モーメントの存在に依存している。
DSWの最小化はWoWの最小化と同等であることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:59:14 GMT)
Hole spin splitting in a Ge quantum dot with finite barriers [2.6] 平面Ge量子ドット(QD)に閉じ込められた単一ホールの低エネルギースペクトルについて検討する。
QDは[001]方向に沿って成長した有限電位高さの2つのGeSi障壁の間に挟まれている。
トップゲート電界および残留張力ひずみがクビット状態に与える影響について検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:14:24 GMT)
ArFake: A Multi-Dialect Benchmark and Baselines for Arabic Spoof-Speech Detection [2.6] アラビア語スプーフ音声データセットを初めて紹介する。
以上の結果から,FishSpeechはカサブランカコーパスのアラビア語音声クローニングにおいて,他のTSモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:11:20 GMT)
SpinGPT: A Large-Language-Model Approach to Playing Poker Correctly [2.6] 我々は、人気のある3人プレイのオンラインポーカーフォーマットであるSpin & Goに合わせた、最初のLarge Language ModelsであるSpinGPTを紹介する。
以上の結果から,SpinGPTは解答者の行動に78%の精度で一致していることがわかった。
これらの結果は、LLMがポーカーのようなマルチプレイヤー不完全な情報ゲームに対処する新しい方法になり得ることを示唆している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:15:44 GMT)
Ground-Truthing AI Energy Consumption: Validating CodeCarbon Against External Measurements [2.5] 本研究では静的および動的エネルギー推定手法の信頼性を系統的に評価する。
確立された推定手法は、一貫して最大40%の誤差を発生させる。
この研究は透明性を確立し、持続可能なAI開発に広く利用されているツールを検証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:12:21 GMT)
Generalization Analysis for Classification on Korobov Space [2.5] 凸$eta$-normの損失関数に従って,過度な誤分類誤差の学習率を導出する。
我々は、浅いReLUニューラルネットワークにより、コロボフ空間$X2, p([-1,1]d)$, $1leq p leq infty$から関数の近似の$L_p$のレートを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:56:45 GMT)
Excavating in the Wild: The GOOSE-Ex Dataset for Semantic Segmentation [2.4] 本研究では,異なる環境から5000個のラベル付きマルチモーダルフレームを含むGOOSE-Exデータセットをオープンソースとして公開する。
本研究では,異なるプラットフォーム上でのセマンティックセグメンテーション性能と,目に見えない環境におけるセンサモードの総合的な解析を行う。
組み合わせたデータセットが、さまざまなダウンストリームアプリケーションやコンペにどのように使用できるかを実証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:03:00 GMT)
The Express Lane to Spam and Centralization: An Empirical Analysis of Arbitrum's Timeboost [2.4] われわれはTimeboostの大規模な実証的研究を行った。
Timeboostはオークションベースのトランザクションシーケンシング機構で、急行車線への短期的な優先アクセスを可能にする。
Timeboostは、公正性、分散化、スパム削減という目標を達成できないことがわかりました。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:02:15 GMT)
Numerion: A Multi-Hypercomplex Model for Time Series Forecasting [2.4] 複数の超複素空間に基づく時系列予測モデルであるNumerionを提案する。
我々の研究は、複素領域と高次超複素空間において、時系列の特徴周波数が自然に減少することを明らかにする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:53:48 GMT)
Mixture of Detectors: A Compact View of Machine-Generated Text Detection [2.4] 本稿では,文書レベルのバイナリやマルチクラス分類,ジェネレータ属性など,複数のシナリオにわたる機械生成テキストの検出に対処する。
BMAS Englishと呼ばれる新しい研究は、人文と機械文のバイナリ分類のための英語データセット、マルチクラス分類のための、そして検出の緩和のための共通の行為であるアドリアックアタックアタックアタック(Adrial attack addressing)である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:05:22 GMT)
Average relative entropy of random states [2.4] 相対エントロピーは量子情報理論における概念として機能する。
Hilbert-Schmidt および Bures-Hall アンサンブルの主要な一般状態モデルからランダム状態の相対エントロピーを研究する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:15:07 GMT)
Adversarial training with restricted data manipulation [2.4] 悲観的二水準最適化は、敵に対するレジリエントな分類器を訓練する効果的な方法であることが示されている。
制約付き悲観的二段階最適化モデルを提案する。
実験を通じて、このモデルが既存のアプローチよりも平均して優れていることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:17:57 GMT)
AutoPK: Leveraging LLMs and a Hybrid Similarity Metric for Advanced Retrieval of Pharmacokinetic Data from Complex Tables and Documents [2.3] AutoPKは、複雑な科学表からPK(Pharmacokinetics)データを正確かつスケーラブルに抽出するための新しいフレームワークである。
キャプションやフットノートを含む605 PKテーブルの実際のデータセットで評価した。
AutoPKは、スケーラブルで高信頼なPKデータ抽出を可能にし、獣医学、薬物安全性監視、公衆衛生決定における重要な応用に適している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:05:32 GMT)
When Speculation Spills Secrets: Side Channels via Speculative Decoding In LLMs [2.3] そこで本研究では,不正な推測と正しい推測の入力依存パターンを,フィルタ単位のトークン数やパケットサイズをモニタすることによって推定できる,新たなサイドチャネルを明らかにする。
これらのパターンを観察する敵は、4つの投機的デコードスキームで90%の精度でユーザクエリをフィンガープリントすることができる。
パケットパディングや繰り返しトークンアグリゲーションなど,一連の軽減策を提案し,評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:28:00 GMT)
Quantum simulation approach to ultra-weak magnetic anisotropy in a frustrated spin-1/2 antiferromagnet [2.3] 磁気結晶異方性(MCA)は、実磁石の重要な特徴である。
我々はCuSb2O6におけるMCAの量子シミュレーションフレームワークを開発した。
本研究は, 実材料における複雑な磁性現象の, 資源効率のよい量子シミュレーションの実現可能性を示すものである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:59:43 GMT)
ADAM: A Diverse Archive of Mankind for Evaluating and Enhancing LLMs in Biographical Reasoning [2.3] 文献的推論におけるマルチモーダル大言語モデル(MLLM)の評価と改善のためのフレームワークであるADAMを紹介する。
AdamDBは、地理、時間、職業にわたって400万人以上の個人をカバーする多言語およびマルチモーダルのデータセットである。
アダムベンチはブルームの分類に基づいて認知的に構造化された評価を提供しており、英語と母語の両方で6つの推論レベルにまたがっている。
AdamRAG(アダムラグ)は、生物学的文脈に合わせた検索拡張生成システムである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:04:28 GMT)
CryptoSRAM: Enabling High-Throughput Cryptography on MCUs via In-SRAM Computing [2.2] CryptoSRAMは、MCUの標準配列内で直接操作を行う暗号アーキテクチャである。
メモリアレイを非常に並列な処理ファブリックに再利用することで、CryptoSRAMはデータ移動のボトルネックを取り除く。
一般的な暗号カーネルでは、CryptoSRAMは最大74$times$と67$times$のスループット向上を実現している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:36:45 GMT)
Towards a Physics Foundation Model [2.1] シミュレーションデータの1.8TBをトレーニングした一般物理変換器(GPhyT)について述べる。
GPhyTは複数の物理領域にまたがる優れた性能を実現し、特殊アーキテクチャを最大29倍の性能で上回る。
単一のモデルがデータだけで一般的な物理原理を学習できることを確立することで、この研究は普遍的な物理基礎モデルへの道を開く。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:59:55 GMT)
ArabJobs: A Multinational Corpus of Arabic Job Ads [2.1] ArabJobsは、エジプト、ヨルダン、サウジアラビア、アラブ首長国連邦から集められたアラビア語の求人広告のコーパスである。
このデータセットはアラブの労働市場における言語、地域、社会経済の変動を捉えている。
本稿では、性別の表現と職業構造の分析を行い、広告間の弁証的変動を強調した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:06:07 GMT)
Hallucination to Truth: A Review of Fact-Checking and Factuality Evaluation in Large Language Models [2.1] 大規模言語モデル(LLM)は、不正確なコンテンツや誤解を招くコンテンツを含む多種多様なインターネットコーパスで訓練されている。
本総説では,LLM生成したコンテンツが現実の精度でどのように評価されるかを系統的に分析する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:54:51 GMT)
Data-Driven Temperature Modelling of Machine Tools by Neural Networks: A Benchmark [2.1] 我々は,NNが機械工具内の高忠実度温度と熱流束場を予測するために訓練される新しいパラダイムを導入する。
提案したフレームワークは、モジュール式でスワップ可能な下流コンポーネントを使用して、幅広いエラータイプの計算と修正を可能にする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:43:08 GMT)
Bridging Technical Capability and User Accessibility: Off-grid Civilian Emergency Communication [2.1] 本稿では,低消費電力長距離ネットワークと危機対応スマートフォンアプリケーションを組み合わせた統合緊急通信システムを提案する。
システムは通信性能とアプリケーション機能という2つの次元で評価される。
並行して、ピアツーピアメッセージング、アイデンティティ検証、コミュニティモデレーションを備えたモバイルアプリケーションを開発した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:44:23 GMT)
Boundary on the Table: Efficient Black-Box Decision-Based Attacks for Structured Data [2.0] 構造化データの敵対的ロバスト性は、視覚や言語ドメインと比較して未探索のフロンティアのままである。
本手法は、勾配のない方向推定と反復境界探索を組み合わせ、離散的かつ連続的な特徴空間の効率的なナビゲーションを可能にする。
実験により,本手法は多種多様なモデルでテストセットのほぼ全域を損なうことができた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:00:11 GMT)
Sycophancy Is Not One Thing: Causal Separation of Sycophantic Behaviors in LLMs [2.0] 我々は、真の合意とは対照的に、空想的合意と空想的賞賛を分解する。
結果は、サイコファンティックな行動は、独立して選択可能な表現と一致していることを示唆している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:15:36 GMT)
The Bias is in the Details: An Assessment of Cognitive Bias in LLMs [2.0] 大規模言語モデル(LLM)は、現実の意思決定プロセスにますます組み込まれています。
本稿では,45LLMにおける8つの認知バイアスの大規模評価について述べる。
モデルサイズと迅速な特異性の両方がバイアス感受性に重要な役割を果たすことがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:09:42 GMT)
Role-Aware Multi-modal federated learning system for detecting phishing webpages [1.9] 本稿では,URL,HTML,画像入力をサポートするマルチモーダルフィッシングサイト検出器を提案する。
提案手法は,FedProx上の役割認識バケットアグリゲーションであり,Mixture-of-ExpertsとFedMMにインスパイアされたものである。
その結果,バケットアグリゲーションとハードゲートの専門家は,厳密なプライバシーの下で安定したフェデレーショントレーニングを可能にすることがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:02:20 GMT)
DexBench: Benchmarking LLMs for Personalized Decision Making in Diabetes Management [1.8] DexBenchは,大規模言語モデル(LLM)の性能を実世界の意思決定タスクで評価するための最初のベンチマークである。
我々のベンチマークは7つの異なるタスクカテゴリを含んでおり、糖尿病患者が質問する現実世界の質問の幅を反映している。
このベンチマークを確立することで、糖尿病治療におけるAIソリューションの信頼性、安全性、有効性、実用性を向上することを目指している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:08:30 GMT)
LFA-Net: A Lightweight Network with LiteFusion Attention for Retinal Vessel Segmentation [1.8] 新たに設計された注目モジュールLiteFusion-Attentionを組み込んだ新しい血管分割ネットワークLFA-Netを提案する。
LFA-Netは、0.11百万のパラメータ、0.42MBのメモリサイズ、および4.46GFLOPのハイパフォーマンスを提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:07:05 GMT)
Mixtures Closest to a Given Measure: A Semidefinite Programming Approach [1.8] 対象測度を有限個のモーメントでしか利用できない問題について検討する。
既存の多くのアプローチとは異なり、パラメータ集合は有限ではないと仮定される。
クラスタリングには,スタンドアローンのメソッドとして,あるいは前処理のステップとして,フレームワークが機能するアプリケーションを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:51:21 GMT)
Modelling Analogies and Analogical Reasoning: Connecting Cognitive Science Theory and NLP Research [1.8] アナロジカル推論は人間の認知の重要な側面である。
これらの概念がNLP研究におけるいくつかの大きな課題にどのように関係しているかを示す。
これによって研究者は、エンティティレベルの類似性に大きく依存するのではなく、テキストのリレーショナル理解をより良く最適化することが可能になる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:52:31 GMT)
A Notion of Uniqueness for the Adversarial Bayes Classifier [1.8] 本稿では,二項分類の設定において,逆ベイズ分類器に対して一意性という新たな概念を提案する。
摂動半径が増加するにつれて、逆ベイズ分類器の正則性の概念が向上することを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:44:38 GMT)
Thinking in Many Modes: How Composite Reasoning Elevates Large Language Model Performance with Limited Data [1.7] 複合推論(CR)は、大規模言語モデル(LLM)を活用して複数の推論スタイルを探索し組み合わせる新しい推論手法である。
科学的および医学的な質問応答ベンチマークで評価する。
その結果, LLMは内部推論スタイルの多様性を育むことで, より堅牢で適応的で効率的な問題解決能力を得ることができた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:38:03 GMT)
Label-Guided Imputation via Forest-Based Proximities for Improved Time Series Classification [1.7] 時系列分類の文脈でデータ計算を欠くためのフレームワークを提供する。
ラベルに条件付きで不足した値を出力する手段を定義する。
この手法を用いて計算を行うことで,分類精度の向上につながる情報をよりリッチに提供できることが示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:47:00 GMT)
EfficientDepth: A Fast and Detail-Preserving Monocular Depth Estimation Model [1.5] 我々は、トランスフォーマーアーキテクチャと軽量畳み込みデコーダを組み合わせた、EfficientDepthと呼ばれる新しいMDEシステムを導入する。
我々は,ハイパフォーマンスなMDE法を用いて,ラベル付き合成画像と実画像と,擬似ラベル付き実画像の組み合わせでモデルを訓練する。
一般的に使用される目的に加えて,LPIPSに基づく損失関数を導入し,ネットワークが詳細な深度マップを作成することを奨励する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:05:43 GMT)
Text-Independent Speaker Identification Using Audio Looping With Margin Based Loss Functions [1.5] 畳み込みニューラルネットワークアーキテクチャを用いたテキスト独立話者識別におけるCosFace LossとArcFace Lossの有効性を検討した。
モデル精度とロバスト性への影響を解析するために,両損失関数を実装する。
実験の結果,従来のSoftmax損失法と比較して同定精度が優れていた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:40:32 GMT)
Developing Strategies to Increase Capacity in AI Education [1.4] Computing Research Associationは、AI教育を改善する202人のエキスパートの仮想ラウンドテーブルディスカッションを32回実施した。
私たちは、AI教育の能力を高めるために、以下のハイレベルなコミュニティの必要性を特定しました。
この調査を通じて、参加者が言及したリソースのリストを編集し、整理しました。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:23:11 GMT)
Multi-Channel Differential Transformer for Cross-Domain Sleep Stage Classification with Heterogeneous EEG and EOG [1.4] 異種脳波-EOG表現学習のための多チャンネル差動変換フレームワークであるSleepDIFFormerを提案する。
SleepDIFFormerは複数のスリープステージデータセットでトレーニングされており、それぞれがソースドメインとして扱われる。
提案手法は,空間的および時間的注意雑音を緩和し,データセット間の特徴分布アライメントを通じて,領域不変なEEG-EOG表現を学習することにより,新しい領域への一般化を促進する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:39:36 GMT)
Variational Autoencoders-based Detection of Extremes in Plant Productivity in an Earth System Model [1.4] 本研究は, 総生産生産性の極端事象を同定するために, 変分オートエンコーダ(VAE)の新たな応用法を提案する。
VAEを用いた異常検出法と従来の特異スペクトル分析法(SSA)法(1850-80,1950-80,2050-80)を比較した。
その結果, 極端事象周波数の空間パターンにおいて, VAE法とSSA法との間に強い地域的一致が認められた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:03:20 GMT)
Question-Driven Analysis and Synthesis: Building Interpretable Thematic Trees with LLMs for Text Clustering and Controllable Generation [1.4] 二分木を対話的に構築するための再帰的テーマ分割(RTP)を導入する。
ツリーの各ノードは、データを意味的に分割する自然言語の質問であり、完全に解釈可能な分類である。
RTPの質問駆動階層はBERTopicのような強力なベースラインからのキーワードベースのトピックよりも解釈可能であることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:27:22 GMT)
Scaling Laws for Neural Material Models [1.3] 優れた電池、半導体、医療機器を設計するには、材料特性の予測が不可欠である。
深層学習は、科学者がエネルギー、力、ストレスを予測することによって、有望な物質を素早く見つけるのに役立つ。
私たちのチームは、トレーニングデータのスケーリング(学習すべきより多くの情報を提供するモデル)、モデルサイズ(パターンを学ぶための能力を与えるモデル)、ニューラルネットワークの計算が、物質的特性予測のパフォーマンスにどのように影響するかを分析します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:14:46 GMT)
Two times or none? [1.3] 量子力学における空間と等価な足場上の時間を扱うための2時間のアプローチ。
我々は、時間のないフレームワークと2時間のアプローチの間に微妙な選択があることを示します。
時間のない哲学を2時間量子力学と組み合わせることのできる枠組みをスケッチする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:28:25 GMT)
Integrating Background Knowledge in Medical Semantic Segmentation with Logic Tensor Networks [1.3] 本稿では,一階述語論理(FOL)ルールを用いて医学的背景知識を符号化するための論理ネットワーク(LTN)を提案する。
脳MRIで海馬のセグメンテーションの課題について検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:26:26 GMT)
Bridging Language Models and Formal Methods for Intent-Driven Optical Network Design [1.3] Intent-Based Networking (IBN)は、ユーザが高レベルな目標を指定できるようにすることで、ネットワーク管理を簡単にすることを目的としている。
非公式な自然言語の意図を、正式に正しい光ネットワークトポロジに変換することは、依然として困難である。
本稿では,Large Language Models(LLMs)に基づくインテント解析,形式的手法,光検索拡張生成(RAG)を統合した新しいハイブリッドパイプラインを提案する。
このアプローチは、ミッションクリティカルなネットワークタスクに不可欠な信頼性と正確性を保証することで、ITNを著しく向上させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:38:53 GMT)
Effect of Model Merging in Domain-Specific Ad-hoc Retrieval [1.1] モデルマージ(英: Model merging)は、複数のモデルの多様な特性を組み合わせた技法である。
我々は、線形アプローチを用いて、ソース検索モデルとドメイン固有(非検索)モデルの重みをマージした。
実験結果から,モデルマージにより,より効果的なドメイン固有検索モデルが得られる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:54:23 GMT)
The MUG-10 Framework for Preventing Usability Issues in Mobile Application Development [1.0] 本研究の目的は,モバイルアプリケーション開発におけるユーザビリティの問題を回避するための対策を提供することである。
本研究は,20人のモバイルソフトウェア設計・開発実践者の調査を通じて,この研究ギャップを埋めることを目的としている。
収集した材料を解析することにより,10のガイドラインと3つのアクティビティからなる新しいフレームワークの開発が可能となった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:54:48 GMT)
Human Mobility Datasets Enriched With Contextual and Social Dimensions [1.0] 意味的に富んだ人間の軌道の2つのデータセットと、それらを構築するためのパイプラインを提示する。
トラジェクトリはOpenStreetMapから取得した公開GPSトレースである。
新しいセマンティックな特徴は、大規模言語モデルによって生成された合成的で現実的なソーシャルメディア投稿を含めることである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:45:27 GMT)
SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models [1.0] タイポグラフィー攻撃は、マルチモーダル基礎モデルにおけるテキストと視覚コンテンツ間の相互作用を利用する。
SCAMは,これまでで最大かつ多種多様な実世界タイポグラフィー・アタック・イメージのデータセットである。
以上の結果から, タイポグラフィーによる攻撃は, 最先端の大規模視線モデルに対して有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:30:35 GMT)
MakOne: Behavioural Data of University Students' Smart Devices in Uganda [1.0] 本稿では,カンボジアのMakerere大学の72人の学生から6週間にわたって収集された,新しいマルチモーダルデータセットMakOneを紹介する。
このデータセットは、受動的スマートフォンセンサーのデータ(位置、身体活動、スクリーン使用量を含む)と、学生の気分や日常のルーチンをキャプチャする生態的瞬間評価(EMA)を統合している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:28:52 GMT)
Localized Uncertainty Quantification in Random Forests via Proximities [1.0] 機械学習では、不確実性定量化はモデルの予測の信頼性を評価するのに役立つ。
従来のアプローチでは予測精度が重視されることが多いが、不確実性対策の導入に焦点が当てられている。
自然発生試験セットと類似度尺度(確率)をランダム林の副産物と見なす新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:53:28 GMT)
Sleeping Kelly is a Thirder [1.0] 睡眠の美」問題は、不完全なリコールのある状況における確率の役割を強調している。
睡眠美」問題を解決する一つのアプローチは、睡眠美」が彼女の信念に基づいて決定を下すことを可能にすることである。
代わりに、ケリー基準を用いて彼女の富の伸び率を最大化することは、スリーピングビューティにとって合理的である、と私は主張する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:26:31 GMT)
Red Teaming Quantum-Resistant Cryptographic Standards: A Penetration Testing Framework Integrating AI and Quantum Security [1.0] 本研究では,量子暗号プロトコルの脆弱性を評価するための構造化アプローチを提案する。
BB84量子鍵分布法とNational Institute of Standards and Technology (NIST)が承認した量子耐性アルゴリズムに焦点を当てている。
AI駆動のレッドチーム、自動テスト、リアルタイム異常検出を統合することで、量子ネットワークにおけるセキュリティリスクを評価し緩和するフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:36:59 GMT)
Comprehensive Analysis of VQC for Financial Fraud Detection: A Comparative Study of Quantum Encoding Techniques and Architectural Optimizations [1.0] 本研究は,量子回路解析のための新しい手法を導入し,実用的な量子機械学習実装のための実用的なデプロイメントレコメンデーションを提供する。
これらの研究は、量子強化詐欺検知システムの初期ベンチマークを提供し、金融セキュリティアプリケーションにおける量子機械学習の潜在的な利点を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:31:30 GMT)
Brain Tumor Classification from MRI Scans via Transfer Learning and Enhanced Feature Representation [1.0] 磁気共鳴画像(MRI)スキャンによる脳腫瘍検出のための,自動的かつ効率的なディープラーニングフレームワークを提案する。
このフレームワークは特徴抽出のために事前訓練されたResNet50モデルを使用し、続いてGlobal Average Pooling (GAP) と線形投影を用いてコンパクトで高レベルな画像表現を得る。
もうひとつの大きな貢献は、信頼できる脳腫瘍MRIリソースの欠如に対応するために設計された、Mymensingh Medical College脳腫瘍データセットの作成である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:41:30 GMT)
A Multi-Modality Evaluation of the Reality Gap in Autonomous Driving Systems [1.0] 我々は、Software-in-the-Loop (SiL), Vehicle-in-the-Loop (ViL), Mixed-Reality (MR), full real-world testingの4つの代表的なテストモードを比較した。
以上の結果から,SiLとViLのセットアップは実世界のダイナミックスとセンシングの重要な側面を単純化するが,MRテストは安全性や制御を損なうことなく知覚リアリズムを改善することが示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:08:53 GMT)
Improving accuracy in short mortality rate series: Exploring Multi-step Forecasting Approaches in Hybrid Systems [1.0] 多段階の予測は公衆衛生、人口計画、保険リスク評価に不可欠である。
本研究では,ハイブリッドシステムの精度に及ぼす多段階予測手法の影響について検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:22:48 GMT)
GEP: A GCG-Based method for extracting personally identifiable information from chatbots built on small language models [1.0] 小型言語モデル(SLM)は、大型言語モデル(LLM)と比較してほぼ同等の性能のため、前例のないほど魅力的になる。
しかし、下流タスクのためのSLMの個人識別情報(PII)漏洩は未だ調査されていない。
PII抽出に特化して設計されたgreedy coordinate gradient-based (GCG) 法である GEP を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:02:21 GMT)
Leveraging Wireless Sensor Networks for Real-Time Monitoring and Control of Industrial Environments [0.9] 我々は、強い無線センサネットワーク(WSN)を確立するためのNRFトランシーバに基づくシステムを提案した。
温度・湿度・土壌水分・火災検知などの産業設備において重要なパラメータをモニターし,LCD画面に表示する。
監視以外にも、オンラインコマンドを通じてDCモータの速度を制御することで、これらのパラメータを遠隔操作する機能も追加された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:07:44 GMT)
Quantum Krylov Subspace Diagonalization via Time Reversal Symmetries [0.9] 我々は、ハミルトン進化における時間反転対称性を活用することでボトルネックを回避する、Krylov Time Reversal (KTR)と呼ばれる新しいプロトコルを導入する。
これにより,回路の深さを大幅に低減し,浅い量子アーキテクチャとの整合性を高めることができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:26:34 GMT)
MINT-RVAE: Multi-Cues Intention Prediction of Human-Robot Interaction using Human Pose and Emotion Information from RGB-only Camera Data [0.9] 本稿では,人間のインタラクション意図とフレームレベルの精度を予測する新しいパイプラインを提案する。
意図予測における重要な課題は、実世界のHRIデータセットに固有のクラス不均衡である。
我々の手法は最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:49:40 GMT)
AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs [0.9] AEGISは、既存のトレーニングエッジを再サンプリングする、エッジのみの拡張フレームワークである。
テキストリッチGDPグラフでは、セマンティックKNNが最大のAUC改善とBrierスコアの削減を実現している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:51:40 GMT)
Random Unitaries in Constant (Quantum) Time [0.9] 我々は、量子計算のよく研究されたモデルにおいて、ユニタリ設計とPRUを効率的に構築できることを示す。
その結果、単体設計とPRUは以前考えられていたよりもはるかに弱い回路モデルで構築可能であることが示された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:37:23 GMT)
Adaptive Dual-Mode Distillation with Incentive Schemes for Scalable, Heterogeneous Federated Learning on Non-IID Data [0.8] Federated Learning(FL)は、ユーザプライバシを損なうことなく分散データの使用を可能にする、有望な分散学習(DL)アプローチとして登場した。
すべてのクライアントが同じ機械学習モデルをトレーニングできると仮定されるが、ビジネスニーズと計算資源の違いにより、すべてのクライアントがこの仮定を満たすことはできない。
統計的不均一性の文脈における効率、プライバシー保護、コミュニケーション効率の学習を容易にするDL-SHと、統計的格差に対処しながら完全に異種モデルを管理するためのDL-MHと、インセンティブに基づくインセンティブベースの拡張であるI-DL-MHを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:48:14 GMT)
Comparative Analysis of GAN and Diffusion for MRI-to-CT translation [0.8] MRIからCTへの変換によく使われる2つのアーキテクチャの性能を比較した。
古典的な3次元翻訳問題を横面上の2次元翻訳列に分割する。
また、生成過程の条件付けが1つのMRI画像/スライスおよび複数のMRIスライスに与える影響についても検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:33:34 GMT)
The Glider Equation for Asymptotic Lenia [0.8] Asymptotic Leniaはコンウェイの『ゲーム・オブ・ライフ』の連続的な拡張であり、豊かなパターン形成を示している。
グライダー方程式」と呼ばれるグライダーパターンの条件を解析的に導出する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:35:16 GMT)
A Global Analysis of Cyber Threats to the Energy Sector: "Currents of Conflict" from a Geopolitical Perspective [0.8] 本稿では, 地政学, サイバー脅威情報分析, 高度な検出技術との交点について検討する。
生成人工知能を利用して、生のサイバー脅威記述から情報を抽出し、構造化する。
我々は、エネルギー標的攻撃の妥協の指標を検出するためのサイバーセキュリティツールの有効性を評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:45:29 GMT)
Local unitary decomposition of tripartite arbitrary leveled qudit stabilizer states into $p$-level-qudit EPR and GHZ state [0.8] 任意の局所ユニタリの下で, 3部安定化器状態の絡み合い構造を次元$D$の$N$クォーディットで調べ, パーティ間を分散する$A$, $B$, $C$について検討する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:00:18 GMT)
Hemorica: A Comprehensive CT Scan Dataset for Automated Brain Hemorrhage Classification, Segmentation, and Detection [0.7] Hemoricaは、2012年から2024年の間に取得された372個の頭部CT検査の公開コレクションである。
ICHサブタイプ(EPH)、サブデューラル(SDH)、サブアラキノイド(SAH)、パーレンキマル(IPH)の5つのサブタイプ(EPH)に対して、各スキャンは徹底的に注釈付けされている。
Hemoricaは、マルチタスクとカリキュラム学習をサポートする統一されたきめ細かいベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:09:41 GMT)
Large Language Models versus Classical Machine Learning: Performance in COVID-19 Mortality Prediction Using High-Dimensional Tabular Data [0.7] 本研究では,古典的特徴ベース機械学習モデル(CML)と大規模言語モデル(LLM)のパフォーマンスを比較し,新型コロナウイルス死亡率の予測を行った。
XGBoost と RF は CML において優れた性能を示し,F1 スコアは0.87 と 0.83 であった。
GPT-4はF1スコアが0.43、微調整のMistral-7bは1%から79%に大幅に改善され、外部検証では安定したF1スコアが0.74となった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:00:01 GMT)
CubistMerge: Spatial-Preserving Token Merging For Diverse ViT Backbones [0.7] ViTのバックボーンは、ウィンドウアテンション、SAMの相対的な位置埋め込み、DINOv3のRoPEといった空間設計を採用している。
本稿では,空間的整合性を維持し,空間的アーキテクチャとのシームレスな整合性を実現するための,シンプルで効果的なトークンマージ手法を提案する。
提案手法では, (i) 構成されたトークン配置を強制するための2次元削減戦略, (ii) 相対的なトークン位置を維持する空間認識型マージアルゴリズム, (iii) 新規な最大値/次元トークン表現を用いる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:59:29 GMT)
PhishLumos: An Adaptive Multi-Agent System for Proactive Phishing Campaign Mitigation [0.7] PhishLumosは、アダプティブなマルチエージェントシステムで、攻撃キャンペーン全体を積極的に緩和する。
PhishLumosは、回避によってブロックされる代わりに、基盤となるインフラストラクチャを調査するための重要なシグナルとして扱う。
実世界のデータから、サイバーセキュリティの専門家による確認の1週間前、私たちのシステムは中央値のキャンペーンの100%を特定しました。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:21:04 GMT)
Edge modes, extended TQFT, and measurement based quantum computation [0.7] citeWong:2022mnvでは、1次元における測定に基づく量子計算がゲージ理論の用語で理解できると説明されている。
本研究では、この「絡み合いゲージ理論」を拡張位相場理論として定式化する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:20:38 GMT)
Intrinsic Signal Models Defined by the High-Dimensional, Small-Sample Limit [0.7] 本研究では,高次元および小サイズ条件下での信号検出を可能にする固有信号モデル'を提案する。
このような信号モデルにより,田口法は信号を検出する効果的な方法を提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:56:56 GMT)
From Outliers to Topics in Language Models: Anticipating Trends in News Corpora [0.7] 本稿では,話題モデリングにおけるノイズとしてしばしば無視される外れ値が,動的ニュースコーパスにおいて出現する話題の弱い信号として機能するかを検討する。
企業における社会的責任と気候変動に焦点をあてた、フランス語と英語のニュースデータセットで、彼らの進化を時間とともに追跡します。
アウトリーチは、モデルと言語の両方にわたって、時間とともに一貫性のあるトピックへと進化する傾向にあります。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:07:02 GMT)
Mind the Missing: Variable-Aware Representation Learning for Irregular EHR Time Series using Large Language Models [0.7] VITAL(VITAL)は、不規則にサンプリングされた生理的時系列から学習するのに適した可変対応大規模言語モデル(LLM)ベースのフレームワークである。
言語空間に重要な記号をリプログラミングし、LLMが時間的文脈を捉え、欠落した値に対する推論を可能にする。
高レベルの欠如の下では堅牢なパフォーマンスを維持しており、これは実際の臨床シナリオでよく見られる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:44:16 GMT)
U-MAN: U-Net with Multi-scale Adaptive KAN Network for Medical Image Segmentation [0.6] マルチスケール・アダプティブ・カン(U-MAN)は、新しいコルモゴロフ・アルノルドネットワーク(KAN)を強化する新しいアーキテクチャである。
PAGFモジュールは単純なスキップ接続を置き換え、エンコーダとデコーダのヒューズ機能に注意を払っています。
MANモジュールにより、ネットワークは複数のスケールで機能を適応的に処理し、さまざまなサイズのオブジェクトを分割する能力を向上させることができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:02:13 GMT)
"She was useful, but a bit too optimistic": Augmenting Design with Interactive Virtual Personas [0.6] 本稿では,対話型バーチャルペルソナ(IVP)について紹介する。マルチモーダル,対話型ユーザシミュレーションにより,設計者がインタビュー,ブレインストーミング,フィードバックの収集をリアルタイムで行うことができる。
以上の結果から,ITPが情報収集を迅速化し,設計ソリューションを刺激し,迅速なユーザライクなフィードバックを提供する可能性が示唆された。
設計者は、バイアス、過度な最適化、真の利害関係者の入力なしに信頼性を確保することの難しさ、そしてIPPが人間のインタラクションのニュアンスを完全に再現できないことへの懸念を提起した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 00:50:33 GMT)
Towards Human-interpretable Explanation in Code Clone Detection using LLM-based Post Hoc Explainer [0.6] 本稿では,MLベースのコードクローン検出器による予測を解明するために,大規模言語モデルの文脈内学習機能を活用する新しい手法を提案する。
我々のアプローチは、正しい説明を98%まで与え、良い説明を95%提供することで、ポストホックな説明者として有望です。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:20:17 GMT)
Decoding quantum low density parity check codes with diffusion [0.6] 量子低密度パリティチェック符号におけるシンドローム測定から論理誤差を推定するための拡散モデルフレームワークを提案する。
マスク付き拡散デコーダは平均より正確で、しばしば高速であり、最悪の場合、他の最先端のデコーダよりも常に高速であることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:46:52 GMT)
Interfacing of an Optical Nanofiber with Tunably Spaced Atoms in an Optical Lattice [0.6] 我々は、可変間隔の光学格子を用いて、多数の原子の光ナノファイバーへの効率的な対面を実験的に実証した。
格子ビームとナノファイバーからの反射は、全ての運動自由度で密閉するトラップ電位を与える。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:43:18 GMT)
Rule-Based Reinforcement Learning for Document Image Classification with Vision Language Models [0.6] 文書画像分類におけるルールベース強化学習の効果について検討する。
強化学習は、分布外データよりも一般化能力が高い傾向にある。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:46:24 GMT)
Machine Unlearning for Speaker-Agnostic Detection of Gender-Based Violence Condition in Speech [0.5] ジェンダーベースの暴力は、女性のメンタルヘルスに深刻な影響を及ぼす公衆衛生上の問題である。
本研究は、性別による暴力被害者を音声から検出するための話者非依存的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:32:26 GMT)
A Nonparametric Discrete Hawkes Model with a Collapsed Gaussian-Process Prior [0.5] ベースラインと励起の両方にガウス過程を優先する非パラメトリックフレームワークを提案する。
これにより、所定の傾向、周期性、または崩壊形を伴わないスムーズなデータ適応構造が得られる。
シミュレーションでは、GP-DHPは多様な励起形状を復元し、ベースラインを進化させる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:23:57 GMT)
Model Context Protocol for Vision Systems: Audit, Security, and Protocol Extensions [0.5] Model Context Protocol (MCP) は、エージェントとツールのインタラクションのためのスキーマ境界実行モデルを定義する。
これは、ビジョンシステムにおけるMPPのデプロイメントスケール監査である、最初のプロトコルレベルである。
我々は,9次元の合成忠実度にアノテートされた91個の視覚中心型MPPサーバを解析した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:20:08 GMT)
Evaluation of A National Digitally-Enabled Health Promotion Campaign for Mental Health Awareness using Social Media Platforms Tik Tok, Facebook, Instagram, and YouTube [0.5] メンタルヘルス障害は、世界の疾病の重荷に寄与する10の要因のうちの1つである。
本研究は,シンガポールにおけるデジタル型メンタルヘルス推進キャンペーンの有効性について検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:13:58 GMT)
Neural Orchestration for Multi-Agent Systems: A Deep Learning Framework for Optimal Agent Selection in Multi-Domain Task Environments [0.5] マルチドメインタスク環境における最適なエージェント選択のためのニューラルネットワークフレームワークであるMetaOrchを提案する。
ファジィ評価モジュールは、完全性、妥当性、信頼度に沿ってエージェント応答をスコアし、オーケストレータを訓練するためのソフトインスペクタラベルを生成する。
異種剤を用いた模擬環境実験により, 提案手法が86.3%の選択精度を達成できた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:28:11 GMT)
A Sparse $Z_2$ Chain Complex Without a Sparse Lift [0.4] スパース$Z$連鎖複体(3つの異なる次数を持ち、量子コードに対応するように)を構築する。
整数に対するスパースリフトを認めず、Ref. 1の質問に答える。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:19:23 GMT)
Pushing Toward the Simplex Vertices: A Simple Remedy for Code Collapse in Smoothed Vector Quantization [0.4] ベクトル量子化は連続ベクトル空間を有限な代表ベクトルの集合(コードブック)に離散化する
滑らかなベクトル量子化は、コードブックベクトルのハードな割り当てを、コードブックエントリの重み付けの組み合わせに緩和することでこの問題に対処する。
離散画像の自動符号化やコントラスト音声表現学習を含む代表的ベンチマーク実験により,提案手法がより信頼性の高いコードブック利用を実現することを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:17:42 GMT)
Forecasting the Future with Yesterday's Climate: Temperature Bias in AI Weather and Climate Models [0.3] 我々は、AI気象モデルと気候モデルにおける冬の冬の土地温度バイアスを分析する。
いずれのモデルも,予測期間よりも15~20年早く,寒冷な平均気温を発生させることがわかった。
アメリカ合衆国東部など一部の地域では、この予測は20-30年前の気候に似ている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:55:29 GMT)
Geometry aware inference of steady state PDEs using Equivariant Neural Fields representations [0.3] 本稿では,幾何的変動を考慮した定常PDEの予測手法であるenf2enfを紹介する。
本手法は,特定空間に固定された遅延特徴にジオメトリを符号化し,ネットワーク全体の局所性を保存する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:06:23 GMT)
Representing LLMs in Prompt Semantic Task Space [0.2] 大規模言語モデル(LLM)は様々なタスクに対して印象的な結果をもたらす。
与えられたタスクに対して最高のパフォーマンスのLLMを特定することは、大きな課題です。
この研究は、プロンプトのセマンティックタスク空間内でLLMを線形作用素として表すための効率的で訓練のないアプローチを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:48:10 GMT)
Zubov-Net: Adaptive Stability for Neural ODEs Reconciling Accuracy with Robustness [0.2] 本稿ではZubovNetという適応型安定学習フレームワークを提案する。
本稿では,PRoAsを直接最適化することで,ロアの形状を積極的に制御する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:01:51 GMT)
Safety and Security Analysis of Large Language Models: Benchmarking Risk Profile and Harm Potential [0.2] 本研究は,9大言語モデル(LLM)の実証分析とリスクプロファイルを提供する。
RSIはアジャイルでスケーラブルな評価スコアであり、セキュリティ姿勢を定量化し比較し、LLMのリスクプロファイルを作成する。
この研究は、テストされたLLMの安全性フィルタの広範な脆弱性を発見し、より強力なアライメント、責任あるデプロイメントプラクティス、モデルガバナンスの必要性を強調している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:00:08 GMT)
Robust semi-parametric signal detection in particle physics with classifiers decorrelated via optimal transport [0.2] 我々は、信号リッチ化ステップを使用して、信号リッチサンプル上で信号検出テストを行う。
その結果, 脱相関法は中程度の背景不特定性に対して頑健であることが判明した。
我々は、デコレーションと信号の富化が安定的で、堅牢で、有効で、より強力なテストを生み出すと結論付けている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:54:20 GMT)
APTx: better activation function than MISH, SWISH, and ReLU's variants used in deep learning [0.1] 活性化関数はディープニューラルネットワークに非線形性をもたらす。
本稿では,MISHに類似した動作を行うアクティベーション関数 APTx を提案する。
APTxのより少ない計算要件は、モデルのトレーニングを高速化し、深層学習モデルのハードウェア要件を低減します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:16:00 GMT)
Security Degradation in Iterative AI Code Generation -- A Systematic Analysis of the Paradox [0.1] 本稿では,400個のコードサンプルを用いた制御実験により,AI生成コードのセキュリティ劣化を解析する。
たった5回のイテレーションで,致命的な脆弱性が37.6%増加したことが分かりました。
これらのリスクを軽減するための実践的ガイドラインを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:44:27 GMT)
The Cost of Secure Restaking vs. Proof-of-Stake [0.1] リスク要件の観点から,セキュアな再試行とProof-of-Stakeプロトコルの効率を比較検討する。
このような再帰グラフをセキュアなPoSプロトコルに変換することは,常に可能であることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:54:43 GMT)
Average-computation benchmarking for local expectation values in digital quantum devices [0.1] 対象の計算をその変種と組み合わせ、平均化すると古典的に解ける相関関数を実現できるスキームを導入する。
この変種は、ゲートを古典的にシミュレート可能なセットに単純化することなく、回路構造と深さを正確に保存する。
平均計算期待値の推定には,限られた数の異なる回路の実現しか必要としないことを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:35:50 GMT)
Bridging Quantum Noise and Classical Electrodynamics with Stochastic Methods [0.1] 量子光学における新興技術の発展は、量子効果を忠実に捉える正確なモデルを必要とする。
We developed a framework based on process with a common cross-covariance structure which can be coupled to various type of Maxwell solver。
この結果は、複雑なフォトニック環境下での非古典的な光をシミュレートするための調整プロセスの可能性を強調した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:14:33 GMT)
An LLM-Powered Agent for Real-Time Analysis of the Vietnamese IT Job Market [0.1] 我々は、AI Job Market Consultantを紹介します。これは、労働市場から直接、リアルタイムに、深く、データ駆動的な洞察を提供する、会話エージェントです。
私たちのシステムの中核は、ReActエージェントフレームワークに基づいたツール拡張AIエージェントです。
プロトタイプは3,745件の求人情報を収集し分析した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:03:12 GMT)
A Longitudinal Randomized Control Study of Companion Chatbot Use: Anthropomorphism and Its Mediating Role on Social Impacts [0.1] 社会人工知能(AI)エージェントとの関係が高まりつつある。
人々は友人関係、メンターシップ、そしてReplikaのようなチャットボットとのロマンチックなパートナーシップを報告します。
人間とAIの相互作用が人間とAIの相互作用にどう影響するかは、人々の社会的要求状態とAIエージェントの人為的類型が関与する可能性がある。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:44:25 GMT)
NarrLV: Towards a Comprehensive Narrative-Centric Evaluation for Long Video Generation [0.1] 長いビデオ生成タスクの目標は、ビデオの長さを延ばすだけでなく、長いビデオの中でよりリッチな物語コンテンツを正確に表現することである。
提案するNarrLVは,Long Video生成モデルのナラティブ表現能力を総合的に評価する最初のベンチマークである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:21:12 GMT)
Active Leakage Cancellation in Single Qubit Gates [0.1] 我々は、アクティブリークキャンセルを導入することにより、最先端のシングルキュービットゲートを強化する。
本手法を超伝導トランスモン量子ビットに適用し,10~5ドル以下でのリークを抑制する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:54:16 GMT)
Universality of Shallow Global Quenches in Critical Spin Chains [0.0] 本研究では,2種類の容易にアクセス可能な初期条件から局所可観測体の力学について検討する。
いずれの場合も、普遍的なスケーリングの崩壊とスケーリング関数を識別する。
有限温度クエンチに対しては、共形場理論の結果が回復される状態を決定する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:00:00 GMT)
VizGen: Data Exploration and Visualization from Natural Language via a Multi-Agent AI Architecture [0.0] VizGenはAIによるグラフ生成システムで、ユーザーが自然言語を使って意味のある視覚化を作成できるようにする。
マルチエージェントアーキテクチャ上に構築されたVizGenのハンドレスql生成、グラフ生成、カスタマイズ、洞察抽出。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:31:00 GMT)
VibeCodeHPC: An Agent-Based Iterative Prompting Auto-Tuner for HPC Code Generation Using LLMs [0.0] VibeCode HPCはマルチエージェントロールアロケーションと反復的なプロンプトリファインメントを通じてプログラムをチューニングする。
エージェントの動的配置とアクティビティモニタリング機能を導入し,効率的なマルチエージェントコラボレーションを実現する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:54:13 GMT)
Urban Green Governance: IoT-Driven Management and Enhancement of Urban Green Spaces in Campobasso [0.0] カンポバッソ市のスマートグリーンシティのユースケースは、グリーン都市部の持続可能な管理のための革新的なモデルである。
このプロジェクトはIoTシステムとデータ駆動型ガバナンスプラットフォームを統合し、木や緑地の健康状態のリアルタイム監視を可能にする。
クラウドベースのプラットフォームは、グリーンアーバンマネージャ、技術専門家、運用スタッフのための総合的なリアルタイム意思決定をサポートする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:45:07 GMT)
Universal and Efficient Quantum State Verification via Schmidt Decomposition and Mutually Unbiased Bases [0.0] 任意の多部純量子状態を検証する普遍的プロトコルを提案する。
局所次元に依存しないサンプル複雑性の普遍的な上限を確立する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:39:39 GMT)
Two classes of quantum spin systems that are gapped on any bounded-degree graph [0.0] 変換不変量子スピンハミルトニアンを非可換相互作用を持つ一般グラフ上で研究する。
我々は、ハミルトニアンが大きな局所次元において高い確率を持つ任意の有界グラフ上でギャップを持つことを証明する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:57:27 GMT)
Tunable optical lattices for the creation of matter-wave lattice solitons [0.0] 光学格子中の明るい物質波ソリトンを生成・研究するために,動的に調整可能な間隔を持つ光アコーディオン格子を用いた実験手法を提案する。
格子間隔に調整された格子パラメータのキャリブレーション法を詳述し、マイクロ波アドレス化によるサイト分解原子番号の調製を実演する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:19:02 GMT)
TrueGradeAI: Retrieval-Augmented and Bias-Resistant AI for Transparent and Explainable Digital Assessments [0.0] TrueGradeAIは、従来の紙ベースの評価の欠点を克服するために設計された、AI駆動のデジタル検査フレームワークである。
このシステムは、セキュアなタブレット上でスタイラス入力による自然な手書き文字のキャプチャと、トランスフォーマーベースの光文字認識を転写に応用する。
評価は、教員ソリューション、キャッシュ層、外部参照を統合した検索強化パイプラインを通じて行われる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:00:36 GMT)
Transfer learning for multifidelity simulation-based inference in cosmology [0.0] ダークマターのみのN$-bodyシミュレーションの事前トレーニングは、高忠実度流体力学シミュレーションの必要な回数を8ドルから15ドルに削減する。
より安価なシミュレーションを活用することで,計算コストを大幅に削減しつつ,高忠実度モデルの性能と高精度な推論を可能にする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:47:28 GMT)
Towards reconstructing quantum structured light on a quantum computer [0.0] 測定データから量子状態を再構成するための変分量子コンピューティング手法を提案する。
再構成コスト関数をイジングモデルにマッピングすることにより、現在の量子ハードウェア上の変分固有解器を用いて問題を解くことができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:04:23 GMT)
Toward a Physics of Deep Learning and Brains [0.0] 生体脳における神経細胞の雪崩を記述するために用いられる方程式は、深部神経ネットワークにおける活動のカスケードにも適用可能であることを示す。
この理論的枠組みは、普遍的な特徴が生物学的ニューラルネットワークと人工ニューラルネットワークの両方で共有されていることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:59:57 GMT)
The system of processing and analysis of customer tracking data for customer journey research on the base of RFID technology [0.0] 本稿では,RFID技術に基づく追跡データの処理と解析を行うシステムの研究に焦点をあてる。
追跡データとトランザクションデータの統合は、小売を正確でデータ駆動の科学に変える基盤を作る。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:20:18 GMT)
The quantum XY chain with boundary fields: finite-size gap and phase behavior [0.0] 逆場における有限サイズの1次元量子XY鎖について検討する。
我々は、(M)相(Delta sim e-aL$)、(MI)相(Delta sim L-2$)、(K)相(Delta sim L-2 f_KI(L)$)、および(KI)相(Delta sim L-2 f_KI(L)$)を求める。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:38:06 GMT)
The STAR-XAI Protocol: A Framework for Inducing and Verifying Agency, Reasoning, and Reliability in AI Agents [0.0] 大きな推論モデルの「ブラックボックス」の性質は、信頼性と透明性の限界を示す。
本稿では,信頼性の高いAIエージェントをトレーニングし,運用するための新たな運用方法論であるSTAR-XAIプロトコルを紹介する。
我々の方法は、明示的で進化する象徴的ルールブックによって支配される構造化ソクラテス的対話として、人間とAIの相互作用を再編成する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:49:26 GMT)
The Outputs of Large Language Models are Meaningless [0.0] 我々は,大規模言語モデル (LLM) の出力が無意味であるという結論を論じる。
我々の主張は、2つの重要な前提に基づいている: (a) LLMの出力が文字通りの意味を持つために、ある種類の意図が必要とされること、そして (b) LLMが正しい種類の意図を持つことができないこと。
論文は、たとえ議論が健全であっても、LLMの出力が意味のあるように見え、真の信念や知識を得るのに使用できる理由を論じて締めくくる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:21:22 GMT)
The AI_INFN Platform: Artificial Intelligence Development in the Cloud [0.0] AI_INFNは、INFNユースケースにおける機械学習技術の採用を促進することを目的としている。
我々はGPUによるデータ分析プラットフォームのコミッタリングについて更新する。
このセットアップは、異なるリソースプロバイダ間でLHCを管理することができる。
最初のテスト結果、新しいケーススタディ、統合シナリオが提示されます。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:40:51 GMT)
The 2T-quoctit: a two-mode bosonic qudit for high energy physics [0.0] 本研究では,非アベリア群構造型コヒーレント状態の星座内のクオクタイトの2モードボソニック符号化について検討した。
この研究は、素粒子物理学における非アーベル対称性の重要性と、非アーベル論理ゲートを持ちたいという欲求によって動機付けられている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:23:15 GMT)
Temporal-Aware Iterative Speech Model for Dementia Detection [0.0] 音声を用いた認知症自動検出の現在の手法は,静的,時間に依存しない特徴や集約された言語コンテンツに依存している。
本稿では,認知症検出のための自然発話を動的にモデル化するテンポラル・アウェア・イテレーティブ・フレームワークであるTAI-Speechを紹介する。
私たちの研究は、より柔軟で堅牢な認知評価ソリューションを提供し、生のオーディオのダイナミクスを直接操作します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:56:07 GMT)
Teaching AI to Feel: A Collaborative, Full-Body Exploration of Emotive Communication [0.0] Commonaiverseは、フルボディのモーショントラッキングとリアルタイムAIフィードバックを通じて人間の感情を探索するインタラクティブなインストールである。
この協調的、アウト・オブ・ザ・ボックス(out-of-of-the-box)アプローチが、マルチメディア研究を、より具体化され、共創された感情的AIのパラダイムへと押し上げる方法について論じる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:28:56 GMT)
TRUSTCHECKPOINTS: Time Betrays Malware for Unconditional Software Root of Trust [0.0] 信頼の根源を確立するための現在のアプローチは秘密鍵や特別なセキュアなハードウェアに依存している。
TRUSTCHECKPOINTSは、正式なモデルに基づいて信頼の無条件ソフトウェアルートを確立する最初のシステムである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:27:48 GMT)
Supervised Machine Learning for Predicting Open Quantum System Dynamics and Detecting Non-Markovian Memory Effects [0.0] オープン量子システムのダイナミクスを予測し,非マルコフメモリを検出するための,エンフノベルでスケーラブルな教師付き機械学習フレームワークを提案する。
過去の補足データの短いスライディングウィンドウでトレーニングされたフィードフォワードニューラルネットワークは、状態トモグラフィや風呂の知識のない観測可能なシステム$langle Z_(S)(t)rangle$を予測する。
メモリの定量化のために、Emphpredicted $langle Z_(S) において上向きの 'ターンバック' をカウントする正規化再生基準を導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:40:44 GMT)
Student Engagement with GenAI's Tutoring Feedback: A Mixed Methods Study [0.0] 本研究の目的は,(1) 学生が学習のフィードバックコンポーネントに関わったときにどう思うかを明らかにすること,(2) フィードバックコンポーネント,学生の視覚的注意,言語的思考,および問題の解決プロセスの一環としての即時行動との関係を探索することである。
380のフィードバックコンポーネントを取り入れた学生の思考の分析から,学生は理解や意見の相違,追加情報が必要,学生はフィードバックを明確に判断する4つの主要なテーマが明らかになった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:17:20 GMT)
Statistical Advantage of Softmax Attention: Insights from Single-Location Regression [0.0] 大規模言語モデルにおける代替案に対するソフトマックスの優位性について検討する。
ソフトマックスがベイズリスクを達成するのに対し、線形注意は基本的に不足していることを示す。
勾配に基づくアルゴリズムによる最適化の関連について論じる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:21:30 GMT)
Solving Free Fermion Problems on a Quantum Computer [0.0] 計算コストを大幅に削減した量子アルゴリズムにより解くことができる自由フェルミオン問題をいくつか提示する。
メモリコストは指数関数的に改善され、poly log$(N)$である。
シミュレーションアルゴリズムは,自由なボソンシステムを含む他の有望な対象に一般化可能であることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:46:03 GMT)
Software Engineering Data Analytics: A Framework Based on a Multi-Layered Abstraction Mechanism [0.0] このフレームワークはドメイン固有の演算子で構成される多層抽象機構に準拠している。
ケーススタディを用いて,このアプローチの可能性を紹介した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:06:12 GMT)
Smart Medical IoT Security Vulnerabilities: Real-Time MITM Attack Analysis, Lightweight Encryption Implementation, and Practitioner Perceptions in Underdeveloped Nigerian Healthcare Systems [0.0] 医療用IoT(mIoT)デバイスにおけるセキュアでない無線通信は、患者のデータをサイバー脅威に晒す。
本研究では,この脆弱性をMITM攻撃シミュレーションを用いて調査し,低コストデバイス上での軽量AES-128暗号の評価を行った。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:45:16 GMT)
Simultaneous Quantization and Reduction of Constrained Systems [0.0] 本稿では,制約量子系の量子化のための新しい枠組みを提案する。
量子化と制約執行のプロセスを同時に行う。
制約量子系に対する統一的な変分原理に加えて、形式主義は真空変動に起因する量子効果に関する情報理論的な視点も提供する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:42:19 GMT)
Short Blocklength Error Correction Codes for Continuous-Variable Quantum Key Distribution [0.0] 本稿では,連続可変量子鍵分布系における2段階誤り訂正方式を提案する。
短いブロック長(1000ビット)の誤り訂正符号を使用することで、140kmの距離で秘密鍵レートを最大7.3倍に向上させることができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:44:11 GMT)
Self-Speculative Biased Decoding for Faster Live Translation [0.0] Self-Speculative Biased Decodingは、一貫して成長する入力ストリームに対して、スクラッチから繰り返し出力を生成するのを避けるために設計された、新しい推論パラダイムである。
提案手法は,従来の自己回帰的再翻訳に比べて,品質を損なうことなく最大1.7倍の高速化を実現する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:13:37 GMT)
Searching for Bloch wave packets with almost definite momentum direction [0.0] ブロッホ波のパケットが一定の-またはほぼ--運動量方向を維持することができるかどうかを検討する。
この問題は、量子バックフローの最初の実現を探索するために固体系システムを使用することの可能性に関係している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:53:52 GMT)
Sachdev-Ye-Kitaev Model in a Quantum Glassy Landscape [0.0] ボソン-フェルミオン結合は、量子スピングラス相の安定性を高めることを示す。
特に、量子スピングラス相では、虚時力学はギャップ位相の高速指数減衰特性からはるかに遅いダイナミクスへと変換される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 22:19:20 GMT)
Quantum topological data analysis algorithm for dynamical systems [0.0] 本稿では,力学系の特性を決定するための量子フレームワークを提案する。
量子アルゴリズム、特に量子ODEソルバと量子トポロジカルデータ解析における最近の多くの進歩を組み合わせる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:04:16 GMT)
Quantum sensing of a quantum field [0.0] 2レベル原子と相互作用させることにより、コヒーレント量子化場の振幅が推定されることを示す。
どちらの気象シナリオにおいても、原子プローブの減少状態の量子フィッシャー情報(QFI)に焦点を当てる。
大振幅$alpha$の極限において、QFIはその最大値が$tau =O(1)$および$tau =O(alpha2)$で1.47$に達し、また、ずっと後の周期的復活を示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:56:54 GMT)
Quantum reflection time and the Goos-Hänchen effect [0.0] 反射波パケットの運動の追従と散乱電位による粒子に課される空間遅延の量子的測定の類似性について検討する。
このような遅延を時間に換算すると「負の時間」となり、避けられることが示されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:46:36 GMT)
Quantum internal vibrations in macroscopic systems with classical centers of mass [0.0] 科学界のかなりの部分は、古典力学は量子力学から生じる効果的な理論であるという考えを支持している。
我々のモデルは、(古典的な質量中心を持つ)マクロ系が量子内部振動を吸収することを防ぐものではないことを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:48:38 GMT)
Quantum Measurement Trees, II: Quantum Observables as Ortho-Measurable Functions and Density Matrices as Ortho-Probability Measures [0.0] 有限次元空間 $ Cn $ の量子状態が与えられたとき、量子可観測体の可能な値の範囲は通常、対応するエルミート行列の固有値の離散スペクトルと同一視される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:43:51 GMT)
Quantum Complexity and Chaos in Many-Qudit Doped Clifford Circuits [0.0] 奇素次元$d$のクォーディットに作用するドッピングクリフォード回路における量子複雑性とカオスの出現について検討する。
ドッピングされたクリフォード・ウィンガルテン計算とレプリカテンソルネットワーク形式を用いて、正確な結果を導き、大規模シミュレーションを行う。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:05:23 GMT)
Quantum Chaos and Universal Trotterisation Behaviours in Digital Quantum Simulations [0.0] デジタル量子シミュレーション(DQS)は、量子プロセッサの最初の有用な実世界のアプリケーションを実現するための最も有望な道の1つである。
Trotterisationは現在、最先端のリソーススケーリングを提供している。
トロッタライズド・アイジングの最近の理論的研究は、予想よりも優れた性能が、明確なブレークスルーしきい値まで実現可能であることを示唆している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 03:14:15 GMT)
Proposal of method to solve a Traveling Salesman Problem using Variational Quantum Kolmogorov-Arnold Network [0.0] トラベルセールスマン問題(TSP)は、多くのグループが解決しようとしている最適化問題の1つである。
本稿では,変分量子コルモゴロフ・アルノルドネットワーク(VQKAN)を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:05:44 GMT)
Propagation Dynamics and Transient Amplification in Warm and Cold Atomic EIT Systems [0.0] 電磁誘導透過(EIT)を示す原子系における過渡増幅の観測限界について検討する。
単一原子,空間的均一なOBE処理は,伝播ダイナミクスを無視することで利得を過大評価することを示した。
以上の結果から, OBE予測と実験観測の相違が説明され, 低温・熱膨張EIT媒体における過渡的な利得の限界が確立された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:31:26 GMT)
Probing metric fluctuations with the spin decoherence of a particle in a quantum simulation [0.0] ディラックフェルミオンと相互作用する(2+1)Dの巨大重力玩具モデルは、特定の時空変動をサポートすることができる。
我々は、フェルミオンのスピンが時空のゆらぎと結合していることによる進化に焦点を当てる。
このシステムのエミュレーションには、原子の電子状態においてスピン自由度を符号化することが含まれる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:19:39 GMT)
Probing high-frequency gravitational waves with entangled vibrational qubits in linear Paul traps [0.0] 我々は、$N$振動量子ビットの絡み合いによって信号の確率が$N2$になることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:22:29 GMT)
Probabilistic Consistency in Machine Learning and Its Connection to Uncertainty Quantification [0.0] ある種の自己整合MLモデルは,クラス条件付き確率分布と等価であることを示す。
この情報は、マルチクラスベイズ最適化の構築や、クラス割り当てにおける固有の不確実性を推定するタスクに十分である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 21:54:20 GMT)
Privacy in Distributed Quantum Sensing with Gaussian Quantum Networks [0.0] ガウスネットワークにおける分散量子センシングプロトコルのプライバシー特性について検討する。
最適化された完全に対称なガウス状態が、完全なプライバシーに急速に近づきつつあることを示す。
本研究は,実用的でプライベートな量子センシングプロトコルの開発への道を開くものである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:24:24 GMT)
Photons do not see entanglement (Entanglement, nonlocality, and the collapse of the wavefunction) [0.0] 絡み合いの背景にある考え方は、いかなる古典的現実主義の観点にも直感的ではない。
軌道角運動量(OAM)のローレンツ加速下での基準フレームにおける絡み合いの進化について検討した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:13:10 GMT)
Orbit dimensions in linear and Gaussian quantum optics [0.0] 量子状態の軌道の次元(ヒルベルト空間の多様体として)を研究する。
群のリー代数を利用して、軌道次元を計算する汎用的で簡単な方法を示す。
我々は、ガウスユニタリ群の下での軌道次元が非ガウス性証人となることを強調する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:57:46 GMT)
OpenAI's GPT-OSS-20B Model and Safety Alignment Issues in a Low-Resource Language [0.0] 本稿では,OpenAI の GPT-OSS-20b モデルで発見された脆弱性の集合を概説する。
私たちの仕事のコアモチベーションは、過小評価されたコミュニティからのユーザに対するモデルの信頼性に疑問を呈することです。
主要なアフリカの言語であるHausaを用いて、モデルの振る舞いにおけるバイアス、不正確さ、文化的不感を明らかにする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:14:54 GMT)
On the Incompatibility of Quantum State Geometry and Fuzzy Metric Spaces: Three No-Go Theorems [0.0] ファジィ距離空間が量子状態幾何学の本質的な特徴を捉えることができないことを示す。
第二に、量子状態空間からファジィ計量空間への距離保存埋め込みが存在しないことを証明する。
第三に、ファジィ論理は対称と非対称な概念の組み合わせを区別できない。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:58:46 GMT)
On a discrete version of the position-momentum commutation relation [0.0] 十分な次元のヒルベルト空間によって記述されたキューディットの場合、位置-運動量交換関係の離散バージョンが存在する。
連続パラメータとある種の離散コヒーレント状態に依存する離散変数ガウス状態の族を含むことを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:01:31 GMT)
Multimodal Recurrent Ensembles for Predicting Brain Responses to Naturalistic Movies (Algonauts 2025) [0.0] 本稿では,事前訓練されたビデオ,音声,言語埋め込みをfMRI時系列にマッピングする階層的マルチモーダル・リカレントアンサンブルを提案する。
トレーニングは複合的なMSE相関損失と、初期の知覚的堅牢性から後期関連領域に徐々に重点を移すカリキュラムに依存している。
このアプローチは、将来のマルチモーダル脳エンコーディングベンチマークのための単純で自然なベースラインを確立する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:29:40 GMT)
Multi-Qubit Gates by Dynamical Decoupling Implemented with IBMQ and 15NV Center in Diamond [0.0] ターゲット量子ビットに結合された中心量子ビットに印加された動的デカップリング(DD)パルス列を用いて高速な高忠実なマルチキュービットゲートを実現するためのプロトコルを示す。
このようにして、中心量子ビットとの本質的な相互作用を活用することにより、ターゲット量子ビットの状態を制御することができる。
この研究は、量子制御のための堅牢なハードウェアに依存しない戦略を提供し、中心ターゲットの量子ビット記述に適合する任意のシステムで実装することができる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:26:55 GMT)
Multi-Agent Reinforcement Learning for Greenhouse Gas Offset Credit Markets [0.0] 政府は企業に対して排ガス制限を課し、その限界を超える排ガスを罰することができる。
排ガス過剰は、二酸化炭素削減プロジェクトに投資する企業によっても相殺される可能性がある。
オフセット信用市場における有限エージェントナッシュ均衡を特徴付ける。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:25:07 GMT)
MonoCon: A general framework for learning ultra-compact high-fidelity representations using monotonicity constraints [0.0] 我々は、任意のトレーニング済みエンコーダに取り付けられた小さな単調多層パーセプトロン(MLP)ヘッドを使用する単純なフレームワークであるMonoConを提案する。
MonoConは、事実上無視可能なパフォーマンスコストで、堅牢で、ゆがみがあり、非常にコンパクトな埋め込みを学ぶ。
SNLI文類似性タスクにおいて, STSbスコアの限界縮小のために, 3.4倍のコンパクト化と1.4倍の頑健な表現を報告した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:54:40 GMT)
Modelling non-stationary extremal dependence through a geometric approach [0.0] 非定常極端依存は、環境データセットや財務データセットでよく見られる。
多変量極値モデリングへの最近のアプローチは幾何学的枠組みを用いており、そこでは、スケールされたサンプル雲の制限形状を通して、極依存性の特徴が推測される。
このフレームワークは、幅広い依存構造を捉えることができ、定常環境では様々な推論手順が提案されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:42:57 GMT)
Measurability in the Fundamental Theorem of Statistical Learning [0.0] 統計的学習の基本定理は、仮説空間がPAC学習可能であることと、そのVC次元が有限であることは同値である。
本稿では、実数 O-極小展開上で定義された仮説空間のPAC学習可能性について十分な条件を示す。
この仮説空間のクラスは、ReLUやシグモイド関数のようなよく用いられる活性化関数を使用する二項分類のためのすべての人工ニューラルネットワークをカバーする。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:35:54 GMT)
Malaysia's AI-Driven Education Landscape: Policies, Applications, and Comparative Insights for a Digital Future [0.0] この記事では、マレーシアのAI駆動型教育の展望について説明する。
教育、カリキュラムデザイン、管理、教師のトレーニングでAIアプリケーションをマップする。
マレーシアのAIリテラシーとパーソナライズドラーニングの進歩が注目されている。
勧告には、ガバナンスの強化、公平なインフラへの投資、民間とのパートナーシップの促進などが含まれる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 04:33:37 GMT)
Machine learning approaches to seismic event classification in the Ostrava region [0.0] チェコ北東部は、国内で最も地震の多い地域の一つである。
最も頻発する地震は、かつては強い鉱業活動があったため、鉱業によって引き起こされたものである。
鉱業活動の停止にもかかわらず、地雷による地震が発生している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:51:16 GMT)
Longitudinal and Multimodal Recording System to Capture Real-World Patient-Clinician Conversations for AI and Encounter Research: Protocol [0.0] 本研究は,マヨクリニックの外来内科で実施されている。
参加診療所への直接訪問患者を招待し、360度ビデオカメラで記録する。
訪問後、患者は共感、満足度、ペース、治療負担に関する調査を完了する。
2025年8月までに、36人の臨床医のうち35人(97%)と281人の患者のうち212人(75%)が同意した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:04:13 GMT)
Lightweight Learning for Grant-Free Activity Detection in Cell-Free Massive MIMO Networks [0.0] Grant-free random access (GF-RA) は、将来の無線ネットワークにおける大規模機械型通信(mMTC)のための有望なアクセス技術である。
本研究では、デバイスアクティビティ検出(AD)における課題に対処するために、教師付き機械学習技術を用いた効率性を検討する。
我々は,mMTC 用の GF-RA のアクティビティ検出に特化して設計された,新しい軽量なデータ駆動型アルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:46:04 GMT)
Leveraging Large Language Models for Robot-Assisted Learning of Morphological Structures in Preschool Children with Language Vulnerabilities [0.0] 言語療法士は、形態的構造を日常の相互作用やゲームベースの学習活動に組み込む。
このアプローチは、正確な言語知識と様々な形態素のリアルタイム生産を必要とする。
TalBotプロジェクトでは、Furhatの会話ロボットが単語検索ゲーム"Alias"を子供たちとプレイし、言語スキルを向上させるアプリケーションを開発した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:48:51 GMT)
Learn, Check, Test -- Security Testing Using Automata Learning and Model Checking [0.0] 外部通信インタフェースを用いたブラックボックスとしてのサイバー物理システムについて検討する。
まず、各プロトコルからモデルにコンテキスト情報をマッピングすることで、命題付きモデルにアノテートする。
基本的なセキュリティ要件に基づいて、一般的なセキュリティ特性を定義します。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:29:53 GMT)
Intuition emerges in Maximum Caliber models at criticality [0.0] 直観は学習のメタスタブルなフェーズとして現れ、将来の経路エントロピーに対する次のトーケン予測を批判的にバランスさせる。
この研究は、学習のメタスタブルなフェーズとして出現する原始的な直観を報告し、将来の経路エントロピーに対する次のトーケン予測を批判的にバランスさせる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:53:43 GMT)
Impact of Collective Behaviors of Autonomous Vehicles on Urban Traffic Dynamics: A Multi-Agent Reinforcement Learning Approach [0.0] 本研究では, 混合交通環境下での都市交通流に対する強化学習(RL)対応自動運転車(AV)の潜在的影響について検討した。
人間の運転者が選択した経路を走行し、最低旅行時間で目的地にたどり着く都市ネットワークを考える。
最適化目標のセットを定義するか、あるいはそれらが行動と呼ぶように、利己的、協力的、競争的、社会的、利他的、悪意的を定義します。
シミュレーションの結果,AVの走行時間は最大5%まで最適化され,AVの挙動によって人体運転者の走行時間に異なる影響が認められた。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:29:54 GMT)
Identifying Memory Effects in Epidemics via a Fractional SEIRD Model and Physics-Informed Neural Networks [0.0] 本研究では,数次SEIRD流行モデルにおけるパラメータ推定のための物理インフォームドニューラルネットワークフレームワークを開発した。
我々のフレームワークは、トレーニング可能なパラメータとして分のメモリオーダー$alpha$を学習し、同時に疫学レート$(beta, sigma, gamma, mu)$を推定する。
合成Mpoxデータを用いたテストでは, ノイズ下での$alpha$とパラメータの信頼性が確認された。一方, COVID-19への応用では, 最適な$alpha in (0, 1]$がメモリ効果を捉え, 従来のSEIRDモデルよりも予測性能を向上させることが示されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:41:11 GMT)
HyCoVAD: A Hybrid SSL-LLM Model for Complex Video Anomaly Detection [0.0] ビデオ異常検出(VAD)はインテリジェントな監視には不可欠だが、複雑な異常を識別することが大きな課題である。
マルチタスク SSL 時間解析器と LLM バリデータを組み合わせたハイブリッド SSL-LLM モデルである HyVAD を導入する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:20:06 GMT)
How to simulate magic state cultivation with around $8$ Clifford terms on average [0.0] 我々は,非クリフォード$d=5$マジックステート培養回路のシミュレーション方法を示す。
我々の結果は、内部構造を持つ運用関連の高い高いT$カウント量子回路のシミュラビリティに光を当てる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:39:22 GMT)
HierLight-YOLO: A Hierarchical and Lightweight Object Detection Network for UAV Photography [0.0] 本稿では,小型物体のリアルタイム検出を支援する階層的特徴融合と軽量モデルであるHierLight-YOLOを提案する。
本稿では階層型拡張経路集約ネットワーク(HEPAN)を提案する。
小さい物体検出ヘッドは、空間分解能をさらに高め、小さな物体(4ピクセル)検出に対処するために特徴融合を行うように設計されている。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:59:02 GMT)
Guiding Evolution of Artificial Life Using Vision-Language Models [0.0] マルチモーダル・ファンデーション・モデル(FM)でガイドされるオープン・エンド・ライクな検索手法であるASAL++を紹介する。
シミュレーションの視覚履歴に基づいて,第2のFMを用いて新たな進化目標を提案する。
1)1回の反復で1つの新しいプロンプトを一致させるシミュレーション(Evolved Supervised Targets: EST)と,(2)生成されたプロンプトのシーケンス全体(Evolved Temporal Targets: ETT)を一致させるシミュレーション(Evolved Supervised Targets: EST)である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:03:24 GMT)
Group Evidence Matters: Tiling-based Semantic Gating for Dense Object Detection [0.0] 本稿では,重畳誘起冗長性をグループエビデンスに変換する検出器非依存のポストプロセッシングフレームワークを提案する。
このフレームワークは再訓練を必要とせず、現代の検出器と統合する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:22:22 GMT)
Generative Logic: A New Computer Architecture for Deterministic Reasoning and Knowledge Generation [0.0] Generative Logic (GL) は、ユーザの公理的定義から始まる決定論的アーキテクチャである。
GLは予想を列挙し、正規化、型、CEフィルタを適用し、機械チェック可能な証明を自動的に再構築する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:33:45 GMT)
GS-2M: Gaussian Splatting for Joint Mesh Reconstruction and Material Decomposition [0.0] 3次元ガウススプラッティングに基づくマルチビュー画像からのメッシュ再構成と材料分解のための統一解を提案する。
以前の作業はこれらのタスクを別々に処理し、非常に反射的な表面を再構築するのに苦労した。
提案手法は, この2つの問題に対して, 描画深度と正規度に関する属性を協調的に最適化することによって対処する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:43:33 GMT)
From Roots to Rewards: Dynamic Tree Reasoning with Reinforcement Learning [0.0] 木に基づく推論を適応的なプロセスに変換する動的強化学習フレームワークを提案する。
これはProbTreeの確率的厳密さを維持しつつ、ソリューションの品質と計算効率の両方を改善している。
この研究は、確率的フレームワークの信頼性と現実の質問応答システムに必要な柔軟性のバランスをとる、木構造推論の新しいパラダイムを確立する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:43:14 GMT)
From Noise to Knowledge: A Comparative Study of Acoustic Anomaly Detection Models in Pumped-storage Hydropower Plants [0.0] 本稿では,水力発電プラントの予測保守を改善する手段として,音響に基づく異常検出手法の比較分析を行った。
時間領域と周波数領域の特徴を抽出する前に、ノイズの多い条件下での音響前処理における重要な課題に対処する。
オーストリアのRodundwerk IIポンプ保存プラントで実世界の2つのデータセットでテストされているLSTM AE、K-Means、OC-SVMの3つの機械学習モデルをベンチマークした。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:57:40 GMT)
Fracture Detection In X-rays Using Custom Convolutional Neural Network (CNN) And Transfer Learning Models [0.0] 骨骨折は、しばしば痛み、モビリティの低下、生産性の低下をもたらす、世界的な健康上の大きな課題となる。
従来の撮像法は、高コスト、放射線暴露、特殊解釈への依存に悩まされている。
我々は、カスタム畳み込みニューラルネットワーク(CNN)を用いたX線画像の自動破壊検出のためのAIベースのソリューションを開発した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 19:27:15 GMT)
Fractional Orbital Angular Momentum as a Quantitative Measure of Wave-Particle Duality [0.0] 相対論的ガウス電子ビームに対するディラック方程式の解は、発散ビームに対して、各電子のスピンはスピン行列と軌道角運動量作用素の両方からの分数的寄与の和であることを示した。
ここでは、分数軌道角運動量 (FOAM) は、系の粒子状特性を定量化する内在的な補体として、分数スピン角運動量 (FSAM) が系の波状特性の測度であると主張する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:55:31 GMT)
Forecasting the future development in quality and value of professional football players [0.0] 本稿では,予測精度と不確実性定量化手法に基づいて,説明可能な機械学習モデルを評価する。
予測精度は1年後の選手の質と価値を予測するためにモデルを訓練することで研究される。
概して、ランダム森林モデルは最も適したモデルである。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:51:52 GMT)
Feature- and process-based optimal control of quantum dynamics [0.0] 我々はマルコフ進化の下で、オープン量子プロセスのための特徴に基づく最適コヒーレント制御形式を開発した。
特徴量に基づく Krotov 最適化アルゴリズムの性能は、学習された初期推定場を選択することで改善できる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:27:26 GMT)
Fast Partition-Based Cross-Validation With Centering and Scaling for $\mathbf{X}^\mathbf{T}\mathbf{X}$ and $\mathbf{X}^\mathbf{T}\mathbf{Y}$ [0.0] 機械学習モデルの分割に基づくクロスバリデーションを大幅に高速化するアルゴリズムを提案する。
我々のアルゴリズムは、例えば、主成分分析(PCA)、主成分回帰(PCR)、隆起回帰(RR)、通常最小二乗(OLS)、部分最小二乗(PLS)のモデル選択に応用できる。
文献に見られる代替手段とは異なり、前処理によるデータの漏洩を避ける。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:33:09 GMT)
Extract-0: A Specialized Language Model for Document Information Extraction [0.0] 本稿では,文書情報抽出に特化して最適化された7ビリオンパラメータ言語モデルであるExtract-0を提案する。
Extract-0は、GPT-4.1 (0.457)、o3 (0.464)、GPT-4.1-2025 (0.459)を上回り、1000種類の文書抽出タスクのベンチマークで0.573の平均的な報酬を得る。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:34:43 GMT)
Exploring the Early Universe with Deep Learning [0.0] 来るべき正方形キロメアアレイ天文台(SKAO)は、イオン化エポック(EoR)中の中性水素の分布をマッピングする。
我々は,SKAOから期待される水素信号の2次元パワースペクトルから情報を抽出する最新の深層学習技術を開発した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 07:51:59 GMT)
Exploratory Semantic Reliability Analysis of Wind Turbine Maintenance Logs using Large Language Models [0.0] 本稿では、より複雑な推論タスクに現代大規模言語モデル(LLM)を活用する際のギャップについて論じる。
我々は,LLMを用いた探索的フレームワークを導入し,分類を超えて意味分析を行う。
以上の結果から,LSMは,テキスト情報や行動可能な専門家レベルの仮説を合成するためにラベル付けを超えて,強力な"信頼性共パイロット"として機能できることが示唆された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:00:20 GMT)
Exact solutions of open quantum Brownian motions on the real line for two-level systems [0.0] 古典拡散過程の量子アナログとしてのオープン量子ブラウン運動を外部環境との相互作用下で研究する。
2段階の内的自由度を持つ粒子の1次元進化に対する正確な解析解を導出する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:24:04 GMT)
Evaluating LLMs for Combinatorial Optimization: One-Phase and Two-Phase Heuristics for 2D Bin-Packing [0.0] 本稿では,Large Language Models (LLM) の最適化能力を評価するための評価フレームワークを提案する。
我々は,LLMと進化的アルゴリズムを組み合わせた体系的手法を導入し,解の生成と洗練を行う。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:19:22 GMT)
Entanglement and apparent thermality in simulated black holes [0.0] 量子ブラックホールの半古典的極限におけるホーキング放射の明らかな熱性について検討する。
事象地平線を隔てて2分割すると、モードの占有が明らかに熱フェルミ・ディラック分布に従うような密度行列が得られることを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:00:01 GMT)
Entanglement Hamiltonian for the massless Dirac field on a segment with an inhomogeneous background [0.0] 非均質な背景における質量を持たないディラック場に対する区間の絡み合いハミルトニアンについて検討する。
我々は、空間座標にのみ依存するワイル因子を通して、ワイルと平坦な計量と等価な計量のクラスに焦点を当てる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:40:56 GMT)
Enhancing Safety in Diabetic Retinopathy Detection: Uncertainty-Aware Deep Learning Models with Rejection Capabilities [0.0] 糖尿病網膜症(DR)は視覚障害の主要な原因である。
深層学習モデルは網膜画像からDRを特定することに成功している。
本稿では,不確実性を考慮したディープラーニングモデルにおいて,低信頼度予測を拒否する拒否機構を含む代替手法について検討する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:47:43 GMT)
Effectiveness of Large Multimodal Models in Detecting Disinformation: Experimental Results [0.0] 本研究では,偽情報の検出・緩和における大規模マルチモーダルモデルの可能性について検討する。
本稿では,GPT-4oモデルの高度な機能を活用し,マルチモーダルな偽情報検出手法を提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 14:07:06 GMT)
Dynamics and computation in linear open quantum walks [0.0] オープン量子ウォーク(英語: Open Quantum Walks、OQW)は、システムと環境との相互作用によって制御される量子ウォークの一種である。
このモデルでは、デフォーカスやデポーラ化といったランダムなユニタリな量子チャネルをどのように表現できるかを示す。
また,本モデルのための回路表現を用いたシミュレーションプロトコルを開発した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:21:01 GMT)
DragGANSpace: Latent Space Exploration and Control for GANs [0.0] この研究はStyleGAN、DragGAN、主成分分析(PCA)を統合し、GAN生成画像の遅延空間効率と制御性を向上させる。
画像操作のためのDrag-GANフレームワークにPCAをベースとした次元削減を組み込むことで、最適化効率を向上しつつ、性能を維持できることがわかった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 10:30:49 GMT)
Divide and Conquer based Symbolic Vulnerability Detection [0.0] 本稿では,シンボル実行と制御フローグラフ解析に基づく脆弱性検出手法を提案する。
提案手法では,無関係なプログラム情報を除去するために,分割・分散アルゴリズムを用いる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:47:52 GMT)
Delay in electronic vortex states created by multiphoton ionization with single elliptically polarized laser pulses [0.0] 光電子運動量分布における渦状構造は、1つの強い楕円偏光レーザーパルスと相互作用する原子に対して観察することができる。
これらの渦巻き構造は、2つの支配的な光電子渦状態の破壊的干渉の結果であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:24:00 GMT)
Deep Learning-Based Pneumonia Detection from Chest X-ray Images: A CNN Approach with Performance Analysis and Clinical Implications [0.0] 胸部X線画像から自動的に肺炎を検出するために,Conal Neural Networksを用いた複雑なディープラーニングシステムを提案する。
提案したCNNアーキテクチャは,分離可能な畳み込みやバッチ正規化,ドロップアウト正規化といった高度な手法を統合している。
精度、精度、リコール、F1スコアなどの複雑な評価指標の配列は、精度91の精度を記録して、モデル例外性能を総合的に検証する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:58:50 GMT)
Debiasing Large Language Models in Thai Political Stance Detection via Counterfactual Calibration [0.0] タイの政治は、間接的な言語、偏りのある人物、絡み合った感情とスタンスによって特徴付けられる。
低リソースで文化的に複雑な環境での政治的スタンスの検出は、大きな言語モデルにとって重要な課題である。
我々は、微調整を必要とせず、政治的偏見を緩和する、軽量でモデルに依存しないキャリブレーションフレームワークであるThaiFACTUALを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 06:26:21 GMT)
Cross-Linguistic Analysis of Memory Load in Sentence Comprehension: Linear Distance and Structural Density [0.0] 本研究では, 文レベルの記憶負荷が, 構文的に関連した単語間の線形近接や, 介在物の構造密度によってよりよく説明されるかを検討する。
複数の言語にまたがる調和した依存性ツリーバンクと混合効果フレームワークを用いて、分析は文の長さ、依存関係の長さ、インターベンタ複雑度をメモリ負荷測定の予測器として共同で評価する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:52:14 GMT)
Creative Adversarial Testing (CAT): A Novel Framework for Evaluating Goal-Oriented Agentic AI Systems [0.0] CAT(Creative Adversarial Testing)は、エージェントAIタスクとシステムの意図する目的との間の複雑な関係をキャプチャして分析するために設計された、新しいアプローチである。
我々は、Alexa+オーディオサービスに倣った合成相互作用データを用いて、CATフレームワークを広範囲にシミュレーションすることで検証する。
我々の結果は、CATフレームワークが目標とタスクのアライメントに関する前例のない洞察を提供し、エージェントAIシステムのより効率的な最適化と開発を可能にしていることを実証している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:52:20 GMT)
Cost-aware Photonic Graph State Generation: A Graphical Framework [0.0] フォトニックグラフ状態は、量子計算と通信に不可欠な資源である。
任意の大きさと形状のフォトニックグラフ状態を生成するためのコスト対応フレームワークを提案する。
このフレームワーク内では,2ビットゲートの使用量を大幅に削減する決定論的生成アルゴリズムであるGraph Builderを開発した。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:00:01 GMT)
Correlators in phase-ordering from Schrödinger-invariance [0.0] 位相秩序運動学を経る系は、完全に乱れた初期状態から0TT_c$の順序相へのクエンチ後に位相秩序運動学を行う。
雑音の初期条件によって決定される1時間と2時間の相関子の長時間の挙動は、シュル「オーディンガー不変性」から導かれる。
完全有限系と大域相関系のスケーリングを見つけ、低温の一般化 $lambda = d-2 ヤンセン=シャウブ=シュミットマンスケーリング関係の値が導出される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:05:37 GMT)
Convexity-Driven Projection for Point Cloud Dimensionality Reduction [0.0] 本稿では,点雲の次元的低減のための凸性駆動型除細動(CDP)を提案する。
CDPは、点雲の次元還元のための境界自由線形法である。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:25:12 GMT)
Construction and simulability of quantum circuits with free fermions in disguise [0.0] 自由フェルミオンを擬似的に収容する局所量子回路を階段とレンガ工で検討する。
我々の研究は、文学における最近の予想を証明し、偽装した自由フェルミオンの古典的シミュラビリティに関する新しい疑問を提起する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 17:04:27 GMT)
Constructing qubit edge states by inverse-designing the electromagnetic environment [0.0] 相互作用する量子ビットの連鎖を囲む周期的誘電体構造を逆設計し、拡張された二量化Su-Schrieffer-Heeger励起模型をエミュレートする。
提案手法により光子を介する相互作用の精密制御が可能となり, クビット鎖における位相的エッジ状態の出現を探索することができる。
この研究は、トポロジカルな励起状態の安定化における逆設計の可能性を強調し、先進的な量子技術への新たな可能性を開く。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 16:15:19 GMT)
Constrained Search in Imaginary Time [0.0] 本稿では,密度汎関数理論から純状態制約付き探索関数を評価するための仮想時間進化法を提案する。
固有状態の所定の密度を生成するポテンシャルを生じる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 15:22:20 GMT)
Compiling by Proving: Language-Agnostic Automatic Optimization from Formal Semantics [0.0] シンボル実行とグラフ構造のコンパイルにより全パス到達可能性証明を構築する。
我々は、多くの意味的な書き直しを単一のルールに集約し、建設による正確性を維持します。
我々はこれを言語に依存しないKフレームワークの拡張として実装する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 02:49:08 GMT)
Comparison of wave-mixing processes in rarefied gas and QED vacuum using numerical simulations [0.0] 真空中におけるレーザー誘起非線形量子電磁力学(QED)効果と競合する信号とを区別するために必要な条件について検討する。
希薄ガスの寄与は1D-1V フラソフ-マクスウェル系を用いて統計的にモデル化される。
真空非線形性はハイゼンベルク・オイラー効果の弱場展開の中で説明される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 20:20:02 GMT)
Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients [0.0] オートエンコーダやシームズネットワークのような人工ニューラルネットワークが、潜在空間において有意義な概念を符号化していることが実証されている。
本稿では,ニューラルネットワークの潜在空間におけるニューロンのクローズドフォーム解釈の枠組みを提案する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 09:33:03 GMT)
Classical and quantum chaotic synchronization in coupled dissipative time crystals [0.0] 2つのコヒーレント結合型散逸時間結晶のダイナミクスについて検討する。
古典的な場合と類似して、この挙動を量子カオス同期と解釈する。
古典的および量子的交叉の位置は互いに一致している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 12:46:46 GMT)
Beyond Token Limits: Assessing Language Model Performance on Long Text Classification [0.0] 我々は,XLM-RoBERTa,Longformer,GPT-3.5,GPT-4の5言語を対象に,比較Agendasプロジェクトのマルチクラス分類タスクについて実験を行った。
その結果、ロングフォーマーモデルには特に利点がなく、特にロングインプットを扱うために事前訓練されている。
クラスレベルの要因の分析は、長いテキスト入力のパフォーマンスに関して、特定のカテゴリ間のサポートと物質重なりが重要であることを示唆している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:22:03 GMT)
An rf-SQUID-based traveling-wave parametric amplifier with -84 dBm input saturation power across more than one octave bandwidth [0.0] トラベリングウェーブパラメトリック増幅器(TWPA)は、量子回路の読み出しと暗黒物質の探索に欠かせない道具となっている。
本稿では,rf-SQUIDをベースとした平均飽和電力-84dBmのJosephson TWPAの実装について報告する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 08:51:57 GMT)
All multipartite entanglements are quantum coherences in locally distinguishable bases [0.0] 多部量子系のm-分離性とk-粒子の絡み合いは、完全正則基底に関して同じ量子コヒーレンスと相関している。
多部量子状態のm-分離可能な絡み合いの幾何学的測度は、完全正則基底に対する状態の最小忠実度に基づく量子コヒーレンスの二乗に等しいことを示す。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 11:13:16 GMT)
Aircraft Trajectory Dataset Augmentation in Latent Space [0.0] 本稿では,航空機軌道データセット拡張のための新しいフレームワークであるATRADAを提案する。
提案フレームワークでは,トランスフォーマーエンコーダが元のトラジェクトリデータセットの下位パターンを学習する。
新しいサンプルは装着されたGMMから引き出され、サンプルの寸法は元の次元に戻され、サンプルは多層パーセプトロンで復号される。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:26:30 GMT)
Advancing Natural Language Formalization to First Order Logic with Fine-tuned LLMs [0.0] 予測可用性はパフォーマンスを15~20%向上させる。
モデルは特定の訓練をせずに、目に見えない論理的議論に一般化する。
構造論理の翻訳は堅牢であるが、述語抽出が主要なボトルネックとして現れる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 13:30:50 GMT)
AI Brown and AI Koditex: LLM-Generated Corpora Comparable to Traditional Corpora of English and Czech Texts [0.0] 本稿では,大言語モデル(LLM)を用いた英語とチェコ語のテキストのコーパスについて述べる。
その動機は、人文テキストとLLM生成テキストを言語的に比較するためのリソースを作成することである。
これらのリソースが多言語であり、トピック、著者、テキストタイプに富んでいることが強調された。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 23:11:17 GMT)
A theoretical basis for model collapse in recursive training [0.0] 生成モデルからのトレーニングは、シミュレーションされた確率分布のいわゆる「崩壊」につながることが知られている。
このノートは、外部ソース、どのようにマイナーであれ、サンプルにも貢献するかどうかによって、実際には2つの異なる振る舞いが得られていることを示している。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 18:37:11 GMT)
A Verified Compiler for Quantum Simulation [0.0] ハミルトンシミュレーションは量子コンピューティングの中心的な応用である。
ハミルトンシミュレーションをコンパイルするための高レベル、正式に検証されたフレームワークであるQBlueを紹介する。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 01:57:18 GMT)
A Large-Scale Dataset and Citation Intent Classification in Turkish with LLMs [0.0] まず、トルコ語による引用意図のデータセットを公開し、目的付けのアノテーションツールで作成する。
次に,Large Language Models (LLMs) を用いた標準インコンテキスト学習の性能評価を行い,手動で設計したプロンプトによる一貫性のない結果によってその効果が制限されることを示した。
最終分類には、複数の最適化されたモデルから出力を集約し、安定かつ信頼性の高い予測を保証するために、重ねられた一般化アンサンブルを用いる。
論文参考訳(メタデータ) (Fri, 26 Sep 2025 05:44:04 GMT)