Fugu-MT: arxivの論文翻訳(概要)

ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data [119.8]
ScaleCUAは、オープンソースのコンピュータ利用データとファンデーションモデルをスケーリングするためのステップである。 6つのオペレーティングシステムと3つのタスクドメインにまたがる大規模なデータセットを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:22 GMT)
A1: Asynchronous Test-Time Scaling via Conformal Prediction [112.5]
大規模な言語モデル(LLM)は、テスト時のスケーリングの恩恵を受けるが、既存のメソッドは重大な課題に直面している。 A1(非同期テスト時間スケーリング)は統計的に保証された適応推論フレームワークで、これらの課題に対処します。 A1は56.7倍のスピードアップと4.14倍のスループット向上を実現している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:55:09 GMT)
Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation [110.0]
本稿では,視覚領域に次世代の予測パラダイムを適用するメカニズムについて,初めて体系的に検討する。高レベルの視覚的意味論の学習を妨げる3つの重要な特性を同定する。これらの課題は、訓練中に自己指導的目的を導入することで効果的に対処できることが示される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:47:40 GMT)
A Survey of Reinforcement Learning for Large Reasoning Models [98.6]
大規模言語モデルによる推論のための強化学習の最近の進歩について LRMのためのRLのさらなるスケーリングは、計算資源だけでなく、アルゴリズム設計、トレーニングデータ、インフラにおいても課題に直面している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:28:02 GMT)
Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [96.5]
動的ポイントクラウド圧縮のためのFMT(Motion Transformation Feature)フレームワークを提案する。 FMTは明示的な運動ベクトルを連続時間変動を暗黙的にモデル化するアライメント戦略に置き換える。本手法は, 符号化効率と復号効率の両方でD-DPCCおよびAdaDPCCを上回り, 20%, 9.4%のBD-Rate還元を達成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:51:06 GMT)
Emulating Human-like Adaptive Vision for Efficient and Flexible Machine Visual Perception [93.2]
本稿では、"パッシブ"から"アクティブ"ビジョンモデルへのパラダイムシフトを促進するための一般的なフレームワークであるAdaptiveNNを紹介する。 AdaptiveNNは、視覚知覚を粗い連続的な意思決定プロセスとして定式化する。アダプティブNNは、大規模な視覚認識、きめ細かい識別、視覚検索、実際の運転と医療シナリオからの画像処理を含む、9つのタスクにまたがる17のベンチマークで評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:25:43 GMT)
MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [92.4]
モノのインターネットのタイムリーな更新は、車載メタバースサービスの没入を実現するために不可欠である。本稿では,フェデレーション学習による効率的なプライバシ保護データ提供を可能にする没入型モデルトレーディングフレームワークを提案する。実験の結果,提案手法は最先端のベンチマークよりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:54:17 GMT)
Lost in Translation? Vocabulary Alignment for Source-Free Domain Adaptation in Open-Vocabulary Semantic Segmentation [90.6]
VocAlignは、セマンティックセグメンテーションにおいてVLM用に特別に設計された、ソースフリーのドメイン適応フレームワークである。提案手法は,CityScapesデータセットの6.11mIoU改善を実現し,ゼロショットセグメンテーションベンチマークにおいて優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:58 GMT)
An Empirical Study of Federated Prompt Learning for Vision Language Model [89.3]
本稿では,言語プロンプト学習(VPT)と視覚プロンプト学習(VLM)の行動的差異を系統的に検討する。我々は、FPL(Federated Prompt Learning)の堅牢性を評価するために、クライアントスケール、集約戦略、即時長といった様々なFLと迅速な構成の影響を評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:36:50 GMT)
Pre-training under infinite compute [87.0]
本研究では、エポック数の増加とパラメータ数の増加に対するデータ制約によるアプローチが、最終的には過度に適合することを示す。独立に訓練されたモデルのアンサンブルは、正規化レシピよりもはるかに低損失の漸近を達成できる。この結果から,計算量の多い将来において,よりデータ効率の高い事前学習が実現できることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:36:23 GMT)
Examining False Positives under Inference Scaling for Mathematical Reasoning [84.0]
言語モデルにおける数学的問題解決における偽陽性解の有効性を体系的に検討する。実験結果から,(1)異なるモデル,データセット,復号化手法,(2)サンプリングベース推論時間スケーリング手法では問題を緩和できないこと,(3)pass@N評価基準の方が偽陽性の影響を受けやすいこと,などが明らかになった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:31:12 GMT)
Assistant-Guided Mitigation of Teacher Preference Bias in LLM-as-a-Judge [82.2]
AGDe-Judgeは、トレーニングデータのラベルとフィードバックの両方から疎外するように設計されたフレームワークです。 AGDe-Judgeは、6つの評価ベンチマークで高いパフォーマンスを維持しながら、教師の嗜好バイアスを効果的に低減します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:24:53 GMT)
Don't Forget the Nonlinearity: Unlocking Activation Functions in Efficient Fine-Tuning [82.2]
NoRAは、固定活性化を学習可能な有理関数に置き換え、構造化された低ランク更新を数値化係数と分母係数に適用する。 CIFAR-10とCIFAR-100で訓練された視覚変換器では、NoRAはパラメータのわずか0.4%を更新しながら完全な微調整に適合または超過する。 NoRAは低次元機能部分空間への適応を制約し、暗黙的に更新の規模と方向を規則化する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:46:37 GMT)
Lightweight and Accurate Multi-View Stereo with Confidence-Aware Diffusion Model [81.0]
本稿では,MVSに拡散モデルを導入する新しいMVSフレームワークを提案する。深度推定の識別特性を考慮し,拡散過程を導出する条件エンコーダを設計する。本稿では,新しいMVSフレームワークであるDiffMVSとCasMVSの2つの新しいMVS手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:19 GMT)
DiCoRe: Enhancing Zero-shot Event Detection via Divergent-Convergent LLM Reasoning [80.3]
DiCoReは、DreamerとGolderを使ってEDのタスクを分離する分散収束推論フレームワークである。我々は、DiCoReがゼロショット、トランスファーラーニング、推論ベースラインを一貫して上回っていることを実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:12:05 GMT)
How Good are Foundation Models in Step-by-Step Embodied Reasoning? [79.2]
身体的エージェントは、安全で空間的に整合性があり、文脈に根ざした決定をしなければならない。大規模マルチモーダルモデルの最近の進歩は、視覚的理解と言語生成において有望な能力を示している。私たちのベンチマークには、10のタスクと8のエボディメントにまたがる詳細なステップバイステップ推論を備えた1.1k以上のサンプルが含まれています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:56:30 GMT)
WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [78.6]
有効なWebエージェントに必要な重要な推論スキルを同定する。我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。このアプローチは、複数のベンチマークで大幅に改善される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:32:15 GMT)
SNaRe: Domain-aware Data Generation for Low-Resource Event Detection [77.3]
事象検出は、生物医学、法学、疫学のような高度に専門化された領域での推論を可能にするために重要である。 SNaReは、Scout、Narrator、Refinerの3つのコンポーネントから構成される、ドメイン対応の合成データ生成フレームワークである。 Scoutはラベルのないターゲットドメインデータからトリガーを抽出し、高品質なドメイン固有のトリガーリストをキュレートする。これらのトリガに条件付けされたナレーターは、高品質なドメイン整列文を生成し、Refinerは追加のイベント参照を識別する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:18:57 GMT)
Manipulation Facing Threats: Evaluating Physical Vulnerabilities in End-to-End Vision Language Action Models [76.6]
視覚言語行動モデル(VLAM)は、ロボット操作タスクのオープン語彙シナリオにおいて、より良いパフォーマンスを達成するために提案されている。本稿では,潜在的な物理的脅威に直面したVLAMを包括的に評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:36:42 GMT)
Evolving Language Models without Labels: Majority Drives Selection, Novelty Promotes Variation [74.8]
EVOL-RL(EVolution-Oriented and Label-free Reinforcement Learning)を提案する。 EVOL-RLは、多数投票された回答を安定したアンカーとして保持する(選択) 既に作られたもの(変種)と理性が異なる応答を好む斬新な報酬を加える。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:50:04 GMT)
OmniSegmentor: A Flexible Multi-Modal Learning Framework for Semantic Segmentation [74.6]
我々はOmniSegmentorと呼ばれる新しいマルチモーダル学習フレームワークを提案する。 ImageNetに基づいて、ImageNeXtと呼ばれるマルチモーダル事前学習のための大規模なデータセットを組み立てる。様々なシナリオにまたがってモデルの知覚能力を一貫して増幅する、普遍的なマルチモーダル事前学習フレームワークを導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:52:44 GMT)
HPGN: Hybrid Priors-Guided Network for Compressed Low-Light Image Enhancement [73.4]
本稿では,圧縮前と照明前の両方を統合することで,圧縮後低照度画像を強化するハイブリッド事前誘導ネットワーク(HPGN)を提案する。提案手法ではJPEG品質係数(QF)とDCT量子化行列をフル活用し,協調作業のための効率的なプラグアンドプレイモジュールの設計を指導する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:34:23 GMT)
Structural-Spectral Graph Convolution with Evidential Edge Learning for Hyperspectral Image Clustering [73.0]
ハイパースペクトル画像(HSI)クラスタリングは、アノテーションなしで同様のピクセルを同じクラスに割り当てる。既存のグラフニューラルネットワーク(GNN)は、入力されたHSIのスペクトル情報を十分に活用できない。グラフ構造化HSIスーパーピクセルに適した構造スペクトルグラフ畳み込み演算子(SSGCO)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:08:33 GMT)
TDRM: Smooth Reward Models with Temporal Difference for LLM RL and Inference [71.6]
我々は、よりスムーズで信頼性の高い報酬モデルを学ぶ方法であるTDRMを紹介する。この時間差正規化(TD)はスムーズな報酬を生み出し、長期的目標との整合性を改善する。実験の結果、TD訓練プロセス報酬モデル(PRM)はBest-of-N(最大6.6%)とツリーサーチ(最大23.7%)でのパフォーマンスを向上させることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:14:34 GMT)
Database-Augmented Query Representation for Information Retrieval [71.4]
データベース拡張クエリ表現(DAQu)と呼ばれる新しい検索フレームワークを提案する。 DAQuは、元のクエリを複数のテーブルにまたがるさまざまな(クエリ関連の)メタデータで拡張する。我々はDAQuを多様な検索シナリオで検証し、全体の検索性能を大幅に向上させることを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:11:49 GMT)
FlowRL: Matching Reward Distributions for LLM Reasoning [69.9]
大規模言語モデル(LLM)強化学習(RL)において、報酬を最大化する代わりに、フローバランシングによる全報酬分布をマッチングするフローRLを提案する。我々はスカラー報酬を学習可能な分割関数を用いて正規化対象分布に変換し、その後、ポリシーと対象分布との逆KL分散を最小化する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:56:36 GMT)
Ensembling Large Language Models for Code Vulnerability Detection: An Empirical Evaluation [69.8]
本研究では,ソースコードの脆弱性検出において,Large Language Models(LLM)の性能を高めるためのアンサンブル学習の可能性を検討する。脆弱性検出に適したスタック機能であるDynamic Gated Stacking (DGS)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:26:58 GMT)
Combo: Co-speech holistic 3D human motion generation and efficient customizable adaptation in harmony [69.2]
共同音声合成のための新しいフレームワークComboを提案する。特に、興味の生成モデルにおけるマルチインプット・マルチプル・アウトプットの性質として、基本的な課題があげられる。コンボは高品質な動きを生み出すのに非常に効果的であるが、アイデンティティや感情の伝達にも効果的である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:14:26 GMT)
Harnessing Multiple Large Language Models: A Survey on LLM Ensemble [67.4]
本稿では,LLM アンサンブルにおける最近の展開の体系的レビューを行う。本稿では, LLM アンサンブルの分類について紹介し, 関連するいくつかの研究課題について論じる。また、「アンサンブル前推論、アンサンブル後推論、アンサンブル後推論」という幅広いカテゴリの手法のより詳細な分類も提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:23:29 GMT)
Kuramoto Orientation Diffusion Models [67.1]
指紋やテクスチャなどのオリエンテーションに富んだ画像は、しばしばコヒーレントな角模様を示す。生体系における位相同期の役割を動機として,スコアベース生成モデルを提案する。一般的な画像ベンチマークで競合する結果を実装し,指紋やテクスチャなどの指向性データセットの生成品質を大幅に向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:18:49 GMT)
SAIL-VL2 Technical Report [65.5]
広義のマルチモーダル理解と推論のためのオープン・スイート・ビジョン・ファンデーション・モデル(LVM)であるSAIL-VL2を紹介する。 SAIL-VL2は2Bと8Bのパラメータスケールで様々な画像とビデオのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:10:25 GMT)
MapAnything: Universal Feed-Forward Metric 3D Reconstruction [63.8]
MapAnythingは1つ以上の画像を取り込み、カメラの内在性、ポーズ、深さ、部分的な再構築など、任意の幾何学的入力を行う。そして、メーター3Dシーンの幾何学とカメラを直接補強する。 MapAnythingは、単一のフィードフォワードパスで幅広い3Dビジョンタスクに対処する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:34:03 GMT)
A Multi-To-One Interview Paradigm for Efficient MLLM Evaluation [63.8]
効率的なMLLM評価のためのマルチツーワンインタビューパラダイムを提案する。本フレームワークは, (i) 事前面接と形式面接の2段階面接戦略, (ii) 公平性を確保するための重みの動的調整, (iii) 質問難度選択のための適応的メカニズムから構成される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:07:40 GMT)
Unique Security and Privacy Threats of Large Language Models: A Comprehensive Survey [63.5]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。プライバシーとセキュリティの問題は、そのライフサイクルを通じて明らかになっている。この調査は、潜在的な対策の概要と分析である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:08:36 GMT)
BiRQ: Bi-Level Self-Labeling Random Quantization for Self-Supervised Speech Recognition [63.5]
BiRQは、BEST-RQの効率とHuBERTスタイルのラベル拡張の強化の利点を組み合わせた、双方向SSLフレームワークである。提案手法は,960時間のLibriSpeech,150時間のAMIミーティング,5,000時間のYODASなど,さまざまなデータセットで検証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:09:29 GMT)
reWordBench: Benchmarking and Improving the Robustness of Reward Models with Transformed Inputs [63.4]
現状の報奨モデルでは, 入力変換が小さい場合でも, 大幅な性能劣化に悩まされていることを示す。同様のスコアをパラフレーズに割り当てるように明示的にトレーニングすることを提案するが、この手法は他の異なる種類の変換に対する堅牢性も向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:58:20 GMT)
ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation [62.6]
ForceVLAは、新しいエンドツーエンド操作フレームワークである。外部力センシングは、VLAシステム内の第一級のモダリティとして扱う。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:02:38 GMT)
LLM Jailbreak Detection for (Almost) Free! [62.5]
大規模言語モデル(LLM)は、広く使用されている場合、アライメントを通じてセキュリティを高めるが、ジェイルブレイク攻撃の影響を受けない。ジェイルブレイク検出方法は、他のモデルや複数のモデル推論の助けを借りて、ジェイルブレイク攻撃を緩和する。本稿では,入力に対する肯定的な指示を前提としたフリージェイルブレイク検出(FJD)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:42:52 GMT)
carps: A Framework for Comparing N Hyperparameter Optimizers on M Benchmarks [61.8]
carpsはComprehensive Automated Research Performance Studiesのベンチマークフレームワークである。我々は、ブラックボックス、マルチオブジェクト、マルチオブジェクト、マルチオブジェクトの4つの重要なタイプのHPOタスクに焦点をあてる。 5つのコミュニティベンチマークコレクションから336のタスクと28種類の9つのファミリーで、私たちはこれまでで最大のGotoライブラリを提供しています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:10:08 GMT)
ClearFairy: Capturing Creative Workflows through Decision Structuring, In-Situ Questioning, and Rationale Inference [59.7]
本稿では,行動・人工物・自己説明の認知的意思決定ステップに推論を関連づけるCLEARフレームワークを提案する。 ClearFairyはUI設計のための思考支援AIアシスタントで、弱い説明を検知し、軽量で明確な質問をし、知識共有の負担を軽減するために、根拠の欠如を推測する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:11:34 GMT)
SeCodePLT: A Unified Platform for Evaluating the Security of Code GenAI [58.3]
コード生成大型言語モデル(LLM)のセキュリティリスクと能力を評価するための既存のベンチマークは、いくつかの重要な制限に直面している。手動で検証し、高品質なシード例から始める、汎用的でスケーラブルなベンチマーク構築フレームワークを導入し、ターゲット突然変異を通じて拡張する。このフレームワークをPython、C/C++、Javaに適用すると、44のCWEベースのリスクカテゴリと3つのセキュリティ機能にまたがる5.9k以上のサンプルデータセットであるSeCodePLTが構築されます。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:12:07 GMT)
IV-tuning: Parameter-Efficient Transfer Learning for Infrared-Visible Tasks [57.9]
完全な微調整のパラダイムの下では、特徴空間は高度に制約され、低ランクとなり、これは深刻な一般化を損なうことが証明されている。本稿では,主観的オブジェクト検出,セマンティックセグメンテーション,オブジェクト検出など,様々なIR-VIS下流タスクにPVMをパラメータ効率よく活用するIV-tuningを提案する。完全な微調整ベースラインと既存のIR-VIS法と比較して、IV-tuningは、バックボーンパラメータの3%未満で、赤外線と可視光の相補的な情報の学習を容易にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:35:59 GMT)
Image-Text-Image Knowledge Transfer for Lifelong Person Re-Identification with Hybrid Clothing States [57.2]
ハイブリッド衣料状態(LReID-Hybrid)を用いた生涯人物再識別を提案する。 LReID-Hybridは、生涯学習中に一連の布の交換と同じ布のドメインを考慮に入れている。我々は、"画像-テキスト-画像"閉ループで知識を効果的に調整し、転送し、蓄積するための、$Teata$と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:03:53 GMT)
Toxicity Red-Teaming: Benchmarking LLM Safety in Singapore's Low-Resource Languages [57.1]
大規模言語モデル(LLM)は自然言語処理を変革しているが、その安全性メカニズムは低リソースで多言語的な設定では未探索のままである。シンガポールの多様な言語文脈におけるLLM安全性をベンチマークするための新しいデータセットおよび評価フレームワークであるtextsfSGToxicGuardを紹介した。我々は最先端の多言語LLMによる広範囲な実験を行い、その安全ガードレールの限界を明らかにする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:14:34 GMT)
Real, Fake, or Manipulated? Detecting Machine-Influenced Text [56.3]
我々はHiErarchical, length-RObust machine-influenced text detector (HERO)を紹介する。 HEROは、人書き、機械生成、機械処理、機械翻訳の4つの主要なタイプから、さまざまな長さのテキストサンプルを分離することを学ぶ。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:41:57 GMT)
Two Web Toolkits for Multimodal Piano Performance Dataset Acquisition and Fingering Annotation [56.3]
2つのグラフィカルユーザインタフェース(GUI)からなる統合Webツールキットを提案する。 PiaRecは、オーディオ、ビデオ、MIDI、パフォーマンスメタデータの同時取得をサポートする。 ASDFは、視覚データからパフォーマーフィンガーの効率的なアノテーションを可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:24 GMT)
DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [55.2]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:34:30 GMT)
Communication-Efficient and Privacy-Adaptable Mechanism for Federated Learning [54.2]
通信効率・プライバシー適応メカニズム(CEPAM)について紹介する。 CEPAMは通信効率とプライバシー保護を同時に達成する。我々は、CEPAMのプライバシー保証を理論的に分析し、CEPAMのユーザプライバシと正確性の間のトレードオフを調査する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:08:44 GMT)
Towards Pre-trained Graph Condensation via Optimal Transport [52.7]
グラフ凝縮は、元のグラフを小さなグラフに蒸留し、冗長性を緩和し、GNNトレーニングを加速することを目的としている。従来のGCアプローチは、厳格なGNNとタスク固有の監督に大きく依存している。タスク依存GC法とアーキテクチャ依存GC法の限界を超越するために, 最適輸送による事前学習グラフ凝縮(PreGC)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:13:24 GMT)
TableDART: Dynamic Adaptive Multi-Modal Routing for Table Understanding [52.6]
TableDARTはトレーニング効率のよいフレームワークで、事前トレーニングされた単一モダリティモデルを再利用することでマルチモーダルビューを統合する。さらに,テキストモデルと画像モデルからの出力を解析し,モーダル間知識統合のための新しいエージェントを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:00:13 GMT)
Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.4]
3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。 Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:01:29 GMT)
Large Multi-modal Models Can Interpret Features in Large Multi-modal Models [51.5]
まず、スパースオートエンコーダを用いて表現を人間の理解可能な特徴に分解する。 LMM自体がSAEで学んだオープンセマンティックな特徴を解釈するための自動解釈フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:46:09 GMT)
UnifiedVisual: A Framework for Constructing Unified Vision-Language Datasets [51.3]
統合視覚大言語モデル(VLLM)は、最近、マルチモーダル理解と生成の両方において顕著な進歩を遂げている。本稿では,新しいデータセット構築フレームワークUnifiedVisualを導入し,UnifiedVisual-240Kを提案する。 UnifiedVisual-240Kは、様々な視覚的およびテキスト的入力と出力をシームレスに統合し、包括的なクロスモーダル推論を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:39:44 GMT)
Rethinking Speaker Embeddings for Speech Generation: Sub-Center Modeling for Capturing Intra-Speaker Diversity [51.3]
本稿では,学習中に話者単位の複数のサブセンタを利用する新しい話者埋め込みネットワークを提案する。このサブセンターモデリングにより、埋め込みは話者分類性能を維持しながら、幅広い話者固有のバリエーションを捉えることができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:22:33 GMT)
Enhancing Retrieval Augmentation via Adversarial Collaboration [50.1]
我々は「検索幻覚」に対処するため、Adrial Collaboration RAG(AC-RAG)フレームワークを提案する。 AC-RAGは、知識ギャップを識別するジェネリスト検出器と、正確な解決策を提供するドメイン特化リゾルバという2つの異種エージェントを使用している。実験により、AC-RAGは検索精度を大幅に向上し、様々な垂直領域における最先端RAG法より優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:54:20 GMT)
MINGLE: VLMs for Semantically Complex Region Detection in Urban Scenes [49.9]
公共空間におけるグループレベルの社会的相互作用は都市計画に不可欠である。対人関係によって定義された視覚領域の推測と空間的接地を必要とする社会集団領域検出タスクを導入する。本稿では,人間検出と深度推定を統合したモジュール型3段階パイプラインであるMINGLEと,ソーシャルアフィリエイトを相互に分類するVLMベースの推論と,ソーシャルに連結したグループを局所化する軽量な空間アグリゲーションアルゴリズムを提案する。そこで本稿では,個人と社会的に相互作用するグループの両方に対して,境界ボックスとラベルを付加した100万の街路ビュー画像のデータセットを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:03:41 GMT)
Towards a Real-World Aligned Benchmark for Unlearning in Recommender Systems [49.8]
推薦システムにおける非学習のためのより現実的なベンチマークの開発を導くために,設計デシダータと研究質問のセットを提案する。我々は、現実世界の削除要求の逐次的で時間に敏感な性質を反映した、未学習のセットアップについて論じる。本稿では,提案したdesiderataをベースとした次世代レコメンデーションセッティングの予備実験を行い,アンラーニングが逐次レコメンデーションモデルにも有効であることを確認した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:17:43 GMT)
Vulnerable Agent Identification in Large-Scale Multi-Agent Reinforcement Learning [49.3]
システムがスケールアップすると、部分的なエージェントの障害は避けられないものとなり、全体的なパフォーマンスが著しく低下するエージェントのサブセットを特定することが重要になる。本稿では,大規模マルチエージェント強化学習(MARL)における脆弱性エージェント識別(VAI)問題について検討する。実験により, 大規模MARLおよびルールベースシステムにおいて, より脆弱なエージェントを効果的に同定し, システムを悪用し, それぞれのエージェントの脆弱性を明らかにする値関数を学習した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:03:50 GMT)
Dense Video Understanding with Gated Residual Tokenization [49.2]
高時間分解能は、ビデオ理解における微細な細部を捉えるのに不可欠である。現在のベンチマークは主に低フレームレートサンプリングに依存している。 Dense Video Understanding (DVU)は、トークン化時間とトークンオーバーヘッドの両方を削減することで、高FPSビデオの理解を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:17:10 GMT)
A Knowledge-driven Adaptive Collaboration of LLMs for Enhancing Medical Decision-making [49.0]
KAMACは知識駆動のAdaptive Multi-Agent Collaborationフレームワークである。エージェントは進化する診断コンテキストに基づいて、専門家チームを動的に形成および拡張することができる。 2つの実世界の医療ベンチマーク実験により、KAMACはシングルエージェント法と高度なマルチエージェント法の両方を著しく上回っていることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:33:36 GMT)
A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code [49.0]
A.S.Eは、AI生成コードのセキュリティを評価するためのリポジトリレベルの評価ベンチマークである。現在の大規模言語モデル(LLM)は、セキュアなコーディングに苦戦している。大きな推論予算は、必ずしもより良いコード生成につながるとは限らない。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:18:10 GMT)
CARE: Multilingual Human Preference Learning for Cultural Awareness [48.8]
我々は,3,490の文化的特異な質問と31.7kの人的判断応答を含む多言語リソースであるtextbfCAREを紹介する。質の高いネイティブな嗜好の質が、様々なLMの文化意識をいかに向上させるかを示す。分析の結果,初期の文化的パフォーマンスが向上したモデルの方がアライメントの恩恵を受けやすいことがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:45:20 GMT)
MOLE: Metadata Extraction and Validation in Scientific Papers Using LLMs [48.7]
MOLEは、アラビア語以外の言語のデータセットをカバーする科学論文からメタデータ属性を自動的に抽出するフレームワークである。本手法では,複数の入力形式にまたがって文書全体を処理し,一貫した出力に対する堅牢な検証機構を組み込む。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:38:31 GMT)
Depth AnyEvent: A Cross-Modal Distillation Paradigm for Event-Based Monocular Depth Estimation [47.9]
イベントカメラは、スパースで高時間解像度の視覚情報をキャプチャする。深層深度アノテーションによる大規模データセットの欠如は、イベントデータから学習に基づく単眼深度推定を妨げている。ビジョンファウンデーションモデル(VFM)を利用した高密度プロキシラベル生成のためのクロスモーダル蒸留パラダイムを提案する。我々の戦略は、RGBフレームに空間的に整合したイベントストリーム、利用可能なオフザシェルフの簡単なセットアップ、大規模VFMの堅牢性を活用することが必要である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:51 GMT)
Self-Adapting Language Models [47.5]
大規模言語モデル(LLM)は強力だが静的であり、新しいタスクや知識、例に対応して重みを適応するメカニズムが欠如している。我々は,自己適応型LSM(Self-Adapting LLMs, SEAL)を導入する。知識の定式化と数ショットの一般化の実験により、SEALは自己指向適応が可能な言語モデルに向けた有望なステップであることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:17:30 GMT)
Unleashing the Potential of Multimodal LLMs for Zero-Shot Spatio-Temporal Video Grounding [47.4]
大規模言語モデル(MLLM)を用いて,STVGのゼロショットソリューションを探索する。 STVGのためのMLLMベースのゼロショットフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:35:50 GMT)
ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning [47.3]
視覚言語アクション(VLA)推論タスクでは、エージェントはマルチモーダル命令を解釈し、長期計画を実行し、動的環境で適応的に行動する必要がある。既存のアプローチは通常、エンドツーエンドでVLAモデルをトレーニングし、明示的な推論なしに入力を直接アクションにマッピングする。本稿では,高レベルの推論と低レベルのアクション実行を,強化された視覚的潜在計画を通じて橋渡しする,デュアルシステムフレームワークであるThinkActを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:26:53 GMT)
GAF: Gaussian Action Field as a Dynamic World Model for Robotic Manipulation [46.9]
既存のアプローチは、視覚入力から直接アクションを予測するV-A(Vision-to-A)パラダイムや、中間的な3D表現を活用するV-3D-to-A(Vision-to-A)パラダイムに従うのが一般的である。本稿では,ガウスアクション場(GAF)を介して動作認識4D表現から直接行動推論を可能にするV-4D-Aフレームワークを採用する。実験では、+11.5385 dB PSNR、+0.3864 SSIM、-0.5574 LPIPSの改善を達成し、平均+7.3%の成功を上げた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:19:35 GMT)
MultiEdit: Advancing Instruction-based Image Editing on Diverse and Challenging Tasks [46.9]
MultiEditは、107K以上の高品質の画像編集サンプルを備えた包括的なデータセットである。 18の非スタイルの編集タイプと38のスタイルの転送操作の多様なコレクションを通じて、6つの困難な編集タスクを含んでいる。我々は、2つのマルチモーダル大言語モデル(MLLM)を用いて視覚適応的な編集命令を生成する新しいデータセット構築パイプラインを用いる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:33:38 GMT)
QA-LIGN: Aligning LLMs through Constitutionally Decomposed QA [46.7]
本稿では,モノリシック報酬を解釈可能な原理固有評価に分解するQA-LIGNを紹介する。ランマ-3.1-8B-インストラクションの適用により、QA-LIGNは攻撃成功率を最大68.7%まで下げる一方で、偽拒絶率0.67%を維持している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:36:13 GMT)
DeKeyNLU: Enhancing Natural Language to SQL Generation through Task Decomposition and Keyword Extraction [46.4]
本稿では,1500組のQAペアを含む新しいデータセットであるDeKeyNLUを提案する。本稿では,ユーザ質問理解,エンティティ検索,生成に3つのモジュールを使用するRAGベースのNL2パイプラインであるDeKeyを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:47:56 GMT)
Knowledge-Driven Hallucination in Large Language Models: An Empirical Study on Process Modeling [46.1]
解析的タスクにおける大規模言語モデルの実用性は、その膨大な事前訓練された知識に根ざしている。この能力は、私たちが知識駆動幻覚と呼ぶものに対して、重大なリスクをもたらします。本稿では,自動プロセスモデリングのタスクにおけるLCMの評価により,この現象を考察する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:27:30 GMT)
Improving Internet Traffic Matrix Prediction via Time Series Clustering [45.9]
モデル学習に先立って,同種の時間パターンで群流を流す2つのクラスタリング手法,すなわちソースクラスタリングとヒストグラムクラスタリングを提案する。既存のTM予測法と比較して,アビレンでは最大92%,G'EANTでは75%削減できる。ルーティングのシナリオでは、クラスタ化された予測により、最大リンク利用率(MLU)のバイアスをそれぞれ18%と21%削減する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:33:33 GMT)
Decoupled Proxy Alignment: Mitigating Language Prior Conflict for Multimodal Alignment in MLLM [45.4]
マルチモーダル・大規模言語モデル (MLLM) は視覚と言語モダリティを統合できることから注目されている。 MLLMの最近の進歩は、主に高品質なデータセットによるパフォーマンス向上に焦点を当てている。我々は、以前見過ごされた問題、言語事前衝突、大規模言語モデル(LLM)固有の言語先行とデータセットのトレーニングにおける言語先行とのミスマッチを識別する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:37:11 GMT)
LiMuon: Light and Fast Muon Optimizer for Large Models [45.1]
大規模モデルのトレーニングに有用なMuonを提案する。私たちのLiMuonは、現在のMuonとその変種よりもメモリが低い。一般化された滑らかな条件下でLiMuonがサンプルO(epsilon-3)$であることを証明する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:49:27 GMT)
Calibration-Aware Prompt Learning for Medical Vision-Language Models [45.0]
ミススカラー予測は、過度に自信過剰なエラーを引き起こし、臨床信頼と意思決定の信頼性を損なう。本稿では,Med-VLM を即時チューニングする最初のフレームワークである CalibPrompt を紹介する。 CalibPromptは、クリーンな精度に大きな影響を及ぼすことなく、キャリブレーションを継続的に改善する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:58 GMT)
BabyHuBERT: Multilingual Self-Supervised Learning for Segmenting Speakers in Child-Centered Long-Form Recordings [44.8]
BabyHuBERTは、多言語児中心の長文記録の13,000時間で訓練された最初の自己教師型音声表現モデルである。 BabyHuBERTは6つの多様なデータセットで52.1%から74.4%までF1スコアを達成した。コードとモデルを共有することで、BabyHuBERTは児童音声研究の基礎モデルとして機能する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:34:17 GMT)
HD3C: Efficient Medical Data Classification for Embedded Devices [44.6]
Class-Wise Clustering (HD3C)は、低消費電力環境向けに設計された軽量な分類フレームワークである。 HD3Cはデータを高次元のハイパーベクターにエンコードし、それらを複数のクラスタ固有のプロトタイプに集約し、ハイパースペースにおける類似性探索を通じて分類を行う。心臓音の分類では,HD3Cはベイジアン・レスネットよりも350タイムs$エネルギー効率が高く,精度は1%以下であった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:46:16 GMT)
Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning [44.5]
Supervised Fine-Tuning (SFT) Large Language Modelsは高品質なトレーニングデータに依存している。データ選択とデータ合成は、データ品質を改善するための2つの一般的な戦略であるが、既存のアプローチは進化するモデル機能に適応しない。モデル認識データ選択とコンテキスト保存データ精錬を利用する自己進化型モデルインフォームド動的データ最適化フレームワークであるMiddoを紹介した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:29:15 GMT)
Which Direction to Choose? An Analysis on the Representation Power of Self-Supervised ViTs in Downstream Tasks [43.5]
視覚変換のための自己監督学習(ViTs)は、近年、様々なコンピュータビジョンタスクの事前学習戦略としてかなりの可能性を示している。本研究の目的は,画像分類とセグメント化タスクにまたがる未修正特徴の使用を体系的に評価することで,ギャップを埋めることである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:46:07 GMT)
Entropy-Regularized Process Reward Model [43.1]
大規模言語モデル(LLM)は、複雑な多段階推論を行う上で有望であるが、数学的推論に苦慮し続けている。 KL規則化マルコフ決定プロセス(MDP)を統合したエントロピー規則化プロセス報酬モデル(ER-PRM)を提案する。 MATHとGSM8Kベンチマークの実証実験により、ER-PRMは既存のプロセス報酬モデルより一貫して優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:47:30 GMT)
LNE-Blocking: An Efficient Framework for Contamination Mitigation Evaluation on Large Language Models [42.9]
我々は,潜在的に漏洩したデータセットを汚染する前にモデル性能を復元する新しいフレームワークである textbfLNE-Blocking を提案する。私たちのフレームワークは、モデルの性能を効率的に回復する最初のフレームワークです。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:16 GMT)
Geometric Image Synchronization with Deep Watermarking [42.9]
SyncSealは、堅牢な画像同期のためのbespokeの透かし方式である。イメージを不可避的に変更する埋め込みネットワークと、画像が被写体となる幾何学的変換を予測する抽出ネットワークに依存している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:56:54 GMT)
Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration [42.7]
DM-Calibは単一の入力画像からピンホールカメラ固有のパラメータを推定するための拡散に基づくアプローチである。我々は、カメラ画像と呼ばれる新しい画像ベース表現を導入し、数値カメラの内在を無意味に符号化する。一つのRGB入力からカメラ画像を生成するための安定拡散モデルを微調整することにより、RANSAC操作を介してカメラ固有の特徴を抽出することができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:25:27 GMT)
RAcQUEt: Unveiling the Dangers of Overlooked Referential Ambiguity in Visual LLMs [42.4]
本稿では,画像に基づく質問応答におけるあいまいさの異なる側面を対象とするデータセットであるRACQUETを紹介する。我々は、その応答のあいまいさに対処する上で、最先端の大規模マルチモーダル言語モデルの過信に関する重大な制限と問題を明らかにする。本結果は, 望ましくないステレオタイプに頼らずに不確実性に対処する頑健な戦略を持つモデルの導入の緊急性を強調した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:44:33 GMT)
Benchmarking and Improving LLM Robustness for Personalized Generation [42.3]
反応が事実的正確であり、ユーザの好みと一致している場合、モデルをロバストと定義します。私たちの作業は、現在の評価プラクティスにおける重要なギャップを強調し、より信頼性が高く、ユーザ対応のデプロイメントをサポートするためのツールとメトリクスを導入しています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:56:14 GMT)
Learning the symmetric group: large from small [42.0]
置換予測を訓練したトランスフォーマーニューラルネットは、100%近い精度で対称群$S_25$に一般化できることを示す。可変語長を管理するためのキーツールとしてアイデンティティ拡張を採用し、隣接する転置のトレーニングには分割ウィンドウを用いる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:41:36 GMT)
A deep solver for backward stochastic Volterra integral equations [42.0]
後方ボルテラ積分方程式(BSVIE)に対する最初のディープラーニング解法を提案する。この方法はニューラルネットワークを訓練し、2つの解場を1段階で近似させる。これらの結果は、制御と量的ファイナンスにおける高次元、経路に依存した問題のファミリーへの実践的アクセスを開放する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:08:53 GMT)
VLM Agents Generate Their Own Memories: Distilling Experience into Embodied Programs of Thought [41.7]
大規模生成言語と視覚言語モデル(LLMとVLM)は、数ショットの学習では優れているが、高品質な実演を必要とする。 In-Context Abstraction Learning (ICAL) を提案し、VLMエージェントが最適な軌道を高品質な訓練データに変換することを可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:44:34 GMT)
EXPLOR: Extrapolatory Pseudo-Label Matching for Out-of-distribution Uncertainty Based Rejection [41.1]
EXPLORは、アウト・オブ・ディストリビューションポイントの予測と不確実性に基づく拒絶を改善するフレームワークである。潜在空間拡張に対する補間的擬似ラベルを導入し、実数値ベクトルデータによる堅牢なOOD一般化を可能にする。ニューラルバックボーンを用いた以前のモダリティ非依存法とは対照的に、EXPLORはモデル非依存であり、単純なツリーベースモデルから複雑なOOD一般化モデルへの手法を効果的に扱う。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:54:53 GMT)
Mixture of Multicenter Experts in Multimodal AI for Debiased Radiotherapy Target Delineation [40.9]
本稿では,医療分野におけるAIバイアスに対処するために,機関間のデータ共有を必要とせず,マルチセンターエキスパートの混在(Mixture of Multicenter Experts, MoME)フレームワークを提案する。 MoMEは、様々な臨床戦略から専門的な専門知識を統合し、医療センター全体のモデル一般化可能性と適応性を高める。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:48:24 GMT)
Not All Degradations Are Equal: A Targeted Feature Denoising Framework for Generalizable Image Super-Resolution [40.7]
Generalizable Image Super-Resolutionは、未知の劣化下でのモデル一般化機能の向上を目的としている。本稿では,ノイズ検出とデノナイジングモジュールを含むターゲット機能デノナイジングフレームワークを提案する。本フレームワークは,従来の正規化方式に比べて優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:04:51 GMT)
AssoCiAm: A Benchmark for Evaluating Association Thinking while Circumventing Ambiguity [40.7]
マルチモーダル大言語モデル(MLLM)は、人工知能(AGI)への有望な経路を提供するなど、大きな注目を集めている。 AGIに必要な重要な能力のうち、創造性はMLLMにとって重要な特性として現れ、その基盤として協会が機能している。 AssoCiAmは、ハイブリッド計算手法により曖昧さを回避しつつ、連想能力を評価するために設計されたベンチマークである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:46:07 GMT)
A Survey of Large Language Models for Data Challenges in Graphs [40.4]
グラフは、ソーシャルネットワーク分析から生体分子予測に至るまで、非ユークリッドデータを表現するために広く使われているパラダイムである。グラフ学習は目覚ましい進歩を遂げているが、現実のグラフデータは学習プロセスを著しく妨げる多くの課題を提示する。最近、Large Language Models (LLMs) は、リッチなセマンティック推論と外部知識を活用することで、これらの課題に対処する可能性を提供している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:51:08 GMT)
Robust Reinforcement Learning under Diffusion Models for Data with Jumps [40.3]
本稿では,MSBVE(Mean-Square Bipower Variation Error)アルゴリズムを提案する。我々はまず,連続時間RLで一般的に使用される平均平方TDエラー(MSTDE)アルゴリズムを再検討し,状態ダイナミクスのジャンプ処理における制限を強調した。提案したMSBVEアルゴリズムは平均2乗2乗変動誤差を最小化し,ジャンプを伴うSDEを特徴とする環境におけるMSTDEよりも優れた性能を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:45:09 GMT)
MovieCORE: COgnitive REasoning in Movies [39.8]
MovieCOREは、映画コンテンツに対する深い認知的理解を探求するために設計された、新しいデータセットである。本稿では,複数の大規模言語モデル(LLM)を思考エージェントとして活用する,革新的なエージェントブレインストーミング手法を提案する。既存のビデオ言語モデル(VLM)の限界に対処するため、エージェント拡張モジュール、エージェント選択拡張(ACE)を導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:56:38 GMT)
RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation [39.4]
RynnVLA-001は、人間のデモンストレーションから大規模ビデオ生成前訓練に基づいて構築された視覚言語アクション(VLA)モデルである。最初のステージであるEgo-Centric Video Generative Pretrainingは、12Mのエゴ中心の操作ビデオ上で、画像からビデオまでのモデルを訓練し、初期フレームと言語命令で条件付けられた将来のフレームを予測する。第2段階であるHuman-Centric Trajectory-Aware Modelingは、将来のキーポイント軌跡を共同で予測することでこれを拡張し、アクション予測による視覚的フレーム予測を効果的にブリッジする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:58:02 GMT)
DeCoP: Enhancing Self-Supervised Time Series Representation with Dependency Controlled Pre-training [39.3]
本稿では、動的でマルチスケールな依存関係を、進化するパッチ間の依存関係をシミュレートすることで、明示的にモデル化する依存性制御事前学習フレームワークを提案する。 DeCoPは、低いコンピューティングリソースを持つ10のデータセットに対して最先端の結果を達成し、わずか37%のFLOPを使用して、PatchTST上のETTh1上でMSEを3%改善する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:44:06 GMT)
Lindblad evolution as gradient flow [39.2]
リンドブラッドの進化は、次元$D$のヒルベルト空間上で作用する密度作用素の空間の勾配フローとして記述できることを示す。重要なことに、リンドブラディアン進化の定常状態は、すべての場合のポテンシャルによって決定される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:56:12 GMT)
TICA-Based Free Energy Matching for Machine-Learned Molecular Dynamics [39.1]
損失関数に相補的なエネルギーマッチング項を導入する。我々はCGSchNetモデルを用いてチグノリンタンパク質の枠組みを評価した。エネルギーマッチングは統計学的に精度が向上することはなかったが、モデルが自由エネルギー表面を一般化する方法に顕著な傾向を示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:22:25 GMT)
InMind: Evaluating LLMs in Capturing and Applying Individual Human Reasoning Styles [39.0]
社会的推論ゲームは、個別の推論スタイルを評価するための自然なテストベッドを提供する。我々は,LLMがパーソナライズされた推論スタイルをキャプチャして適用できるかどうかを評価するための認知基盤評価フレームワークであるInMindを紹介する。ケーススタディとして、InMindをゲームAvalonに適用し、11の最先端LCMを評価した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:16:24 GMT)
On the Role of Individual Differences in Current Approaches to Computational Image Aesthetics [38.9]
画像アセスメント(IAA)は、画像の多様性とユーザの主観性によって複雑なタスクである画像美学を評価する。ジェネリックIAA(GIAA)モデルは平均麻酔スコアを推定し、パーソナライズIAA(PIAA)モデルは転送学習を用いてGIAAを適応し、ユーザ主観性を取り入れる。この研究はIAAの理論的基盤を確立し、個々の特性を分布形式にエンコードする統一モデルを提案し、個人とグループの両方で評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:55:54 GMT)
SMART: Simulated Students Aligned with Item Response Theory for Question Difficulty Prediction [38.8]
本稿では、シミュレーションされた学生を指導力で整列させる新しい方法SMART(Simulated Students Aligned with IRT)を提案する。 SMARTは、その改善された能力アライメントを活用することで、他の項目の難易度予測手法よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:29:00 GMT)
A Mutual Information Perspective on Multiple Latent Variable Generative Models for Positive View Generation [38.4]
画像生成において、Multiple Latent Variable Generative Models (MLVGM) は複数の潜伏変数を用いて最終像を徐々に形成する。本稿では,Mutual Information (MI) を指標として,各潜伏変数の寄与度を定量化する新しいフレームワークを提案する。 MLVGMの階層変数と非絡み合い変数を活用することで,実画像データを必要としない多様で意味のあるビューを生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:48:33 GMT)
VisMoDAl: Visual Analytics for Evaluating and Improving Corruption Robustness of Vision-Language Models [38.0]
視覚言語モデル(VL)を様々な汚職タイプに対して評価するための視覚分析フレームワークであるVisMoDAlを紹介する。 VisMoDAlは、特定の汚職下でのパフォーマンス検査から、タスク駆動によるモデル動作の検査まで、多レベル分析をサポートする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:15:00 GMT)
Hierarchical Federated Learning for Social Network with Mobility [37.9]
Federated Learning (FL)は、協力的なローカルモデルトレーニングとグローバルアグリゲーションを可能にする分散ソリューションを提供する。従来のFLフレームワークでは、データプライバシは、ローカルデータが完全にプライベートであるという前提の下で保存されるのが一般的である。クライアント間のデータ共有とモビリティパターンの両方を考慮した階層型フェデレーション学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:17:06 GMT)
Automatic Mapping of AutomationML Files to Ontologies for Graph Queries and Validation [37.7]
AutomationMLは、自動化ドメインにおけるオープンデータ交換フォーマットとして広く採用されている。本稿では、AutomationMLをOWLに変換することで、SPARQLでのクエリやSHACLによる検証において、新たなユースケースを実現する方法について説明する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:00:06 GMT)
FAWN: A MultiEncoder Fusion-Attention Wave Network for Integrated Sensing and Communication Indoor Scene Inference [37.6]
ISAC(Integrated Sensing and Communication)はこの課題に対処する一歩を踏み出した。 ISAC内では、受動的センシングは、環境を感知するために無線通信を再利用するコスト効率の高いソリューションとして出現する。本稿では,ISAC屋内シーン推論のためのマルチエンコーダフュージョン・アテンション・ウェーブ・ネットワークであるFAWNについて述べる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:01:14 GMT)
Radiolunadiff: Estimation of wireless network signal strength in lunar terrain [37.6]
月面上の無線地図を予測するための物理インフォームド深層学習アーキテクチャを提案する。提案手法は,NASAの公開データから得られるリアルな地形を生成する物理ベースの月面地形生成装置と,電波伝搬シナリオの高忠実度データセットを作成するレイトレーシングエンジンを統合したものである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:44:05 GMT)
Efficient Multimodal Dataset Distillation via Generative Models [37.6]
本稿では,効率的なマルチモーダルデータセット蒸留のための生成蒸留法であるEDGEを紹介する。具体的には、生成モデルを用いてマルチモーダルデータセットを蒸留する2つの重要な課題を特定する。両方向のコントラスト損失と多様性損失を有する新しい生成モデルトレーニングワークフローを提案する。提案手法はFlickr30K,COCO,CC3Mのデータセットを用いて評価し,既存の手法と比較して優れた性能と効率性を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:36:57 GMT)
Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration [37.4]
大規模言語モデル(LLM)は、ユーザや組織によってカスタマイズされた、振る舞いと安全性の仕様(特別な)によって管理される、さまざまな実世界のシナリオにますます適用されています。我々は、この課題を仕様の整合性として定式化し、行動と安全性の両方の観点から、動的でシナリオ固有の仕様に従うLLMの能力に焦点をあてる。本稿では,テスト時間自由度(TTD)と階層的リフレクションと仕様境界に対するリフレクションを併用した軽量な手法Align3を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:08:53 GMT)
Sharp Matrix Empirical Bernstein Inequalities [37.4]
有界固有値を持つ対称ランダム行列に対して、2つの鋭く閉形式の経験的ベルンシュタイン不等式を示す。鋭いことは、両方の不等式が未知の分散に厳密な方法で適応することを意味する。第1の不等式は独立行列の平均値であり、第2の不等式は停止時のマルティンゲール依存下での平均推定値である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:39:12 GMT)
SPATIALGEN: Layout-guided 3D Indoor Scene Generation [37.3]
本研究では,現実的でセマンティックに整合した室内シーンを生成するマルチビューマルチモーダル拡散モデルであるSpatialGenを提案する。 3次元レイアウトと参照画像が与えられたモデルでは、任意の視点から外観(カラー画像)、幾何学(シーン座標マップ)、意味(セマンティックセグメンテーションマップ)を合成する。私たちは、コミュニティを力づけ、屋内のシーン理解と生成の分野を前進させるために、データとモデルをオープンソース化しています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:12:32 GMT)
Real-Time Streaming Mel Vocoding with Generative Flow Matching [36.7]
我々は,32ms,48msのアルゴリズムを用いて,16kHzでサンプリングした音声用ストリーミング対応ジェネレータMel vocoderを開発した。我々は,HyFi-GANを含むメルボコーディングにおいて,ストリーミング可能でないベースラインに比べて,PSSQとSI-SDRの精度が大幅に向上することを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:43:06 GMT)
PVLM: Parsing-Aware Vision Language Model with Dynamic Contrastive Learning for Zero-Shot Deepfake Attribution [36.4]
ゼロショットディープフェイク属性(ZS-DFA)のための動的コントラスト学習法(PVLM)を用いた新しい構文認識型視覚言語モデルを提案する。具体的には、拡散のような未確認の先進発電機に対するディープフェイク属性の属性性能を評価するために、新規できめ細かいZS-DFAベンチマークを実施している。また,動的コントラスト学習(PVLM)法を用いて,汎用的かつ多様な属性特徴を抽出する革新的な解析誘導型視覚言語モデルを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:24:25 GMT)
Explicit vs. Implicit Biographies: Evaluating and Adapting LLM Information Extraction on Wikidata-Derived Texts [36.3]
本研究では,テキストの暗黙性が事前学習した言語モデルにおける情報抽出作業にどのように影響するかを検討する。我々は,LLMの性能に与える影響を測るために,暗黙的かつ明示的なバイオグラフィ情報の音声化を2つの合成データセットで生成する。その結果,LoRAを用いた微調整LLMモデルでは,暗黙のテキストから情報を取り出す際の性能が向上することが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:30:31 GMT)
The Great AI Witch Hunt: Reviewers Perception and (Mis)Conception of Generative AI in Research Writing [36.2]
研究執筆におけるジェネレーティブAI(GenAI)の利用は急速に増加している。ピアレビュアーがAIによる増補された写本をどう認識するか、それとも誤認しているかは明らかでない。我々の研究結果は、AIによって強化された文章は可読性、言語多様性、情報性を改善するが、しばしば研究の詳細や著者からの反射的な洞察を欠いていることを示唆している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:58:43 GMT)
Precision Neural Networks: Joint Graph And Relational Learning [36.1]
共分散ニューラルネットワーク(VNN)は、データの共分散行列によって決定されたグラフ上で畳み込みを行う。精度行列(逆共分散)の精度ニューラルネットワーク(PNN)について検討する。我々は,ネットワークパラメータと精度行列を協調的に学習する最適化問題を定式化し,交互に最適化することで解決する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:22:05 GMT)
Out-of-Sight Trajectories: Tracking, Fusion, and Prediction [36.0]
軌道予測はコンピュータビジョンと自律システムにおいて重要な課題である。視外軌道(OST)の進歩について OSTはノイズのない物体の視覚的軌跡をノイズの多いセンサデータを用いて予測する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:16 GMT)
Exploring the Impact of Personality Traits on LLM Bias and Toxicity [36.0]
個人性が異なる大規模言語モデル(LLM)の「パーソナライゼーション」が研究の関心を集めている。本研究では, 異なる性格特性をLSMに割り当てることが, アウトプットの毒性やバイアスに与える影響について検討した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:59:34 GMT)
SynBench: A Benchmark for Differentially Private Text Generation [35.9]
医療や金融といった高度な分野におけるデータ駆動型意思決定のサポートは、データ共有にとって大きな障壁に直面している。大規模言語モデルのような最近の生成AIモデルは、オープンドメインタスクにおいて印象的なパフォーマンスを示している。しかし、彼らのセンシティブな環境への導入は、予測不可能な振る舞いと、プライバシー保護の不十分なデータセットによって制限されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:57:50 GMT)
Implicit Kinodynamic Motion Retargeting for Human-to-humanoid Imitation Learning [35.8]
Implicit Kinodynamic Motion Retargeting (IKMR)は、キネマティクスとダイナミックスの両方を考慮した、効率的でスケーラブルなフレームワークである。 IKMRは、モーション領域マッピングを学ぶために、モーショントポロジ表現とデュアルエンコーダデコーダアーキテクチャを事前訓練する。実物大のヒューマノイドロボットでシミュレータと実物ロボットの両方で実験を行う。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:34:02 GMT)
Global Pre-fixing, Local Adjusting: A Simple yet Effective Contrastive Strategy for Continual Learning [35.3]
我々はtextbf Supervised textbfContrastive Learning (GPLASC) のための textbfGlobal textbfPre-fixing, textbfLocal textbfAdjusting というコントラスト戦略を提案する。具体的には、表現の単位超球面全体を非重複領域に分割し、各領域の中心がタスク間の事前固定を形成する。個々のタスクに対して,本手法は特徴構造を制御し,内部を形成するのに役立つ。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:41:06 GMT)
Causal Reasoning Elicits Controllable 3D Scene Generation [35.2]
CausalStructは3Dシーン生成に因果推論を組み込む新しいフレームワークである。ノードがオブジェクトや属性を表現する因果グラフを構築し、エッジが因果依存性と物理的制約をエンコードする。提案手法では,3次元ガウス切削およびスコア蒸留サンプリングにより形状精度とレンダリング安定性を向上し,3次元シーンにおけるオブジェクト配置とレイアウトの誘導にテキストや画像を用いる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:03:21 GMT)
A Weak Supervision Approach for Monitoring Recreational Drug Use Effects in Social Media [35.2]
我々は、ソーシャルメディア(特にTwitter)を、エキスタシー、GHB、および2C-Bという3つの新しい精神活性物質に関連する、ユーザーによって報告された効果のリッチで未報告の源として活用する。 MetaMapによるバイオメディカルな概念抽出とスラング用語のキュレートされたリストを組み合わせることで、これらの物質に言及する92,000以上のツイートを特定し、弱く注釈づけした。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:42:42 GMT)
DualEdit: Dual Editing for Knowledge Updating in Vision-Language Models [35.1]
テキストと視覚の両方を各キー層で修正するエディタであるDualEditを提案する。複数のVLMバックボーンとベンチマークデータセットにまたがるDualEditを評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:24:31 GMT)
URNet: Uncertainty-aware Refinement Network for Event-based Stereo Depth Estimation [35.0]
イベントカメラは高時間分解能、高ダイナミックレンジ、低レイテンシを提供する。イベントベースステレオ深度推定のための不確実性認識ネットワークURNetを導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:24:50 GMT)
ImpRAG: Retrieval-Augmented Generation with Implicit Queries [34.7]
ImpRAGは、検索と生成を統一モデルに統合するクエリフリーなRAGシステムである。我々は、ImpRAGが、多様な形式を持つ未確認タスクの正確なマッチスコアを3.6-11.5改善したことを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:24:21 GMT)
GRADA: Graph-based Reranking against Adversarial Documents Attack [34.4]
敵対的なドキュメント攻撃は、クエリとセマンティックに類似した、敵対的なドキュメントを導入することで、検索プロセスを操作します。本稿では,検索品質の維持を目標とし,相手の成功を著しく低減するグラフベースの逆文書攻撃対策フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:20:24 GMT)
Multi-Fidelity Hybrid Reinforcement Learning via Information Gain Maximization [34.3]
情報ゲイン(MFHRL-IGM)を用いた多要素ハイブリッドRLを提案する。 MFHRL-IGM (MFHRL-IGM) は、ブートストラップ方式による情報ゲインに基づく忠実度選択を実装したハイブリッドオフラインオンラインRLアルゴリズムである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:12:22 GMT)
Mind the Inclusivity Gap: Multilingual Gender-Neutral Translation Evaluation with mGeNTE [34.1]
ジェンダーニュートラル翻訳(GNT)は、言語間のより公平なコミュニケーションに向けた言語戦略である。我々は、専門家によるリソースであるmGeNTEを導入し、包括的翻訳の最初の体系的多言語的評価を行う。 en-es/de/it/elの実験では、モデルが中立性が適切かどうかを認識できるが、中立的な翻訳を一貫して生成することはできないことが明らかになった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:48:23 GMT)
Mind the Gap: Data Rewriting for Stable Off-Policy Supervised Fine-Tuning [33.9]
大規模言語モデルの教師付き微調整(SFT)は、非政治的な学習問題と見なすことができる。既存のアプローチは、KLペナルティやクリッピングを使ってこの問題を軽減する。本稿では,政策ギャップを積極的に縮小する簡易かつ効果的なデータ書き換えフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:02:30 GMT)
Optimal Learning from Label Proportions with General Loss Functions [33.8]
本稿では,ラベル情報から学習する新奇で多用途な低分散デバイアス手法を提案する。提案手法は,実用的な損失関数の幅広いスペクトルをシームレスに収容する,顕著な柔軟性を示す。提案手法の有効性を様々なベンチマークデータセットで実証的に検証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:53:32 GMT)
Modular Machine Learning: An Indispensable Path towards New-Generation Large Language Models [33.8]
我々は,次世代大規模言語モデル(LLM)に不可欠なアプローチとして,有望な学習パラダイム,すなわちモジュール機械学習(MML)を概説する。我々は,LLMの複雑な構造を,モジュール表現,モジュールモデル,モジュール推論の3つの相互依存成分に分解する,LLMのための統一MMLフレームワークを提案する。最終的に、MLとLLMの統合は、統計的(深層)学習と形式的(論理的)推論のギャップを埋める可能性があると信じています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:34:54 GMT)
Superpose Task-specific Features for Model Merging [33.8]
本稿では,ニューラルネットワーク表現の基本的なメカニズムを活用することによって,モデルマージの新たな視点を導入する。本稿では,個々のモデルからタスク固有の特徴を重畳したモデルに重ね合わせる手法を提案する。提案手法は,ディープネットワークにおける特徴の活性化と抽出に不可欠な線形変換行列を特に対象とする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:17:25 GMT)
Binarized Neural Networks Converge Toward Algorithmic Simplicity: Empirical Support for the Learning-as-Compression Hypothesis [33.7]
本稿では,二元化ニューラルネットワーク(BNN)を第1のプロキシとして用いて,アルゴリズム情報理論へのシフトを提案する。ブロック分解法 (BDM) を適用し, エントロピーよりもトレーニング中の構造変化をより綿密に追跡した。これらの結果は、学習が構造化正規性の進行的内部化に対応するアルゴリズム圧縮の過程としてのトレーニングの観点を支持する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:30:41 GMT)
Fermat's Spiral-Based Characterization of Squeezed Nonlinear Motional States of Levitated Nanoparticle [33.7]
我々はフェルマーのスパイラルの概念を用いて位相空間座標の非線形変換を導入する。ダッフィング型非線形性によって引き起こされる状態歪みを除去し、運動状態のキャラクタリゼーションを可能にする。提案方式により, 適用状態の操作, システムの漸進的熱化, 閉じ込めの非線形性の影響を分離することができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:17:35 GMT)
Assessing Historical Structural Oppression Worldwide via Rule-Guided Prompting of Large Language Models [33.7]
我々は,Large Language Models(LLMs)を利用した圧縮測定のための新しいフレームワークを提案する。我々は、モデルが解釈可能で理論的に基礎付けられた抑圧の推定を生成することを奨励するルール誘導的促進戦略を設計する。以上の結果から, LLM は, 明示的なルールでガイドされている場合, 国家内における個人性に基づく歴史的抑圧の微妙な形態を捉えることができることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:05 GMT)
Generalizable Geometric Image Caption Synthesis [33.5]
本稿ではデータ生成パイプラインにRLVR(Reinforcement Learning with Verifiable Rewards)を導入する。幾何学的画像のキャプションを改良するためにRLVRを採用することで、我々のパイプラインは幾何学的問題解決の重要な特徴を捉えた。アウト・オブ・ディストリビューションのシナリオであっても、生成されたデータセットは、マルチモーダルな大規模言語モデルの一般的な推論能力を高める。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:11 GMT)
Select to Know: An Internal-External Knowledge Self-Selection Framework for Domain-Specific Question Answering [33.5]
大規模言語モデル(LLM)は一般的なQAではうまく機能するが、ドメイン固有のシナリオではしばしば苦労する。 Selct2Know(S2K)は,ドメイン知識を内部的・外部的知識自己選択戦略によって内部化する,費用対効果の高いフレームワークである。医学的、法的、財務的なQAベンチマークの実験は、S2Kが既存の方法より一貫して優れていることを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:35:01 GMT)
Breathing and Semantic Pause Detection and Exertion-Level Classification in Post-Exercise Speech [33.4]
運動後のスピーチには豊富な生理的・言語的な手がかりが含まれており、しばしば意味的なポーズ、呼吸停止、呼吸・情緒的な一時停止が特徴である。本研究では,ポーズ型の体系的なアノテーションを提供し,深層学習モデル全体にわたって,探索的呼吸と意味的停止検出と実行レベル分類を行う。その結果,各タイプの検出精度はセマンティクスで89$%,呼吸で55$%,複合停止で86$%,オーバーオールで73$%まで向上した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:39:34 GMT)
LLM-OREF: An Open Relation Extraction Framework Based on Large Language Models [33.4]
オープンリレーション抽出(OpenRE)の目的は、トレーニング中に遭遇しない新しいリレーションに一般化できるREモデルを開発することである。本稿では,大規模言語モデル(LLM)に基づくOpenREフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:46:40 GMT)
The Anatomy of a Personal Health Agent [33.0]
一般消費者の健康管理装置や一般の健康記録からマルチモーダルデータを分析できる包括的パーソナルヘルスエージェントの構築を目指している。我々は,消費者の健康ニーズの3つの主要なカテゴリを特定し,それぞれが専門的なサブエージェントによって支えられている。動的にパーソナライズされた対話を可能にするマルチエージェントフレームワークであるPersonal Health Agent(PHA)を提案し,開発する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:43:25 GMT)
A Test-Function Approach to Incremental Stability [32.9]
値関数の正則性とその漸進安定性への関連性は、制御理論における安定性の証明に対する従来のリャプノフのアプローチとは異なる方法で理解することができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:25:22 GMT)
TITAN: A Trajectory-Informed Technique for Adaptive Parameter Freezing in Large-Scale VQE [32.2]
変分量子固有解法(VQE)は、量子コンピュータを用いて量子化学と材料シミュレーションを推し進める主要な候補である。そこで我々はTitanと呼ばれる深層学習フレームワークを提案し,不活性パラメータの同定と凍結を行う。タイタンはコンバージェンスを最大で3倍速くし、最先端のベースラインよりも40%から60%少ない回路評価を実現している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:50:02 GMT)
Standardizing Generative Face Video Compression using Supplemental Enhancement Information [32.1]
本稿では,補助強調情報(SEI)を用いたGFVC(Generative Face Video Compression)アプローチを提案する。この記事執筆時点では,SEIメッセージを用いたGFVC方式がVersatile Supplemental Enhancement Information (VSEI)標準のドラフト修正に含まれている。著者の知識を最大限活用するために、JVETが提案したSEIベースのGFVCアプローチは、生成ビデオ圧縮のための最初の標準化活動である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:41:04 GMT)
The Inadequacy of Offline LLM Evaluations: A Need to Account for Personalization in Model Behavior [32.0]
我々は、同じ言語モデルに対する同一のベンチマーク質問が、ステートレスシステムに誘導された場合、顕著に異なる応答を生成できることを示す。オフライン評価と、ChatGPTとGeminiの実際のユーザ800名によるフィールド評価を比較し、チャットインターフェースに提示された質問とを比較した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:41:20 GMT)
Visionerves: Automatic and Reproducible Hybrid AI for Peripheral Nervous System Recognition Applied to Endometriosis Cases [31.8]
子宮内膜症はしばしば慢性骨盤痛と神経障害を引き起こす。末梢神経系認識のための新しいハイブリッドAIフレームワークであるVisionervesを紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:08:28 GMT)
SCoT: Straight Consistent Trajectory for Pre-Trained Diffusion Model Distillations [31.6]
本研究では,事前学習した拡散モデルに対する直線一貫性軌道(SCoT)モデルを提案する。 SCoTは、高速サンプリングのための両方のアプローチの利点を享受し、一貫した特性と直線的な性質のトラジェクトリを同時に生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:02:07 GMT)
Who is Responsible When AI Fails? Mapping Causes, Entities, and Consequences of AI Privacy and Ethical Incidents [31.5]
我々は、202の現実世界のAIプライバシと倫理的インシデントを分析し、分類学を開発した。この結果から, 組織的決定の貧弱さと法的な非コンプライアンスの悪影響が明らかとなった。本研究は,政策立案者や実践者に対して有効なガイダンスを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:53:51 GMT)
GCDance: Genre-Controlled 3D Full Body Dance Generation Driven By Music [31.3]
GCDanceは、音楽とテキストの両方のプロンプトに条件付きジャンル固有のダンスモーションを生成するための分類器なし拡散フレームワークである。提案手法は,高レベルな事前学習音楽基礎モデルと手作りのマルチグラニュラリティ特徴融合機能を組み合わせることで,音楽の特徴を抽出する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:30:09 GMT)
Adaptive Algorithms with Sharp Convergence Rates for Stochastic Hierarchical Optimization [31.0]
階層最適化問題に対する新しい適応アルゴリズムを提案する。我々のアルゴリズムは、ノイズレベルの事前の知識なしに、鋭い収束率を達成する。合成および深層学習タスクの実験は,提案アルゴリズムの有効性を実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:17:18 GMT)
Walk and Read Less: Improving the Efficiency of Vision-and-Language Navigation via Tuning-Free Multimodal Token Pruning [30.5]
トーケンプルーニングは、性能損失を最小限に抑えながら、効率をアピールするトレードオフを提供する。本研究では,ナビゲーション固有の特徴を活かしたナビゲーション・アウェア・プルーニング(NAP)を提案する。 NAPは以前の作業よりも優れており、50%以上のFLOPSを節約しながら高い成功率を維持している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:05:37 GMT)
Evaluating Large Language Models for Cross-Lingual Retrieval [30.5]
大規模言語モデル(LLM)を用いた2段階CLIRにおけるレトリバーとリランカーの相互作用について検討する。以上の結果から,機械翻訳がなければ,CLIRに直接適用した場合,最先端のリランカーは著しく低下することが明らかとなった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:54:17 GMT)
Dr. Jekyll and Mr. Hyde: Two Faces of LLMs [30.2]
大規模言語モデル(LLM)はチャットボットやメールアシスタントなどのアプリケーションに統合されている。本研究では,ChatGPT,Gemini,Deepseekの安全性対策を,複雑なペルソナを擬人化することによって回避する。ペルソナを用いて、禁止された応答が提供され、不正、違法、有害な情報を得ることができることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:33:35 GMT)
CoDoL: Conditional Domain Prompt Learning for Out-of-Distribution Generalization [29.7]
本稿では,OOD一般化性能を向上させるための条件付きドメインプロンプト学習(CoDoL)手法を提案する。インスタンス固有の情報とドメイン固有の情報の両方をキャプチャするために,各領域の画像に対して入力条件トークンを生成する軽量なドメインメタネットワーク(DMN)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:23:59 GMT)
DF-LLaVA: Unlocking MLLM's potential for Synthetic Image Detection via Prompt-Guided Knowledge Injection [29.2]
我々は,MLLMの本質的な識別可能性を解き放つ,シンプルで効果的なフレームワークであるDF-LLaVAを提案する。提案手法はまずMLLMから潜伏知識を抽出し,プロンプトによるトレーニングに注入する。総合実験によりDF-LLaVAの優位性が確認され, 合成画像検出の精度と説明性の両方が得られた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:43:42 GMT)
Spin-photon coupling using circular double quantum dots [29.1]
円形二重量子ドットを用いたマイクロ波スピンフォトン界面の解析を行う。環状態が奇数および幾何的パリティ軌道状態の交差でどのように形成されるかを示す。本システムは、特定の磁場角に2階の電荷ノイズスイートスポットを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:13:43 GMT)
Deep Reinforcement Learning with Gradient Eligibility Traces [28.9]
本稿では、$lambda$-returnに基づいて、一般化された$overlinetextPBE$目的を拡張し、マルチステップクレジット代入をサポートする。我々は、経験的リプレイと互換性のあるフォワードビュー定式化と、ストリーミングアルゴリズムと互換性のある後方ビュー定式化の両方を提供する。提案アルゴリズムは, MuJoCo 環境と MinAtar 環境においてPPO と StreamQ の両方より優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:17:44 GMT)
Ghost Imaging with Free Electron-Photon Pairs [28.5]
ゴーストイメージングとしても知られるコインシデンスイメージングは、2つの粒子間の相関を利用して標本に関する情報を再構成する。本研究では,透過電子顕微鏡内で発生した電子-カソードルミネッセンス光子対を用いた同時撮像について検討する。空間分解能を2$mu$mまで下げることで、フォトニック量子光学から電子顕微鏡への量子強調画像技術の適用を可能にしました。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:35:31 GMT)
"My Boyfriend is AI": A Computational Analysis of Human-AI Companionship in Reddit's AI Community [28.5]
Redditの主要なAIコンパニオンコミュニティであるr/MyBoyfriendIsAIの大規模解析を行った。この結果から,コミュニティメンバのAIコンパニオンシップが意図せず,機能的利用によって意図せず出現することが明らかとなった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:50:53 GMT)
Morph: A Motion-free Physics Optimization Framework for Human Motion Generation [28.0]
現在の運動生成は、物理学的な制約を無視し、物理的に不可解な運動をもたらす。雑音の多い動きデータを用いて有効な運動物理学を訓練するためのフレームワークである textbfMorph を提案する。我々のフレームワークは、身体的可視性を大幅に向上させながら、最先端の運動品質を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:52:22 GMT)
3DS: Medical Domain Adaptation of LLMs via Decomposed Difficulty-based Data Selection [27.9]
大きな言語モデルは一般的なタスクでは優れていますが、医療のような専門分野では苦労しています。 2段階モデル中心のデータ選択フレームワークDe Difficulty Data Selection (3DS)を提案する。実世界の医療データセットに関する我々の実験は、既存の方法よりも5.29%以上の精度で3DSの方が優れていることを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:16:30 GMT)
Scalable entanglement of nuclear spins mediated by electron exchange [27.8]
シリコンデバイスにおける2つのリン原子の核間の2量子制御-Z論理演算を実演する。この方法により、半導体スピン量子ビットのスケールアップの今後の進歩は、核スピンベースの量子コンピュータの開発にまで拡張できる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:54:37 GMT)
Stochastic Bilevel Optimization with Heavy-Tailed Noise [27.8]
本稿では,低次問題を強く凸し,高次問題を非定常雑音レベルとするスムーズな二段階最適化について考察する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:37:40 GMT)
CSRM-LLM: Embracing Multilingual LLMs for Cold-Start Relevance Matching in Emerging E-commerce Markets [27.7]
多言語大言語モデル(LLM)を用いたコールドスタート関連マッチングフレームワークを提案する。本実験は,CSRM-LLMと提案手法の有効性を実証し,実世界の展開に成功し,オンライン上で大きな成果を上げている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:42:32 GMT)
Roll Your Eyes: Gaze Redirection via Explicit 3D Eyeball Rotation [27.4]
本稿では,明快な3次元眼球構造を利用した新しい3次元視線リダイレクトフレームワークを提案する。本手法は, 3次元眼球構造を明示的に回転・翻訳することにより, 所望の視線方向を忠実に再現するフォトリアリスティック画像を生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:50:55 GMT)
MUSE: MCTS-Driven Red Teaming Framework for Enhanced Multi-Turn Dialogue Safety in Large Language Models [27.4]
攻撃角と防御角の両方からマルチターンジェイルブレイクに対処する包括的フレームワークであるMUSEを紹介する。攻撃に対して,フレームセマンティクスと木探索を用いて多種多様な意味軌道を探索するMUSE-Aを提案する。 MUSE-D(MUSE-D)は,対話の初期段階において脆弱性の軽減に介入する,きめ細かい安全アライメント手法である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:12:27 GMT)
Edge-Aware Normalized Attention for Efficient and Detail-Preserving Single Image Super-Resolution [27.3]
単一高分解能超解像(SISR)は、単一の低分解能観測から構造的に忠実な高周波成分を回収することが曖昧であるため、非常に不明瞭である。既存のエッジ対応の手法では、エッジ先行または注意枝をますます複雑なバックボーンにアタッチすることが多いが、アドホック融合は冗長性、不安定な最適化、あるいは限られた構造的利得をもたらすことが多い。このギャップには, エッジ特徴量と中間特徴量から適応変調マップを導出するエッジ誘導型アテンション機構を用いて対処し, それらを正規化および再重み付けに応用し, 微妙なテクスチャを抑えつつ, 構造的に健全な領域を選択的に増幅する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:31:24 GMT)
RationAnomaly: Log Anomaly Detection with Rationality via Chain-of-Thought and Reinforcement Learning [27.2]
RationAnomalyは、Chain-of-Thoughtファインチューニングと強化学習を相乗化することにより、ログの異常検出を強化する新しいフレームワークである。コードとデータセットを含む、対応するリソースをリリースしました。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:35:58 GMT)
Temporal Reasoning with Large Language Models Augmented by Evolving Knowledge Graphs [27.2]
大規模な言語モデルは、多くの言語理解タスクにおいて優れているが、進化する知識よりも推論に苦労する。 EvoReasonerは,グローバルな局所的なエンティティグラウンド,複数ルートの分解,時間的グラウンドのスコアリングを行う,時間的認識型マルチホップ推論アルゴリズムである。我々は、時間的QAベンチマークと、KGを生文書から動的に更新する新しいエンドツーエンド設定に対するアプローチを評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:24:55 GMT)
StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant [27.2]
オフラインビデオLLMをストリーミング対応モデルにシームレスに変換するフレームワークであるStreamBridgeを紹介します。既存のモデルをオンラインシナリオに適応する上での根本的な課題は,(1)マルチターンリアルタイム理解能力の制限,(2)プロアクティブ応答機構の欠如である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:56:09 GMT)
MAVL: A Multilingual Audio-Video Lyrics Dataset for Animated Song Translation [26.8]
歌声翻訳のためのマルチリンガル・マルチモーダル・ベンチマークであるMAVL(Multilingual Audio-Video Lyrics Benchmark for Animated Song Translation)を紹介する。本稿では,Syllable-Constrained Audio-Video LLM with Chain-of-Thought SylAVL-CoTを提案する。実験結果から,SylAVL-CoTはテキストベースモデルよりも歌声性や文脈精度が優れていた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:19:20 GMT)
Efficient Dual-domain Image Dehazing with Haze Prior Perception [26.6]
トランスフォーマーベースのモデルは、シングルイメージのデハージングにおいて強力なグローバルモデリング能力を示すが、その高い計算コストはリアルタイム適用性を制限する。そこで我々はDGFDNet(Dark Channel Guided Frequency-aware Dehazing Network)を提案する。 4つのベンチマークハウズデータセットの実験により、DGFDNetは、より優れた堅牢性とリアルタイム効率で最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:05:42 GMT)
Moment- and Power-Spectrum-Based Gaussianity Regularization for Text-to-Image Models [26.1]
本稿では,標準ガウス分布と標準ガウス分布を一致させ,標準ガウス分布を強制する新たな正規化損失を提案する。本稿では,テキスト・ツー・イメージ・モデルを用いたテスト時間報酬アライメントのためのジェネレーティブ・モデリングにおける正規化の適用について紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:35:34 GMT)
Structure-Preserving Margin Distribution Learning for High-Order Tensor Data with Low-Rank Decomposition [26.1]
低ランク分解(SPMD-LRT)を用いた高次データのための構造保存マルジン分布学習を提案する。 SPMD-LRTは、一階および二階テンソル統計を取り入れた多次元空間構造を保存する。従来のSVM、ベクトルベースのLMDM、およびそれ以前のテンソルベースのSVM拡張よりも優れた分類精度を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:26:09 GMT)
FreeAudio: Training-Free Timing Planning for Controllable Long-Form Text-to-Audio Generation [26.0]
テキスト・トゥ・オーディオ(T2A)生成は,最近の生成モデルの発展により,有望な成果を上げている。時間的に整列した音声テキストペアの品質と量に制限があるため、既存のT2Aメソッドは複雑なテキストプロンプトを扱うのに苦労する。本稿では,時間制御の長いT2A生成を実現するための,学習不要な時間制御型T2AフレームワークFreeAudioを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:19:36 GMT)
Learning to Retrieve for Environmental Knowledge Discovery: An Augmentation-Adaptive Self-Supervised Learning Framework [25.3]
本稿では、対象生態系のモデリングを強化するために、関連する観測サンプルを検索するAugmentation-Adaptive Self-Supervised Learning (A$2$SL)フレームワークを提案する。これらの学習された類似性は、ターゲットシナリオを異なる場所や時間から関連するデータで補完する検索メカニズムを駆動する。実世界の湖沼における水温と溶存酸素動態のモデル化におけるA$2$SLの評価を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:51:53 GMT)
MedFact-R1: Towards Factual Medical Reasoning via Pseudo-Label Augmentation [25.2]
MEDFACT-R1は、外部知識基盤と強化学習を統合した2段階のフレームワークである。従来の最先端手法に比べて22.5%の精度で絶対的な改善が達成されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:59:59 GMT)
ReservoirTTA: Prolonged Test-time Adaptation for Evolving and Recurring Domains [25.1]
ReservoirTTAは、長期間のテスト時間適応のために設計された新しいプラグインフレームワークである。中心となるReservoirTTAはドメイン特化モデルの貯水池を維持している。理論的解析により,パラメータの分散を束縛し,モデル崩壊を防ぐ重要な要素が明らかになった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:15:08 GMT)
Tomography of entangling two-qubit logic operations in exchange-coupled donor electron spin qubits [24.6]
量子プロセッサは高忠実な普遍量子論理演算を必要とする。ドナー結合電子スピン間の絡み合いは今のところ証明されていない。これらの結果は、ドナーベースの量子コンピュータのスケールアップに必要な基盤となる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:22:49 GMT)
Mitigating data replication in text-to-audio generative diffusion models through anti-memorization guidance [24.4]
反記憶誘導(Anti-memorization Guidance、AMG)は、事前学習した拡散モデルのサンプリングプロセスを変更して記憶を阻害する手法である。そこで本研究では,AMG内の3種類のガイダンスについて検討し,それぞれが生成品質を保ちながら複製を減少させるように設計された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:14:25 GMT)
SWE-Effi: Re-Evaluating Software AI Agent System Effectiveness Under Resource Constraints [24.3]
ソフトウェアエンジニアリングのリーダーボードのための既存のAIは、ソリューションの正確性にのみフォーカスする。 SWE-Effiは、総合的な有効性スコアの観点からAIシステムを再評価する、新しいメトリクスのセットである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:31:55 GMT)
Value-Guided KV Compression for LLMs via Approximated CUR Decomposition [24.3]
CurDKVは、CUR行列分解から計算したレバレッジスコアに基づいてキーと値を選択する、新しい、値中心のKV圧縮手法である。我々のアプローチは、注意出力$softmax(QKT)V$の支配的部分空間を近似し、保持されたトークンがモデルの予測挙動を最善に維持することを保証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:04:06 GMT)
ATLANTIS: AI-driven Threat Localization, Analysis, and Triage Intelligence System [24.2]
ATLANTISは、チームアトランタが開発したサイバー推論システムで、DARPAのAIサイバーチャレンジ(AIxCC)の最終コンペで1位を獲得した。 ATLANTISの背後にある設計哲学、アーキテクチャ決定、実装戦略について詳述する。プログラム分析が現代のAIに合うとき、自動セキュリティの境界を押して学んだ教訓を共有します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:46:18 GMT)
Do Code Semantics Help? A Comprehensive Study on Execution Trace-Based Information for Code Large Language Models [24.1]
コードLLMの教師付き微調整(SFT)と位相後推論におけるトレースベースセマンティック情報の有用性について検討する。実験結果は従来の研究と驚くほど異なっており、意味情報がコードLLMのSFTおよびテスト時間スケーリングに限られた有用性を持っていることを実証している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:44:09 GMT)
Retrieval-Retro: Retrieval-based Inorganic Retrosynthesis with Expert Knowledge [24.1]
本稿では, 参照材料の前駆体情報を暗黙的に抽出する無機レトロ合成計画のためのRetrieval-Retroを提案する。検索において,対象物質と前駆体との熱力学的関係を考察する。 Retrieval-Retroのレトロ合成計画における優位性、特に新規合成レシピの発見について実験を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:24:02 GMT)
CodeFuse-CR-Bench: A Comprehensiveness-aware Benchmark for End-to-End Code Review Evaluation in Python Projects [24.0]
CodeFuse-CR-Benchは、リポジトリレベルのCR評価のための、最初の包括性対応ベンチマークである。 CodeFuse-CR-Benchは、9つのプルリクエスト(PR)問題ドメインをカバーする70のPythonプロジェクトから601の高品質なインスタンスで構成されている。本稿では,この包括的CR課題に対して,最先端の大規模言語モデル(LLM)の大規模評価を行う。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:24:09 GMT)
(SP)$^2$-Net: A Neural Spatial Spectrum Method for DOA Estimation [23.9]
我々は、測定値と仮説角を入力として取り込むディープニューラルネットワークを訓練し、より広い配列の能力と整合したスコアを出力することを学ぶ。推定時、任意の角度の集合を走査することでヒートマップを生成することができる。本稿では,Bartlettビームフォーマとスポーサリティに基づくDOA推定法に対して,トレーニングモデルである (SP)$2$-Net の利点を実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:40:28 GMT)
Adaptive and Iterative Point Cloud Denoising with Score-Based Diffusion Model [23.8]
本稿では,スコアベース拡散モデルに基づく適応的かつ反復的な点雲復調法を提案する。最先端のポイント・クラウド・デノナイズ手法と比較して,本手法はクリーンでスムーズなポイント・クラウドを得る。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:46:08 GMT)
Predicting Language Models' Success at Zero-Shot Probabilistic Prediction [23.8]
個人レベルの特徴を生成するためのゼロショットモデルとして,大規模言語モデル(LLM)の能力について検討する。 LLMのパフォーマンスは、同じデータセット内のタスクと異なるデータセットの両方で非常に可変であることがわかった。タスクレベルでのLLMのパフォーマンスを予測するためのメトリクスを構築し、LLMがうまく機能する可能性のあるタスクと、それらが適さない可能性のあるタスクを区別することを目的としている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:57:05 GMT)
SMARTER: A Data-efficient Framework to Improve Toxicity Detection with Explanation via Self-augmenting Large Language Models [23.6]
有害コンテンツはソーシャルメディアプラットフォームに広まりつつある。本稿では、説明可能なコンテンツモデレーションのためのフレームワークSMARTERを紹介する。当社のフレームワークは、低リソース設定のためのスケーラブルな戦略を提供します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:30:36 GMT)
Fast and Fluent Diffusion Language Models via Convolutional Decoding and Rejective Fine-tuning [23.6]
Autoregressive (AR)言語モデルでは、テキストを1つずつ生成することで、推論速度が制限される。本稿では,デコードウインドウを狭める正規化法であるConal decoding (Conv)を提案する。 Rejecting Rule-based Fine-Tuning (R2FT)も導入しています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:48:21 GMT)
DiffVL: Diffusion-Based Visual Localization on 2D Maps via BEV-Conditioned GPS Denoising [23.5]
DiffVLは,拡散モデルを用いたGPSデノナイズタスクとして視覚的ローカライゼーションを再構成する最初のフレームワークである。我々の研究は、ノイズの多いGPSを生成先行として扱うことにより、DiffVLがスケーラブルなローカライゼーションを可能にすることを証明している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:57:28 GMT)
Efficient Conformal Prediction for Regression Models under Label Noise [23.2]
医用画像などの高精細なシナリオでは、信頼性のある信頼区間を持つ回帰モデルの予測を行うことが重要である。近年、コンフォーマル予測は、予め特定された確率を持つ真のラベルを含む間隔を生成する強力な統計フレームワークとして出現している。本稿では,キャリブレーションセットがノイズラベルを含む場合,回帰モデルにCPを適用するという問題に対処する。回帰問題の連続的な性質から生じる課題を克服する実践的なアルゴリズムに転換する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:27:09 GMT)
SWE-QA: Can Language Models Answer Repository-level Code Questions? [23.1]
SWE-QAは、現実的なコード環境における自動QAシステムの研究を容易にするために設計された、リポジトリレベルのコード質問応答(QA)ベンチマークである。 SWE-QAは、意図的理解、クロスファイル推論、マルチホップ依存分析など、さまざまなカテゴリにまたがる576の高品質な質問応答ペアを含んでいる。エージェントフレームワークであるSWE-QA-Agentを開発した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:25:32 GMT)
RSCC: A Large-Scale Remote Sensing Change Caption Dataset for Disaster Events [22.9]
本稿では,62,315個の前/後イメージペアからなる大規模ベンチマークであるRemote Sensing Change Captionデータセットを紹介する。リモートセンシングデータの時間的・意味的な分割をブリッジすることにより、RSCCは災害対応の両時間的理解のための視覚言語モデルの堅牢なトレーニングと評価を可能にする。結果は、RSCCの詳細な災害関連分析を促進する能力を強調し、リモートセンシングにおけるより正確で解釈可能でスケーラブルな視覚言語アプリケーションへの道を開いた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:04:27 GMT)
DAG: A Dual Causal Network for Time Series Forecasting with Exogenous Variables [22.4]
時系列予測は、経済学、トラフィック、AIOpsなど、さまざまな分野において重要である。本稿では,2つの因果ネットワークを時間次元とチャネル次元の両方に沿って利用する汎用フレームワークDAGを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:14:10 GMT)
Learning in Stackelberg Mean Field Games: A Non-Asymptotic Analysis [22.4]
Stackelberg平均フィールドゲーム(MFG)におけるポリシー最適化について検討する。本稿では,連続的に生成するマルコフサンプルを利用するシングルループアクター批判アルゴリズムAC-SMFGを提案する。アルゴリズムの有限時間および有限サンプル収束をスタックルバーグ目標の定常点に確立する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:58:31 GMT)
Internalizing Self-Consistency in Language Models: Multi-Agent Consensus Alignment [22.3]
言語モデル(LM)は矛盾する推論子であり、しばしば同じプロンプトに対する矛盾した応答を生成する。適切に整合した推論モデルの本質的な性質として自己整合性を定式化し、MACA(Multi-Agent Consensus Alignment)を導入する。 MACAは、エージェントが自分自身をより決定的かつ簡潔に教えることを可能にし、外部の監督なしにマルチエージェント設定におけるピアインサイトをより活用する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:27:28 GMT)
Sampling Method for Generalized Graph Signals with Pre-selected Vertices via DC Optimization [22.2]
本論文は, 一般理論に基づく最適回復を実現するために設計された, 広範囲なグラフ信号の分類法を含む。既存のフレキシブルサンプリングの方法は、サンプリング、必須包摂、または除外のためのアクティブ頂点の数を制御することができる。この効果は、様々なグラフ信号モデルの実験によって実証される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:57:52 GMT)
OpenLens AI: Fully Autonomous Research Agent for Health Infomatics [22.2]
OpenLens AIは、健康情報学に適した完全に自動化されたフレームワークである。文献レビュー、データ分析、コード生成、原稿作成のための特殊エージェントを統合している。このフレームワークは研究パイプライン全体を自動化し、出版可能な原稿を生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:25:57 GMT)
Learning Graph from Smooth Signals under Partial Observation: A Robustness Analysis [22.1]
バニラグラフトポロジ学習法は低域フィルタグラフ信号の部分的な観測に対して暗黙的に堅牢であることを示す。本研究では,スムーズ性に基づくグラフ学習の定式化により,観測ノードに対応する基底真理グラフトポロジーを復元できることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:09:40 GMT)
Dataset Distillation for Super-Resolution without Class Labels and Pre-trained Models [22.1]
ディープニューラルネットワークのトレーニングはますます需要を増し、大規模なデータセットと重要な計算リソースを必要としている。本稿では,クラスラベルや事前学習SRモデルを必要としない画像SRに対して,新しいデータ蒸留手法を提案する。実験結果から,本手法はトレーニングデータを大幅に削減し,計算時間を削減するとともに,最先端の性能を実現することが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:25:51 GMT)
Scalable Interconnect Learning in Boolean Networks [22.0]
我々は、入力幅が大きくなるにつれてパラメータ数が一定となる訓練可能な微分可能論理ネットワーク(DBN)を拡張した。性能に影響を与えずに冗長ゲートを除去するSATベースの論理等価パスと、等級的なグリーディベースラインを上回り、圧縮精度の良いトレードオフを提供する類似性に基づくデータ駆動パスの2つの相補的なプルーニングステージを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:18:15 GMT)
Attention Beyond Neighborhoods: Reviving Transformer for Graph Clustering [21.9]
Attentive Graph Clustering Network (AGCN)は、グラフが注目されているという概念を再解釈する新しいアーキテクチャである。 AGCNはアテンション機構をグラフ構造に埋め込み、効果的なグローバル情報抽出を可能にする。我々のフレームワークは、AGCNの挙動をグラフニューラルネットワーク(GNN)やトランスフォーマーと対比するために理論解析を取り入れている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:51:13 GMT)
Interactive Face Video Coding: A Generative Compression Framework [21.8]
本稿では,対話型顔映像符号化(IFVC)のための新しいフレームワークを提案する。提案手法には,超コンパクト表現,低遅延相互作用,鮮明な表現/重み付けアニメーションなど,いくつかの利点がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:11:08 GMT)
Self-Improving Embodied Foundation Models [21.8]
ロボット工学における2段階のポストトレーニング手法を提案する。第1段階であるSupervised Fine-Tuning (SFT) は、a) 行動クローニングとb) ステップ・トゥ・ゴーの予測目的の両方を用いたファインチューン事前訓練基礎モデルである。第2段階では、ステップ・トゥ・ゴー予測により、良好な形状の報酬関数と堅牢な成功検出器の抽出が可能となる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:00:08 GMT)
Undersampled Phase Retrieval with Image Priors [21.8]
我々は、構造化されたランダム測定を用いて、重度アンダーサンプリングの文脈において、様々な画像の先行性を評価する。以上の結果より, 再建が有意に改善し, 回復しきい値以下でも正確な再建が可能であることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:51:56 GMT)
Fairness-in-the-Workflow: How Machine Learning Practitioners at Big Tech Companies Approach Fairness in Recommender Systems [21.7]
大手テクノロジー企業におけるRS実践者のワークフローをマップします。既存のRSに公平さを取り入れる上で重要な課題を特定する。私たちはRSコミュニティに対して実行可能なレコメンデーションを提供します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:37:12 GMT)
DICE: Diffusion Consensus Equilibrium for Sparse-view CT Reconstruction [21.5]
Diffusion Consensus Equilibrium (DICE) は拡散モデルのサンプリングプロセスに2エージェントのコンセンサス平衡を統合するフレームワークである。実験の結果,DICEは高画質CT画像の再構成において最先端のベースラインを著しく上回ることがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:59:42 GMT)
ORCA: Agentic Reasoning For Hallucination and Adversarial Robustness in Vision-Language Models [21.4]
LVLM(Large Vision-Language Models)は、強力なマルチモーダル能力を示すが、固有のエラーによる幻覚や、外部の攻撃による敵攻撃に弱い。本稿では,事前学習したLVLMの現実的精度と対角的ロバスト性を向上するエージェント推論フレームワークORCAを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:17:23 GMT)
ASCoT: An Adaptive Self-Correction Chain-of-Thought Method for Late-Stage Fragility in LLMs [21.4]
CoT(Chain-of-Thought)の促進により,LLM(Large Language Models)の推論機能が大幅に向上した。 CoT鎖の後半で導入されたエラーは、当初と同一のエラーよりも、最終回答が著しく破損する可能性が高い。本稿では、この脆弱性に対処するために、適応自己補正連鎖法(ASCoT)を導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:45:51 GMT)
ToolSample: Dual Dynamic Sampling Methods with Curriculum Learning for RL-based Tool Learning [21.4]
本稿では,この課題に対処するためのフレームワークであるDSCL(Dynamic Smpling with Curriculum Learning)を紹介する。 DSCLは2つのコアコンポーネントを備えている。Reward-Based Dynamic Smplingは多次元の報酬統計(平均値と分散値)を使用して価値データを優先順位付けする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:04:49 GMT)
UCorr: Wire Detection and Depth Estimation for Autonomous Drones [21.2]
ワイヤセグメンテーションと深さ推定のためのモノクラーエンド・ツー・エンド・モデルとして,革新的な解を提案する。我々の結果は、自律ドローンの安全性と精度を高めるための我々のモデルの可能性を強調している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:21:52 GMT)
Beyond Surface Alignment: Rebuilding LLMs Safety Mechanism via Probabilistically Ablating Refusal Direction [21.0]
大規模言語モデル(LLM)に永続的な脅威をもたらす脱獄攻撃私たちはこれらの問題を克服する堅牢な安全アライメントフレームワークであるDeepRefusalを紹介します。本手法は,性能劣化を最小限に抑えながら,攻撃成功率を約95%削減する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:54:31 GMT)
Omni-CLST: Error-aware Curriculum Learning with guided Selective chain-of-Thought for audio question answering [20.9]
提案するOmni-Tは,Selective Chain-of-Thoughtを用いた誤り認識学習フレームワークである。我々は,Omni-TがMMAUminiで73.80%,MMARで64.30%を達成していることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:19:29 GMT)
Doppler Radiance Field-Guided Antenna Selection for Improved Generalization in Multi-Antenna Wi-Fi-based Human Activity Recognition [20.9]
雑音を抑えるためのマルチアンテナAPのための新しいフレームワークを提案し,DoRF整合誤差に基づいて最も情報性の高いアンテナを同定する。挑戦的な手動ジェスチャー認識データセットの実験結果から,提案したDoRF誘導Wi-FiベースのHARアプローチが一般化能力を大幅に向上することが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:40:14 GMT)
Digging Into the Internal: Causality-Based Analysis of LLM Function Calling [20.6]
FC(Function Calling)は,ユーザ命令による大規模言語モデルのコンプライアンスを大幅に向上させることができることを示す。我々は,従来のプロンプト法と比較してFCベースの命令の有効性を比較する実験を行った。 FCは、悪意のある入力を検知する従来のプロンプト法よりも平均で約135%の性能向上を示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:30:26 GMT)
TIDE: Achieving Balanced Subject-Driven Image Generation via Target-Instructed Diffusion Enhancement [20.4]
本稿では,TIDE(Target-Instructed Diffusion Enhancing)フレームワークについて紹介する。 TIDEの先駆者たちは、アジェクション画像、命令、ターゲット画像を用いて、対象適応ダイナミクスをモデル化する。その結果、TIDEは命令コンプライアンスを維持しつつ、主観的な出力を生成するのに優れた性能を示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:02:44 GMT)
NFL-BA: Near-Field Light Bundle Adjustment for SLAM in Dynamic Lighting [20.2]
本稿では, 近接場照明をバンドル調整損失の一部として明示的にモデル化した, 近場照明バンドル調整損失(NFL-BA)について紹介する。 NFL-BAは暗黙的または明示的なシーン表現を持つニューラルネットワークベースのSLAMシステムに統合することができる。本評価は,SLAMが自律ナビゲーション,非監視領域への誘導,盲点検出,3次元可視化を可能にする内視鏡的手順に重点を置いている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:33:03 GMT)
OnlineMate: An LLM-Based Multi-Agent Companion System for Cognitive Support in Online Learning [20.1]
大規模言語モデル(LLM)によって駆動されるマルチエージェント学習支援システムである OnlineMate を提案する。 OnlineMateは、ピアライクなエージェントの役割をシミュレートし、協調的な議論中に学習者の認知状態に適応し、誤解、混乱、モチベーションなどの心理的状態を推測する。シミュレーション学習シナリオにおける実験結果から,オンライン学習環境における認知的エンゲージメントを高めつつ,オンライン学習と議論を効果的に促進することが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:56:45 GMT)
Timestamp Manipulation: Timestamp-based Nakamoto-style Blockchains are Vulnerable [20.1]
タイムスタンプベースの中本型ブロックチェーンをターゲットとした攻撃を抑える最初のブロックとして,Staircase-Unrestricted Uncle Maker (SUUM)を紹介した。ブロックの保持、タイムスタンプ操作、難易度リスクコントロールを通じて、SUUMの敵はコストゼロで最小限の難易度リスク特性で永続的な攻撃を開始することができる。これにより、ブロックチェーンのセキュリティを脅かす自己強化サイクルが生成される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:39:41 GMT)
TriSPrompt: A Hierarchical Soft Prompt Model for Multimodal Rumor Detection with Incomplete Modalities [19.9]
提案する階層型ソフトプロンプトモデルtextsfTriSPromptは,3種類のプロンプト,すなわち,emphmodality-aware(MA)プロンプト,emphmodality-missing(MM)プロンプト,emphmutual-views(MV)プロンプトを統合する。 textsfTriSPromptは最先端の手法に比べて精度が13%以上向上している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:46:51 GMT)
Quantifying Self-Awareness of Knowledge in Large Language Models [19.9]
大きな言語モデルにおける幻覚予測は、しばしば自己認識の兆候として解釈される。このようなパフォーマンスは、真のモデル側イントロスペクションではなく、質問側ショートカットから生じる可能性がある、と我々は主張する。モデル側信号の利用を促進させるSCAOを導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:29:14 GMT)
MedVAL: Toward Expert-Level Medical Text Validation with Language Models [19.9]
LM生成医療用テキストの精度と安全性を即時評価する必要がある。現在、このような評価は手作業による医師の診察にのみ依存している。本稿では, 合成データを利用して評価者を訓練する新しい, 自己監督型, 効率的な蒸留法であるMedVALを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:11:49 GMT)
Quantifying Uncertainty in Natural Language Explanations of Large Language Models for Question Answering [19.9]
大規模言語モデル(LLM)は、質問応答タスクにおいて簡潔でコンテキスト対応の回答を可能にする強力な能力を示している。本稿では、これらの生成した自然言語説明のための新しい不確実性推定フレームワークを提案する。また、ノイズ下においても確実な不確実性を保証する新しい確実性推定法を設計する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:29:48 GMT)
Evaluating Multimodal Large Language Models on Spoken Sarcasm Understanding [19.6]
サーカスムの検出は、自然言語理解において依然として課題である。我々は,大言語モデル(LLM)と多モーダルLLMを,英語と中国語の皮肉検出のために体系的に評価した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:44:27 GMT)
From Ground Trust to Truth: Disparities in Offensive Language Judgments on Contemporary Korean Political Discourse [19.4]
本研究は、現代政治談話の大規模なデータセットを構築し、真理を欠いた3つの洗練された判断を用いた。我々は,各判断の異なるパターンを特定し,離脱戦略を用いてラベル合意の傾向を示した。これは、本質的な制約のある現実世界の設定に適用可能なアプローチを示唆している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:57:18 GMT)
Silenced voices: social media polarization and women's marginalization in peacebuilding during the Northern Ethiopia War [19.4]
本研究では,ソーシャルメディア,分極,対立の複雑な関係について検討する。これは、北エチオピア戦争を事例研究として、デジタル平和構築と女性の参加に焦点を当てている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:56:17 GMT)
Statistical Methods in Generative AI [19.4]
生成的人工知能は重要な技術として登場し、多くの分野で変革を約束している。デフォルトでは、生成AI技術には、正確性、安全性、公正性、その他の特性に関する保証がない。統計的手法は、生成AI技術の信頼性を改善するための有望なアプローチを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:33:20 GMT)
Sample Efficient Experience Replay in Non-stationary Environments [19.3]
非定常環境における強化学習(RL)は、ダイナミクスや報酬の変化によって過去の経験が急速に時代遅れになるため、困難である。従来の経験リプレイ(ER)法、特にTDエラー優先順位付け法は、エージェントのポリシーによって引き起こされる変化と環境から引き起こされる変化を区別するのに苦労する。本稿では、ポリシー更新と環境変更の両方に基づいて遷移を優先順位付けする適応型ERフレームワークである、環境優先体験再生(DEER)について紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:57:09 GMT)
Generative AI Meets Wireless Sensing: Towards Wireless Foundation Model [19.0]
Generative Artificial Intelligence (GenAI) はコンピュータビジョン (CV) や自然言語処理 (NLP) などの分野で大きな進歩を遂げている。近年,GenAIをワイヤレスセンシングシステムに統合することへの関心が高まっている。本稿では2つの相補的な視点から,GenAIの収束と無線センシングについて検討する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:51:25 GMT)
FG-PRM: Fine-grained Hallucination Detection and Mitigation in Language Model Mathematical Reasoning [18.9]
既存のアプローチは、主に幻覚の存在を検知するが、それらのタイプや表現の微妙な理解は欠如している。数学的推論タスクにおける一般的な幻覚を6つのタイプに分類する包括的分類法を導入する。次に,FG-PRM(FG-PRM)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:00:59 GMT)
Who to Trust? Aggregating Client Knowledge in Logit-Based Federated Learning [18.9]
フェデレーテッド・ラーニング(FL)は通常、モデルの重みや勾配を共有します。 LogitベースのFLは、パブリックプロキシデータセットで計算されたログのみを共有することで、このコストを削減する。本稿では、単純な平均化、不確実性重み付け平均化、学習されたメタアグリゲータという3つのロジットアグリゲーション手法を紹介し、比較する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:54:23 GMT)
VMDNet: Time Series Forecasting with Leakage-Free Samplewise Variational Mode Decomposition and Multibranch Decoding [18.9]
変分モード分解(VMD)は周期性を考慮した分解のための強力な信号処理手法である。我々は,VMDNetを提案する。VMDNetは因果保存のためのフレームワークで,リークを回避するためにサンプル単位のVMDを適用している。 2つのエネルギー関連データセットの実験により、VMDNetは周期性が強い場合に最先端の結果が得られることを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:02:14 GMT)
Causal Fingerprints of AI Generative Models [18.9]
完全なモデル指紋は、画像の出現とモデルトレースの因果関係を反映すべきである、と我々は主張する。本稿では、画像固有のコンテンツやスタイルから切り離す因果分離フレームワークを提案する。提案手法は, モデル属性における既存手法よりも優れており, 偽造検出, モデル著作権追跡, アイデンティティ保護の強力な可能性を示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:33:27 GMT)
Reconstruction of Differentially Private Text Sanitization via Large Language Models [18.8]
大規模言語モデル(LLM)は、DP対応のプロンプトから変更/削除されたプライバシを再構築することができる。 LLMのアクセシビリティに基づいた2つの攻撃(ブラックボックスとホワイトボックス)を提案する。本研究は、これらの有名なLCMが、既存のDPテキストサニタイズアプローチの新たなセキュリティリスクとして出現したことを示唆している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:14:05 GMT)
OpenViGA: Video Generation for Automotive Driving Scenes by Streamlining and Fine-Tuning Open Source Models with Public Data [18.7]
自動車運転シーンのためのオープンビデオ生成システムOpenViGAを提案する。 4fpsの256x256の画像サイズでは、1フレームのアルゴリズムによるレイテンシで、現実的なドライビングシーンビデオをフレーム単位で予測することが可能です。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:54:13 GMT)
Controllable Localized Face Anonymization Via Diffusion Inpainting [18.7]
そこで本研究では,遅延拡散モデルの塗装能力を活用して,現実的な匿名化画像を生成する統一フレームワークを提案する。従来の手法とは異なり、アダプティブ属性誘導モジュールを設計することで、匿名化プロセスを完全に制御できる。当社のフレームワークはローカライズされた匿名化もサポートしており、ユーザーはどの顔領域が変更されていないかを指定できる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:33:47 GMT)
Birds look like cars: Adversarial analysis of intrinsically interpretable deep learning [18.7]
設計による「本質的に」解釈可能なモデルの敵の操作に対する過度信頼と感受性に関連するリスクを強調した。潜伏プロトタイプの使用によってモデルの推論を養うことは、ディープニューラルネットワークの本質的非解釈可能性を示す。パートプロトタイプネットワークの制限が報告されたことにより、信頼性と適用性が疑問視され、(深い)解釈可能なモデルの堅牢性と整合性に関するさらなる研究が動機となった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:58:35 GMT)
FMGS-Avatar: Mesh-Guided 2D Gaussian Splatting with Foundation Model Priors for 3D Monocular Avatar Reconstruction [18.6]
2Dプリミティブをテンプレートメッシュ面に直接アタッチして位置、回転、動きを制限したメッシュガイド2Dガウススプラッティングを導入する。 Sapiensのような大規模データセットでトレーニングされた基礎モデルを活用して、モノクロビデオからの限られた視覚的手がかりを補完します。実験により, 従来の手法に比べて再現性は優れており, 幾何的精度と外観忠実度は顕著に向上した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:41:41 GMT)
CUFG: Curriculum Unlearning Guided by the Forgetting Gradient [18.6]
CUFG(Curriculum Unlearning via Forgetting Gradients)は、近似的アンラーニングの安定性を高める新しいフレームワークである。 CUFGは、微調整に基づく未学習のための勾配を忘れることによってガイドされる新しい勾配補正器を統合する。カリキュラムアンラーニングの概念には、かなりの研究の可能性を秘めていると信じている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:22:47 GMT)
Emergent Alignment via Competition [18.3]
人間のユーザが複数のミスアライメントAIエージェントと対話する戦略的な環境について検討する。私たちの重要な洞察は、ユーザユーティリティがエージェントユーティリティの凸内にある場合、戦略的競争は、完全に整合したモデルと相互作用する結果に匹敵する結果をもたらすことができるということです。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:47:00 GMT)
Collective Voice: Recovered-Peer Support Mediated by An LLM-Based Chatbot for Eating Disorder Recovery [18.3]
ピアリカバリの物語は、摂食障害の文脈における希望と持続的なリカバリを促進する。 RecoveryTellerは、EDから回復した人物として自らを描写した、回復したピアペルソナだ。本研究では,このような人物がピアリカバリ物語の支援能力の再現が可能かどうかを検討した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:38:58 GMT)
OmniSync: Towards Universal Lip Synchronization via Diffusion Transformers [18.2]
我々は,多様な視覚シナリオを対象とした共通唇同期フレームワークであるOmniSyncを紹介する。提案手法では,Diffusion Transformerモデルを用いたマスクのないトレーニングパラダイムを導入し,マスクを明示せずに直接フレーム編集を行う。 AI生成ビデオにおけるリップシンクのための最初の評価スイートであるAICLipSync Benchmarkも確立した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:02:49 GMT)
Semantic Representation Attack against Aligned Large Language Models [18.1]
大きな言語モデル(LLM)は、有害な出力を防ぐためにアライメント技術を採用する傾向にある。現在の手法は通常、限定収束、不自然なプロンプト、高い計算コストに苦しむ正確な肯定応答を目標としている。本稿では,LLMに対する敵対的目的を根本的に再認識する新しいパラダイムであるSemantic Representation Attackを紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:06:46 GMT)
Trade-offs in Cross-Domain Generalization of Foundation Model Fine-Tuned for Biometric Applications [18.1]
CLIPのようなファンデーションモデルは、多様な視覚タスクにまたがる例外的なゼロショットと少数ショットの転送機能を示している。しかし、高度に専門化された生体認証タスク、顔認識(FR)、モーフィングアタック検出(MAD)、プレゼンテーションアタック検出(PAD)は、過剰な特殊化に悩まされる可能性がある。 FR,MAD,PADに微調整されたCLIPの3つの事例を評価することで,これらのトレードオフを体系的に定量化する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:58:18 GMT)
GenKOL: Modular Generative AI Framework For Scalable Virtual KOL Generation [18.0]
GenKOLは、マーケティング専門家が生成AIを使用して高品質な仮想KOLイメージを効率的に生成できるようにするインタラクティブシステムである。ユーザは、複数のAI機能を統合する直感的なインターフェースを通じて、プロモーションビジュアルを動的に作成できる。当社のシステムは,ブランドコンテンツの生産を著しく効率化し,コストを低減し,スケーラブルな仮想KOL作成を加速することができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:07:05 GMT)
M4Diffuser: Multi-View Diffusion Policy with Manipulability-Aware Control for Robust Mobile Manipulation [18.0]
M4Diffuserは、マルチビュー拡散ポリシーとモバイル操作のための新しいReduceed and Manipulability-aware QPコントローラを統合するハイブリッドフレームワークである。提案手法は,スムーズな全身協調のための堅牢な性能と,目に見えないタスクへの強力な一般化を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:09:53 GMT)
Empathy-R1: A Chain-of-Empathy and Reinforcement Learning Framework for Long-Form Mental Health Support [18.0]
強化学習(Reinforcement Learning, RL)とCoE(Chain-of-Empathy)推論プロセスを統合する新しいフレームワークであるEmpathy-R1を紹介する。認知行動療法にインスパイアされた私たちのCoEパラダイムは、ヘルプ・シーカーの感情、原因、意図を逐次推論するためにモデルをガイドします。我々のフレームワークは、新しい大規模な中国のデータセット、共感-QA、および2段階のトレーニングプロセスによって強化されています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:16:09 GMT)
SERVAL: Surprisingly Effective Zero-Shot Visual Document Retrieval Powered by Large Vision and Language Models [17.9]
Visual Document Retrieval (VDR) は通常、文書イメージを直接埋め込むために訓練された特殊なバイエンコーダを使用してテキストから画像の検索を行う。我々はゼロショット生成・符号化パイプラインを再考し、まず視覚言語モデルを用いて各文書画像の詳細なテキスト記述を生成する。 ViDoRe-v2ベンチマークでは、63.4%のnDCG@5に達し、マルチベクトルビジュアルドキュメントエンコーダで最強である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:11:13 GMT)
LEED: A Highly Efficient and Scalable LLM-Empowered Expert Demonstrations Framework for Multi-Agent Reinforcement Learning [17.7]
マルチエージェント強化学習(MARL)は、複雑な環境でのインテリジェントな意思決定を大いに約束する。 LLMを利用した多エージェント強化学習(LEED)のためのエキスパートデモフレームワークを提案する。 LEEDはデモ生成(DG)モジュールとポリシー最適化(PO)モジュールの2つのコンポーネントで構成されている。実験の結果, LEEDは, 最先端のベースラインに比べて, サンプル効率, 時間効率, 堅牢性に優れていた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:19:24 GMT)
SALT4Decompile: Inferring Source-level Abstract Logic Tree for LLM-Based Binary Decompilation [17.6]
Saltmはバイナリとソースコードの間の安定した論理的特徴を抽象化する新しいバイナリ逆コンパイル法である。 Saltmはソースコードのロジックを回復するのに非常に効果的で、最先端のメソッドよりもはるかに優れている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:57:15 GMT)
UMA-Split: unimodal aggregation for both English and Mandarin non-autoregressive speech recognition [17.4]
本稿では,英語とマンダリンの音声認識のための一元的アグリゲーション(UMA)に基づく非自己回帰モデルを提案する。オリジナルのUMAは、同じテキストトークンの音響フレーム(最初は単調に増加し、その後減少する)を明示的に分割して集約し、通常の接続性時間分類よりも優れた表現を学習する。 1つの音節が複数のきめ細かいトークンにトークン化される、あるいはトークンが3つの音響フレーム未満に分散し、単調な重みを形成するのに失敗する、といった他の言語と競合する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:20:39 GMT)
SynParaSpeech: Automated Synthesis of Paralinguistic Datasets for Speech Generation and Understanding [17.4]
笑いやため息のようなパラ言語的な音は、より現実的で魅力的なスピーチを合成するのに不可欠である。大規模パラ言語データを生成するための自動フレームワークを提案し,それをSynParaSpeechデータセットの構築に適用する。データセットは6つのパラ言語カテゴリーで構成され、118.75時間のデータと正確なタイムスタンプは、いずれも自然な会話音声に由来する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:32:27 GMT)
PRISM: Product Retrieval In Shopping Carts using Hybrid Matching [17.4]
小売店舗における商品検索のためのハイブリッド手法であるPRISMを提案する。 PRISMは視覚言語モデルベースとピクセルワイドマッチングアプローチを使用する。提案するPRISMは,最先端画像検索手法を4.21%上回っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:15:37 GMT)
WorldForge: Unlocking Emergent 3D/4D Generation in Video Diffusion Model via Training-Free Guidance [17.3]
近年の映像拡散モデルでは, 空間知能タスクの潜在的な可能性を示す。 3つの密結合モジュールからなるトレーニング不要な推論時間フレームワークであるWorldForgeを提案する。本研究は,空間的知性に先立って生成的先行性を活用するための新たな視点を提供する,制御可能なビデオ合成のための新しいプラグイン・アンド・プレイパラダイムを導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:40:47 GMT)
Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld's Episode Theory [17.2]
本稿では,Schoenfeld のエピソード理論を応用して,大規模推論モデルの推論トレースを分析する手法を提案する。我々は,7つの認知ラベルを用いて,モデル生成解から数学問題への数千の文と段落を注釈付けした。予備分析では,認知状態間の遷移ダイナミクスなど,LRM推論の異なるパターンが明らかになった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:42:41 GMT)
Debias your Large Multi-Modal Model at Test-Time via Non-Contrastive Visual Attribute Steering [17.2]
大規模マルチモーダルモデル(LMM)のための学習自由脱バイアスフレームワークを提案する。我々のフレームワークは、保護された属性に対する参照を減らすステアリングベクトルを構築することによって、テキスト生成中のモデルの表現に介入する。実験の結果,これらの介入は,感情や流布を維持しつつ,保護属性に関連するテキストを生成するLMMの妥当性を効果的に低下させることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:58:56 GMT)
MedFuncta: A Unified Framework for Learning Efficient Medical Neural Fields [17.2]
各種医療信号の大規模NFトレーニングのための統合フレームワークであるMedFunctaを紹介する。我々のアプローチはデータを統一表現、すなわち1D潜在ベクトルにエンコードし、共有されたメタ学習NFを変調する。私たちはコード、モデルウェイト、およびマルチインスタンス医療NFのための500k以上の潜伏ベクトルを含む最初の大規模データセットMedNFをリリースしました。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:43:28 GMT)
FURINA: Free from Unmergeable Router via LINear Aggregation of mixed experts [17.1]
パラメータ効率の良い微調整のために,Mixture of Experts (MoE) をローランド適応 (LoRA) に統合することに成功している。既存のMoE-LoRA手法の鍵となる制限は、離散ルータに依存することである。我々は,LINear Aggregation of expertsに基づく,フリー・アグリゲーション・オブ・アンマージブル・ルータ・フレームワークであるFURINAを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:22:32 GMT)
Sea-ing Through Scattered Rays: Revisiting the Image Formation Model for Realistic Underwater Image Generation [17.0]
本稿では、一般的に省略される前方散乱項を含む改良された合成データ生成パイプラインを提案する。また、制御された濁度条件下でBUCKETデータセットを収集し、対応する基準画像を用いて実際の濁度映像を取得する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:42:24 GMT)
Explicit Context-Driven Neural Acoustic Modeling for High-Fidelity RIR Generation [17.0]
所与の場所で粗い部屋メッシュを問合せし,局所文脈の明示的な表現として距離分布を抽出するメッシュ注入型ニューラルネットワーク(MiNAF)を提案する。我々のアプローチは、明示的な局所幾何学的特徴を取り入れることで、より正確なRIR予測を生成する上で、ニューラルネットワークをより導出できることを実証している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:57:07 GMT)
Probing the Representational Power of Sparse Autoencoders in Vision Models [16.8]
スパースオートエンコーダ(SAE)は,大規模言語モデル(LLM)の隠蔽状態を解釈するための一般的なツールとして登場した。言語モデルに人気があるにもかかわらず、SAEは依然として視覚領域で研究されている。我々は、幅広い画像ベースタスクを用いて、視覚モデルに対するSAEの表現力を広範囲に評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:45:16 GMT)
Diffusion-Based Scenario Tree Generation for Multivariate Time Series Prediction and Multistage Stochastic Optimization [16.8]
Diffusion Scenario Tree (DST) は多変量予測タスクのためのシナリオツリーを構築するための一般的なフレームワークである。ニューヨーク州の日頭電力市場におけるエネルギー仲裁の最適化に関する枠組みを評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:49:05 GMT)
Towards Privacy-Preserving and Heterogeneity-aware Split Federated Learning via Probabilistic Masking [16.8]
スプリット・フェデレート・ラーニング(SFL)は、従来のフェデレート・ラーニング(FL)に代わる効果的な代替手段として登場した。本稿では,確率的マスクトレーニングを取り入れたスケーラブルかつプライバシ保護型SFLフレームワークPM-SFLを提案する。画像および無線センシングタスクの実験は、PM-SFLが一貫して精度、通信効率、プライバシー攻撃を改善することを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:28:08 GMT)
Let's Grow an Unbiased Community: Guiding the Fairness of Graphs via New Links [16.7]
グラフニューラルネットワーク(GNN)は、さまざまなアプリケーションで大きな成功を収めています。元のユーザグラフ構造は一般にバイアスを受けているが、新しいリンクを導入することで、これらの既存の構造をバイアスのないものへと導くことを約束している。フェアネス誘導グラフ上で訓練された下流タスクの公平性を保証するための,FairGuideという新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:15:50 GMT)
AnoF-Diff: One-Step Diffusion-Based Anomaly Detection for Forceful Tool Use [16.7]
本稿では, 時系列データから力トルク特徴を抽出し, 異常検出に力トルク特徴を用いる拡散モデルに基づくAnoF-Diffを提案する。我々は,F1スコアとAUROC(Area Under the Receiver Operating Characteristics curve)を4つのツール・タスクで比較した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:58:00 GMT)
Mind the Gap: A Closer Look at Tokenization for Multiple-Choice Question Answering with LLMs [16.4]
植民地の後に空間をトークン化する方法には合意がないが、しばしば自明な選択として見過ごされる。驚いたことに、私たちは1つの特定の戦略 -- 回答のレターとともにスペースをトークン化する -- を推奨できます。本研究は、注意深い評価設計の重要性を強調し、標準化された透明な評価プロトコルの必要性を強調した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:47:58 GMT)
Enhancing Feature Fusion of U-like Networks with Dynamic Skip Connections [16.3]
Uライクネットワークは、スキップ接続による医用画像セグメンテーションの基本的なフレームワークとなっている。従来のスキップ接続には、機能間制約と機能内制約の2つの重要な制限がある。本稿では,動的スキップ接続(DSC)ブロックを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:35:29 GMT)
A Multi-Scale Graph Neural Process with Cross-Drug Co-Attention for Drug-Drug Interactions Prediction [16.2]
本稿では,新しいマルチスケールグラフニューラルプロセスフレームワークMPNP-DDIを提案する。 MPNP-DDIのコアは、グラフ表現の階層構造を複数のスケールで学習するユニークなメッセージパス方式である。 MPNP-DDIは、ベンチマークデータセットの最先端ベースラインを著しく上回る。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:48:10 GMT)
Chain-of-Thought Re-ranking for Image Retrieval Tasks [16.1]
そこで我々は,画像検索に対処する新しいChain-of-Thought Re-Ranking(CoTRR)手法を提案する。 MLLMがリストワイズ推論を行えるようにすることで,グローバル比較,一貫した推論,解釈可能な意思決定をサポートする。提案手法は,テキスト・トゥ・イメージ検索(TIR),合成画像検索(CIR),チャットベースの画像検索(Chat-IR)など,3つの画像検索タスクにおける最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:48:46 GMT)
SPICE: An Automated SWE-Bench Labeling Pipeline for Issue Clarity, Test Coverage, and Effort Estimation [16.1]
SWEベンチスタイルのデータセットをラベル付けするためのスケーラブルで自動化されたパイプラインであるSPICEを紹介する。 SPICEは、コンテキスト対応のコードナビゲーション、合理化によるプロンプト、マルチパスコンセンサスを組み合わせて、専門家のアノテーションに近似したラベルを生成する。 SPICEツールとSPICE Benchは、SWE-Gymの291のオープンソースプロジェクトから収集された6,802のSPICEラベル付きインスタンスのデータセットです。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:44:18 GMT)
Survivability of Backdoor Attacks on Unconstrained Face Recognition Systems [16.0]
本稿では,顔認識システムを対象としたバックドア攻撃の包括的システムレベル解析について述べる。 20のパイプライン構成と15の攻撃シナリオを分析して、単一のバックドアが顔認識システム全体を損なう可能性があることを明らかにする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:06:37 GMT)
Brought a Gun to a Knife Fight: Modern VFM Baselines Outgun Specialized Detectors on In-the-Wild AI Image Detection [15.9]
現代ビジョン基礎モデル(VFM)における単純な線形分類器を提案する。同一データに基づいてトレーニングされたこのベースラインは、Wild内の精度を20%以上のマージンで決定的に向上させる。我々は、このアライメントと全体的な精度の両方が、VFMの事前訓練されたカットオフ日後にスクラップされた新しいデータセットに急降下するため、データ露出によるものであると推測する。 1)AI生成画像検出の現実世界での銃撃戦では、更新されたVFMの生火力の方がはるかに効果的である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:30:49 GMT)
Beyond Community Notes: A Framework for Understanding and Building Crowdsourced Context Systems [15.9]
ソーシャルメディアプラットフォームは、記事とともにクラウドソースされたコンテキストを表示する機能の開発が増えている。これらのシステムは、トップダウンのファクトチェックに代わるものとして、主要なプラットフォームが採用するにつれて、私たちの情報エコシステムを再構築する可能性がある。本フレームワークは理論的,設計的,倫理的視点を統合し,クラウドソーシング・コンテクストシステムに関する将来の人間中心研究の基盤を確立する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:17:18 GMT)
Language Modeling with Learned Meta-Tokens [15.9]
この研究は、メタトークンを使った新しいアプローチ、事前トレーニング中に注入された特別なトークン、およびこれらのトークンを使用するためのLMをガイドする専用のメタアテンションメカニズムを導入している。メタトークンを利用した100B未満のトークンで事前学習したデータ効率の言語モデルは、微調整後、これらのタスクに対して高い性能を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:38:48 GMT)
Leveraging Geometric Visual Illusions as Perceptual Inductive Biases for Vision Models [15.6]
合成・パラメトリックな幾何学的イリュージョンデータセットを導入し,画像ネットの分類目的と錯覚認識タスクを組み合わせた3つのマルチソース学習戦略を評価する。 i) 錯視を補助的指導として取り入れることで、特に複雑な輪郭や細かいテクスチャを含む視覚的に困難な場合において、一般化を体系的に改善する。これらの結果は、知覚科学と機械学習の新たな統合を実証し、視覚モデル設計に知覚の先行を埋め込むための新しい方向性を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:00:42 GMT)
Rationality Check! Benchmarking the Rationality of Large Language Models [15.6]
大規模言語モデル (LLM) の完全有理性を評価するための最初のベンチマークを提案する。このベンチマークには、使い易いツールキット、広範な実験結果、LLMが理想化された人間の合理性から収束して分岐する場所を照らす分析が含まれている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:23:56 GMT)
HARNESS: Lightweight Distilled Arabic Speech Foundation Models [15.4]
アラビア語中心の自己教師型音声モデルファミリであるHArnESSを紹介する。我々は、大きなバイリンガル・ハーネス・SSLモデル(HL)を訓練し、知識を圧縮された学生モデル(HS, HST)に蒸留する。我々は低ランク近似を用いて、教師の個別の監督を浅い薄いモデルに圧縮する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:30:37 GMT)
Security and Privacy Measurement on Chinese Consumer IoT Traffic based on Device Lifecycle [15.4]
本研究は,中国における消費者向けIoTデバイストラフィックに関する最初の大規模データセットを構築した。 38のブランドと12のデバイスカテゴリにまたがる77のデバイスからのトラフィックを集めています。他の地域と比較すると、中国の消費者向けIoTデバイスは国内サービスに依存している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:29:19 GMT)
Partial Column Generation with Graph Neural Networks for Team Formation and Routing [15.4]
複数の価格問題のある設定のための新しい部分列生成戦略を提案する。チーム形成とルーティングの問題に適した機械学習モデルを開発する。実験により,本手法の適用により解法が向上し,従来の部分列生成手法より優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:19:22 GMT)
IEFS-GMB: Gradient Memory Bank-Guided Feature Selection Based on Information Entropy for EEG Classification of Neurological Disorders [15.4]
グラディエントメモリバンクで案内される情報エントロピーに基づく特徴選択手法であるIEFS-GMBを提案する。 IEFS-GMBで拡張されたエンコーダは,ベースラインモデルよりも0.64%から6.45%の精度向上を実現している。また、4つの競合するFS技術より優れ、モデルの解釈性が向上し、臨床現場での実用性も向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:14:17 GMT)
LoCaL: Countering Surface Bias in Code Evaluation Metrics [15.2]
我々は4つの基準ベースコード評価指標(CEM)を批判的に評価する。本稿では,CEM評価ベンチマークであるLoCaLを提案する。その結果, 4つのCEMは, ベースラインに比べてLoCaLの性能が著しく低下していることが判明した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:13:41 GMT)
RGB-Only Supervised Camera Parameter Optimization in Dynamic Scenes [15.2]
COLMAPは、静的シーンにおけるカメラパラメータ最適化の主要な方法であり続けている。本稿では,RGBビデオのみを教師する動的シーンにおいて,より正確かつ効率的なカメラパラメータ最適化手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:29:07 GMT)
Exploit Tool Invocation Prompt for Tool Behavior Hijacking in LLM-Based Agentic System [15.2]
LLMベースのエージェントシステムは、大きな言語モデルを利用して、ユーザクエリの処理、決定、複雑なタスクのための外部ツールの実行を行う。これらのシステムにおいて重要なコンポーネントはツール起動プロンプト(TIP)であり、ツールインタラクションプロトコルを定義し、ツール使用のセキュリティと正しさを保証するためにLLMをガイドする。本研究では、TIP関連のセキュリティリスクを調査し、主要なLCMベースのシステムがリモートコード実行(RCE)やDoS(DoS)といった攻撃に対して脆弱であることを明らかにする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:38:28 GMT)
Hierarchical Self-Attention: Generalizing Neural Attention Mechanics to Multi-Scale Problems [15.0]
まず,マルチモーダル・マルチスケールデータを表す数学的構成法を提案する。次に,エントロピー最小化の第一原理から,提案した構造に対する神経的注意機構を数学的に導出する。導出した定式化は、標準ソフトマックスの注意に最も近いという意味で最適であることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:44:07 GMT)
Unsupervised Concept Vector Extraction for Bias Control in LLMs [14.8]
大規模言語モデル(LLM)は、ステレオタイプを永続し、バイアスを示すことが知られている。表現工学を応用して「ジェンダー」の概念がLLM内でどのように表現されるかを研究する。モデル予測の高精度なステアリングを可能にするプロジェクションベース手法を開発した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:59:48 GMT)
What Matters in LLM-Based Feature Extractor for Recommender? A Systematic Analysis of Prompts, Models, and Adaptation [14.8]
LLM-as-feature-extractorパイプラインを4つのモジュールに分解するモジュールフレームワークであるRecXploreを提案する。新しいテクニックを提案する代わりに、RecXploreは確立したメソッドを再検討し、整理し、各モジュールを分離して体系的な探索を可能にする。実験の結果、既存の技術から得られる最良の設計を組み合わせるだけで、NDCG@5が18.7%、HR@5が12.7%向上することがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:08:45 GMT)
Cloud-Edge Collaborative Data Anomaly Detection in Industrial Sensor Networks [14.8]
本稿では,産業用センサネットワークにおけるクラウド・エッジ協調データ異常検出手法を提案する。それは、個々のエッジにデプロイされたセンサーデータ検出モデルと、クラウドにデプロイされたセンサーデータ分析モデルで構成される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:21:26 GMT)
Llama-Mimi: Speech Language Models with Interleaved Semantic and Acoustic Tokens [14.7]
Llama-Mimiは、統一トークン化器と単一トランスフォーマーデコーダを使用する言語モデルである。総合評価は,Llama-Mimiが音の整合性において最先端の性能を達成することを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:00:07 GMT)
Pluralistic Alignment for Healthcare: A Role-Driven Framework [14.6]
多様な視点と価値をシミュレートするために,まず軽量で一般化可能な多元的アライメントアプローチ EthosAgents を提案する。実験により、7つの異なる大きさのオープンおよびクローズドモデルにまたがる3つのモードの多元的アライメントが進行することを示す。以上の結果から,健康関連多元主義は適応的かつ規範的アプローチを要求され,これらのモデルが他のハイテイク領域の多様性をいかに尊重するかについての洞察を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:57:40 GMT)
RespoDiff: Dual-Module Bottleneck Transformation for Responsible & Faithful T2I Generation [14.6]
RespoDiffは、責任あるテキスト-画像生成のための新しいフレームワークである。我々のアプローチは、様々なプロンプトにまたがって、責任と意味的コヒーレントな生成を20%改善する。 SDXLのような大型モデルにシームレスに統合され、公正性と安全性が向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:48:46 GMT)
Semiparametric Learning from Open-Set Label Shift Data [14.5]
オープンセットラベルシフト問題について検討し、テストデータにはトレーニングに欠席した新しいクラスが含まれる可能性がある。この設定は、クラス比率と新しいクラスの分布の両方が余分な仮定なしでは識別できないため、難しい。本稿では,新しいクラスと既知のクラス間の重なりを許容しながら,識別可能性を保証する半パラメトリック密度比モデルフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:32:29 GMT)
NeRF-based Visualization of 3D Cues Supporting Data-Driven Spacecraft Pose Estimation [14.4]
軌道上での操作では、チェッカー宇宙船とターゲットの間の相対的な6Dポーズを推定する必要がある。データ駆動型宇宙船のポーズ推定法が開発されているが、実際のミッションへの採用は意思決定プロセスの理解の欠如によって妨げられている。本稿では,ポーズ推定器が依存する3次元視覚的手がかりを可視化する手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:10:47 GMT)
Domain Generalization for In-Orbit 6D Pose Estimation [14.4]
宇宙船のポーズ推定ネットワークのための,エンドツーエンドのニューラルベースアーキテクチャを提案する。提案手法はドメインギャップを効果的に閉鎖し,SPEED+データセット上で最先端の精度を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:59:31 GMT)
Personalized Real-time Jargon Support for Online Meetings [14.1]
ParseJargonはリアルタイムにパーソナライズされたjargon識別と説明を提供する対話型システムである。追跡調査では、リアルタイムミーティングにおけるParseJargonのユーザビリティと実践的価値が検証された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:54:38 GMT)
Communication Efficient Split Learning of ViTs with Attention-based Double Compression [14.1]
本稿では,Attention-based Double Compression (ADC) という通信効率のよいスプリットラーニング(SL)フレームワークを提案する。 ADCは2つの並列圧縮戦略を取り入れている。シミュレーションの結果、注意に基づくダブル圧縮は最先端のSLフレームワークよりも優れていた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:22:24 GMT)
Strong converse exponent of channel interconversion [14.0]
本稿では, 対応するR'enyiチャネル容量の差を考慮した単純な最適化により, 高精度な逆指数が特徴づけられることを示す。さらに、この結果を古典量子チャネルの絡み合い支援変換に拡張する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:54:01 GMT)
AutoEdit: Automatic Hyperparameter Tuning for Image Editing [13.7]
マルコフ決定過程を確立する強化学習フレームワークを提案する。既存のブルートフォース手法と比較して,探索時間と計算オーバーヘッドが大幅に低減された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:56:50 GMT)
Linguistic Generalizations are not Rules: Impacts on Evaluation of LMs [13.7]
LMがいかにうまく一般化するかの言語学的評価は、自然言語は象徴的な規則によって生成されるという当然の事である。ここでは、LMが象徴的なルールに従わなかったことはバグではなく機能かもしれないことを示唆する。新しい発話は、柔軟性、相互関連性、文脈に依存した構成の組み合わせによって生成され、理解される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:12:24 GMT)
Diffusion-Based Action Recognition Generalizes to Untrained Domains [13.6]
本研究では,視覚拡散モデルにより生成された特徴を用いて,人間の行動認識を実現することを提案する。動物種間での行動分類におけるアプローチの一般化特性を実験的に検討した。我々のモデルは、3つの一般化ベンチマークにまたがって新しい最先端のモデルを設定し、マシンアクション認識を人間のような堅牢性に近づける。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:59:19 GMT)
MeanFlowSE: one-step generative speech enhancement via conditional mean flow [13.4]
MeanFlowSEは、軌道に沿った有限区間の平均速度を学習する条件付き生成モデルである。 VoiceBank-DEMANDでは、シングルステップモデルは多ステップベースラインよりも計算コストが大幅に低い強い知性、忠実性、知覚品質を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:24:47 GMT)
Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play Reinforcement Learning [13.4]
我々は3v3マルチドローンバレーボールを習うことの課題に取り組む。このタスクには、高レベルの戦略的調整と低レベルのアジャイル管理の両方が必要です。階層型強化学習フレームワークである階層型自己学習を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:58:13 GMT)
Gap-Dependent Bounds for Federated $Q$-learning [13.4]
有限水平マルコフ決定過程(MDPs)におけるオンラインフェデレーション$Q$Learningに対する後悔とコミュニケーションコストの最初のギャップ依存分析を提示する。我々の新しいフレームワークは、厳密な正の準最適ギャップのようなMDPの良質な構造を利用して、$log T$-type regret boundと洗練された通信コストboundを達成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:17:35 GMT)
Listening, Imagining \& Refining: A Heuristic Optimized ASR Correction Framework with LLMs [13.3]
LIR-ASR は "Listening-Imagining-Refining" 戦略を適用し、音素の変種を生成し、文脈でそれらを精製する。英語と中国語の両方のASR出力の実験では、LIR-ASR平均は最大1.5ポイントのCER/WERの減少を達成している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:50:54 GMT)
CbLDM: A Diffusion Model for recovering nanostructure from pair distribution function [13.2]
本稿では,ナノ構造を復元するためにPDFを使用するという課題に焦点をあてる。条件ベース遅延拡散モデルである深層学習モデルCbLDMを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:26:28 GMT)
Brain-HGCN: A Hyperbolic Graph Convolutional Network for Brain Functional Network Analysis [12.9]
双曲幾何学に基づく幾何学的深層学習フレームワークBrain-HGCNを提案する。精神疾患分類のための2つの大規模fMRIデータセットの実験は、我々のアプローチが最先端のユークリッドベースラインを大きく上回っていることを示している。この研究は、fMRI分析のための新しい幾何学的深層学習パラダイムを開拓し、計算心理学の分野における双曲型GNNの潜在可能性を強調した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:55:02 GMT)
Beyond Random Masking: A Dual-Stream Approach for Rotation-Invariant Point Cloud Masked Autoencoders [12.9]
既存の回転不変点クラウドマスキングオートエンコーダは、幾何学的構造とセマンティックコヒーレンスを見下ろすランダムマスキング戦略に依存している。本稿では3次元空間格子マスキングとプログレッシブ・セマンティック・マスキングを組み合わせた二重ストリームマスキング手法を提案する。我々の戦略は、アーキテクチャの変更なしに既存の回転不変フレームワークに統合され、異なるアプローチで広範な互換性が保証されます。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:06:13 GMT)
A-TDOM: Active TDOM via On-the-Fly 3DGS [12.8]
A-TDOM は On-the-Fly 3DGS 最適化に基づくリアルタイム TDOM 生成手法である。提案したA-TDOMは、TDOMをほぼリアルタイムで高速にレンダリングすることができ、新しい画像ごとに3DGSの最適化を行うことができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:45:24 GMT)
From Turn-Taking to Synchronous Dialogue: A Survey of Full-Duplex Spoken Language Models [12.7]
フルデュープレックス音声通信は、自然なターンテイク、重複する音声、中断と同時聴取と会話を可能にする。本調査はFD-SLM(Full-Duplex Spoken Language Models)を包括的にレビューする。同期データの不足、アーキテクチャのばらつき、評価ギャップなど、基本的な課題を特定します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:00:58 GMT)
Adaptive LoRA Experts Allocation and Selection for Federated Fine-Tuning [12.7]
Federated Learning(FL)は、プライバシ保護ソリューションを提供するが、計算制約による課題に直面している。 Low-Rank Adaptation (LoRA) はパラメータ効率の良い微調整手法として登場した。我々は、ドメイン固有のLoRAエキスパートを割り当て、訓練するための表現類似性に基づいてクライアントを適応的にクラスタ化する新しいフレームワークであるFedLEASEを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:43:33 GMT)
LowDiff: Efficient Diffusion Sampling with Low-Resolution Condition [12.7]
LowDiffは、カスケードアプローチに基づく、新しく効率的な拡散フレームワークである。 LowDiffは、低解像度から所望の解像度まで画像を段階的に洗練する統一モデルを採用している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:31:56 GMT)
Efficient RAW Image Deblurring with Adaptive Frequency Modulation [12.7]
RAW画像の劣化は、特に周波数依存のぼかしを扱う際、ユニークな課題を示す。本稿では、RAW-to-RAWデブロアリング用に設計されたフレームワークである周波数拡張ネットワーク(FrENet)を提案する。実験により,FrENetはRAW画像の劣化における最先端の劣化手法を超越していることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:46:36 GMT)
DPANet: Dual Pyramid Attention Network for Multivariate Time Series Forecasting [12.7]
我々はDPANetの重要成分を検証するために厳密なアブレーション研究を行った。完全なモデルは、すべての変種を一貫して上回る。この結果は、我々の対話型融合ブロックが最も重要なコンポーネントであることを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:35:21 GMT)
AD-DINOv3: Enhancing DINOv3 for Zero-Shot Anomaly Detection with Anomaly-Aware Calibration [12.6]
Zero-Shot Anomaly Detection (ZSAD)は、任意の新しいカテゴリから異常を識別する。最近のDINOv3のようなビジョン基礎モデルは、強力な転送可能な表現能力を示している。本稿では,ZSAD用に設計された新しい視覚言語マルチモーダルフレームワークであるAD-DINOv3を紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:19:00 GMT)
HybridMamba: A Dual-domain Mamba for 3D Medical Image Segmentation [12.6]
Mambaは、CNN固有の長距離依存関係をモデリングする際の制限に対処する上で、優れたパフォーマンスを示している。二重補完機構を用いたアーキテクチャであるHybridMambaを提案する。 MRIおよびCTデータセットの実験により、HybridMambaは3次元医用画像のセグメンテーションにおいて最先端の手法を大幅に上回っていることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:32:49 GMT)
On Finite-Blocklength Noisy Classical-Quantum Channel Coding With Amplitude Damping Errors [12.5]
量子振幅減衰チャネル(ADC)上での実用的な有限ブロック長古典量子チャネル符号化について検討する。以上の結果から, 有限ブロック長の場合, 単純 (符号なし) なアプローチではADCに対する優位性は得られなかったことが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:16:29 GMT)
Gender and Political Bias in Large Language Models: A Demonstration Platform [12.2]
ParlAI Voteは欧州議会で議論や投票を行うための対話的なシステムである。性別、年齢、国、政治的グループなどの人口統計が豊富である。ユーザーは討論を閲覧したり、リンクされたスピーチを検査したり、実際の投票結果とフロンティアのLSMの予測を比較することができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:34:33 GMT)
JaneEye: A 12-nm 2K-FPS 18.9-$μ$J/Frame Event-based Eye Tracking Accelerator [12.2]
JaneEyeは、ウェアラブルデバイスのためのエネルギー効率の高いイベントベースのアイトラッキングハードウェアアクセラレータだ。提案モデルでは,最大1250Hzのイベントフレームレートを持つ17.6Kパラメータのみを用いて,3ET+データセットの画素誤差2.45の高精度化を実現している。 12nm ASIC の実装は 400MHz で動作するため、エンドツーエンドのレイテンシは 0.5 ms で、エネルギー効率は 18.9$mu$J/frame である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:37:49 GMT)
NeuroRAD-FM: A Foundation Model for Neuro-Oncology with Distributionally Robust Training [12.2]
既存の基礎モデル(FM)は、異常な分子マーカーを予測するのに不十分である。我々は,腫瘍の表現型を正確に推定できる分布的ロバストな損失関数を有する神経腫瘍学特異的FMを開発した。 CUIMC 0.592 から 0.597 に、UPenn 0.647 から 0.672 に、UCSF 0.600 から 0.627 に改良された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:43:08 GMT)
End4: End-to-end Denoising Diffusion for Diffusion-Based Inpainting Detection [12.1]
本稿では,エンド・ツー・エンドの復調拡散(End4)に基づく新しい検出手法を提案する。コードとデータセットはまもなくリリースされます。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:03:18 GMT)
An Evaluation-Centric Paradigm for Scientific Visualization Agents [12.0]
本稿では,SciVisエージェントに必要な各種評価方法について検討する。我々は、SciVisエージェント評価ベンチマークを開発するためのより広範なコラボレーションを提唱する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:08:23 GMT)
Transplant-Ready? Evaluating AI Lung Segmentation Models in Candidates with Severe Lung Disease [11.9]
本研究は, 移植既往の患者において, 利用可能な深層学習に基づく肺セグメンテーションモデルについて検討した。 Unet-R231は評価されたモデルの中で最も正確な自動肺セグメンテーションを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:42:43 GMT)
No Modality Left Behind: Adapting to Missing Modalities via Knowledge Distillation for Brain Tumor Segmentation [11.8]
AdaMMは、欠落したモダリティシナリオに適したマルチモーダル脳腫瘍セグメンテーションフレームワークである。 AdaMMは既存の手法を一貫して上回り、セグメンテーション精度とロバスト性に優れる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:47:20 GMT)
Set Phasers to Stun: Beaming Power and Control to Mobile Robots with Laser Light [11.6]
本稿では、狭ビームレーザー光を移動ロボットに誘導し、同時に無線による電力供給と通信を行うシステムであるPhaserを提案する。高出力ビームステアリングによる立体視に基づく3次元ロボットトラッキングの融合を実現するための半自動キャリブレーション手法を設計する。 Phaserは110 mW/cm$2$以上の光パワー密度とエラーのないデータをマルチメートル範囲の移動ロボットに供給する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:34:13 GMT)
Physics-Informed Representation Alignment for Sparse Radio-Map Reconstruction [11.6]
無線地図の再構成は高度な応用の実現には不可欠であるが、複雑な信号伝搬やスパース観測データといった課題は、現実的なシナリオにおいて正確な再構成を妨げている。既存の手法は、特にスパース測定条件下では、物理的制約とデータ駆動的特徴の整合に失敗することが多い。 We propose **Phy**sics- **R**adio **M**ap **D**iffusion **M**odel (**PhyRMDM**)。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:50:14 GMT)
What's the Best Way to Retrieve Slides? A Comparative Study of Multimodal, Caption-Based, and Hybrid Retrieval Techniques [11.4]
テキスト、画像、チャートを組み合わせたマルチモダリティは、検索強化生成システムの課題を提示する。本論文では,ColPaliのような視覚的遅延相互作用埋め込みモデル,視覚的リランカの利用,密集検索とBM25を組み合わせたハイブリッド検索など,効果的なスライド検索手法について検討する。ビジョンランゲージモデルに基づく新しいキャプションパイプラインも評価され、視覚的遅延動作技術と比較して埋め込みストレージの要求が大幅に低減された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:57:07 GMT)
What Gets Measured Gets Managed: Mitigating Supply Chain Attacks with a Link Integrity Management System [11.4]
LiMSは、最小限のオーバーヘッドでWebブラウジングセッションにおけるリンク整合性の保証をブートストラップする透過的なシステムである。総合的な整合性ポリシーの構成要素として基本的な整合性ポリシーがどのように機能するかを論じる。 450ドメインの代表サンプルのデプロイをシミュレートして,オープンソースプロトタイプの評価を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:33:24 GMT)
Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale [11.2]
VLA(Vision-Language-Action Model)は、専門的なアーキテクチャと専門家ポリシーのタスクに適したコンポーネントを、大規模なデータ収集とセットアップ固有の微調整に置き換える。従来のロボットソフトウェアフレームワークはボトルネックとなり、ロボットシミュレーションは、実世界の実験への移行を限定的にサポートする。我々は、大規模なジェネラリストポリシーによるロボット学習の研究を支援するために、ゼロから設計されたリーンエコシステムであるRobot Control Stack (RCS)を紹介した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:12:16 GMT)
Quantum steering and discord in hyperon-antihyperon system in electron-positron annihilation [11.1]
電子-陽電子消滅で生成するハイパーオン-反ハイペロン系において、量子ステアリングと不協和という2種類の量子相関を解析する。これらの量子相関の挙動は、偏光効果によりトップクォークやタウレプトンのような素粒子-反粒子系のものと異なる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:22:34 GMT)
Pseudo-Label Enhanced Cascaded Framework: 2nd Technical Report for LSVOS 2025 VOS Track [11.1]
複雑なビデオオブジェクト(VOS)は、フレーム間でオブジェクトを正確にセグメンテーションする上で重要な課題である。 SAM2 フレームワークに基づく LSVOS 2025 VOS Track のソリューションを提案する。私たちはMOSEテストセットで0.8616のJ&Fスコア(SAM2Longベースラインで+1.4ポイント)を獲得し、LSVOS 2025 VOSトラックで2位を確保しました。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:23:51 GMT)
scSplit: Bringing Severity Cognizance to Image Decomposition in Fluorescence Microscopy [11.0]
計算多重化技術は、複数の細胞構造を単一の画像で捉え、後に未混合にすることを可能にする。与えられた入力に対する重ね合わせ画像の相対強度(混合比)が未定であることに注意する必要がある。 i) 与えられた入力画像の劣化レベル(混合)を予測する訓練された回帰器ネットワークと(ii) 劣化特異的正規化モジュールを導入し、劣化認識推論を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:23:00 GMT)
Fracture interactive geodesic active contours for bone segmentation [11.0]
本稿では,骨セグメント化に適したフラクチャーインタラクティブな測地活動輪郭法を提案する。整形外科的知識に触発され,骨の縁に向かって輪郭を案内する新しいエッジ検出関数を構築した。我々のアルゴリズムはまた、ドメイン知識とディープニューラルネットワークの組み合わせに関する洞察を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:18:29 GMT)
MaskAttn-SDXL: Controllable Region-Level Text-To-Image Generation [10.9]
安定拡散XL(SDXL)のUNetのクロスアテンションロジットに適用した領域レベルのゲーティング機構であるMaskAttn-SDXLを提案する。 MaskAttn-SDXLは、層ごとのバイナリマスクを学習し、トークン間相互作用をスパシフィケートするために、ソフトマックスの前に各アテンションロジットマップにそれを注入する。画像の質と多様性を保ちながら,マルチオブジェクトプロンプトにおける空間コンプライアンスと属性バインディングを改善した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:57:47 GMT)
Rate doubly robust estimation for weighted average treatment effects [10.9]
重み付き平均治療効果(英: weighted average treatment effect、WATE)は、確率スコアの重みによって特徴づけられる集団の因果推定値の多様類を定義する。 WATEは、これらの分野の多くのデータセットが、そのフレームワークと一致しているため、社会的および医学的な研究に広く適用可能である。特定の速度と規則性条件下での3つのRDR推定器を提案し,その性能をモンテカルロシミュレーションを用いて評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:26:56 GMT)
A Real-Time Multi-Model Parametric Representation of Point Clouds [10.9]
実時間表面検出とフィッティングを併用したマルチモデルパラメトリック表現を提案する。この表現は、低消費電力のオンボードコンピュータ上で36.4fpsで動作するガウス混合モデルよりも精度が2倍向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:23:51 GMT)
Cross-Modal Knowledge Distillation for Speech Large Language Models [10.8]
音声機能の導入は,入力がテキストのままであっても,知識や推論を損なう可能性があることを示す。本稿では,テキスト・トゥ・テキスト・チャンネルと音声・テキスト・チャンネルの両方を活用して,テキスト・ベースの教師モデルから音声LLMへ知識を伝達するクロスモーダルな知識蒸留フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:07:53 GMT)
Noise Supervised Contrastive Learning and Feature-Perturbed for Anomalous Sound Detection [10.8]
教師なし異常音検出は,正常な音声データのみを用いてモデルを訓練することにより未知の異常音を検出することを目的としている。本稿では,一段階教師付きコントラスト学習(OS-SCL)と呼ばれる新しい学習手法を提案する。 OS-SCLは、埋め込み空間の機能を摂動させ、一段階のノイズ制御型コントラスト学習アプローチを採用することでこの問題に対処する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:34:38 GMT)
FCPE: A Fast Context-based Pitch Estimation Model [10.8]
本稿では,低計算コストと頑健な耐雑音性を維持しつつ,メルスペクトルの特徴を捉える高速な文脈ベースピッチ推定モデルを提案する。実験の結果,MIR-1Kデータセット上で96.79%のRAW Pitch Accuracy(RPA)が達成された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:50:09 GMT)
Beyond Spurious Signals: Debiasing Multimodal Large Language Models via Counterfactual Inference and Adaptive Expert Routing [10.7]
MLLM(Multimodal Large Language Models)は、視覚情報とテキスト情報を統合する能力を示すが、しばしば素早い相関に頼っている。本稿では,MLLMの表層相関バイアスに対する批判的課題を,新たな因果媒介に基づく脱バイアスフレームワークを通じて解決する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:01:11 GMT)
AR-KAN: Autoregressive-Weight-Enhanced Kolmogorov-Arnold Network for Time Series Forecasting [10.7]
時間記憶のための事前学習ARモジュールと非線形表現のためのkanを統合した自己回帰強化コルモゴロフ・アルノルドネットワーク(AR-KAN)を提案する。 AR-KANはARIMAとほぼ周期関数で一致し、72%のRdatasetsシリーズで最高の結果を得る。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:57:01 GMT)
StFT: Spatio-temporal Fourier Transformer for Long-term Dynamics Prediction [10.6]
本稿では,自動回帰時変変換器(FTStours)を提案する。 FTStoursは、マクロスケールとマイクロスペーススケールの両方にわたる基礎となるダイナミクスをキャプチャする。 3つのベンチマークデータセットで行った評価は、最先端のML手法に対する我々のアプローチの利点を示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:41:01 GMT)
One-step Multi-view Clustering With Adaptive Low-rank Anchor-graph Learning [10.6]
適応型低ランクアンカーグラフ学習(OMCAL)を用いた一段階のマルチビュークラスタリング手法を開発した。高品質なCAGを構築するために、OMCALは、情報冗長性とノイズ干渉に対する核ノルムに基づく適応CAG学習モデルを提供する。 OMCALはクラスタリングの有効性と効率の点で既存の最先端手法よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:17:52 GMT)
Towards Human-like Multimodal Conversational Agent by Generating Engaging Speech [10.6]
本研究では,会話のムードと応答型情報に基づいて,音声応答を生成するヒューマンライクなエージェントを提案する。エージェントが自然言語を生成できるようにするために,音声に着目した新しいマルチセンサ会話データセットを構築した。実験結果から,会話における視覚的・音声的モダリティの両面を利用した係り受け音声生成の有効性が示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:14:10 GMT)
Music4All A+A: A Multimodal Dataset for Music Information Retrieval Tasks [10.5]
音楽は様々なレベルの粒度で説明できる。 Music4All A+Aは、音楽アーティストやアルバムに基づいたマルチモーダルMIRタスクのためのデータセットである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:10:58 GMT)
Fovea Stacking: Imaging with Dynamic Localized Aberration Correction [10.4]
Fovea Stackingは、デフォルマブル位相プレート(DPP)と呼ばれる動的光学部品を局所的な収差補正に利用する新しいタイプのイメージングシステムである。微分可能な光学モデルによりDPP変形を最適化することにより、オフ軸収差を局所的に補正し、眼窩に類似した、固定点での鋭さを増強したファーベレーション画像を生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:36:32 GMT)
Evaluation and Facilitation of Online Discussions in the LLM Era: A Survey [10.3]
本稿では, LLM の可能性に着目し, オンライン討論の質を評価・向上する手法について調査する。本研究は,NLPと社会科学のアイデアを総合し,(a)議論品質評価の新しい分類法,(b)介入・ファシリテーション戦略の概要,(c)会話ファシリテーションデータセットの新しい分類法を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:26:24 GMT)
Analysis Plug-and-Play Methods for Imaging Inverse Problems [10.2]
Plug-and-Play Priorsは、画像からノイズを取り除くために訓練されたデノイザーの形で事前処理を統合することで、逆イメージング問題を解決するための一般的なフレームワークである。本稿では,代替分析の定式化について考察する。前者は、その勾配のような画像の表現に課される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:01:44 GMT)
V-SEAM: Visual Semantic Editing and Attention Modulating for Causal Interpretability of Vision-Language Models [10.1]
本稿では,視覚言語モデルの因果的解釈に視覚意味編集と注意調整を組み合わせた新しいフレームワークであるV-SEAMを紹介する。 V-SEAMは3つの意味レベルにわたる予測に肯定的あるいは否定的な貢献で注目の頭を認識する。 3種類のVQAベンチマークでLLaVAとInstructBLIPの性能向上を示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:58:34 GMT)
Impact of Phonetics on Speaker Identity in Adversarial Voice Attack [10.0]
音声の対立摂動は、自動音声認識(ASR)と話者検証に深刻な脅威をもたらす。本研究は, 母音集中化や子音置換などの系統的混乱を利用した摂動が, 声道レベルでの逆方向の音声を解析し, 摂動が生ずることを示す。 16の音節にまたがる実験結果から,敵対的音声は転写誤りと同一性ドリフトの両方を誘発することが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:19:53 GMT)
An Empirical Study of Position Bias in Modern Information Retrieval [10.0]
本研究では,情報検索における位置バイアスについて検討する。モデルは、後から現れる意味的に関連する情報を無視しながら、通過の開始時にコンテンツを過度に強調する傾向がある。実験により, 関連する情報が通過中に現れると, 密埋モデルとコルバート式モデルが著しく性能劣化することが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:50:24 GMT)
Simultaneous Speedmeter and Position-Meter Response in a Single Tabletop Interferometer [9.9]
量子放射圧ノイズ(QRPN)は重力波検出器の低周波感度を制限する。速度計の概念は、位置ではなくテスト質量速度を測定することによって、ソースでのQRPNを避ける。移動試験質量を持つ系における速度計の挙動に関する最初の実験的検討を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:14:43 GMT)
Catch Me If You Can? Not Yet: LLMs Still Struggle to Imitate the Implicit Writing Styles of Everyday Authors [9.9]
本研究は,大規模言語モデルの個人記述スタイルを模倣する能力を包括的に評価する。著者の帰属、著者の検証、スタイルマッチング、AI検出など、補完的な指標の集合体を導入し、スタイルの模倣を頑健に評価する。結果は、LLMがニュースやメールなどの構造化フォーマットでユーザスタイルを近似できる一方で、ブログやフォーラムでの曖昧で非公式な書き込みに苦労していることを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:18:49 GMT)
Exact Coset Sampling for Quantum Lattice Algorithms [9.9]
複雑なGaussian windowcitepchen2024quantumを用いた最近のウィンドウ付きQFT格子アルゴリズムのステップ9において、競合する領域拡張'をシンプルかつ確実に置き換える。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:43:19 GMT)
SWAT: Sliding Window Adversarial Training for Gradual Domain Adaptation [9.9]
ドメインシフトは、機械学習のパフォーマンスを損なう重要な問題である。教師なしのドメイン適応(UDA)は、ドメインシフトが急激で急激なときに悩む。 Sliding Window Adversarial Training (SWAT) for Gradual Domain Adaptation (GDA)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:52:33 GMT)
EchoVLM: Dynamic Mixture-of-Experts Vision-Language Model for Universal Ultrasound Intelligence [9.7]
本稿では,超音波医療画像に特化して設計された視覚言語モデルであるEchoVLMを提案する。このモデルは、7つの解剖学的領域にまたがるデータに基づいてトレーニングされたMixture of Experts (MoE)アーキテクチャを採用している。 EchoVLMは、それぞれBLEU-1スコアとROUGE-1スコアで10.15点と4.77点を大きく改善した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:07:53 GMT)
Screener: Self-supervised Pathology Segmentation in Medical CT Images [9.7]
我々は、教師なしの視覚異常セグメンテーション問題として、病理診断の枠組みを定めている。既存の密度ベースUVASフレームワークを2つの重要なイノベーションで強化する。 3万枚以上のラベルのない3DCTボリュームでトレーニングされた当社の完全自己監督型モデル、Screenerは、既存のUVAS法より優れています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:50:33 GMT)
Proposal of cavity quantum acoustodynamics platform based on Lithium Niobate-on-Sapphire chip [9.7]
このアーキテクチャは超伝導トランスモン量子ビットと1つのチップ上のフォノン集積回路を統合する。このプラットフォームは、持続しない導波路とマイクロリング構造において、密閉および誘導されたフォノンモードをサポートする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:27:18 GMT)
Enterprise AI Must Enforce Participant-Aware Access Control [9.7]
大規模言語モデル(LLM)は、複数のユーザと対話し、センシティブな内部データに基づいてトレーニングあるいは微調整されるエンタープライズ環境に、ますます多くデプロイされている。敵は、現在の微調整アーキテクチャやRAGアーキテクチャを利用して、アクセス制御の強制力の欠如を活用して機密情報を漏洩することができることを示す。本稿では, LLM による学習, 検索, 生成に使用されるコンテンツは, インセンティブに関わるユーザに対して明示的に認証される,という原則に基づくフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:30:49 GMT)
Balanced Spanning Tree Distributions Have Separation Fairness [9.5]
分離フェアネスの概念を導入し、サンプル再限定計画において、隣接する地理的単位が少なくとも一定の確率で(一から離れた)分離されるかどうかを問う。バランスの取れた木の分布のスムーズな変種が分離公正性を満たすことを証明した。また,ReComのようなMCMC手法の理論的サポートも提供し,サンプリングプロセスの粒度レベルで公平性を維持することが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:48:43 GMT)
Geometric optimization for quantum communication [9.5]
チャネルの量子容量や共有状態の蒸留可能な絡み合いなどの量子通信の限界について検討する。上界に対しては、既知の情報理論境界を最小化する状態拡張とチャネル拡張を探索する。下界に対しては、ユニタリ多様体上の量子楽器をパラメータ化することにより、一方向の蒸留可能な絡み合いの下位境界を確立する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:13:07 GMT)
DSPC: Dual-Stage Progressive Compression Framework for Efficient Long-Context Reasoning [9.5]
デュアルステージ進行圧縮(Dual-Stage Progressive Compression,DSPC)と呼ばれる2段階の訓練不要圧縮手法を提案する。粗粒度段階において、意味関連文フィルタリングは、TF-IDFに基づく意味値の低い文を除去する。粒度の細かい段階では、注意貢献、モデル間損失差、位置重要度を用いてトークンの重要性を評価する。例えば、LongbenchデータセットのFewShotタスクでは、DSPCは3倍少ないトークンを使用して49.17のパフォーマンスを実現し、最先端のベースラインであるLongLLMLinguaよりも優れています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:29:18 GMT)
QuizRank: Picking Images by Quizzing VLMs [9.4]
画像はウィキペディア記事の読みやすさと理解を向上させる上で重要な役割を担っている。本稿では,大規模な言語モデル (LLM) と視覚言語モデル (VLM) を利用して,画像の学習介入としてランク付けする新しい画像選択手法であるQuizRankを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:22:33 GMT)
Controlling Language Difficulty in Dialogues with Linguistic Features [9.4]
言語アノテートされた対話データに基づく大規模言語モデル(LLM)の訓練は、言語習熟度を正確に調節することができる。提案手法は,高い対話品質を維持しつつ,言語能力の優れた制御性を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:22:43 GMT)
Estimating Respiratory Effort from Nocturnal Breathing Sounds for Obstructive Sleep Apnoea Screening [9.4]
閉塞性睡眠時無呼吸症(OSA)は、健康に重大な影響を及ぼす疾患である。本研究は夜間オーディオから直接呼吸活動を評価するための最初の研究である。そこで本研究では,OSA検出のための音響的特徴と推定工数埋め込みを統合した潜在空間融合フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:31:19 GMT)
Constrained Feedback Learning for Non-Stationary Multi-Armed Bandits [9.4]
非定常的なマルチアームバンドは、報酬分布のシフトを検出し、応答するメカニズムを組み込むことで、エージェントが変化する環境に適応できるようにする。本稿では,非定常マルチアームバンドにおいて,報酬フィードバックの可利用性を制限する制約付きフィードバックの新しいモデルを提案する。本稿では,この設定において,ほぼ最適な動的後悔を実現するための,最初の事前自由なアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:35:32 GMT)
Emotion-Aware Speech Generation with Character-Specific Voices for Comics [9.3]
本稿では,漫画からキャラクター固有の感情認識音声を生成するためのエンドツーエンドパイプラインを提案する。提案システムは,全巻を入力として,各キャラクタの対話や感情状態に合わせて音声を生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:49:57 GMT)
SubDyve: Subgraph-Driven Dynamic Propagation for Virtual Screening Enhancement Controlling False Positive [9.3]
SubDyveはネットワークベースのVSフレームワークで、サブグラフ対応の類似性ネットワークを構築し、小さな既知のアクティビティからのアクティビティ信号を伝搬する。ゼロショット条件下で10のDUD-Eターゲットと100万のZINCデータセットを用いてCDK7ターゲット上でSubDyveを評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:48:12 GMT)
Large Language Models and Operations Research: A Structured Survey [9.2]
大規模言語モデル(LLM)は、意味理解、構造化生成、推論制御を通じて制限に対処する可能性を示している。 LLMは、自然言語記述を数学的モデルや実行可能なコードに変換し、ベンチマークを生成し、アルゴリズムを進化させ、最適化タスクに取り組むことができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:52:19 GMT)
Federated Hypergraph Learning with Local Differential Privacy: Toward Privacy-Aware Hypergraph Structure Completion [9.2]
FedHGLは、非結合性およびプライバシー制約のあるハイパーグラフパーティションに関する連邦ハイパーグラフ学習のための第一種フレームワークである。 We developed FedHGL, a first-of-in-kind framework for Federated hypergraph learning on disjoint and privacy-constrained hypergraph partitions。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:48:15 GMT)
Speech Language Models for Under-Represented Languages: Insights from Wolof [9.1]
We present our journey in training a speech language model for Wolof, a underrepresented language spoken in West Africa。まず,大規模で自発的で高品質な音声データを収集することの重要性を強調した。このデータセット上でのHuBERTの事前学習は、ASRのベースモデルとアフリカ中心モデルの両方より優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:01:48 GMT)
CausalPre: Scalable and Effective Data Pre-processing for Causal Fairness [9.0]
CausalPreはスケーラブルで効果的な因果性誘導型データ前処理フレームワークである。 CausalPreは有効かつスケーラブルであり、因果フェアネスを達成するためには関係のカバレッジをトレードオフする必要があるという従来の信念に挑戦する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:54:01 GMT)
DualSG: A Dual-Stream Explicit Semantic-Guided Multivariate Time Series Forecasting Framework [9.0]
明示的なセマンティックガイダンスを提供するデュアルストリームフレームワークであるDualSGを提案する。本稿では、自然言語のトレンドパターンを要約した明示的なプロンプトフォーマットである時系列キャプションを紹介する。さまざまなドメインの実際のデータセットに関する実験によると、DualSGは15の最先端ベースラインを一貫して上回っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:23:30 GMT)
Robust Barycenters of Persistence Diagrams [9.0]
我々は、一般的な輸送コストに対するバリセンター図の計算に代替の固定点法を適用した。 emph(i) 永続化ダイアグラムのクラスタリングとemph(ii) 永続化ダイアグラムの辞書エンコーディングである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:29:10 GMT)
Evil Vizier: Vulnerabilities of LLM-Integrated XR Systems [9.0]
拡張現実(XR)アプリケーションは、ユーザエクスペリエンスの向上、シーン理解、さらには実行可能なXRコンテンツの生成のために、Large Language Models(LLM)を統合している。これらの潜在的な利点にもかかわらず、統合されたXR-LLMパイプラインにより、XRアプリケーションは新しいタイプの攻撃に対して脆弱になる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:58:15 GMT)
Exploring How Audio Effects Alter Emotion with Foundation Models [8.9]
音声効果(FX)は、音楽聴取中に感情的な反応を形作る上で重要な役割を担っている。本研究は、基礎モデルを用いてこれらの効果を分析する方法について検討する。本研究の目的は,音楽の認知,演奏,情緒的コンピューティングに影響を及ぼす音楽制作実践の知覚的影響の理解を深めることである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:57:08 GMT)
Bayesian Concept Bottleneck Models with LLM Priors [8.9]
概念ボトルネックモデル (CBM) は、ホワイトボックスモデルとブラックボックスモデルの間の妥協として提案されており、精度を犠牲にすることなく解釈性を実現することを目的としている。 BC-LLM はベイズフレームワーク内の潜在的無限の概念を反復的に探索し、Large Language Models (LLM) が概念抽出のメカニズムと事前の両方として機能する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:29:36 GMT)
A Benchmark for End-to-End Zero-Shot Biomedical Relation Extraction with LLMs: Experiments with OpenAI Models [8.9]
バイオメディカルリレーション抽出タスクの多種多様なサンプリングにおいて,OpenAI LLMの性能パターンについて検討した。エンド・ツー・エンドのゼロショットバイオメディカルREタスクにおけるGPT-4, o1, GPT-OSSの性能について検討し, 比較を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:51:48 GMT)
Generating Part-Based Global Explanations Via Correspondence [8.8]
ユーザ定義部分ラベルを限られた画像集合から活用し,より大規模なデータセットに効率的に転送する手法を提案する。これにより、部分ベースの局所的な説明を集約することでグローバルな象徴的説明を生成することができ、最終的には大規模なモデル決定に対して人間に理解可能な説明を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:00:49 GMT)
VLM-E2E: Enhancing End-to-End Autonomous Driving with Multimodal Driver Attention Fusion [8.7]
VLM-E2Eは、視覚言語モデルを用いて、注意喚起手段を提供することでトレーニングを強化する新しいフレームワークである。注意の意味論に焦点を当てることで、VLM-E2Eは人間のような運転行動と整合し、ダイナミックで複雑な環境をナビゲートするのに重要である。我々は、nuScenesデータセット上でVLM-E2Eを評価し、ベースラインのエンドツーエンドモデルに対する認識、予測、計画の大幅な改善を実現した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:55:02 GMT)
Towards robust variational quantum simulation of Lindblad dynamics via stochastic Magnus expansion [8.7]
我々はリンドブラッド方程式の変分量子シミュレーションのための新しい一般的な枠組みを紹介する。古典的, 量子的両実装における数値的な例を通して, アルゴリズムの有効性を実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:08:10 GMT)
Next-Depth Lookahead Tree [8.7]
Next-Depth Lookahead Tree (NDLT) はノード分割を評価することで性能を向上させるために設計された単一ツリーモデルである。本稿では,次の深さレベルの品質を評価することにより,性能向上を目的とした単木モデルを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:51:57 GMT)
Super-Linear: A Lightweight Pretrained Mixture of Linear Experts for Time Series Forecasting [8.7]
汎用予測のための軽量でスケーラブルなMixed-of-Experts(MoE)モデルであるSuper-Linearを紹介する。深層アーキテクチャを、複数の周波数レギュレーションにまたがる再サンプリングデータに基づいて訓練された、単純な周波数特化線形エキスパートに置き換える。優れた効率性、様々なサンプリングレートに対する堅牢性、解釈可能性の向上を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:11:31 GMT)
Stabilizing Information Flow Entropy: Regularization for Safe and Interpretable Autonomous Driving Perception [8.5]
我々はディープニューラルエンコーダを階層型通信チェーンとして再認識し、生の知覚入力をタスク関連潜在特徴に圧縮する。 Elossは,軽量でプラグアンドプレイの学習目標として設計された,エントロピーベースの新しい正規化器である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:01:27 GMT)
Acoustic Simulation Framework for Multi-channel Replay Speech Detection [8.5]
リプレイ音声攻撃は音声制御システムに重大な脅威をもたらす。マルチチャンネル再生音声構成をシミュレートする音響シミュレーションフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:38:58 GMT)
Frustratingly Easy Data Augmentation for Low-Resource ASR [8.2]
音声認識のための自己完結型データ拡張手法を3つ導入する。我々はこれらの手法を極めて限られたリソースを持つ4つの言語に適用する。トレーニング済みのWav2Vec2-XLSR-53モデルをオリジナルオーディオと生成された合成データの組み合わせで微調整すると、性能が大幅に向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:20:37 GMT)
Tight PAC-Bayesian Risk Certificates for Contrastive Learning [8.2]
コントラスト表現学習のための非空白のPACベイズリスク証明書を開発した。我々は、データ拡張や温度スケーリングを含むSimCLR固有の要因を取り入れ、対照的なゼロワンリスクのリスク証明書を導出する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:54:55 GMT)
From Patterns to Predictions: A Shapelet-Based Framework for Directional Forecasting in Noisy Financial Markets [8.2]
金融市場の方向性予測には正確性と解釈可能性の両方が必要である。教師なしのパターン抽出と解釈可能な予測を統合する2段階のフレームワークを提案する。我々のアプローチは、予測結果を導くパターン構造を明らかにすることによって、透明性のある意思決定を可能にします。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:05:27 GMT)
Asymptotic Study of In-context Learning with Random Transformers through Equivalent Models [8.1]
非線形回帰の設定において,事前学習したトランスフォーマーの文脈内学習能力について検討する。ランダムトランスフォーマーはICL誤差の観点から有限次ヘルミットモデルと等価に振る舞うことを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:57:27 GMT)
Provable Non-Convex Euclidean Distance Matrix Completion: Geometry, Reconstruction, and Robustness [8.1]
ユークリッド距離行列補完問題は、センサーネットワークの局所化、分子ロバスト性、多様体学習など、幅広い応用で発生する。本稿では,正半定値グラム行列の空間上の低ランク行列補完タスクを提案する。利用可能な距離の測定は非直交基底で拡張係数として符号化され、グラム行列の最適化は非負性や三角形の不等式を通じて暗黙的に幾何的整合を強制する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:38:25 GMT)
Measuring the Measures: Discriminative Capacity of Representational Similarity Metrics Across Model Families [8.0]
モデルファミリを分離する能力に基づいて,表現類似度を評価する枠組みを提案する。信号検出理論,シルエット係数,ROC-AUCの3つの相補的分離性尺度を用いる。我々は、メトリクスがより厳密なアライメント制約を課すにつれて、分離性が体系的に増加することを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:07:56 GMT)
Spatial Audio Motion Understanding and Reasoning [8.0]
空間音響推論は、機械が出来事とその空間特性を理解することによって聴覚シーンを解釈することを可能にする。空間音響エンコーダを導入し,複数の重なり合う事象を検出し,その空間特性,DoA(Direction of Arrival)および音源距離をフレームレベルで推定する。第2に、移動音源を含む動的オーディオシーンに関する複雑な質問に答えるために、我々のモデルによって抽出された構造化空間属性に対して、大きな言語モデル(LLM)を条件付ける。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:53:22 GMT)
MemEvo: Memory-Evolving Incremental Multi-view Clustering [8.0]
インクリメンタル・マルチビュー・クラスタリングは、インクリメンタル・ビューにおける安定性・可塑性ジレンマ(SPD)に対処しながら、安定したクラスタリング結果を達成することを目的としている。神経科学における海馬前頭前野協調記憶機構に着想を得て,このバランスを実現するための記憶-進化的インクリメンタル・マルチビュー・クラスタリング法(MemEvo)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:21:09 GMT)
STEP: Structured Training and Evaluation Platform for benchmarking trajectory prediction models [7.9]
複数のデータセットに統一されたインターフェースを提供することで制限に対処する新しいベンチマークフレームワークであるSTEPを紹介します。筆者らは,1)広く利用されている試験手順の限界,2) 相互作用予測のためのエージェントの協調モデリングの重要性,3) 分散シフトおよび敵エージェントによる標的攻撃に対する現在の最先端モデルの脆弱性を明らかにする実験でSTEPの能力を実証した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:56:16 GMT)
Exploring Data and Parameter Efficient Strategies for Arabic Dialect Identifications [7.9]
アラビア方言識別(ADI)におけるデータ効率とパラメータ効率の異なるアプローチについて検討する。データ効率の戦略では、ゼロショットと少数ショットの推論でハードプロンプトを解析する。パラメータ効率のよいPEFT手法について,アラビア固有エンコーダモデルを用いて実験を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:09:19 GMT)
Code Less to Code More: Streamlining Language Server Protocol and Type System Development for Language Families [7.7]
既存の言語ワークベンチは、モジュール性、再利用性、言語サーバー生成のための型システムの利用に苦労している。モジュール、構成可能、再利用可能な型システム実装のためのドメイン固有言語のファミリーであるTypelangを提案する。我々はNeverlangにTypelangを実装し、各アーティファクト用の言語サーバと3つのエディタ用のLSPプラグインを生成します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:57:01 GMT)
ReCoVeR the Target Language: Language Steering without Sacrificing Task Performance [7.7]
ReCoVeRは、言語固有のステアリングベクトルに基づいた、言語の混乱を低減するための、新しい軽量なアプローチである。 3つのベンチマークと18の言語を含む我々の評価は、ReCoVeRがモノリンガルとクロスランガルの両方のセットアップにおいて、言語の混乱を効果的に軽減していることを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:15:52 GMT)
Two tales for a geometric Jensen--Shannon divergence [7.6]
幾何学的ジェンセン-シャノン分岐(G-JSD)は、機械学習と情報科学で人気を博した。正の密度に合わせた幾何的ジェンセン-シャノン発散の代替定義を導入する。この斬新な発散は、より一般的な正測度の場合に適用される拡張G-JSDと呼ばれる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:44:04 GMT)
LSTC-MDA: A Unified Framework for Long-Short Term Temporal Convolution and Mixed Data Augmentation in Skeleton-Based Action Recognition [7.6]
ラベル付きトレーニングサンプルの不足と、短距離および長距離の時間的依存関係をモデル化することの難しさだ。本稿では、時間的モデリングとデータの多様性を同時に改善する統合フレームワークLSTC-MDAを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:48:32 GMT)
Calibrating LLM Confidence by Probing Perturbed Representation Stability [7.5]
LLM(Large Language Models)におけるミススキャリブレーションは信頼性を損なうものであり、正確な信頼度推定の必要性を強調している。 LLMの内部表現安定性を解析する新しい手法であるCCPSを紹介する。 CCPSは予測エラーを約55%削減し,Brier-Proベンチマークを21%削減し,精度を5ポイント向上した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:45:36 GMT)
Heterogeneous Directed Hypergraph Neural Network over abstract syntax tree (AST) for Code Classification [7.5]
本稿では、抽象構文木(AST)を表すヘテロジニアス指向ハイパーグラフ(HDHG)と、コード分類のためのグラフを処理するヘテロジニアス指向ハイパーグラフニューラルネットワーク(HDHGN)を提案する。提案手法は, コード理解を改善し, 対の相互作用を超えた高次データ相関を表現できる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:19:01 GMT)
MATTER: Multiscale Attention for Registration Error Regression [7.4]
ポイントクラウド登録(PCR)は、同時ローカライゼーションとマッピング(SLAM)やオブジェクト追跡など、多くの下流タスクに不可欠である。既存のメソッドはすべて、バリデーションを分類タスクとして扱い、いくつかのクラスに品質を割り当てることを目的としています。本研究では, PCRバリデーションにレグレッションを用い, よりきめ細かな登録品質の定量化を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:23:30 GMT)
Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland [7.4]
我々はスイス連邦最高裁判所の20万件の判決を含むスイスのランドマーク決定要約データセットを紹介する。我々は、オープンモデルを微調整し、それらをより大きな汎用および推論調整 LLM と比較する。細調整されたモデルは語彙的類似性において良好に機能し、大きなモデルはより法的に正確で一貫性のある要約を生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:48:34 GMT)
Data coarse graining can improve model performance [7.3]
データの粗粒化」下における高次元リッジ正規化線形回帰の可解モデルを用いたパラドックスの研究統計物理学における正規化群に着想を得て,学習課題との関連性に基づいて,特徴を体系的に捨てる粗粒化スキームを解析した。この結果は,データの構造によって形成される複雑で非単調なリスクランドスケープに注目し,統計物理学からのアイデアが,現代の機械学習現象を理解するための原理化されたレンズをいかに提供するかを説明する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:17:01 GMT)
AIP: Subverting Retrieval-Augmented Generation via Adversarial Instructional Prompt [7.3]
本稿では,RAG出力を操作するために,対向的命令プロンプトを利用した新たな攻撃法を提案する。 AIPは、システムの整合性を損なうために、いかに信頼されているように見えるインターフェースコンポーネントを武器化できるかを明らかにしている。本稿では,ユーザクエリの現実的な言語的変動をシミュレートする多様なクエリ生成戦略を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:06:53 GMT)
"What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets [7.3]
HealthChat-11Kは、25万のユーザメッセージからなる1万1千の現実世界の会話のキュレートされたデータセットである。我々の分析は、ユーザーが健康情報を求める方法と理由に関する洞察を明らかにする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:35:47 GMT)
Learning Rate Should Scale Inversely with High-Order Data Moments in High-Dimensional Online Independent Component Analysis [7.2]
オンライン独立成分分析(ICA)アルゴリズムの学習力学に及ぼす高次モーメントの影響について検討する。高次モーメントが増加するにつれて、アルゴリズムは収束が遅くなり、より低い学習率とより高い初期アライメントを要求する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:34:59 GMT)
Benefits of Online Tilted Empirical Risk Minimization: A Case Study of Outlier Detection and Robust Regression [7.2]
経験的リスク最小化(Empirical Risk Minimization、ERM)は、教師付き学習の基礎となるフレームワークである。データが一度に1つのサンプルに到達するオンラインまたはストリーミング設定では、古典的なTERMは標準ERMに縮退する。本稿では,従来の目的から対数を取り除き,新たな計算やメモリオーバーヘッドを伴わずに傾き効果を保存するオンラインTERMを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:51:23 GMT)
Aligning Audio Captions with Human Preferences [7.2]
本稿では,人間フィードバックからの強化学習に基づく優先的な音声キャプションフレームワークを提案する。我々は,人間ラベル付きペアワイズ嗜好データを用いて,CLAPに基づく報奨モデルを訓練する。本フレームワークは,音声キャプションと人間の嗜好の整合性を実証し,地上データを用いた教師付きアプローチに匹敵する性能を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:33:44 GMT)
RulER: Automated Rule-Based Semantic Error Localization and Repair for Code Translation [7.2]
RulERはルールベースのコード翻訳のデバッグ方法である。 RulERは、LLMによって生成された正しい翻訳からコード翻訳ルールを自動的に導出する。 RulERはパッチ生成のための直接的なLLMよりも優れた修理性能を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:45:26 GMT)
Data Augmentation via Latent Diffusion Models for Detecting Smell-Related Objects in Historical Artworks [7.2]
我々は, 合成データ生成の可能性を探究し, 美術品のニオイ参照を見つける際の問題を緩和する。モデルトレーニングに合成データを組み込むことで検出性能が向上することを示す。本研究は,拡散モデルの大規模事前学習を活用することにより,検出精度の向上に寄与することが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:03:49 GMT)
SCORPION: Addressing Scanner-Induced Variability in Histopathology [7.1]
様々な領域にわたる信頼性の高いモデル性能を保証することは、計算病理学において重要な課題である。我々は、スキャナの可変性の下でモデル信頼性を評価するために明示的に設計された新しいデータセットであるSCORPIONをリリースする。拡張型ドメイン一般化技術と整合性損失を組み合わせたフレキシブルなフレームワークであるSimConsを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:31:01 GMT)
Region-Aware Deformable Convolutions [7.1]
Region-Aware Deformable Convolution (RAD-Conv)は、ニューラルネットワークが複雑な画像構造に適応する能力を高める新しい畳み込み演算子である。 RAD-Convはカーネル要素ごとに4つの境界オフセットを使用して、画像の内容に合わせて動的にサイズと形状を調整する柔軟で長方形の領域を作成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:18:36 GMT)
Online reinforcement learning via sparse Gaussian mixture model Q-functions [7.1]
本稿では,強化学習のための構造化・解釈可能なオンラインポリシイテレーションフレームワークを提案する。スパースガウス混合モデルQ-函数(S-GMM-QFs)の新たなクラスを中心に構築されている。数値実験により,S-GMM-QFは標準ベンチマーク上での高密度深度RL(DeepRL)法の性能と一致していることがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:37:11 GMT)
FASL-Seg: Anatomy and Tool Segmentation of Surgical Scenes [7.0]
特徴適応型空間局在モデル(FASL-Seg)を提案する。 2つの異なる処理ストリームを通じて、機能の複数の詳細レベルをキャプチャするように設計されている。外科的セグメンテーションのベンチマークデータセットであるEndoVis18とEndoVis17でテストされている。 FASL-Segは、EndoVis18の部品と解剖学的セグメンテーションに72.71%の平均的結合(mIoU)を達成し、SOTAを5%改善した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:31:18 GMT)
Diverse, not Short: A Length-Controlled Data Selection Strategy for Improving Response Diversity of Language Models [7.0]
我々は、共通の多様性指標、さらには好み最適化に使用される報酬モデル、より短い出力に向けて体系的にバイアスモデルを示す。長さパリティを維持しながら応答の多様性を向上する長さ制御データ選択戦略であるDiverse, not Short (Diverse-NS)を導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:46:32 GMT)
Larger-scale Nakamoto-style Blockchains Offer Better Security [7.0]
中本型ブロックチェーンの従来のセキュリティモデルは、悪意のあるノード間の即時同期を仮定することで、敵の調整を過大評価する。本稿では、セキュリティ分析を再考するデュアル遅延フレームワークを導入し、2つの重要なイノベーションを通じてこの監視に対処する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:52:34 GMT)
Erased or Dormant? Rethinking Concept Erasure Through Reversibility [6.9]
我々は、統一概念編集と消去安定拡散という2つの代表的な概念消去手法を評価する。消去された概念は、最小限の適応の後、しばしばかなりの視覚的忠実度で再帰することを示す。本研究は,既存の概念消去アプローチにおける限界を明らかにするものである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:23:42 GMT)
Context parroting: A simple but tough-to-beat baseline for foundation models in scientific machine learning [6.9]
ファンデーションモデルは、単純なオウム戦略を通じて予測されることがよくあります。文脈から直接コピーする単純なコンテキストパロッキングモデルは、主要な時系列基礎モデルよりも高いスコアを得る。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:10:25 GMT)
Domain Adaptation for Ulcerative Colitis Severity Estimation Using Patient-Level Diagnoses [6.9]
潰瘍性大腸炎(UC)の重症度を推定する方法は、画像装置の違いによる領域シフトや、病院全体の臨床環境の違いによって生じることが多い。本稿では,患者レベルの診断結果を対象領域の弱監視として活用する,弱監視ドメイン適応手法を提案する。実験の結果,本手法は比較DA手法より優れており,ドメインシフトした環境でのUC重度推定精度が向上していることがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:19:50 GMT)
EnCoBo: Energy-Guided Concept Bottlenecks for Interpretable Generation [6.8]
概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、明示的で人間の理解可能な概念を通じて解釈可能な意思決定を提供する。本研究では,全ての表現を明示的な概念のみで流れるように制限することにより,補助的手がかりを排除した生成モデルのためのポストホックな概念ボトルネックであるEnCoBoを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:55:53 GMT)
Wireless Communication Performance Testing: From Laboratory Environment to Research Vessel [6.8]
目的は、視線を妨害する実験室の物体が、送信機(Tx)と受信機(Rx)の間の信号を減衰させる様子を実証することであった。また, 電気探査船内の各地点における距離と配置が信号伝達効率に及ぼす影響についても検討した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:41:51 GMT)
Fleming-R1: Toward Expert-Level Medical Reasoning via Reinforcement Learning [6.8]
Fleming-R1は、3つの相補的な革新を通じて、医学的推論を検証するために設計されたモデルである。まず、我々のReasoning-Oriented Data Strategy(RODS)は、キュレートされた医療用QAデータセットと知識グラフ誘導合成を組み合わせる。第2に,教師モデルから高品質な推論軌跡を蒸留するために,CoTコールドスタート(Chain-of-Thought)を用いる。第三に、検証可能なリワードフレームワークから2段階の強化学習を実装します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:35:14 GMT)
On the Use of Agentic Coding: An Empirical Study of Pull Requests on GitHub [6.7]
大規模言語モデル(LLM)は、ソフトウェア開発プロセスに統合されつつある。自律的なAIエージェントを使用して、コードを生成し、人間の介入を最小限に抑えたプルリクエストを提出する能力は、標準のプラクティスになる可能性がある。エージェントコーディングツールであるClaude Codeを使って生成した567のGitHubプルリクエスト(PR)を、157のオープンソースプロジェクトで実証研究しました。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:48:32 GMT)
A Stateless and Secure Delivery versus Payment across two Blockchains [6.7]
セキュアでステートレスでコンポーザブルなトランザクションスキームを提案し、2つのブロックチェーンにまたがるデリバリ対費用(DvP)を確立する。このメソッドは調整のオーバーヘッドを最小限に抑え、キーを条件付きでリリースするステートレス復号法によって競合条件を除去する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:17:46 GMT)
Adversarial Distilled Retrieval-Augmented Guarding Model for Online Malicious Intent Detection [6.7]
ADRAGは、堅牢で効率的なオンライン悪意のある意図検出のための2段階のフレームワークである。リアルタイムアプリケーションでは、毎秒300クエリで最大5.6倍のレイテンシを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:04:48 GMT)
FlowCast-ODE: Continuous Hourly Weather Forecasting with Dynamic Flow Matching and ODE Integration [6.6]
本研究では,大気状態の進化を連続的な流れとしてモデル化するフレームワークであるFlowCast-ODEを提案する。 FlowCast-ODEは、物理力学系とより自然に整合するアプローチである、前の状態から条件流路を直接学習する。軽量な低ランクAdaLN-Zero変調機構を提案し、精度を損なうことなくモデルサイズを15%削減する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:24:57 GMT)
KAIO: A Collection of More Challenging Korean Questions [6.6]
KAIOは、フロンティアモデルの評価とランク付けが可能な韓国のベンチマークである。彩度に近い最近の韓国のスイートとは異なり、KAIOは飽和状態には程遠い。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:56:31 GMT)
Single- vs. Dual-Prompt Dialogue Generation with LLMs for Job Interviews in Human Resources [6.5]
大規模言語モデル(LLM)を用いた人事面接の2つの方法の比較を行った。両プロンプト法で生成されたインタビューは, 単プロンプト法で生成されたインタビューの2倍から10倍の勝利率が得られることがわかった。 GPT-4o と Llama 3.3 70B のどちらでも、この違いは一貫している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:58:13 GMT)
Frequency-Aware Ensemble Learning for BraTS 2025 Pediatric Brain Tumor Segmentation [6.4]
我々は,BraTS-PED 2025チャレンジに対して,nnU-Net,Swin UNETR,HFF-Netを統合するアンサンブルアプローチを提案する。提案手法には3つの重要な拡張が組み込まれている: 最適な nnU-Net 複雑性制御のための調整可能なスケール、BraTS 2021 の事前学習モデルからの変換学習、周波数領域の分解である。最終的なアンサンブルは、nnU-Net、微調整Swin UNETR、HFF-Netを組み合わせ、72.3%(ET)、95.6%(NET)、68.9%(CC)、89.5%(ED)、92.3%(TC)のDiceスコアを得る。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:24:58 GMT)
A Case for Computing on Unstructured Data [6.4]
我々は、非構造化データ上での計算と呼ばれる新しいパラダイムを議論し、潜在構造の抽出、データ処理技術によるこの構造の変換、非構造化形式への投影という3つの段階に構築する。この双方向パイプラインは、構造化されていないデータに対して、構造化された計算の分析力の恩恵を受けると同時に、非構造化された表現のリッチ性とアクセシビリティを人間とAIの消費のために保持する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:24:41 GMT)
BWCache: Accelerating Video Diffusion Transformers through Block-Wise Caching [6.4]
Block-Wise Caching (BWCache)は、DiTベースのビデオ生成を高速化するトレーニング不要の手法である。いくつかのビデオ拡散モデルの実験では、BWCacheは2.24$times$ speedupを同等の視覚的品質で達成している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:57:32 GMT)
Template-Based Cortical Surface Reconstruction with Minimal Energy Deformation [6.3]
磁気共鳴画像(MRI)による皮質表面再構成(CSR)は神経画像解析の基礎となる。学習ベースのCSRの最近の進歩は、処理を劇的に加速し、解剖学的テンプレートの変形を数秒で再現することができる。しかし、学習した変形が変形エネルギーの点で最適であること、トレーニングの実行中に一貫性があることは、依然として特に課題である。本研究では, 最小エネルギー変形(MED)損失を設計し, 変形軌道のレギュレータとして機能し, CSRにおいて広く使用されているチャンファー距離を補完する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:41:39 GMT)
"Let it be Chaos in the Plumbing!" Usage and Efficacy of Chaos Engineering in DevOps Pipelines [6.3]
カオスエンジニアリング(CE)は、現代の分散システムのレジリエンスを改善するための積極的な方法として登場した。本稿では,近年,産業実践者がCEの原則をどのように採用し,導入してきたのかを考察する,系統的なグレーの文献レビューを紹介する。我々の研究は、CEのコアテットが引き続き影響力を持つ一方で、実践者は実験、自動化、リスク軽減戦略のコントロールをますます強調していることを明らかにした。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:10:32 GMT)
MARIC: Multi-Agent Reasoning for Image Classification [6.3]
画像分類のためのマルチエージェント型推論(MARIC)を提案する。 MARICは、画像分類を協調推論プロセスとして再構成するマルチエージェントフレームワークである。 4つの多様な画像分類ベンチマークデータセットの実験は、MARICがベースラインを大幅に上回っていることを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:27:00 GMT)
Mitigating Intra-Speaker Variability in Diarization with Style-Controllable Speech Augmentation [6.3]
多様なスタイルで音声を増強するスタイル制御可能な音声生成モデルを提案する。提案システムは,従来のダイアリザのダイアリゼーションセグメントから開始する。オリジナルのオーディオと生成されたオーディオの両方からの話者埋め込みは、システムの堅牢性を高めるためにブレンドされる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:21:20 GMT)
Follow the MEP: Scalable Neural Representations for Minimum-Energy Path Discovery in Molecular Systems [6.3]
本稿では,高速かつスケーラブルなニューラル最適化問題としてMEP発見を再構成する手法を提案する。 3500以上の原子を持つBPTI系を含む2つのタンパク質に対するこのアプローチを実証した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:39:14 GMT)
Explaining deep learning for ECG using time-localized clusters [6.2]
心電図解析に応用した畳み込みニューラルネットワークの新しい解釈可能性法を提案する。本手法は,モデルの内部表現から時間的局所クラスタを抽出し,学習特性に応じてECGをセグメント化する。これにより、異なる波形領域がモデルの予測にどのように貢献するかを可視化し、その決定の確実性を評価することができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:52:30 GMT)
The Art of Saying "Maybe": A Conformal Lens for Uncertainty Benchmarking in VLMs [6.2]
VLM(Vision-Language Models)は、科学的および推論タスクにおける複雑な視覚的理解において、顕著な進歩を遂げている。 3つの異なるスコアリング機能を持つ6つのマルチモーダルデータセットにわたる16の最先端のVLMを評価し、包括的不確実性ベンチマーク研究を行う。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:10:19 GMT)
DeDisCo at the DISRPT 2025 Shared Task: A System for Discourse Relation Classification [6.1]
本稿では,ジョージタウン大学の DisRPT 2025 共用課題である DeDisCo について述べる。オープンなQwenモデルを用いてmt5ベースのエンコーダとデコーダベースのアプローチの2つのアプローチをテストする。本システムは,71.28のマクロ精度スコアを達成し,結果に対する解釈と誤り解析を行う。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:02:56 GMT)
Consistent causal discovery with equal error variances: a least-squares perspective [6.1]
線形非巡回構造方程式モデル(SEM)により生成される変数群間の真の因果構造を復元する問題を考える。因果構造を符号化する真の基盤となる有向非巡回グラフ(DAG)がこの仮定の下で一意に同定できることはよく知られている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:52:26 GMT)
RoadMind: Towards a Geospatial AI Expert for Disaster Response [6.0]
大規模言語モデル(LLM)は、様々な自然言語タスクで顕著なパフォーマンスを示しているが、地理空間データについて推論する能力には制限がある。 OpenStreetMap (OSM) の構造化データを用いて LLM の地理空間的推論能力を向上させる自己教師型フレームワークである RoadMind を提案する。以上の結果から,先進的なプログレッシブ・エンジニアリングを備えた最先端のLLMを含む,強力なベースラインをはるかに上回るモデルが得られた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:46:55 GMT)
CAGE: Continuity-Aware edGE Network Unlocks Robust Floorplan Reconstruction [6.0]
textbfCAGE (textitContinuity-Aware edGE)ネットワークは、ポイントクラウド密度マップから直接ベクトルフロアプランを再構築する。 textbfCAGEは最先端のパフォーマンスを実現し、F1スコアは99.1%(部屋)、91.7%(コーナー)、89.3%(角度)である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:10:37 GMT)
CARGO: A Framework for Confidence-Aware Routing of Large Language Models [6.0]
CARGOは動的大規模言語モデル(LLM)選択のための軽量で信頼性に配慮したフレームワークである。 CARGOは、LLM-judgedペアワイド比較に基づいて訓練された単一の埋め込みベースの回帰器を用いて、モデル性能を予測する。 CARGOは76.4%でトップ1のルーティング精度を達成し、個々の専門家に対して72%から89%の勝利率を達成した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:21:30 GMT)
HAM: Hierarchical Adapter Merging for Scalable Continual Learning [6.0]
新しい知識は、以前に学習した情報に干渉し、モデルが新しい知識に賛成する以前の知識を忘れる原因となる。本稿では,HAM(Hierarchical Adapters Merging)について紹介する。ハムは、特にタスクの数が増加するにつれて、最先端の手法を著しく上回っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:56:54 GMT)
Real-Time Adaptive Motion Planning via Point Cloud-Guided, Energy-Based Diffusion and Potential Fields [6.0]
追従回避の問題に触発され,エネルギーベース拡散モデルと人工ポテンシャル場を組み合わせた運動計画フレームワークを提案する。提案手法は、点雲から直接障害物情報を処理し、完全な幾何学的表現を必要としない効率的な計画を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:08:55 GMT)
Traffic Co-Simulation Framework Empowered by Infrastructure Camera Sensing and Reinforcement Learning [5.9]
マルチエージェント強化学習(MARL)は、反復シミュレーションを用いて、ネットワーク内の信号機の制御戦略の学習に特に有効である。本研究では,高忠実度3次元モデリングと大規模交通流シミュレーションを組み合わせたCARLAシミュレートとSUMOを組み合わせた協調シミュレーションフレームワークを提案する。実時間カメラを用いた交通状況検出におけるMARL手法の有効性を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:50:08 GMT)
Reveal and Release: Iterative LLM Unlearning with Self-generated Data [5.9]
本稿では,自己生成データで学習するReveal-and-Release'法を提案する。モデルの重み空間をパラメータ効率のよいモジュールで漸進的に調整する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:07:27 GMT)
AS-ASR: A Lightweight Framework for Aphasia-Specific Automatic Speech Recognition [5.9]
AS-ASRはWhisper-tinyに基づく軽量な失語特異的音声認識フレームワークである。提案手法は,様々な比率で標準音声と失語音声を体系的に組み合わせ,ロバストな一般化を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:36:33 GMT)
Stochastic Sample Approximations of (Local) Moduli of Continuity [5.8]
一般化された微分と局所連続性のモジュライの間の関係を再検討し、局所連続性のモジュライに対する非一様近似を示す。これは、ニューラルネットワークの堅牢性と、その繰り返しの使用の公正性を研究する上で重要である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:13:33 GMT)
Robust Shape Regularity Criteria for Superpixel Evaluation [5.7]
スーパーピクセル形状の正則性やコンパクト性は、主にその円形性によって測定される。形状の正則性を考慮した新しい計量法を提案する。我々の測度は、スケールとノイズに対して堅牢であり、より関連性の高いスーパーピクセル法の比較を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:05:29 GMT)
Skeleton-based sign language recognition using a dual-stream spatio-temporal dynamic graph convolutional network [5.7]
本稿では、幾何学モデルとジェスチャーモデルを分離した2重参照2重ストリームアーキテクチャであるDual-SignLanguageNetを紹介する。 DSLNetは、挑戦的なWLASL-100、WLASL-300、LSA64データセットでそれぞれ93.70%、89.97%、99.79%の精度を達成した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:22:49 GMT)
Copycat vs. Original: Multi-modal Pretraining and Variable Importance in Box-office Prediction [5.6]
映画ポスターの視覚情報に、各映画のクラウドソースによる記述キーワードを接地することで、ボックスオフィスを予測するマルチモーダルニューラルネットワークを構築する。コピーキャットのステータスと映画収入との間には肯定的な関係がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:41:27 GMT)
Differentially private multivariate medians [5.4]
差分的にプライベートな深度に基づく中央値に対する新しい有限サンプル性能保証法を開発した。 Cauchyの限界の下では、重み付けされた位置推定のコストがプライバシーのコストよりも高いことを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:23:55 GMT)
Position: Thematic Analysis of Unstructured Clinical Transcripts with Large Language Models [5.4]
LLM(Large Language Model)は、構造化されていない臨床転写のセマンティック解析をサポートする。既存の評価方法は大きく異なり、進歩を妨げ、研究全体で有意義なベンチマークを防ぐ。本稿では,妥当性,信頼性,解釈可能性の3つの側面に着目した評価フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:02:00 GMT)
Silenzio: Secure Non-Interactive Outsourced MLP Training [5.4]
私たちはSilenuioを紹介します。Silenuioは、固有のMLスキルのトレーニングのための、最初の完全にインタラクティブなアウトソーシングスキームです。 Silenzio は FHE 固有の計算オーバーヘッドのために、完全に低ビット幅の整数上で動作する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:56:59 GMT)
Incorporating Visual Cortical Lateral Connection Properties into CNN: Recurrent Activation and Excitatory-Inhibitory Separation [5.3]
標準CNNフレームワーク内で横接続をどのようにモデル化するかを示す。本研究は,(1)繰り返し活性化と(2)興奮・抑制接続の分離という,側方接続の2つのアーキテクチャ的特徴に焦点を当てる。これら2つのモデルが加わったことにより、分類精度が向上し、さらに重要なことに、結果として得られるモデルの活性化特性と接続特性は、生物学的視覚系で観察されたものと類似した特性を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:13:48 GMT)
ProtoMedX: Towards Explainable Multi-Modal Prototype Learning for Bone Health Classification [5.3]
ProtoMedXは、腰椎のDEXAスキャンと患者の記録の両方を使用するマルチモーダルモデルである。 4,160人の実際のNHS患者のデータセットを用いて、プロトメドXは視覚のみのタスクで87.58%、マルチモーダル変種で89.8%の精度を達成している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:46:18 GMT)
Solar Forecasting with Causality: A Graph-Transformer Approach to Spatiotemporal Dependencies [5.3]
SolarCAST は将来のグローバル水平放射率(GHI)を予測する因果的に情報を得たモデルであり、X サイトと近辺の局 S の歴史的な GHI のみを用いて目標地点で予測する。様々な地理的条件で時系列やマルチモーダルのベースラインを上回ります。最上位の予測装置であるSolcastよりも25.9%のエラー削減を実現している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:57:07 GMT)
RoboEye: Enhancing 2D Robotic Object Identification with Selective 3D Geometric Keypoint Matching [5.2]
RoboEyeはドメイン適応型3D推論と軽量アダプタで2Dセマンティック機能を追加するフレームワークである。実験の結果、RoboEyeはRecall@1を7.1%改善した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:59:24 GMT)
Fair-GPTQ: Bias-Aware Quantization for Large Language Models [5.2]
本稿では,大規模言語モデルにおける不公平さの低減を図った最初の量子化手法であるFair-GPTQを紹介する。我々は、職業バイアスと性別、人種、宗教にまたがる差別的言語を含むステレオタイプ生成に焦点を当てる。 Fair-GPTQは、ゼロショットベンチマークにおけるベースライン精度の少なくとも90%を保ち、半精度モデルに対する不公平さを低減し、4ビット量子化のメモリとスピードの利点を保っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:56:16 GMT)
GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search [5.2]
埋め込みベースのテキスト検索x2013$retrieval from corporax2013$は、ディープラーニングを実現する強力なメソッドステートとして登場した。しかし、埋め込みベースの検索は、悪意のあるコンテンツを宣伝する検索エンジンの敵に受け入れられる可能性がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:12:36 GMT)
Exploring Fine-Tuning of Large Audio Language Models for Spoken Language Understanding under Limited Speech data [5.1]
音声言語モデル(LALM)は、音声関連タスクの強力なツールとして登場したが、微調整には未熟なままである。テキストのみ、直接混合、カリキュラム学習などの微調整方式が音声言語理解(SLU)に与える影響を示す。言語間SLUでは、ソース言語音声データとターゲット言語テキストと、最小のターゲット言語音声データを組み合わせることで、効果的な適応が可能となる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:54:08 GMT)
Top K Enhanced Reinforcement Learning Attacks on Heterogeneous Graph Node Classification [5.1]
グラフニューラルネットワーク(GNN)は、グラフベースのデータに対する例外的なパフォーマンスのため、かなりの関心を集めている。それらの堅牢性、特に異種グラフ上では、特に敵攻撃に対する探索が過小評価されている。本稿では,ヘテロKRLAttackを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:51:53 GMT)
TextMine: LLM-Powered Knowledge Extraction for Humanitarian Mine Action [5.0]
TextMineは、構造化されていないレポートから知識トリプルを抽出するためのオントロジー誘導パイプラインである。ドキュメントチャンキング、ドメイン認識プロンプト、トリプル抽出、および参照ベースとLCM-as-a-Judgeの評価を統合している。 TextMineはグローバルデマイニングの取り組みや他のドメインに適応し、構造化されていないデータを構造化された知識に変換する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:55:19 GMT)
VLA-LPAF: Lightweight Perspective-Adaptive Fusion for Vision-Language-Action to Enable More Unconstrained Robotic Manipulation [4.9]
2次元データのみを用いてVLAモデルの視点適応性を向上する軽量モジュールVLA-LPAFを提案する。 VLA-LPAFは、単一のビューの画像を用いて微調整され、潜在空間における他のマルチビュー観測を融合する。実験によると、RoboFlamingo-LPAFは、CALVINで平均8%、LIBEROで15%、カスタマイズされたシミュレーションベンチマークで30%のタスク成功率の改善を実現している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:24:39 GMT)
Positive maps and extendibility hierarchies from copositive matrices [4.9]
本研究は, PCOP(pairwise co positive)の新しい凸錐体を導入し, 系統的に研究する。我々は、この円錐がPCPの錐体と双対であること(pairwise completely co positive)を証明し、批判的に、広い共変写像群の正の完全な特徴づけを与える。我々は、コーンPDECを導入し、分解可能な地図のための類似のフレームワークを開発する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:54:09 GMT)
Synthesizing Attitudes, Predicting Actions (SAPA): Behavioral Theory-Guided LLMs for Ridesourcing Mode Choice Modeling [4.9]
既存の配車モードの選択予測モデルでは、重要な心理的要因を捉えることができないため、予測精度が制限されている場合が多い。本稿では,理論に基づく潜在態度を合成するために,SAPA(Synthesizing Attitudes, Predicting Actions)フレームワークを紹介する。大規模・多年にわたる旅行調査の実験では、SAPAは最先端のベースラインを大きく上回っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:52:27 GMT)
Inspired by machine learning optimization: can gradient-based optimizers solve cycle skipping in full waveform inversion given sufficient iterations? [4.9]
フルウェーブフォームインバージョン(FWI)は、観測データとシミュレーションデータの違いを最小限に抑えて、速度モデルを反復的に更新する。初期速度モデルが不正確で低周波地震データがない場合、シミュレーションデータと観測データとのミスマッチは周期の半分を超える可能性がある。本研究では、まずFWIが局所的な最小値に収束することを示したが、追加の繰り返しが十分であれば、インバージョンは徐々に大域的な最小値に近づくことができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:56:43 GMT)
Enhancing Interpretability in Deep Reinforcement Learning through Semantic Clustering [4.9]
セマンティッククラスタリング(セマンティッククラスタリング)とは、ニューラルネットワークが内部空間におけるセマンティックな類似性に基づいて入力をクラスタリングする能力である。本稿では,特徴量削減とオンラインクラスタリングを組み合わせた新しいセマンティッククラスタリングモジュールを組み込んだDRLアーキテクチャを提案する。提案モジュールの有効性を実験的に検証し,DRL内のセマンティッククラスタリング特性を明らかにする能力を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:08:45 GMT)
The Role of Touch: Towards Optimal Tactile Sensing Distribution in Anthropomorphic Hands for Dexterous In-Hand Manipulation [4.9]
本研究は,手指と手のさまざまな部位からの触覚フィードバックが,手指の物体の方向転換作業に与える影響について検討する。触覚センサの構成は,操作の効率と精度の向上に寄与する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:13:26 GMT)
MaRVIn: A Cross-Layer Mixed-Precision RISC-V Framework for DNN Inference, from ISA Extension to Hardware Acceleration [4.9]
既存の組み込みマイクロプロセッサは、混合精度NNを効率的に実行するための十分なアーキテクチャサポートを欠いている。電力効率と性能を向上させる多層ハードウェア/ソフトウェア共同設計フレームワークであるMARVInを紹介する。我々のフレームワークは、平均17.6倍のスピードアップを1%未満の精度で達成でき、ISA非依存のRISC-Vコアより優れ、最大1.8TOP/Wを実現している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:48:20 GMT)
Subjective Behaviors and Preferences in LLM: Language of Browsing [4.8]
大規模言語モデル(LLM)はドメインやタスクにまたがって汎用性を提供します。小さなLMは、大きなLMよりも"ブラウジングの言語"を表現できますか? 主観的行動に適したクラスタワイズLMトレーニング(HeTLM)を導入する。ページレベルのトークン化器を用いてトレーニングした小さなLMは、トレーニング済みまたは微調整済みのLMよりも優れた性能を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:00:28 GMT)
Image Super-Resolution Reconstruction Network based on Enhanced Swin Transformer via Alternating Aggregation of Local-Global Features [4.7]
Swin Transformer Network (ESTN) は、ローカルとグローバルの機能を交互に集約する。 ESTNは、SRCNN、ELAN-light、SwinIR-light、SMFANER+モデルを上回る平均PSNRを達成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:05:49 GMT)
IMPQ: Interaction-Aware Layerwise Mixed Precision Quantization for LLMs [4.7]
混合精度量子化は説得力のある解であるが、従来の方法では平均精度が4ビット以下に低下する。本稿では,これらの制約に対処する2つのイノベーションを提案する。まず,混合精度量子化問題を階層間の協調ゲームとして構成し,Shapley-based Progressive Quantization Estimation (SPQE)を導入する。次に、これらのShapley推定値を2次最適化形式に変換する対話型混合精度量子化(IMPQ)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:59:40 GMT)
Quantum router of silicon-vacancy centers via a diamond waveguide [4.6]
ダイヤモンドのシリコン空洞(SiV)センターは量子技術のための有望なプラットフォームを提供する。量子ノードとしてSiV中心の配列が埋め込まれたダイヤモンド導波路をベースとした非マルコフ量子ルータを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:44:08 GMT)
Back to Ear: Perceptually Driven High Fidelity Music Reconstruction [4.4]
epsilonar-VAEは、変分オートエンコーダ(VAE)を再考し最適化するオープンソースの音楽信号再構成モデルである実験の結果、epsilonar-VAEは44.1kHzで、様々なメトリクスにわたる主要なオープンソースモデルよりも大幅に優れていた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:41:34 GMT)
Algorithmic Fairness: Not a Purely Technical but Socio-Technical Property [4.3]
公正さは純粋にモデルに関する技術的な制約に還元できないと我々は主張する。本研究では,既存の公正度尺度の限界について,概念分析と実証図面を用いて検討する。これらの発見は、技術的フォーマライゼーションと社会的現実のギャップを埋める助けになると考えています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:49:10 GMT)
Extending the Limited Performance of the Quantum Refrigerator with Catalysts [4.3]
2ストロークの量子冷凍機は、外部の作業によって駆動される離散ストロークによって、冷たい貯水池から熱を抽出する。触媒はサイクル毎に変化せず、熱抽出が完全に作業入力によって駆動されることを保証する。その結果、量子熱デバイスの動作能力を拡大する触媒機構の可能性を強調した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:18:38 GMT)
Security Analysis of Web Applications Based on Gruyere [4.2]
Gruyereは既知の脆弱性を分析する実験対象として採用されている。特定の脆弱性に対する詳細な再現手順を提示し、包括的修復戦略を提案する。発見によると、Gruyereの脆弱性は比較的時代遅れであるものの、その根底にある原則は、広範囲の現代のセキュリティ欠陥を説明することに非常に関係している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:52:06 GMT)
Set Contribution Functions for Quantitative Bipolar Argumentation and their Principles [4.2]
関心の議論(いわゆるトピック)に対する(最後の強み)議論の集合の寄与を定量化する関数を提案する。私たちの集合のコントリビューション関数は、トピックへの1つのコントリビューション引数のコントリビューションを定量化する既存の関数の一般化である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:52:53 GMT)
Low-rank surrogate modeling and stochastic zero-order optimization for training of neural networks with black-box layers [4.2]
本稿では、再構成可能な物理層を持つハイブリッドネットワークのエンドツーエンドトレーニングのためのフレームワークを提案する。提案手法の重要な構成要素は,プロジェクタ分割型インテグレータアルゴリズムであり,各前方通過後の軽量サロゲートモデルを更新する。我々は,コンピュータビジョン,音声分類,言語モデリングなど,多様なディープラーニングタスクにまたがる手法を実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:17:44 GMT)
AgentCompass: Towards Reliable Evaluation of Agentic Workflows in Production [4.0]
本稿では,エージェントパイプラインのデプロイ後監視と推論に特化して設計された,最初の評価フレームワークであるAgentを紹介する。 Agentは、主要なメトリクスに関する最先端の結果を達成すると同時に、人間のアノテーションで見逃された重要な問題を明らかにする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:59:04 GMT)
The NazoNazo Benchmark: A Cost-Effective and Extensible Test of Insight-Based Reasoning in LLMs [4.0]
そこで本研究では,日本人児童のライドルから構築した費用効果評価指標であるNazonazoについて紹介する。 GPT-5以外のモデルは人間の性能に匹敵せず、平均精度は52.9%である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:50:04 GMT)
SINAI at eRisk@CLEF 2023: Approaching Early Detection of Gambling with Natural Language Processing [4.0]
本稿では,eRisk@CLEFラボにおけるSINAIチームの参加について述べる。提案課題の1つは,病的なギャンブルの兆候を早期に検出するタスク2である。 Task 2で提示されるアプローチは、Transformersアーキテクチャからトレーニング済みのモデルに基づいており、包括的な事前処理データとデータバランシング技術がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:50:14 GMT)
Exploring the Global-to-Local Attention Scheme in Graph Transformers: An Empirical Study [3.9]
グラフ変換器(GT)はグラフ表現学習において大きな可能性を示す。 G2LFormerは、新しいグローバル・ローカル・アテンション・スキームを備えている。グローバルレイヤからの有益な情報をローカルレイヤが保持できるように、クロスレイヤ情報融合戦略が導入された。その結果,G2LFormerは線形複雑性を維持しながら優れた性能を示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:30:50 GMT)
A Systematic Literature Review on Fundamental Technologies and Security Challenges in the Metaverse Platforms [3.9]
Metaverseは、拡張現実(XR)、人工知能(AI)、ブロックチェーン、デジタルツインといった新興技術を利用している。この調査は、Metaverseで実現可能な技術について、包括的なレビューを提供することを目的としている。また、そのサステナビリティとユーザの安全性を損なう可能性のある重要な脆弱性や脅威を、徹底的に分析することを目指している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:20:46 GMT)
Where Do I 'Add the Egg'?: Exploring Agency and Ownership in AI Creative Co-Writing Systems [3.9]
我々は,エージェント,ツールライク,マジックという,異なるインタフェースメタファーを持つ3つのAIコライトシステムを開発した。分析の結果,機関と所有サブタイプの分類が得られた。インタフェースのメタファーは、制御の期待を導くだけでなく、著者の観念を形作っている、と我々は主張する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:27:12 GMT)
Attention Lattice Adapter: Visual Explanation Generation for Visual Foundation Model [3.9]
本稿では,視覚基盤モデルにおける新しい説明生成手法を提案する。説明を生成することと、解釈可能性を高めるために部分的にモデルパラメータを更新することの両方を目的としている。 CUB-200-2011 と ImageNet-S の2つのベンチマーク・データセットを用いて評価を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:45:29 GMT)
Frame Sampling Strategies Matter: A Benchmark for small vision language models [3.7]
ビデオ質問応答のための最先端の小型視覚言語モデルのフレーム精度の最初のベンチマークを提案する。その結果,疑わしいバイアスが確認され,異なるフレームサンプリング手法によるSVLMのデータ固有動作とタスク固有動作の両方が強調された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:18:42 GMT)
Neural Architecture Search Algorithms for Quantum Autoencoders [3.7]
本稿では,特定の量子タスクを与えられた効率的な回路を見つけることを目的とした2つの量子NASアルゴリズムを提案する。この結果から, 量子NASアルゴリズムは, 任意のタスクに対して実行可能な量子回路を提供しながら, その手作業を大幅に軽減できることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:49:38 GMT)
Style Transfer with Diffusion Models for Synthetic-to-Real Domain Adaptation [3.7]
拡散モデルを用いた意味論的一貫したスタイル伝達のための2つの新しい手法を提案する。 GTA5をソースとして,Cityscapes/ACDCをターゲットドメインとして実験したところ,FIDスコアが低く,コンテンツ保存性が向上した高品質な画像が得られた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:25:20 GMT)
Hybrid Learning and Optimization methods for solving Capacitated Vehicle Routing Problem [3.7]
CVRP(Capacitated Vehicle Routing Problem)は、ロジスティクスにおける基本的なNPハード問題である。本稿では,古典的(RL-C-ALM)と量子拡張的(RL-Q-ALM)の両方のALMソルバ内でのペナルティパラメータの選択を自動化するために,深層強化学習(RL)を統合したハイブリッド最適化手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:38:29 GMT)
Autoguided Online Data Curation for Diffusion Model Training [3.6]
近年開発された自己誘導法とオンラインデータ選択法により,生成拡散モデルの学習時間とサンプル効率が向上するか否かを検討する。制御された2次元合成データ生成タスクと3x64x64)-D画像生成におけるデータキュレーションの組み合わせを評価する。実験全体を通して、自己誘導は一貫してサンプルの品質と多様性を改善します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:09:04 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.6]
本稿では,ジェネレーティブ・人工知能(GenAI)を利用したストーリーテリングを支援する教育ツールのコンセプトを紹介する。我々は,GenAIによるナラティブ・コクリエーション,テキスト・トゥ・音声変換,テキスト・トゥ・ミュージック,テキスト・トゥ・ビデオ生成を評価し,学習者にとって魅力的な体験を生み出す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:23:26 GMT)
mdok of KInIT: Robustly Fine-tuned LLM for Binary and Multiclass AI-Generated Text Detection [3.6]
自動検出は、人間が機械生成したテキストを表示するのを助けることができる。このノートは、テキスト分類のための微調整された小さなLLMに基づいて、ロバスト検出における我々のmdokアプローチを記述している。これは、Voight-Kampff Generative AI Detection 2025のサブタスクの両方に適用され、どちらも優れたパフォーマンス(1位)を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:06:09 GMT)
Evaluating the Effectiveness of Coverage-Guided Fuzzing for Testing Deep Learning Library APIs [3.5]
我々は、テンプレート、ヘルパー関数、APIドキュメントを組み合わせることで、APIレベルのハーネスを自動的に合成するFlashFuzzを提案する。最先端のファジィ法と比較すると、FlashFuzzは101.13から212.88パーセントのカバレッジと1.0xから5.4倍の妥当性を実現している。本研究は,CGFがディープラーニングライブラリに効果的に適用可能であることを確認し,今後のテストアプローチの強力なベースラインを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:10:42 GMT)
Accurate typhoon intensity forecasts using a non-iterative spatiotemporal transformer model [3.5]
熱帯サイクロン(TC)強度の正確な予測は、運用気象学の課題である。機械学習の最近の進歩は、TC予測の顕著な進歩をもたらした。本稿では,非定常5日間の強度軌跡を生成するトランスフォーマーに基づく予測モデルNetを紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:50:17 GMT)
VRScout: Towards Real-Time, Autonomous Testing of Virtual Reality Games [3.5]
我々は,VR環境を自律的にナビゲートし,人間らしくリアルタイムに仮想オブジェクトと対話できる,ディープラーニングベースのエージェントであるVRScoutを紹介する。この結果から,VRScoutはトレーニングデータに制限のある専門家レベルの性能を実現し,60FPSのリアルタイム推論を実現していることがわかった。これらの結果は、VRScoutをVRゲームの自動テストのための実用的でスケーラブルなフレームワークとして位置づけ、品質保証と安全性監査の両方に直接的な応用がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:16:05 GMT)
PILOT: Steering Synthetic Data Generation with Psychological & Linguistic Output Targeting [3.5]
PILOT (Psychological and Linguistic Output Targeting) は、構造化された心理言語学プロファイルを持つ大規模言語モデルを操るフレームワークである。我々はPILOTが全条件にわたって高い応答品質を維持しており、ステアリングアプローチ間で統計的に有意な差はないことを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:43:28 GMT)
SINAI at eRisk@CLEF 2022: Approaching Early Detection of Gambling and Eating Disorders with Natural Language Processing [3.3]
本稿では,eRisk@CLEFラボにおけるSINAIチームの参加について述べる。 Task 1で提示されるアプローチは、Transformerからの文の埋め込みの使用に基づいている。タスク3のアプローチは、トランスフォーマーからの文脈的単語埋め込みを用いたテキスト類似度推定に基づいている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:03:31 GMT)
RETRO: REthinking Tactile Representation Learning with Material PriOrs [3.3]
触覚表現学習プロセスに素材認識の先行性を導入する。これらの先行は、異なる材料に特有の事前学習特性を表しており、モデルが表面テクスチャのニュアンスをよりよく捉え、一般化することができる。提案手法は,多様な材料やテクスチャにまたがって,より正確で,文脈的にリッチな触覚フィードバックを可能にし,ロボット工学や触覚フィードバックシステム,材料編集などの実世界のアプリケーションの性能を向上させる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:51:19 GMT)
Limitations of Public Chest Radiography Datasets for Artificial Intelligence: Label Quality, Domain Shift, Bias and Evaluation Challenges [3.3]
大規模な公開データセットは、数十万のラベル付きイメージに病理アノテーションを提供する。放射線診断レポートから自動ラベル抽出がエラーを引き起こしますドメインシフトと人口バイアスはサブグループモデル一般可能性を制限する 2人の放射線学者による専門家によるレビューでは、公開データセットラベルと大きな意見の相違が判明した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:13:11 GMT)
Infinite-fold Asymptotic Quantum Advantage in Classical Correlation Sensing [3.3]
我々は,同一平均エネルギーの相関熱雑音と非相関熱雑音を$K$検出器上で識別する仮説試験問題について検討した。熱光学信号の相関を検出する場合、線形光学とオンオフ測定は古典的手法よりも優れた検出を実現するのに十分であることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:23:00 GMT)
(P)rior(D)yna(F)low: A Priori Dynamic Workflow Construction via Multi-Agent Collaboration [3.2]
本稿では,ワークフローの自動構築のための事前動的フレームワークを提案する。われわれのフレームワークはまずQテーブル学習を利用して意思決定空間を最適化する。エージェントは現在のタスクの進捗を評価し、次のエージェントの実行について優先順位を決定する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:24:14 GMT)
Structure-Aware Contrastive Learning with Fine-Grained Binding Representations for Drug Discovery [3.2]
この研究は、構造的先駆体をタンパク質表現に統合する配列に基づく薬物-標的相互作用フレームワークを導入する。このモデルはHumanおよびBioSNAPデータセットの最先端のパフォーマンスを実現し、BindingDBと競合する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:38:46 GMT)
T-SYNTH: A Knowledge-Based Dataset of Synthetic Breast Images [3.2]
物理シミュレーションを用いて画素レベルのセグメンテーションアノテーションを用いた合成画像を生成する。 2Dデジタルマンモグラフィー(DM)と3Dデジタル乳房トモシンセシス(DBT)画像の大規模オープンソースデータセットであるT-SYNTHをリリースする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:56:54 GMT)
Delta Knowledge Distillation for Large Language Models [3.1]
知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を移すことによって、大きなニューラルネットワークを圧縮するための広く採用されているアプローチである。教師の指導的微調整(SFT)で導入された分布シフトデルタを明示的に保存することにより,学生が最適な表現空間を近似するように促す,トークンレベルKDの新たな拡張であるデルタ知識蒸留(Delta-KD)を提案する。 ROUGE測定の実証結果から,デルタKDは教員の知識を多く保持しながら,学生のパフォーマンスを大幅に向上させることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:42:24 GMT)
Hybrid unary-binary design for multiplier-less printed Machine Learning classifiers [3.0]
Printed Electronics (PE)は、機械学習(ML)回路を実装するためのシリコンの柔軟性とコスト効率の代替手段を提供する。本研究は,コストのかかるエンコーダを除去し,より効率的かつ乗算性のない分類器の実行を可能にする,代替算術とハイブリッドなユニタリバイナリアーキテクチャについて検討する。 6つのデータセットの評価では、エリアの46%、パワーの39%が平均で、精度の低下は最小限であり、他の最先端の設計を上回っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:02:24 GMT)
Beyond Marginals: Learning Joint Spatio-Temporal Patterns for Multivariate Anomaly Detection [2.9]
時系列データでは、関連時系列の同時ずれにより異常を示すことができる。我々のアプローチは、潜在空間における結合依存をモデル化することでこの問題に対処する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:57:55 GMT)
The Role of Graph Topology in the Performance of Biomedical Knowledge Graph Completion Models [2.9]
公開生物医学知識グラフのトポロジ的特性を包括的に調査する。すべてのモデル予測と新しい分析ツールをリリースすることによって、コミュニティは私たちの仕事の上に構築し、これらの重要なアプリケーションの理解を引き続き改善するよう促します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:09:02 GMT)
CLEAR: A Comprehensive Linguistic Evaluation of Argument Rewriting by Large Language Models [2.9]
我々は、議論的テキストとその改善、Argument Improvement(ArgImp)というタスクに焦点を当てる。本稿では4つの言語レベルにマッピングされた57のメトリクスからなる評価パイプラインであるCLEARについて述べる。これらのモデルでは,文章の短縮と平均語長の増大,文章の融合によりArgImpが実現されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:53:41 GMT)
Toward a Unified Security Framework for AI Agents: Trust, Risk, and Liability [2.8]
信頼・リスク・責任(TRL)フレームワークは、信頼・リスク・責任の相互依存関係を結び付け、信頼の構築・強化の体系的な方法を提供する。 TRLフレームワークの意義は、その潜在的な社会的影響、経済的影響、倫理的影響などにある。潜在的な課題に対処し、6GネットワークにおけるAIの信頼性、リスクフリー、責任ある使用を促進するために、優れた価値をもたらすことが期待されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:55:03 GMT)
A Comparative Evaluation of Large Language Models for Persian Sentiment Analysis and Emotion Detection in Social Media Texts [2.8]
本研究では,ペルシャ語のソーシャルメディアテキストにおける感情分析と感情検出のための4つの大規模言語モデル(LLM)の比較評価を行った。その結果、全てのモデルの性能が許容できるレベルに達しており、最良の3つのモデルの統計的比較では、それらの間に有意な差は見られなかった。その結果、感情検出タスクは感情分析タスクと比較して全てのモデルにおいて困難であり、誤分類パターンはペルシア語のテキストにおけるいくつかの課題を表わす可能性があることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:59:07 GMT)
Automating Modelica Module Generation Using Large Language Models: A Case Study on Building Control Description Language [2.8]
本稿では,制御記述言語モジュールの自動生成における大規模言語モデルの利用について検討する。我々は,標準化されたプロンプトスキャフォールド,ライブラリ認識基盤,OpenModelicaによる自動コンパイル,ループ評価を併用した構造化ワークフローを開発した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:07:17 GMT)
The Why and How of Convex Clustering [2.8]
本稿では,凸最適化問題に基づくクラスタリング手法について概説する。重要なアルゴリズムを強調し、その計算コストが問題の大きさとどのようにスケールするかについて議論する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:56:55 GMT)
Large Vision Models Can Solve Mental Rotation Problems [2.8]
心的回転は、人間の空間的推論の鍵となるテストである。現代の視覚変換器の成功にもかかわらず、これらのモデルがどのように類似の能力を発達するかは未だ不明である。 ViT,CLIP,DINOv2,DINOv3の系統的評価を行った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:18:28 GMT)
Discrete Flow-Based Generative Models for Measurement Optimization in Quantum Computing [2.8]
本稿では,ハミルトニアンのグラフ表現を彩色するために生成フローネットワーク(GFlowNets)を適用するアルゴリズムを提案する。ベンチマーク分子ハミルトニアンでは, 測定コストを削減し, ソートインサーションベースラインよりも優れていた。この生成ポリシーフレームワークは、測定コストを削減するだけでなく、潜在的なハードウェア対応適応にも柔軟性を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:23:36 GMT)
Can I Trust This Chatbot? Assessing User Privacy in AI-Healthcare Chatbot Applications [2.7]
私たちの研究は、米国内のApp StoreとGoogle Playで利用可能な、広くダウンロードされた12のAIヘルスケアチャットボットアプリのプライバシプラクティスを評価した。調査対象アプリの半数はサインアップ時にプライバシーポリシーを示しておらず、その時点でデータ共有を無効にするオプションは2つだけだった。アプリのプライバシポリシの大部分は、データ保護対策に対処できなかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:29:43 GMT)
Mixture-of-Experts Framework for Field-of-View Enhanced Signal-Dependent Binauralization of Moving Talkers [2.6]
信号マッチングにおけるフィールド・オブ・ビュー・エンハンスメントのための新しい専門家フレームワークを提案する。提案手法は, 連続した話者の動きに適応し, ユーザが選択した方向からの音声を強調・抑制できる動的空間音響レンダリングを実現する。これにより、移動音源のリアルタイム追跡と強化が可能になり、音声フォーカス、ノイズ低減、拡張現実および仮想現実におけるワールドロックされたオーディオなどのアプリケーションをサポートする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:20:59 GMT)
Spatio-Temporal Anomaly Detection with Graph Networks for Data Quality Monitoring of the Hadron Calorimeter [2.6]
GraphSTADシステムは、検出器を横断する粒子によって誘導される局所的な空間特性を学習する。提案手法の精度を検証し,多様なチャネル障害タイプを抽出する。 GraphSTADシステムは、実運用レベルの精度を実現し、HCALのリアルタイム監視のためにCMSコアプロダクションシステムに統合されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:37:00 GMT)
Robust Utility Optimization via a GAN Approach [2.5]
本稿では,堅牢なユーティリティ最適化問題を解決するために,GAN(Generative Adversarial Network)アプローチを提案する。特に、投資家と市場の両方をニューラルネットワーク(NN)でモデル化し、ミニマックスゼロサムゲームでトレーニングする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:54:44 GMT)
Dual-Mode Deep Anomaly Detection for Medical Manufacturing: Structural Similarity and Feature Distance [2.5]
本稿では,2つの注意誘導型オートエンコーダアーキテクチャを提案する。 1つ目は、軽量でリアルタイムな欠陥検出を可能にする構造的類似性に基づくスコアリングアプローチである。第二に、Mahalanobis を用いた特徴距離ベースの戦略を、遅延特性の低減に応用する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:46:38 GMT)
On the complexity of unique quantum witnesses and quantum approximate counting [2.4]
量子オラクルを$mathsfBQPmathsfUniqueQMA$と$mathsfQMA$で分離する。局所ハミルトン問題のどんな構造的特性を活用できるのか? 局所ハミルトンの基底エネルギーを$mathsfUniqueQMA$プロトコルで推定できることを示すことによって、物理的動機付けの候補を導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:58:28 GMT)
Zero-Shot LLMs in Human-in-the-Loop RL: Replacing Human Feedback for Reward Shaping [2.4]
強化学習(Reinforcement Learning, RL)は、しばしば報酬のミスアライメントに苦しむ。 HITL(Human-in-the-loop)メソッドはこの問題を緩和するが、バイアスも導入する。これらの課題に対処するための2つの重要な貢献を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:32:51 GMT)
Suppressing Degradation in Quantum Batteries by Electromagnetically-induced Transparency [2.4]
電磁誘導透過(EIT)を導入してQBの老化を抑制することを提案する。 EITを組み込んだQBsは,EITを含まないものと比べ,自然崩壊に対する耐性が強いことが実証された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:54:30 GMT)
Scalable Multi-Objective Robot Reinforcement Learning through Gradient Conflict Resolution [2.4]
タスクベースの報酬と、現実的な行動に対するポリシーを規則化する用語の衝突を解決する方法を示す。本稿では、アクター更新を客観的な勾配に分解するアクター批判最適化の修正であるGCR-PPOを提案する。 GCR-PPOは、最大で9.5%の改善を達成し、より高度な改善を観察する、大規模な近位政策最適化を改善する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:18:07 GMT)
Can Hawking effect of multipartite state protect quantum resources in Schwarzschild black hole? [2.3]
我々は、シュワルツシルト時空の多部量子状態に対するホーキング効果の影響を分析する。その結果、ホーキング効果の影響下では、励起数$q$の増加は量子絡みと相互情報の減少につながることが示された。これは、励起多部状態に対するホーキング効果が量子相関を劣化させる傾向にあるが、同時に曲線化された時空における量子コヒーレンスを保護していることを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:37:27 GMT)
Self-supervised learning of imaging and clinical signatures using a multimodal joint-embedding predictive architecture [2.3]
肺結節診断のためのマルチモーダルモデルは、ラベル付きデータの不足と、これらのモデルがトレーニング分布に過度に適合する傾向によって制限される。これらの課題に対処するために、縦・マルチモーダルアーカイブからの自己教師型学習を活用する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:35:44 GMT)
Towards universal property prediction in Cartesian space: TACE is all you need [2.2]
原子クラスター膨張と運動電位は任意の構造決定的テンソル特性の体系的予測のための枠組みである。我々は、TACEが主要な同変フレームワークに匹敵する精度、安定性、効率を達成することを実証する。この研究は、新しい世代の普遍的原子論機械学習モデルの基礎を築いた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:51:07 GMT)
TypedSchematics: A Block-based PCB Design Tool with Real-time Detection of Common Connection Errors [2.2]
回路設計ブロックの再利用は、初心者が専門家が設計した再使用を妨げている主要な要因である。ブロックベースのPCB設計ツールであるTypedticsを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:26:01 GMT)
V-SenseDrive: A Privacy-Preserving Road Video and In-Vehicle Sensor Fusion Framework for Road Safety & Driver Behaviour Modelling [2.2]
V-SenseDriveはパキスタンの運転環境内で収集された最初のプライバシー保護型マルチモーダル運転行動データセットである。 V-SenseDriveはスマートフォンベースの慣性センサーとGPSセンサーのデータと同期した道路対向ビデオを組み合わせて、3つの目標運転行動を記録する。パキスタンにおける現実の運転を表現することによって、V-SenseDriveは、ドライバーの行動データセットのグローバルな状況における重要なギャップを埋める。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:55:14 GMT)
Socratic Mind: Impact of a Novel GenAI-Powered Assessment Tool on Student Learning and Higher-Order Thinking [2.2]
本研究では,ジェネレーティブ・人工知能(GenAI)を利用した形式的評価ツールであるソクラティック・マインド(Socratic Mind)が学習結果に与える影響について検討する。 GenAIツールに携わる学生は、クイズスコアが、そうでない学生に比べて大幅に向上した。我々の研究は、より深いエンゲージメントと高次の認知スキルを育成する上で、AIによる対話の約束を強調した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:08:24 GMT)
Scale and Rotation Estimation of Similarity-Transformed Images via Cross-Correlation Maximization Based on Auxiliary Function Method [2.2]
本稿では,2つの画像間のスケールと回転を,サブピクセル精度で共同で推定できる高効率アルゴリズムを提案する。画像アライメントは、異なる視点から撮影された画像を空間的に登録する重要なプロセスとして機能する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:22:13 GMT)
Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation [2.2]
大規模言語モデル(LLM)を外部知識に基盤付けるための重要なアプローチとして,検索-拡張生成(RAG)システムが登場している。本稿では,ガバナンス,サイバーセキュリティ,農業,産業研究,医療診断の5つの領域固有のRAGアプリケーションについて述べる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:12:45 GMT)
Assessing metadata privacy in neuroimaging [2.2]
OpenNeuroで公開されている6つのニューロイメージングデータセットのデータについてレビューした。プライバシーは一般的によく維持されており、重大な脆弱性はまれである。これらのリスクに対処し、より安全なデータ共有を可能にするための実践的な対策を概説する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:56:03 GMT)
PRISM: Phase-enhanced Radial-based Image Signature Mapping framework for fingerprinting AI-generated images [2.1]
我々は,AI生成画像のフィンガープリントのためのスケーラブルなフレームワークであるPRISMを紹介する。 PRISM-36Kは、6つのテキスト・ツー・イメージのGANモデルと拡散モデルによって生成される36,000の画像からなる新しいデータセットである。 PRISMは、このデータセットに対して92.04%の属性精度を達成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:57:26 GMT)
Read Before You Think: Mitigating LLM Comprehension Failures with Step-by-Step Reading [2.1]
大きな言語モデル(LLM)は、問題理解の欠陥によって複雑な推論タスクで失敗することが多い。本稿では,これらの理解障害について,系統的研究を行う。本稿では,ステップ・バイ・ステップ・レディング(SSR)ファミリについて紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:32:59 GMT)
Stochastic Adaptive Gradient Descent Without Descent [1.9]
本稿では,1次オラクルのみを用いて目的関数の局所的幾何を利用する,勾配付き凸最適化のための新しい適応的なステップサイズ戦略を提案する。様々な仮定の下で、勾配降下の収束とステップ化を証明し、チューニングされたベースラインと競合することを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:02:10 GMT)
Learning Mechanistic Subtypes of Neurodegeneration with a Physics-Informed Variational Autoencoder Mixture Model [1.9]
物理に基づくPDEによって制御された潜在動的モデルの混合を学習するための深層生成モデルを提案する。本手法は, 反応拡散PDEを可変オートエンコーダ(VAE)混合モデルフレームワークに統合する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:29:45 GMT)
Energy Equity, Infrastructure and Demographic Analysis with XAI Methods [1.8]
本研究は、複数の地域における電力使用量を調べるために、説明可能な人工知能(XAI)の手法をデプロイする。エネルギー消費の最も重要な問題、すなわち中央値の世帯所得で分けられたエネルギーに費やされる総量に対処する。分析結果に基づき, 新規エネルギー負荷電卓とともに, パイロットエネルギーエクイティWebポータルを設計した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:13:39 GMT)
A Closeness Centrality-based Circuit Partitioner for Quantum Simulations [1.8]
高性能コンピューティングシステム上での量子回路(QC)のシミュレーションは,現在の量子ハードウェアの限界にもかかわらず,アルゴリズムをベンチマークし,大規模量子計算の可能性を探るための重要な方法となっている。我々は,大規模QCに対して,フレキシブルコードジェネレータとともに効率的なパーティショニングスキームを提供するエンドツーエンドフレームワークを導入し,計算ノード間のデータ移動を最小限に抑えるポータブルソリューションを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:53:34 GMT)
PMPO: Probabilistic Metric Prompt Optimization for Small and Large Language Models [1.7]
PMPOはマスキングに基づく分析を通じて低品質のプロンプトセグメントを特定し、反復的にそれらを書き換えて改良された変種を提案する。単一のフォワードパスにおける損失を最小限に抑え、出力のサンプリングを排除し、選択のための人または判断に基づくスコアをなくし、変種の中から選択する。 PMPOは、BBHで最高平均精度を達成し、GSM8KとAQUA RATに強く依存し、AlpacaEval 2.0の勝利率を19ポイント以上上げる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:37:35 GMT)
Variables Ordering Optimization in Boolean Characteristic Set Method Using Simulated Annealing and Machine Learning-based Time Prediction [1.7]
本稿では,機械学習に基づく時間予測とシミュレーションアニーリング(SA)を統合した新しいフレームワークを提案する。我々は、任意の変数の順序付けに要する問題解決時間を推定するために、正確なML予測器 ft(X) を訓練する。実験により,本手法は標準BCSアルゴリズムよりもかなり優れていることが示された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:02:32 GMT)
RaceGAN: A Framework for Preserving Individuality while Converting Racial Information for Image-to-Image Translation [1.6]
GAN(Generative Adversarial Network)は画像から画像への翻訳において大きな進歩を見せている。人種属性翻訳中に複数のドメインにスタイルコードをマッピングできる新しいフレームワークであるRaceGANを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:55:37 GMT)
Positional Encoding in Transformer-Based Time Series Models: A Survey [1.5]
本研究は,変圧器を用いた時系列モデルにおいて,既存の位置符号化手法を体系的に検討する。シーケンスの長さ、信号の複雑さ、次元といったデータ特性は、メソッドの有効性に大きな影響を与えます。我々は、重要な課題を概説し、位置符号化戦略を強化する研究の方向性を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:31:51 GMT)
DyWPE: Signal-Aware Dynamic Wavelet Positional Encoding for Time Series Transformers [1.5]
動的ウェーブレット位置決めを導入する。離散ウェーブレット変換(DWT)を用いた入力時間から直接位置埋め込みを生成する新しい信号認識フレームワーク(DyWPE) DyWPEは、バイオメディカル信号の正弦波絶対位置符号化に比べて平均9.1%の相対的な改善を達成し、既存の8つの位置符号化法を一貫して上回っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:37:33 GMT)
Trainability of Quantum Models Beyond Known Classical Simulability [1.4]
変分量子アルゴリズム(VQA)は、短期量子コンピューティングの候補として有望である。システムサイズが指数関数的に消える不毛な高原のため、スケーラビリティの課題に直面している。最近の予想では、バレンプラトーを避けることは本質的に古典的なシミュラビリティにつながる可能性がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:26:31 GMT)
AmphiKey: A Dual-Mode Secure Authenticated Key Encapsulation Protocol for Smart Grid [1.4]
AmphiKeyは、古典的および量子的脅威に対してスマートグリッド通信を保護するように設計されている。単一のフレームワーク内で2つの異なる運用モード – 認証モードと識別モード – を提供する。主なコントリビューションは、セキュリティ強化、オプションの廃止、スマートグリッドインフラストラクチャのさまざまなニーズに適合した効率性を備えたフレキシブルなプロトコルの提供である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:20:45 GMT)
Negotiative Alignment: Embracing Disagreement to Achieve Fairer Outcomes -- Insights from Urban Studies [1.4]
診断パターンは本例では体系的であった。グループディスカッションでは、情報のギャップは減ったが、価値の衝突は減った。意見の不一致を信号として扱い、合計と共に最悪のグループの結果を報告することは、プランナーやAI実践者がトレードオフに遭遇し、少数派の優先事項を維持しながら効率を維持するのに役立つかもしれない。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:14:35 GMT)
Controllable Surface Diffusion Generative Model for Neurodevelopmental Trajectories [1.3]
本稿では,皮質成熟の制御可能なシミュレーションを支援する新しいグラフ拡散ネットワークを提案する。本研究では, 個別に訓練した年齢回帰ネットワークを騙すのに十分な精度で大脳皮質成熟度をモデル化しながら, 対象特異的な皮質形態を維持できることを実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:38:23 GMT)
Efficient Fine-Tuning of DINOv3 Pretrained on Natural Images for Atypical Mitotic Figure Classification in MIDOG 2025 [1.3]
非定型有糸分裂図(AMF)は予後不良に伴う細胞分裂を表わす。 MIDOG 2025チャレンジでは、複数のドメインにわたるAMF分類のベンチマークが導入されている。我々は、低ランク適応(LoRA)を用いて、自然画像に事前訓練された最近発表されたDINOv3-H+視覚変換器を微調整した。我々の微調整したDINOv3は病理組織学に効果的に移行し、予備試験セットで2位に達した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:53:45 GMT)
LLM Agents at the Roundtable: A Multi-Perspective and Dialectical Reasoning Framework for Essay Scoring [1.3]
Roundtable Essay Scoring (RES) は、ゼロショット設定で正確でヒューマンアライメントのスコアリングを行うために設計されたマルチエージェント評価フレームワークである。 RESは弁証的推論プロセスを通じて個々の評価を集約し、最終的な総合的なスコアを生成する。 ChatGPTとClaudeを用いたASAPデータセットの実験では、RESは素早いプロンプトよりも平均QWKを34.86%改善した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:55:33 GMT)
Designing Latent Safety Filters using Pre-Trained Vision Models [1.3]
事前学習された視覚モデル(PVR)は、様々なロボティクス領域における制御に有効な知覚バックボーンであることが示されている。我々は、障害セットを定義する分類器、ハミルトン・ヤコビ(HJ)リーチビリティに基づく安全フィルタ、潜在世界モデルのためのバックボーンとしてこれらを用いる。バックボーンであるモデルのトレーニングにおいて、スクラッチからのトレーニング、微調整、PVRの凍結のトレードオフについて論じる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:06:37 GMT)
Leveraging Reinforcement Learning, Genetic Algorithms and Transformers for background determination in particle physics [1.3]
本稿では,美容ハドロン崩壊測定に影響を及ぼす重要な背景を明らかにするための新しい手法を提案する。機械学習の観点から,RLと遺伝的アルゴリズムの相乗効果を利用した新しいアルゴリズムを提案する。また, 崩壊を表すトークン列を扱うために, RLエージェントのトランスフォーマーアーキテクチャを組み込んだ。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:17:25 GMT)
Efficient and Versatile Model for Multilingual Information Retrieval of Islamic Text: Development and Deployment in Real-World Scenarios [1.3]
イラン語多言語コーパスの特徴を活用し、イスラムドメインのためのアドホックIRシステムを開発するための最適な戦略を検討する。我々は,モノリンガル,クロスリンガル,トランスレーショナル・トレインオールの4つの訓練手法と,クロスリンガルとモノリンガルを併用した新しい混合手法を用いた11種類の検索モデルを構築した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:32:07 GMT)
Synergizing Static Analysis with Large Language Models for Vulnerability Discovery and beyond [1.3]
本稿では,Large Language Models (LLMs) と Static Application Security Testing (SAST) の相乗効果を検討した。 LLMはコード解析やパターン認識に優れるが、矛盾や幻覚に陥りやすい。 SAST-GeniusはSem単独と比較して偽陽性を約91%(225～20)減らした。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:15:20 GMT)
ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation [1.2]
学習されたダイナミックスモデルによるプランニングは、多目的な現実世界の操作に対して有望なアプローチを提供する。残差物理モデリングと不確実性に基づく能動学習を組み合わせたフレームワークであるActivePusherを提案する。シミュレーションと実環境の両方でアプローチを評価し,データ効率を継続的に改善し,より高い計画成功率を達成することを実証した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:45:55 GMT)
Stochastic Clock Attention for Aligning Continuous and Ordered Sequences [1.2]
我々はアライメントモデルとして機能する連続および順序列に対する注意機構を定式化する。 Transformerのテキスト音声テストベッドでは、この構造により、より安定したアライメントが得られ、グローバルな時間スケーリングに対する堅牢性が向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:18:34 GMT)
Support-Projected Petz Monotone Geometry of Two-Qubit Families: Three-Channel Identity and Non-Reduction of Curvatures [1.2]
本稿では、任意のペッツ単調量子測度を回路定義部分多様体へ引き戻すことにより、純粋2量子変分族の情報幾何について検討する。このフレームワークは対称対数微分(SLD/Bures)のケースを厳密に一般化し、特にウィグナー・ヤネーゼとボゴリボフ・クボ・モリ計量を含む。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:27:10 GMT)
From Learning to Optimize to Learning Optimization Algorithms [1.2]
我々は、古典的アルゴリズムが従うが、これまでは、学習の最適化(L2O)には使われていない重要な原則を特定します。我々は,データ,アーキテクチャ,学習戦略を考慮した汎用設計パイプラインを提供し,古典最適化とL2Oの相乗効果を実現する。我々は,新しい学習強化BFGSアルゴリズムを設計し,テスト時に多くの設定に適応する数値実験を行うことにより,これらの新原理の成功を実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:54:40 GMT)
Rule-Based Error Detection and Correction to Operationalize Movement Trajectory Classification [1.2]
動作軌跡プラットフォームに組み込むためのモデルの誤り訂正と検出を行う,ニューロシンボリックなルールベースのフレームワークを提供する。最大0.984の誤差を予測するためのF1スコア、分布外精度の大幅な向上(ゼロショット精度のSOTAよりも8.51%向上)、SOTAモデルよりも精度の向上を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:31:57 GMT)
Generative Large Language Models for Knowledge Representation: A Systematic Review of Concept Map Generation [1.2]
生成型大規模言語モデル(LLM)の台頭により,概念地図による知識表現を自動化する新たな機会が開かれた。本総説では, LLM を用いた概念マップ生成に関する新たな研究の体系化について述べる。人間のループシステム、弱い教師付き学習モデル、微調整されたドメイン固有LLM、素早いエンジニアリングによる事前訓練されたLLM、知識ベースを統合するハイブリッドシステム、シンボルと統計ツールを組み合わせたモジュラーフレームワークである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:36:54 GMT)
AI-Derived Structural Building Intelligence for Urban Resilience: An Application in Saint Vincent and the Grenadines [1.1]
衛星画像から屋上属性を自動的に推測するAI駆動ワークフローを提案する。我々の研究は、AIと地球観測(EO)データを利用して、より効率的でエビデンスベースの都市ガバナンスを可能にする、SIDSに新たな能力を提供することを目的としています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:12:50 GMT)
Decoded Quantum Interferometry Requires Structure [1.1]
MAX-$k$-XOR-SATの典型例における復号量子干渉法(DQI)の性能について検討した。 DQI は、多くの標準的な符号のアンサンブルに対して、量子ワッサーシュタイン計量の下ではおよそリプシッツであることが証明されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:51:36 GMT)
A Race Bias Free Face Aging Model for Reliable Kinship Verification [1.1]
我々は、人種的に偏りのない画像を生成するために、RA-GANとRA-GANという2つの新しいモジュール、ACEpSpと特徴ミキサーからなる顔老化型GANモデルを提案する。無バイアス合成写真は、同年齢の親子画像の検証結果を調べるために親子検証に使用される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:34:20 GMT)
Philosophy-informed Machine Learning [1.1]
哲学インフォームド機械学習(PhIML)は、分析哲学からMLモデルアーキテクチャ、目的、評価プロトコルへのコアアイデアを注入する。本稿では,哲学的ゲインとアライメントを示す概念的基礎を概観する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:51:21 GMT)
PolBiX: Detecting LLMs' Political Bias in Fact-Checking through X-phemisms [1.0]
本研究は,ドイツの主張において,エウヘミズムやディフェミズムと言葉を交換することで,政治的偏見を体系的に調査する。政治的傾向よりも、判断的単語の存在が真理性評価に大きく影響していることが分かる。いくつかのモデルでは政治的偏見の傾向を示しているが、これはプロンプトにおける客観主義を明示的に求めることによって緩和されるものではない。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:26:53 GMT)
Deep Learning Agents Trained For Avoidance Behave Like Hawks And Doves [1.0]
簡単な回避ゲームを行う深層学習エージェントによって表現される最適な戦略を提案する。我々は、2人のエージェントの学習と行動を分析する。本研究は,ゲーム『ホークス』や『ダブズ』に類似した行動を示し,攻撃的エージェントが目標に到達するための攻撃的戦略を採用し,他のエージェントが攻撃的エージェントを避ける方法を学ぶことを示唆している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:53:07 GMT)
Learning Conservative Neural Control Barrier Functions from Offline Data [1.0]
オフラインデータセットからニューラルネットワークバリア関数をトレーニングするアルゴリズムを提案する。我々のアルゴリズムはこれらの機能を訓練し、システムが安全でない状態に達するのを防げるだけでなく、配布外状態に到達するのを嫌うようにもしている。実験の結果, CCBFはタスク性能に最小限の影響を与えつつ, 安全性を維持する上で, 既存の手法よりも優れていたことが確認された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:32:32 GMT)
MapAnything: Mapping Urban Assets using Single Street-View Images [1.0]
本稿では,個々の画像を用いてオブジェクトのジオコーディネートを自動的に決定するモジュールであるMapAnythingを紹介する。都市オブジェクトの自動化やインシデントマッピングの推奨事項として,モジュールの詳細と検証を行う。都市環境におけるLiDAR点雲に対する推定距離の精度を測定した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:02:54 GMT)
ALIGNS: Unlocking nomological networks in psychological measurement through a large language model [1.0]
本稿では,評価されたアンケート尺度を訓練した大規模言語モデルベースシステム,ALIGNS の生成のための潜時指標分析について紹介する。 ALIGNSは心理学、医学、社会政策、その他の分野にまたがる550,000以上の指標を含む3つの包括的なノモロジーネットワークを提供している。これは、測定バリデーションにおける基礎的な問題を解決するために、大きな言語モデルの最初の応用である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:46:59 GMT)
Resource-Aware Aggregation and Sparsification in Heterogeneous Ensemble Federated Learning [0.9]
フェデレートラーニング(FL)は、プライベートクライアントデータによる分散トレーニングを可能にする。現在のアンサンブルに基づくFL法はモデル予測の多様性を捉えるには不十分である。多様な計算能力を持つクライアントに適したグローバルアンサンブルベースのFLフレームワークである textbfSHEFL を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:49:06 GMT)
Semi-Supervised 3D Medical Segmentation from 2D Natural Images Pretrained Model [0.9]
本稿では,3次元医用画像のセグメンテーションを改善するために,2次元自然画像に事前訓練された一般視覚モデルからの知識の伝達について検討する。本稿では,2次元事前学習モデルからスクラッチから学習した3次元セグメンテーションモデルまで,段階的に知識を蒸留するモデル非依存フレームワークを提案する。我々のアプローチであるM&Nは、互いに生成した擬似マスクを用いて2つのモデルの反復的協調学習と、提案した学習率誘導サンプリングを含む。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:17:52 GMT)
Dynamical decoupling protection for three-level systems [0.9]
3レベルシステムのための物理的に実現可能な動的デカップリング演算子列を構築する。本手法は, 環境騒音を除去することにより, 3段階の量子ゲートの忠実度を効果的に向上させることができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:26:24 GMT)
The Impact of Structural Changes on Learning Capacity in the Fly Olfactory Neural Circuit [0.9]
ショウジョウバエの体(MB)は嗅覚学習と記憶に関与していることが知られている。これまでの研究では、MB内のケニオン細胞へのプロジェクションニューロン(PN)接続に焦点を当てていた。キノコ体回路の構造と接続性の変化、特にKC内からキノコ体出力ニューロン(MBON)の神経回路がMBONの匂いを識別する能力に与える影響について検討した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:12:58 GMT)
Threats and Security Strategies for IoMT Infusion Pumps [0.9]
本研究は、現代医療において重要なデバイスであるIoMT注入ポンプのサイバーセキュリティ脆弱性に焦点を当てる。この結果から、デバイスレベルの欠陥、認証とアクセス制御の問題、ネットワークと通信の弱点、データセキュリティとプライバシのリスク、医療ネットワーク内の横から攻撃される可能性がある運用または組織上の課題などの脆弱性に直面していることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:29:07 GMT)
Deep Learning Foundation and Pattern Models: Challenges in Hydrological Time Series [0.8]
本稿では,水文学データを用いて時系列における重要な特徴を特定することを目的とする。本研究では, CAMELS と Caravan のグローバルデータセットから水文学時系列を解析する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:42:10 GMT)
Radiology Report Conditional 3D CT Generation with Multi Encoder Latent diffusion Model [0.8]
Report2CTは3次元胸部CTボリュームを自由テキストラジオグラフィーレポートから直接合成するための条件拡散フレームワークである。 Report2CTは、優れた視覚的品質とテキスト画像アライメントを備えた解剖学的に一貫したCTボリュームを生成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:32:23 GMT)
Fast Multipole Attention: A Scalable Multilevel Attention Mechanism for Text and Images [0.8]
我々は,n体物理学にインスパイアされた自己注意のための分割・コンカヤ機構である高速多極注意(FMA)を導入する。 FMAは、完全なコンテキストインタラクションを保持しながら、自己アテンションの時間とメモリの複雑さを$mathcalOleft(n2right)$から$mathcalO(n log n)$に削減する。言語タスクと視覚タスクのためのFMAの1次元実装と2次元実装をそれぞれ開発した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:14:08 GMT)
Data Quality Monitoring for the Hadron Calorimeters Using Transfer Learning for Anomaly Detection [0.8]
トランスファーラーニング(TL)メカニズムは、新しいタスクに事前訓練されたモデルを利用することで、データのスパーシリティとモデルの複雑さを軽減することを約束する。畳み込み,グラフ,リカレントニューラルネットワークを組み込んだハイブリッドオートエンコーダアーキテクチャを用いて,高次元ST ADにおけるTLの可能性を示す。この研究の主な貢献は、エンコーダネットワークとデコーダネットワークのコンテキストにおけるTLのポテンシャルと制限の探索である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:21:58 GMT)
Open-system analogy of Berry conjecture [0.8]
ベリー予想は孤立系における量子カオスの理解の中心である。ベイリー予想の開系類似性を確立し、量子定常状態と古典的な散逸的誘引子を接続する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:49:37 GMT)
Probabilistic and nonlinear compressive sensing [0.8]
モンテカルロサンプリングを必要としない正則回帰のスムーズな確率的再構成を提案する。 IHT や (Relaxed-) Lasso などの圧縮センシングアルゴリズムよりも優れていることを実証的に実証した。また, 学生ネットワークの圧縮による非線形教師ネットワークのパラメータ回復がいつ可能かを調べることで, 圧縮センシングの非線形一般化に関する研究にも貢献する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:22:48 GMT)
Explainable AI for Infection Prevention and Control: Modeling CPE Acquisition and Patient Outcomes in an Irish Hospital with Transformers [0.8]
本研究では,患者に対するCPEの影響を調べるための,eXplainable AIモデリングフレームワークを提案する。診断基準,病棟移行,患者の人口統計,感染関連変数,接触ネットワークの特徴を組み込んだ,アイルランドの急性病院の入院データセットを解析した。既往の病院曝露や入院状況,ネットワーク集中度など,感染症に関連する特徴は,患者の予後やCPE取得リスクの予測に強い影響を及ぼすと考えられた。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:29:11 GMT)
Full Quantum Stack: Ket Platform [0.7]
エンド・ツー・エンドの量子ソフトウェアスタックを示し、ユーザ向けコードからハードウェア実行までの抽象化の各レイヤを詳述する。私たちは、アルゴリズム開発のための表現力豊かなPythonベースのインターフェースを提供するKet量子プログラミングプラットフォームで、最も高いレベルから始めます。我々は,電子回路を物理実現に接続し,キャリブレーションされたマイクロ波パルスによってネイティブゲートがどのように実装されるかを説明する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:14:01 GMT)
Exploring multimodal implicit behavior learning for vehicle navigation in simulated cities [0.7]
Inlicit Behavioral Cloning (IBC) with Energy-Based Models (EBMs) to capture multimodality。本稿では,データ拡張型IBC(DA-IBC)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:17:29 GMT)
Comparing Computational Pathology Foundation Models using Representational Similarity Analysis [0.7]
計算神経科学の手法を用いて、6つのCPath基礎モデルの表現空間を体系的に解析する。 UNI2 と Virchow2 は最も異なる表現構造を持つのに対し、Prov-Gigapath はモデル間の平均類似度が最も高い。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:01:13 GMT)
Circuit-based chatacterization of finite-temperature quantum phases and self-correcting quantum memory [0.7]
ゼロ温度トポロジカルコードと同じ熱相にある任意の系が、マクロ的に長い時間量子情報をコヒーレントに保存していることを示す。熱平衡系に情報をエンコードし、復号するために、明示的な符号化および復号化チャネル回路を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:55:15 GMT)
Comparative Analysis of STEM and non-STEM Teachers' Needs for Integrating AI into Educational Environments [0.6]
本研究は,AIと分析機能を取り入れることで,教育プラットフォームをどのように改善できるかを考察する。我々は8人のK-12教師にインタビューを行い、ブロックベースのプログラミング(BBP)プラットフォームをクラスで使用しながら、その実践とニーズについて質問した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:20:18 GMT)
AI-Driven Multi-Agent Vehicular Planning for Battery Efficiency and QoS in 6G Smart Cities [0.6]
本稿では,これらの要件を満たすためのSimulator Orchestrator(SO)の拡張について述べる。現実的な都市データセットに対する予備的な結果は、車載計画アルゴリズムを利用すると、バッテリーと性能が向上することを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:46:22 GMT)
Dual-Mode Visual System for Brain-Computer Interfaces: Integrating SSVEP and P300 Responses [0.6]
本研究では新しい発光ダイオード(LED)を用いた二重刺激装置の開発と評価について述べる。このシステムは7Hz、8Hz、9Hz、10Hzの4つの異なる周波数を用いており、前方、後方、右側、左方向の制御に対応している。提案したハイブリッドシステムは平均分類精度86.25%、平均ITRは42.08ビット/分(bpm)である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:25:18 GMT)
Synaptic Theory of Chunking in Working Memory [0.6]
本稿では, 短期的なシナプス可塑性により, 動作記憶におけるチャンク表現の形成を可能にする, チャンクのシナプス理論を紹介する。チャンキングニューロン'の特異的集団は、ゲーティングと同様、刺激応答性ニューロン群を選択的に制御する。我々の研究は、脳がリアルタイムでどのように情報を整理するかを理解するための、概念的で分析的な枠組みを提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:16:45 GMT)
GIN-Graph: A Generative Interpretation Network for Model-Level Explanation of Graph Neural Networks [0.6]
グラフニューラルネットワーク(GIN-Graph)のモデルレベル記述のための新しい生成ネットワークを提案する。 GIN-Graphは信頼性と高品質なモデルレベルの説明グラフを生成する。実験結果から,GIN-Graphは様々なグラフデータセット上で訓練されたGNNの解釈に応用可能であることが示唆された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:44:47 GMT)
The Distribution Shift Problem in Transportation Networks using Reinforcement Learning and AI [0.6]
我々はMetaLightと呼ばれる最先端のMeta RLアプローチを評価し,分析する。特定の条件下では、MetaLightは確かに合理的に良い結果をもたらす可能性があるが、他の条件下では、うまく機能しないかもしれないことを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:24:08 GMT)
Quantum Convolutional Neural Network for Phase Recognition in Two Dimensions [0.5]
量子畳み込みニューラルネットワーク(Quantum Convolutional Neural Network, QCNN)は、複雑な量子状態を特徴づける量子回路である。そこで我々は,位相認識を2次元で行うQCNNを構築した。ネットワークはまた、トポロジ的順序が認識されるまでのノイズ閾値を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:02:56 GMT)
Capturing the Page Curve and Entanglement Dynamics of Black Holes in Quantum Computers [0.5]
我々は,IBMの超伝導量子コンピュータ上でのブラックホール蒸発のおもちゃキュービットモデルであるqubitトランスポートモデルについて,厳密に検討した。具体的には、効率的なランダムユニタリ回路を用いて、ブラックホールのスクランブルダイナミクスの量子シミュレーションを実装した。我々は、量子ビット輸送モデルにおけるR'enyiエントロピーを正確に決定し、複雑な量子系の将来の研究における量子コンピュータの有用性を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:10:47 GMT)
Advanced Physics-Informed Neural Network with Residuals for Solving Complex Integral Equations [0.5]
RISNは、幅広い積分方程式と積分微分方程式を解くために設計された、新しいニューラルネットワークアーキテクチャである。 RISNは残差接続を高精度な数値法と統合する。 RISNは古典的なPINNよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:27:52 GMT)
Multiple many-body localization transitions in a driven non-Hermitian quasiperiodic chain [0.5]
フロッケ加熱による運転時間の増加に伴い多体局在系が熱化する。厳密には、駆動期間のさらなる増加は、一連の局所化-非局在化遷移をもたらす。非ハーモニティ性は、拡張された島の境界に感受性を与え、フロッケ多体皮膚効果をもたらす。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:38:50 GMT)
The Energy-Efficient Hierarchical Neural Network with Fast FPGA-Based Incremental Learning [0.4]
従来の勾配に基づくトレーニング手法は非効率であり、多くの反復的な更新と高消費電力を必要とする。本稿では,階層分解とFPGAに基づく直接方程式解法と漸進学習を組み合わせたハイブリッドフレームワークを提案する。提案手法では,ニューラルネットワークを2つの機能層に分割する。低層はFPGA上の単一ステップ方程式により最適化され,効率よく並列化可能な特徴抽出が可能であり,高層は適応的な漸進的学習を用いて,完全リトレーニングなしで連続的な更新をサポートする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:54:15 GMT)
Forecasting and Visualizing Air Quality from Sky Images with Vision-Language Models [0.4]
大気汚染は公衆衛生と環境の持続可能性にとって重要な脅威である。本稿では,スカイイメージから環境大気汚染レベルを予測するAI駆動エージェントを提案する。提案手法は, 統計的テクスチャ解析と教師あり学習を組み合わせた汚染分類手法である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:36:38 GMT)
Sentinel Agents for Secure and Trustworthy Agentic AI in Multi-Agent Systems [0.4]
本稿では,マルチエージェントシステム(MAS)のセキュリティと信頼性向上を目的とした新しいアーキテクチャフレームワークを提案する。このフレームワークの中心的なコンポーネントは、分散セキュリティ層として機能するSentinel Agentsのネットワークである。このようなエージェントは、エージェント間のコミュニケーションを監督し、潜在的な脅威を特定し、プライバシーとアクセス制御を強制し、包括的な監査記録を維持することができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:39:59 GMT)
Evidential Physics-Informed Neural Networks for Scientific Discovery [0.4]
E-PINN(Evidential Physics-Informed Neural Network) E-PINN(Evidential Physics-Informed Neural Network)の基礎となる理論と実装ガイドラインについて述べる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:06:14 GMT)
Efficient motion-based metrics for video frame interpolation [0.4]
本研究では,運動場の分散度を計測する動き計測手法を提案する。次に、提案したメトリクスを使用して、アートフレームメトリクスのさまざまな状態を評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:23:38 GMT)
Predicting Case Suffixes With Activity Start and End Times: A Sweep-Line Based Approach [0.4]
本稿では,開始と終了のタイムスタンプによるアクティビティからなるケースサフィックスの予測手法を提案する。提案手法は,各アクティビティの待ち時間と処理時間の両方を予測する。実生活および合成データセットの評価は、このアプローチの異なるインスタンス化の精度を比較する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:01:30 GMT)
Modeling User Redemption Behavior in Complex Incentive Digital Environment: An Empirical Study Using Large-Scale Transactional Data [0.3]
我が国の個人金融アプリケーションから実世界の取引データを分析した。ポイントの利用はランダムではなく、体系的に人口統計と結びついていることがわかりました。巨額の助成金は、現金支出に影響を与えることなく、ポイント支出の増加を刺激した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:49:29 GMT)
Classical and Quantum Heuristics for the Binary Paint Shop Problem [0.3]
バイナリペイントショップ問題(BPSP)は自動車製造における最適化問題である。主要な性能指標はペイントスワップ比であり、車ごとの平均色変化数である。 BPSPの重み付きMaxCutへの還元により,QAOAをBPSPに適用するための理論的基礎を構築した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:00:00 GMT)
Artificial Intelligence and Market Entrant Game Developers [0.3]
この論文は、生成型AIがより一般公開されるようになると、比較的独立した開発者が市場に参入したことを示している。 AIに関連するゲーム機能は、独立開発者に対するAIの影響を示唆している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:35:19 GMT)
Evaluating the Limitations of Local LLMs in Solving Complex Programming Challenges [0.3]
本研究では,オープンソースのローカルホスト型大規模言語モデル(LLM)による複雑なプログラミングタスクの処理性能について検討する。 AI駆動のコード生成評価(FACE)のためのオリジナルのフレームワークをベースとして、著者らはパイプラインを完全にオフラインで動作するように改造した。その結果、パス@1の精度は局所モデルでは控えめであり、最高のモデルはプロプライエタリモデルの受け入れ率の約半分であることがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:13:30 GMT)
Orion: Fuzzing Workflow Automation [0.3]
従来のツールとLLM推論を統合することでファジィのマニュアルを自動化するフレームワークであるOrionを紹介した。ベンチマークスイート全体を通じて、Orionはワークフローステージに応じて、人間の労力を46～204倍削減します。我々は、広く使われているオープンソースのclibライブラリで、これまで知られていなかった2つの脆弱性を発見し、その効果を実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:52:06 GMT)
Top-$k$ Feature Importance Ranking [0.3]
RAMPARTは、新しいアルゴリズムで既存の機能の重要度を測定するフレームワークである。提案手法は,有望な特徴に計算資源を徐々に集中させる適応的半進戦略を組み合わせたものである。本稿では,RAMPARTが適切な上位$kのランキングを,軽度条件下で高い確率で達成できることを理論的に保証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:58:30 GMT)
Unentanglement and Post-Measurement Branching in Quantum Interactive Proofs [0.3]
我々は,最初のメッセージだけが量子である場合でも,3ラウンドの非絡み合いの量子対話的証明がNEXPと等しいことを示す。 2ラウンドの量子古典的証明システムにおける測定後の分岐について検討する。パブリック・コインとプライベート・コインの古典的対話的証明の等価性とは異なり、測定後の分岐から生じる量子環境の分離の証拠を与える。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:09:12 GMT)
Maize Seedling Detection Dataset (MSDD): A Curated High-Resolution RGB Dataset for Seedling Maize Detection and Benchmarking with YOLOv9, YOLO11, YOLOv12 and Faster-RCNN [0.3]
スタンドカウントは、植物が発芽した数を決定し、再移植や入力の調整といったタイムリーな決定を導く。実生苗数計測のための高品質な航空画像データセットであるMSDDを導入し,早稲作モニタリング,収量予測,現地管理に応用した。 MSDDには、様々な成長段階、植林設備、土壌タイプ、照明条件、カメラアングル、密度の3つのクラス・シングル、ダブル、トリプルの植物が含まれる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:41:59 GMT)
Discrete optimal transport is a strong audio adversarial attack [0.3]
我々は、離散的最適輸送(DOT)が、現代の音声防汚対策(CM)に対する効果的なブラックボックス対逆攻撃であることを示した。フレームレベルのWavLM埋め込みは、エントロピーOTとトップ$kのバリセント型プロジェクションを介して、未ペアのボナファイドプールにアライメントされ、その後、ニューラルボコーダでデコードされる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:46:16 GMT)
Modeling Transformers as complex networks to analyze learning dynamics [0.3]
本研究は,複雑なネットワーク理論のレンズを用いて,動的学習を特徴付けることができるかどうかを考察する。ノードがモデルの計算コンポーネントである有向重み付きグラフとして、トランスフォーマーベースのモデルを表現するための新しい手法を紹介します。グラフ理論の一連のメトリクスを分析して、ネットワークの構造が探索、統合、洗練の異なるフェーズを通して進化することを明らかにする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:20:26 GMT)
Physics-Informed GCN-LSTM Framework for Long-Term Forecasting of 2D and 3D Microstructure Evolution [0.2]
このフレームワークはコンポジション対応で、異なるコンポジションを持つデータセットを共同でトレーニングし、潜在グラフ空間で動作する。このフレームワークは、進化するミクロ構造の空間的および時間的パターンを捉えながら、トレーニング後の計算コストを削減した長距離予測を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:55:56 GMT)
Causal inference for the expected number of recurrent events in the presence of a terminal event [0.2]
終端故障イベントを伴う繰り返しイベントデータにおける因果推論のための多元的ロバストな推定フレームワークを開発する。条件付き独立検閲よりも弱い条件下で推定値が識別可能であることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:38:07 GMT)
Coupling 4H-Silicon Carbide spins to a microwave resonator at milli-Kelvin temperature [0.2]
マイクロ波空洞モードとスピン量子ビット遷移を結合することは、効率的な量子ビットの読み出しと制御を可能にするために重要である。炭化ケイ素(SiC)材料中の異なるスピン量子ビット遷移を10mKの温度で約12.6GHzの3Dマイクロ波(MW共振器モード)に結合させることを実験的に観察した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:03:08 GMT)
LLM-Assisted Topic Reduction for BERTopic on Social Media Data [0.2]
本稿では,話題生成のためのBERTopicと話題短縮のための大規模言語モデルを組み合わせたフレームワークを提案する。 3つのTwitter/Xデータセットと4つの異なる言語モデルにまたがるアプローチを評価した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:59:11 GMT)
Mini-Batch Robustness Verification of Deep Neural Networks [0.2]
BaVerLyは、ミニバッチを動的に構築し、検証することで、$epsilon$-ballsのセットの局所的な検証を促進する音と完全検証器である。結果、BaVerLyは平均2.3倍、最大4.1倍の検証を行い、分析時間を24時間から6時間に短縮した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:33:26 GMT)
Threat Modeling for Enhancing Security of IoT Audio Classification Devices under a Secure Protocols Framework [0.2]
本稿では,エッジデバイス,セルネットワーク,クラウドを3つの異なる信頼領域として扱うセキュリティプロトコルを提案する。 STRIDE駆動の脅威モデルとアタックツリー分析が設計を導く。トランジット中のデータはTLS 1.3によって保護され、クエンタム後のレジリエンスを提供するためにカイバーとディリシウムとハイブリッド化されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:25:50 GMT)
BEACON: Behavioral Malware Classification with Large Language Model Embeddings and Deep Learning [0.2]
従来の静的解析は、コードの難読化、ポリモーフィズム、その他の回避技術を用いた現代の脅威に対して防御に失敗する。本研究では,大規模言語モデル(LLM)を利用した新しいディープラーニングフレームワークBEACONを提案する。これらの埋め込みは、各サンプルのセマンティックおよび構造パターンをキャプチャし、マルチクラスのマルウェア分類のための1次元畳み込みニューラルネットワーク(1D CNN)によって処理される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:24:12 GMT)
Sampled-Based Guided Quantum Walk: Non-variational quantum algorithm for combinatorial optimization [0.2]
任意の次数の二項最適化問題を解くための新しい量子アルゴリズムであるSamBa-GQWを紹介する。我々のアルゴリズムの重要な新規性は、ハミルトニアン問題のスペクトルに関する情報を提供するオフラインの古典的サンプリングプロトコルである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:49:06 GMT)
Living on the edge: a non-perturbative resolution to the negativity of bulk entropies [0.2]
Lin, Maldacena, Rozenberg, and Shan (LMRS) はブラックホール物理学の新しいパラドックスを発表した。両側のブラックホールにおけるエンタングルメントとR'enyiエントロピーは、幾何学が非常に多くの物質励起を含む場合、負となることがある。通常の量子系におけるエンタングルメントとR'enyiエントロピーは負ではないので、このパズルを解くことはブラックホールの量子力学的記述を理解するための必要なステップである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:00:00 GMT)
A Black Hole Airy Tail [0.2]
Jackiw-Teitelboim重力における焼成エントロピーを計算する。我々は、JT重力中のブラックホールが孤立した基底状態であることを証明するために、重力経路積分を利用する方法を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:47:16 GMT)
Deep learning and abstractive summarisation for radiological reports: an empirical study for adapting the PEGASUS models' family with scarce data [0.2]
医学のような繊細でデータ制限のある領域では、抽象的な要約は依然として難しい。非ドメイン固有の抽象的要約エンコーダ-デコーダモデルファミリーの微調整過程について検討した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:51:33 GMT)
Temporal Representation Learning of Phenotype Trajectories for pCR Prediction in Breast Cancer [0.2]
乳がん化学療法(NACT)を施行した症例において,画像データから治療反応の早期動態の表現を学習し,病理学的完全反応(pCR)を予測することを提案する。乳房MRI(MRI)画像の経時的変化は、潜在空間の軌跡を形成し、応答の予測の基礎となる。公開可能なISPY-2データセットの実験において、潜在軌道空間における線形分類器は、前処理データ(T0)と初期応答(T0+T1)と画像時間(0.861)のみを用いて0.761の平衡精度を達成する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:37:27 GMT)
AI and the Future of Academic Peer Review [0.2]
大規模言語モデル(LLM)は、ジャーナリスト、資金提供者、個人レビュアーによってピアレビューパイプラインで試験されている。初期の研究は、AIアシストが人間に匹敵する品質のレビューを作成できることを示唆している。教師付きLDM支援は, 人間の判断を損なうことなく, エラー検出, タイムライン, レビューヤの作業量を改善することができることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:04:39 GMT)
The superconducting grid-states qubit [0.2]
固有状態が保護格子状態を形成する超伝導量子ビットを導入する。我々は、回路が小さな障害を許容し、環境騒音に対して堅牢性を得るのを観察する。これらの発見は、創発的な特性を持つ先進固体装置の将来の探索の舞台となった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:23:05 GMT)
Krylov Complexity for Open Quantum System: Dissipation and Decoherence [0.1]
ボーソニック浴モデルに対するリンドブラッドマスター方程式を用いた開量子系のクリロフ複雑性について検討する。クリャロフ複雑性は全系において飽和し、デコヒーレンス項が抑制されたときに期待される散逸挙動を再現する。しかし、クリロフの複雑性はデコヒーレンスの開始に敏感に見え、明確な特徴は見られない。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:12:01 GMT)
Optimizing Quantum Photonic Integrated Circuits using Differentiable Tensor Networks [0.1]
本稿では,量子フォトニック集積回路の勾配に基づく最適化手法を提案する。量子フォトニック回路を2つの重要なユースケースに最適化することにより,本手法の適用性を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:08:40 GMT)
Composable logical gate error in approximate quantum error correction: reexamining gate implementations in Gottesman-Kitaev-Preskill codes [0.1]
論理ゲート誤差(composable logic gate error)と呼ばれる1つのスカラー量を導入する。望ましいターゲットゲートからの論理アクションの逸脱と、コード空間からのリークの両方をキャプチャする。物理ユニタリの行列要素から構成可能な論理ゲート誤差を(近似)論理基底状態にバインドする方法を示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:27:09 GMT)
Magnetic-Field and Temperature Limits of a Kinetic-Inductance Traveling-Wave Parametric Amplifier [0.1]
キネティックインダクタンス進行波パラメトリック増幅器(KI-TWPA)は、飽和電力の高いブロードバンド近量子制限増幅を提供する。 Nb面を有する薄NbTiN逆マイクロストリップを用いたKI-TWPAの性能に及ぼす磁場と温度の影響について検討した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:07:59 GMT)
Large Language Model probabilities cannot distinguish between possible and impossible language [0.1]
モデル-内部表現を使用して、大言語モデルが'文法-非文法'の区別を表現する方法を直接タップします。文字列確率が文法の限界のプロキシとして機能すると、非文法的条件は言語的違反を含む条件の中で際立つと予測する。この結果から,非文法的プロンプトに対する特異な副次的シグネチャは明らかにされていない。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:17:48 GMT)
Comparative Analysis of Tokenization Algorithms for Low-Resource Language Dzongkha [0.1]
事前訓練されたトークンライザのほとんどは、英語のような高リソース言語に適しているが、低リソース言語では性能が悪い。本研究では,他の一般的な手法と比較して,3種類の共通トークン化アルゴリズムの訓練と性能を評価する。結果は、3つのアルゴリズムがすべてポテンシャルを示す一方で、SentencePieceはDzongkhaトークン化に最も効果的であることを示している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:02:55 GMT)
Calibrated Generative AI as Meta-Reviewer: A Systemic Functional Linguistics Discourse Analysis of Reviews of Peer Reviews [0.1]
生成AIは、効果的な人間のフィードバックの重要な修辞的および関係的な特徴を近似することができる。生成型AIメタフィードバックは、フィードバックリテラシーを足場として、ピアレビューによるリーンエンゲージメントを高める可能性がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:00:44 GMT)
A Graph-Based Approach to Alert Contextualisation in Security Operations Centres [0.1]
本稿では,グラフベースの警告グループにアラートを集約することで,SOCにおける警告コンテキスト化を強化するためのグラフベースのアプローチを提案する。関連するアラートをグループ化することにより、より抽象的なレベルでの分析が可能になり、個々のアラートよりも効果的に攻撃手順をキャプチャする。我々のフォーマットが下流の機械学習手法に適していることを示すために、我々は、受信する警告グループと過去のインシデントを関連付けるために、グラフマッチングネットワーク(GMN)を使用している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:05:45 GMT)
Quantum eigenpair solver with minimal sampling overhead [0.0]
本稿では,最終状態に符号化された固有ペアの数を実測量に削減する振幅増幅によるポストフィルタ法を提案する。適応型固有ペアソルバは古典的な代替手段と競合するだけでなく、メモリ要件やランタイム、汎用性の観点からも優れています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:42:43 GMT)
Self-Explaining Reinforcement Learning for Mobile Network Resource Allocation [0.0]
自己説明型ニューラルネットワーク(SENN)に基づく解を提案する。提案手法は, モデル動作の局所的および大域的説明を強固に生成するための低次元問題を対象としている。モバイルネットワークにおける資源配分問題に対する提案手法の評価を行い,SENNが競合性能を持つ解釈可能な解を構成することを実証した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:04:29 GMT)
Integrated high-fidelity preparation and analysis of photonic two-qubit states for quantum network nodes [0.0]
統合フォトニクスは量子ネットワークノードのための有望なプラットフォームである。双方向動作が可能なシリコンオン絶縁体集積フォトニックチップを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:00:47 GMT)
jXBW: Fast Substructure Search for Large-Scale JSONL Datasets with LLM Applications [0.0]
主要な操作はサブストラクチャ検索であり、クエリパターンを含むすべてのオブジェクトを識別する。既存の方法は非効率である: 木マッチング、簡潔な表現は空間を節約するが、探索を加速しない。本稿では,XMLL 上の効率的な部分構造探索のための圧縮インデックス jXBW を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:46:04 GMT)
VIRTUS-FPP: Virtual Sensor Modeling for Fringe Projection Profilometry in NVIDIA Isaac Sim [0.0]
VIRTUS-FPPはNVIDIA Isaac Simで開発された物理ベースの仮想センサーモデリングフレームワークである。包括的仮想キャリブレーションを行い、システムの再構築精度を検証する。シミュレーションにおいて物理FPPシステムを複製することにより,仮想システムをデジタルツインとしてモデル化できることを実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:21:15 GMT)
Probabilistic Conformal Coverage Guarantees in Small-Data Settings [0.0]
等角予測は、周縁被覆が保証された分布自由予測セットを提供する。分割共形予測では、この保証はトレーニング条件でのみ期待される。この分散は、実用的な応用において効果的なリスク制御を損なう。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:41:50 GMT)
Transcoder-based Circuit Analysis for Interpretable Single-Cell Foundation Models [0.0]
我々はC2Sモデル(最先端のSCFM)でトランスコーダを訓練する。トレーニングされたトランスコーダを利用して、C2Sモデルから内部決定回路を抽出する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:16:21 GMT)
mucAI at BAREC Shared Task 2025: Towards Uncertainty Aware Arabic Readability Assessment [0.0]
本稿では,BAREC 2025共有タスクにおけるアラビア可読性分類のモデル化手法を提案する。提案手法は共形予測を適用してカバレッジ保証付き予測セットを生成し,次に共形集合上のソフトマックス非正規化確率を用いて重み付き平均を計算する。この不確実性を認識した復号化により, 準重み付きカッパ (QWK) が向上する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:14:51 GMT)
[Re] Improving Interpretation Faithfulness for Vision Transformers [0.0]
本研究の目的は、arXiv:2311.17983によって提案されたFViT(Fithful Vision Transformers)の結果を、視覚変換器の解釈可能性手法と共に再現することである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:11:27 GMT)
Zero-energy resonances in ultracold hydrogen sticking to liquid helium films of finite thickness [0.0]
H-He膜相互作用を含む結合ポテンシャルにおける超低温水素原子の量子状態について検討した。重力量子状態のシフトと幅は、H-He膜基板電位の複雑な散乱長によって決定されることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:17:44 GMT)
Zero Indirect Band Gap in Non-Hermitian Systems [0.0]
ゼロ間接バンドギャップが非エルミート摂動に対して安定であることを示す。特筆すべきは、ゼロ間接ギャップが非エルミート皮膚効果の抑制を引き起こすことである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:02:24 GMT)
Wave-particle duality in the measurement of gravitational radiation [0.0]
波動や粒子の様相が明らかになるかどうかは、量子測定鎖の端で用いられる検出器の特性である。線形検出器は、フォック状態の放射用信号とコヒーレント状態の振幅に比例する信号とを出力しない。対照的に、メーターのエネルギーに結合した検出器からの信号は、入射放射線が少なくとも1つの重力子を含む場合にのみゼロではない。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:24:38 GMT)
Watermarking and Anomaly Detection in Machine Learning Models for LORA RF Fingerprinting [0.0]
本稿では,疑わしい入力を見つけるために,所有権証明のための透かしと異常検出を併用したより強力なRFFIシステムを提案する。 LoRaデータセットでは、94.6%の精度、98%の透かし成功、0.94のAUROCを達成し、検証可能な改ざん防止認証を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:21:33 GMT)
Vibrational Fingerprints of Strained Polymers: A Spectroscopic Pathway to Mechanical State Prediction [0.0]
高分子ネットワークの振動応答は、分子の変形の感度の高いプローブを提供する。実効エポキシサーモセットにおいて, 機械学習力場が量子レベルの忠実度でこれらの分光指紋を再現することを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:27:16 GMT)
Unified Spatiotemporal Physics-Informed Learning (USPIL): A Framework for Modeling Complex Predator-Prey Dynamics [0.0]
エコロジーシステムは、従来のモデリングに挑戦する複雑なマルチスケールのダイナミクスを示す。新しい方法は、保存原則に固執しながら、時間的振動と創発的なパターンを捉える必要がある。本稿では,物理インフォームドニューラルネットワークを統合したディープラーニングアーキテクチャであるUnified Stemporal Physics-Intemporal Learningフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:37:24 GMT)
Training thermodynamic computers by gradient descent [0.0]
所望の計算を行うために,熱力学コンピュータのパラメータを降下によって調整する方法を示す。我々は、デジタルおよび熱力学的実装のエネルギーコストの比率である熱力学的優位性を7桁を超えると見積もる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:12:55 GMT)
Trade-offs between classical and quantum space using spooky pebbling [0.0]
Pebbleゲームは、空間/時間のトレードオフを研究するために使用されます。本稿では,一般的な回路に対して,スポーキーな小石ゲームフレームワークを初めて適用する。制限されたランタイム内では、古典的な空間を考慮すると量子空間を減らす戦略を見つけることができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:22:05 GMT)
Topology and Spectral Entanglement in Cavity-Mediated Photon Scattering [0.0]
我々はSSHモデルを用いたトポロジカル絶縁体におけるキャビティ媒介光子-光子相互作用の図式理論を開発した。我々は、真空光子交換から電子自己エネルギーを計算し、帯域再正規化における対称性を付与した限界を同定する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:25:30 GMT)
Thresholds for post-selected quantum error correction from statistical mechanics [0.0]
我々は、量子誤り訂正(QEC)において、選択後使用可能なレジームを特定する。統計力学モデルを用いて、選択後QECの性能と閾値を解析的に定量化する。選択後QECは4つの異なる熱力学的位相によって特徴づけられる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:51:07 GMT)
The threat of analytic flexibility in using large language models to simulate human data: A call to attention [0.0]
シリコンサンプル(シリコンサンプル)とは、ヒトの被験者を対象とする合成データセットである。ごく少数の意思決定が、シリコンサンプルと人間のデータとの対応を劇的に変えることができることを示す。私は、シリコンサンプルの使用における分析的柔軟性の脅威に対して、より注意を払っています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:18:12 GMT)
The mechanization of science illustrated by the Lean formalization of the multi-graded Proj construction [0.0]
我々はLean4における多階化Projの構成を定式化し、機械化数学と形式化を図示した。この記事はSymbolic Interaction誌に初めて掲載された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:19:41 GMT)
The Ensemble Kalman Update is an Empirical Matheron Update [0.0]
Ensemble Kalman Filter (EnKF) は高次元システムにおけるデータ同化法として広く用いられている。本稿は、この単純だが未公開な接続をコンパクトに紹介する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:19:32 GMT)
The Describe-Then-Generate Bottleneck: How VLM Descriptions Alter Image Generation Outcomes [0.0]
本稿では,自然言語が視覚情報の中間表現として機能する記述列生成ボトルネックの実証分析を行う。評価の結果,99.3%のサンプルが知覚的劣化を示し,91.5%が構造的情報損失を示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:48:51 GMT)
Synthetic-to-Real Object Detection using YOLOv11 and Domain Randomization Strategies [0.0]
本稿では、合成データとドメインランダム化戦略のみを用いて、特定のオブジェクト(スープ缶)を検出するためのYOLOv11モデルを訓練することに焦点を当てる。この方法論には、データ拡張、データセット合成、モデルスケーリングによる広範な実験が含まれる。最高のパフォーマンス設定は、拡張され多様なデータセットでトレーニングされたYOLOv11lモデルで、競合の隠れテストセットで0.910のmAP@50を達成した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:08:54 GMT)
Subject Matter Expertise vs Professional Management in Collective Sequential Decision Making [0.0]
専門職と専門職の議論」を定量的かつ客観的にどう扱うかは明らかになっていない。このタスクを制御された環境でモデル化するには、相互依存的な決定を伴う複雑なシーケンシャルゲームであるチェスを利用する。最小限の閾値を超えた課題の専門知識は、チームのシナジーに大きく寄与しないことがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:56:24 GMT)
Strong coupling of a microwave photon to an electron on helium [0.0]
共振器マイクロ波場と電子の運動量子状態との強い結合を初めて実証する。これらの実験は、ヘリウムベースのスピン量子ビット上の電子の測定と制御への重要なステップである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:38:28 GMT)
State-to-Hamiltonian conversion with a few copies [0.0]
密度行列指数 (DME) は未知の量子状態からハミルトン進化に変換する過程である。非物理プロセスを用いて,$mathcalO(log(1/varepsilon)$または$mathcalO(1)$状態コピーを実現する仮想DMEを提案する。量子主成分分析タスクにおけるコピーカウントの指数的削減とともに、この小さな定数オーバーヘッドを数値的に検証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:41:04 GMT)
SmolRGPT: Efficient Spatial Reasoning for Warehouse Environments with 600M Parameters [0.0]
本稿では,領域レベルの空間的推論を明示的に組み込んだ,コンパクトな視覚言語アーキテクチャであるSmolRGPTを提案する。 SmolRGPTは3段階のカリキュラムを採用しており、視覚的特徴と言語的特徴を段階的に整列させ、空間的関係理解を可能にし、タスク固有のデータセットに適応する。 SmolRGPTは6億のパラメータしか持たず、倉庫の空間推論ベンチマークに挑戦し、より大きな代替品の性能にマッチまたは超える結果が得られることを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:55:51 GMT)
Simultaneous Matching of Phase and Amplitude for Spontaneous Parametric Down-conversion in Semiconductor Waveguides [0.0]
本稿では,光子対生成効率を大幅に向上させるために,$chi(2)_xyz$の均一でない変調法を提案する。解析により,最も効率的な非変調導波路に比べて10倍の効率向上が予測された。また、通信帯域をまたいで調整可能な、高効率でコンパクトなツイン光子源の実装についても検討する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:27:34 GMT)
Simplified scheme for continuous-variable entanglement distillation: multicopy distillation of Gaussian entanglement without heralding Gaussian measurements [0.0]
連続可変ガウス状態の絡み合わせは, 単光子減算や反復棚付きガウス化といった脱ガス化操作を組み合わせることで蒸留することができる。本稿では,このような絡み合った蒸留プロトコルの簡易な等価バージョンを提示し,解析する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:29:04 GMT)
Shedding Light on Dark Matter at the LHC with Machine Learning [0.0]
我々は,Z_3$-symmetric Next-to-Minimal Supersymmetric Standard Modelにおいて,Singlino-dominated Lightest Supersymmetric Particle (LSP) の形でWIMPダークマター(DM)候補を検証した。この枠組みは、近傍のヒグシノ様エレクトロウェキノとの共消滅によりDMが得られ、DM直接検出シグナルが抑制されるパラメータ空間の領域を生じさせる。我々は、これらの微妙な信号に対する感度を向上させるデータ駆動機械学習(ML)分析を適用し、新しい物理シナリオを発見するための従来の検索戦略を強力に補完する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:27:19 GMT)
Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification [0.0]
本稿では,CLIPの階層的空間意味論を活用することで3次元幾何学的忠実度を高めるフレームワークを提案する。本手法は3次元のクラスインクリメンタル学習を著しく改善し,テクスチャバイアスに対して優れた幾何コヒーレンスとロバスト性を実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:45:08 GMT)
SecureFixAgent: A Hybrid LLM Agent for Automated Python Static Vulnerability Repair [0.0]
本稿では、Banditと軽量ローカルLLMを統合したハイブリッド修復フレームワークSecureFixAgentを紹介する。精度を向上させるために、パラメータ効率のよいLoRAに基づく微調整を、多種多様なキュレートされたデータセットに適用する。実験では、SecureFixAgentは静的解析で偽陽性を10.8%減らし、修正精度を13.51%改善し、事前訓練されたLDMと比較して偽陽性を5.46%減らした。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:45:43 GMT)
Scalable projected entangled-pair state representation of random quantum circuit states [0.0]
ランダムな量子回路状態を表すバイダルゲージにおいて,投影された絡み合ったペア状態 (PEPS) の更新を示す。従来のCPUで128ドル(約1万4000円)の大規模回路を使用すれば、状態の忠実さの普遍的なスケーリングの挙動が分かる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:09:26 GMT)
Rounding near-optimal quantum strategies for nonlocal games to strategies using maximally entangled states [0.0]
制約系(BCS)ゲームに対するほぼ完全な量子戦略は、対応するBCS代数の近似表現であることを示す。 XOR非局所ゲームのクラスに対して、準最適量子戦略は対応する$*$-代数の近似表現であることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:27:22 GMT)
Resource-efficient linear-optical generation of GHZ-like states [0.0]
本稿では,非論理的中間状態からGHZ様状態を生成する能力を示す理論的枠組みを提案する。我々の研究結果は、普遍的な解ではないが、非最大エンタングル状態は特定のフォトニック量子情報タスクに実用的な利点をもたらすことを示唆している。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:45:48 GMT)
Reinforcement Learning Agent for a 2D Shooter Game [0.0]
複雑なゲーム環境における強化学習エージェントは、しばしばスパース報酬、トレーニング不安定性、サンプル効率の低下に悩まされる。本稿では,オフライン模倣学習とオンライン強化学習を組み合わせた2次元シューティングゲームエージェントのハイブリッドトレーニング手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:07:41 GMT)
Red Teaming Multimodal Language Models: Evaluating Harm Across Prompt Modalities and Models [0.0]
マルチモーダル大規模言語モデル (MLLM) は, 現実の応用においてますます利用されているが, 敵条件下での安全性はいまだ検討されていない。本研究は,テキストのみおよびマルチモーダル形式にまたがる敵対的プロンプトに曝露した4つのMLLMの無害性を評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:51:06 GMT)
Reconnecting Citizens to Politics via Blockchain - Starting the Debate [0.0]
選挙は自由民主主義を機能させるために最も重要な柱の1つである。世界中の最近の証拠は、それらを自由で公平に行うことは容易ではないことを示している。頻繁なスキャンダルは、この問題に対処する現在のアプローチで遭遇した困難を証明している。政治キャンペーンと広告の費用を特別に支払うために設計された別の暗号通貨が導入された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:39:41 GMT)
Recent Advancements in Microscopy Image Enhancement using Deep Learning: A Survey [0.0]
顕微鏡画像強調の進歩は、特に深層学習の助けを借りて顕著に増加している。本研究の目的は,この急速に成長する最先端の手法のスナップショットを提供することであり,その進化,応用,課題,今後の方向性に焦点をあてることである。中心となる議論は、顕微鏡画像の超解像・再構成・復調の重要領域を中心に行われ、各領域は現在の傾向と深層学習の実用性の観点から探索されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:03:41 GMT)
Random Matrix Theory-guided sparse PCA for single-cell RNA-seq data [0.0]
単細胞RNA-seqは個々の細胞の詳細な分子スナップショットを提供する。ほとんどの研究は、次元減少のための主成分分析(PCA)に依存している。スパースプリンシパルコンポーネントの推論を導くRMT(Random Matrix Theory)ベースのアプローチでPCAを改善する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:08:38 GMT)
Quantum Metrology of Spin Sensing with Free Space Electrons [0.0]
透過電子顕微鏡の最近の進歩は、単一スピン感度のスピン共鳴分光への道を開いた。磁気モーメントの大きさを推定し,スピンの存在を識別する。従来のTEMイメージングは、スピン状態へのプローブ電子のバックアクションが無視できる場合、量子境界を飽和させることができる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:12:56 GMT)
Quantum Gambling: Best-Arm Strategies for Generator Selection in Adaptive Variational Algorithms [0.0]
我々は、最適アーム識別問題としてジェネレータの選択を再構成する。目的は、可能な限り少ない測定値を用いて、最大のエネルギー勾配を持つ発電機を特定することである。提案アルゴリズムは,適応的に測定を割り当て,未提案の候補を破棄する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:55:32 GMT)
Qompiler: A Traceable Quantum Circuit Synthesizer for Arbitrary Hamiltonians [0.0]
物理モデリングと量子ソフトウェア開発のギャップを埋める量子コンパイラフレームワークを提案する。このフレームワークの中核は、任意のハミルトニアンを量子回路に分解できる多用途量子回路シンセサイザーである。中間表現はコンパイルされたコードの普遍的でハードウェアに依存しないキャリアとして機能し、ほとんどの量子ハードウェアバックエンドで容易にレンダリングできる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:27:33 GMT)
Pseudo-real quantum fields [0.0]
複素数に対する擬現実性の概念は、場の量子論に対する2つのアプローチのための統一的な枠組みを提供することを示す。ボゾン場の擬現実条件は、擬エルミート電流を含むゲージ理論の定式化によって長年の問題を解決している。擬現実性の一般的な原理は、擬エルミート場の量子論の第一原理の構成の継続的な発展に寄与することが期待されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:48:27 GMT)
Prestige over merit: An adapted audit of LLM bias in peer review [0.0]
大規模言語モデル(LLM)は、学術的なピアレビューにおいて、次第に統合されつつも、概して非公式な役割を担っている。著者の身元をランダム化して,高品質な写本群を代表的に評価するシミュレーションを開発した。監査の結果、強い、一貫した制度的先制バイアスが明らかになった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:28:19 GMT)
Patent Language Model Pretraining with ModernBERT [0.0]
われわれは、ModernBERTアーキテクチャと6000万以上の特許記録をキュレートしたコーパスを用いて、ドメイン固有の3つのマスク付き言語モデルを事前訓練する。このアプローチでは,FlashAttention,回転埋め込み,GLUフィードフォワードレイヤなどのアーキテクチャ最適化を取り入れている。われわれのモデルである ModernBERT-base-PT は、4つのデータセットのうち3つで汎用 ModernBERT ベースラインを一貫して上回り、ベースラインの PatentBERT と競合する性能を示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:04:30 GMT)
On the Use of Agentic Coding Manifests: An Empirical Study of Claude Code [0.0]
エージェントコーディングツールは自然言語で書かれた目標を入力として受け取り、それらを特定のタスクに分解し、人間の介入を最小限に抑えて実際のコードを書き、実行します。このプロセスの鍵となるのは、エージェントマニフェスト、エージェントに必須のプロジェクトコンテキスト、アイデンティティ、運用ルールを提供する構成ファイル(Claude.mdなど)である。構造パターンと共通コンテンツを特定するため,242リポジトリから253 Claude.mdファイルを解析した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:46:41 GMT)
On Quantum Field Theory and Observers [0.0]
音場理論における可観測物の見方が楽器の読み出しの相関性にどのように適合するかを考える。フェルミパラドックスの簡単な解法も指摘されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:06:50 GMT)
Nonequilibrium Quasiparticles in Superconducting Circuits: Energy Relaxation, Charge and Flux Noise [0.0]
ジョセフソン接合を横切る過剰な準粒子のトンネルは超伝導量子ビットにおける主要な損失とデコヒーレンス機構の1つとして認識されている。準粒子からの電荷ノイズは対数周波数のフラックスノイズを引き起こし、フラックス量子ビットで観測されるフラックスノイズに匹敵する「ほぼ白い」寄与をもたらすことを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:19:10 GMT)
Non-Intrusive Parametrized-Background Data-Weak Reconstruction of Cardiac Displacement Fields from Sparse MRI-like Observations [0.0]
非侵襲的パラメタライズド・データ・ウェイク(PBDW)法をMRIのような限られた観察から3次元心停止再建に応用した。私たちの実装はソリューションスナップショットのみを必要とします -- 管理方程式、アセンブリルーチン、あるいはソルバアクセスは不要です。本手法の有効性をシミュレーションした3次元左室モデルを用いて検証した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:10:24 GMT)
Non-Commutation Chains in Pre- and Post-Selection Paradoxes [0.0]
制限ケースに対する論理的事前選択パラドックスと後選択パラドックスの予想を証明した。このことは、最近[1]で導入された因果バランスの理論と関係し、この理論がそのようなパラドックスをどうブロックするかを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:03:00 GMT)
No-go theorem for quantum realization of extremal correlations [0.0]
量子相関の研究は、量子情報と基礎の中心である。極端非決定性相関の非自明な量子化は存在しない、すなわち、任意の「量子」実現は古典的ランダム性によってシミュレートされなければならない。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:48:55 GMT)
Monitored Fluctuating Hydrodynamics [0.0]
グローバル対称性の存在下では、条件付きアンサンブルが測定誘起の「焼成」相転移を受けることができることを示す。我々は、弱い監視された拡散多体量子系に対する既知の「チャージファジィ相」の単純な流体力学的導出を与える。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:00:06 GMT)
Mechanism of defect formation in the quantum annealing of the random transverse-field Ising chain [0.0]
ランダム逆場イジング鎖の量子アニールにおける欠陥形成の顕微鏡機構を提案する。臨界点外におけるギャップの有限性について説明するが、これはキブルズレークスケーリングによる問題の早期アプローチにおいて暗黙的であった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 06:27:17 GMT)
Machines are more productive than humans until they aren't, and vice versa [0.0]
本稿では,実証現実主義に基づくモンテカルロシミュレーションに基づくシリコン内フレームワークを開発し,人的・機械的スキルの経済的影響を分析する。本研究は, 自動化が低次元一般化難易度を特徴とするタスクにおいて, 最も経済的に有効な戦略である傾向にあるという確立された概念を定量的に支援するものである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:27:46 GMT)
MIDOG 2025: Mitotic Figure Detection with Attention-Guided False Positive Correction [0.0]
既存のFCOS(Fully Convolutional One-Stage Object Detector)を拡張した新しいアプローチを提案する。本モデルでは,正常値と異常値の分類のためのフィードバックアテンションラダーCNN (FAL-CNN) モデルを提案する。本ネットワークは、FCOSオブジェクト検出器の偽陽性率を低減し、オブジェクト検出の精度を向上し、ネットワークの汎用性を高めることを目的としている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:21:39 GMT)
Limitation of Stoquastic Quantum Annealing: A Structural Perspective [0.0]
縮退した局所最小値の集合に付随するエネルギー間の競合から生じる反交差に関する構造的説明を提供する。本論文は,DIC-DAC-DOAアルゴリズムの主な研究の補足として機能する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:39:48 GMT)
Leveraging IndoBERT and DistilBERT for Indonesian Emotion Classification in E-Commerce Reviews [0.0]
本研究では,インドネシア語における感情分類の精度向上に焦点をあて,高度な言語モデルであるIndoBERTとDistilBERTを活用する。データの増大は高い精度を達成する上で重要な要素であることが判明した。 IndoBERTはインドネシアで最も効果的な感情分類モデルであり、データの増大は高い精度を達成する上で重要な要素であることが証明された。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:38:02 GMT)
Leveraging Artificial Intelligence as a Strategic Growth Catalyst for Small and Medium-sized Enterprises [0.0]
人工知能(AI)は、大企業が保有する未来的な概念から、中小企業向けの現代的でアクセスしやすく、不可欠な成長レバーへと移行してきた。起業家やビジネスリーダーにとって、戦略的AIの採用はもはや選択肢ではない。 AIの採用を裏付ける定量的証拠は魅力的だ。91%の中小企業がAIを使用して、収入を直接的に増やすと報告している。トップラインの成長以外にも、AIは重要な運用効率を推進し、運用コストを最大30%削減し、企業価値を20時間以上節約できることを示した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:56:04 GMT)
Large-order perturbation theory of linear eigenvalue problems [0.0]
線形固有値問題のクラスは、小パラメータのエプシロンに依存するが、エプシロンの力における固有値の級数展開は発散する。我々はこの分岐の正確な性質を決定するための新しい手法を開発した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:11:04 GMT)
Julia Set in Quantum Evolution: The case of Dynamical Quantum Phase Transitions [0.0]
動的量子相転移(英: Dynamical quantum phase transitions, DQPTs)は、多体量子系において起こる非平衡相転移のクラスである。本稿では、複素力学と実空間再正規化群(RG)を組み合わせたDQPTの正確な解析手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:59:12 GMT)
Introducing OmniGEC: A Silver Multilingual Dataset for Grammatical Error Correction [0.0]
我々は、文法的誤り訂正(GEC)タスクのための多言語銀標準データセットの集合であるOmniGECを紹介する。これらのデータセットは、多言語GECソリューションの開発を促進し、多言語GECに英語GECソリューションを適用する際のデータギャップを埋めるのに役立つ。データセットのテキストは、3つのソースから作成されている。ウィキペディアは11のターゲット言語を編集し、Redditは11のターゲット言語でサブレディットを編集し、そしてウクライナのみのUberText 2.0ソーシャルメディアコーパスである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:35:31 GMT)
Integrating Activity Predictions in Knowledge Graphs [0.0]
本研究では,漁船の動きなどのデータを知識グラフから整理して検索する方法を示す。これらのクエリ結果はマルコフ連鎖モデルの作成に使用され、船体の歴史に基づいて将来の状態を予測できます。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:28:04 GMT)
Inferring Quantum Network Topologies using Genetic Optimisation of Indirect Measurements [0.0]
我々は外部プローブを用いて連続時間量子ウォークの文脈でネットワークトポロジーを推定する。プローブは励起の減衰チャネルとして機能し、ネットワーク力学の間接的な測定を行うと解釈できる。本研究では,プローブ数の増加が再構成作業を大幅に単純化し,プローブ数と計算能力とのトレードオフを明らかにした。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:11:01 GMT)
Improving the efficiency of quantum engineering of SCSs by adding two demultiplexed input photons [0.0]
条件付き光子の付加と減光は連続変数(CV)状態の量子工学の強力なツールである。本稿では, 振幅2.5のコヒーレント状態(SCS)の量子工学による測定手法を提案し, 忠実度は0.99以上とした。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:09:32 GMT)
Imaging of electrical signals in a quantum SiC microscope [0.0]
本稿では、量子シリコン炭化物顕微鏡(QSiCM)の実験的実現を報告し、電流によって生じる磁場をイメージングすることによってその機能を示す。本研究では, 歪みや温度変動に起因する雑音を抑えながら, 読み出しコントラストを高めるために, デュアル周波数検出プロトコルを用いる。このアプローチは、50×50ドル仮想ピクセルの視野、50,mathrmms$の時間分解能、30,mathrmmu m$の空間分解能、約2,mathrmmu Tの感度を有する電流誘起磁場の空間イメージングを可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:10:04 GMT)
Hybrid Autoregressive-Diffusion Model for Real-Time Sign Language Production [0.0]
我々は手話生成のための自己回帰モデルと拡散モデルを組み合わせたハイブリッドアプローチを開発する。微粒な体の動きを捉えるため,異なる音節から細かな特徴を別々に抽出するマルチスケール・ポース表現モジュールを設計した。ポーズ生成過程を動的に導くために,共同レベルの信頼度スコアを利用する信頼度対応型因果注意機構を導入する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 02:58:04 GMT)
How to be an orthodox quantum mechanic [0.0]
この研究は、量子力学の正統的な解釈とは何か? 我々は、量子力学に関する42の教科書のコレクションをレビューし、この性質の最もポピュラーで顕著な著作を取り上げている。次に、12の命題に対する反応を測って、正統派量子力学によって信じられていることを正確に表す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:30:04 GMT)
How Digital Transformation Impacts Corporate Green Innovation? [0.0]
本稿では,企業におけるディジタルトランスフォーメーションの指標を構築し,デジタルトランスフォーメーションがグリーンイノベーションに与える影響について検討する。その結果、企業におけるデジタルトランスフォーメーションは、企業におけるグリーンイノベーションのアウトプットを促進することが示され、その持続的な影響は、わずかに減少傾向を示している。デジタルトランスフォーメーションは、中小企業や技術集約産業におけるグリーンイノベーションのアウトプットに対して、より顕著な促進効果を持っている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:59:21 GMT)
Harnessing quantum back-action for time-series processing [0.0]
我々は、間接的な測定を量子機械学習プロトコルに組み込むことで、実行時間のスケーリングと全体的なパフォーマンスの両面で利点があることを示した。その結果, 貯留層ハミルトンパラメータと測定強度の両方を慎重に最適化することで, 量子貯水池計算アルゴリズムの性能を大幅に向上させることができることがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:29:57 GMT)
Geodesics in the Deep Linear Network [0.0]
線形ネットワーク幾何学における全階行列間の測地学の特別な場合において、ODEと関連する明示的解の一般系を導出する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 01:06:06 GMT)
From top quarks to enhanced quantum key distribution: A Framework for Optimal Predictability of Quantum Observables [0.0]
両部量子系における測定の予測可能性の定量化のための包括的枠組みを提案する。任意の可観測状態と2キュービット状態の予測誤差を最小限に抑える最適測定のための解析式を導出する。我々は,局所的な振幅減衰雑音の影響を受けやすいベル状態と,高エネルギー衝突器で生成するトップ・アンチトップクォーク対の2つのシナリオに適用した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:46:29 GMT)
From Sea to System: Exploring User-Centered Explainable AI for Maritime Decision Support [0.0]
本稿では,海洋領域における効果的な人間-機械チーム構築の基盤として,説明可能なAI(XAI)の重要性を強調した。本研究では,海洋専門家の信頼,ユーザビリティ,説明可能性に対する認識を捉えたドメイン固有調査を提案する。我々の目的は、海運チームや海運チームのニーズに合わせた、ユーザ中心のXAIシステムの開発を奨励し、指導することである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:42:54 GMT)
From Pixels to Urban Policy-Intelligence: Recovering Legacy Effects of Redlining with a Multimodal LLM [0.0]
本稿では,マルチモーダル大規模言語モデル(MLLM)が都市における計測能力を拡大し,場所に基づく政策介入の追跡を支援する方法について述べる。 GPT-4oは、ストリートビュー画像上に構築された、合理的に見積もられたパイプラインを用いて、近隣の貧困と樹冠を推定し、1930年代のリライニングの遺産を評価する準実験的な設計に組み込む。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 16:42:01 GMT)
FragmentRetro: A Quadratic Retrosynthetic Method Based on Fragmentation Algorithms [0.0]
再合成はコンピュータ支援合成計画に不可欠である。 FragmentRetroは,フラグメンテーションアルゴリズムを利用した新しいレトロシンセティック手法である。 FragmentRetroは競合するランタイムで高い解決率を達成することを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:36:22 GMT)
Fault-tolerant quantum computing with a high-rate symplectic double code [0.0]
シンプレクティック・ダブルコードのためのフォールトトレラント・エンコーダを提案する。この符号の利点は、高い符号化率に加えて、そのコンパクトさである。また、任意の量子状態をコード空間に注入できる任意の状態エンコーダを開発した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:03:30 GMT)
Exploring dark matter with quantum-enhanced haloscopes and time projection chambers [0.0]
この論文はダークマターの検出に対する実験的および理論的アプローチを探求している。ダークマターは宇宙のエネルギーの27%を占める。天体物理学と宇宙学の証拠をレビューし、標準模型の限界を強調し、WIMP、アクシオン、ダーク光子の探索を動機付けている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 12:19:18 GMT)
Explainable AI-Enhanced Supervisory Control for Robust Multi-Agent Robotic Systems [0.0]
マルチエージェントロボットのためのAI強化型監視制御フレームワークを提案する。我々は、このアプローチを、宇宙船形成飛行と自律水中車両の2つの対照的な領域で検証した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:59:13 GMT)
Evaluating undergraduate mathematics examinations in the era of generative AI: a curriculum-level case study [0.0]
我々は、ルッセルグループ大学の8つの学部数学試験に、GenAIを作成した。 GenAIの到達度は1級のレベルですが、現在のパフォーマンスはモジュールによって異なります。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 09:55:59 GMT)
Entanglement Structure of Non-Gaussian States and How to Measure It [0.0]
本稿では,実験的な相関関数による量子状態の制約を行うプロトコルを提案する。この方法は量子状態の絡み合い構造の計測を可能にする。提案プロトコルは,現在および今後の実験能力とともに有用であることを示す。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:17:32 GMT)
Ensemble of Pathology Foundation Models for MIDOG 2025 Track 2: Atypical Mitosis Classification [0.0]
病理基盤モデル(PFM)を大規模病理組織学データセットで事前訓練した。我々はPFMを補完するために、最先端の畳み込みニューラルネットワークアーキテクチャであるConvNeXt V2を組み込んだ。我々は,相補的な形態的洞察を統合するために複数のPFMをアンサンブルし,予備評価フェーズデータセット上でバランスの取れた精度を実現した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:00:25 GMT)
Enhancing business process execution with a context engine [0.0]
本稿では,ビジネスプロセス管理システムのコンテキスト認識性を高めるためのコンテキストエンジンを提案する。提案されたアーキテクチャは、ビジネスルールとBPMシステムのよく知られた組み合わせと、CEPに基づいたコンテキストエンジンを拡張します。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:05:49 GMT)
Electrodynamics of carbon nanotubes with non-local surface conductivity [0.0]
非局所伝導性のモデルは、擬スピンに対するディラック方程式に適用されたKubo法に基づいて展開される。非局所性のため、局所伝導度限界で消失する新しいタイプの固有モードが生成される。ナノアンテナや他の電子機器の設計への潜在的な応用についても論じる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:38:43 GMT)
Do Vision-Language Models See Urban Scenes as People Do? An Urban Perception Benchmark [0.0]
モントリオールの街路画像100枚を用いて,都市感における視覚言語モデル(VLM)の検証を行う。結果は、主観的評価よりも、可視的で客観的な特性に対するモデルアライメントが強いことを示唆している。我々は,参加型都市分析における再現性,不確実性を考慮した評価のためのベンチマーク,プロンプト,ハーネスをリリースする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:21:10 GMT)
Distributed Batch Matrix Multiplication: Trade-Offs in Download Rate, Randomness, and Privacy [0.0]
分散バッチ行列乗算における通信速度とプライバシのトレードオフについて検討する。私たちの設定では、$boldB$はすべてのサーバから公開アクセス可能ですが、$boldA$は非公開でなければなりません。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:10:43 GMT)
Distances between pure quantum states induced by a distance matrix [0.0]
複素射影空間 $mathbbP(mathbbCn)$ 上で、無限の距離の族 $d_p$ を構築する。この論文は、量子ワッサーシュタイン距離によって課される量子状態空間の幾何学に関する重要な疑問を解決し、初期の研究を大幅に拡張した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 08:23:33 GMT)
Dispersion Relations in Two- and Three-Dimensional Quantum Systems [0.0]
本研究は3次元量子格子モデルに対する分散関係計算の最初の実演である。量子シミュレーション、フォトニック材料設計、量子情報プラットフォームのための強力なツールである。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:11:34 GMT)
Disentangling Latent Shifts of In-Context Learning with Weak Supervision [0.0]
In-context Learning (ICL)により、大規模言語モデルでは、プロンプト内のラベル付き例を条件にすることで、少数ショット学習が可能となる。柔軟性にも拘わらず、ICLはより多くのデモで即時長が増加するにつれて不安定に悩まされる。提案手法は,実演による潜時変化をクエリから切り離すパラメータ効率の手法を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:29:48 GMT)
Direct Video-Based Spatiotemporal Deep Learning for Cattle Lameness Detection [0.0]
本研究では,公開されているビデオデータを用いた牛の乳腺自動検出のためのフレームワークを提案する。 2つのディープラーニングアーキテクチャをトレーニングし、評価した。 3D CNNは、精度、リコール、85%の精度でビデオレベルの分類精度を90%達成し、ConvLSD2モデルを上回った。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:50:59 GMT)
Digital Engineering Transformation as a Sociotechnical Challenge: Categorization of Barriers and Their Mapping to DoD's Policy Goals [0.0]
デジタルエンジニアリング(DE)変換は、システムエンジニアリングにおけるパラダイムシフトを表している。制度的な支援にもかかわらず、多くのDEイニシアチブは、彼らの意図した利益を達成または達成できなかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 22:17:53 GMT)
Diagnostics of cognitive failures in multi-agent expert systems using dynamic evaluation protocols and subsequent mutation of the processing context [0.0]
この研究は、専門家システムのための診断フレームワークを導入し、評価だけでなく、専門家行動のLSMエージェントへの転送を容易にする。我々は,多エージェント採用支援システム上での枠組みを実証し,潜在的認知障害を明らかにした。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:08:03 GMT)
Detecting Statistically Significant Fairness Violations in Recidivism Forecasting Algorithms [0.0]
本稿では, 統計的に有意なフェアネス指標違反を識別できる統計検査について紹介する。我々は,国立司法研究所のデータに基づいて訓練されたリシビズム予測アルゴリズムをテストすることで,このアプローチを実証する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:15:23 GMT)
DeepACTIF: Efficient Feature Attribution via Activation Traces in Neural Sequence Models [0.0]
特徴属性は、医療、バイオメトリックス、人間とAIの相互作用といった時系列領域におけるディープラーニングモデルの解釈に不可欠である。統合グラディエントやSHAPのような標準属性法は計算集約的であり、リアルタイムアプリケーションには適していない。提案するDeepACTIFは,シークエンスモデルの内部アクティベーションを利用して,特徴の重要度を効率的に推定する,軽量かつアーキテクチャ対応な特徴属性手法である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:47:05 GMT)
Deep Learning-Driven Multimodal Detection and Movement Analysis of Objects in Culinary [0.0]
本研究は、既存のモデルについて検討し、YOLOv8セグメンテーションモデル、手指の動きシーケンスに基づいて訓練されたLSTMモデルとASR(Whisper-base)を組み合わせた微調整を行う。すべてのデータは著者によって収集され、複雑で困難な環境でベストを尽くす、堅牢なタスク特定システムを実現する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 05:06:19 GMT)
Deciding how to respond: A deliberative framework to guide policymaker responses to AI systems [0.0]
我々は自由の概念を運用することによって、補完的なアプローチを開発することができると主張している。結果として得られるフレームワークは、コーディネート、コミュニケーション、決定空間を中心に構成されている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:30:53 GMT)
Data-Driven Prediction of Maternal Nutritional Status in Ethiopia Using Ensemble Machine Learning Models [0.0]
妊婦の栄養失調はエチオピアの主要な公衆衛生問題である。従来の統計学的アプローチでは、栄養状態の複雑な多次元決定因子を捉えることができない。本研究では,アンサンブル機械学習を用いた予測モデルを開発した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:31:40 GMT)
DSperse: A Framework for Targeted Verification in Zero-Knowledge Machine Learning [0.0]
DSperseは、暗号検証による分散機械学習推論のためのフレームワークである。複数の証明システムを用いてDSperseを評価し,メモリ使用量,実行時間,回路動作に関する実験結果を報告する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 03:15:13 GMT)
DACoN: DINO for Anime Paint Bucket Colorization with Any Number of Reference Images [0.0]
DACoNは、基礎モデルを利用して、ライン描画でも部分レベルのセマンティクスをキャプチャするフレームワークである。提案手法は,CNNから高分解能な空間的特徴を持つ基礎モデルから低分解能な意味的特徴を融合して,きめ細かな特徴抽出を行う。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:24:52 GMT)
Credit Card Fraud Detection [0.0]
本研究では、アンダーサンプリング、SMOTE、ハイブリッドアプローチを用いて、実世界のデータセット上で5つの機械学習モデルを評価する。その結果, ハイブリット法はリコールと精度のバランスが良く, 特にKNNの性能が向上していることがわかった。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:08:14 GMT)
Computing Linear Regions in Neural Networks with Skip Connections [0.0]
ニューラルネットワークが線形写像である領域を計算するアルゴリズムを提案する。ニューラルネットワークのトレーニングの難しさ、特にオーバーフィットの問題やスキップ接続の利点に関する洞察を提供する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 21:27:43 GMT)
Can maiBERT Speak for Maithili? [0.0]
Maithiliは何百万人もの人に話されているが、十分な計算資源がない。 Maithili 専用の BERT ベースの言語モデルであるmaiBERT を紹介する。本モデルは,新たに構築したMaithiliコーパスを用いて学習し,ニュース分類タスクを通じて評価する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:11:18 GMT)
Blockchain-Enabled Explainable AI for Trusted Healthcare Systems [0.0]
本稿では、医療システムのためのa-Integrated Explainable AI Framework(BXHF)を紹介する。我々は、安全なデータ交換と理解可能なAIによる臨床意思決定という、健康情報ネットワークに直面する2つの課題に取り組む。当社のアーキテクチャにはブロックチェーンが組み込まれており、患者の記録が不変で、監査可能で、安全でないことが保証されています。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:17:19 GMT)
Beyond Stoquasticity: Structural Steering and Interference in Quantum Optimization [0.0]
独立集合(MIS)問題を解くための非確率量子アルゴリズムであるDIC-DAC-DOAアルゴリズムの理論解析について述べる。このスピードアップの中核は、進化する基底状態が正と負の振幅の両方を発達させる能力にある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:27:42 GMT)
Beyond Spherical geometry: Unraveling complex features of objects orbiting around stars from its transit light curve using deep learning [0.0]
我々は、シミュレーションされた光曲線から直接フーリエ係数を予測するために、ディープニューラルネットワークを訓練する。その結果,ニューラルネットワークは低次楕円の再構築に成功していることがわかった。ニューラルネットワークによって達成された再構築のレベルは、トランジットシステムから情報を取り出す手段として光曲線を使うことの有用性を裏付けている。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 11:44:10 GMT)
Benchmark of stylistic variation in LLM-generated texts [0.0]
本研究では,人間によって書かれたテキストと,大規模言語モデル(LLM)によって作成された同等のテキストのレジスタ変動について検討する。同様の分析は、AI-Koditexコーパスとチェコの多次元モデルを用いてチェコで複製される。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 23:31:43 GMT)
Balancing Sparse RNNs with Hyperparameterization Benefiting Meta-Learning [0.0]
本稿では、スパースリカレントニューラルネットワーク(RNN)を特定するための代替ハイパーパラメータを提案する。これらのハイパーパラメータにより、モデルのトレーニング可能な重量行列内での間隔が変化し、全体的なパフォーマンスが向上する。このアーキテクチャは、モデル内の未知物の分布のバランスを保ち、モデル性能のかなりの説明力を提供する、新しい計量、隠された比例の定義を可能にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:20:13 GMT)
BST: Badminton Stroke-type Transformer for Skeleton-based Action Recognition in Racket Sports [0.0]
本研究では,バドミントン放送の試合において,各選手のラケットスイングのフレームを抽出する新しいビデオクリッピング手法を提案する。これらのクリップされたフレームは、既存の3つのモデルによって処理される。本研究では,Badminton Stroke-type Transformer (BST)を提案する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 07:48:05 GMT)
Anti-Money Laundering Systems Using Deep Learning [0.0]
本稿では,世界金融産業におけるアンチ・モニー・ロンダリング(AML)の活動が果たす重要な役割について考察する。これらの課題に対処するために,深層学習技術を用いたリンク解析を活かした高度なAMLシステムを提案する。このシステムの中心には、Degree Centrality、Closeness Centrality、Interferness Centrality、PageRankといった中央集権アルゴリズムの利用がある。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 14:06:40 GMT)
Analyzing the Impact of Credit Card Fraud on Economic Fluctuations of American Households Using an Adaptive Neuro-Fuzzy Inference System [0.0]
拡張ANFISを用いて新しいハイブリッド解析法を提案する。このモデルは、歴史的トランザクションデータとマクロ経済指標に基づいて離散ウェーブレット変換を行い、局所的な経済ショック信号を生成する。実験の結果、RMSEは局所神経ファジィモデルや従来のLSTMモデルと比較して17.8%減少した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 20:09:07 GMT)
An Outcome-Based Educational Recommender System [0.0]
OBER-an Outcome-Based Educational Recommenderは学習結果と評価項目を直接データスキーマに埋め込む。 OBERは最小限のエンティティ-リレーションモデル、ログ駆動のマスタリー式、プラグインアーキテクチャを使用する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 18:18:03 GMT)
An Artificial Intelligence Driven Semantic Similarity-Based Pipeline for Rapid Literature [0.0]
セマンティックな類似性を利用して文献レビューを行うための自動パイプラインを提案する。この研究は、トランスフォーマーベースの埋め込みとコサイン類似性を利用することにより、最小限のオーバーヘッドと高い関連性を強調する。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 17:24:47 GMT)
Adversarial generalization of unfolding (model-based) networks [0.0]
本稿では,$l$-normの制約付き攻撃で乱れた場合の展開ネットワークの対角一般化について検討する。これは展開ネットワークの対角一般化に関する最初の理論的解析である。実世界のデータに関する一連の実験を行い、得られた理論を裏付ける結果を得た。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 19:17:07 GMT)
A unified picture for quantum Zeno and anti-Zeno effects -- a review [0.0]
量子ゼノ効果は、選択的および非選択的の測定の文脈で研究されている。ゼノ効果と反ゼノ効果は、測定のようなプロセスが非可換進化と競合するときに現れる統一的な効果のレギュレーションとして明らかにされる。量子ゼノ効果は、短期量子コンピューティングの将来において、ユビキタスかつ必須である。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 04:30:58 GMT)
A new dataset and comparison for multi-camera frame synthesis [0.0]
我々は、カスタムに構築された高密度リニアカメラアレイを用いて、新しいマルチカメラデータセットを開発する。我々は,古典的・深層学習フレーム補間器をビュー・イン・ビュー・イン・ビューニングのためのビュー・シンセサイザー法と比較した。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 15:26:41 GMT)
A Scalable and Interoperable Platform for Transforming Building Information with Brick Ontology [0.0]
本稿では,自動化構築における一般的な課題に対処するためのプラットフォームを提案する。提案されたプラットフォーム開発の全体的な目標は、プロセスの半自動化である。開発プラットフォーム内の履歴データのシームレスでオフラインの統合は、データセキュリティのリスクを最小限にする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 00:24:57 GMT)
A Plea for History and Philosophy of Statistics and Machine Learning [0.0]
統計学と機械学習の歴史と哲学の統合は、これまで以上に緊急である。最近の人工推論の成功は、主に機械学習によって推進されている。統合はまた、科学スペクトルの哲学のレベルでも現れる。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 10:12:59 GMT)
A Comparative Analysis of Transformer Models in Social Bot Detection [0.0]
ソーシャルメディアは、今日の社会における重要なコミュニケーションの媒体となっている。多くの当事者は人工的なユーザー(あるいはボット)を雇い、他人に真実を信じさせ、そのような当事者に有利な方法で行動するように仕向ける。本稿では,エンコーダとデコーダ変換器を用いたボット検出モデルの有効性を比較することを目的とする。
論文参考訳（メタデータ） (Thu, 18 Sep 2025 13:15:16 GMT)