Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation [110.0] 本稿では,視覚領域に次世代の予測パラダイムを適用するメカニズムについて,初めて体系的に検討する。
高レベルの視覚的意味論の学習を妨げる3つの重要な特性を同定する。
これらの課題は、訓練中に自己指導的目的を導入することで効果的に対処できることが示される。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:47:40 GMT)
A Survey of Reinforcement Learning for Large Reasoning Models [98.6] 大規模言語モデルによる推論のための強化学習の最近の進歩について
LRMのためのRLのさらなるスケーリングは、計算資源だけでなく、アルゴリズム設計、トレーニングデータ、インフラにおいても課題に直面している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:28:02 GMT)
MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [92.4] モノのインターネットのタイムリーな更新は、車載メタバースサービスの没入を実現するために不可欠である。
本稿では,フェデレーション学習による効率的なプライバシ保護データ提供を可能にする没入型モデルトレーディングフレームワークを提案する。
実験の結果,提案手法は最先端のベンチマークよりも優れていた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:54:17 GMT)
Lost in Translation? Vocabulary Alignment for Source-Free Domain Adaptation in Open-Vocabulary Semantic Segmentation [90.6] VocAlignは、セマンティックセグメンテーションにおいてVLM用に特別に設計された、ソースフリーのドメイン適応フレームワークである。
提案手法は,CityScapesデータセットの6.11mIoU改善を実現し,ゼロショットセグメンテーションベンチマークにおいて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:59:58 GMT)
An Empirical Study of Federated Prompt Learning for Vision Language Model [89.3] 本稿では,言語プロンプト学習(VPT)と視覚プロンプト学習(VLM)の行動的差異を系統的に検討する。
我々は、FPL(Federated Prompt Learning)の堅牢性を評価するために、クライアントスケール、集約戦略、即時長といった様々なFLと迅速な構成の影響を評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:36:50 GMT)
Lightweight and Accurate Multi-View Stereo with Confidence-Aware Diffusion Model [81.0] 本稿では,MVSに拡散モデルを導入する新しいMVSフレームワークを提案する。
深度推定の識別特性を考慮し,拡散過程を導出する条件エンコーダを設計する。
本稿では,新しいMVSフレームワークであるDiffMVSとCasMVSの2つの新しいMVS手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:59:19 GMT)
How Good are Foundation Models in Step-by-Step Embodied Reasoning? [79.2] 身体的エージェントは、安全で空間的に整合性があり、文脈に根ざした決定をしなければならない。
大規模マルチモーダルモデルの最近の進歩は、視覚的理解と言語生成において有望な能力を示している。
私たちのベンチマークには、10のタスクと8のエボディメントにまたがる詳細なステップバイステップ推論を備えた1.1k以上のサンプルが含まれています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:56:30 GMT)
WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [78.6] 有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:32:15 GMT)
SNaRe: Domain-aware Data Generation for Low-Resource Event Detection [77.3] 事象検出は、生物医学、法学、疫学のような高度に専門化された領域での推論を可能にするために重要である。
SNaReは、Scout、Narrator、Refinerの3つのコンポーネントから構成される、ドメイン対応の合成データ生成フレームワークである。
Scoutはラベルのないターゲットドメインデータからトリガーを抽出し、高品質なドメイン固有のトリガーリストをキュレートする。
これらのトリガに条件付けされたナレーターは、高品質なドメイン整列文を生成し、Refinerは追加のイベント参照を識別する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:18:57 GMT)
A Multi-To-One Interview Paradigm for Efficient MLLM Evaluation [63.8] 効率的なMLLM評価のためのマルチツーワンインタビューパラダイムを提案する。
本フレームワークは, (i) 事前面接と形式面接の2段階面接戦略, (ii) 公平性を確保するための重みの動的調整, (iii) 質問難度選択のための適応的メカニズムから構成される。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:07:40 GMT)
Unique Security and Privacy Threats of Large Language Models: A Comprehensive Survey [63.5] 大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
プライバシーとセキュリティの問題は、そのライフサイクルを通じて明らかになっている。
この調査は、潜在的な対策の概要と分析である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:08:36 GMT)
BiRQ: Bi-Level Self-Labeling Random Quantization for Self-Supervised Speech Recognition [63.5] BiRQは、BEST-RQの効率とHuBERTスタイルのラベル拡張の強化の利点を組み合わせた、双方向SSLフレームワークである。
提案手法は,960時間のLibriSpeech,150時間のAMIミーティング,5,000時間のYODASなど,さまざまなデータセットで検証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:09:29 GMT)
reWordBench: Benchmarking and Improving the Robustness of Reward Models with Transformed Inputs [63.4] 現状の報奨モデルでは, 入力変換が小さい場合でも, 大幅な性能劣化に悩まされていることを示す。
同様のスコアをパラフレーズに割り当てるように明示的にトレーニングすることを提案するが、この手法は他の異なる種類の変換に対する堅牢性も向上する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:58:20 GMT)
ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation [62.6] ForceVLAは、新しいエンドツーエンド操作フレームワークである。
外部力センシングは、VLAシステム内の第一級のモダリティとして扱う。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:02:38 GMT)
carps: A Framework for Comparing N Hyperparameter Optimizers on M Benchmarks [61.8] carpsはComprehensive Automated Research Performance Studiesのベンチマークフレームワークである。
我々は、ブラックボックス、マルチオブジェクト、マルチオブジェクト、マルチオブジェクトの4つの重要なタイプのHPOタスクに焦点をあてる。
5つのコミュニティベンチマークコレクションから336のタスクと28種類の9つのファミリーで、私たちはこれまでで最大のGotoライブラリを提供しています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:10:08 GMT)
SeCodePLT: A Unified Platform for Evaluating the Security of Code GenAI [58.3] コード生成大型言語モデル(LLM)のセキュリティリスクと能力を評価するための既存のベンチマークは、いくつかの重要な制限に直面している。
手動で検証し、高品質なシード例から始める、汎用的でスケーラブルなベンチマーク構築フレームワークを導入し、ターゲット突然変異を通じて拡張する。
このフレームワークをPython、C/C++、Javaに適用すると、44のCWEベースのリスクカテゴリと3つのセキュリティ機能にまたがる5.9k以上のサンプルデータセットであるSeCodePLTが構築されます。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:12:07 GMT)
IV-tuning: Parameter-Efficient Transfer Learning for Infrared-Visible Tasks [57.9] 完全な微調整のパラダイムの下では、特徴空間は高度に制約され、低ランクとなり、これは深刻な一般化を損なうことが証明されている。
本稿では,主観的オブジェクト検出,セマンティックセグメンテーション,オブジェクト検出など,様々なIR-VIS下流タスクにPVMをパラメータ効率よく活用するIV-tuningを提案する。
完全な微調整ベースラインと既存のIR-VIS法と比較して、IV-tuningは、バックボーンパラメータの3%未満で、赤外線と可視光の相補的な情報の学習を容易にする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:35:59 GMT)
Image-Text-Image Knowledge Transfer for Lifelong Person Re-Identification with Hybrid Clothing States [57.2] ハイブリッド衣料状態(LReID-Hybrid)を用いた生涯人物再識別を提案する。
LReID-Hybridは、生涯学習中に一連の布の交換と同じ布のドメインを考慮に入れている。
我々は、"画像-テキスト-画像"閉ループで知識を効果的に調整し、転送し、蓄積するための、$Teata$と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:03:53 GMT)
Toxicity Red-Teaming: Benchmarking LLM Safety in Singapore's Low-Resource Languages [57.1] 大規模言語モデル(LLM)は自然言語処理を変革しているが、その安全性メカニズムは低リソースで多言語的な設定では未探索のままである。
シンガポールの多様な言語文脈におけるLLM安全性をベンチマークするための新しいデータセットおよび評価フレームワークであるtextsfSGToxicGuardを紹介した。
我々は最先端の多言語LLMによる広範囲な実験を行い、その安全ガードレールの限界を明らかにする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:14:34 GMT)
Real, Fake, or Manipulated? Detecting Machine-Influenced Text [56.3] 我々はHiErarchical, length-RObust machine-influenced text detector (HERO)を紹介する。
HEROは、人書き、機械生成、機械処理、機械翻訳の4つの主要なタイプから、さまざまな長さのテキストサンプルを分離することを学ぶ。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:41:57 GMT)
Two Web Toolkits for Multimodal Piano Performance Dataset Acquisition and Fingering Annotation [56.3] 2つのグラフィカルユーザインタフェース(GUI)からなる統合Webツールキットを提案する。
PiaRecは、オーディオ、ビデオ、MIDI、パフォーマンスメタデータの同時取得をサポートする。
ASDFは、視覚データからパフォーマーフィンガーの効率的なアノテーションを可能にする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:59:24 GMT)
DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [55.2] ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:34:30 GMT)
Communication-Efficient and Privacy-Adaptable Mechanism for Federated Learning [54.2] 通信効率・プライバシー適応メカニズム(CEPAM)について紹介する。
CEPAMは通信効率とプライバシー保護を同時に達成する。
我々は、CEPAMのプライバシー保証を理論的に分析し、CEPAMのユーザプライバシと正確性の間のトレードオフを調査する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:08:44 GMT)
Towards Pre-trained Graph Condensation via Optimal Transport [52.7] グラフ凝縮は、元のグラフを小さなグラフに蒸留し、冗長性を緩和し、GNNトレーニングを加速することを目的としている。
従来のGCアプローチは、厳格なGNNとタスク固有の監督に大きく依存している。
タスク依存GC法とアーキテクチャ依存GC法の限界を超越するために, 最適輸送による事前学習グラフ凝縮(PreGC)を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:13:24 GMT)
Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models [52.4] 3つのコアコンポーネントで構成されるICU(Iterative Contrastive Unlearning)フレームワークを紹介する。
知識未学習誘導モジュールは、未学習の損失を使用して、特定の知識を除去するためにターゲットとする。
Contrastive Learning Enhancementモジュールは、純粋な未学習の目標に対してモデルの表現力を保持する。
イテレーティブ・アンラーニング・リファインメントモジュールは、進行中の評価と更新を通じて、アンラーニングプロセスを動的に調整する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:01:29 GMT)
Large Multi-modal Models Can Interpret Features in Large Multi-modal Models [51.5] まず、スパースオートエンコーダを用いて表現を人間の理解可能な特徴に分解する。
LMM自体がSAEで学んだオープンセマンティックな特徴を解釈するための自動解釈フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:46:09 GMT)
UnifiedVisual: A Framework for Constructing Unified Vision-Language Datasets [51.3] 統合視覚大言語モデル(VLLM)は、最近、マルチモーダル理解と生成の両方において顕著な進歩を遂げている。
本稿では,新しいデータセット構築フレームワークUnifiedVisualを導入し,UnifiedVisual-240Kを提案する。
UnifiedVisual-240Kは、様々な視覚的およびテキスト的入力と出力をシームレスに統合し、包括的なクロスモーダル推論を可能にする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:39:44 GMT)
MINGLE: VLMs for Semantically Complex Region Detection in Urban Scenes [49.9] 公共空間におけるグループレベルの社会的相互作用は都市計画に不可欠である。
対人関係によって定義された視覚領域の推測と空間的接地を必要とする社会集団領域検出タスクを導入する。
本稿では,人間検出と深度推定を統合したモジュール型3段階パイプラインであるMINGLEと,ソーシャルアフィリエイトを相互に分類するVLMベースの推論と,ソーシャルに連結したグループを局所化する軽量な空間アグリゲーションアルゴリズムを提案する。
そこで本稿では,個人と社会的に相互作用するグループの両方に対して,境界ボックスとラベルを付加した100万の街路ビュー画像のデータセットを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:03:41 GMT)
Towards a Real-World Aligned Benchmark for Unlearning in Recommender Systems [49.8] 推薦システムにおける非学習のためのより現実的なベンチマークの開発を導くために,設計デシダータと研究質問のセットを提案する。
我々は、現実世界の削除要求の逐次的で時間に敏感な性質を反映した、未学習のセットアップについて論じる。
本稿では,提案したdesiderataをベースとした次世代レコメンデーションセッティングの予備実験を行い,アンラーニングが逐次レコメンデーションモデルにも有効であることを確認した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:17:43 GMT)
GAF: Gaussian Action Field as a Dynamic World Model for Robotic Manipulation [46.9] 既存のアプローチは、視覚入力から直接アクションを予測するV-A(Vision-to-A)パラダイムや、中間的な3D表現を活用するV-3D-to-A(Vision-to-A)パラダイムに従うのが一般的である。
本稿では,ガウスアクション場(GAF)を介して動作認識4D表現から直接行動推論を可能にするV-4D-Aフレームワークを採用する。
実験では、+11.5385 dB PSNR、+0.3864 SSIM、-0.5574 LPIPSの改善を達成し、平均+7.3%の成功を上げた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:19:35 GMT)
MultiEdit: Advancing Instruction-based Image Editing on Diverse and Challenging Tasks [46.9] MultiEditは、107K以上の高品質の画像編集サンプルを備えた包括的なデータセットである。
18の非スタイルの編集タイプと38のスタイルの転送操作の多様なコレクションを通じて、6つの困難な編集タスクを含んでいる。
我々は、2つのマルチモーダル大言語モデル(MLLM)を用いて視覚適応的な編集命令を生成する新しいデータセット構築パイプラインを用いる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:33:38 GMT)
DeKeyNLU: Enhancing Natural Language to SQL Generation through Task Decomposition and Keyword Extraction [46.4] 本稿では,1500組のQAペアを含む新しいデータセットであるDeKeyNLUを提案する。
本稿では,ユーザ質問理解,エンティティ検索,生成に3つのモジュールを使用するRAGベースのNL2パイプラインであるDeKeyを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:47:56 GMT)
Knowledge-Driven Hallucination in Large Language Models: An Empirical Study on Process Modeling [46.1] 解析的タスクにおける大規模言語モデルの実用性は、その膨大な事前訓練された知識に根ざしている。
この能力は、私たちが知識駆動幻覚と呼ぶものに対して、重大なリスクをもたらします。
本稿では,自動プロセスモデリングのタスクにおけるLCMの評価により,この現象を考察する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:27:30 GMT)
Improving Internet Traffic Matrix Prediction via Time Series Clustering [45.9] モデル学習に先立って,同種の時間パターンで群流を流す2つのクラスタリング手法,すなわちソースクラスタリングとヒストグラムクラスタリングを提案する。
既存のTM予測法と比較して,アビレンでは最大92%,G'EANTでは75%削減できる。
ルーティングのシナリオでは、クラスタ化された予測により、最大リンク利用率(MLU)のバイアスをそれぞれ18%と21%削減する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:33:33 GMT)
Decoupled Proxy Alignment: Mitigating Language Prior Conflict for Multimodal Alignment in MLLM [45.4] マルチモーダル・大規模言語モデル (MLLM) は視覚と言語モダリティを統合できることから注目されている。
MLLMの最近の進歩は、主に高品質なデータセットによるパフォーマンス向上に焦点を当てている。
我々は、以前見過ごされた問題、言語事前衝突、大規模言語モデル(LLM)固有の言語先行とデータセットのトレーニングにおける言語先行とのミスマッチを識別する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:37:11 GMT)
LiMuon: Light and Fast Muon Optimizer for Large Models [45.1] 大規模モデルのトレーニングに有用なMuonを提案する。
私たちのLiMuonは、現在のMuonとその変種よりもメモリが低い。
一般化された滑らかな条件下でLiMuonがサンプルO(epsilon-3)$であることを証明する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:49:27 GMT)
HD3C: Efficient Medical Data Classification for Embedded Devices [44.6] Class-Wise Clustering (HD3C)は、低消費電力環境向けに設計された軽量な分類フレームワークである。
HD3Cはデータを高次元のハイパーベクターにエンコードし、それらを複数のクラスタ固有のプロトタイプに集約し、ハイパースペースにおける類似性探索を通じて分類を行う。
心臓音の分類では,HD3Cはベイジアン・レスネットよりも350タイムs$エネルギー効率が高く,精度は1%以下であった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:46:16 GMT)
Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning [44.5] Supervised Fine-Tuning (SFT) Large Language Modelsは高品質なトレーニングデータに依存している。
データ選択とデータ合成は、データ品質を改善するための2つの一般的な戦略であるが、既存のアプローチは進化するモデル機能に適応しない。
モデル認識データ選択とコンテキスト保存データ精錬を利用する自己進化型モデルインフォームド動的データ最適化フレームワークであるMiddoを紹介した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:29:15 GMT)
Which Direction to Choose? An Analysis on the Representation Power of Self-Supervised ViTs in Downstream Tasks [43.5] 視覚変換のための自己監督学習(ViTs)は、近年、様々なコンピュータビジョンタスクの事前学習戦略としてかなりの可能性を示している。
本研究の目的は,画像分類とセグメント化タスクにまたがる未修正特徴の使用を体系的に評価することで,ギャップを埋めることである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:46:07 GMT)
Entropy-Regularized Process Reward Model [43.1] 大規模言語モデル(LLM)は、複雑な多段階推論を行う上で有望であるが、数学的推論に苦慮し続けている。
KL規則化マルコフ決定プロセス(MDP)を統合したエントロピー規則化プロセス報酬モデル(ER-PRM)を提案する。
MATHとGSM8Kベンチマークの実証実験により、ER-PRMは既存のプロセス報酬モデルより一貫して優れていることが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:47:30 GMT)
LNE-Blocking: An Efficient Framework for Contamination Mitigation Evaluation on Large Language Models [42.9] 我々は,潜在的に漏洩したデータセットを汚染する前にモデル性能を復元する新しいフレームワークである textbfLNE-Blocking を提案する。
私たちのフレームワークは、モデルの性能を効率的に回復する最初のフレームワークです。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:59:16 GMT)
Geometric Image Synchronization with Deep Watermarking [42.9] SyncSealは、堅牢な画像同期のためのbespokeの透かし方式である。
イメージを不可避的に変更する埋め込みネットワークと、画像が被写体となる幾何学的変換を予測する抽出ネットワークに依存している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:56:54 GMT)
Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration [42.7] DM-Calibは単一の入力画像からピンホールカメラ固有のパラメータを推定するための拡散に基づくアプローチである。
我々は、カメラ画像と呼ばれる新しい画像ベース表現を導入し、数値カメラの内在を無意味に符号化する。
一つのRGB入力からカメラ画像を生成するための安定拡散モデルを微調整することにより、RANSAC操作を介してカメラ固有の特徴を抽出することができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:25:27 GMT)
RAcQUEt: Unveiling the Dangers of Overlooked Referential Ambiguity in Visual LLMs [42.4] 本稿では,画像に基づく質問応答におけるあいまいさの異なる側面を対象とするデータセットであるRACQUETを紹介する。
我々は、その応答のあいまいさに対処する上で、最先端の大規模マルチモーダル言語モデルの過信に関する重大な制限と問題を明らかにする。
本結果は, 望ましくないステレオタイプに頼らずに不確実性に対処する頑健な戦略を持つモデルの導入の緊急性を強調した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:44:33 GMT)
Benchmarking and Improving LLM Robustness for Personalized Generation [42.3] 反応が事実的正確であり、ユーザの好みと一致している場合、モデルをロバストと定義します。
私たちの作業は、現在の評価プラクティスにおける重要なギャップを強調し、より信頼性が高く、ユーザ対応のデプロイメントをサポートするためのツールとメトリクスを導入しています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:56:14 GMT)
Learning the symmetric group: large from small [42.0] 置換予測を訓練したトランスフォーマーニューラルネットは、100%近い精度で対称群$S_25$に一般化できることを示す。
可変語長を管理するためのキーツールとしてアイデンティティ拡張を採用し、隣接する転置のトレーニングには分割ウィンドウを用いる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:41:36 GMT)
A deep solver for backward stochastic Volterra integral equations [42.0] 後方ボルテラ積分方程式(BSVIE)に対する最初のディープラーニング解法を提案する。
この方法はニューラルネットワークを訓練し、2つの解場を1段階で近似させる。
これらの結果は、制御と量的ファイナンスにおける高次元、経路に依存した問題のファミリーへの実践的アクセスを開放する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:08:53 GMT)
VLM Agents Generate Their Own Memories: Distilling Experience into Embodied Programs of Thought [41.7] 大規模生成言語と視覚言語モデル(LLMとVLM)は、数ショットの学習では優れているが、高品質な実演を必要とする。
In-Context Abstraction Learning (ICAL) を提案し、VLMエージェントが最適な軌道を高品質な訓練データに変換することを可能にする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:44:34 GMT)
EXPLOR: Extrapolatory Pseudo-Label Matching for Out-of-distribution Uncertainty Based Rejection [41.1] EXPLORは、アウト・オブ・ディストリビューションポイントの予測と不確実性に基づく拒絶を改善するフレームワークである。
潜在空間拡張に対する補間的擬似ラベルを導入し、実数値ベクトルデータによる堅牢なOOD一般化を可能にする。
ニューラルバックボーンを用いた以前のモダリティ非依存法とは対照的に、EXPLORはモデル非依存であり、単純なツリーベースモデルから複雑なOOD一般化モデルへの手法を効果的に扱う。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:54:53 GMT)
Mixture of Multicenter Experts in Multimodal AI for Debiased Radiotherapy Target Delineation [40.9] 本稿では,医療分野におけるAIバイアスに対処するために,機関間のデータ共有を必要とせず,マルチセンターエキスパートの混在(Mixture of Multicenter Experts, MoME)フレームワークを提案する。
MoMEは、様々な臨床戦略から専門的な専門知識を統合し、医療センター全体のモデル一般化可能性と適応性を高める。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:48:24 GMT)
Not All Degradations Are Equal: A Targeted Feature Denoising Framework for Generalizable Image Super-Resolution [40.7] Generalizable Image Super-Resolutionは、未知の劣化下でのモデル一般化機能の向上を目的としている。
本稿では,ノイズ検出とデノナイジングモジュールを含むターゲット機能デノナイジングフレームワークを提案する。
本フレームワークは,従来の正規化方式に比べて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:04:51 GMT)
AssoCiAm: A Benchmark for Evaluating Association Thinking while Circumventing Ambiguity [40.7] マルチモーダル大言語モデル(MLLM)は、人工知能(AGI)への有望な経路を提供するなど、大きな注目を集めている。
AGIに必要な重要な能力のうち、創造性はMLLMにとって重要な特性として現れ、その基盤として協会が機能している。
AssoCiAmは、ハイブリッド計算手法により曖昧さを回避しつつ、連想能力を評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:46:07 GMT)
A Survey of Large Language Models for Data Challenges in Graphs [40.4] グラフは、ソーシャルネットワーク分析から生体分子予測に至るまで、非ユークリッドデータを表現するために広く使われているパラダイムである。
グラフ学習は目覚ましい進歩を遂げているが、現実のグラフデータは学習プロセスを著しく妨げる多くの課題を提示する。
最近、Large Language Models (LLMs) は、リッチなセマンティック推論と外部知識を活用することで、これらの課題に対処する可能性を提供している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:51:08 GMT)
Robust Reinforcement Learning under Diffusion Models for Data with Jumps [40.3] 本稿では,MSBVE(Mean-Square Bipower Variation Error)アルゴリズムを提案する。
我々はまず,連続時間RLで一般的に使用される平均平方TDエラー(MSTDE)アルゴリズムを再検討し,状態ダイナミクスのジャンプ処理における制限を強調した。
提案したMSBVEアルゴリズムは平均2乗2乗変動誤差を最小化し,ジャンプを伴うSDEを特徴とする環境におけるMSTDEよりも優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:45:09 GMT)
MovieCORE: COgnitive REasoning in Movies [39.8] MovieCOREは、映画コンテンツに対する深い認知的理解を探求するために設計された、新しいデータセットである。
本稿では,複数の大規模言語モデル(LLM)を思考エージェントとして活用する,革新的なエージェントブレインストーミング手法を提案する。
既存のビデオ言語モデル(VLM)の限界に対処するため、エージェント拡張モジュール、エージェント選択拡張(ACE)を導入する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:56:38 GMT)
RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation [39.4] RynnVLA-001は、人間のデモンストレーションから大規模ビデオ生成前訓練に基づいて構築された視覚言語アクション(VLA)モデルである。
最初のステージであるEgo-Centric Video Generative Pretrainingは、12Mのエゴ中心の操作ビデオ上で、画像からビデオまでのモデルを訓練し、初期フレームと言語命令で条件付けられた将来のフレームを予測する。
第2段階であるHuman-Centric Trajectory-Aware Modelingは、将来のキーポイント軌跡を共同で予測することでこれを拡張し、アクション予測による視覚的フレーム予測を効果的にブリッジする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:58:02 GMT)
DeCoP: Enhancing Self-Supervised Time Series Representation with Dependency Controlled Pre-training [39.3] 本稿では、動的でマルチスケールな依存関係を、進化するパッチ間の依存関係をシミュレートすることで、明示的にモデル化する依存性制御事前学習フレームワークを提案する。
DeCoPは、低いコンピューティングリソースを持つ10のデータセットに対して最先端の結果を達成し、わずか37%のFLOPを使用して、PatchTST上のETTh1上でMSEを3%改善する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:44:06 GMT)
TICA-Based Free Energy Matching for Machine-Learned Molecular Dynamics [39.1] 損失関数に相補的なエネルギーマッチング項を導入する。
我々はCGSchNetモデルを用いてチグノリンタンパク質の枠組みを評価した。
エネルギーマッチングは統計学的に精度が向上することはなかったが、モデルが自由エネルギー表面を一般化する方法に顕著な傾向を示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:22:25 GMT)
InMind: Evaluating LLMs in Capturing and Applying Individual Human Reasoning Styles [39.0] 社会的推論ゲームは、個別の推論スタイルを評価するための自然なテストベッドを提供する。
我々は,LLMがパーソナライズされた推論スタイルをキャプチャして適用できるかどうかを評価するための認知基盤評価フレームワークであるInMindを紹介する。
ケーススタディとして、InMindをゲームAvalonに適用し、11の最先端LCMを評価した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:16:24 GMT)
On the Role of Individual Differences in Current Approaches to Computational Image Aesthetics [38.9] 画像アセスメント(IAA)は、画像の多様性とユーザの主観性によって複雑なタスクである画像美学を評価する。
ジェネリックIAA(GIAA)モデルは平均麻酔スコアを推定し、パーソナライズIAA(PIAA)モデルは転送学習を用いてGIAAを適応し、ユーザ主観性を取り入れる。
この研究はIAAの理論的基盤を確立し、個々の特性を分布形式にエンコードする統一モデルを提案し、個人とグループの両方で評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:55:54 GMT)
SMART: Simulated Students Aligned with Item Response Theory for Question Difficulty Prediction [38.8] 本稿では、シミュレーションされた学生を指導力で整列させる新しい方法SMART(Simulated Students Aligned with IRT)を提案する。
SMARTは、その改善された能力アライメントを活用することで、他の項目の難易度予測手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:29:00 GMT)
A Mutual Information Perspective on Multiple Latent Variable Generative Models for Positive View Generation [38.4] 画像生成において、Multiple Latent Variable Generative Models (MLVGM) は複数の潜伏変数を用いて最終像を徐々に形成する。
本稿では,Mutual Information (MI) を指標として,各潜伏変数の寄与度を定量化する新しいフレームワークを提案する。
MLVGMの階層変数と非絡み合い変数を活用することで,実画像データを必要としない多様で意味のあるビューを生成する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:48:33 GMT)
VisMoDAl: Visual Analytics for Evaluating and Improving Corruption Robustness of Vision-Language Models [38.0] 視覚言語モデル(VL)を様々な汚職タイプに対して評価するための視覚分析フレームワークであるVisMoDAlを紹介する。
VisMoDAlは、特定の汚職下でのパフォーマンス検査から、タスク駆動によるモデル動作の検査まで、多レベル分析をサポートする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:15:00 GMT)
Hierarchical Federated Learning for Social Network with Mobility [37.9] Federated Learning (FL)は、協力的なローカルモデルトレーニングとグローバルアグリゲーションを可能にする分散ソリューションを提供する。
従来のFLフレームワークでは、データプライバシは、ローカルデータが完全にプライベートであるという前提の下で保存されるのが一般的である。
クライアント間のデータ共有とモビリティパターンの両方を考慮した階層型フェデレーション学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:17:06 GMT)
Automatic Mapping of AutomationML Files to Ontologies for Graph Queries and Validation [37.7] AutomationMLは、自動化ドメインにおけるオープンデータ交換フォーマットとして広く採用されている。
本稿では、AutomationMLをOWLに変換することで、SPARQLでのクエリやSHACLによる検証において、新たなユースケースを実現する方法について説明する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:00:06 GMT)
FAWN: A MultiEncoder Fusion-Attention Wave Network for Integrated Sensing and Communication Indoor Scene Inference [37.6] ISAC(Integrated Sensing and Communication)はこの課題に対処する一歩を踏み出した。
ISAC内では、受動的センシングは、環境を感知するために無線通信を再利用するコスト効率の高いソリューションとして出現する。
本稿では,ISAC屋内シーン推論のためのマルチエンコーダフュージョン・アテンション・ウェーブ・ネットワークであるFAWNについて述べる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:01:14 GMT)
Radiolunadiff: Estimation of wireless network signal strength in lunar terrain [37.6] 月面上の無線地図を予測するための物理インフォームド深層学習アーキテクチャを提案する。
提案手法は,NASAの公開データから得られるリアルな地形を生成する物理ベースの月面地形生成装置と,電波伝搬シナリオの高忠実度データセットを作成するレイトレーシングエンジンを統合したものである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:44:05 GMT)
PVLM: Parsing-Aware Vision Language Model with Dynamic Contrastive Learning for Zero-Shot Deepfake Attribution [36.4] ゼロショットディープフェイク属性(ZS-DFA)のための動的コントラスト学習法(PVLM)を用いた新しい構文認識型視覚言語モデルを提案する。
具体的には、拡散のような未確認の先進発電機に対するディープフェイク属性の属性性能を評価するために、新規できめ細かいZS-DFAベンチマークを実施している。
また,動的コントラスト学習(PVLM)法を用いて,汎用的かつ多様な属性特徴を抽出する革新的な解析誘導型視覚言語モデルを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:24:25 GMT)
Explicit vs. Implicit Biographies: Evaluating and Adapting LLM Information Extraction on Wikidata-Derived Texts [36.3] 本研究では,テキストの暗黙性が事前学習した言語モデルにおける情報抽出作業にどのように影響するかを検討する。
我々は,LLMの性能に与える影響を測るために,暗黙的かつ明示的なバイオグラフィ情報の音声化を2つの合成データセットで生成する。
その結果,LoRAを用いた微調整LLMモデルでは,暗黙のテキストから情報を取り出す際の性能が向上することが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:30:31 GMT)
The Great AI Witch Hunt: Reviewers Perception and (Mis)Conception of Generative AI in Research Writing [36.2] 研究執筆におけるジェネレーティブAI(GenAI)の利用は急速に増加している。
ピアレビュアーがAIによる増補された写本をどう認識するか、それとも誤認しているかは明らかでない。
我々の研究結果は、AIによって強化された文章は可読性、言語多様性、情報性を改善するが、しばしば研究の詳細や著者からの反射的な洞察を欠いていることを示唆している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:58:43 GMT)
Global Pre-fixing, Local Adjusting: A Simple yet Effective Contrastive Strategy for Continual Learning [35.3] 我々はtextbf Supervised textbfContrastive Learning (GPLASC) のための textbfGlobal textbfPre-fixing, textbfLocal textbfAdjusting というコントラスト戦略を提案する。
具体的には、表現の単位超球面全体を非重複領域に分割し、各領域の中心がタスク間の事前固定を形成する。
個々のタスクに対して,本手法は特徴構造を制御し,内部を形成するのに役立つ。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:41:06 GMT)
Causal Reasoning Elicits Controllable 3D Scene Generation [35.2] CausalStructは3Dシーン生成に因果推論を組み込む新しいフレームワークである。
ノードがオブジェクトや属性を表現する因果グラフを構築し、エッジが因果依存性と物理的制約をエンコードする。
提案手法では,3次元ガウス切削およびスコア蒸留サンプリングにより形状精度とレンダリング安定性を向上し,3次元シーンにおけるオブジェクト配置とレイアウトの誘導にテキストや画像を用いる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:03:21 GMT)
A Weak Supervision Approach for Monitoring Recreational Drug Use Effects in Social Media [35.2] 我々は、ソーシャルメディア(特にTwitter)を、エキスタシー、GHB、および2C-Bという3つの新しい精神活性物質に関連する、ユーザーによって報告された効果のリッチで未報告の源として活用する。
MetaMapによるバイオメディカルな概念抽出とスラング用語のキュレートされたリストを組み合わせることで、これらの物質に言及する92,000以上のツイートを特定し、弱く注釈づけした。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:42:42 GMT)
DualEdit: Dual Editing for Knowledge Updating in Vision-Language Models [35.1] テキストと視覚の両方を各キー層で修正するエディタであるDualEditを提案する。
複数のVLMバックボーンとベンチマークデータセットにまたがるDualEditを評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:24:31 GMT)
Multi-Fidelity Hybrid Reinforcement Learning via Information Gain Maximization [34.3] 情報ゲイン(MFHRL-IGM)を用いた多要素ハイブリッドRLを提案する。
MFHRL-IGM (MFHRL-IGM) は、ブートストラップ方式による情報ゲインに基づく忠実度選択を実装したハイブリッドオフラインオンラインRLアルゴリズムである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:12:22 GMT)
Mind the Inclusivity Gap: Multilingual Gender-Neutral Translation Evaluation with mGeNTE [34.1] ジェンダーニュートラル翻訳(GNT)は、言語間のより公平なコミュニケーションに向けた言語戦略である。
我々は、専門家によるリソースであるmGeNTEを導入し、包括的翻訳の最初の体系的多言語的評価を行う。
en-es/de/it/elの実験では、モデルが中立性が適切かどうかを認識できるが、中立的な翻訳を一貫して生成することはできないことが明らかになった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:48:23 GMT)
Mind the Gap: Data Rewriting for Stable Off-Policy Supervised Fine-Tuning [33.9] 大規模言語モデルの教師付き微調整(SFT)は、非政治的な学習問題と見なすことができる。
既存のアプローチは、KLペナルティやクリッピングを使ってこの問題を軽減する。
本稿では,政策ギャップを積極的に縮小する簡易かつ効果的なデータ書き換えフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:02:30 GMT)
Optimal Learning from Label Proportions with General Loss Functions [33.8] 本稿では,ラベル情報から学習する新奇で多用途な低分散デバイアス手法を提案する。
提案手法は,実用的な損失関数の幅広いスペクトルをシームレスに収容する,顕著な柔軟性を示す。
提案手法の有効性を様々なベンチマークデータセットで実証的に検証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:53:32 GMT)
Modular Machine Learning: An Indispensable Path towards New-Generation Large Language Models [33.8] 我々は,次世代大規模言語モデル(LLM)に不可欠なアプローチとして,有望な学習パラダイム,すなわちモジュール機械学習(MML)を概説する。
我々は,LLMの複雑な構造を,モジュール表現,モジュールモデル,モジュール推論の3つの相互依存成分に分解する,LLMのための統一MMLフレームワークを提案する。
最終的に、MLとLLMの統合は、統計的(深層)学習と形式的(論理的)推論のギャップを埋める可能性があると信じています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:34:54 GMT)
Superpose Task-specific Features for Model Merging [33.8] 本稿では,ニューラルネットワーク表現の基本的なメカニズムを活用することによって,モデルマージの新たな視点を導入する。
本稿では,個々のモデルからタスク固有の特徴を重畳したモデルに重ね合わせる手法を提案する。
提案手法は,ディープネットワークにおける特徴の活性化と抽出に不可欠な線形変換行列を特に対象とする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:17:25 GMT)
Binarized Neural Networks Converge Toward Algorithmic Simplicity: Empirical Support for the Learning-as-Compression Hypothesis [33.7] 本稿では,二元化ニューラルネットワーク(BNN)を第1のプロキシとして用いて,アルゴリズム情報理論へのシフトを提案する。
ブロック分解法 (BDM) を適用し, エントロピーよりもトレーニング中の構造変化をより綿密に追跡した。
これらの結果は、学習が構造化正規性の進行的内部化に対応するアルゴリズム圧縮の過程としてのトレーニングの観点を支持する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:30:41 GMT)
Fermat's Spiral-Based Characterization of Squeezed Nonlinear Motional States of Levitated Nanoparticle [33.7] 我々はフェルマーのスパイラルの概念を用いて位相空間座標の非線形変換を導入する。
ダッフィング型非線形性によって引き起こされる状態歪みを除去し、運動状態のキャラクタリゼーションを可能にする。
提案方式により, 適用状態の操作, システムの漸進的熱化, 閉じ込めの非線形性の影響を分離することができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:17:35 GMT)
Assessing Historical Structural Oppression Worldwide via Rule-Guided Prompting of Large Language Models [33.7] 我々は,Large Language Models(LLMs)を利用した圧縮測定のための新しいフレームワークを提案する。
我々は、モデルが解釈可能で理論的に基礎付けられた抑圧の推定を生成することを奨励するルール誘導的促進戦略を設計する。
以上の結果から, LLM は, 明示的なルールでガイドされている場合, 国家内における個人性に基づく歴史的抑圧の微妙な形態を捉えることができることが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:59:05 GMT)
Select to Know: An Internal-External Knowledge Self-Selection Framework for Domain-Specific Question Answering [33.5] 大規模言語モデル(LLM)は一般的なQAではうまく機能するが、ドメイン固有のシナリオではしばしば苦労する。
Selct2Know(S2K)は,ドメイン知識を内部的・外部的知識自己選択戦略によって内部化する,費用対効果の高いフレームワークである。
医学的、法的、財務的なQAベンチマークの実験は、S2Kが既存の方法より一貫して優れていることを示している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:35:01 GMT)
Breathing and Semantic Pause Detection and Exertion-Level Classification in Post-Exercise Speech [33.4] 運動後のスピーチには豊富な生理的・言語的な手がかりが含まれており、しばしば意味的なポーズ、呼吸停止、呼吸・情緒的な一時停止が特徴である。
本研究では,ポーズ型の体系的なアノテーションを提供し,深層学習モデル全体にわたって,探索的呼吸と意味的停止検出と実行レベル分類を行う。
その結果,各タイプの検出精度はセマンティクスで89$%,呼吸で55$%,複合停止で86$%,オーバーオールで73$%まで向上した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:39:34 GMT)
LLM-OREF: An Open Relation Extraction Framework Based on Large Language Models [33.4] オープンリレーション抽出(OpenRE)の目的は、トレーニング中に遭遇しない新しいリレーションに一般化できるREモデルを開発することである。
本稿では,大規模言語モデル(LLM)に基づくOpenREフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:46:40 GMT)
The Anatomy of a Personal Health Agent [33.0] 一般消費者の健康管理装置や一般の健康記録からマルチモーダルデータを分析できる包括的パーソナルヘルスエージェントの構築を目指している。
我々は,消費者の健康ニーズの3つの主要なカテゴリを特定し,それぞれが専門的なサブエージェントによって支えられている。
動的にパーソナライズされた対話を可能にするマルチエージェントフレームワークであるPersonal Health Agent(PHA)を提案し,開発する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:43:25 GMT)
A Test-Function Approach to Incremental Stability [32.9] 値関数の正則性とその漸進安定性への関連性は、制御理論における安定性の証明に対する従来のリャプノフのアプローチとは異なる方法で理解することができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:25:22 GMT)
TITAN: A Trajectory-Informed Technique for Adaptive Parameter Freezing in Large-Scale VQE [32.2] 変分量子固有解法(VQE)は、量子コンピュータを用いて量子化学と材料シミュレーションを推し進める主要な候補である。
そこで我々はTitanと呼ばれる深層学習フレームワークを提案し,不活性パラメータの同定と凍結を行う。
タイタンはコンバージェンスを最大で3倍速くし、最先端のベースラインよりも40%から60%少ない回路評価を実現している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:50:02 GMT)
Standardizing Generative Face Video Compression using Supplemental Enhancement Information [32.1] 本稿では,補助強調情報(SEI)を用いたGFVC(Generative Face Video Compression)アプローチを提案する。
この記事執筆時点では,SEIメッセージを用いたGFVC方式がVersatile Supplemental Enhancement Information (VSEI)標準のドラフト修正に含まれている。
著者の知識を最大限活用するために、JVETが提案したSEIベースのGFVCアプローチは、生成ビデオ圧縮のための最初の標準化活動である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:41:04 GMT)
The Inadequacy of Offline LLM Evaluations: A Need to Account for Personalization in Model Behavior [32.0] 我々は、同じ言語モデルに対する同一のベンチマーク質問が、ステートレスシステムに誘導された場合、顕著に異なる応答を生成できることを示す。
オフライン評価と、ChatGPTとGeminiの実際のユーザ800名によるフィールド評価を比較し、チャットインターフェースに提示された質問とを比較した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:41:20 GMT)
Visionerves: Automatic and Reproducible Hybrid AI for Peripheral Nervous System Recognition Applied to Endometriosis Cases [31.8] 子宮内膜症はしばしば慢性骨盤痛と神経障害を引き起こす。
末梢神経系認識のための新しいハイブリッドAIフレームワークであるVisionervesを紹介する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:08:28 GMT)
SCoT: Straight Consistent Trajectory for Pre-Trained Diffusion Model Distillations [31.6] 本研究では,事前学習した拡散モデルに対する直線一貫性軌道(SCoT)モデルを提案する。
SCoTは、高速サンプリングのための両方のアプローチの利点を享受し、一貫した特性と直線的な性質のトラジェクトリを同時に生成する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:02:07 GMT)
Who is Responsible When AI Fails? Mapping Causes, Entities, and Consequences of AI Privacy and Ethical Incidents [31.5] 我々は、202の現実世界のAIプライバシと倫理的インシデントを分析し、分類学を開発した。
この結果から, 組織的決定の貧弱さと法的な非コンプライアンスの悪影響が明らかとなった。
本研究は,政策立案者や実践者に対して有効なガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:53:51 GMT)
GCDance: Genre-Controlled 3D Full Body Dance Generation Driven By Music [31.3] GCDanceは、音楽とテキストの両方のプロンプトに条件付きジャンル固有のダンスモーションを生成するための分類器なし拡散フレームワークである。
提案手法は,高レベルな事前学習音楽基礎モデルと手作りのマルチグラニュラリティ特徴融合機能を組み合わせることで,音楽の特徴を抽出する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:30:09 GMT)
Walk and Read Less: Improving the Efficiency of Vision-and-Language Navigation via Tuning-Free Multimodal Token Pruning [30.5] トーケンプルーニングは、性能損失を最小限に抑えながら、効率をアピールするトレードオフを提供する。
本研究では,ナビゲーション固有の特徴を活かしたナビゲーション・アウェア・プルーニング(NAP)を提案する。
NAPは以前の作業よりも優れており、50%以上のFLOPSを節約しながら高い成功率を維持している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:05:37 GMT)
Evaluating Large Language Models for Cross-Lingual Retrieval [30.5] 大規模言語モデル(LLM)を用いた2段階CLIRにおけるレトリバーとリランカーの相互作用について検討する。
以上の結果から,機械翻訳がなければ,CLIRに直接適用した場合,最先端のリランカーは著しく低下することが明らかとなった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:54:17 GMT)
Dr. Jekyll and Mr. Hyde: Two Faces of LLMs [30.2] 大規模言語モデル(LLM)はチャットボットやメールアシスタントなどのアプリケーションに統合されている。
本研究では,ChatGPT,Gemini,Deepseekの安全性対策を,複雑なペルソナを擬人化することによって回避する。
ペルソナを用いて、禁止された応答が提供され、不正、違法、有害な情報を得ることができることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:33:35 GMT)
"My Boyfriend is AI": A Computational Analysis of Human-AI Companionship in Reddit's AI Community [28.5] Redditの主要なAIコンパニオンコミュニティであるr/MyBoyfriendIsAIの大規模解析を行った。
この結果から,コミュニティメンバのAIコンパニオンシップが意図せず,機能的利用によって意図せず出現することが明らかとなった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:50:53 GMT)
Morph: A Motion-free Physics Optimization Framework for Human Motion Generation [28.0] 現在の運動生成は、物理学的な制約を無視し、物理的に不可解な運動をもたらす。
雑音の多い動きデータを用いて有効な運動物理学を訓練するためのフレームワークである textbfMorph を提案する。
我々のフレームワークは、身体的可視性を大幅に向上させながら、最先端の運動品質を実現する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:52:22 GMT)
3DS: Medical Domain Adaptation of LLMs via Decomposed Difficulty-based Data Selection [27.9] 大きな言語モデルは一般的なタスクでは優れていますが、医療のような専門分野では苦労しています。
2段階モデル中心のデータ選択フレームワークDe Difficulty Data Selection (3DS)を提案する。
実世界の医療データセットに関する我々の実験は、既存の方法よりも5.29%以上の精度で3DSの方が優れていることを示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:16:30 GMT)
Scalable entanglement of nuclear spins mediated by electron exchange [27.8] シリコンデバイスにおける2つのリン原子の核間の2量子制御-Z論理演算を実演する。
この方法により、半導体スピン量子ビットのスケールアップの今後の進歩は、核スピンベースの量子コンピュータの開発にまで拡張できる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:54:37 GMT)
Roll Your Eyes: Gaze Redirection via Explicit 3D Eyeball Rotation [27.4] 本稿では,明快な3次元眼球構造を利用した新しい3次元視線リダイレクトフレームワークを提案する。
本手法は, 3次元眼球構造を明示的に回転・翻訳することにより, 所望の視線方向を忠実に再現するフォトリアリスティック画像を生成する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:50:55 GMT)
MUSE: MCTS-Driven Red Teaming Framework for Enhanced Multi-Turn Dialogue Safety in Large Language Models [27.4] 攻撃角と防御角の両方からマルチターンジェイルブレイクに対処する包括的フレームワークであるMUSEを紹介する。
攻撃に対して,フレームセマンティクスと木探索を用いて多種多様な意味軌道を探索するMUSE-Aを提案する。
MUSE-D(MUSE-D)は,対話の初期段階において脆弱性の軽減に介入する,きめ細かい安全アライメント手法である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:12:27 GMT)
Edge-Aware Normalized Attention for Efficient and Detail-Preserving Single Image Super-Resolution [27.3] 単一高分解能超解像(SISR)は、単一の低分解能観測から構造的に忠実な高周波成分を回収することが曖昧であるため、非常に不明瞭である。
既存のエッジ対応の手法では、エッジ先行または注意枝をますます複雑なバックボーンにアタッチすることが多いが、アドホック融合は冗長性、不安定な最適化、あるいは限られた構造的利得をもたらすことが多い。
このギャップには, エッジ特徴量と中間特徴量から適応変調マップを導出するエッジ誘導型アテンション機構を用いて対処し, それらを正規化および再重み付けに応用し, 微妙なテクスチャを抑えつつ, 構造的に健全な領域を選択的に増幅する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:31:24 GMT)
RationAnomaly: Log Anomaly Detection with Rationality via Chain-of-Thought and Reinforcement Learning [27.2] RationAnomalyは、Chain-of-Thoughtファインチューニングと強化学習を相乗化することにより、ログの異常検出を強化する新しいフレームワークである。
コードとデータセットを含む、対応するリソースをリリースしました。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:35:58 GMT)
Temporal Reasoning with Large Language Models Augmented by Evolving Knowledge Graphs [27.2] 大規模な言語モデルは、多くの言語理解タスクにおいて優れているが、進化する知識よりも推論に苦労する。
EvoReasonerは,グローバルな局所的なエンティティグラウンド,複数ルートの分解,時間的グラウンドのスコアリングを行う,時間的認識型マルチホップ推論アルゴリズムである。
我々は、時間的QAベンチマークと、KGを生文書から動的に更新する新しいエンドツーエンド設定に対するアプローチを評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:24:55 GMT)
StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant [27.2] オフラインビデオLLMをストリーミング対応モデルにシームレスに変換するフレームワークであるStreamBridgeを紹介します。
既存のモデルをオンラインシナリオに適応する上での根本的な課題は,(1)マルチターンリアルタイム理解能力の制限,(2)プロアクティブ応答機構の欠如である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:56:09 GMT)
MAVL: A Multilingual Audio-Video Lyrics Dataset for Animated Song Translation [26.8] 歌声翻訳のためのマルチリンガル・マルチモーダル・ベンチマークであるMAVL(Multilingual Audio-Video Lyrics Benchmark for Animated Song Translation)を紹介する。
本稿では,Syllable-Constrained Audio-Video LLM with Chain-of-Thought SylAVL-CoTを提案する。
実験結果から,SylAVL-CoTはテキストベースモデルよりも歌声性や文脈精度が優れていた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:19:20 GMT)
Learning to Retrieve for Environmental Knowledge Discovery: An Augmentation-Adaptive Self-Supervised Learning Framework [25.3] 本稿では、対象生態系のモデリングを強化するために、関連する観測サンプルを検索するAugmentation-Adaptive Self-Supervised Learning (A$2$SL)フレームワークを提案する。
これらの学習された類似性は、ターゲットシナリオを異なる場所や時間から関連するデータで補完する検索メカニズムを駆動する。
実世界の湖沼における水温と溶存酸素動態のモデル化におけるA$2$SLの評価を行った。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:51:53 GMT)
MedFact-R1: Towards Factual Medical Reasoning via Pseudo-Label Augmentation [25.2] MEDFACT-R1は、外部知識基盤と強化学習を統合した2段階のフレームワークである。
従来の最先端手法に比べて22.5%の精度で絶対的な改善が達成されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:59:59 GMT)
ReservoirTTA: Prolonged Test-time Adaptation for Evolving and Recurring Domains [25.1] ReservoirTTAは、長期間のテスト時間適応のために設計された新しいプラグインフレームワークである。
中心となるReservoirTTAはドメイン特化モデルの貯水池を維持している。
理論的解析により,パラメータの分散を束縛し,モデル崩壊を防ぐ重要な要素が明らかになった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:15:08 GMT)
Tomography of entangling two-qubit logic operations in exchange-coupled donor electron spin qubits [24.6] 量子プロセッサは高忠実な普遍量子論理演算を必要とする。
ドナー結合電子スピン間の絡み合いは今のところ証明されていない。
これらの結果は、ドナーベースの量子コンピュータのスケールアップに必要な基盤となる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:22:49 GMT)
Mitigating data replication in text-to-audio generative diffusion models through anti-memorization guidance [24.4] 反記憶誘導(Anti-memorization Guidance、AMG)は、事前学習した拡散モデルのサンプリングプロセスを変更して記憶を阻害する手法である。
そこで本研究では,AMG内の3種類のガイダンスについて検討し,それぞれが生成品質を保ちながら複製を減少させるように設計された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:14:25 GMT)
SWE-Effi: Re-Evaluating Software AI Agent System Effectiveness Under Resource Constraints [24.3] ソフトウェアエンジニアリングのリーダーボードのための既存のAIは、ソリューションの正確性にのみフォーカスする。
SWE-Effiは、総合的な有効性スコアの観点からAIシステムを再評価する、新しいメトリクスのセットである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:31:55 GMT)
Value-Guided KV Compression for LLMs via Approximated CUR Decomposition [24.3] CurDKVは、CUR行列分解から計算したレバレッジスコアに基づいてキーと値を選択する、新しい、値中心のKV圧縮手法である。
我々のアプローチは、注意出力$softmax(QKT)V$の支配的部分空間を近似し、保持されたトークンがモデルの予測挙動を最善に維持することを保証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:04:06 GMT)
ATLANTIS: AI-driven Threat Localization, Analysis, and Triage Intelligence System [24.2] ATLANTISは、チームアトランタが開発したサイバー推論システムで、DARPAのAIサイバーチャレンジ(AIxCC)の最終コンペで1位を獲得した。
ATLANTISの背後にある設計哲学、アーキテクチャ決定、実装戦略について詳述する。
プログラム分析が現代のAIに合うとき、自動セキュリティの境界を押して学んだ教訓を共有します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:46:18 GMT)
Do Code Semantics Help? A Comprehensive Study on Execution Trace-Based Information for Code Large Language Models [24.1] コードLLMの教師付き微調整(SFT)と位相後推論におけるトレースベースセマンティック情報の有用性について検討する。
実験結果は従来の研究と驚くほど異なっており、意味情報がコードLLMのSFTおよびテスト時間スケーリングに限られた有用性を持っていることを実証している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:44:09 GMT)
CodeFuse-CR-Bench: A Comprehensiveness-aware Benchmark for End-to-End Code Review Evaluation in Python Projects [24.0] CodeFuse-CR-Benchは、リポジトリレベルのCR評価のための、最初の包括性対応ベンチマークである。
CodeFuse-CR-Benchは、9つのプルリクエスト(PR)問題ドメインをカバーする70のPythonプロジェクトから601の高品質なインスタンスで構成されている。
本稿では,この包括的CR課題に対して,最先端の大規模言語モデル(LLM)の大規模評価を行う。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:24:09 GMT)
(SP)$^2$-Net: A Neural Spatial Spectrum Method for DOA Estimation [23.9] 我々は、測定値と仮説角を入力として取り込むディープニューラルネットワークを訓練し、より広い配列の能力と整合したスコアを出力することを学ぶ。
推定時、任意の角度の集合を走査することでヒートマップを生成することができる。
本稿では,Bartlettビームフォーマとスポーサリティに基づくDOA推定法に対して,トレーニングモデルである (SP)$2$-Net の利点を実証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:40:28 GMT)
Adaptive and Iterative Point Cloud Denoising with Score-Based Diffusion Model [23.8] 本稿では,スコアベース拡散モデルに基づく適応的かつ反復的な点雲復調法を提案する。
最先端のポイント・クラウド・デノナイズ手法と比較して,本手法はクリーンでスムーズなポイント・クラウドを得る。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:46:08 GMT)
Predicting Language Models' Success at Zero-Shot Probabilistic Prediction [23.8] 個人レベルの特徴を生成するためのゼロショットモデルとして,大規模言語モデル(LLM)の能力について検討する。
LLMのパフォーマンスは、同じデータセット内のタスクと異なるデータセットの両方で非常に可変であることがわかった。
タスクレベルでのLLMのパフォーマンスを予測するためのメトリクスを構築し、LLMがうまく機能する可能性のあるタスクと、それらが適さない可能性のあるタスクを区別することを目的としている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:57:05 GMT)
SMARTER: A Data-efficient Framework to Improve Toxicity Detection with Explanation via Self-augmenting Large Language Models [23.6] 有害コンテンツはソーシャルメディアプラットフォームに広まりつつある。
本稿では、説明可能なコンテンツモデレーションのためのフレームワークSMARTERを紹介する。
当社のフレームワークは、低リソース設定のためのスケーラブルな戦略を提供します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:30:36 GMT)
Fast and Fluent Diffusion Language Models via Convolutional Decoding and Rejective Fine-tuning [23.6] Autoregressive (AR)言語モデルでは、テキストを1つずつ生成することで、推論速度が制限される。
本稿では,デコードウインドウを狭める正規化法であるConal decoding (Conv)を提案する。
Rejecting Rule-based Fine-Tuning (R2FT)も導入しています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:48:21 GMT)
DAG: A Dual Causal Network for Time Series Forecasting with Exogenous Variables [22.4] 時系列予測は、経済学、トラフィック、AIOpsなど、さまざまな分野において重要である。
本稿では,2つの因果ネットワークを時間次元とチャネル次元の両方に沿って利用する汎用フレームワークDAGを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:14:10 GMT)
Learning in Stackelberg Mean Field Games: A Non-Asymptotic Analysis [22.4] Stackelberg平均フィールドゲーム(MFG)におけるポリシー最適化について検討する。
本稿では,連続的に生成するマルコフサンプルを利用するシングルループアクター批判アルゴリズムAC-SMFGを提案する。
アルゴリズムの有限時間および有限サンプル収束をスタックルバーグ目標の定常点に確立する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:58:31 GMT)
Fairness-in-the-Workflow: How Machine Learning Practitioners at Big Tech Companies Approach Fairness in Recommender Systems [21.7] 大手テクノロジー企業におけるRS実践者のワークフローをマップします。
既存のRSに公平さを取り入れる上で重要な課題を特定する。
私たちはRSコミュニティに対して実行可能なレコメンデーションを提供します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:37:12 GMT)
NFL-BA: Near-Field Light Bundle Adjustment for SLAM in Dynamic Lighting [20.2] 本稿では, 近接場照明をバンドル調整損失の一部として明示的にモデル化した, 近場照明バンドル調整損失(NFL-BA)について紹介する。
NFL-BAは暗黙的または明示的なシーン表現を持つニューラルネットワークベースのSLAMシステムに統合することができる。
本評価は,SLAMが自律ナビゲーション,非監視領域への誘導,盲点検出,3次元可視化を可能にする内視鏡的手順に重点を置いている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:33:03 GMT)
OnlineMate: An LLM-Based Multi-Agent Companion System for Cognitive Support in Online Learning [20.1] 大規模言語モデル(LLM)によって駆動されるマルチエージェント学習支援システムである OnlineMate を提案する。
OnlineMateは、ピアライクなエージェントの役割をシミュレートし、協調的な議論中に学習者の認知状態に適応し、誤解、混乱、モチベーションなどの心理的状態を推測する。
シミュレーション学習シナリオにおける実験結果から,オンライン学習環境における認知的エンゲージメントを高めつつ,オンライン学習と議論を効果的に促進することが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:56:45 GMT)
TriSPrompt: A Hierarchical Soft Prompt Model for Multimodal Rumor Detection with Incomplete Modalities [19.9] 提案する階層型ソフトプロンプトモデルtextsfTriSPromptは,3種類のプロンプト,すなわち,emphmodality-aware(MA)プロンプト,emphmodality-missing(MM)プロンプト,emphmutual-views(MV)プロンプトを統合する。
textsfTriSPromptは最先端の手法に比べて精度が13%以上向上している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:46:51 GMT)
Quantifying Self-Awareness of Knowledge in Large Language Models [19.9] 大きな言語モデルにおける幻覚予測は、しばしば自己認識の兆候として解釈される。
このようなパフォーマンスは、真のモデル側イントロスペクションではなく、質問側ショートカットから生じる可能性がある、と我々は主張する。
モデル側信号の利用を促進させるSCAOを導入する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:29:14 GMT)
MedVAL: Toward Expert-Level Medical Text Validation with Language Models [19.9] LM生成医療用テキストの精度と安全性を即時評価する必要がある。
現在、このような評価は手作業による医師の診察にのみ依存している。
本稿では, 合成データを利用して評価者を訓練する新しい, 自己監督型, 効率的な蒸留法であるMedVALを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:11:49 GMT)
Quantifying Uncertainty in Natural Language Explanations of Large Language Models for Question Answering [19.9] 大規模言語モデル(LLM)は、質問応答タスクにおいて簡潔でコンテキスト対応の回答を可能にする強力な能力を示している。
本稿では、これらの生成した自然言語説明のための新しい不確実性推定フレームワークを提案する。
また、ノイズ下においても確実な不確実性を保証する新しい確実性推定法を設計する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:29:48 GMT)
Evaluating Multimodal Large Language Models on Spoken Sarcasm Understanding [19.6] サーカスムの検出は、自然言語理解において依然として課題である。
我々は,大言語モデル(LLM)と多モーダルLLMを,英語と中国語の皮肉検出のために体系的に評価した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:44:27 GMT)
From Ground Trust to Truth: Disparities in Offensive Language Judgments on Contemporary Korean Political Discourse [19.4] 本研究は、現代政治談話の大規模なデータセットを構築し、真理を欠いた3つの洗練された判断を用いた。
我々は,各判断の異なるパターンを特定し,離脱戦略を用いてラベル合意の傾向を示した。
これは、本質的な制約のある現実世界の設定に適用可能なアプローチを示唆している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:57:18 GMT)
Silenced voices: social media polarization and women's marginalization in peacebuilding during the Northern Ethiopia War [19.4] 本研究では,ソーシャルメディア,分極,対立の複雑な関係について検討する。
これは、北エチオピア戦争を事例研究として、デジタル平和構築と女性の参加に焦点を当てている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:56:17 GMT)
Statistical Methods in Generative AI [19.4] 生成的人工知能は重要な技術として登場し、多くの分野で変革を約束している。
デフォルトでは、生成AI技術には、正確性、安全性、公正性、その他の特性に関する保証がない。
統計的手法は、生成AI技術の信頼性を改善するための有望なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:33:20 GMT)
Reconstruction of Differentially Private Text Sanitization via Large Language Models [18.8] 大規模言語モデル(LLM)は、DP対応のプロンプトから変更/削除されたプライバシを再構築することができる。
LLMのアクセシビリティに基づいた2つの攻撃(ブラックボックスとホワイトボックス)を提案する。
本研究は、これらの有名なLCMが、既存のDPテキストサニタイズアプローチの新たなセキュリティリスクとして出現したことを示唆している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:14:05 GMT)
OpenViGA: Video Generation for Automotive Driving Scenes by Streamlining and Fine-Tuning Open Source Models with Public Data [18.7] 自動車運転シーンのためのオープンビデオ生成システムOpenViGAを提案する。
4fpsの256x256の画像サイズでは、1フレームのアルゴリズムによるレイテンシで、現実的なドライビングシーンビデオをフレーム単位で予測することが可能です。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:54:13 GMT)
Controllable Localized Face Anonymization Via Diffusion Inpainting [18.7] そこで本研究では,遅延拡散モデルの塗装能力を活用して,現実的な匿名化画像を生成する統一フレームワークを提案する。
従来の手法とは異なり、アダプティブ属性誘導モジュールを設計することで、匿名化プロセスを完全に制御できる。
当社のフレームワークはローカライズされた匿名化もサポートしており、ユーザーはどの顔領域が変更されていないかを指定できる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:33:47 GMT)
Birds look like cars: Adversarial analysis of intrinsically interpretable deep learning [18.7] 設計による「本質的に」解釈可能なモデルの敵の操作に対する過度信頼と感受性に関連するリスクを強調した。
潜伏プロトタイプの使用によってモデルの推論を養うことは、ディープニューラルネットワークの本質的非解釈可能性を示す。
パートプロトタイプネットワークの制限が報告されたことにより、信頼性と適用性が疑問視され、(深い)解釈可能なモデルの堅牢性と整合性に関するさらなる研究が動機となった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:58:35 GMT)
FMGS-Avatar: Mesh-Guided 2D Gaussian Splatting with Foundation Model Priors for 3D Monocular Avatar Reconstruction [18.6] 2Dプリミティブをテンプレートメッシュ面に直接アタッチして位置、回転、動きを制限したメッシュガイド2Dガウススプラッティングを導入する。
Sapiensのような大規模データセットでトレーニングされた基礎モデルを活用して、モノクロビデオからの限られた視覚的手がかりを補完します。
実験により, 従来の手法に比べて再現性は優れており, 幾何的精度と外観忠実度は顕著に向上した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:41:41 GMT)
CUFG: Curriculum Unlearning Guided by the Forgetting Gradient [18.6] CUFG(Curriculum Unlearning via Forgetting Gradients)は、近似的アンラーニングの安定性を高める新しいフレームワークである。
CUFGは、微調整に基づく未学習のための勾配を忘れることによってガイドされる新しい勾配補正器を統合する。
カリキュラムアンラーニングの概念には、かなりの研究の可能性を秘めていると信じている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:22:47 GMT)
Semantic Representation Attack against Aligned Large Language Models [18.1] 大きな言語モデル(LLM)は、有害な出力を防ぐためにアライメント技術を採用する傾向にある。
現在の手法は通常、限定収束、不自然なプロンプト、高い計算コストに苦しむ正確な肯定応答を目標としている。
本稿では,LLMに対する敵対的目的を根本的に再認識する新しいパラダイムであるSemantic Representation Attackを紹介する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:06:46 GMT)
Trade-offs in Cross-Domain Generalization of Foundation Model Fine-Tuned for Biometric Applications [18.1] CLIPのようなファンデーションモデルは、多様な視覚タスクにまたがる例外的なゼロショットと少数ショットの転送機能を示している。
しかし、高度に専門化された生体認証タスク、顔認識(FR)、モーフィングアタック検出(MAD)、プレゼンテーションアタック検出(PAD)は、過剰な特殊化に悩まされる可能性がある。
FR,MAD,PADに微調整されたCLIPの3つの事例を評価することで,これらのトレードオフを体系的に定量化する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:58:18 GMT)
GenKOL: Modular Generative AI Framework For Scalable Virtual KOL Generation [18.0] GenKOLは、マーケティング専門家が生成AIを使用して高品質な仮想KOLイメージを効率的に生成できるようにするインタラクティブシステムである。
ユーザは、複数のAI機能を統合する直感的なインターフェースを通じて、プロモーションビジュアルを動的に作成できる。
当社のシステムは,ブランドコンテンツの生産を著しく効率化し,コストを低減し,スケーラブルな仮想KOL作成を加速することができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:07:05 GMT)
M4Diffuser: Multi-View Diffusion Policy with Manipulability-Aware Control for Robust Mobile Manipulation [18.0] M4Diffuserは、マルチビュー拡散ポリシーとモバイル操作のための新しいReduceed and Manipulability-aware QPコントローラを統合するハイブリッドフレームワークである。
提案手法は,スムーズな全身協調のための堅牢な性能と,目に見えないタスクへの強力な一般化を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:09:53 GMT)
Empathy-R1: A Chain-of-Empathy and Reinforcement Learning Framework for Long-Form Mental Health Support [18.0] 強化学習(Reinforcement Learning, RL)とCoE(Chain-of-Empathy)推論プロセスを統合する新しいフレームワークであるEmpathy-R1を紹介する。
認知行動療法にインスパイアされた私たちのCoEパラダイムは、ヘルプ・シーカーの感情、原因、意図を逐次推論するためにモデルをガイドします。
我々のフレームワークは、新しい大規模な中国のデータセット、共感-QA、および2段階のトレーニングプロセスによって強化されています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:16:09 GMT)
SERVAL: Surprisingly Effective Zero-Shot Visual Document Retrieval Powered by Large Vision and Language Models [17.9] Visual Document Retrieval (VDR) は通常、文書イメージを直接埋め込むために訓練された特殊なバイエンコーダを使用してテキストから画像の検索を行う。
我々はゼロショット生成・符号化パイプラインを再考し、まず視覚言語モデルを用いて各文書画像の詳細なテキスト記述を生成する。
ViDoRe-v2ベンチマークでは、63.4%のnDCG@5に達し、マルチベクトルビジュアルドキュメントエンコーダで最強である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:11:13 GMT)
SALT4Decompile: Inferring Source-level Abstract Logic Tree for LLM-Based Binary Decompilation [17.6] Saltmはバイナリとソースコードの間の安定した論理的特徴を抽象化する新しいバイナリ逆コンパイル法である。
Saltmはソースコードのロジックを回復するのに非常に効果的で、最先端のメソッドよりもはるかに優れている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:57:15 GMT)
UMA-Split: unimodal aggregation for both English and Mandarin non-autoregressive speech recognition [17.4] 本稿では,英語とマンダリンの音声認識のための一元的アグリゲーション(UMA)に基づく非自己回帰モデルを提案する。
オリジナルのUMAは、同じテキストトークンの音響フレーム(最初は単調に増加し、その後減少する)を明示的に分割して集約し、通常の接続性時間分類よりも優れた表現を学習する。
1つの音節が複数のきめ細かいトークンにトークン化される、あるいはトークンが3つの音響フレーム未満に分散し、単調な重みを形成するのに失敗する、といった他の言語と競合する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:20:39 GMT)
SynParaSpeech: Automated Synthesis of Paralinguistic Datasets for Speech Generation and Understanding [17.4] 笑いやため息のようなパラ言語的な音は、より現実的で魅力的なスピーチを合成するのに不可欠である。
大規模パラ言語データを生成するための自動フレームワークを提案し,それをSynParaSpeechデータセットの構築に適用する。
データセットは6つのパラ言語カテゴリーで構成され、118.75時間のデータと正確なタイムスタンプは、いずれも自然な会話音声に由来する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:32:27 GMT)
PRISM: Product Retrieval In Shopping Carts using Hybrid Matching [17.4] 小売店舗における商品検索のためのハイブリッド手法であるPRISMを提案する。
PRISMは視覚言語モデルベースとピクセルワイドマッチングアプローチを使用する。
提案するPRISMは,最先端画像検索手法を4.21%上回っている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:15:37 GMT)
WorldForge: Unlocking Emergent 3D/4D Generation in Video Diffusion Model via Training-Free Guidance [17.3] 近年の映像拡散モデルでは, 空間知能タスクの潜在的な可能性を示す。
3つの密結合モジュールからなるトレーニング不要な推論時間フレームワークであるWorldForgeを提案する。
本研究は,空間的知性に先立って生成的先行性を活用するための新たな視点を提供する,制御可能なビデオ合成のための新しいプラグイン・アンド・プレイパラダイムを導入する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:40:47 GMT)
Understanding the Thinking Process of Reasoning Models: A Perspective from Schoenfeld's Episode Theory [17.2] 本稿では,Schoenfeld のエピソード理論を応用して,大規模推論モデルの推論トレースを分析する手法を提案する。
我々は,7つの認知ラベルを用いて,モデル生成解から数学問題への数千の文と段落を注釈付けした。
予備分析では,認知状態間の遷移ダイナミクスなど,LRM推論の異なるパターンが明らかになった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:42:41 GMT)
Debias your Large Multi-Modal Model at Test-Time via Non-Contrastive Visual Attribute Steering [17.2] 大規模マルチモーダルモデル(LMM)のための学習自由脱バイアスフレームワークを提案する。
我々のフレームワークは、保護された属性に対する参照を減らすステアリングベクトルを構築することによって、テキスト生成中のモデルの表現に介入する。
実験の結果,これらの介入は,感情や流布を維持しつつ,保護属性に関連するテキストを生成するLMMの妥当性を効果的に低下させることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:58:56 GMT)
MedFuncta: A Unified Framework for Learning Efficient Medical Neural Fields [17.2] 各種医療信号の大規模NFトレーニングのための統合フレームワークであるMedFunctaを紹介する。
我々のアプローチはデータを統一表現、すなわち1D潜在ベクトルにエンコードし、共有されたメタ学習NFを変調する。
私たちはコード、モデルウェイト、およびマルチインスタンス医療NFのための500k以上の潜伏ベクトルを含む最初の大規模データセットMedNFをリリースしました。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:43:28 GMT)
FURINA: Free from Unmergeable Router via LINear Aggregation of mixed experts [17.1] パラメータ効率の良い微調整のために,Mixture of Experts (MoE) をローランド適応 (LoRA) に統合することに成功している。
既存のMoE-LoRA手法の鍵となる制限は、離散ルータに依存することである。
我々は,LINear Aggregation of expertsに基づく,フリー・アグリゲーション・オブ・アンマージブル・ルータ・フレームワークであるFURINAを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:22:32 GMT)
Sea-ing Through Scattered Rays: Revisiting the Image Formation Model for Realistic Underwater Image Generation [17.0] 本稿では、一般的に省略される前方散乱項を含む改良された合成データ生成パイプラインを提案する。
また、制御された濁度条件下でBUCKETデータセットを収集し、対応する基準画像を用いて実際の濁度映像を取得する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:42:24 GMT)
Probing the Representational Power of Sparse Autoencoders in Vision Models [16.8] スパースオートエンコーダ(SAE)は,大規模言語モデル(LLM)の隠蔽状態を解釈するための一般的なツールとして登場した。
言語モデルに人気があるにもかかわらず、SAEは依然として視覚領域で研究されている。
我々は、幅広い画像ベースタスクを用いて、視覚モデルに対するSAEの表現力を広範囲に評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:45:16 GMT)
Diffusion-Based Scenario Tree Generation for Multivariate Time Series Prediction and Multistage Stochastic Optimization [16.8] Diffusion Scenario Tree (DST) は多変量予測タスクのためのシナリオツリーを構築するための一般的なフレームワークである。
ニューヨーク州の日頭電力市場におけるエネルギー仲裁の最適化に関する枠組みを評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:49:05 GMT)
Towards Privacy-Preserving and Heterogeneity-aware Split Federated Learning via Probabilistic Masking [16.8] スプリット・フェデレート・ラーニング(SFL)は、従来のフェデレート・ラーニング(FL)に代わる効果的な代替手段として登場した。
本稿では,確率的マスクトレーニングを取り入れたスケーラブルかつプライバシ保護型SFLフレームワークPM-SFLを提案する。
画像および無線センシングタスクの実験は、PM-SFLが一貫して精度、通信効率、プライバシー攻撃を改善することを示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:28:08 GMT)
Let's Grow an Unbiased Community: Guiding the Fairness of Graphs via New Links [16.7] グラフニューラルネットワーク(GNN)は、さまざまなアプリケーションで大きな成功を収めています。
元のユーザグラフ構造は一般にバイアスを受けているが、新しいリンクを導入することで、これらの既存の構造をバイアスのないものへと導くことを約束している。
フェアネス誘導グラフ上で訓練された下流タスクの公平性を保証するための,FairGuideという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:15:50 GMT)
AnoF-Diff: One-Step Diffusion-Based Anomaly Detection for Forceful Tool Use [16.7] 本稿では, 時系列データから力トルク特徴を抽出し, 異常検出に力トルク特徴を用いる拡散モデルに基づくAnoF-Diffを提案する。
我々は,F1スコアとAUROC(Area Under the Receiver Operating Characteristics curve)を4つのツール・タスクで比較した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:58:00 GMT)
Mind the Gap: A Closer Look at Tokenization for Multiple-Choice Question Answering with LLMs [16.4] 植民地の後に空間をトークン化する方法には合意がないが、しばしば自明な選択として見過ごされる。
驚いたことに、私たちは1つの特定の戦略 -- 回答のレターとともにスペースをトークン化する -- を推奨できます。
本研究は、注意深い評価設計の重要性を強調し、標準化された透明な評価プロトコルの必要性を強調した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:47:58 GMT)
SPICE: An Automated SWE-Bench Labeling Pipeline for Issue Clarity, Test Coverage, and Effort Estimation [16.1] SWEベンチスタイルのデータセットをラベル付けするためのスケーラブルで自動化されたパイプラインであるSPICEを紹介する。
SPICEは、コンテキスト対応のコードナビゲーション、合理化によるプロンプト、マルチパスコンセンサスを組み合わせて、専門家のアノテーションに近似したラベルを生成する。
SPICEツールとSPICE Benchは、SWE-Gymの291のオープンソースプロジェクトから収集された6,802のSPICEラベル付きインスタンスのデータセットです。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:44:18 GMT)
Survivability of Backdoor Attacks on Unconstrained Face Recognition Systems [16.0] 本稿では,顔認識システムを対象としたバックドア攻撃の包括的システムレベル解析について述べる。
20のパイプライン構成と15の攻撃シナリオを分析して、単一のバックドアが顔認識システム全体を損なう可能性があることを明らかにする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:06:37 GMT)
Brought a Gun to a Knife Fight: Modern VFM Baselines Outgun Specialized Detectors on In-the-Wild AI Image Detection [15.9] 現代ビジョン基礎モデル(VFM)における単純な線形分類器を提案する。
同一データに基づいてトレーニングされたこのベースラインは、Wild内の精度を20%以上のマージンで決定的に向上させる。
我々は、このアライメントと全体的な精度の両方が、VFMの事前訓練されたカットオフ日後にスクラップされた新しいデータセットに急降下するため、データ露出によるものであると推測する。
1)AI生成画像検出の現実世界での銃撃戦では、更新されたVFMの生火力の方がはるかに効果的である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:30:49 GMT)
Beyond Community Notes: A Framework for Understanding and Building Crowdsourced Context Systems [15.9] ソーシャルメディアプラットフォームは、記事とともにクラウドソースされたコンテキストを表示する機能の開発が増えている。
これらのシステムは、トップダウンのファクトチェックに代わるものとして、主要なプラットフォームが採用するにつれて、私たちの情報エコシステムを再構築する可能性がある。
本フレームワークは理論的,設計的,倫理的視点を統合し,クラウドソーシング・コンテクストシステムに関する将来の人間中心研究の基盤を確立する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:17:18 GMT)
Language Modeling with Learned Meta-Tokens [15.9] この研究は、メタトークンを使った新しいアプローチ、事前トレーニング中に注入された特別なトークン、およびこれらのトークンを使用するためのLMをガイドする専用のメタアテンションメカニズムを導入している。
メタトークンを利用した100B未満のトークンで事前学習したデータ効率の言語モデルは、微調整後、これらのタスクに対して高い性能を実現する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:38:48 GMT)
Security and Privacy Measurement on Chinese Consumer IoT Traffic based on Device Lifecycle [15.4] 本研究は,中国における消費者向けIoTデバイストラフィックに関する最初の大規模データセットを構築した。
38のブランドと12のデバイスカテゴリにまたがる77のデバイスからのトラフィックを集めています。
他の地域と比較すると、中国の消費者向けIoTデバイスは国内サービスに依存している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:29:19 GMT)
Partial Column Generation with Graph Neural Networks for Team Formation and Routing [15.4] 複数の価格問題のある設定のための新しい部分列生成戦略を提案する。
チーム形成とルーティングの問題に適した機械学習モデルを開発する。
実験により,本手法の適用により解法が向上し,従来の部分列生成手法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:19:22 GMT)
IEFS-GMB: Gradient Memory Bank-Guided Feature Selection Based on Information Entropy for EEG Classification of Neurological Disorders [15.4] グラディエントメモリバンクで案内される情報エントロピーに基づく特徴選択手法であるIEFS-GMBを提案する。
IEFS-GMBで拡張されたエンコーダは,ベースラインモデルよりも0.64%から6.45%の精度向上を実現している。
また、4つの競合するFS技術より優れ、モデルの解釈性が向上し、臨床現場での実用性も向上する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:14:17 GMT)
Unsupervised Concept Vector Extraction for Bias Control in LLMs [14.8] 大規模言語モデル(LLM)は、ステレオタイプを永続し、バイアスを示すことが知られている。
表現工学を応用して「ジェンダー」の概念がLLM内でどのように表現されるかを研究する。
モデル予測の高精度なステアリングを可能にするプロジェクションベース手法を開発した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:59:48 GMT)
What Matters in LLM-Based Feature Extractor for Recommender? A Systematic Analysis of Prompts, Models, and Adaptation [14.8] LLM-as-feature-extractorパイプラインを4つのモジュールに分解するモジュールフレームワークであるRecXploreを提案する。
新しいテクニックを提案する代わりに、RecXploreは確立したメソッドを再検討し、整理し、各モジュールを分離して体系的な探索を可能にする。
実験の結果、既存の技術から得られる最良の設計を組み合わせるだけで、NDCG@5が18.7%、HR@5が12.7%向上することがわかった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:08:45 GMT)
Cloud-Edge Collaborative Data Anomaly Detection in Industrial Sensor Networks [14.8] 本稿では,産業用センサネットワークにおけるクラウド・エッジ協調データ異常検出手法を提案する。
それは、個々のエッジにデプロイされたセンサーデータ検出モデルと、クラウドにデプロイされたセンサーデータ分析モデルで構成される。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:21:26 GMT)
Llama-Mimi: Speech Language Models with Interleaved Semantic and Acoustic Tokens [14.7] Llama-Mimiは、統一トークン化器と単一トランスフォーマーデコーダを使用する言語モデルである。
総合評価は,Llama-Mimiが音の整合性において最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:00:07 GMT)
Pluralistic Alignment for Healthcare: A Role-Driven Framework [14.6] 多様な視点と価値をシミュレートするために,まず軽量で一般化可能な多元的アライメントアプローチ EthosAgents を提案する。
実験により、7つの異なる大きさのオープンおよびクローズドモデルにまたがる3つのモードの多元的アライメントが進行することを示す。
以上の結果から,健康関連多元主義は適応的かつ規範的アプローチを要求され,これらのモデルが他のハイテイク領域の多様性をいかに尊重するかについての洞察を提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:57:40 GMT)
Linguistic Generalizations are not Rules: Impacts on Evaluation of LMs [13.7] LMがいかにうまく一般化するかの言語学的評価は、自然言語は象徴的な規則によって生成されるという当然の事である。
ここでは、LMが象徴的なルールに従わなかったことはバグではなく機能かもしれないことを示唆する。
新しい発話は、柔軟性、相互関連性、文脈に依存した構成の組み合わせによって生成され、理解される。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:12:24 GMT)
Listening, Imagining \& Refining: A Heuristic Optimized ASR Correction Framework with LLMs [13.3] LIR-ASR は "Listening-Imagining-Refining" 戦略を適用し、音素の変種を生成し、文脈でそれらを精製する。
英語と中国語の両方のASR出力の実験では、LIR-ASR平均は最大1.5ポイントのCER/WERの減少を達成している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:50:54 GMT)
CbLDM: A Diffusion Model for recovering nanostructure from pair distribution function [13.2] 本稿では,ナノ構造を復元するためにPDFを使用するという課題に焦点をあてる。
条件ベース遅延拡散モデルである深層学習モデルCbLDMを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:26:28 GMT)
From Turn-Taking to Synchronous Dialogue: A Survey of Full-Duplex Spoken Language Models [12.7] フルデュープレックス音声通信は、自然なターンテイク、重複する音声、中断と同時聴取と会話を可能にする。
本調査はFD-SLM(Full-Duplex Spoken Language Models)を包括的にレビューする。
同期データの不足、アーキテクチャのばらつき、評価ギャップなど、基本的な課題を特定します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:00:58 GMT)
HybridMamba: A Dual-domain Mamba for 3D Medical Image Segmentation [12.6] Mambaは、CNN固有の長距離依存関係をモデリングする際の制限に対処する上で、優れたパフォーマンスを示している。
二重補完機構を用いたアーキテクチャであるHybridMambaを提案する。
MRIおよびCTデータセットの実験により、HybridMambaは3次元医用画像のセグメンテーションにおいて最先端の手法を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:32:49 GMT)
Gender and Political Bias in Large Language Models: A Demonstration Platform [12.2] ParlAI Voteは欧州議会で議論や投票を行うための対話的なシステムである。
性別、年齢、国、政治的グループなどの人口統計が豊富である。
ユーザーは討論を閲覧したり、リンクされたスピーチを検査したり、実際の投票結果とフロンティアのLSMの予測を比較することができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:34:33 GMT)
An Evaluation-Centric Paradigm for Scientific Visualization Agents [12.0] 本稿では,SciVisエージェントに必要な各種評価方法について検討する。
我々は、SciVisエージェント評価ベンチマークを開発するためのより広範なコラボレーションを提唱する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:08:23 GMT)
Transplant-Ready? Evaluating AI Lung Segmentation Models in Candidates with Severe Lung Disease [11.9] 本研究は, 移植既往の患者において, 利用可能な深層学習に基づく肺セグメンテーションモデルについて検討した。
Unet-R231は評価されたモデルの中で最も正確な自動肺セグメンテーションを提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:42:43 GMT)
No Modality Left Behind: Adapting to Missing Modalities via Knowledge Distillation for Brain Tumor Segmentation [11.8] AdaMMは、欠落したモダリティシナリオに適したマルチモーダル脳腫瘍セグメンテーションフレームワークである。
AdaMMは既存の手法を一貫して上回り、セグメンテーション精度とロバスト性に優れる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:47:20 GMT)
Set Phasers to Stun: Beaming Power and Control to Mobile Robots with Laser Light [11.6] 本稿では、狭ビームレーザー光を移動ロボットに誘導し、同時に無線による電力供給と通信を行うシステムであるPhaserを提案する。
高出力ビームステアリングによる立体視に基づく3次元ロボットトラッキングの融合を実現するための半自動キャリブレーション手法を設計する。
Phaserは110 mW/cm$2$以上の光パワー密度とエラーのないデータをマルチメートル範囲の移動ロボットに供給する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:34:13 GMT)
What's the Best Way to Retrieve Slides? A Comparative Study of Multimodal, Caption-Based, and Hybrid Retrieval Techniques [11.4] テキスト、画像、チャートを組み合わせたマルチモダリティは、検索強化生成システムの課題を提示する。
本論文では,ColPaliのような視覚的遅延相互作用埋め込みモデル,視覚的リランカの利用,密集検索とBM25を組み合わせたハイブリッド検索など,効果的なスライド検索手法について検討する。
ビジョンランゲージモデルに基づく新しいキャプションパイプラインも評価され、視覚的遅延動作技術と比較して埋め込みストレージの要求が大幅に低減された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:57:07 GMT)
What Gets Measured Gets Managed: Mitigating Supply Chain Attacks with a Link Integrity Management System [11.4] LiMSは、最小限のオーバーヘッドでWebブラウジングセッションにおけるリンク整合性の保証をブートストラップする透過的なシステムである。
総合的な整合性ポリシーの構成要素として基本的な整合性ポリシーがどのように機能するかを論じる。
450ドメインの代表サンプルのデプロイをシミュレートして,オープンソースプロトタイプの評価を行った。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:33:24 GMT)
Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale [11.2] VLA(Vision-Language-Action Model)は、専門的なアーキテクチャと専門家ポリシーのタスクに適したコンポーネントを、大規模なデータ収集とセットアップ固有の微調整に置き換える。
従来のロボットソフトウェアフレームワークはボトルネックとなり、ロボットシミュレーションは、実世界の実験への移行を限定的にサポートする。
我々は、大規模なジェネラリストポリシーによるロボット学習の研究を支援するために、ゼロから設計されたリーンエコシステムであるRobot Control Stack (RCS)を紹介した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:12:16 GMT)
Quantum steering and discord in hyperon-antihyperon system in electron-positron annihilation [11.1] 電子-陽電子消滅で生成するハイパーオン-反ハイペロン系において、量子ステアリングと不協和という2種類の量子相関を解析する。
これらの量子相関の挙動は、偏光効果によりトップクォークやタウレプトンのような素粒子-反粒子系のものと異なる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:22:34 GMT)
FCPE: A Fast Context-based Pitch Estimation Model [10.8] 本稿では,低計算コストと頑健な耐雑音性を維持しつつ,メルスペクトルの特徴を捉える高速な文脈ベースピッチ推定モデルを提案する。
実験の結果,MIR-1Kデータセット上で96.79%のRAW Pitch Accuracy(RPA)が達成された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:50:09 GMT)
Beyond Spurious Signals: Debiasing Multimodal Large Language Models via Counterfactual Inference and Adaptive Expert Routing [10.7] MLLM(Multimodal Large Language Models)は、視覚情報とテキスト情報を統合する能力を示すが、しばしば素早い相関に頼っている。
本稿では,MLLMの表層相関バイアスに対する批判的課題を,新たな因果媒介に基づく脱バイアスフレームワークを通じて解決する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:01:11 GMT)
AR-KAN: Autoregressive-Weight-Enhanced Kolmogorov-Arnold Network for Time Series Forecasting [10.7] 時間記憶のための事前学習ARモジュールと非線形表現のためのkanを統合した自己回帰強化コルモゴロフ・アルノルドネットワーク(AR-KAN)を提案する。
AR-KANはARIMAとほぼ周期関数で一致し、72%のRdatasetsシリーズで最高の結果を得る。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:57:01 GMT)
Evaluation and Facilitation of Online Discussions in the LLM Era: A Survey [10.3] 本稿では, LLM の可能性に着目し, オンライン討論の質を評価・向上する手法について調査する。
本研究は,NLPと社会科学のアイデアを総合し,(a)議論品質評価の新しい分類法,(b)介入・ファシリテーション戦略の概要,(c)会話ファシリテーションデータセットの新しい分類法を提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:26:24 GMT)
V-SEAM: Visual Semantic Editing and Attention Modulating for Causal Interpretability of Vision-Language Models [10.1] 本稿では,視覚言語モデルの因果的解釈に視覚意味編集と注意調整を組み合わせた新しいフレームワークであるV-SEAMを紹介する。
V-SEAMは3つの意味レベルにわたる予測に肯定的あるいは否定的な貢献で注目の頭を認識する。
3種類のVQAベンチマークでLLaVAとInstructBLIPの性能向上を示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:58:34 GMT)
Impact of Phonetics on Speaker Identity in Adversarial Voice Attack [10.0] 音声の対立摂動は、自動音声認識(ASR)と話者検証に深刻な脅威をもたらす。
本研究は, 母音集中化や子音置換などの系統的混乱を利用した摂動が, 声道レベルでの逆方向の音声を解析し, 摂動が生ずることを示す。
16の音節にまたがる実験結果から,敵対的音声は転写誤りと同一性ドリフトの両方を誘発することが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:19:53 GMT)
An Empirical Study of Position Bias in Modern Information Retrieval [10.0] 本研究では,情報検索における位置バイアスについて検討する。
モデルは、後から現れる意味的に関連する情報を無視しながら、通過の開始時にコンテンツを過度に強調する傾向がある。
実験により, 関連する情報が通過中に現れると, 密埋モデルとコルバート式モデルが著しく性能劣化することが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:50:24 GMT)
Simultaneous Speedmeter and Position-Meter Response in a Single Tabletop Interferometer [9.9] 量子放射圧ノイズ(QRPN)は重力波検出器の低周波感度を制限する。
速度計の概念は、位置ではなくテスト質量速度を測定することによって、ソースでのQRPNを避ける。
移動試験質量を持つ系における速度計の挙動に関する最初の実験的検討を行った。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:14:43 GMT)
Catch Me If You Can? Not Yet: LLMs Still Struggle to Imitate the Implicit Writing Styles of Everyday Authors [9.9] 本研究は,大規模言語モデルの個人記述スタイルを模倣する能力を包括的に評価する。
著者の帰属、著者の検証、スタイルマッチング、AI検出など、補完的な指標の集合体を導入し、スタイルの模倣を頑健に評価する。
結果は、LLMがニュースやメールなどの構造化フォーマットでユーザスタイルを近似できる一方で、ブログやフォーラムでの曖昧で非公式な書き込みに苦労していることを示している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:18:49 GMT)
Controlling Language Difficulty in Dialogues with Linguistic Features [9.4] 言語アノテートされた対話データに基づく大規模言語モデル(LLM)の訓練は、言語習熟度を正確に調節することができる。
提案手法は,高い対話品質を維持しつつ,言語能力の優れた制御性を実現する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:22:43 GMT)
Large Language Models and Operations Research: A Structured Survey [9.2] 大規模言語モデル(LLM)は、意味理解、構造化生成、推論制御を通じて制限に対処する可能性を示している。
LLMは、自然言語記述を数学的モデルや実行可能なコードに変換し、ベンチマークを生成し、アルゴリズムを進化させ、最適化タスクに取り組むことができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:52:19 GMT)
Federated Hypergraph Learning with Local Differential Privacy: Toward Privacy-Aware Hypergraph Structure Completion [9.2] FedHGLは、非結合性およびプライバシー制約のあるハイパーグラフパーティションに関する連邦ハイパーグラフ学習のための第一種フレームワークである。
We developed FedHGL, a first-of-in-kind framework for Federated hypergraph learning on disjoint and privacy-constrained hypergraph partitions。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:48:15 GMT)
Speech Language Models for Under-Represented Languages: Insights from Wolof [9.1] We present our journey in training a speech language model for Wolof, a underrepresented language spoken in West Africa。
まず,大規模で自発的で高品質な音声データを収集することの重要性を強調した。
このデータセット上でのHuBERTの事前学習は、ASRのベースモデルとアフリカ中心モデルの両方より優れていることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:01:48 GMT)
CausalPre: Scalable and Effective Data Pre-processing for Causal Fairness [9.0] CausalPreはスケーラブルで効果的な因果性誘導型データ前処理フレームワークである。
CausalPreは有効かつスケーラブルであり、因果フェアネスを達成するためには関係のカバレッジをトレードオフする必要があるという従来の信念に挑戦する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:54:01 GMT)
DualSG: A Dual-Stream Explicit Semantic-Guided Multivariate Time Series Forecasting Framework [9.0] 明示的なセマンティックガイダンスを提供するデュアルストリームフレームワークであるDualSGを提案する。
本稿では、自然言語のトレンドパターンを要約した明示的なプロンプトフォーマットである時系列キャプションを紹介する。
さまざまなドメインの実際のデータセットに関する実験によると、DualSGは15の最先端ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:23:30 GMT)
Evil Vizier: Vulnerabilities of LLM-Integrated XR Systems [9.0] 拡張現実(XR)アプリケーションは、ユーザエクスペリエンスの向上、シーン理解、さらには実行可能なXRコンテンツの生成のために、Large Language Models(LLM)を統合している。
これらの潜在的な利点にもかかわらず、統合されたXR-LLMパイプラインにより、XRアプリケーションは新しいタイプの攻撃に対して脆弱になる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:58:15 GMT)
Exploring How Audio Effects Alter Emotion with Foundation Models [8.9] 音声効果(FX)は、音楽聴取中に感情的な反応を形作る上で重要な役割を担っている。
本研究は、基礎モデルを用いてこれらの効果を分析する方法について検討する。
本研究の目的は,音楽の認知,演奏,情緒的コンピューティングに影響を及ぼす音楽制作実践の知覚的影響の理解を深めることである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:57:08 GMT)
Towards robust variational quantum simulation of Lindblad dynamics via stochastic Magnus expansion [8.7] 我々はリンドブラッド方程式の変分量子シミュレーションのための新しい一般的な枠組みを紹介する。
古典的, 量子的両実装における数値的な例を通して, アルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:08:10 GMT)
Next-Depth Lookahead Tree [8.7] Next-Depth Lookahead Tree (NDLT) はノード分割を評価することで性能を向上させるために設計された単一ツリーモデルである。
本稿では,次の深さレベルの品質を評価することにより,性能向上を目的とした単木モデルを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:51:57 GMT)
Super-Linear: A Lightweight Pretrained Mixture of Linear Experts for Time Series Forecasting [8.7] 汎用予測のための軽量でスケーラブルなMixed-of-Experts(MoE)モデルであるSuper-Linearを紹介する。
深層アーキテクチャを、複数の周波数レギュレーションにまたがる再サンプリングデータに基づいて訓練された、単純な周波数特化線形エキスパートに置き換える。
優れた効率性、様々なサンプリングレートに対する堅牢性、解釈可能性の向上を提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:11:31 GMT)
Stabilizing Information Flow Entropy: Regularization for Safe and Interpretable Autonomous Driving Perception [8.5] 我々はディープニューラルエンコーダを階層型通信チェーンとして再認識し、生の知覚入力をタスク関連潜在特徴に圧縮する。
Elossは,軽量でプラグアンドプレイの学習目標として設計された,エントロピーベースの新しい正規化器である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:01:27 GMT)
From Patterns to Predictions: A Shapelet-Based Framework for Directional Forecasting in Noisy Financial Markets [8.2] 金融市場の方向性予測には正確性と解釈可能性の両方が必要である。
教師なしのパターン抽出と解釈可能な予測を統合する2段階のフレームワークを提案する。
我々のアプローチは、予測結果を導くパターン構造を明らかにすることによって、透明性のある意思決定を可能にします。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:05:27 GMT)
Asymptotic Study of In-context Learning with Random Transformers through Equivalent Models [8.1] 非線形回帰の設定において,事前学習したトランスフォーマーの文脈内学習能力について検討する。
ランダムトランスフォーマーはICL誤差の観点から有限次ヘルミットモデルと等価に振る舞うことを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:57:27 GMT)
STEP: Structured Training and Evaluation Platform for benchmarking trajectory prediction models [7.9] 複数のデータセットに統一されたインターフェースを提供することで制限に対処する新しいベンチマークフレームワークであるSTEPを紹介します。
筆者らは,1)広く利用されている試験手順の限界,2) 相互作用予測のためのエージェントの協調モデリングの重要性,3) 分散シフトおよび敵エージェントによる標的攻撃に対する現在の最先端モデルの脆弱性を明らかにする実験でSTEPの能力を実証した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:56:16 GMT)
Exploring Data and Parameter Efficient Strategies for Arabic Dialect Identifications [7.9] アラビア方言識別(ADI)におけるデータ効率とパラメータ効率の異なるアプローチについて検討する。
データ効率の戦略では、ゼロショットと少数ショットの推論でハードプロンプトを解析する。
パラメータ効率のよいPEFT手法について,アラビア固有エンコーダモデルを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:09:19 GMT)
Code Less to Code More: Streamlining Language Server Protocol and Type System Development for Language Families [7.7] 既存の言語ワークベンチは、モジュール性、再利用性、言語サーバー生成のための型システムの利用に苦労している。
モジュール、構成可能、再利用可能な型システム実装のためのドメイン固有言語のファミリーであるTypelangを提案する。
我々はNeverlangにTypelangを実装し、各アーティファクト用の言語サーバと3つのエディタ用のLSPプラグインを生成します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:57:01 GMT)
ReCoVeR the Target Language: Language Steering without Sacrificing Task Performance [7.7] ReCoVeRは、言語固有のステアリングベクトルに基づいた、言語の混乱を低減するための、新しい軽量なアプローチである。
3つのベンチマークと18の言語を含む我々の評価は、ReCoVeRがモノリンガルとクロスランガルの両方のセットアップにおいて、言語の混乱を効果的に軽減していることを示している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:15:52 GMT)
Two tales for a geometric Jensen--Shannon divergence [7.6] 幾何学的ジェンセン-シャノン分岐(G-JSD)は、機械学習と情報科学で人気を博した。
正の密度に合わせた幾何的ジェンセン-シャノン発散の代替定義を導入する。
この斬新な発散は、より一般的な正測度の場合に適用される拡張G-JSDと呼ばれる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:44:04 GMT)
LSTC-MDA: A Unified Framework for Long-Short Term Temporal Convolution and Mixed Data Augmentation in Skeleton-Based Action Recognition [7.6] ラベル付きトレーニングサンプルの不足と、短距離および長距離の時間的依存関係をモデル化することの難しさだ。
本稿では、時間的モデリングとデータの多様性を同時に改善する統合フレームワークLSTC-MDAを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:48:32 GMT)
"What's Up, Doc?": Analyzing How Users Seek Health Information in Large-Scale Conversational AI Datasets [7.3] HealthChat-11Kは、25万のユーザメッセージからなる1万1千の現実世界の会話のキュレートされたデータセットである。
我々の分析は、ユーザーが健康情報を求める方法と理由に関する洞察を明らかにする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:35:47 GMT)
Learning Rate Should Scale Inversely with High-Order Data Moments in High-Dimensional Online Independent Component Analysis [7.2] オンライン独立成分分析(ICA)アルゴリズムの学習力学に及ぼす高次モーメントの影響について検討する。
高次モーメントが増加するにつれて、アルゴリズムは収束が遅くなり、より低い学習率とより高い初期アライメントを要求する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:34:59 GMT)
Benefits of Online Tilted Empirical Risk Minimization: A Case Study of Outlier Detection and Robust Regression [7.2] 経験的リスク最小化(Empirical Risk Minimization、ERM)は、教師付き学習の基礎となるフレームワークである。
データが一度に1つのサンプルに到達するオンラインまたはストリーミング設定では、古典的なTERMは標準ERMに縮退する。
本稿では,従来の目的から対数を取り除き,新たな計算やメモリオーバーヘッドを伴わずに傾き効果を保存するオンラインTERMを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:51:23 GMT)
Aligning Audio Captions with Human Preferences [7.2] 本稿では,人間フィードバックからの強化学習に基づく優先的な音声キャプションフレームワークを提案する。
我々は,人間ラベル付きペアワイズ嗜好データを用いて,CLAPに基づく報奨モデルを訓練する。
本フレームワークは,音声キャプションと人間の嗜好の整合性を実証し,地上データを用いた教師付きアプローチに匹敵する性能を実現する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:33:44 GMT)
Online reinforcement learning via sparse Gaussian mixture model Q-functions [7.1] 本稿では,強化学習のための構造化・解釈可能なオンラインポリシイテレーションフレームワークを提案する。
スパースガウス混合モデルQ-函数(S-GMM-QFs)の新たなクラスを中心に構築されている。
数値実験により,S-GMM-QFは標準ベンチマーク上での高密度深度RL(DeepRL)法の性能と一致していることがわかった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:37:11 GMT)
FASL-Seg: Anatomy and Tool Segmentation of Surgical Scenes [7.0] 特徴適応型空間局在モデル(FASL-Seg)を提案する。
2つの異なる処理ストリームを通じて、機能の複数の詳細レベルをキャプチャするように設計されている。
外科的セグメンテーションのベンチマークデータセットであるEndoVis18とEndoVis17でテストされている。
FASL-Segは、EndoVis18の部品と解剖学的セグメンテーションに72.71%の平均的結合(mIoU)を達成し、SOTAを5%改善した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:31:18 GMT)
Diverse, not Short: A Length-Controlled Data Selection Strategy for Improving Response Diversity of Language Models [7.0] 我々は、共通の多様性指標、さらには好み最適化に使用される報酬モデル、より短い出力に向けて体系的にバイアスモデルを示す。
長さパリティを維持しながら応答の多様性を向上する長さ制御データ選択戦略であるDiverse, not Short (Diverse-NS)を導入する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:46:32 GMT)
Erased or Dormant? Rethinking Concept Erasure Through Reversibility [6.9] 我々は、統一概念編集と消去安定拡散という2つの代表的な概念消去手法を評価する。
消去された概念は、最小限の適応の後、しばしばかなりの視覚的忠実度で再帰することを示す。
本研究は,既存の概念消去アプローチにおける限界を明らかにするものである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:23:42 GMT)
Context parroting: A simple but tough-to-beat baseline for foundation models in scientific machine learning [6.9] ファンデーションモデルは、単純なオウム戦略を通じて予測されることがよくあります。
文脈から直接コピーする単純なコンテキストパロッキングモデルは、主要な時系列基礎モデルよりも高いスコアを得る。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:10:25 GMT)
Wireless Communication Performance Testing: From Laboratory Environment to Research Vessel [6.8] 目的は、視線を妨害する実験室の物体が、送信機(Tx)と受信機(Rx)の間の信号を減衰させる様子を実証することであった。
また, 電気探査船内の各地点における距離と配置が信号伝達効率に及ぼす影響についても検討した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:41:51 GMT)
Fleming-R1: Toward Expert-Level Medical Reasoning via Reinforcement Learning [6.8] Fleming-R1は、3つの相補的な革新を通じて、医学的推論を検証するために設計されたモデルである。
まず、我々のReasoning-Oriented Data Strategy(RODS)は、キュレートされた医療用QAデータセットと知識グラフ誘導合成を組み合わせる。
第2に,教師モデルから高品質な推論軌跡を蒸留するために,CoTコールドスタート(Chain-of-Thought)を用いる。
第三に、検証可能なリワードフレームワークから2段階の強化学習を実装します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:35:14 GMT)
On the Use of Agentic Coding: An Empirical Study of Pull Requests on GitHub [6.7] 大規模言語モデル(LLM)は、ソフトウェア開発プロセスに統合されつつある。
自律的なAIエージェントを使用して、コードを生成し、人間の介入を最小限に抑えたプルリクエストを提出する能力は、標準のプラクティスになる可能性がある。
エージェントコーディングツールであるClaude Codeを使って生成した567のGitHubプルリクエスト(PR)を、157のオープンソースプロジェクトで実証研究しました。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:48:32 GMT)
A Stateless and Secure Delivery versus Payment across two Blockchains [6.7] セキュアでステートレスでコンポーザブルなトランザクションスキームを提案し、2つのブロックチェーンにまたがるデリバリ対費用(DvP)を確立する。
このメソッドは調整のオーバーヘッドを最小限に抑え、キーを条件付きでリリースするステートレス復号法によって競合条件を除去する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:17:46 GMT)
Adversarial Distilled Retrieval-Augmented Guarding Model for Online Malicious Intent Detection [6.7] ADRAGは、堅牢で効率的なオンライン悪意のある意図検出のための2段階のフレームワークである。
リアルタイムアプリケーションでは、毎秒300クエリで最大5.6倍のレイテンシを提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:04:48 GMT)
KAIO: A Collection of More Challenging Korean Questions [6.6] KAIOは、フロンティアモデルの評価とランク付けが可能な韓国のベンチマークである。
彩度に近い最近の韓国のスイートとは異なり、KAIOは飽和状態には程遠い。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:56:31 GMT)
Single- vs. Dual-Prompt Dialogue Generation with LLMs for Job Interviews in Human Resources [6.5] 大規模言語モデル(LLM)を用いた人事面接の2つの方法の比較を行った。
両プロンプト法で生成されたインタビューは, 単プロンプト法で生成されたインタビューの2倍から10倍の勝利率が得られることがわかった。
GPT-4o と Llama 3.3 70B のどちらでも、この違いは一貫している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:58:13 GMT)
A Case for Computing on Unstructured Data [6.4] 我々は、非構造化データ上での計算と呼ばれる新しいパラダイムを議論し、潜在構造の抽出、データ処理技術によるこの構造の変換、非構造化形式への投影という3つの段階に構築する。
この双方向パイプラインは、構造化されていないデータに対して、構造化された計算の分析力の恩恵を受けると同時に、非構造化された表現のリッチ性とアクセシビリティを人間とAIの消費のために保持する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:24:41 GMT)
"Let it be Chaos in the Plumbing!" Usage and Efficacy of Chaos Engineering in DevOps Pipelines [6.3] カオスエンジニアリング(CE)は、現代の分散システムのレジリエンスを改善するための積極的な方法として登場した。
本稿では,近年,産業実践者がCEの原則をどのように採用し,導入してきたのかを考察する,系統的なグレーの文献レビューを紹介する。
我々の研究は、CEのコアテットが引き続き影響力を持つ一方で、実践者は実験、自動化、リスク軽減戦略のコントロールをますます強調していることを明らかにした。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:10:32 GMT)
Mitigating Intra-Speaker Variability in Diarization with Style-Controllable Speech Augmentation [6.3] 多様なスタイルで音声を増強するスタイル制御可能な音声生成モデルを提案する。
提案システムは,従来のダイアリザのダイアリゼーションセグメントから開始する。
オリジナルのオーディオと生成されたオーディオの両方からの話者埋め込みは、システムの堅牢性を高めるためにブレンドされる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:21:20 GMT)
Follow the MEP: Scalable Neural Representations for Minimum-Energy Path Discovery in Molecular Systems [6.3] 本稿では,高速かつスケーラブルなニューラル最適化問題としてMEP発見を再構成する手法を提案する。
3500以上の原子を持つBPTI系を含む2つのタンパク質に対するこのアプローチを実証した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:39:14 GMT)
Explaining deep learning for ECG using time-localized clusters [6.2] 心電図解析に応用した畳み込みニューラルネットワークの新しい解釈可能性法を提案する。
本手法は,モデルの内部表現から時間的局所クラスタを抽出し,学習特性に応じてECGをセグメント化する。
これにより、異なる波形領域がモデルの予測にどのように貢献するかを可視化し、その決定の確実性を評価することができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:52:30 GMT)
The Art of Saying "Maybe": A Conformal Lens for Uncertainty Benchmarking in VLMs [6.2] VLM(Vision-Language Models)は、科学的および推論タスクにおける複雑な視覚的理解において、顕著な進歩を遂げている。
3つの異なるスコアリング機能を持つ6つのマルチモーダルデータセットにわたる16の最先端のVLMを評価し、包括的不確実性ベンチマーク研究を行う。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:10:19 GMT)
DeDisCo at the DISRPT 2025 Shared Task: A System for Discourse Relation Classification [6.1] 本稿では,ジョージタウン大学の DisRPT 2025 共用課題である DeDisCo について述べる。
オープンなQwenモデルを用いてmt5ベースのエンコーダとデコーダベースのアプローチの2つのアプローチをテストする。
本システムは,71.28のマクロ精度スコアを達成し,結果に対する解釈と誤り解析を行う。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:02:56 GMT)
Consistent causal discovery with equal error variances: a least-squares perspective [6.1] 線形非巡回構造方程式モデル(SEM)により生成される変数群間の真の因果構造を復元する問題を考える。
因果構造を符号化する真の基盤となる有向非巡回グラフ(DAG)がこの仮定の下で一意に同定できることはよく知られている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:52:26 GMT)
RoadMind: Towards a Geospatial AI Expert for Disaster Response [6.0] 大規模言語モデル(LLM)は、様々な自然言語タスクで顕著なパフォーマンスを示しているが、地理空間データについて推論する能力には制限がある。
OpenStreetMap (OSM) の構造化データを用いて LLM の地理空間的推論能力を向上させる自己教師型フレームワークである RoadMind を提案する。
以上の結果から,先進的なプログレッシブ・エンジニアリングを備えた最先端のLLMを含む,強力なベースラインをはるかに上回るモデルが得られた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:46:55 GMT)
CARGO: A Framework for Confidence-Aware Routing of Large Language Models [6.0] CARGOは動的大規模言語モデル(LLM)選択のための軽量で信頼性に配慮したフレームワークである。
CARGOは、LLM-judgedペアワイド比較に基づいて訓練された単一の埋め込みベースの回帰器を用いて、モデル性能を予測する。
CARGOは76.4%でトップ1のルーティング精度を達成し、個々の専門家に対して72%から89%の勝利率を達成した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:21:30 GMT)
Position: Thematic Analysis of Unstructured Clinical Transcripts with Large Language Models [5.4] LLM(Large Language Model)は、構造化されていない臨床転写のセマンティック解析をサポートする。
既存の評価方法は大きく異なり、進歩を妨げ、研究全体で有意義なベンチマークを防ぐ。
本稿では,妥当性,信頼性,解釈可能性の3つの側面に着目した評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:02:00 GMT)
ProtoMedX: Towards Explainable Multi-Modal Prototype Learning for Bone Health Classification [5.3] ProtoMedXは、腰椎のDEXAスキャンと患者の記録の両方を使用するマルチモーダルモデルである。
4,160人の実際のNHS患者のデータセットを用いて、プロトメドXは視覚のみのタスクで87.58%、マルチモーダル変種で89.8%の精度を達成している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:46:18 GMT)
Solar Forecasting with Causality: A Graph-Transformer Approach to Spatiotemporal Dependencies [5.3] SolarCAST は将来のグローバル水平放射率(GHI)を予測する因果的に情報を得たモデルであり、X サイトと近辺の局 S の歴史的な GHI のみを用いて目標地点で予測する。
様々な地理的条件で時系列やマルチモーダルのベースラインを上回ります。
最上位の予測装置であるSolcastよりも25.9%のエラー削減を実現している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:57:07 GMT)
Fair-GPTQ: Bias-Aware Quantization for Large Language Models [5.2] 本稿では,大規模言語モデルにおける不公平さの低減を図った最初の量子化手法であるFair-GPTQを紹介する。
我々は、職業バイアスと性別、人種、宗教にまたがる差別的言語を含むステレオタイプ生成に焦点を当てる。
Fair-GPTQは、ゼロショットベンチマークにおけるベースライン精度の少なくとも90%を保ち、半精度モデルに対する不公平さを低減し、4ビット量子化のメモリとスピードの利点を保っている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:56:16 GMT)
GASLITEing the Retrieval: Exploring Vulnerabilities in Dense Embedding-based Search [5.2] 埋め込みベースのテキスト検索x2013$retrieval from corporax2013$は、ディープラーニングを実現する強力なメソッドステートとして登場した。
しかし、埋め込みベースの検索は、悪意のあるコンテンツを宣伝する検索エンジンの敵に受け入れられる可能性がある。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:12:36 GMT)
Exploring Fine-Tuning of Large Audio Language Models for Spoken Language Understanding under Limited Speech data [5.1] 音声言語モデル(LALM)は、音声関連タスクの強力なツールとして登場したが、微調整には未熟なままである。
テキストのみ、直接混合、カリキュラム学習などの微調整方式が音声言語理解(SLU)に与える影響を示す。
言語間SLUでは、ソース言語音声データとターゲット言語テキストと、最小のターゲット言語音声データを組み合わせることで、効果的な適応が可能となる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:54:08 GMT)
Top K Enhanced Reinforcement Learning Attacks on Heterogeneous Graph Node Classification [5.1] グラフニューラルネットワーク(GNN)は、グラフベースのデータに対する例外的なパフォーマンスのため、かなりの関心を集めている。
それらの堅牢性、特に異種グラフ上では、特に敵攻撃に対する探索が過小評価されている。
本稿では,ヘテロKRLAttackを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:51:53 GMT)
Inspired by machine learning optimization: can gradient-based optimizers solve cycle skipping in full waveform inversion given sufficient iterations? [4.9] フルウェーブフォームインバージョン(FWI)は、観測データとシミュレーションデータの違いを最小限に抑えて、速度モデルを反復的に更新する。
初期速度モデルが不正確で低周波地震データがない場合、シミュレーションデータと観測データとのミスマッチは周期の半分を超える可能性がある。
本研究では、まずFWIが局所的な最小値に収束することを示したが、追加の繰り返しが十分であれば、インバージョンは徐々に大域的な最小値に近づくことができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:56:43 GMT)
Enhancing Interpretability in Deep Reinforcement Learning through Semantic Clustering [4.9] セマンティッククラスタリング(セマンティッククラスタリング)とは、ニューラルネットワークが内部空間におけるセマンティックな類似性に基づいて入力をクラスタリングする能力である。
本稿では,特徴量削減とオンラインクラスタリングを組み合わせた新しいセマンティッククラスタリングモジュールを組み込んだDRLアーキテクチャを提案する。
提案モジュールの有効性を実験的に検証し,DRL内のセマンティッククラスタリング特性を明らかにする能力を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:08:45 GMT)
The Role of Touch: Towards Optimal Tactile Sensing Distribution in Anthropomorphic Hands for Dexterous In-Hand Manipulation [4.9] 本研究は,手指と手のさまざまな部位からの触覚フィードバックが,手指の物体の方向転換作業に与える影響について検討する。
触覚センサの構成は,操作の効率と精度の向上に寄与する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:13:26 GMT)
MaRVIn: A Cross-Layer Mixed-Precision RISC-V Framework for DNN Inference, from ISA Extension to Hardware Acceleration [4.9] 既存の組み込みマイクロプロセッサは、混合精度NNを効率的に実行するための十分なアーキテクチャサポートを欠いている。
電力効率と性能を向上させる多層ハードウェア/ソフトウェア共同設計フレームワークであるMARVInを紹介する。
我々のフレームワークは、平均17.6倍のスピードアップを1%未満の精度で達成でき、ISA非依存のRISC-Vコアより優れ、最大1.8TOP/Wを実現している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:48:20 GMT)
Subjective Behaviors and Preferences in LLM: Language of Browsing [4.8] 大規模言語モデル(LLM)はドメインやタスクにまたがって汎用性を提供します。
小さなLMは、大きなLMよりも"ブラウジングの言語"を表現できますか?
主観的行動に適したクラスタワイズLMトレーニング(HeTLM)を導入する。
ページレベルのトークン化器を用いてトレーニングした小さなLMは、トレーニング済みまたは微調整済みのLMよりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:00:28 GMT)
Image Super-Resolution Reconstruction Network based on Enhanced Swin Transformer via Alternating Aggregation of Local-Global Features [4.7] Swin Transformer Network (ESTN) は、ローカルとグローバルの機能を交互に集約する。
ESTNは、SRCNN、ELAN-light、SwinIR-light、SMFANER+モデルを上回る平均PSNRを達成する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:05:49 GMT)
Quantum router of silicon-vacancy centers via a diamond waveguide [4.6] ダイヤモンドのシリコン空洞(SiV)センターは量子技術のための有望なプラットフォームを提供する。
量子ノードとしてSiV中心の配列が埋め込まれたダイヤモンド導波路をベースとした非マルコフ量子ルータを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:44:08 GMT)
Back to Ear: Perceptually Driven High Fidelity Music Reconstruction [4.4] epsilonar-VAEは、変分オートエンコーダ(VAE)を再考し最適化するオープンソースの音楽信号再構成モデルである
実験の結果、epsilonar-VAEは44.1kHzで、様々なメトリクスにわたる主要なオープンソースモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:41:34 GMT)
Algorithmic Fairness: Not a Purely Technical but Socio-Technical Property [4.3] 公正さは純粋にモデルに関する技術的な制約に還元できないと我々は主張する。
本研究では,既存の公正度尺度の限界について,概念分析と実証図面を用いて検討する。
これらの発見は、技術的フォーマライゼーションと社会的現実のギャップを埋める助けになると考えています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:49:10 GMT)
Extending the Limited Performance of the Quantum Refrigerator with Catalysts [4.3] 2ストロークの量子冷凍機は、外部の作業によって駆動される離散ストロークによって、冷たい貯水池から熱を抽出する。
触媒はサイクル毎に変化せず、熱抽出が完全に作業入力によって駆動されることを保証する。
その結果、量子熱デバイスの動作能力を拡大する触媒機構の可能性を強調した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:18:38 GMT)
Security Analysis of Web Applications Based on Gruyere [4.2] Gruyereは既知の脆弱性を分析する実験対象として採用されている。
特定の脆弱性に対する詳細な再現手順を提示し、包括的修復戦略を提案する。
発見によると、Gruyereの脆弱性は比較的時代遅れであるものの、その根底にある原則は、広範囲の現代のセキュリティ欠陥を説明することに非常に関係している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:52:06 GMT)
Set Contribution Functions for Quantitative Bipolar Argumentation and their Principles [4.2] 関心の議論(いわゆるトピック)に対する(最後の強み)議論の集合の寄与を定量化する関数を提案する。
私たちの集合のコントリビューション関数は、トピックへの1つのコントリビューション引数のコントリビューションを定量化する既存の関数の一般化である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:52:53 GMT)
Low-rank surrogate modeling and stochastic zero-order optimization for training of neural networks with black-box layers [4.2] 本稿では、再構成可能な物理層を持つハイブリッドネットワークのエンドツーエンドトレーニングのためのフレームワークを提案する。
提案手法の重要な構成要素は,プロジェクタ分割型インテグレータアルゴリズムであり,各前方通過後の軽量サロゲートモデルを更新する。
我々は,コンピュータビジョン,音声分類,言語モデリングなど,多様なディープラーニングタスクにまたがる手法を実証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:17:44 GMT)
AgentCompass: Towards Reliable Evaluation of Agentic Workflows in Production [4.0] 本稿では,エージェントパイプラインのデプロイ後監視と推論に特化して設計された,最初の評価フレームワークであるAgentを紹介する。
Agentは、主要なメトリクスに関する最先端の結果を達成すると同時に、人間のアノテーションで見逃された重要な問題を明らかにする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:59:04 GMT)
The NazoNazo Benchmark: A Cost-Effective and Extensible Test of Insight-Based Reasoning in LLMs [4.0] そこで本研究では,日本人児童のライドルから構築した費用効果評価指標であるNazonazoについて紹介する。
GPT-5以外のモデルは人間の性能に匹敵せず、平均精度は52.9%である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:50:04 GMT)
SINAI at eRisk@CLEF 2023: Approaching Early Detection of Gambling with Natural Language Processing [4.0] 本稿では,eRisk@CLEFラボにおけるSINAIチームの参加について述べる。
提案課題の1つは,病的なギャンブルの兆候を早期に検出するタスク2である。
Task 2で提示されるアプローチは、Transformersアーキテクチャからトレーニング済みのモデルに基づいており、包括的な事前処理データとデータバランシング技術がある。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:50:14 GMT)
Exploring the Global-to-Local Attention Scheme in Graph Transformers: An Empirical Study [3.9] グラフ変換器(GT)はグラフ表現学習において大きな可能性を示す。
G2LFormerは、新しいグローバル・ローカル・アテンション・スキームを備えている。
グローバルレイヤからの有益な情報をローカルレイヤが保持できるように、クロスレイヤ情報融合戦略が導入された。
その結果,G2LFormerは線形複雑性を維持しながら優れた性能を示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:30:50 GMT)
A Systematic Literature Review on Fundamental Technologies and Security Challenges in the Metaverse Platforms [3.9] Metaverseは、拡張現実(XR)、人工知能(AI)、ブロックチェーン、デジタルツインといった新興技術を利用している。
この調査は、Metaverseで実現可能な技術について、包括的なレビューを提供することを目的としている。
また、そのサステナビリティとユーザの安全性を損なう可能性のある重要な脆弱性や脅威を、徹底的に分析することを目指している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:20:46 GMT)
Where Do I 'Add the Egg'?: Exploring Agency and Ownership in AI Creative Co-Writing Systems [3.9] 我々は,エージェント,ツールライク,マジックという,異なるインタフェースメタファーを持つ3つのAIコライトシステムを開発した。
分析の結果,機関と所有サブタイプの分類が得られた。
インタフェースのメタファーは、制御の期待を導くだけでなく、著者の観念を形作っている、と我々は主張する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:27:12 GMT)
Attention Lattice Adapter: Visual Explanation Generation for Visual Foundation Model [3.9] 本稿では,視覚基盤モデルにおける新しい説明生成手法を提案する。
説明を生成することと、解釈可能性を高めるために部分的にモデルパラメータを更新することの両方を目的としている。
CUB-200-2011 と ImageNet-S の2つのベンチマーク・データセットを用いて評価を行った。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:45:29 GMT)
Frame Sampling Strategies Matter: A Benchmark for small vision language models [3.7] ビデオ質問応答のための最先端の小型視覚言語モデルのフレーム精度の最初のベンチマークを提案する。
その結果,疑わしいバイアスが確認され,異なるフレームサンプリング手法によるSVLMのデータ固有動作とタスク固有動作の両方が強調された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:18:42 GMT)
Style Transfer with Diffusion Models for Synthetic-to-Real Domain Adaptation [3.7] 拡散モデルを用いた意味論的一貫したスタイル伝達のための2つの新しい手法を提案する。
GTA5をソースとして,Cityscapes/ACDCをターゲットドメインとして実験したところ,FIDスコアが低く,コンテンツ保存性が向上した高品質な画像が得られた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:25:20 GMT)
Hybrid Learning and Optimization methods for solving Capacitated Vehicle Routing Problem [3.7] CVRP(Capacitated Vehicle Routing Problem)は、ロジスティクスにおける基本的なNPハード問題である。
本稿では,古典的(RL-C-ALM)と量子拡張的(RL-Q-ALM)の両方のALMソルバ内でのペナルティパラメータの選択を自動化するために,深層強化学習(RL)を統合したハイブリッド最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:38:29 GMT)
Autoguided Online Data Curation for Diffusion Model Training [3.6] 近年開発された自己誘導法とオンラインデータ選択法により,生成拡散モデルの学習時間とサンプル効率が向上するか否かを検討する。
制御された2次元合成データ生成タスクと3x64x64)-D画像生成におけるデータキュレーションの組み合わせを評価する。
実験全体を通して、自己誘導は一貫してサンプルの品質と多様性を改善します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:09:04 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.6] 本稿では,ジェネレーティブ・人工知能(GenAI)を利用したストーリーテリングを支援する教育ツールのコンセプトを紹介する。
我々は,GenAIによるナラティブ・コクリエーション,テキスト・トゥ・音声変換,テキスト・トゥ・ミュージック,テキスト・トゥ・ビデオ生成を評価し,学習者にとって魅力的な体験を生み出す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:23:26 GMT)
mdok of KInIT: Robustly Fine-tuned LLM for Binary and Multiclass AI-Generated Text Detection [3.6] 自動検出は、人間が機械生成したテキストを表示するのを助けることができる。
このノートは、テキスト分類のための微調整された小さなLLMに基づいて、ロバスト検出における我々のmdokアプローチを記述している。
これは、Voight-Kampff Generative AI Detection 2025のサブタスクの両方に適用され、どちらも優れたパフォーマンス(1位)を提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:06:09 GMT)
Evaluating the Effectiveness of Coverage-Guided Fuzzing for Testing Deep Learning Library APIs [3.5] 我々は、テンプレート、ヘルパー関数、APIドキュメントを組み合わせることで、APIレベルのハーネスを自動的に合成するFlashFuzzを提案する。
最先端のファジィ法と比較すると、FlashFuzzは101.13から212.88パーセントのカバレッジと1.0xから5.4倍の妥当性を実現している。
本研究は,CGFがディープラーニングライブラリに効果的に適用可能であることを確認し,今後のテストアプローチの強力なベースラインを提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:10:42 GMT)
Accurate typhoon intensity forecasts using a non-iterative spatiotemporal transformer model [3.5] 熱帯サイクロン(TC)強度の正確な予測は、運用気象学の課題である。
機械学習の最近の進歩は、TC予測の顕著な進歩をもたらした。
本稿では,非定常5日間の強度軌跡を生成するトランスフォーマーに基づく予測モデルNetを紹介する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:50:17 GMT)
VRScout: Towards Real-Time, Autonomous Testing of Virtual Reality Games [3.5] 我々は,VR環境を自律的にナビゲートし,人間らしくリアルタイムに仮想オブジェクトと対話できる,ディープラーニングベースのエージェントであるVRScoutを紹介する。
この結果から,VRScoutはトレーニングデータに制限のある専門家レベルの性能を実現し,60FPSのリアルタイム推論を実現していることがわかった。
これらの結果は、VRScoutをVRゲームの自動テストのための実用的でスケーラブルなフレームワークとして位置づけ、品質保証と安全性監査の両方に直接的な応用がある。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:16:05 GMT)
PILOT: Steering Synthetic Data Generation with Psychological & Linguistic Output Targeting [3.5] PILOT (Psychological and Linguistic Output Targeting) は、構造化された心理言語学プロファイルを持つ大規模言語モデルを操るフレームワークである。
我々はPILOTが全条件にわたって高い応答品質を維持しており、ステアリングアプローチ間で統計的に有意な差はないことを示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:43:28 GMT)
SINAI at eRisk@CLEF 2022: Approaching Early Detection of Gambling and Eating Disorders with Natural Language Processing [3.3] 本稿では,eRisk@CLEFラボにおけるSINAIチームの参加について述べる。
Task 1で提示されるアプローチは、Transformerからの文の埋め込みの使用に基づいている。
タスク3のアプローチは、トランスフォーマーからの文脈的単語埋め込みを用いたテキスト類似度推定に基づいている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:03:31 GMT)
RETRO: REthinking Tactile Representation Learning with Material PriOrs [3.3] 触覚表現学習プロセスに素材認識の先行性を導入する。
これらの先行は、異なる材料に特有の事前学習特性を表しており、モデルが表面テクスチャのニュアンスをよりよく捉え、一般化することができる。
提案手法は,多様な材料やテクスチャにまたがって,より正確で,文脈的にリッチな触覚フィードバックを可能にし,ロボット工学や触覚フィードバックシステム,材料編集などの実世界のアプリケーションの性能を向上させる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:51:19 GMT)
Limitations of Public Chest Radiography Datasets for Artificial Intelligence: Label Quality, Domain Shift, Bias and Evaluation Challenges [3.3] 大規模な公開データセットは、数十万のラベル付きイメージに病理アノテーションを提供する。
放射線診断レポートから 自動ラベル抽出が エラーを引き起こします
ドメインシフトと人口バイアスは サブグループモデル一般可能性を制限する
2人の放射線学者による専門家によるレビューでは、公開データセットラベルと大きな意見の相違が判明した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:13:11 GMT)
The Role of Graph Topology in the Performance of Biomedical Knowledge Graph Completion Models [2.9] 公開生物医学知識グラフのトポロジ的特性を包括的に調査する。
すべてのモデル予測と新しい分析ツールをリリースすることによって、コミュニティは私たちの仕事の上に構築し、これらの重要なアプリケーションの理解を引き続き改善するよう促します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:09:02 GMT)
CLEAR: A Comprehensive Linguistic Evaluation of Argument Rewriting by Large Language Models [2.9] 我々は、議論的テキストとその改善、Argument Improvement(ArgImp)というタスクに焦点を当てる。
本稿では4つの言語レベルにマッピングされた57のメトリクスからなる評価パイプラインであるCLEARについて述べる。
これらのモデルでは,文章の短縮と平均語長の増大,文章の融合によりArgImpが実現されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:53:41 GMT)
Toward a Unified Security Framework for AI Agents: Trust, Risk, and Liability [2.8] 信頼・リスク・責任(TRL)フレームワークは、信頼・リスク・責任の相互依存関係を結び付け、信頼の構築・強化の体系的な方法を提供する。
TRLフレームワークの意義は、その潜在的な社会的影響、経済的影響、倫理的影響などにある。
潜在的な課題に対処し、6GネットワークにおけるAIの信頼性、リスクフリー、責任ある使用を促進するために、優れた価値をもたらすことが期待されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:55:03 GMT)
A Comparative Evaluation of Large Language Models for Persian Sentiment Analysis and Emotion Detection in Social Media Texts [2.8] 本研究では,ペルシャ語のソーシャルメディアテキストにおける感情分析と感情検出のための4つの大規模言語モデル(LLM)の比較評価を行った。
その結果、全てのモデルの性能が許容できるレベルに達しており、最良の3つのモデルの統計的比較では、それらの間に有意な差は見られなかった。
その結果、感情検出タスクは感情分析タスクと比較して全てのモデルにおいて困難であり、誤分類パターンはペルシア語のテキストにおけるいくつかの課題を表わす可能性があることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:59:07 GMT)
Automating Modelica Module Generation Using Large Language Models: A Case Study on Building Control Description Language [2.8] 本稿では,制御記述言語モジュールの自動生成における大規模言語モデルの利用について検討する。
我々は,標準化されたプロンプトスキャフォールド,ライブラリ認識基盤,OpenModelicaによる自動コンパイル,ループ評価を併用した構造化ワークフローを開発した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:07:17 GMT)
The Why and How of Convex Clustering [2.8] 本稿では,凸最適化問題に基づくクラスタリング手法について概説する。
重要なアルゴリズムを強調し、その計算コストが問題の大きさとどのようにスケールするかについて議論する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:56:55 GMT)
Large Vision Models Can Solve Mental Rotation Problems [2.8] 心的回転は、人間の空間的推論の鍵となるテストである。
現代の視覚変換器の成功にもかかわらず、これらのモデルがどのように類似の能力を発達するかは未だ不明である。
ViT,CLIP,DINOv2,DINOv3の系統的評価を行った。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:18:28 GMT)
Can I Trust This Chatbot? Assessing User Privacy in AI-Healthcare Chatbot Applications [2.7] 私たちの研究は、米国内のApp StoreとGoogle Playで利用可能な、広くダウンロードされた12のAIヘルスケアチャットボットアプリのプライバシプラクティスを評価した。
調査対象アプリの半数はサインアップ時にプライバシーポリシーを示しておらず、その時点でデータ共有を無効にするオプションは2つだけだった。
アプリのプライバシポリシの大部分は、データ保護対策に対処できなかった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:29:43 GMT)
Spatio-Temporal Anomaly Detection with Graph Networks for Data Quality Monitoring of the Hadron Calorimeter [2.6] GraphSTADシステムは、検出器を横断する粒子によって誘導される局所的な空間特性を学習する。
提案手法の精度を検証し,多様なチャネル障害タイプを抽出する。
GraphSTADシステムは、実運用レベルの精度を実現し、HCALのリアルタイム監視のためにCMSコアプロダクションシステムに統合されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:37:00 GMT)
Robust Utility Optimization via a GAN Approach [2.5] 本稿では,堅牢なユーティリティ最適化問題を解決するために,GAN(Generative Adversarial Network)アプローチを提案する。
特に、投資家と市場の両方をニューラルネットワーク(NN)でモデル化し、ミニマックスゼロサムゲームでトレーニングする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:54:44 GMT)
Dual-Mode Deep Anomaly Detection for Medical Manufacturing: Structural Similarity and Feature Distance [2.5] 本稿では,2つの注意誘導型オートエンコーダアーキテクチャを提案する。
1つ目は、軽量でリアルタイムな欠陥検出を可能にする構造的類似性に基づくスコアリングアプローチである。
第二に、Mahalanobis を用いた特徴距離ベースの戦略を、遅延特性の低減に応用する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:46:38 GMT)
On the complexity of unique quantum witnesses and quantum approximate counting [2.4] 量子オラクルを$mathsfBQPmathsfUniqueQMA$と$mathsfQMA$で分離する。
局所ハミルトン問題のどんな構造的特性を活用できるのか?
局所ハミルトンの基底エネルギーを$mathsfUniqueQMA$プロトコルで推定できることを示すことによって、物理的動機付けの候補を導入する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:58:28 GMT)
Zero-Shot LLMs in Human-in-the-Loop RL: Replacing Human Feedback for Reward Shaping [2.4] 強化学習(Reinforcement Learning, RL)は、しばしば報酬のミスアライメントに苦しむ。
HITL(Human-in-the-loop)メソッドはこの問題を緩和するが、バイアスも導入する。
これらの課題に対処するための2つの重要な貢献を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:32:51 GMT)
Suppressing Degradation in Quantum Batteries by Electromagnetically-induced Transparency [2.4] 電磁誘導透過(EIT)を導入してQBの老化を抑制することを提案する。
EITを組み込んだQBsは,EITを含まないものと比べ,自然崩壊に対する耐性が強いことが実証された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:54:30 GMT)
Can Hawking effect of multipartite state protect quantum resources in Schwarzschild black hole? [2.3] 我々は、シュワルツシルト時空の多部量子状態に対するホーキング効果の影響を分析する。
その結果、ホーキング効果の影響下では、励起数$q$の増加は量子絡みと相互情報の減少につながることが示された。
これは、励起多部状態に対するホーキング効果が量子相関を劣化させる傾向にあるが、同時に曲線化された時空における量子コヒーレンスを保護していることを示している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:37:27 GMT)
Self-supervised learning of imaging and clinical signatures using a multimodal joint-embedding predictive architecture [2.3] 肺結節診断のためのマルチモーダルモデルは、ラベル付きデータの不足と、これらのモデルがトレーニング分布に過度に適合する傾向によって制限される。
これらの課題に対処するために、縦・マルチモーダルアーカイブからの自己教師型学習を活用する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:35:44 GMT)
Towards universal property prediction in Cartesian space: TACE is all you need [2.2] 原子クラスター膨張と運動電位は任意の構造決定的テンソル特性の体系的予測のための枠組みである。
我々は、TACEが主要な同変フレームワークに匹敵する精度、安定性、効率を達成することを実証する。
この研究は、新しい世代の普遍的原子論機械学習モデルの基礎を築いた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:51:07 GMT)
TypedSchematics: A Block-based PCB Design Tool with Real-time Detection of Common Connection Errors [2.2] 回路設計ブロックの再利用は、初心者が専門家が設計した再使用を妨げている主要な要因である。
ブロックベースのPCB設計ツールであるTypedticsを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:26:01 GMT)
V-SenseDrive: A Privacy-Preserving Road Video and In-Vehicle Sensor Fusion Framework for Road Safety & Driver Behaviour Modelling [2.2] V-SenseDriveはパキスタンの運転環境内で収集された最初のプライバシー保護型マルチモーダル運転行動データセットである。
V-SenseDriveはスマートフォンベースの慣性センサーとGPSセンサーのデータと同期した道路対向ビデオを組み合わせて、3つの目標運転行動を記録する。
パキスタンにおける現実の運転を表現することによって、V-SenseDriveは、ドライバーの行動データセットのグローバルな状況における重要なギャップを埋める。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:55:14 GMT)
Socratic Mind: Impact of a Novel GenAI-Powered Assessment Tool on Student Learning and Higher-Order Thinking [2.2] 本研究では,ジェネレーティブ・人工知能(GenAI)を利用した形式的評価ツールであるソクラティック・マインド(Socratic Mind)が学習結果に与える影響について検討する。
GenAIツールに携わる学生は、クイズスコアが、そうでない学生に比べて大幅に向上した。
我々の研究は、より深いエンゲージメントと高次の認知スキルを育成する上で、AIによる対話の約束を強調した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:08:24 GMT)
Scale and Rotation Estimation of Similarity-Transformed Images via Cross-Correlation Maximization Based on Auxiliary Function Method [2.2] 本稿では,2つの画像間のスケールと回転を,サブピクセル精度で共同で推定できる高効率アルゴリズムを提案する。
画像アライメントは、異なる視点から撮影された画像を空間的に登録する重要なプロセスとして機能する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:22:13 GMT)
Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation [2.2] 大規模言語モデル(LLM)を外部知識に基盤付けるための重要なアプローチとして,検索-拡張生成(RAG)システムが登場している。
本稿では,ガバナンス,サイバーセキュリティ,農業,産業研究,医療診断の5つの領域固有のRAGアプリケーションについて述べる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:12:45 GMT)
Learning Mechanistic Subtypes of Neurodegeneration with a Physics-Informed Variational Autoencoder Mixture Model [1.9] 物理に基づくPDEによって制御された潜在動的モデルの混合を学習するための深層生成モデルを提案する。
本手法は, 反応拡散PDEを可変オートエンコーダ(VAE)混合モデルフレームワークに統合する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:29:45 GMT)
Energy Equity, Infrastructure and Demographic Analysis with XAI Methods [1.8] 本研究は、複数の地域における電力使用量を調べるために、説明可能な人工知能(XAI)の手法をデプロイする。
エネルギー消費の最も重要な問題、すなわち中央値の世帯所得で分けられたエネルギーに費やされる総量に対処する。
分析結果に基づき, 新規エネルギー負荷電卓とともに, パイロットエネルギーエクイティWebポータルを設計した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:13:39 GMT)
A Closeness Centrality-based Circuit Partitioner for Quantum Simulations [1.8] 高性能コンピューティングシステム上での量子回路(QC)のシミュレーションは,現在の量子ハードウェアの限界にもかかわらず,アルゴリズムをベンチマークし,大規模量子計算の可能性を探るための重要な方法となっている。
我々は,大規模QCに対して,フレキシブルコードジェネレータとともに効率的なパーティショニングスキームを提供するエンドツーエンドフレームワークを導入し,計算ノード間のデータ移動を最小限に抑えるポータブルソリューションを提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:53:34 GMT)
PMPO: Probabilistic Metric Prompt Optimization for Small and Large Language Models [1.7] PMPOはマスキングに基づく分析を通じて低品質のプロンプトセグメントを特定し、反復的にそれらを書き換えて改良された変種を提案する。
単一のフォワードパスにおける損失を最小限に抑え、出力のサンプリングを排除し、選択のための人または判断に基づくスコアをなくし、変種の中から選択する。
PMPOは、BBHで最高平均精度を達成し、GSM8KとAQUA RATに強く依存し、AlpacaEval 2.0の勝利率を19ポイント以上上げる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:37:35 GMT)
Variables Ordering Optimization in Boolean Characteristic Set Method Using Simulated Annealing and Machine Learning-based Time Prediction [1.7] 本稿では,機械学習に基づく時間予測とシミュレーションアニーリング(SA)を統合した新しいフレームワークを提案する。
我々は、任意の変数の順序付けに要する問題解決時間を推定するために、正確なML予測器 ft(X) を訓練する。
実験により,本手法は標準BCSアルゴリズムよりもかなり優れていることが示された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:02:32 GMT)
RaceGAN: A Framework for Preserving Individuality while Converting Racial Information for Image-to-Image Translation [1.6] GAN(Generative Adversarial Network)は画像から画像への翻訳において大きな進歩を見せている。
人種属性翻訳中に複数のドメインにスタイルコードをマッピングできる新しいフレームワークであるRaceGANを提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:55:37 GMT)
Positional Encoding in Transformer-Based Time Series Models: A Survey [1.5] 本研究は,変圧器を用いた時系列モデルにおいて,既存の位置符号化手法を体系的に検討する。
シーケンスの長さ、信号の複雑さ、次元といったデータ特性は、メソッドの有効性に大きな影響を与えます。
我々は、重要な課題を概説し、位置符号化戦略を強化する研究の方向性を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:31:51 GMT)
DyWPE: Signal-Aware Dynamic Wavelet Positional Encoding for Time Series Transformers [1.5] 動的ウェーブレット位置決めを導入する。
離散ウェーブレット変換(DWT)を用いた入力時間から直接位置埋め込みを生成する新しい信号認識フレームワーク(DyWPE)
DyWPEは、バイオメディカル信号の正弦波絶対位置符号化に比べて平均9.1%の相対的な改善を達成し、既存の8つの位置符号化法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:37:33 GMT)
Trainability of Quantum Models Beyond Known Classical Simulability [1.4] 変分量子アルゴリズム(VQA)は、短期量子コンピューティングの候補として有望である。
システムサイズが指数関数的に消える不毛な高原のため、スケーラビリティの課題に直面している。
最近の予想では、バレンプラトーを避けることは本質的に古典的なシミュラビリティにつながる可能性がある。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:26:31 GMT)
Leveraging Reinforcement Learning, Genetic Algorithms and Transformers for background determination in particle physics [1.3] 本稿では,美容ハドロン崩壊測定に影響を及ぼす重要な背景を明らかにするための新しい手法を提案する。
機械学習の観点から,RLと遺伝的アルゴリズムの相乗効果を利用した新しいアルゴリズムを提案する。
また, 崩壊を表すトークン列を扱うために, RLエージェントのトランスフォーマーアーキテクチャを組み込んだ。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:17:25 GMT)
Efficient and Versatile Model for Multilingual Information Retrieval of Islamic Text: Development and Deployment in Real-World Scenarios [1.3] イラン語多言語コーパスの特徴を活用し、イスラムドメインのためのアドホックIRシステムを開発するための最適な戦略を検討する。
我々は,モノリンガル,クロスリンガル,トランスレーショナル・トレインオールの4つの訓練手法と,クロスリンガルとモノリンガルを併用した新しい混合手法を用いた11種類の検索モデルを構築した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:32:07 GMT)
Synergizing Static Analysis with Large Language Models for Vulnerability Discovery and beyond [1.3] 本稿では,Large Language Models (LLMs) と Static Application Security Testing (SAST) の相乗効果を検討した。
LLMはコード解析やパターン認識に優れるが、矛盾や幻覚に陥りやすい。
SAST-GeniusはSem単独と比較して偽陽性を約91%(225~20)減らした。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:15:20 GMT)
ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation [1.2] 学習されたダイナミックスモデルによるプランニングは、多目的な現実世界の操作に対して有望なアプローチを提供する。
残差物理モデリングと不確実性に基づく能動学習を組み合わせたフレームワークであるActivePusherを提案する。
シミュレーションと実環境の両方でアプローチを評価し,データ効率を継続的に改善し,より高い計画成功率を達成することを実証した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:45:55 GMT)
Stochastic Clock Attention for Aligning Continuous and Ordered Sequences [1.2] 我々はアライメントモデルとして機能する連続および順序列に対する注意機構を定式化する。
Transformerのテキスト音声テストベッドでは、この構造により、より安定したアライメントが得られ、グローバルな時間スケーリングに対する堅牢性が向上する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:18:34 GMT)
Support-Projected Petz Monotone Geometry of Two-Qubit Families: Three-Channel Identity and Non-Reduction of Curvatures [1.2] 本稿では、任意のペッツ単調量子測度を回路定義部分多様体へ引き戻すことにより、純粋2量子変分族の情報幾何について検討する。
このフレームワークは対称対数微分(SLD/Bures)のケースを厳密に一般化し、特にウィグナー・ヤネーゼとボゴリボフ・クボ・モリ計量を含む。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:27:10 GMT)
From Learning to Optimize to Learning Optimization Algorithms [1.2] 我々は、古典的アルゴリズムが従うが、これまでは、学習の最適化(L2O)には使われていない重要な原則を特定します。
我々は,データ,アーキテクチャ,学習戦略を考慮した汎用設計パイプラインを提供し,古典最適化とL2Oの相乗効果を実現する。
我々は,新しい学習強化BFGSアルゴリズムを設計し,テスト時に多くの設定に適応する数値実験を行うことにより,これらの新原理の成功を実証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:54:40 GMT)
Rule-Based Error Detection and Correction to Operationalize Movement Trajectory Classification [1.2] 動作軌跡プラットフォームに組み込むためのモデルの誤り訂正と検出を行う,ニューロシンボリックなルールベースのフレームワークを提供する。
最大0.984の誤差を予測するためのF1スコア、分布外精度の大幅な向上(ゼロショット精度のSOTAよりも8.51%向上)、SOTAモデルよりも精度の向上を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:31:57 GMT)
Generative Large Language Models for Knowledge Representation: A Systematic Review of Concept Map Generation [1.2] 生成型大規模言語モデル(LLM)の台頭により,概念地図による知識表現を自動化する新たな機会が開かれた。
本総説では, LLM を用いた概念マップ生成に関する新たな研究の体系化について述べる。
人間のループシステム、弱い教師付き学習モデル、微調整されたドメイン固有LLM、素早いエンジニアリングによる事前訓練されたLLM、知識ベースを統合するハイブリッドシステム、シンボルと統計ツールを組み合わせたモジュラーフレームワークである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:36:54 GMT)
AI-Derived Structural Building Intelligence for Urban Resilience: An Application in Saint Vincent and the Grenadines [1.1] 衛星画像から屋上属性を自動的に推測するAI駆動ワークフローを提案する。
我々の研究は、AIと地球観測(EO)データを利用して、より効率的でエビデンスベースの都市ガバナンスを可能にする、SIDSに新たな能力を提供することを目的としています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:12:50 GMT)
PolBiX: Detecting LLMs' Political Bias in Fact-Checking through X-phemisms [1.0] 本研究は,ドイツの主張において,エウヘミズムやディフェミズムと言葉を交換することで,政治的偏見を体系的に調査する。
政治的傾向よりも、判断的単語の存在が真理性評価に大きく影響していることが分かる。
いくつかのモデルでは政治的偏見の傾向を示しているが、これはプロンプトにおける客観主義を明示的に求めることによって緩和されるものではない。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:26:53 GMT)
Deep Learning Agents Trained For Avoidance Behave Like Hawks And Doves [1.0] 簡単な回避ゲームを行う深層学習エージェントによって表現される最適な戦略を提案する。
我々は、2人のエージェントの学習と行動を分析する。
本研究は,ゲーム『ホークス』や『ダブズ』に類似した行動を示し,攻撃的エージェントが目標に到達するための攻撃的戦略を採用し,他のエージェントが攻撃的エージェントを避ける方法を学ぶことを示唆している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:53:07 GMT)
Learning Conservative Neural Control Barrier Functions from Offline Data [1.0] オフラインデータセットからニューラルネットワークバリア関数をトレーニングするアルゴリズムを提案する。
我々のアルゴリズムはこれらの機能を訓練し、システムが安全でない状態に達するのを防げるだけでなく、配布外状態に到達するのを嫌うようにもしている。
実験の結果, CCBFはタスク性能に最小限の影響を与えつつ, 安全性を維持する上で, 既存の手法よりも優れていたことが確認された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:32:32 GMT)
MapAnything: Mapping Urban Assets using Single Street-View Images [1.0] 本稿では,個々の画像を用いてオブジェクトのジオコーディネートを自動的に決定するモジュールであるMapAnythingを紹介する。
都市オブジェクトの自動化やインシデントマッピングの推奨事項として,モジュールの詳細と検証を行う。
都市環境におけるLiDAR点雲に対する推定距離の精度を測定した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:02:54 GMT)
ALIGNS: Unlocking nomological networks in psychological measurement through a large language model [1.0] 本稿では,評価されたアンケート尺度を訓練した大規模言語モデルベースシステム,ALIGNS の生成のための潜時指標分析について紹介する。
ALIGNSは心理学、医学、社会政策、その他の分野にまたがる550,000以上の指標を含む3つの包括的なノモロジーネットワークを提供している。
これは、測定バリデーションにおける基礎的な問題を解決するために、大きな言語モデルの最初の応用である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:46:59 GMT)
Semi-Supervised 3D Medical Segmentation from 2D Natural Images Pretrained Model [0.9] 本稿では,3次元医用画像のセグメンテーションを改善するために,2次元自然画像に事前訓練された一般視覚モデルからの知識の伝達について検討する。
本稿では,2次元事前学習モデルからスクラッチから学習した3次元セグメンテーションモデルまで,段階的に知識を蒸留するモデル非依存フレームワークを提案する。
我々のアプローチであるM&Nは、互いに生成した擬似マスクを用いて2つのモデルの反復的協調学習と、提案した学習率誘導サンプリングを含む。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:17:52 GMT)
Dynamical decoupling protection for three-level systems [0.9] 3レベルシステムのための物理的に実現可能な動的デカップリング演算子列を構築する。
本手法は, 環境騒音を除去することにより, 3段階の量子ゲートの忠実度を効果的に向上させることができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:26:24 GMT)
The Impact of Structural Changes on Learning Capacity in the Fly Olfactory Neural Circuit [0.9] ショウジョウバエの体(MB)は嗅覚学習と記憶に関与していることが知られている。
これまでの研究では、MB内のケニオン細胞へのプロジェクションニューロン(PN)接続に焦点を当てていた。
キノコ体回路の構造と接続性の変化、特にKC内からキノコ体出力ニューロン(MBON)の神経回路がMBONの匂いを識別する能力に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:12:58 GMT)
Threats and Security Strategies for IoMT Infusion Pumps [0.9] 本研究は、現代医療において重要なデバイスであるIoMT注入ポンプのサイバーセキュリティ脆弱性に焦点を当てる。
この結果から、デバイスレベルの欠陥、認証とアクセス制御の問題、ネットワークと通信の弱点、データセキュリティとプライバシのリスク、医療ネットワーク内の横から攻撃される可能性がある運用または組織上の課題などの脆弱性に直面していることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:29:07 GMT)
Deep Learning Foundation and Pattern Models: Challenges in Hydrological Time Series [0.8] 本稿では,水文学データを用いて時系列における重要な特徴を特定することを目的とする。
本研究では, CAMELS と Caravan のグローバルデータセットから水文学時系列を解析する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:42:10 GMT)
Radiology Report Conditional 3D CT Generation with Multi Encoder Latent diffusion Model [0.8] Report2CTは3次元胸部CTボリュームを自由テキストラジオグラフィーレポートから直接合成するための条件拡散フレームワークである。
Report2CTは、優れた視覚的品質とテキスト画像アライメントを備えた解剖学的に一貫したCTボリュームを生成する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:32:23 GMT)
Fast Multipole Attention: A Scalable Multilevel Attention Mechanism for Text and Images [0.8] 我々は,n体物理学にインスパイアされた自己注意のための分割・コンカヤ機構である高速多極注意(FMA)を導入する。
FMAは、完全なコンテキストインタラクションを保持しながら、自己アテンションの時間とメモリの複雑さを$mathcalOleft(n2right)$から$mathcalO(n log n)$に削減する。
言語タスクと視覚タスクのためのFMAの1次元実装と2次元実装をそれぞれ開発した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:14:08 GMT)
Data Quality Monitoring for the Hadron Calorimeters Using Transfer Learning for Anomaly Detection [0.8] トランスファーラーニング(TL)メカニズムは、新しいタスクに事前訓練されたモデルを利用することで、データのスパーシリティとモデルの複雑さを軽減することを約束する。
畳み込み,グラフ,リカレントニューラルネットワークを組み込んだハイブリッドオートエンコーダアーキテクチャを用いて,高次元ST ADにおけるTLの可能性を示す。
この研究の主な貢献は、エンコーダネットワークとデコーダネットワークのコンテキストにおけるTLのポテンシャルと制限の探索である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:21:58 GMT)
Explainable AI for Infection Prevention and Control: Modeling CPE Acquisition and Patient Outcomes in an Irish Hospital with Transformers [0.8] 本研究では,患者に対するCPEの影響を調べるための,eXplainable AIモデリングフレームワークを提案する。
診断基準,病棟移行,患者の人口統計,感染関連変数,接触ネットワークの特徴を組み込んだ,アイルランドの急性病院の入院データセットを解析した。
既往の病院曝露や入院状況,ネットワーク集中度など,感染症に関連する特徴は,患者の予後やCPE取得リスクの予測に強い影響を及ぼすと考えられた。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:29:11 GMT)
Full Quantum Stack: Ket Platform [0.7] エンド・ツー・エンドの量子ソフトウェアスタックを示し、ユーザ向けコードからハードウェア実行までの抽象化の各レイヤを詳述する。
私たちは、アルゴリズム開発のための表現力豊かなPythonベースのインターフェースを提供するKet量子プログラミングプラットフォームで、最も高いレベルから始めます。
我々は,電子回路を物理実現に接続し,キャリブレーションされたマイクロ波パルスによってネイティブゲートがどのように実装されるかを説明する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:14:01 GMT)
Exploring multimodal implicit behavior learning for vehicle navigation in simulated cities [0.7] Inlicit Behavioral Cloning (IBC) with Energy-Based Models (EBMs) to capture multimodality。
本稿では,データ拡張型IBC(DA-IBC)を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:17:29 GMT)
Circuit-based chatacterization of finite-temperature quantum phases and self-correcting quantum memory [0.7] ゼロ温度トポロジカルコードと同じ熱相にある任意の系が、マクロ的に長い時間量子情報をコヒーレントに保存していることを示す。
熱平衡系に情報をエンコードし、復号するために、明示的な符号化および復号化チャネル回路を提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:55:15 GMT)
Comparative Analysis of STEM and non-STEM Teachers' Needs for Integrating AI into Educational Environments [0.6] 本研究は,AIと分析機能を取り入れることで,教育プラットフォームをどのように改善できるかを考察する。
我々は8人のK-12教師にインタビューを行い、ブロックベースのプログラミング(BBP)プラットフォームをクラスで使用しながら、その実践とニーズについて質問した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:20:18 GMT)
AI-Driven Multi-Agent Vehicular Planning for Battery Efficiency and QoS in 6G Smart Cities [0.6] 本稿では,これらの要件を満たすためのSimulator Orchestrator(SO)の拡張について述べる。
現実的な都市データセットに対する予備的な結果は、車載計画アルゴリズムを利用すると、バッテリーと性能が向上することを示している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:46:22 GMT)
Dual-Mode Visual System for Brain-Computer Interfaces: Integrating SSVEP and P300 Responses [0.6] 本研究では新しい発光ダイオード(LED)を用いた二重刺激装置の開発と評価について述べる。
このシステムは7Hz、8Hz、9Hz、10Hzの4つの異なる周波数を用いており、前方、後方、右側、左方向の制御に対応している。
提案したハイブリッドシステムは平均分類精度86.25%、平均ITRは42.08ビット/分(bpm)である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:25:18 GMT)
Synaptic Theory of Chunking in Working Memory [0.6] 本稿では, 短期的なシナプス可塑性により, 動作記憶におけるチャンク表現の形成を可能にする, チャンクのシナプス理論を紹介する。
チャンキングニューロン'の特異的集団は、ゲーティングと同様、刺激応答性ニューロン群を選択的に制御する。
我々の研究は、脳がリアルタイムでどのように情報を整理するかを理解するための、概念的で分析的な枠組みを提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:16:45 GMT)
GIN-Graph: A Generative Interpretation Network for Model-Level Explanation of Graph Neural Networks [0.6] グラフニューラルネットワーク(GIN-Graph)のモデルレベル記述のための新しい生成ネットワークを提案する。
GIN-Graphは信頼性と高品質なモデルレベルの説明グラフを生成する。
実験結果から,GIN-Graphは様々なグラフデータセット上で訓練されたGNNの解釈に応用可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:44:47 GMT)
The Distribution Shift Problem in Transportation Networks using Reinforcement Learning and AI [0.6] 我々はMetaLightと呼ばれる最先端のMeta RLアプローチを評価し,分析する。
特定の条件下では、MetaLightは確かに合理的に良い結果をもたらす可能性があるが、他の条件下では、うまく機能しないかもしれないことを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:24:08 GMT)
Quantum Convolutional Neural Network for Phase Recognition in Two Dimensions [0.5] 量子畳み込みニューラルネットワーク(Quantum Convolutional Neural Network, QCNN)は、複雑な量子状態を特徴づける量子回路である。
そこで我々は,位相認識を2次元で行うQCNNを構築した。
ネットワークはまた、トポロジ的順序が認識されるまでのノイズ閾値を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:02:56 GMT)
Capturing the Page Curve and Entanglement Dynamics of Black Holes in Quantum Computers [0.5] 我々は,IBMの超伝導量子コンピュータ上でのブラックホール蒸発のおもちゃキュービットモデルであるqubitトランスポートモデルについて,厳密に検討した。
具体的には、効率的なランダムユニタリ回路を用いて、ブラックホールのスクランブルダイナミクスの量子シミュレーションを実装した。
我々は、量子ビット輸送モデルにおけるR'enyiエントロピーを正確に決定し、複雑な量子系の将来の研究における量子コンピュータの有用性を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:10:47 GMT)
Advanced Physics-Informed Neural Network with Residuals for Solving Complex Integral Equations [0.5] RISNは、幅広い積分方程式と積分微分方程式を解くために設計された、新しいニューラルネットワークアーキテクチャである。
RISNは残差接続を高精度な数値法と統合する。
RISNは古典的なPINNよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:27:52 GMT)
The Energy-Efficient Hierarchical Neural Network with Fast FPGA-Based Incremental Learning [0.4] 従来の勾配に基づくトレーニング手法は非効率であり、多くの反復的な更新と高消費電力を必要とする。
本稿では,階層分解とFPGAに基づく直接方程式解法と漸進学習を組み合わせたハイブリッドフレームワークを提案する。
提案手法では,ニューラルネットワークを2つの機能層に分割する。低層はFPGA上の単一ステップ方程式により最適化され,効率よく並列化可能な特徴抽出が可能であり,高層は適応的な漸進的学習を用いて,完全リトレーニングなしで連続的な更新をサポートする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:54:15 GMT)
Forecasting and Visualizing Air Quality from Sky Images with Vision-Language Models [0.4] 大気汚染は公衆衛生と環境の持続可能性にとって重要な脅威である。
本稿では,スカイイメージから環境大気汚染レベルを予測するAI駆動エージェントを提案する。
提案手法は, 統計的テクスチャ解析と教師あり学習を組み合わせた汚染分類手法である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:36:38 GMT)
Sentinel Agents for Secure and Trustworthy Agentic AI in Multi-Agent Systems [0.4] 本稿では,マルチエージェントシステム(MAS)のセキュリティと信頼性向上を目的とした新しいアーキテクチャフレームワークを提案する。
このフレームワークの中心的なコンポーネントは、分散セキュリティ層として機能するSentinel Agentsのネットワークである。
このようなエージェントは、エージェント間のコミュニケーションを監督し、潜在的な脅威を特定し、プライバシーとアクセス制御を強制し、包括的な監査記録を維持することができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:39:59 GMT)
Efficient motion-based metrics for video frame interpolation [0.4] 本研究では,運動場の分散度を計測する動き計測手法を提案する。
次に、提案したメトリクスを使用して、アートフレームメトリクスのさまざまな状態を評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:23:38 GMT)
Predicting Case Suffixes With Activity Start and End Times: A Sweep-Line Based Approach [0.4] 本稿では,開始と終了のタイムスタンプによるアクティビティからなるケースサフィックスの予測手法を提案する。
提案手法は,各アクティビティの待ち時間と処理時間の両方を予測する。
実生活および合成データセットの評価は、このアプローチの異なるインスタンス化の精度を比較する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:01:30 GMT)
Modeling User Redemption Behavior in Complex Incentive Digital Environment: An Empirical Study Using Large-Scale Transactional Data [0.3] 我が国の個人金融アプリケーションから実世界の取引データを分析した。
ポイントの利用はランダムではなく、体系的に人口統計と結びついていることがわかりました。
巨額の助成金は、現金支出に影響を与えることなく、ポイント支出の増加を刺激した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:49:29 GMT)
Classical and Quantum Heuristics for the Binary Paint Shop Problem [0.3] バイナリペイントショップ問題(BPSP)は自動車製造における最適化問題である。
主要な性能指標はペイントスワップ比であり、車ごとの平均色変化数である。
BPSPの重み付きMaxCutへの還元により,QAOAをBPSPに適用するための理論的基礎を構築した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:00:00 GMT)
Artificial Intelligence and Market Entrant Game Developers [0.3] この論文は、生成型AIがより一般公開されるようになると、比較的独立した開発者が市場に参入したことを示している。
AIに関連するゲーム機能は、独立開発者に対するAIの影響を示唆している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:35:19 GMT)
Evaluating the Limitations of Local LLMs in Solving Complex Programming Challenges [0.3] 本研究では,オープンソースのローカルホスト型大規模言語モデル(LLM)による複雑なプログラミングタスクの処理性能について検討する。
AI駆動のコード生成評価(FACE)のためのオリジナルのフレームワークをベースとして、著者らはパイプラインを完全にオフラインで動作するように改造した。
その結果、パス@1の精度は局所モデルでは控えめであり、最高のモデルはプロプライエタリモデルの受け入れ率の約半分であることがわかった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:13:30 GMT)
Unentanglement and Post-Measurement Branching in Quantum Interactive Proofs [0.3] 我々は,最初のメッセージだけが量子である場合でも,3ラウンドの非絡み合いの量子対話的証明がNEXPと等しいことを示す。
2ラウンドの量子古典的証明システムにおける測定後の分岐について検討する。
パブリック・コインとプライベート・コインの古典的対話的証明の等価性とは異なり、測定後の分岐から生じる量子環境の分離の証拠を与える。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:09:12 GMT)
Maize Seedling Detection Dataset (MSDD): A Curated High-Resolution RGB Dataset for Seedling Maize Detection and Benchmarking with YOLOv9, YOLO11, YOLOv12 and Faster-RCNN [0.3] スタンドカウントは、植物が発芽した数を決定し、再移植や入力の調整といったタイムリーな決定を導く。
実生苗数計測のための高品質な航空画像データセットであるMSDDを導入し,早稲作モニタリング,収量予測,現地管理に応用した。
MSDDには、様々な成長段階、植林設備、土壌タイプ、照明条件、カメラアングル、密度の3つのクラス・シングル、ダブル、トリプルの植物が含まれる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:41:59 GMT)
Discrete optimal transport is a strong audio adversarial attack [0.3] 我々は、離散的最適輸送(DOT)が、現代の音声防汚対策(CM)に対する効果的なブラックボックス対逆攻撃であることを示した。
フレームレベルのWavLM埋め込みは、エントロピーOTとトップ$kのバリセント型プロジェクションを介して、未ペアのボナファイドプールにアライメントされ、その後、ニューラルボコーダでデコードされる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:46:16 GMT)
Modeling Transformers as complex networks to analyze learning dynamics [0.3] 本研究は,複雑なネットワーク理論のレンズを用いて,動的学習を特徴付けることができるかどうかを考察する。
ノードがモデルの計算コンポーネントである有向重み付きグラフとして、トランスフォーマーベースのモデルを表現するための新しい手法を紹介します。
グラフ理論の一連のメトリクスを分析して、ネットワークの構造が探索、統合、洗練の異なるフェーズを通して進化することを明らかにする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:20:26 GMT)
Physics-Informed GCN-LSTM Framework for Long-Term Forecasting of 2D and 3D Microstructure Evolution [0.2] このフレームワークはコンポジション対応で、異なるコンポジションを持つデータセットを共同でトレーニングし、潜在グラフ空間で動作する。
このフレームワークは、進化するミクロ構造の空間的および時間的パターンを捉えながら、トレーニング後の計算コストを削減した長距離予測を可能にする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:55:56 GMT)
Causal inference for the expected number of recurrent events in the presence of a terminal event [0.2] 終端故障イベントを伴う繰り返しイベントデータにおける因果推論のための多元的ロバストな推定フレームワークを開発する。
条件付き独立検閲よりも弱い条件下で推定値が識別可能であることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:38:07 GMT)
Coupling 4H-Silicon Carbide spins to a microwave resonator at milli-Kelvin temperature [0.2] マイクロ波空洞モードとスピン量子ビット遷移を結合することは、効率的な量子ビットの読み出しと制御を可能にするために重要である。
炭化ケイ素(SiC)材料中の異なるスピン量子ビット遷移を10mKの温度で約12.6GHzの3Dマイクロ波(MW共振器モード)に結合させることを実験的に観察した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:03:08 GMT)
LLM-Assisted Topic Reduction for BERTopic on Social Media Data [0.2] 本稿では,話題生成のためのBERTopicと話題短縮のための大規模言語モデルを組み合わせたフレームワークを提案する。
3つのTwitter/Xデータセットと4つの異なる言語モデルにまたがるアプローチを評価した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:59:11 GMT)
Mini-Batch Robustness Verification of Deep Neural Networks [0.2] BaVerLyは、ミニバッチを動的に構築し、検証することで、$epsilon$-ballsのセットの局所的な検証を促進する音と完全検証器である。
結果、BaVerLyは平均2.3倍、最大4.1倍の検証を行い、分析時間を24時間から6時間に短縮した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:33:26 GMT)
Threat Modeling for Enhancing Security of IoT Audio Classification Devices under a Secure Protocols Framework [0.2] 本稿では,エッジデバイス,セルネットワーク,クラウドを3つの異なる信頼領域として扱うセキュリティプロトコルを提案する。
STRIDE駆動の脅威モデルとアタックツリー分析が設計を導く。
トランジット中のデータはTLS 1.3によって保護され、クエンタム後のレジリエンスを提供するためにカイバーとディリシウムとハイブリッド化されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:25:50 GMT)
BEACON: Behavioral Malware Classification with Large Language Model Embeddings and Deep Learning [0.2] 従来の静的解析は、コードの難読化、ポリモーフィズム、その他の回避技術を用いた現代の脅威に対して防御に失敗する。
本研究では,大規模言語モデル(LLM)を利用した新しいディープラーニングフレームワークBEACONを提案する。
これらの埋め込みは、各サンプルのセマンティックおよび構造パターンをキャプチャし、マルチクラスのマルウェア分類のための1次元畳み込みニューラルネットワーク(1D CNN)によって処理される。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:24:12 GMT)
Living on the edge: a non-perturbative resolution to the negativity of bulk entropies [0.2] Lin, Maldacena, Rozenberg, and Shan (LMRS) はブラックホール物理学の新しいパラドックスを発表した。
両側のブラックホールにおけるエンタングルメントとR'enyiエントロピーは、幾何学が非常に多くの物質励起を含む場合、負となることがある。
通常の量子系におけるエンタングルメントとR'enyiエントロピーは負ではないので、このパズルを解くことはブラックホールの量子力学的記述を理解するための必要なステップである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:00:00 GMT)
A Black Hole Airy Tail [0.2] Jackiw-Teitelboim重力における焼成エントロピーを計算する。
我々は、JT重力中のブラックホールが孤立した基底状態であることを証明するために、重力経路積分を利用する方法を示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:47:16 GMT)
Deep learning and abstractive summarisation for radiological reports: an empirical study for adapting the PEGASUS models' family with scarce data [0.2] 医学のような繊細でデータ制限のある領域では、抽象的な要約は依然として難しい。
非ドメイン固有の抽象的要約エンコーダ-デコーダモデルファミリーの微調整過程について検討した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:51:33 GMT)
Temporal Representation Learning of Phenotype Trajectories for pCR Prediction in Breast Cancer [0.2] 乳がん化学療法(NACT)を施行した症例において,画像データから治療反応の早期動態の表現を学習し,病理学的完全反応(pCR)を予測することを提案する。
乳房MRI(MRI)画像の経時的変化は、潜在空間の軌跡を形成し、応答の予測の基礎となる。
公開可能なISPY-2データセットの実験において、潜在軌道空間における線形分類器は、前処理データ(T0)と初期応答(T0+T1)と画像時間(0.861)のみを用いて0.761の平衡精度を達成する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:37:27 GMT)
AI and the Future of Academic Peer Review [0.2] 大規模言語モデル(LLM)は、ジャーナリスト、資金提供者、個人レビュアーによってピアレビューパイプラインで試験されている。
初期の研究は、AIアシストが人間に匹敵する品質のレビューを作成できることを示唆している。
教師付きLDM支援は, 人間の判断を損なうことなく, エラー検出, タイムライン, レビューヤの作業量を改善することができることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:04:39 GMT)
Magnetic-Field and Temperature Limits of a Kinetic-Inductance Traveling-Wave Parametric Amplifier [0.1] キネティックインダクタンス進行波パラメトリック増幅器(KI-TWPA)は、飽和電力の高いブロードバンド近量子制限増幅を提供する。
Nb面を有する薄NbTiN逆マイクロストリップを用いたKI-TWPAの性能に及ぼす磁場と温度の影響について検討した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:07:59 GMT)
Large Language Model probabilities cannot distinguish between possible and impossible language [0.1] モデル-内部表現を使用して、大言語モデルが'文法-非文法'の区別を表現する方法を直接タップします。
文字列確率が文法の限界のプロキシとして機能すると、非文法的条件は言語的違反を含む条件の中で際立つと予測する。
この結果から,非文法的プロンプトに対する特異な副次的シグネチャは明らかにされていない。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:17:48 GMT)
Comparative Analysis of Tokenization Algorithms for Low-Resource Language Dzongkha [0.1] 事前訓練されたトークンライザのほとんどは、英語のような高リソース言語に適しているが、低リソース言語では性能が悪い。
本研究では,他の一般的な手法と比較して,3種類の共通トークン化アルゴリズムの訓練と性能を評価する。
結果は、3つのアルゴリズムがすべてポテンシャルを示す一方で、SentencePieceはDzongkhaトークン化に最も効果的であることを示している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:02:55 GMT)
Calibrated Generative AI as Meta-Reviewer: A Systemic Functional Linguistics Discourse Analysis of Reviews of Peer Reviews [0.1] 生成AIは、効果的な人間のフィードバックの重要な修辞的および関係的な特徴を近似することができる。
生成型AIメタフィードバックは、フィードバックリテラシーを足場として、ピアレビューによるリーンエンゲージメントを高める可能性がある。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:00:44 GMT)
A Graph-Based Approach to Alert Contextualisation in Security Operations Centres [0.1] 本稿では,グラフベースの警告グループにアラートを集約することで,SOCにおける警告コンテキスト化を強化するためのグラフベースのアプローチを提案する。
関連するアラートをグループ化することにより、より抽象的なレベルでの分析が可能になり、個々のアラートよりも効果的に攻撃手順をキャプチャする。
我々のフォーマットが下流の機械学習手法に適していることを示すために、我々は、受信する警告グループと過去のインシデントを関連付けるために、グラフマッチングネットワーク(GMN)を使用している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:05:45 GMT)
Zero-energy resonances in ultracold hydrogen sticking to liquid helium films of finite thickness [0.0] H-He膜相互作用を含む結合ポテンシャルにおける超低温水素原子の量子状態について検討した。
重力量子状態のシフトと幅は、H-He膜基板電位の複雑な散乱長によって決定されることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:17:44 GMT)
Zero Indirect Band Gap in Non-Hermitian Systems [0.0] ゼロ間接バンドギャップが非エルミート摂動に対して安定であることを示す。
特筆すべきは、ゼロ間接ギャップが非エルミート皮膚効果の抑制を引き起こすことである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:02:24 GMT)
Wave-particle duality in the measurement of gravitational radiation [0.0] 波動や粒子の様相が明らかになるかどうかは、量子測定鎖の端で用いられる検出器の特性である。
線形検出器は、フォック状態の放射用信号とコヒーレント状態の振幅に比例する信号とを出力しない。
対照的に、メーターのエネルギーに結合した検出器からの信号は、入射放射線が少なくとも1つの重力子を含む場合にのみゼロではない。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:24:38 GMT)
Watermarking and Anomaly Detection in Machine Learning Models for LORA RF Fingerprinting [0.0] 本稿では,疑わしい入力を見つけるために,所有権証明のための透かしと異常検出を併用したより強力なRFFIシステムを提案する。
LoRaデータセットでは、94.6%の精度、98%の透かし成功、0.94のAUROCを達成し、検証可能な改ざん防止認証を提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:21:33 GMT)
Vibrational Fingerprints of Strained Polymers: A Spectroscopic Pathway to Mechanical State Prediction [0.0] 高分子ネットワークの振動応答は、分子の変形の感度の高いプローブを提供する。
実効エポキシサーモセットにおいて, 機械学習力場が量子レベルの忠実度でこれらの分光指紋を再現することを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:27:16 GMT)
Training thermodynamic computers by gradient descent [0.0] 所望の計算を行うために,熱力学コンピュータのパラメータを降下によって調整する方法を示す。
我々は、デジタルおよび熱力学的実装のエネルギーコストの比率である熱力学的優位性を7桁を超えると見積もる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:12:55 GMT)
Trade-offs between classical and quantum space using spooky pebbling [0.0] Pebbleゲームは、空間/時間のトレードオフを研究するために使用されます。
本稿では,一般的な回路に対して,スポーキーな小石ゲームフレームワークを初めて適用する。
制限されたランタイム内では、古典的な空間を考慮すると量子空間を減らす戦略を見つけることができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:22:05 GMT)
Topology and Spectral Entanglement in Cavity-Mediated Photon Scattering [0.0] 我々はSSHモデルを用いたトポロジカル絶縁体におけるキャビティ媒介光子-光子相互作用の図式理論を開発した。
我々は、真空光子交換から電子自己エネルギーを計算し、帯域再正規化における対称性を付与した限界を同定する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:25:30 GMT)
Thresholds for post-selected quantum error correction from statistical mechanics [0.0] 我々は、量子誤り訂正(QEC)において、選択後使用可能なレジームを特定する。
統計力学モデルを用いて、選択後QECの性能と閾値を解析的に定量化する。
選択後QECは4つの異なる熱力学的位相によって特徴づけられる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:51:07 GMT)
The threat of analytic flexibility in using large language models to simulate human data: A call to attention [0.0] シリコンサンプル(シリコンサンプル)とは、ヒトの被験者を対象とする合成データセットである。
ごく少数の意思決定が、シリコンサンプルと人間のデータとの対応を劇的に変えることができることを示す。
私は、シリコンサンプルの使用における分析的柔軟性の脅威に対して、より注意を払っています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:18:12 GMT)
The mechanization of science illustrated by the Lean formalization of the multi-graded Proj construction [0.0] 我々はLean4における多階化Projの構成を定式化し、機械化数学と形式化を図示した。
この記事はSymbolic Interaction誌に初めて掲載された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:19:41 GMT)
The Ensemble Kalman Update is an Empirical Matheron Update [0.0] Ensemble Kalman Filter (EnKF) は高次元システムにおけるデータ同化法として広く用いられている。
本稿は、この単純だが未公開な接続をコンパクトに紹介する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:19:32 GMT)
The Describe-Then-Generate Bottleneck: How VLM Descriptions Alter Image Generation Outcomes [0.0] 本稿では,自然言語が視覚情報の中間表現として機能する記述列生成ボトルネックの実証分析を行う。
評価の結果,99.3%のサンプルが知覚的劣化を示し,91.5%が構造的情報損失を示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:48:51 GMT)
Synthetic-to-Real Object Detection using YOLOv11 and Domain Randomization Strategies [0.0] 本稿では、合成データとドメインランダム化戦略のみを用いて、特定のオブジェクト(スープ缶)を検出するためのYOLOv11モデルを訓練することに焦点を当てる。
この方法論には、データ拡張、データセット合成、モデルスケーリングによる広範な実験が含まれる。
最高のパフォーマンス設定は、拡張され多様なデータセットでトレーニングされたYOLOv11lモデルで、競合の隠れテストセットで0.910のmAP@50を達成した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:08:54 GMT)
Subject Matter Expertise vs Professional Management in Collective Sequential Decision Making [0.0] 専門職と専門職の議論」を定量的かつ客観的にどう扱うかは明らかになっていない。
このタスクを制御された環境でモデル化するには、相互依存的な決定を伴う複雑なシーケンシャルゲームであるチェスを利用する。
最小限の閾値を超えた課題の専門知識は、チームのシナジーに大きく寄与しないことがわかった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:56:24 GMT)
Strong coupling of a microwave photon to an electron on helium [0.0] 共振器マイクロ波場と電子の運動量子状態との強い結合を初めて実証する。
これらの実験は、ヘリウムベースのスピン量子ビット上の電子の測定と制御への重要なステップである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:38:28 GMT)
State-to-Hamiltonian conversion with a few copies [0.0] 密度行列指数 (DME) は未知の量子状態からハミルトン進化に変換する過程である。
非物理プロセスを用いて,$mathcalO(log(1/varepsilon)$または$mathcalO(1)$状態コピーを実現する仮想DMEを提案する。
量子主成分分析タスクにおけるコピーカウントの指数的削減とともに、この小さな定数オーバーヘッドを数値的に検証する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:41:04 GMT)
Scalable projected entangled-pair state representation of random quantum circuit states [0.0] ランダムな量子回路状態を表すバイダルゲージにおいて,投影された絡み合ったペア状態 (PEPS) の更新を示す。
従来のCPUで128ドル(約1万4000円)の大規模回路を使用すれば、状態の忠実さの普遍的なスケーリングの挙動が分かる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:09:26 GMT)
Rounding near-optimal quantum strategies for nonlocal games to strategies using maximally entangled states [0.0] 制約系(BCS)ゲームに対するほぼ完全な量子戦略は、対応するBCS代数の近似表現であることを示す。
XOR非局所ゲームのクラスに対して、準最適量子戦略は対応する$*$-代数の近似表現であることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:27:22 GMT)
Resource-efficient linear-optical generation of GHZ-like states [0.0] 本稿では,非論理的中間状態からGHZ様状態を生成する能力を示す理論的枠組みを提案する。
我々の研究結果は、普遍的な解ではないが、非最大エンタングル状態は特定のフォトニック量子情報タスクに実用的な利点をもたらすことを示唆している。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:45:48 GMT)
Reinforcement Learning Agent for a 2D Shooter Game [0.0] 複雑なゲーム環境における強化学習エージェントは、しばしばスパース報酬、トレーニング不安定性、サンプル効率の低下に悩まされる。
本稿では,オフライン模倣学習とオンライン強化学習を組み合わせた2次元シューティングゲームエージェントのハイブリッドトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:07:41 GMT)
Red Teaming Multimodal Language Models: Evaluating Harm Across Prompt Modalities and Models [0.0] マルチモーダル大規模言語モデル (MLLM) は, 現実の応用においてますます利用されているが, 敵条件下での安全性はいまだ検討されていない。
本研究は,テキストのみおよびマルチモーダル形式にまたがる敵対的プロンプトに曝露した4つのMLLMの無害性を評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:51:06 GMT)
Reconnecting Citizens to Politics via Blockchain - Starting the Debate [0.0] 選挙は自由民主主義を機能させるために最も重要な柱の1つである。
世界中の最近の証拠は、それらを自由で公平に行うことは容易ではないことを示している。
頻繁なスキャンダルは、この問題に対処する現在のアプローチで遭遇した困難を証明している。
政治キャンペーンと広告の費用を特別に支払うために設計された別の暗号通貨が導入された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:39:41 GMT)
Recent Advancements in Microscopy Image Enhancement using Deep Learning: A Survey [0.0] 顕微鏡画像強調の進歩は、特に深層学習の助けを借りて顕著に増加している。
本研究の目的は,この急速に成長する最先端の手法のスナップショットを提供することであり,その進化,応用,課題,今後の方向性に焦点をあてることである。
中心となる議論は、顕微鏡画像の超解像・再構成・復調の重要領域を中心に行われ、各領域は現在の傾向と深層学習の実用性の観点から探索されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:03:41 GMT)
Random Matrix Theory-guided sparse PCA for single-cell RNA-seq data [0.0] 単細胞RNA-seqは個々の細胞の詳細な分子スナップショットを提供する。
ほとんどの研究は、次元減少のための主成分分析(PCA)に依存している。
スパースプリンシパルコンポーネントの推論を導くRMT(Random Matrix Theory)ベースのアプローチでPCAを改善する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:08:38 GMT)
Quantum Metrology of Spin Sensing with Free Space Electrons [0.0] 透過電子顕微鏡の最近の進歩は、単一スピン感度のスピン共鳴分光への道を開いた。
磁気モーメントの大きさを推定し,スピンの存在を識別する。
従来のTEMイメージングは、スピン状態へのプローブ電子のバックアクションが無視できる場合、量子境界を飽和させることができる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:12:56 GMT)
Prestige over merit: An adapted audit of LLM bias in peer review [0.0] 大規模言語モデル(LLM)は、学術的なピアレビューにおいて、次第に統合されつつも、概して非公式な役割を担っている。
著者の身元をランダム化して,高品質な写本群を代表的に評価するシミュレーションを開発した。
監査の結果、強い、一貫した制度的先制バイアスが明らかになった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:28:19 GMT)
Patent Language Model Pretraining with ModernBERT [0.0] われわれは、ModernBERTアーキテクチャと6000万以上の特許記録をキュレートしたコーパスを用いて、ドメイン固有の3つのマスク付き言語モデルを事前訓練する。
このアプローチでは,FlashAttention,回転埋め込み,GLUフィードフォワードレイヤなどのアーキテクチャ最適化を取り入れている。
われわれのモデルである ModernBERT-base-PT は、4つのデータセットのうち3つで汎用 ModernBERT ベースラインを一貫して上回り、ベースラインの PatentBERT と競合する性能を示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:04:30 GMT)
On the Use of Agentic Coding Manifests: An Empirical Study of Claude Code [0.0] エージェントコーディングツールは自然言語で書かれた目標を入力として受け取り、それらを特定のタスクに分解し、人間の介入を最小限に抑えて実際のコードを書き、実行します。
このプロセスの鍵となるのは、エージェントマニフェスト、エージェントに必須のプロジェクトコンテキスト、アイデンティティ、運用ルールを提供する構成ファイル(Claude.mdなど)である。
構造パターンと共通コンテンツを特定するため,242リポジトリから253 Claude.mdファイルを解析した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:46:41 GMT)
On Quantum Field Theory and Observers [0.0] 音場理論における可観測物の見方が楽器の読み出しの相関性にどのように適合するかを考える。
フェルミパラドックスの簡単な解法も指摘されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:06:50 GMT)
Nonequilibrium Quasiparticles in Superconducting Circuits: Energy Relaxation, Charge and Flux Noise [0.0] ジョセフソン接合を横切る過剰な準粒子のトンネルは超伝導量子ビットにおける主要な損失とデコヒーレンス機構の1つとして認識されている。
準粒子からの電荷ノイズは対数周波数のフラックスノイズを引き起こし、フラックス量子ビットで観測されるフラックスノイズに匹敵する「ほぼ白い」寄与をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:19:10 GMT)
Mechanism of defect formation in the quantum annealing of the random transverse-field Ising chain [0.0] ランダム逆場イジング鎖の量子アニールにおける欠陥形成の顕微鏡機構を提案する。
臨界点外におけるギャップの有限性について説明するが、これはキブルズレークスケーリングによる問題の早期アプローチにおいて暗黙的であった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 06:27:17 GMT)
Machines are more productive than humans until they aren't, and vice versa [0.0] 本稿では,実証現実主義に基づくモンテカルロシミュレーションに基づくシリコン内フレームワークを開発し,人的・機械的スキルの経済的影響を分析する。
本研究は, 自動化が低次元一般化難易度を特徴とするタスクにおいて, 最も経済的に有効な戦略である傾向にあるという確立された概念を定量的に支援するものである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:27:46 GMT)
Limitation of Stoquastic Quantum Annealing: A Structural Perspective [0.0] 縮退した局所最小値の集合に付随するエネルギー間の競合から生じる反交差に関する構造的説明を提供する。
本論文は,DIC-DAC-DOAアルゴリズムの主な研究の補足として機能する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:39:48 GMT)
Leveraging IndoBERT and DistilBERT for Indonesian Emotion Classification in E-Commerce Reviews [0.0] 本研究では,インドネシア語における感情分類の精度向上に焦点をあて,高度な言語モデルであるIndoBERTとDistilBERTを活用する。
データの増大は高い精度を達成する上で重要な要素であることが判明した。
IndoBERTはインドネシアで最も効果的な感情分類モデルであり、データの増大は高い精度を達成する上で重要な要素であることが証明された。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:38:02 GMT)
Leveraging Artificial Intelligence as a Strategic Growth Catalyst for Small and Medium-sized Enterprises [0.0] 人工知能(AI)は、大企業が保有する未来的な概念から、中小企業向けの現代的でアクセスしやすく、不可欠な成長レバーへと移行してきた。
起業家やビジネスリーダーにとって、戦略的AIの採用はもはや選択肢ではない。
AIの採用を裏付ける定量的証拠は魅力的だ。91%の中小企業がAIを使用して、収入を直接的に増やすと報告している。
トップラインの成長以外にも、AIは重要な運用効率を推進し、運用コストを最大30%削減し、企業価値を20時間以上節約できることを示した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:56:04 GMT)
Large-order perturbation theory of linear eigenvalue problems [0.0] 線形固有値問題のクラスは、小パラメータのエプシロンに依存するが、エプシロンの力における固有値の級数展開は発散する。
我々はこの分岐の正確な性質を決定するための新しい手法を開発した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:11:04 GMT)
Julia Set in Quantum Evolution: The case of Dynamical Quantum Phase Transitions [0.0] 動的量子相転移(英: Dynamical quantum phase transitions, DQPTs)は、多体量子系において起こる非平衡相転移のクラスである。
本稿では、複素力学と実空間再正規化群(RG)を組み合わせたDQPTの正確な解析手法を提案する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:59:12 GMT)
Improving the efficiency of quantum engineering of SCSs by adding two demultiplexed input photons [0.0] 条件付き光子の付加と減光は連続変数(CV)状態の量子工学の強力なツールである。
本稿では, 振幅2.5のコヒーレント状態(SCS)の量子工学による測定手法を提案し, 忠実度は0.99以上とした。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:09:32 GMT)
Imaging of electrical signals in a quantum SiC microscope [0.0] 本稿では、量子シリコン炭化物顕微鏡(QSiCM)の実験的実現を報告し、電流によって生じる磁場をイメージングすることによってその機能を示す。
本研究では, 歪みや温度変動に起因する雑音を抑えながら, 読み出しコントラストを高めるために, デュアル周波数検出プロトコルを用いる。
このアプローチは、50×50ドル仮想ピクセルの視野、50,mathrmms$の時間分解能、30,mathrmmu m$の空間分解能、約2,mathrmmu Tの感度を有する電流誘起磁場の空間イメージングを可能にする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:10:04 GMT)
Hybrid Autoregressive-Diffusion Model for Real-Time Sign Language Production [0.0] 我々は手話生成のための自己回帰モデルと拡散モデルを組み合わせたハイブリッドアプローチを開発する。
微粒な体の動きを捉えるため,異なる音節から細かな特徴を別々に抽出するマルチスケール・ポース表現モジュールを設計した。
ポーズ生成過程を動的に導くために,共同レベルの信頼度スコアを利用する信頼度対応型因果注意機構を導入する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 02:58:04 GMT)
How to be an orthodox quantum mechanic [0.0] この研究は、量子力学の正統的な解釈とは何か?
我々は、量子力学に関する42の教科書のコレクションをレビューし、この性質の最もポピュラーで顕著な著作を取り上げている。
次に、12の命題に対する反応を測って、正統派量子力学によって信じられていることを正確に表す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:30:04 GMT)
How Digital Transformation Impacts Corporate Green Innovation? [0.0] 本稿では,企業におけるディジタルトランスフォーメーションの指標を構築し,デジタルトランスフォーメーションがグリーンイノベーションに与える影響について検討する。
その結果、企業におけるデジタルトランスフォーメーションは、企業におけるグリーンイノベーションのアウトプットを促進することが示され、その持続的な影響は、わずかに減少傾向を示している。
デジタルトランスフォーメーションは、中小企業や技術集約産業におけるグリーンイノベーションのアウトプットに対して、より顕著な促進効果を持っている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:59:21 GMT)
Geodesics in the Deep Linear Network [0.0] 線形ネットワーク幾何学における全階行列間の測地学の特別な場合において、ODEと関連する明示的解の一般系を導出する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 01:06:06 GMT)
From top quarks to enhanced quantum key distribution: A Framework for Optimal Predictability of Quantum Observables [0.0] 両部量子系における測定の予測可能性の定量化のための包括的枠組みを提案する。
任意の可観測状態と2キュービット状態の予測誤差を最小限に抑える最適測定のための解析式を導出する。
我々は,局所的な振幅減衰雑音の影響を受けやすいベル状態と,高エネルギー衝突器で生成するトップ・アンチトップクォーク対の2つのシナリオに適用した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:46:29 GMT)
From Sea to System: Exploring User-Centered Explainable AI for Maritime Decision Support [0.0] 本稿では,海洋領域における効果的な人間-機械チーム構築の基盤として,説明可能なAI(XAI)の重要性を強調した。
本研究では,海洋専門家の信頼,ユーザビリティ,説明可能性に対する認識を捉えたドメイン固有調査を提案する。
我々の目的は、海運チームや海運チームのニーズに合わせた、ユーザ中心のXAIシステムの開発を奨励し、指導することである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:42:54 GMT)
From Pixels to Urban Policy-Intelligence: Recovering Legacy Effects of Redlining with a Multimodal LLM [0.0] 本稿では,マルチモーダル大規模言語モデル(MLLM)が都市における計測能力を拡大し,場所に基づく政策介入の追跡を支援する方法について述べる。
GPT-4oは、ストリートビュー画像上に構築された、合理的に見積もられたパイプラインを用いて、近隣の貧困と樹冠を推定し、1930年代のリライニングの遺産を評価する準実験的な設計に組み込む。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 16:42:01 GMT)
FragmentRetro: A Quadratic Retrosynthetic Method Based on Fragmentation Algorithms [0.0] 再合成はコンピュータ支援合成計画に不可欠である。
FragmentRetroは,フラグメンテーションアルゴリズムを利用した新しいレトロシンセティック手法である。
FragmentRetroは競合するランタイムで高い解決率を達成することを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:36:22 GMT)
Fault-tolerant quantum computing with a high-rate symplectic double code [0.0] シンプレクティック・ダブルコードのためのフォールトトレラント・エンコーダを提案する。
この符号の利点は、高い符号化率に加えて、そのコンパクトさである。
また、任意の量子状態をコード空間に注入できる任意の状態エンコーダを開発した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:03:30 GMT)
Exploring dark matter with quantum-enhanced haloscopes and time projection chambers [0.0] この論文はダークマターの検出に対する実験的および理論的アプローチを探求している。
ダークマターは宇宙のエネルギーの27%を占める。
天体物理学と宇宙学の証拠をレビューし、標準模型の限界を強調し、WIMP、アクシオン、ダーク光子の探索を動機付けている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 12:19:18 GMT)
Explainable AI-Enhanced Supervisory Control for Robust Multi-Agent Robotic Systems [0.0] マルチエージェントロボットのためのAI強化型監視制御フレームワークを提案する。
我々は、このアプローチを、宇宙船形成飛行と自律水中車両の2つの対照的な領域で検証した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:59:13 GMT)
Evaluating undergraduate mathematics examinations in the era of generative AI: a curriculum-level case study [0.0] 我々は、ルッセルグループ大学の8つの学部数学試験に、GenAIを作成した。
GenAIの到達度は1級のレベルですが、現在のパフォーマンスはモジュールによって異なります。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 09:55:59 GMT)
Entanglement Structure of Non-Gaussian States and How to Measure It [0.0] 本稿では,実験的な相関関数による量子状態の制約を行うプロトコルを提案する。
この方法は量子状態の絡み合い構造の計測を可能にする。
提案プロトコルは,現在および今後の実験能力とともに有用であることを示す。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:17:32 GMT)
Ensemble of Pathology Foundation Models for MIDOG 2025 Track 2: Atypical Mitosis Classification [0.0] 病理基盤モデル(PFM)を大規模病理組織学データセットで事前訓練した。
我々はPFMを補完するために、最先端の畳み込みニューラルネットワークアーキテクチャであるConvNeXt V2を組み込んだ。
我々は,相補的な形態的洞察を統合するために複数のPFMをアンサンブルし,予備評価フェーズデータセット上でバランスの取れた精度を実現した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:00:25 GMT)
Enhancing business process execution with a context engine [0.0] 本稿では,ビジネスプロセス管理システムのコンテキスト認識性を高めるためのコンテキストエンジンを提案する。
提案されたアーキテクチャは、ビジネスルールとBPMシステムのよく知られた組み合わせと、CEPに基づいたコンテキストエンジンを拡張します。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:05:49 GMT)
Electrodynamics of carbon nanotubes with non-local surface conductivity [0.0] 非局所伝導性のモデルは、擬スピンに対するディラック方程式に適用されたKubo法に基づいて展開される。
非局所性のため、局所伝導度限界で消失する新しいタイプの固有モードが生成される。
ナノアンテナや他の電子機器の設計への潜在的な応用についても論じる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:38:43 GMT)
Do Vision-Language Models See Urban Scenes as People Do? An Urban Perception Benchmark [0.0] モントリオールの街路画像100枚を用いて,都市感における視覚言語モデル(VLM)の検証を行う。
結果は、主観的評価よりも、可視的で客観的な特性に対するモデルアライメントが強いことを示唆している。
我々は,参加型都市分析における再現性,不確実性を考慮した評価のためのベンチマーク,プロンプト,ハーネスをリリースする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:21:10 GMT)
Distances between pure quantum states induced by a distance matrix [0.0] 複素射影空間 $mathbbP(mathbbCn)$ 上で、無限の距離の族 $d_p$ を構築する。
この論文は、量子ワッサーシュタイン距離によって課される量子状態空間の幾何学に関する重要な疑問を解決し、初期の研究を大幅に拡張した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 08:23:33 GMT)
Dispersion Relations in Two- and Three-Dimensional Quantum Systems [0.0] 本研究は3次元量子格子モデルに対する分散関係計算の最初の実演である。
量子シミュレーション、フォトニック材料設計、量子情報プラットフォームのための強力なツールである。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:11:34 GMT)
Direct Video-Based Spatiotemporal Deep Learning for Cattle Lameness Detection [0.0] 本研究では,公開されているビデオデータを用いた牛の乳腺自動検出のためのフレームワークを提案する。
2つのディープラーニングアーキテクチャをトレーニングし、評価した。
3D CNNは、精度、リコール、85%の精度でビデオレベルの分類精度を90%達成し、ConvLSD2モデルを上回った。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:50:59 GMT)
Digital Engineering Transformation as a Sociotechnical Challenge: Categorization of Barriers and Their Mapping to DoD's Policy Goals [0.0] デジタルエンジニアリング(DE)変換は、システムエンジニアリングにおけるパラダイムシフトを表している。
制度的な支援にもかかわらず、多くのDEイニシアチブは、彼らの意図した利益を達成または達成できなかった。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 22:17:53 GMT)
Diagnostics of cognitive failures in multi-agent expert systems using dynamic evaluation protocols and subsequent mutation of the processing context [0.0] この研究は、専門家システムのための診断フレームワークを導入し、評価だけでなく、専門家行動のLSMエージェントへの転送を容易にする。
我々は,多エージェント採用支援システム上での枠組みを実証し,潜在的認知障害を明らかにした。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 19:08:03 GMT)
Deep Learning-Driven Multimodal Detection and Movement Analysis of Objects in Culinary [0.0] 本研究は、既存のモデルについて検討し、YOLOv8セグメンテーションモデル、手指の動きシーケンスに基づいて訓練されたLSTMモデルとASR(Whisper-base)を組み合わせた微調整を行う。
すべてのデータは著者によって収集され、複雑で困難な環境でベストを尽くす、堅牢なタスク特定システムを実現する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 05:06:19 GMT)
Deciding how to respond: A deliberative framework to guide policymaker responses to AI systems [0.0] 我々は自由の概念を運用することによって、補完的なアプローチを開発することができると主張している。
結果として得られるフレームワークは、コーディネート、コミュニケーション、決定空間を中心に構成されている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:30:53 GMT)
Data-Driven Prediction of Maternal Nutritional Status in Ethiopia Using Ensemble Machine Learning Models [0.0] 妊婦の栄養失調はエチオピアの主要な公衆衛生問題である。
従来の統計学的アプローチでは、栄養状態の複雑な多次元決定因子を捉えることができない。
本研究では,アンサンブル機械学習を用いた予測モデルを開発した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:31:40 GMT)
DSperse: A Framework for Targeted Verification in Zero-Knowledge Machine Learning [0.0] DSperseは、暗号検証による分散機械学習推論のためのフレームワークである。
複数の証明システムを用いてDSperseを評価し,メモリ使用量,実行時間,回路動作に関する実験結果を報告する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 03:15:13 GMT)
DACoN: DINO for Anime Paint Bucket Colorization with Any Number of Reference Images [0.0] DACoNは、基礎モデルを利用して、ライン描画でも部分レベルのセマンティクスをキャプチャするフレームワークである。
提案手法は,CNNから高分解能な空間的特徴を持つ基礎モデルから低分解能な意味的特徴を融合して,きめ細かな特徴抽出を行う。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 07:24:52 GMT)
Computing Linear Regions in Neural Networks with Skip Connections [0.0] ニューラルネットワークが線形写像である領域を計算するアルゴリズムを提案する。
ニューラルネットワークのトレーニングの難しさ、特にオーバーフィットの問題やスキップ接続の利点に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 21:27:43 GMT)
Can maiBERT Speak for Maithili? [0.0] Maithiliは何百万人もの人に話されているが、十分な計算資源がない。
Maithili 専用の BERT ベースの言語モデルであるmaiBERT を紹介する。
本モデルは,新たに構築したMaithiliコーパスを用いて学習し,ニュース分類タスクを通じて評価する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:11:18 GMT)
Blockchain-Enabled Explainable AI for Trusted Healthcare Systems [0.0] 本稿では、医療システムのためのa-Integrated Explainable AI Framework(BXHF)を紹介する。
我々は、安全なデータ交換と理解可能なAIによる臨床意思決定という、健康情報ネットワークに直面する2つの課題に取り組む。
当社のアーキテクチャにはブロックチェーンが組み込まれており、患者の記録が不変で、監査可能で、安全でないことが保証されています。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:17:19 GMT)
Beyond Stoquasticity: Structural Steering and Interference in Quantum Optimization [0.0] 独立集合(MIS)問題を解くための非確率量子アルゴリズムであるDIC-DAC-DOAアルゴリズムの理論解析について述べる。
このスピードアップの中核は、進化する基底状態が正と負の振幅の両方を発達させる能力にある。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:27:42 GMT)
Beyond Spherical geometry: Unraveling complex features of objects orbiting around stars from its transit light curve using deep learning [0.0] 我々は、シミュレーションされた光曲線から直接フーリエ係数を予測するために、ディープニューラルネットワークを訓練する。
その結果,ニューラルネットワークは低次楕円の再構築に成功していることがわかった。
ニューラルネットワークによって達成された再構築のレベルは、トランジットシステムから情報を取り出す手段として光曲線を使うことの有用性を裏付けている。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 11:44:10 GMT)
Benchmark of stylistic variation in LLM-generated texts [0.0] 本研究では,人間によって書かれたテキストと,大規模言語モデル(LLM)によって作成された同等のテキストのレジスタ変動について検討する。
同様の分析は、AI-Koditexコーパスとチェコの多次元モデルを用いてチェコで複製される。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 23:31:43 GMT)
Anti-Money Laundering Systems Using Deep Learning [0.0] 本稿では,世界金融産業におけるアンチ・モニー・ロンダリング(AML)の活動が果たす重要な役割について考察する。
これらの課題に対処するために,深層学習技術を用いたリンク解析を活かした高度なAMLシステムを提案する。
このシステムの中心には、Degree Centrality、Closeness Centrality、Interferness Centrality、PageRankといった中央集権アルゴリズムの利用がある。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 14:06:40 GMT)
Analyzing the Impact of Credit Card Fraud on Economic Fluctuations of American Households Using an Adaptive Neuro-Fuzzy Inference System [0.0] 拡張ANFISを用いて新しいハイブリッド解析法を提案する。
このモデルは、歴史的トランザクションデータとマクロ経済指標に基づいて離散ウェーブレット変換を行い、局所的な経済ショック信号を生成する。
実験の結果、RMSEは局所神経ファジィモデルや従来のLSTMモデルと比較して17.8%減少した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 20:09:07 GMT)
An Outcome-Based Educational Recommender System [0.0] OBER-an Outcome-Based Educational Recommenderは学習結果と評価項目を直接データスキーマに埋め込む。
OBERは最小限のエンティティ-リレーションモデル、ログ駆動のマスタリー式、プラグインアーキテクチャを使用する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 18:18:03 GMT)
An Artificial Intelligence Driven Semantic Similarity-Based Pipeline for Rapid Literature [0.0] セマンティックな類似性を利用して文献レビューを行うための自動パイプラインを提案する。
この研究は、トランスフォーマーベースの埋め込みとコサイン類似性を利用することにより、最小限のオーバーヘッドと高い関連性を強調する。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 17:24:47 GMT)
A unified picture for quantum Zeno and anti-Zeno effects -- a review [0.0] 量子ゼノ効果は、選択的および非選択的の測定の文脈で研究されている。
ゼノ効果と反ゼノ効果は、測定のようなプロセスが非可換進化と競合するときに現れる統一的な効果のレギュレーションとして明らかにされる。
量子ゼノ効果は、短期量子コンピューティングの将来において、ユビキタスかつ必須である。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 04:30:58 GMT)
A new dataset and comparison for multi-camera frame synthesis [0.0] 我々は、カスタムに構築された高密度リニアカメラアレイを用いて、新しいマルチカメラデータセットを開発する。
我々は,古典的・深層学習フレーム補間器をビュー・イン・ビュー・イン・ビューニングのためのビュー・シンセサイザー法と比較した。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 15:26:41 GMT)
A Scalable and Interoperable Platform for Transforming Building Information with Brick Ontology [0.0] 本稿では,自動化構築における一般的な課題に対処するためのプラットフォームを提案する。
提案されたプラットフォーム開発の全体的な目標は、プロセスの半自動化である。
開発プラットフォーム内の履歴データのシームレスでオフラインの統合は、データセキュリティのリスクを最小限にする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 00:24:57 GMT)
A Plea for History and Philosophy of Statistics and Machine Learning [0.0] 統計学と機械学習の歴史と哲学の統合は、これまで以上に緊急である。
最近の人工推論の成功は、主に機械学習によって推進されている。
統合はまた、科学スペクトルの哲学のレベルでも現れる。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 10:12:59 GMT)
A Comparative Analysis of Transformer Models in Social Bot Detection [0.0] ソーシャルメディアは、今日の社会における重要なコミュニケーションの媒体となっている。
多くの当事者は人工的なユーザー(あるいはボット)を雇い、他人に真実を信じさせ、そのような当事者に有利な方法で行動するように仕向ける。
本稿では,エンコーダとデコーダ変換器を用いたボット検出モデルの有効性を比較することを目的とする。
論文参考訳(メタデータ) (Thu, 18 Sep 2025 13:15:16 GMT)