DD-Ranking: Rethinking the Evaluation of Dataset Distillation [223.3] 本稿では,統合評価フレームワークであるDD-Rankingと,異なる手法によって達成された真の性能改善を明らかにするための新しい総合評価指標を提案する。
DD-Rankingは、蒸留データセットの実際の情報強化に再焦点をあてることで、将来の研究の進展に対してより包括的で公正な評価基準を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:15:21 GMT)
Hunyuan-TurboS: Advancing Large Language Models through Mamba-Transformer Synergy and Adaptive Chain-of-Thought [190.9] Hunyuan-TurboSは、Transformer-Mamba Mixture of Expertsの大型ハイブリッドモデルである。
高いパフォーマンスと効率のバランスを保ち、推論コストを低く抑えている。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:11:53 GMT)
Large Language Models Post-training: Surveying Techniques from Alignment to Reasoning [185.5] 大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:38:28 GMT)
SeMv-3D: Towards Concurrency of Semantic and Multi-view Consistency in General Text-to-3D Generation [122.5] SeMv-3Dは、GT23D生成におけるセマンティックアライメントとマルチビュー一貫性を協調的に強化する新しいフレームワークである。
本稿では,TPL(Triplane Prior Learning)について紹介する。
我々はまた、一貫した任意のビュー合成を可能にする、三葉飛行機(SAT)における事前ベースセマンティックアライニング(Semantic Aligning)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:34:36 GMT)
Think Only When You Need with Large Hybrid-Reasoning Models [121.6] LHRM(Large Hybrid-Reasoning Model)
ユーザクエリのコンテキスト情報に基づいて思考を行うか否かを適応的に決定できるモデル。
実験の結果, LHRMsは, 様々な難易度, 種別の問合せに対して, 適応的にハイブリッド思考を行うことができた。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:17:34 GMT)
When Less Language is More: Language-Reasoning Disentanglement Makes LLMs Better Multilingual Reasoners [111.5] 言語固有のアブレーションは多言語推論性能を継続的に向上させることを示す。
トレーニング後のアブレーションと比較して、トレーニング不要のアブレーションは、計算オーバーヘッドを最小限に抑えながら、同等または優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:35:05 GMT)
Inference via Interpolation: Contrastive Representations Provably Enable Planning and Inference [110.5] 時系列データを考えると、“今後どうなるか?”や“どうやって来たのか?”といった質問に答えるにはどうすればよいでしょう?
これらの質問は、学習された表現の観点から、いかにコンパクトで閉じた形状の解が得られるかを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:05:51 GMT)
Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method [108.6] 本研究では,乱数から発散する概念に触発された偏差に基づくキャリブレーション手法を導入し,プリトレーニングデータ検出のためのトークン確率のキャリブレーションを行う。
我々は,中国語テキスト上でのLLMの検出手法の性能を評価するために,中国語のベンチマークであるPatentMIAを開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:41:29 GMT)
Self-GIVE: Associative Thinking from Limited Structured Knowledge for Enhanced Large Language Model Reasoning [103.2] Graph Inspired Veracity Extrapolation (GIVE)は、知識グラフ(KG)を用いて構造化知識を外挿する。
本稿では,自動連想思考による大規模言語モデルの拡張を目的とした検索RLフレームワークであるSelf-GIVEを提案する。
Self-GIVEは、構造化された検索と推論と連想的思考とのスケーラブルな統合を強化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:30:55 GMT)
BanditSpec: Adaptive Speculative Decoding via Bandit Algorithms [102.0] 大規模言語モデル(LLM)の推論を高速化する一般的な手法として、投機的復号法が登場した。
本稿では,テキスト生成時に投機的復号化のためのハイパーパラメータの設定を適応的に選択する学習自由オンライン学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:56:31 GMT)
SWE-smith: Scaling Data for Software Engineering Agents [100.3] SWE-smithは、大規模なソフトウェアエンジニアリングトレーニングデータを生成するための新しいパイプラインである。
128のGitHubリポジトリからソースされた50kインスタンスのデータセットを作成します。
我々はSWE-agent-LM-32Bをトレーニングし、SWE-bench Verifiedベンチマークで40.2%のPass@1リゾルバ率を達成した。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:21:45 GMT)
Interspatial Attention for Efficient 4D Human Video Generation [98.4] 本稿では,現代的なビデオ生成モデルのための拡張性のあるビルディングブロックとして,新しい空間間アテンション(ISA)機構を導入する。
ISAは人間のビデオの生成に適した相対的な位置エンコーディングを利用する新しいタイプのクロスアテンションである。
本モデルは,4次元映像合成における最先端性能を実現し,動作の一貫性とアイデンティティの保存性を実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:53:47 GMT)
An Information Theory-inspired Strategy for Automatic Network Pruning [97.0] 深層畳み込みニューラルネットワークは、リソース制約のあるデバイスで圧縮されることがよく知られている。
既存のネットワークプルーニング手法の多くは、人的努力と禁忌な計算資源を必要とする。
本稿では,自動モデル圧縮のための情報理論に基づく戦略を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:34:56 GMT)
Fundamental Limits of Hierarchical Secure Aggregation with Cyclic User Association [93.5] 階層的なセキュアな集約は、連合学習によって動機づけられる。
本稿では,各ユーザが連続する$B$のリレーに接続される循環型アソシエーションパターンを用いたHSAについて考察する。
本稿では、勾配符号化にインスパイアされた入力に対するメッセージ設計を含む効率的なアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:35:06 GMT)
How Should We Enhance the Safety of Large Reasoning Models: An Empirical Study [90.3] 大規模推論モデル(LRM)は数学やプログラミングのような推論集約的なタスクにおいて顕著な成功を収めた。
しかし、その強化された推論能力は必ずしも安全性能の向上に必ずしも寄与しない。
スーパーバイザード・ファイン・チューニング(Supervised Fine-Tuning)によるLEMの安全性向上に関する総合的な実証研究について述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:45:29 GMT)
X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography [89.8] X線ガウス再構成モデル(X-GRM)はスパースビュー2次元X線投影から3次元CTを再構成するための大型フィードモデルである。
X-GRMはスケーラブルなトランスフォーマーベースのアーキテクチャを使用して、任意の数のスパースX線入力を符号化し、異なるビューからのトークンを効率的に統合する。
X-GRMのトレーニングを支援するため,さまざまな臓器に約15,000個のCT/X線ペアを含む大規模CT再構成データセットであるReconX-15Kを収集した。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:14:10 GMT)
Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis [89.6] 後学習量子化(PTQ)技術は大規模言語モデル(LLM)圧縮に広く採用されている。
既存のアルゴリズムは主にパフォーマンスに重点を置いており、モデルサイズ、パフォーマンス、量子化ビット幅間のトレードオフを見越している。
本稿では LLM PTQ のための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:11:19 GMT)
FLARE: Robot Learning with Implicit World Modeling [87.8] $textbfFLARE$は、予測潜在世界モデリングをロボットポリシー学習に統合する。
$textbfFLARE$は最先端のパフォーマンスを実現し、これまでのポリシー学習のベースラインを最大26%上回っている。
この結果は、暗黙の世界モデリングと高周波ロボット制御を組み合わせた汎用的でスケーラブルなアプローチとして$textbfFLARE$を確立した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:33:27 GMT)
Ada-R1: Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization [86.6] 適応的で効率的な推論のための新しい2段階のフレームワークを提案する。
まず、長いCoTモデルと短いCoTモデルを組み合わせてハイブリッド推論モデルを構築する。
第二に、モデルに適切な推論スタイルを選択するための2段階の選好訓練を適用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:59:38 GMT)
KaFT: Knowledge-aware Fine-tuning for Boosting LLMs' Domain-specific Question-Answering Performance [84.0] Supervised Fine-tuning (SFT)は、大規模言語モデル(LLM)のドメイン固有質問応答(QA)性能を改善するための一般的なアプローチである。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:55:28 GMT)
EcomScriptBench: A Multi-task Benchmark for E-commerce Script Planning via Step-wise Intention-Driven Product Association [83.5] 本稿では,E-Commerce Script Planning(EcomScript)の課題を3つの逐次サブタスクとして定義する。
本稿では,各ステップに製品を関連付けることで,拡張性のある製品リッチスクリプトの生成を可能にする新しいフレームワークを提案する。
最初の大規模なEcomScriptデータセットであるEcomScriptBenchを構築しました。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:21:38 GMT)
Instruction-Tuning Data Synthesis from Scratch via Web Reconstruction [83.0] Web Restruction(WebR)は、Webドキュメントから直接高品質な命令チューニング(IT)データを合成するための、完全に自動化されたフレームワークである。
WebRが生成したデータセットは、4つのインストラクションフォローベンチマークで、最先端のベースラインを最大16.65%上回ります。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:54:15 GMT)
Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation [82.4] 低品質データから高品質な生成モデルをトレーニングするための驚くほど効果的で斬新なアプローチであるDSD(Denoising score distillation)を導入する。
DSDはノイズの多い劣化したサンプルにのみ拡散モデルを事前訓練し、精製されたクリーンな出力を生成することができる1ステップの発電機に蒸留する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:09:44 GMT)
Emergence of human-like polarization among large language model agents [80.0] 我々は、何千もの大規模言語モデルエージェントを含むネットワーク化されたシステムをシミュレートし、それらの社会的相互作用を発見し、人間のような偏極をもたらす。
人間とLLMエージェントの類似性は、社会的分極を増幅する能力に関する懸念を提起するだけでなく、分極を緩和するためのもっともらしい戦略を識別するための貴重なテストベッドとして機能する可能性も持っている。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:51:09 GMT)
Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation [79.7] CoSynは、合成テキストリッチマルチモーダルデータを作成するフレームワークである。
高品質な命令チューニングデータを生成することができる。
また、合成ポインティングデータを生成し、視覚言語モデルで入力画像内の情報をグラウンドできる。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:42:25 GMT)
KORGym: A Dynamic Game Platform for LLM Reasoning Evaluation [79.0] 我々はKOR-BenchとGymnasiumに触発された動的評価プラットフォームであるKORGym(Knowledge Orthogonal Reasoning Gymnasium)を紹介する。
KORGymはテキストまたはビジュアル形式で50以上のゲームを提供し、強化学習シナリオによるインタラクティブでマルチターンアセスメントをサポートする。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:43:57 GMT)
SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model [77.9] 本稿では,SPA-VL と呼ばれる視覚言語モデルのための安全優先アライメントデータセットを提案する。
SPA-VLは6つの有害ドメイン、13のカテゴリ、53のサブカテゴリをカバーし、クエクション、画像、選択された応答、拒否された応答)の4倍体の100,788のサンプルを含んでいる。
実験により、SPA-VLデータセット上のアライメント技術でトレーニングされたモデルは、コア機能を維持しながら、無害性と有用性を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:55:10 GMT)
Be Careful When Fine-tuning On Open-Source LLMs: Your Fine-tuning Data Could Be Secretly Stolen! [77.6] プロプライエタリなデータによるオープンソースのLarge Language Models(LLM)の微調整は、現在、ダウンストリーム開発者にとって標準のプラクティスとなっている。
オープンソースLLMの作成者は、後にプライベートな下流の微調整データを抽出することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:32:14 GMT)
Meta-Design Matters: A Self-Design Multi-Agent System [76.4] 大規模言語モデル(LLM)の印象的な機能を活用するマルチエージェントシステム(MAS)は、複雑なタスクに対処する大きな可能性を秘めている。
現在、ほとんどのMASは手動で設計されたエージェントロールと通信プロトコルに依存している。
自動MAS設計のための自己教師型推論時間専用フレームワークSELF-MASを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:56:09 GMT)
From Problem-Solving to Teaching Problem-Solving: Aligning LLMs with Pedagogy using Reinforcement Learning [76.1] 大規模言語モデル(LLM)は教育を変換することができるが、直接質問応答のための最適化はしばしば効果的な教育を損なう。
オンライン強化学習(RL)に基づくアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:00:07 GMT)
Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models [75.9] SAGE(Sentient Agent as a Judge)は、大規模言語モデルの評価フレームワークである。
SAGEは人間のような感情の変化や内的思考をシミュレートするSentient Agentをインスタンス化する。
SAGEは、真に共感的で社会的に適応的な言語エージェントへの進捗を追跡するための、原則付き、スケーラブルで解釈可能なツールを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:45:40 GMT)
PoseX: AI Defeats Physics Approaches on Protein-Ligand Cross Docking [74.8] PoseXは、セルフドッキングとクロスドッキングの両方を評価するためのオープンソースのベンチマークである。
23のドッキング法を3つの方法論カテゴリに組み込んだ。
我々は,コンフォメーションエネルギーを最小化し,結合ポーズを洗練するために,後処理の緩和法を開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:15:35 GMT)
Automated Data Augmentation for Few-Shot Time Series Forecasting: A Reinforcement Learning Approach Guided by a Model Zoo [74.0] 本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。
我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:29:57 GMT)
How to Enable Effective Cooperation Between Humans and NLP Models: A Survey of Principles, Formalizations, and Beyond [73.6] 我々は、その原則、形式化、オープンな課題を探求し、人間-モデル協力の徹底的なレビューを行う。
既存のアプローチを要約する統一的な視点を提供する新しい分類法を導入する。
また、潜在的なフロンティア領域とその対応課題についても論じる。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:48:00 GMT)
Rethinking Link Prediction for Directed Graphs [73.4] 有向グラフのリンク予測は、様々な現実世界のアプリケーションにとって重要な課題である。
埋め込み手法とグラフニューラルネットワーク(GNN)の最近の進歩は、有望な改善を示している。
本稿では,既存手法の表現性を評価する統一的なフレームワークを提案し,二重埋め込みとデコーダ設計がリンクの有向予測性能に与える影響を強調した。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:07:55 GMT)
Visual Thoughts: A Unified Perspective of Understanding Multimodal Chain-of-Thought [72.9] 大規模視覚言語モデル(LVLM)の性能と解釈性を改善するマルチモーダル・チェーン・オブ・シント(MCoT)
我々は,MCoTフォーマットによらず,画像情報を推論プロセスに伝達する視覚的思考を取り入れることで,MCoTがLVLMを促進することを示す。
また、視覚的思考の内部的な性質を探求し、視覚的思考が入力画像と深いトランスフォーマー層への推論の間の仲介として機能することを発見した。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:29:58 GMT)
ModelingAgent: Bridging LLMs and Mathematical Modeling for Real-World Challenges [72.2] ModelingBenchは、様々な領域にわたる数学モデリングの競争から、現実に着想を得たオープンエンドの問題を特徴付ける新しいベンチマークである。
これらのタスクには、自然言語を形式的な数学的定式化に翻訳し、適切なツールを適用し、構造化された防御可能なレポートを生成する必要がある。
ツール使用をコーディネートするマルチエージェントフレームワークである ModelingAgent も紹介します。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:33:23 GMT)
SQL Injection Jailbreak: A Structural Disaster of Large Language Models [71.6] 大規模言語モデル(LLM)は、有害なコンテンツを生成するよう誘導するジェイルブレイク攻撃の影響を受けやすい。
本稿では,LLMの外部特性をターゲットとした新しいジェイルブレイク手法を提案する。
ユーザプロンプトにジェイルブレイク情報を注入することで、SIJは有害なコンテンツを出力するモデルをうまく誘導する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:29:45 GMT)
BARE: Leveraging Base Language Models for Few-Shot Synthetic Data Generation [71.5] 現在のデータ生成法は、数万の例を含むシードセットに依存して、命令調整されたモデルを実行している。
いくつか例を挙げると、インストラクションチューニングモデルでは、下流タスクの多様性が不十分であることが分かる。
本研究では,ベースモデルの多様性と命令調整モデルの品質保証を両立させる新しい2段階手法であるBase-Refineを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:50:43 GMT)
SpaceR: Reinforcing MLLMs in Video Spatial Reasoning [70.7] ビデオ空間推論は、既存のマルチモーダル大言語モデル(MLLM)にとって重要な課題である
この制限は主に、1)このタスクに高品質なデータセットがないこと、2)空間推論能力を開発するための効果的なトレーニング戦略がないことに由来する。
空間推論能力のアンロックにおける強化学習(Reinforcement Learning with Verifiable Reward, RLVR)の成功により, RLVRパラダイムを通じて映像空間推論におけるMLLMの改善を目指す。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:38:44 GMT)
OceanChat: The Effect of Virtual Conversational AI Agents on Sustainable Attitude and Behavior Change [70.2] 本論文では,大規模言語モデルを活用した対話型システムであるOceanChatについて述べる。
人類同型と種認証のバランスをとることで、OceanChatは、インタラクティブな物語が環境知識と現実世界の行動変化のギャップを埋める方法を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:19:16 GMT)
Chain-of-Focus: Adaptive Visual Search and Zooming for Multimodal Reasoning via RL [70.1] 視覚言語モデル(VLM)は、様々なコンピュータビジョンタスクにおいて印象的な性能を達成している。
本稿では,キー画像領域に適応的な焦点付けとズームインを行うことができるChain-of-Focus(CoF)手法を提案する。
教師付き微調整と強化学習を含む2段階の訓練パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:18:15 GMT)
TongUI: Building Generalized GUI Agents by Learning from Multimodal Web Tutorials [70.1] リッチなマルチモーダルWebチュートリアルから学習し,汎用GUIエージェントを構築するTongUIフレームワークを提案する。
我々は、5つのオペレーティングシステムと200以上のアプリケーションにまたがる143Kトラジェクトリデータを含むGUI-Netデータセットを作成する。
我々はGUI-Net上でQwen2.5-VL-3B/7Bモデルを微調整してTongUIエージェントを開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:22:57 GMT)
Boost Post-Training Quantization via Null Space Optimization for Large Language Models [68.8] 既存の大規模言語モデル(LLM)の学習後量子化手法は驚くべき成功を収めている。
余分な性能向上は、既存の量子化戦略がより圧縮されたモデルの開発を支援するには不十分であることを示唆している。
我々は、量子化後の重みを入力アクティベーションのヌル空間内に配置することで、量子化誤差を効果的に緩和することができると論じる。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:07:07 GMT)
NL-Debugging: Exploiting Natural Language as an Intermediate Representation for Code Debugging [68.4] 大規模言語モデル(LLM)の最近の進歩は、コード関連タスクを強化するために自然言語推論を活用することに注意を向けている。
本稿では,自然言語を中間表現として用い,コード改善のための新しいフレームワークであるNL-GINGを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:38:50 GMT)
CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation [67.4] 我々はtextbfCLass-incremental textbfIm Balance-aware textbf3DIS の統一フレームワークを提案する。
提案手法は, 先行研究を最大16.76%まで上回り, セマンティックセマンティックセマンティックセマンティクスでは約30%のmIoUを達成している。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:24:42 GMT)
Uncertainty Quantification for LLMs through Minimum Bayes Risk: Bridging Confidence and Consistency [66.9] 大規模言語モデル(LLM)のための不確実性定量化(UQ)手法は、様々なアプローチを含んでいる。
本稿では,モデル信頼度と出力整合性を統合する新しい手法を提案する。
我々は,質問応答,抽象要約,機械翻訳など,様々なタスクに対するアプローチを評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:24:49 GMT)
Evaluating Judges as Evaluators: The JETTS Benchmark of LLM-as-Judges as Test-Time Scaling Evaluators [66.8] 本稿では,テスト時間スケーリングベンチマークの判定評価について紹介する。
3つのタスク設定の下で、3つのドメイン(推論、コード生成、命令従)での判定性能を評価する。
我々のベンチマークは、審査員が再評価において結果報酬モデルと競合する一方で、ビームサーチにおけるプロセス報酬モデルよりも一貫して悪いことを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:42:20 GMT)
Learning to Rank Chain-of-Thought: An Energy-Based Approach with Outcome Supervision [66.8] 本稿では,エネルギ・アウトカム・リワード・モデル(EORM)について紹介する。
数学的ベンチマークでは、EORMは最終回答の精度を大幅に改善する(例えば、Llama 3 8B、GSM8kで90.7%、MATHで63.7%)。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:06:29 GMT)
Graph Foundation Models: A Comprehensive Survey [66.7] Graph Foundation Models (GFMs)は、構造化データにスケーラブルで汎用的なインテリジェンスを提供することを目指している。
この調査は、GFMの概要を包括的に提供し、モジュラーフレームワークの下での多様な取り組みを統合する。
GFMは構造化データに対するオープンエンド推論の基盤となる。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:08:00 GMT)
Finding the Sweet Spot: Preference Data Construction for Scaling Preference Optimization [66.7] 本研究の目的は、繰り返しランダムサンプリングにより、オンラインサンプルの数を増大させ、アライメント性能を向上させることである。
実験の結果,サンプルサイズが大きくなるにつれて,この戦略がエフェデクリンの性能向上につながることが明らかとなった。
サンプルの規模が大きくなるにつれてモデル性能を継続的に向上するスケーラブルな嗜好データ構築戦略を導入する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:53:32 GMT)
Ca2-VDM: Efficient Autoregressive Video Diffusion Model with Causal Generation and Cache Sharing [66.7] Ca2-VDMは、Causal生成とキャッシュ共有を備えた効率的な自己回帰VDMである。
因果生成のために一方向の特徴計算を導入し、前回の自己回帰ステップで条件付きフレームのキャッシュをプリ計算できるようにする。
キャッシュ共有では、巨大なキャッシュストレージコストを避けるために、すべてのデノナイズステップでキャッシュを共有する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:38:01 GMT)
AsynFusion: Towards Asynchronous Latent Consistency Models for Decoupled Whole-Body Audio-Driven Avatars [65.5] 全体オーディオ駆動型アバターポーズと表現生成は、生命に似たデジタル人間を作るための重要なタスクである。
本稿では,拡散変換器を応用し,結合表現とジェスチャ合成を実現する新しいフレームワークAsynFusionを提案する。
AsynFusionは、リアルタイムで同期された全身アニメーションを生成する際に最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:28:53 GMT)
Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors [65.3] テキスト検出を効果的に欺く訓練不要な方法である textbfContrastive textbfParaphrase textbfAttack (CoPA) を提案する。
CoPAは、大規模言語モデルによって生成される人間のような分布とは対照的に、補助的な機械的な単語分布を構築している。
我々の理論的分析は、提案された攻撃の優越性を示唆している。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:08:39 GMT)
Efficient Differentiable Approximation of Generalized Low-rank Regularization [64.7] 低ランク正規化(LRR)は様々な機械学習タスクに広く応用されている。
本稿では,LRRの効率的な微分可能近似を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:49:17 GMT)
General-Reasoner: Advancing LLM Reasoning Across All Domains [64.7] 強化学習(RL)は近年,大規模言語モデル(LLM)の推論能力の向上に強い可能性を示している。
本稿では,多分野にわたるLSM推論能力の向上を目的とした,新たなトレーニングパラダイムであるGeneral-Reasonerを提案する。
私たちは一連のモデルをトレーニングし、物理学、化学、金融、電子工学など幅広い分野をカバーする幅広いデータセットでそれらを評価します。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:55:36 GMT)
Single LLM, Multiple Roles: A Unified Retrieval-Augmented Generation Framework Using Role-Specific Token Optimization [64.3] RoleRAGは、ロール固有のトークン最適化を通じて効率的なマルチタスク処理を実現する統一的なRAGフレームワークである。
RoleRAGは6つのモジュールから構成され、それぞれがRAGプロセス内で特定のサブタスクを処理する。
クエリの分解を表すクエリグラフを導入し、分解状態に応じて動的に解決する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:25:12 GMT)
SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models [63.6] 本稿では,難しい例と簡単な例を区別するバイナリルータを提案する。
提案手法は、ルータが考慮するデータに対して、より大きな安全ガードモデルを選択的に適用し、精度を維持しながら効率を向上する。
複数のベンチマークデータセットによる実験結果から,適応モデルの選択により,計算コストと安全性性能のトレードオフが著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:38:31 GMT)
InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation [63.6] InfoDeepSeekは、現実世界の動的Web環境でエージェント情報を求めるための新しいベンチマークである。
本稿では,決定性,難易度,多様性の基準を満たす課題クエリを構築するための体系的手法を提案する。
本研究では,情報探索結果の正確性,有用性,コンパクト性に関する詳細な指標を含む,動的エージェント情報探索に適した最初の評価フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:44:40 GMT)
GATEAU: Selecting Influential Samples for Long Context Alignment [62.9] GATEAUは、長距離依存関係に富む影響力のあるサンプルを同定する。
実験結果から, GATEAUは有効に有効なサンプルを同定し, これらのサンプルに基づいてトレーニングしたモデルにより, より優れた指示追従能力と長文理解能力を示すことが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:31:56 GMT)
Soft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Space [62.5] ソフトシンキング(Soft Thinking)は、ソフトで抽象的な概念トークンを生成することによって、人間のような「ソフト」推論をエミュレートする訓練不要な手法である。
これらの概念トークンは、連続的な概念空間を形成するトークン埋め込みの確率重み付き混合によって生成される。
本質的に、生成された概念トークンは関連する離散トークンから複数の意味をカプセル化し、暗黙的に様々な推論経路を探索する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:29:15 GMT)
BountyBench: Dollar Impact of AI Agent Attackers and Defenders on Real-World Cybersecurity Systems [62.2] 我々は、現実世界のシステムを進化させる際に、攻撃的かつ防御的なサイバー能力を捕獲する最初の枠組みを紹介する。
脆弱性のライフサイクルを捉えるために、3つのタスクタイプを定義します。
Detectでは、脆弱性タイプにまたがって一般的な新しい成功指標を構築し、局所評価を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:44:52 GMT)
UWSAM: Segment Anything Model Guided Underwater Instance Segmentation and A Large-scale Benchmark Dataset [62.0] 大規模な水中インスタンスセグメンテーションデータセットであるUIIS10Kを提案する。
次に,水中インスタンスの自動・高精度セグメンテーションのための効率的なモデルであるUWSAMを紹介する。
複数の水中インスタンスデータセット上での最先端手法よりも優れた性能向上を実現し,本モデルの有効性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:36:01 GMT)
EvoMesh: Adaptive Physical Simulation with Hierarchical Graph Evolutions [61.9] EvoMeshは、グラフ階層と物理力学を共同で学習する、完全に差別化可能なフレームワークである。
EvoMeshは、最近の固定階層メッセージパッシングネットワークよりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:23:38 GMT)
Scalable Chain of Thoughts via Elastic Reasoning [61.8] Elastic Reasoningは、スケーラブルな思考の連鎖のための新しいフレームワークである。
推論は、独立して割り当てられた予算で、思考と解決の2つのフェーズに分けられる。
我々のアプローチは、制約のない設定でもより簡潔で効率的な推論をもたらす。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:40:27 GMT)
Scaling Diffusion Transformers Efficiently via $μ$P [61.6] 最小更新パラメトリゼーション(mu$P)は、小さな言語モデルから大規模な言語モデルへの安定したHP転送を可能にするバニラトランスフォーマーに対して提案された。
拡散変換器に標準の$mu$Pを一般化し、大規模実験によりその有効性を検証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:49:03 GMT)
Long-Form Information Alignment Evaluation Beyond Atomic Facts [60.3] 明示的な幻覚を導入することなく、真理のステートメントを"モンテージ"することで、偽りの物語を構築するベンチマークであるMontageLieを紹介します。
本稿では,事実の正確性とイベント順序の整合性を共同で検証する新しいフレームワークであるDoveScoreを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:46:38 GMT)
P3Net: Progressive and Periodic Perturbation for Semi-Supervised Medical Image Segmentation [60.1] 本研究では,非ラベルデータの学習を支援するために,進行的かつ周期的な摂動機構(P3M)と境界中心の損失を提案する。
提案手法は,2つの2次元および3次元データセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:35:28 GMT)
Let LLMs Break Free from Overthinking via Self-Braking Tuning [60.1] 大きな推論モデル(LRM)は思考の長い連鎖を生成することによって推論能力を著しく向上させた。
この性能向上は、生成プロセス中の冗長な推論を大幅に増加させるコストが伴う。
本稿では、モデルが独自の推論プロセスを制御することを許容する観点から、過度に検討する新しいフレームワーク、Self-Braking Tuning(SBT)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:45:44 GMT)
Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching [60.0] Chain-of-Thoughtはステップバイステップの問題解決を促すが、中間出力の過剰な冗長性を犠牲にすることが多い。
我々は,認知にインスパイアされた推論パラダイムを言語制約と統合する促進フレームワークであるSketch-of-Thought(SoT)を提案する。
SoTはトークンを最大78%削減し、15の推論データセットで最小限の精度損失を発生させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:47:26 GMT)
lmgame-Bench: How Good are LLMs at Playing Games? [60.0] 本稿では,現代の大規模言語モデル (LLM) エージェントを評価するために,人気ゲームを使用する上での大きな課題について検討する。
我々はlmgame-Benchを導入し、ゲームを信頼性評価に変換する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:02:55 GMT)
AnyBody: A Benchmark Suite for Cross-Embodiment Manipulation [59.7] ロボット工学におけるスケーラブルで伝達可能な学習を実現する上で、新しい実施形態に対する制御ポリシーの一般化は、依然として根本的な課題である。
本稿では,多種多様な形態素を横断する2つの基礎的タスクリーチとプッシュアラウンドに着目し,クロスボデーメント操作の学習のためのベンチマークを紹介する。
異なるRLポリシーが複数の形態から学習し、新しい政策に一般化する能力を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:21:38 GMT)
LENS: Multi-level Evaluation of Multimodal Reasoning with Large Language Models [59.0] Lensは3.4Kの現代画像と8つのタスクと12の日次シナリオをカバーする60K以上の人間による質問のベンチマークである。
このデータセットは本質的に、基本的な知覚から構成的推論に至るまで、画像不変のプロンプトを処理するためのMLLMの評価をサポートする。
我々は,Qwen2.5-VL-72B,InternVL3-78B,GPT-4oおよび2つの推論モデルQVQ-72B-previewとKim-VLなどの15以上のフロンティアMLLMを評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:06:59 GMT)
AuxDet: Auxiliary Metadata Matters for Omni-Domain Infrared Small Target Detection [58.7] シーン認識最適化のためのテキストメタデータを組み込むことにより、IRSTDパラダイムを再定義する新しいIRSTDフレームワークを提案する。
AuxDetは最先端の手法を一貫して上回り、堅牢性と正確性を改善する上で補助情報の重要な役割を検証している。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:02:05 GMT)
Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.5] 独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:16:44 GMT)
Tversky Neural Networks: Psychologically Plausible Deep Learning with Differentiable Tversky Similarity [58.5] 我々は、勾配降下によって学習可能なトヴェルスキーの類似性の微分可能なパラメータ化を開発する。
トヴェルスキー射影層は線形射影層に有利な置換であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:01:48 GMT)
Predictable Scale: Part I -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining [58.3] 最適な学習速度は、モデルパラメータとデータサイズの両方とのパワー-法則関係に従うが、最適なバッチサイズは、主にデータサイズでスケールする。
この研究は、Mixture-of-Expertsモデルや高密度トランスなど、異なるモデル形状と構造を統一する最初の研究である。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:48:37 GMT)
Aligning Dialogue Agents with Global Feedback via Large Language Model Reward Decomposition [57.7] 本稿では,対話エージェントを協調する大規模言語モデルに基づく報酬分解フレームワークを提案する。
凍結した事前訓練された大きな言語モデルの推論能力を利用して、きめ細かい局所的な暗黙の報酬を推測する。
我々は、テキストのみとマルチモーダルの両方の変種を、最先端の報酬分解法に対して評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:19:45 GMT)
HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases [57.5] 大規模言語モデル(LLM)は、ハードウェア設計タスクにおいてその可能性を実証している。
しかし、実際のリポジトリレベルのHDLプロジェクトでのパフォーマンスは、数千から数万のコード行で妨げられています。
グラフ検索拡張生成(Graph RAG)とLLMを統合する新しいフレームワークであるHDLxGraphを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:14:10 GMT)
CLEVER: A Curated Benchmark for Formally Verified Code Generation [57.5] $rm Csmall LEVER$は、リーンにおけるエンドツーエンドのコード生成のための161の問題を、高品質でキュレートしたベンチマークである。
それぞれの問題は、(1)堅実な仕様と一致する仕様を生成するタスク、(2)この仕様を確実に満足するリーン実装を生成するタスクで構成されています。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:14:32 GMT)
ChestX-Reasoner: Advancing Radiology Foundation Models with Reasoning through Step-by-Step Verification [57.2] ChestX-Reasoner(チェストX-Reasoner)は、臨床報告から直接採掘されるプロセスの監督を活用するために設計された放射線診断MLLMである。
我々の2段階のトレーニングフレームワークは、モデル推論と臨床標準との整合性を高めるために、プロセス報酬によって指導された教師付き微調整と強化学習を組み合わせる。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:50:11 GMT)
Predicting generalization performance with correctness discriminators [56.9] 未確認データに対して,金のラベルを必要とせず,精度の上下境界を確立する新しいモデルを提案する。
予測された上境界と下限の間に金の精度が確実に成立する様々なタグ付け、構文解析、意味解析タスクを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:48:36 GMT)
MTR-Bench: A Comprehensive Benchmark for Multi-Turn Reasoning Evaluation [56.9] 大規模言語モデルに対するMTR-Benchの評価について述べる。
4つのクラス、40のタスク、3600のインスタンスを含むMTR-Benchは、様々な推論機能をカバーする。
MTR-Benchは、データセットの構築とモデル評価の両方にまたがる、完全に自動化されたフレームワークを備えている。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:12 GMT)
Learning to Reason via Mixture-of-Thought for Logical Reasoning [56.2] Mixture-of-Thought (MoT) は、LLMが自然言語、コード、真理表の3つの相補的なモダリティにまたがる推論を可能にするフレームワークである。
MoT は,(1) 自己進化型 MoT トレーニング,(2) 3 つのモーダルの相乗効果を完全に活用してより良い予測を生成する MoT 推論,という2段階の設計を採用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:54 GMT)
Procedural Environment Generation for Tool-Use Agents [55.4] 我々はRandomWorldを紹介した。これは対話型ツールと合成ツール利用データの手続き的生成のためのパイプラインである。
我々は,SFTとRLによるRandomWorldの合成データによるモデル調整により,様々なツール使用ベンチマークが改良されたことを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:10:06 GMT)
VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models [55.4] OpenAI o1とDeepSeek-R1は、推論の領域で素晴らしいパフォーマンスを達成した。
彼らのトレーニングの重要な要素は、強化学習に検証可能な報酬を取り入れることである。
既存の報酬ベンチマークでは、参照ベースの報酬システムの評価は行われていない。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:54:43 GMT)
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning [55.3] 複数の視覚知覚タスクの推論と解決が可能な統合フレームワークであるVisionReasonerを紹介する。
VisionReasonerは、検出、セグメンテーション、カウントという3つの重要な領域にまたがる10のタスクに対して評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:08:08 GMT)
Trajectory Bellman Residual Minimization: A Simple Value-Based Method for LLM Reasoning [55.3] 現在、政策に基づく手法が大規模言語モデル(LLM)推論のための強化学習パイプラインを支配している。
本稿では,このアイデアを LLM に自然に適応させるアルゴリズムである Trajectory Bellman Residual Minimization (TBRM) を紹介する。
我々は、軌道の軌道変更-測度分析の改善により、任意のオフ政治から、最適に近いKL正規化政策への収束を証明した。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:41:53 GMT)
Shaping the Safety Boundaries: Understanding and Defending Against Jailbreaks in Large Language Models [55.3] 大規模言語モデル(LLM)におけるジェイルブレークは、LLMを騙して有害なテキストを生成するというセキュリティ上の問題である。
我々は7つの異なるジェイルブレイク法を詳細に分析し、不一致が不十分な観察サンプルから生じることを確認した。
安全境界内でのアクティベーションを適応的に制限する「textbfActivation Boundary Defense (ABD)」という新しい防衛法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:47:23 GMT)
Continuous Representation Methods, Theories, and Applications: An Overview and Perspectives [55.2] 近年,実世界のデータ固有の構造を特徴付ける新しいパラダイムとして,連続表現法が登場している。
本総説では, 基礎関数表現, 統計モデル, テンソル関数分解, 暗黙的神経表現などの連続表現法設計, (ii) 近似誤差解析, 収束特性, 暗黙的正規化などの連続表現の理論的基礎, (iii) コンピュータビジョン, グラフィックス, バイオインフォマティクス, リモートセンシングなどの連続表現の現実的応用について述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:50:19 GMT)
UniErase: Unlearning Token as a Universal Erasure Primitive for Language Models [54.8] 学習可能なパラメトリック接尾辞(アンラーニングトークン)を用いて、ターゲットとなる忘れ行動に向けて言語モデルを操る新しいアンラーニングパラダイムであるUniEraseを紹介する。
UniEraseは、実世界の知識設定の下で、バッチ、シーケンシャル、そして正確なアンラーニングで、最先端のSOTA(State-of-the-art)パフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:53:28 GMT)
Mind the Gap: Bridging Thought Leap for Improved Chain-of-Thought Tuning [54.7] 本研究では,跳躍を自動的に検出し,中間的推論ステップを欠くことを目的としたCoT Thought Leap Bridge Taskを提案する。
ブリッジされたデータセットに微調整されたモデルが、元のデータセットでトレーニングされたモデルよりも一貫して優れていることを示す。
提案手法は, 蒸留データを効果的に向上させ, 強化学習の出発点として優れたものを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:02:34 GMT)
Unlocking the Power of SAM 2 for Few-Shot Segmentation [54.6] Few-Shot (FSS) は、少数のクラスでクラスに依存しないセグメンテーションを学習し、任意のクラスをセグメンテーションすることを目的としている。
近年、SAM 2は、クラスに依存しないマッチング能力を持つビデオセグメンテーションをサポートしてSAMを拡張している。
擬似クエリメモリを符号化するPseudo Prompt Generatorを設計し、クエリ機能と互換性のある方法でマッチングする。
さらに、メモリにより多くのクエリFG機能を融合させる反復メモリリファインメントを設計し、メモリの予期せぬクエリBG機能を抑制するためのサポートキャリブレーションメモリアテンションを考案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:47:37 GMT)
Diversity-Driven View Subset Selection for Indoor Novel View Synthesis [54.5] 本稿では、包括的多様性に基づく測定と、よく設計されたユーティリティ機能を統合する新しいサブセット選択フレームワークを提案する。
私たちのフレームワークは、データの5~20%しか使用せずに、ベースライン戦略を一貫して上回ります。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:42:41 GMT)
AGENTFUZZER: Generic Black-Box Fuzzing for Indirect Prompt Injection against LLM Agents [54.3] 本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジィングフレームワークであるAgentXploitを提案する。
我々は、AgentXploitをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:34:08 GMT)
dKV-Cache: The Cache for Diffusion Language Models [53.9] Diffusion Language Models (DLMs) は自己回帰型言語モデルにとって有望な競合と見なされている。
本稿では,DLMの復調過程に対するKVキャッシュ機構,遅延KVキャッシュを提案する。
我々のアプローチは、異なるトークンが拡散過程を通して異なる表現力学を持つという観察によって動機付けられている。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:32:10 GMT)
Mitigating Subgroup Disparities in Multi-Label Speech Emotion Recognition: A Pseudo-Labeling and Unsupervised Learning Approach [53.8] Implicit Demography Inference (IDI)モジュールはk平均クラスタリングを用いてカテゴリー音声感情認識(SER)のバイアスを軽減する
実験により,擬似ラベルIDIはサブグループの格差を減少させ,SERの精度を3%以下に抑えながら,フェアネスの指標を33%以上改善することが示された。
教師なしのIDIは人種と年齢格差を一貫して軽減し、明示的な人口統計情報が利用できないシナリオにおいてその可能性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:04:44 GMT)
Mobile-Agent-V: A Video-Guided Approach for Effortless and Efficient Operational Knowledge Injection in Mobile Automation [53.5] Mobile-Agent-Vは、動画をガイドツールとして活用し、モバイル自動化プロセスに運用知識を強制的かつ効率的に注入する革新的なフレームワークである。
ビデオコンテンツから直接知識を抽出することにより、Mobile-Agent-Vは手作業による介入を排除し、知識獲得に必要な労力と時間を著しく削減する。
実験の結果, Mobile-Agent-Vは既存手法に比べて36%向上した。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:28:49 GMT)
ReGUIDE: Data Efficient GUI Grounding via Spatial Reasoning and Search [53.4] ReGUIDEは、MLLMが自己生成的推論と空間認識的批判を通じてデータを効率的に学習することを可能にするWebグラウンドのためのフレームワークである。
実験により、ReGUIDEは複数のベンチマークでWebグラウンド性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:36:18 GMT)
Enhancing Large Language Models (LLMs) for Telecommunications using Knowledge Graphs and Retrieval-Augmented Generation [52.8] 大規模言語モデル(LLM)は、汎用自然言語処理タスクにおいて大きな進歩を遂げている。
本稿では,知識グラフ(KG)と検索拡張生成(RAG)技術を組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:55:47 GMT)
Certified Neural Approximations of Nonlinear Dynamics [52.8] 安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。
本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:22:20 GMT)
Streaming Sequence Transduction through Dynamic Compression [52.7] 本稿では,ストリーム上の効率のよいシーケンス・ツー・シーケンス・トランスダクションを設計した新しいトランスフォーマーモデルであるSTAR(Stream Transduction with Anchor Representations)を紹介する。
STARは入力ストリームを動的にセグメント化して圧縮アンカー表現を生成し、自動音声認識(ASR)においてほぼロスレス圧縮(12x)を達成する
STARは、音声とテキストの同時タスクにおいて、セグメンテーションとレイテンシ品質のトレードオフが優れており、レイテンシ、メモリフットプリント、品質が最適化されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:10:36 GMT)
Learning Interpretable Representations Leads to Semantically Faithful EEG-to-Text Generation [52.5] 我々は脳波からテキストへの復号に焦点をあて、後部崩壊のレンズを通して幻覚の問題に対処する。
脳波とテキスト間の情報容量のミスマッチを認め、デコードタスクをコア意味のセマンティックな要約として再設計する。
パブリックなZuCoデータセットの実験では、GLIMが一貫して、流動的なEEG基底文を生成することが示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:29:55 GMT)
From Tokens to Thoughts: How LLMs and Humans Trade Compression for Meaning [52.3] 人間は知識をセマンティック圧縮によってコンパクトなカテゴリに分類する。
大規模言語モデル(LLM)は、顕著な言語能力を示す。
しかし、その内部表現が、圧縮と意味的忠実性の間の人間のようなトレードオフにぶつかるかどうかは不明だ。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:29:00 GMT)
MoE-Loco: Mixture of Experts for Multitask Locomotion [52.0] 脚付きロボットのマルチタスク移動のためのフレームワークであるMoE-Locoを提案する。
本手法は,四足歩行と二足歩行をサポートしながら,多様な地形を扱える1つの政策を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:51:53 GMT)
GLTW: Joint Improved Graph Transformer and LLM via Three-Word Language for Knowledge Graph Completion [52.0] 我々は、KGの構造情報をエンコードし、それを大規模言語モデルにマージするGLTWと呼ばれる新しい手法を提案する。
具体的には、局所構造情報とグローバル構造情報の両方を効果的に符号化する改良されたグラフ変換器(iGT)を導入する。
また,KG内のすべてのエンティティを分類対象として用いたサブグラフに基づく多分類学習目標を開発し,学習効率を向上する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:57:35 GMT)
Collaborative Problem-Solving in an Optimization Game [52.0] 本稿では,エージェントが協調して2人プレイのトラベリングセールスマン問題を解く対話ゲームを紹介する。
我々のベストエージェントは、ゲームの45%を最適に自己プレイで解決します。
また、人間のユーザーとうまく協力し、馴染みのないグラフに一般化する能力も示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:15:35 GMT)
Understanding Synthetic Context Extension via Retrieval Heads [51.9] 本稿では,検索と推論を必要とする3つの長文タスクに対する合成データの微調整について検討する。
合成データに基づいてトレーニングされたモデルは、実際のデータには及ばないが、驚くべきことに、ミスマッチを解釈できる。
我々の結果は、合成データの微調整性能の解釈方法と、長期にわたる実世界の能力学習のためのより良いデータ作成方法に光を当てた。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:27:00 GMT)
BriLLM: Brain-inspired Large Language Model [51.8] BriLLMは非トランスフォーマー、非GPT、非伝統的な機械学習入出力制御型生成言語モデルである。
4000トークン,32次元ノード幅,16token長列予測機能,GPT-1に匹敵する言語モデル予測性能を備えた,中国語の最初の BriLLM バージョンをリリースする。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:02:30 GMT)
Intermediate Languages Matter: Formal Choice Drives Neurosymbolic LLM Reasoning [51.0] 形式言語の選択は構文的および意味論的推論能力の両方に影響を及ぼすことを示す。
平均的な文脈認識エンコーディングはLCMの推論に役立つが、コメントやマークダウン構文を使うことによる明らかな影響はない、と結論付けている。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:51:37 GMT)
Joint Resource Management for Energy-efficient UAV-assisted SWIPT-MEC: A Deep Reinforcement Learning Approach [50.5] 6G Internet of Things (IoT)ネットワークは、地上インフラストラクチャが利用できない遠隔地や災害シナリオにおいて、課題に直面している。
本稿では、指向性アンテナにより強化された新しい無人航空機(UAV)支援コンピューティングシステムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:03:07 GMT)
Seeing the Trees for the Forest: Rethinking Weakly-Supervised Medical Visual Grounding [50.5] 現在のモデルは、非効率な注意機構ときめ細かいトークン表現の欠如により、テキスト記述と病気領域を関連付けるのに苦労している。
本稿では、VLMの説明可能性マップを用いて、適切な画像特徴を識別する病原体認識プロンプト(DAP)を提案する。
DAPは3つの主要な胸部X線データセットの最先端手法と比較して、視覚的接地精度を20.74%向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:16:45 GMT)
MARS: Benchmarking the Metaphysical Reasoning Abilities of Language Models with a Multi-task Evaluation Dataset [50.4] 大きな言語モデル(LLM)は、一般化可能な推論能力を持つ意識的なエージェントとして機能する。
この能力は、イベントにおける無限の可能な変更をモデル化する複雑さのために、まだ探索されていない。
我々は,各ステップに対応する3つのタスクからなる最初のベンチマークMARSを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:30:48 GMT)
PixelWorld: Towards Perceiving Everything as Pixels [50.1] Perceive Everything as Pixels (PEAP)は、自然言語入力を単一のピクセル空間にレンダリングするためのベンチマークである。
実験の結果,PEAPは意味理解タスクにおいて,競争精度が向上することがわかった。
また、視覚情報とテキスト情報が密接に統合されている場合、ピクセルが前処理の複雑さを減らし、あらゆることを表現していることもわかりました。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:35:00 GMT)
A Deep Unrolling Model with Hybrid Optimization Structure for Hyperspectral Image Deconvolution [50.1] 本稿では,DeepMixと呼ばれるハイパースペクトルデコンボリューション問題に対する新しい最適化フレームワークを提案する。
これは3つの異なるモジュール、すなわちデータ一貫性モジュール、手作りの正規化器の効果を強制するモジュール、および装飾モジュールで構成されている。
本研究は,他のモジュールの協調作業によって達成される進歩を維持するために設計された,文脈を考慮した認知型モジュールを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:07:39 GMT)
Robust and Minimally Invasive Watermarking for EaaS [50.1] 組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。
編集はモデル抽出攻撃に対して脆弱であり、著作権保護の必要性を強調している。
そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:20:41 GMT)
Variations in Relevance Judgments and the Shelf Life of Test Collections [50.1] ニューラル検索設定における先行研究を再現し、評価者の不一致がシステムランキングに影響を及ぼさないことを示す。
我々は、新しい関係判断によって、いくつかのモデルが著しく劣化し、既にランク付け者としての人間の有効性に到達していることを観察した。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:54:57 GMT)
OpenFly: A Comprehensive Platform for Aerial Vision-Language Navigation [49.7] Vision-Language Navigation (VLN)は、言語命令と視覚的手がかりを活用してエージェントを誘導することを目的としており、AIの具体化において重要な役割を果たす。
各種レンダリングエンジン,多用途ツールチェーン,航空VLNの大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。
我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:40:06 GMT)
How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior [49.6] メモリは、大きな言語モデル(LLM)ベースのエージェントにおいて重要なコンポーネントである。
メモリ管理の選択がLLMエージェントの行動,特に長期的パフォーマンスに与える影響について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:35:01 GMT)
STAR-R1: Spacial TrAnsformation Reasoning by Reinforcing Multimodal LLMs [49.4] MLLM(Multimodal Large Language Models)は、様々なタスクにまたがる顕著な能力を示すが、空間的推論において人間よりもはるかに遅れている。
このギャップを変換駆動型視覚推論(TVR)を用いて検討する。
本稿では,STAR-R1を提案する。STAR-R1は単一ステージのRLパラダイムとTVRに適した微細な報酬機構を統合した新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:57:38 GMT)
ViQAgent: Zero-Shot Video Question Answering via Agent with Open-Vocabulary Grounding Validation [49.2] 本研究は、ゼロショットビデオ質問応答(VideoQA)のためのLCMブラインドエージェントを提案する。
Chain-of-Thoughtフレームワークと、YOLO-Worldと組み合わせて、オブジェクトのトラッキングとアライメントを強化する。
このアプローチは、NExT-QA、iVQA、ActivityNet-QAベンチマークのパフォーマンスを向上した、ビデオQAおよびビデオ理解における新しい最先端技術を確立する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:32:43 GMT)
Towards Holistic Evaluation of Large Audio-Language Models: A Comprehensive Survey [49.2] 我々は総合的な調査を行い、LALM評価のための体系的な分類法を提案する。
各カテゴリの詳細な概要と,この分野の課題について紹介する。
調査した論文の収集を公表し、現在進行中の分野の発展を支援するため、積極的に維持していく。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:17:29 GMT)
Statistical Collusion by Collectives on Learning Platforms [49.2] 集団は自身の利益に合わせるためにプラットフォームに影響を与えようとするかもしれない。
この方法でプラットフォームに影響を与えるためには、集団が実行しなければならない計算を理解することが不可欠である。
これらの問題を理論的かつアルゴリズム的に処理するフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:05:33 GMT)
Convergence of Adam in Deep ReLU Networks via Directional Complexity and Kakeya Bounds [49.2] Adamのような一階適応最適化手法は、現代のディープニューラルネットワークをトレーニングするためのデフォルトの選択肢である。
我々は,領域横断の制限を段階的に強化する多層改質フレームワークを開発した。
有効次元において,領域交差の数が指数的からほぼ直線的に崩壊することが証明された。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:34:16 GMT)
Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.1] 都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:57:10 GMT)
PhyX: Does Your Model Have the "Wits" for Physical Reasoning? [49.1] 既存のベンチマークでは、物理的な推論という、インテリジェンスの重要な側面を捉えられません。
視覚シナリオにおける物理基底推論のモデルキャパシティを評価するために設計された,最初の大規模ベンチマークであるPhyXを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:33:50 GMT)
FragFake: A Dataset for Fine-Grained Detection of Edited Images with Vision Language Models [48.9] FragFakeは、画像検出のための最初の専用のベンチマークデータセットである。
画像分類と編集領域ローカライゼーションのタスクにおいて,視覚言語モデル(VLM)を初めて使用した。
この研究は、視覚言語理解タスクとして、局所化画像編集検出を再構成した最初のものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:22:45 GMT)
Leveraging Unit Language Guidance to Advance Speech Modeling in Textless Speech-to-Speech Translation [48.8] 本稿では,2つのモデリング課題を克服する単位言語を提案する。
単位言語はテキストのような表現形式とみなすことができる。
我々は,音声モデリングプロセスの指導に単位言語を利用するために,マルチタスク学習を実装した。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:05:25 GMT)
Policy Testing in Markov Decision Processes [48.6] 本研究では,不確実性条件下での割引決定プロセス(MDP)におけるポリシーテスト問題について検討する。
目的は、与えられたポリシーの値が数値しきい値を超えるかどうかを決定することである。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:13:54 GMT)
Feature Extraction and Steering for Enhanced Chain-of-Thought Reasoning in Language Models [48.4] 大規模言語モデル(LLM)は、Chain-of-Thought(CoT)技術を用いて推論と数学的問題を解く能力を示す。
この研究はDeepSeek-R1の深い思考パラダイムにインスパイアされ、外部データセットを使わずにLCMの推論能力を高めるためにステアリング技術を利用している。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:17:59 GMT)
Seeing Through Deception: Uncovering Misleading Creator Intent in Multimodal News with Vision-Language Models [48.2] 本稿では,創造者の意図を明示的にモデル化することで,現実のマルチモーダルニュース作成をシミュレートする自動化フレームワークを提案する。
DeceptionDecodedは、信頼できる参照記事と一致した12,000のイメージキャプチャペアからなるベンチマークである。
我々は3つの意図中心のタスクに対して、14の最先端ビジョン言語モデル(VLM)の包括的な評価を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:14:32 GMT)
Bridging Sign and Spoken Languages: Pseudo Gloss Generation for Sign Language Translation [48.2] 手話翻訳は、手話動画を音声テキストにマッピングすることを目的としている。
一般的なアプローチは、中間表現としてのグロスアノテーションに依存している。
そこで我々は,人間に注釈付けされたグルースを不要とした光沢のない擬似グルース生成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:19:55 GMT)
NeSyGeo: A Neuro-Symbolic Framework for Multimodal Geometric Reasoning Data Generation [47.6] 幾何学的推論データを生成するためのニューラルシンボリックなフレームワークNeSyGeoを提案する。
我々は,大規模言語モデルにおける幾何学的推論能力を評価するためのベンチマークNeSyGeo-Testをリリースした。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:45:49 GMT)
Adaptive Temperature Scaling with Conformal Prediction [47.5] 本稿では,共形予測集合の要素にキャリブレーションされた確率を割り当てる最初の手法を提案する。
本手法では,適応キャリブレーション問題として,所望のカバレッジレベルに適合する入力固有温度パラメータを選択する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:18:15 GMT)
BusterX: MLLM-Powered AI-Generated Video Forgery Detection and Explanation [47.5] GenBuster-200Kは、200Kの高解像度ビデオクリップを備えた、大規模で高品質なAI生成ビデオデータセットである。
BusterXは、マルチモーダル大言語モデル(MLLM)と強化学習を活用した、AI生成のビデオ検出および説明フレームワークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:26:56 GMT)
Dataless Knowledge Fusion by Merging Weights of Language Models [47.4] 微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:53:00 GMT)
Unsupervised detection of semantic correlations in big data [47.2] 本稿では,2進数として表される高次元データにおける意味的相関を検出する手法を提案する。
本研究では,データ記述に必要な独立座標の最小個数を定量化するデータセットの2値固有次元を推定する。
提案アルゴリズムは, いわゆる次元の呪いとは無関係であり, ビッグデータ解析に利用することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:30:40 GMT)
Unlabeled Data or Pre-trained Model: Rethinking Semi-Supervised Learning and Pretrain-Finetuning [47.2] 半教師付き学習(SSL)は、ラベルのないデータを活用することにより、データラベリングプロセスのコストを軽減する。
プレトレイン・ネットワークのパラダイムは近年大きな注目を集めている。
この2つのパラダイムを公平に比較できるフレームワークであるtextitFew-shot SSLを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:23:40 GMT)
CodeI/O: Condensing Reasoning Patterns via Code Input-Output Prediction [47.2] 我々は,文脈的に構築されたコードに埋め込まれた多様な推論パターンを凝縮する新しい手法であるCodeI/Oを提案する。
与えられたコードとテストケースを完全に自然言語で予測するためにモデルをトレーニングすることで、それらを普遍的な推論プリミティブに公開します。
実験の結果、CodeI/Oは記号、科学、論理学、数学と数値、常識推論タスクに一貫した改善をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:38:27 GMT)
MMaDA: Multimodal Large Diffusion Language Models [47.0] マルチモーダル拡散基礎モデルの新たなクラスであるMMaDAを紹介する。
テキスト推論、マルチモーダル理解、テキスト・ツー・イメージ生成など、さまざまな領域で優れたパフォーマンスを実現するように設計されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:05 GMT)
A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment [46.8] 小型言語モデル(SLM)は、GPT-4のような大規模言語モデルに代わる費用対効果を提供する。
SLMは費用対効果のある代替手段を提供するが、その限られた能力は生物医学的な領域適応を必要とする。
本研究では,SLMを高性能な臨床モデルに適用するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:36:21 GMT)
The Agentic Economy [46.8] 我々は、消費者と企業の間のコミュニケーション摩擦を減らすことによる、より深い経済的な影響について論じる。
この変化は、市場を再編成し、電力を再分配し、新しい製品やサービスの創出を触媒する可能性がある。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:51:36 GMT)
DARWIN 1.5: Large Language Models as Materials Science Adapted Learners [46.7] DARWIN 1.5は,材料科学に適したオープンソースの大規模言語モデルである。
DARWINはタスク固有の記述子の必要性を排除し、材料特性の予測と発見に対する柔軟な統一的なアプローチを可能にする。
提案手法は,6Mの物質ドメイン論文と49,256の物質から得られた21の実験データセットを統合し,タスク間の知識伝達を可能にする。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:04:00 GMT)
Efficient Data Driven Mixture-of-Expert Extraction from Trained Networks [46.5] ビジョントランスフォーマーは様々なコンピュータビジョンタスクの最先端モデルとして登場した。
しばしば、コストのかかる再訓練や、スクラッチからトレーニングも必要となる。
近年の進歩は、事前学習ネットワークを利用することで、これらの計算コストを削減することを目的としている。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:55:25 GMT)
A Closer Look at Machine Unlearning for Large Language Models [46.2] 大型言語モデル(LLM)は機密または著作権のあるコンテンツを記憶し、プライバシーと法的懸念を高める。
LLMの機械学習におけるいくつかの問題について議論し、可能なアプローチについての洞察を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:52:08 GMT)
An approach to identify the most semantically informative deep representations of text and images [46.1] ディープニューラルネットワークは、セマンティック関連データに類似した表現を開発することが知られている。
本稿では,意味的関連データの表現の相対的情報量を測定する手法を提案する。
また、大規模言語モデルと視覚変換器の複数のトークンにエンコードする方法も検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:38:48 GMT)
ConvSearch-R1: Enhancing Query Reformulation for Conversational Search with Reasoning via Reinforcement Learning [45.4] 本稿では、強化学習を活用して外部リライト管理に依存しないフレームワークであるConvSearch-R1を提案する。
新たな2段階のアプローチは,検索誘導型自己蒸留によるコールドスタート問題に対処するために,セルフ駆動型ポリシーウォームアップと,従来型の検索指標における疎度問題に対処する特別に設計されたランクインセンティブ報酬形成機構を備えた検索誘導型強化学習を組み合わせたものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:27:42 GMT)
Bayesian Ensembling: Insights from Online Optimization and Empirical Bayes [45.2] ベイズモデル平均化(BMA)やベイズ積み重ねのような既存のアプローチを、新しい経験的ベイズレンズを通して再解釈する。
予測分布よりもログスコアを最適化してベイズモデルを適応的に組み合わせる手法である Online Bayesian Stacking (OBS) を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:19:08 GMT)
Reinforcement Learning on Dyads to Enhance Medication Adherence [45.0] 介入の配信をパーソナライズする新しいマルチエージェント強化学習(MARL)手法を提案する。
MARLフレームワークは、各エージェントが1つの介入コンポーネントのデリバリに責任を持つもので、フラット化されたエージェントと比較してより高速な学習を可能にする。
実際の臨床データに基づくダイアディック・シミュレーター環境による評価は,薬剤の付着性を大幅に改善した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:40:06 GMT)
A Comprehensive Evaluation of Large Language Models on Temporal Event Forecasting [45.0] 時間的事象予測のための大規模言語モデル(LLM)を総合的に評価する。
テキストによる微調整 LLM は性能を著しく向上させることができる。
しかし、LLMでは人気バイアスやロングテール問題などの問題が続いている。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:22:08 GMT)
Unraveling the iterative CHAD [45.0] Combinatory Homomorphic Automatic Differentiation (CHAD) はもともと、リバースモードADのためのセマンティクス駆動のソース変換として定式化された。
私たちはCHADを、潜在的に終端しない操作、実値条件、 while-loop のような反復構造といった機能を持つ部分言語に拡張します。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:10:40 GMT)
The Unreasonable Effectiveness of Entropy Minimization in LLM Reasoning [45.0] エントロピー最小化(EM)は、最も確実な出力にさらに確率質量を集中するようにモデルを訓練する。
この単純な目的だけでラベル付きデータなしでは、挑戦的な数学、物理学、コーディングタスクにおいて大きな言語モデルの性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:39:11 GMT)
Lost in Benchmarks? Rethinking Large Language Model Benchmarking with Item Response Theory [44.9] 商品の特徴とモデル能力の正確かつ信頼性の高い評価を行うための新しいフレームワークを提案する。
PSN-IRT は IRT-grounded アーキテクチャにアイテムパラメータの豊富なセットを組み込んでいる。
我々は,PSN-IRTがより小さなベンチマークを構築できると同時に,人間の嗜好との整合性を維持していることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:24:11 GMT)
AGENT-X: Adaptive Guideline-based Expert Network for Threshold-free AI-generated teXt detection [44.7] Agent-Xは、AI生成テキスト検出のためのゼロショットマルチエージェントフレームワークである。
我々は,検出ガイドラインを意味的,スタイリスティック,構造的次元に整理し,それぞれが専門的な言語エージェントによって独立に評価される。
メタエージェントは、信頼を意識したアグリゲーションを通じてこれらのアセスメントを統合し、しきい値のない解釈可能な分類を可能にする。
多様なデータセットの実験により、Agent-Xは精度、解釈可能性、一般化において最先端の教師付きおよびゼロショットアプローチを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:39:18 GMT)
From KAN to GR-KAN: Advancing Speech Enhancement with KAN-Based Methodology [44.6] Kolmogorov-Arnold Networks (KAN) の変種である Group-Rational Kan (GR-KAN) は、複雑なタスクのスケーラビリティを改善しながら、kan の表現性を保っている。
我々は、時間周波数(T-F)ドメインMP-SENetの高密度層をGR-KAN層に置き換え、時間周波数(T-F)ドメインの1D CNN層にGR-KANの活性化を適応させることにより、既存のDNNベースのSEにGR-KANを適用する。
Voicebank-DEMANDの結果,GR-KANのパラメータは最大4倍,PESQは最大0.1。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:41:45 GMT)
Hierarchical clustering with maximum density paths and mixture models [44.4] t-NEBは確率的に基底化された階層的クラスタリング法である。
自然な高次元データに対して最先端のクラスタリング性能が得られる。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:35:42 GMT)
MLEP: Multi-granularity Local Entropy Patterns for Universal AI-generated Image Detection [44.4] AI生成画像(AIGI)を効果的に検出する手法が緊急に必要である。
マルチグラニュラリティ局所エントロピーパターン (MLEP) を提案する。
MLEPは、画像のセマンティクスを著しく破壊し、潜在的なコンテンツバイアスを低減しながら、次元とスケールの画素関係を包括的にキャプチャする。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:22:01 GMT)
Improving LLM First-Token Predictions in Multiple-Choice Question Answering via Prefilling Attack [44.2] 大規模言語モデル(LLM)は、MCQA(Multiple-choice Question answering)タスクでますます評価される。
モデル出力に先立って、構造化された自然言語の接頭辞である*prefilling attack*(例: "*The correct option is:*")を提案する。
以上の結果から,プレフィルは複数選択設定におけるFTPベースの評価の信頼性を高めるための,シンプルで堅牢で低コストな手法であることが示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:58:38 GMT)
Unsupervised Learning for Optimal Transport plan prediction between unbalanced graphs [44.0] グラフ間の最適な転送は、グラフ構造の比較と整合のための強力なツールである。
本稿では、この問題を解決する方法として、不均衡輸送(ULOT)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:29:19 GMT)
Efficient Shapley Value-based Non-Uniform Pruning of Large Language Models [43.5] 大規模言語モデル(LLM)のプルーニングは、性能を保ちながら、モデルのサイズと計算の複雑さを減らすための有望なソリューションである。
LLMのためのShapley Value-based Non-Uniform Pruning (SV-NUP)法を提案する。
このアプローチは,各トランス層がモデル全体の性能に与える影響を定量的に評価し,各層に最適化されたプルーニング予算を割り当てることで,臨界パラメータを維持できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:38:25 GMT)
Property Enhanced Instruction Tuning for Multi-task Molecule Generation with Large Language Models [43.4] 分子関連タスクのための大規模言語モデルを改善するための2段階のフレームワークPEITを提案する。
最初のステップでは、PEIT-GENと呼ばれるモデルを事前訓練するために、テキスト記述、SMILES、生化学的特性をマルチモーダル入力として使用します。
2番目のステップでは、既存のオープンソースLCMを合成データで微調整し、PEIT-LLMは分子キャプション、テキストベースの分子生成、分子特性予測、新たに提案したマルチ制約分子生成タスクを処理できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:03:16 GMT)
Joint Flashback Adaptation for Forgetting-Resistant Instruction Tuning [43.3] 大規模言語モデルは様々なタスクで顕著な成功を収めた。
破滅的な忘れ物のために、彼らが新しいタスクを漸進的に学ぶことは難しい。
既存のアプローチは、経験のリプレイ、最適化の制約、タスクの差別化に依存している。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:45:28 GMT)
A-MEM: Agentic Memory for LLM Agents [42.5] 大規模言語モデル(LLM)エージェントは、歴史的経験を活用するためにメモリシステムを必要とする。
現在のメモリシステムは基本的なストレージと検索を可能にするが、洗練されたメモリ構造は欠如している。
本稿では, LLMエージェントに対して, エージェント方式で動的に記憶を整理できる新しいエージェントメモリシステムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:16:32 GMT)
ROUTE: Robust Multitask Tuning and Collaboration for Text-to-SQL [42.0] 我々は,オープンソースのText2用LLMの包括的機能を改善するために,RObust mUltitask Tuning and collaboration mEthod (ROUTE)を提案する。
提案手法は,tosql生成に関する各種合成トレーニングデータを用いて,マルチタスク制御ファインチューニング(SFT)から始める。
また,マルチタスク・コラボレーション・プロンプティング(MCP)戦略を導入し,スクル生成時の幻覚を低減する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:25:34 GMT)
MonoSplat: Generalizable 3D Gaussian Splatting from Monocular Depth Foundation Models [42.0] 我々は,事前学習した単分子深度基礎モデルからリッチな視覚的事前情報を活用する新しいフレームワークであるMonoSplatを紹介した。
提案手法は,モノクロ特徴を多視点表現に変換するMono-Multi Feature Adapterと,ガウス予測モジュールの2つの重要なコンポーネントから構成される。
我々はMonoSplatが既存の手法に比べて優れた再構築品質と一般化能力を実現することを実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:03:16 GMT)
NeoN: A Tool for Automated Detection, Linguistic and LLM-Driven Analysis of Neologisms in Polish [41.9] NeoNはポーランドのネオロジズムを検出し解析するためのツールである。
システムは文脈対応の補題化、周波数分析、正書法正規化を用いる。
LLMモジュールは定義を自動的に生成し、ドメインと感情によってネオロジズムを分類する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:09:31 GMT)
Ideal Gas Law for a Quantum Particle [41.9] 二次元キャビティ内に閉じ込められた単一量子粒子に対する理想気体法則(IGL)の有効性を検討する。
平均圧力については、放射圧の概念を直感的にベースとした2つの定義と、ビリヤード固有状態に有効な準直交関係を利用する2つの定義を用いる。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:25:35 GMT)
Streamline Without Sacrifice -- Squeeze out Computation Redundancy in LMM [41.8] 我々は,視覚トークンの計算レベルの冗長性を同定し,情報損失を確実にする。
本稿では,プロキシビジョントークンを用いた新しいアプローチであるProxyVを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:52 GMT)
SANER: Annotation-free Societal Attribute Neutralizer for Debiasing CLIP [41.6] CLIPのような大規模視覚言語モデルは、保護属性に関する社会的バイアスを含むことが知られている。
我々は,CLIPテキストの特徴情報から属性情報を取り除き,属性ニュートラル記述のみを除去する,SANERという単純なyet- Effective debiasing手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:16:20 GMT)
Denoising Concept Vectors with Sparse Autoencoders for Improved Language Model Steering [41.6] 本稿では,Sparse Autoencoder-Denoized Concept Vectors (SDCV)を提案する。
実測実験と特徴可視化によるノイズ仮説の検証を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:45:11 GMT)
Group Distributionally Robust Optimization with Flexible Sample Queries [41.4] グループ分散ロバスト最適化(GDRO)は、$m$の分散を同時に行うモデルを開発することを目的としている。
既存のGDROアルゴリズムは、イテレーション毎に1または$m$の固定数のサンプルしか処理できない。
我々はGDROアルゴリズムを開発し、1ラウンドあたりの任意のサンプルサイズを可変し、高い確率最適化誤差を$Oleft(frac1tsqrtsum_j=1t fracmr_jlog mright)$とする。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:41:16 GMT)
Effectively Controlling Reasoning Models through Thinking Intervention [41.4] Reasoning-enhanced large language model (LLM) は、最終回答を生成する前に、中間推論ステップを明示的に生成する。
本稿では,LLMの内部推論プロセスを明示的に導くための新しいパラダイムであるThinking Interventionを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:51:27 GMT)
Generative AI in Transportation Planning: A Survey [41.4] 我々は、交通計画においてGenAIを活用するための最初の包括的枠組みを提示する。
交通計画の観点から, 記述的, 予測的, 生成的, シミュレーション, 説明可能なタスクの自動化におけるGenAIの役割を検討する。
データ不足、説明可能性、バイアス軽減、ドメイン固有の評価フレームワークの開発など、重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:21:48 GMT)
"Did my figure do justice to the answer?" : Towards Multimodal Short Answer Grading with Feedback (MMSAF) [41.1] 本稿では、フィードバック(MMSAF)問題と2,197個のデータポイントを併用したマルチモーダルショートアンサーグレーディングを提案する。
評価の結果,既存のMLLM(Multimodal Large Language Models)では,解答が正解か正解かを55%の精度で予測することができた。
同様に、学生の回答に提供される画像が75%の精度で関連しているか否かを予測することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:42:16 GMT)
FedGraph: A Research Library and Benchmark for Federated Graph Learning [41.0] フェデレーショングラフ学習は、重要な実践上の課題を持つ新興分野である。
我々は,実践的な分散トレーニングを目的とした研究ライブラリであるFedGraphを紹介する。
FedGraphは最先端のグラフ学習メソッドをサポートし、システムパフォーマンスを評価するモニタリングクラスを含んでいる。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:05:44 GMT)
MCIP: Protecting MCP Safety via Model Contextual Integrity Protocol [40.4] 本稿では,モデルコンテキストプロトコルの安全性を高めるための新しいフレームワークを提案する。
MAESTRO フレームワークをベースとして,まず MCP に欠落する安全機構を解析する。
次に、MPPシナリオで観察されるさまざまな安全でない振る舞いをキャプチャする、きめ細かい分類法を開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:48:40 GMT)
Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective [40.3] 本稿では,長期文書検索においてLLMベースの埋め込みモデルよりも20%優れる拡散言語埋め込みモデルについて,最初の体系的研究を行う。
我々の分析は、双方向の注意が、長く複雑なテキストでグローバルなコンテキストを符号化するのに重要であることを検証している。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:59:14 GMT)
MoTE: Mixture of Task-specific Experts for Pre-Trained ModelBased Class-incremental Learning [39.9] クラスインクリメンタルラーニング(CIL)では、ストリーミングデータから新たな知識を継続的に取得するために、ディープラーニングモデルが必要である。
プロンプトベースのアプローチはプロンプトオーバーライトに悩まされ、アダプタベースの手法はタスク間の次元的ミスアライメントのような課題に直面している。
本稿では,不整合出力次元による誤判定を効果的に軽減するタスク特化専門家(MoTE)フレームワークの混合を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:06:10 GMT)
Mechanistic evaluation of Transformers and state space models [39.8] 言語モデリングのための状態空間モデル(SSM)は、2次アテンション変換器に代わる効率的でパフォーマンスの高い代替品である。
Associative Recall(AR)において、トランスフォーマーとベースSSMモデルのみが完全に成功することがわかった。
すべてのアーキテクチャがARと同じメカニズムを学んでおり、同じ3つのモデルがそのタスクで成功しています。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:56:09 GMT)
Pixel Reasoner: Incentivizing Pixel-Space Reasoning with Curiosity-Driven Reinforcement Learning [39.7] 連鎖推論は、大規模言語モデルの性能を大幅に改善した。
画素空間における推論の概念を紹介する。
このアプローチが視覚言語モデルを大幅に改善することを示します。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:35:08 GMT)
SpikeCLIP: A Contrastive Language-Image Pretrained Spiking Neural Network [39.5] 従来のニューラルネットワーク(ANN)の代替として、スパイキングニューラルネットワーク(SNN)が登場した。
本稿ではスパイクベースの計算におけるモダリティギャップを埋める新しいフレームワークであるSpikeCLIPを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:31:33 GMT)
Chinese Toxic Language Mitigation via Sentiment Polarity Consistent Rewrites [39.4] ToxiRewriteCNは、感情極性を維持するために明示的に設計された最初の中国のデータセットである。
1,556個の注釈付き三つ子からなり、それぞれに有毒な文、無害な非有毒な書き直し、ラベル付き有毒なスパンを含む。
標準的な表現、絵文字誘発、ホモフォニックな毒性、シングルターンとマルチターンの対話の5つの現実シナリオをカバーしている。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:27:18 GMT)
Any Large Language Model Can Be a Reliable Judge: Debiasing with a Reasoning-based Bias Detector [39.3] 推論に基づくバイアス検出器は、バイアス評価を特定し、構造的推論を生成して評価器の自己補正を導く。
RBDモデルのサイズを1.5Bから14Bに微調整し、すべてのスケールで一貫した性能改善を観察する。
例えば、RBD-8Bモデルは平均18.5%、一貫性10.9%で評価精度を向上し、それぞれ12.8%、微調整された審査員を17.2%上回る。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:23:05 GMT)
Gompertz Linear Units: Leveraging Asymmetry for Enhanced Learning Dynamics [39.1] GoLU は $mathrmGoLU(x) = x, MathrmGompertz(x)$, where $mathrmGompertz(x) = e-e-x$ と定義される新しい自己ゲート活性化関数である。
GoLUは最先端のアクティベーション関数よりも優れており、既存のアクティベーション関数の強力な代替品として確立されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:36:14 GMT)
UAV-Flow Colosseo: A Real-World Benchmark for Flying-on-a-Word UAV Imitation Learning [39.1] 無人航空機(UAV)は言語と対話するプラットフォームへと進化し、より直感的な人間とドローンの相互作用を可能にしている。
本研究では,この問題をFlying-on-a-Word(Flow)タスクとして形式化し,UAV模倣学習を効果的なアプローチとして導入する。
UAV-Flowは, 言語条件付き, きめ細かいUAV制御のための, 世界初の実世界のベンチマークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:31:28 GMT)
Resource Analysis of Low-Overhead Transversal Architectures for Reconfigurable Atom Arrays [38.7] 本稿では,大規模フォールトトレラント量子アルゴリズムのレイアウトと資源推定をサポートする低オーバヘッドアーキテクチャを提案する。
2048ビットのRSAファクタリングは5.6日で19万キュービットで実行でき、QECサイクルは1ミリ秒である。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:00:18 GMT)
GODBench: A Benchmark for Multimodal Large Language Models in Video Comment Art [38.4] ビデオコメントアートはユーモア、風刺、感情共鳴を伝達する創造的なコンテンツを提供することによってユーザーのエンゲージメントを高める。
我々は、ビデオとテキストのモダリティを統合した新しいベンチマークであるGODBenchを紹介し、コメントアートを構成するMLLMの能力を体系的に評価する。
また,MLLMの創造性向上を目的とした多段階推論フレームワークRipple of Thought (RoT)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:41:51 GMT)
Traveling Across Languages: Benchmarking Cross-Lingual Consistency in Multimodal LLMs [38.3] KnowRecallとVisRecallの2つの新しいベンチマークを紹介します。
KnowRecallは15の言語における事実的知識の一貫性を測定するために設計された視覚的質問応答ベンチマークである。
VisRecallは、画像にアクセスすることなく、9つの言語でランドマークの外観を記述するようモデルに求めることで、ビジュアルメモリの一貫性を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:43:37 GMT)
Generalised Probabilistic Modelling and Improved Uncertainty Estimation in Comparative LLM-as-a-judge [37.8] 既存のProduct-of-Expertsメソッドはより広範なフレームワークの特定のケースであり、多様なモデリングオプションを可能にします。
個人比較に対する不確実性評価の改善を提案し、より効率的な選択を可能にし、より少ない評価で強靭な性能を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:16:18 GMT)
Harnessing Caption Detailness for Data-Efficient Text-to-Image Generation [37.8] 詳細なキャプションを持つ訓練用テキスト・ツー・イメージ(T2I)モデルは、生成品質を著しく向上させることができる。
既存の方法は、T2Iトレーニングセットのキャプションの細部を表すためにキャプションの長さのような単純なメトリクスに依存することが多い。
画像カバレッジ率(ICR)と平均オブジェクト詳細度(AOD)の2つの側面からキャプション詳細度を推定する新しい指標を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:42:17 GMT)
AutoData: A Multi-Agent System for Open Web Data Collection [37.8] AutoDataは、人間の介入を最小限にする必要のある、自動Webデータ収集のための新しいマルチエージェントシステムである。
Instruct2DSは、学術、金融、スポーツの3つの領域にわたるWebソースからのライブデータ収集をサポートする新しいベンチマークデータセットである。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:32:35 GMT)
Robust and compact single-lens crossed-beam optical dipole trap for Bose-Einstein condensation in microgravity [37.7] 単一レンズを用いたコンパクトで頑健なクロスビーム光双極子トラップ(cODT)のコンセプトを提案する。
cODTは、動的条件下でのボース・アインシュタイン凝縮(BEC)の効率的な生成のために設計されている。
このシステムは2つの独立な2次元アコスト光偏向器(AOD)と1つの高精細レンズを併用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:32:46 GMT)
Scaling and Enhancing LLM-based AVSR: A Sparse Mixture of Projectors Approach [37.7] Llama-SMoPは、推論コストを増大させることなくモデル容量をスケールするためにスパース・ミクチャー・オブ・プロジェクター(SMoP)モジュールを使用している。
ASR、VSR、AVSRタスクにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:22:18 GMT)
Granary: Speech Recognition and Translation Dataset in 25 European Languages [37.6] Granaryは、25のヨーロッパ言語をまたがる認識と翻訳のための音声データセットの大規模なコレクションである。
これは、この規模で書き起こしと翻訳の両方を行う最初のオープンソース取り組みである。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:00:54 GMT)
The Effects of Data Augmentation on Confidence Estimation for LLMs [37.5] 本研究では,異なるデータ拡張手法が信頼度推定に与える影響について検討する。
データの多様性の向上により、拡張の有効性が向上する。
パラメータ転送可能性とユーザビリティを考えると、拡張のランダムな組み合わせは有望な選択である。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:35:33 GMT)
Forging Time Series with Language: A Large Language Model Approach to Synthetic Data Generation [37.3] SDForgerは、LLMを使用して高品質な時系列を生成するためのフレームワークである。
生成プロセスでテキストコンディショニングを有効にすることで、SDForgerはマルチモーダルモデリングの道を開く。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:50:49 GMT)
Bridging the Domain Gap in Equation Distillation with Reinforcement Feedback [37.1] データ2Eqnタスクの基本モデルのドメイン適応性を高めるための強化学習に基づく微調整フレームワークを提案する。
提案手法により,モデルが特定の複雑なデータ分布に適応し,数学的に意味のある方程式を生成することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:25:41 GMT)
Challenger: Affordable Adversarial Driving Video Generation [36.9] Challenger(チャレンジャー)は、物理的に可視だがフォトリアリスティックな対向駆動ビデオを生成するフレームワークである。
nuScenesデータセットでテストされているように、Challengeはさまざまなアグレッシブな駆動シナリオを生成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:55 GMT)
Guided Policy Optimization under Partial Observability [36.9] 部分的に観察可能な環境下での強化学習(RL)は、不確実性の下での学習の複雑さによって大きな課題を生じさせる。
本稿では,ガイドと学習者を協調訓練するフレームワークであるGPOを紹介する。
理論的には、この学習方式は直接RLに匹敵する最適性を達成し、既存のアプローチに固有の重要な制限を克服する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:01:08 GMT)
Cascaded Diffusion Models for Neural Motion Planning [36.5] 本研究では,拡散政策を用いたグローバルな動き計画学習手法を提案する。
我々のアプローチは、グローバルな予測と局所的な洗練を統一するカスケード階層モデルを用いる。
ナビゲーションや操作を含む複数の領域における課題タスクにおいて,本手法は(5%)優れていた。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:21:50 GMT)
Towards Spoken Mathematical Reasoning: Benchmarking Speech-based Models over Multi-faceted Math Problems [36.5] 本稿では,音声ベースモデルの数学的推論能力を評価するための新しいベンチマークである,Spoken-MQA(Spken Math Question Answering)を紹介する。
Spoken-MQAは、純粋算術、単段階および多段階の文脈推論、知識指向推論問題など、多種多様な数学問題をカバーしている。
基本算術を含む文脈的推論タスクにおいて、LLMが競合的に機能する言語もあるが、直接算術問題に苦戦している。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:07:00 GMT)
AnyCharV: Bootstrap Controllable Character Video Generation with Fine-to-Coarse Guidance [36.3] 本稿では,任意のソース文字とターゲットシーンを用いてフレキシブルにキャラクタ映像を生成する新しいフレームワークであるAnyCharVを提案する。
第1段階では、ポーズガイダンスを用いて、ソースキャラクタとターゲットシーンを統合可能なベースモデルを開発する。
第2段階はさらに自己ブート機構を通じて制御可能な生成をブートストラップし、生成した映像を第1段階に使用し、微細マスクを粗いものに置き換える。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:46:18 GMT)
KVLink: Accelerating Large Language Models via Efficient KV Cache Reuse [36.0] KVLinkは、大規模言語モデル(LLM)における効率的なキー値(KV)キャッシュ再利用のためのアプローチである。
KVLinkは、連結後のグローバルな位置と一致するように、推論時にKVキャッシュの位置埋め込みを調整することと、自己注意を回復するためにトレーニング可能な特別なトークンを使用することである。
7つのデータセットにわたる実験によると、KVLinkは最先端の手法よりも平均4%の精度で質問応答を改善する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:42:08 GMT)
SciCUEval: A Comprehensive Dataset for Evaluating Scientific Context Understanding in Large Language Models [35.8] SciCUEvalは、大規模言語モデル(LLM)の科学的文脈理解能力を評価するためのベンチマークデータセットである。
生物学、化学、物理学、生物医学、材料科学にまたがる10のドメイン固有のサブデータセットで構成され、構造化テーブル、知識グラフ、構造化されていないテキストを含む多様なデータモダリティを統合する。
関連情報識別、情報理解検出、マルチソース情報統合、コンテキスト認識推論の4つのコア能力を、様々な質問形式を通じて体系的に評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:33:26 GMT)
Teaching Language Models to Evolve with Users: Dynamic Profile Modeling for Personalized Alignment [35.7] 本稿では,対話を通じてユーザプロファイルを反復的に推測・精査するRLPAフレームワークについて紹介する。
我々はQwen-2.5-3B-インストラクトを微調整することでRLPAをインスタンス化し、Qwen-RLPAはパーソナライズされた対話における最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:38:36 GMT)
DPO Meets PPO: Reinforced Token Optimization for RLHF [35.6] 本稿では,トークンワイド報酬関数を選好データから学習し,この学習したトークンワイド報酬信号に基づいてポリシー最適化を行うアルゴリズムを提案する。
実験により、texttRTOはPPOや他の直接選好学習アルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:34:02 GMT)
Not All Models Suit Expert Offloading: On Local Routing Consistency of Mixture-of-Expert Models [35.6] Mixture-of-Experts (MoE) は、推論中に専門家がわずかに活性化された大きな言語モデルの効率的なスケーリングを可能にする。
多くのシステムでは,専門家のサブセットを高速メモリにキャッシュする*専門家オフロード*を導入している。
各層にMoEを適用し、共有専門家を使用しないモデルは、最も高い局所的なルーティング一貫性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:13:09 GMT)
ToxicTone: A Mandarin Audio Dataset Annotated for Toxicity and Toxic Utterance Tonality [35.5] ToxicToneはこの種の公開データセットとしては最大である。
我々のデータは、様々な現実世界のオーディオから導き出され、13のトピックに分類される。
本研究では,音響的,言語的,感情的特徴を統合したマルチモーダル検出フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:25:27 GMT)
Comprehensive Evaluation and Analysis for NSFW Concept Erasure in Text-to-Image Diffusion Models [35.4] 拡散モデルの強い一般化能力は、必然的にNSFW(Not-safe-for-work)コンテンツの生成につながる。
提案手法は,NSFW の概念消去法の最初の体系的な研究を行い,概念消去に特化して設計されたフルパイプ・ツールキットである。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:31:45 GMT)
Responsible Diffusion Models via Constraining Text Embeddings within Safe Regions [35.3] また、NSFW(Not Safe for Work)コンテンツを作成し、社会的偏見を示す可能性を懸念している。
本稿では,安全な領域に埋め込まれたテキストの埋め込みを制限するために,埋め込み空間における意味方向ベクトルを同定する,新たな自己発見手法を提案する。
本手法は, 拡散モデルにより生ずるNSFW含量と社会的バイアスを, 最先端のベースラインと比較して効果的に低減することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:10:26 GMT)
Mitigating cosmic ray-like correlated events with a modular quantum processor [35.1] マザーボードと2つのフリップチップ結合された娘ボードモジュールからなる量子プロセッサにおける宇宙線様事象を測定する。
1つの加群内の崩壊事象は強く相関している(85%以上)が、別々の加群内の事象は$sim 2%$相関しか示さない。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:16:06 GMT)
Distributionally Robust Federated Learning with Client Drift Minimization [35.1] textitDRDMは分散的に堅牢な最適化フレームワークであり、動的正規化によりクライアントのドリフトを緩和する。
textitDRDMは、最悪のクライアントのパフォーマンスを最大化することを目的とした、min-max最適化問題としてトレーニングをフレーム化している。
実験の結果,textitDRDMは通信ラウンドを減らしながら最悪のテスト精度を著しく向上することがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:05:56 GMT)
MV-MATH: Evaluating Multimodal Math Reasoning in Multi-Visual Contexts [35.0] MV-MATHは,2,009の高次数問題からなる厳密にキュレートされたデータセットである。
それぞれの問題は、K-12シナリオから派生したテキストでインターリーブされた複数の画像を統合し、詳細なアノテーションで富む。
MV-MATHには、複数の選択、自由形式、多段階の質問が含まれており、3つの困難レベルにわたる11の主題領域をカバーしている。
我々は,マルチ視覚数学におけるMLLMの課題が,MV-MATH上での人間の能力に比較してかなりの性能差があることを観察した。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:00:34 GMT)
HV-BEV: Decoupling Horizontal and Vertical Feature Sampling for Multi-View 3D Object Detection [34.7] 視覚に基づく多視点環境認識システムの適用は、自律運転技術においてますます認識されている。
現在の最先端ソリューションは主に、暗黙の深度予測を通じて、各カメラビューからの画像をBEV空間にエンコードする。
我々は,textbfBEVグリッドクエリのパラダイムにおける特徴サンプリングを,textbfHorizontal特徴集約に分離する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:35:40 GMT)
P3P: Pseudo-3D Pre-training for Scaling 3D Voxel-based Masked Autoencoders [34.6] 本稿では,数百万の画像を3次元事前学習コーパスに組み込んだ,自己教師型事前学習フレームワークを提案する。
本手法は,3次元分類,少数ショット学習,および3次元分割における最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:52:47 GMT)
Expanding Zero-Shot Object Counting with Rich Prompts [34.6] RichCountは、テキストエンコーディングを強化し、画像内のオブジェクトとモデルの関連性を強化するトレーニング戦略である。
RichCountはゼロショットカウントにおける最先端のパフォーマンスを達成し、オープンワールドシナリオにおける見えないカテゴリへの一般化を著しく強化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:38:23 GMT)
Intentional Gesture: Deliver Your Intentions with Gestures for Speech [34.4] textbfIntentional-Gestureは、ハイレベルなコミュニケーション機能に基づく意図推論タスクとしてジェスチャ生成をキャストする。
我々のフレームワークは、デジタル人間と具体化されたAIにおいて、表現力のあるジェスチャー生成のためのモジュラー基盤を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:24:51 GMT)
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning [34.3] 本稿では,生深度データを構造化・解釈可能なテキスト論理に変換する新しいフレームワークを提案する。
これらのテキストの有理は、空間的推論能力を著しく向上させる意味のある中間表現として機能する。
中間空間推論アノテーションを付加した100万スケールの視覚言語推論データセットであるSSR-CoTを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:34:31 GMT)
An Empirical Study on Reinforcement Learning for Reasoning-Search Interleaved LLM Agents [34.3] 強化学習(RL)は、現実世界の問題解決に複雑な推論が可能な大規模言語モデル(LLM)の訓練に強い可能性を示している。
最近では、RLを利用して、推論と検索エンジンの使用を巧みに組み合わせた高度なLLMベースの検索エージェントが作成されている。
1)報酬の定式化,(2)基礎となるLLMの選択と特性,(3)RLプロセスにおける検索エンジンの役割など,重要な要素はさらなる調査が必要である。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:09:43 GMT)
Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling [34.2] Sarc3Dはスパース変形可能なマーチングキューブ表現と新しいエンコーダSparconv-VAEを組み合わせた統一フレームワークである。
Sparc3Dは、オープンサーフェス、切断されたコンポーネント、複雑な幾何学を含む挑戦的な入力に対して、最先端の再構築忠実性を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:06:19 GMT)
Shallow Preference Signals: Large Language Model Aligns Even Better with Truncated Data? [34.2] 優先応答で得られる識別信号が初期トークンに集中していることが示される。
意外なことに、切り捨てられたデータセットでトレーニングされたモデルでは、トークンの前半または後半しか保持せず、完全なデータセットでトレーニングされたモデルと同等あるいはそれ以上のパフォーマンスを実現している。
そこで我々は,浅層優先信号を利用してアライメントと計算効率のトレードオフを最適化する,浅部報酬信号観測(Longth Control Decoding)とKL Threshold Control Decoding(KL Threshold Control Decoding)の2つの単純な復号方式を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:02 GMT)
Multi-Modality Expansion and Retention for LLMs through Parameter Merging and Decoupling [33.9] MMERは既存のMLLMを統合し、元の性能を維持しながら効果的なマルチモーダル展開を行う。
MMERは、新しいタスクで微調整されたMLLMに同様のプロセスを適用することで、破滅的な忘れを軽減できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:40:07 GMT)
Extractive Structures Learned in Pretraining Enable Generalization on Finetuned Facts [33.8] 事前訓練された言語モデル(LM)は、それらが微調整されている事実の含意を一般化することができる。
本稿では、この一般化を実現するために、LMのコンポーネントがどのように協調するかを記述するためのフレームワークとして、抽出構造を紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:01:22 GMT)
Finite-Sample Analysis of Policy Evaluation for Robust Average Reward Reinforcement Learning [33.7] 本稿では、ロバストな平均回帰における政策評価のための第1次有限サンプル解析について述べる。
提案手法はマルチレベルモンテカルロ法(MLMC)を用いてベルマン作用素を効率的に推定する。
本手法は,ロバストな政策評価とロバストな平均報酬推定のために,$tildemathcalO(epsilon-2)$のオーダー最適サンプル複雑性を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:21:42 GMT)
Pre-training Large Memory Language Models with Internal and External Knowledge [33.7] 本稿では,内部重みと外部データベースの両方に事実知識を格納する事前学習レシピを備えた,新たな言語モデルであるLarge Memory Language Models (LMLM)を提案する。
提案手法は,トレーニング損失から現実の値を戦略的に隠蔽し,モデル重みの記憶に頼るのではなく,対象のルックアップを実行するようにモデルに指示する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:26:03 GMT)
VERDI: VLM-Embedded Reasoning for Autonomous Driving [33.7] 自律走行(VERDI)のためのVLM埋め込み推論を提案する。
VERDIは、VLMの推論プロセスと常識知識をADスタックに蒸留するトレーニングタイムフレームワークである。
提案手法の有効性をNuScenesデータセットに示すとともに,VERDIが既存のe2eメソッドより優れていることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:24:36 GMT)
FreqMoE: Dynamic Frequency Enhancement for Neural PDE Solvers [33.5] 本稿では,低周波成分に対する高周波信号の依存性を利用した,効率的かつプログレッシブなトレーニングフレームワークFreqMoEを提案する。
正規格子PDEと不規則格子PDEの両方の実験により、FreqMoEは16.6%の精度向上を達成した。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:53:03 GMT)
Higher-order Structure Boosts Link Prediction on Temporal Graphs [33.5] 時間グラフニューラルネットワーク(TGNN)は,時間グラフの構造をモデル化し,予測するために注目を集めている。
本稿では,ハイパーグラフ表現を時間グラフ学習に組み込んだ高次構造時間グラフニューラルネットワークを提案する。
HTGNは,従来の手法と比較してメモリコストを最大50%削減しながら,動的リンク予測において優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:51:44 GMT)
Neural Collapse is Globally Optimal in Deep Regularized ResNets and Transformers [33.4] クロスエントロピーや平均二乗誤差損失で訓練されたLayerNormを用いたディープ・正規化変圧器と残留ネットワーク(ResNet)のグローバル最適性がほぼ崩壊していることを証明する。
我々の理論的結果は、コンピュータビジョンと言語データセットの実験によって支持されており、深さが大きくなるにつれて神経崩壊が実際に顕著になることを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:16:03 GMT)
Distributed Conformal Prediction via Message Passing [33.3] Conformal Prediction (CP)は、堅牢なポストホックキャリブレーションフレームワークを提供する。
CPによる信頼性推論を実現するために,メッセージパスに基づく2つのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:57:01 GMT)
Large Language Models Are More Persuasive Than Incentivized Human Persuaders [32.7] 我々は,フロンティア大言語モデル(LLM)の説得能力と,オンラインクイズ設定におけるインセンティブ付き人間説得者との比較を行った。
LLMの説得者は、インセンティブを得た人間の説得者よりも、方向性の説得の試みへのコンプライアンスを著しく向上させた。
以上の結果から、AIの説得能力は、パフォーマンスに結びついたリアルタイムボーナスを持つ人間の能力を上回ることが示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:29:57 GMT)
SEA: Low-Resource Safety Alignment for Multimodal Large Language Models via Synthetic Embeddings [32.7] MLLM(Multimodal Large Language Models)は、重大なセキュリティ上の脆弱性を持つ。
テキストアライメントを含む既存の低リソースのセキュリティアライメント手法は、追加のモダリティによって引き起こされるセキュリティリスクに悩まされている。
勾配更新による追加モダリティの埋め込みを最適化するSEA(Synthetic Embedding augmented safety alignment)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:31:15 GMT)
LABO: Towards Learning Optimal Label Regularization via Bi-level Optimization [32.5] ニューラルネットワークの一般化性能とトレーニング効率を向上させるためには,正規化技術が不可欠である。
本稿では、従来のLSを含むラベル正規化によるトレーニングのための一般的なフレームワークを提案するが、インスタンス固有の変種をモデル化することもできる。
本稿では,Bi-level Optimization (LABO) 問題を考案し,LAbel 正規化を効率的に学習する方法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:50:07 GMT)
Reinforcing the Diffusion Chain of Lateral Thought with Diffusion Language Models [32.4] 本稿では,拡散言語モデルの推論フレームワークであるDCoLT(Diffusion Chain of Lateral Thought)を紹介する。
DCoLTは、思考の中間段階において文法的正しさに厳格な規則を持たず、双方向で非線形な推論を可能にする。
DCoLT強化拡散言語モデル(DLM)は、SFTやRLで訓練された他のDLMよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:44:47 GMT)
GS2E: Gaussian Splatting is an Effective Data Generator for Event Stream Generation [32.1] 高忠実度イベントビジョンタスクのための大規模合成イベントデータセットであるGS2E(Gaussian Splatting to Event)を紹介する。
イベントベース3次元再構成の結果は、GS2Eの優れた一般化能力と実用的価値を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:15:42 GMT)
AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving [32.1] VLM(Vision-Language Models)は、自律走行を約束するが、幻覚、非効率な推論、限られた実世界の検証は、正確な知覚と堅牢なステップバイステップ推論を妨げる。
我々は、Chain-of-Thought(CoT)推論と、自律運転タスクのための動的エージェントスタイルのツール呼び出しを統合した、先駆的な統合フレームワークであるtextbfAgentThinkを紹介した。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:27:43 GMT)
Sparse Data Generation Using Diffusion Models [32.0] 本稿では,スパースデータを生成する新しい手法であるスパースデータ拡散(SDD)を紹介する。
SDD は連続状態空間拡散モデルを拡張し、空間空間をモデル化することで正確な零点を明示する。
物理学と生物学の2つの科学的応用を含む様々な分野における実証的検証は、SDDがデータの空間性を表現する上で高い忠実性を達成することを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:09:56 GMT)
Model Merging is Secretly Certifiable: Non-Vacuous Generalisation Bounds for Low-Shot Learning [31.9] モデル融合と一般化証明に基づく学習手法のファミリー間の新しい関係を描いている。
微調整により、既存の学習戦略が既に非自明な一般化保証を提供していることを示す。
この結果から,100の例を学習する上で,非自明な一般化が保証されることが確認された。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:51:05 GMT)
The Devil Is in the Details: Tackling Unimodal Spurious Correlations for Generalizable Multimodal Reward Models [31.8] マルチモーダル・リワードモデル(MM-RM)は,大規模言語モデル(LLM)と人間の嗜好の整合に不可欠である。
MM-RMは、不動の突発的相関に依存するため、アウト・オブ・ディストリビューションデータへの一般化に苦慮することが多い。
本稿では,この問題を動的にトレーニングサンプルを再重み付けすることで軽減する,ショートカット対応MM-RM学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:00:20 GMT)
Listen to the Context: Towards Faithful Large Language Models for Retrieval Augmented Generation on Climate Questions [31.7] 検索拡張生成を使用する大規模言語モデルは、貴重な知識を解放する可能性がある。
このアプローチは、検索された節を追加の文脈として頼りにすることで、事実の幻覚を軽減するのに役立つ。
この設定において、異なるモデルの忠実度の自動評価について検討する。
我々は,支持原子クレームの30%から57%の忠実度向上を実現するClimateGPT Faithful+を開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:17:38 GMT)
FaceCrafter: Identity-Conditional Diffusion with Disentangled Control over Facial Pose, Expression, and Emotion [31.6] 本研究では,アイデンティティ保存を損なうことなく,ポーズ,表情,感情を正確に制御できる新しいアイデンティティ条件拡散モデルを提案する。
提案手法は,ポーズ,表情,感情に対する制御精度の点で既存の手法を超越し,アイデンティティのみの条件下での生成の多様性を向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:43:21 GMT)
Global Convergence for Average Reward Constrained MDPs with Primal-Dual Actor Critic Algorithm [31.5] 本研究では,高収束率を確保しつつ制約を適切に管理するPrimal-Dual Natural Actor-Criticアルゴリズムを提案する。
この結果はマルコフ決定過程の理論的下限と一致し、平均報酬CMDPの理論的探索において新しいベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:49:11 GMT)
Oral Imaging for Malocclusion Issues Assessments: OMNI Dataset, Deep Learning Baselines and Benchmarking [31.5] マロクルージョンは矯正治療において大きな課題であり、その複雑なプレゼンテーションと多彩な臨床症状は正確な局所化と診断を重要視している。
現在、歯科画像解析の分野で直面している大きな欠点の1つは、不正咬合問題に特化した大規模で正確にラベル付けされたデータセットの欠如である。
口腔顔面自然画像(OMNI)データセットは, 咬合異常に対する歯像解析研究の推進を目的とした, 新規で包括的な歯科画像データセットである。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:18:56 GMT)
Deliberation on Priors: Trustworthy Reasoning of Large Language Models on Knowledge Graphs [31.5] 我々は、優先事項に関する審議(DP)と呼ばれる信頼できる推論フレームワークを提案する。
DPは、教師付き微調整とKahneman-Tversky最適化を組み合わせることで、構造的事前をLLM(Large Language Models)に統合する。
本フレームワークでは,LLMに対して,抽出した制約前処理に基づいて精巧な推論検証を行うための推論イントロスペクション戦略を採用している。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:38:45 GMT)
Think in Safety: Unveiling and Mitigating Safety Alignment Collapse in Multimodal Large Reasoning Model [30.8] 5つのベンチマークでMLRM(Multimodal Large Reasoning Model)11の安全性評価を行う。
分析の結果、異なるベンチマークで異なる安全性パターンが明らかになった。
これは、モデル固有の推論能力を活用して安全でない意図を検出することで、MLRMの安全性問題に対処する潜在的アプローチである。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:18:00 GMT)
Beyond Hard and Soft: Hybrid Context Compression for Balancing Local and Global Information Retention [30.6] 大規模言語モデル(LLM)は、計算の非効率性と冗長な処理による長周期推論において重大な課題に直面する。
既存の方法は、ハードローカル圧縮や、ソフトグローバル圧縮のための遅延表現にコンテキストをエンコードするためにトークンの重要度に依存することが多い。
我々は,グローバルな視点とローカルな視点を統合してコンテキスト圧縮をガイドするHyCo$を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:26:11 GMT)
DINOv2-powered Few-Shot Semantic Segmentation: A Unified Framework via Cross-Model Distillation and 4D Correlation Mining [30.6] セマンティックセグメンテーションは、その一般化能力によって関心が高まっている。
近年,表現の伝達性向上のための基礎モデルが提案されている。
DINOv2エンコーダと軽量セグメンタのみを備えたFS-DINOを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:59:41 GMT)
Robust Relevance Feedback for Interactive Known-Item Video Search [30.4] 我々は、トップk選択の安定性を改善するためのペアワイズ相対判定フィードバックを導入する。
ユーザ認識を複数のサブパーセプションに分解し,それぞれが独立した埋め込み空間として表現される。
我々は,各ユーザフィードバックインスタンスに基づいて,サブパーセプションの組み合わせを推定する予測的ユーザモデルを開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:31:49 GMT)
A Unified Gradient-based Framework for Task-agnostic Continual Learning-Unlearning [30.3] 近年の深層モデルの進歩は、知識獲得のための連続学習(CL)とデータ除去のための機械アンラーニング(MU)を組み合わせたインテリジェントシステムの必要性を強調している。
Kullback-Leibler の発散最小化に基づく統一最適化フレームワークにより,本質的な接続を明らかにする。
実験により、提案したUG-CLUフレームワークは、複数のデータセットやモデルアーキテクチャにわたるインクリメンタルラーニング、正確なアンラーニング、知識安定性を効果的に調整することを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:49:05 GMT)
Whose story is it? Personalizing story generation by inferring author styles [30.3] パーソナライゼーションはインタラクティブな書き込みや教育アプリケーションにおけるユーザエクスペリエンス向上に不可欠である。
著者の執筆スタイルを模倣することを目的とした,物語生成のパーソナライズ作業について検討する。
112人の著者から3.6kストーリーのデータセットであるMythosを収集し、1人の著者の平均16ストーリーを収集する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:56:22 GMT)
Gradient Flows and Riemannian Structure in the Gromov-Wasserstein Geometry [29.7] 本稿ではGromov-Wasserstein(GW)幾何学における勾配流について検討する。
本稿では,$mathbbRd上の分布間の内部積 GW (IGW) 距離に着目した。
固有IGW幾何を創り出す固有IGW幾何を同定し,それを用いて,IGWのベナモ・ブレニエ式を定式化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:02:11 GMT)
Can LLMs Maintain Fundamental Abilities under KV Cache Compression? [29.5] 各種基本言語モデルにおけるKVキャッシュ圧縮の効果を評価するためのベンチマークKVFundaBenchを提案する。
ショットレベルのセマンティックコヒーレンスを維持しつつ、プリフィルとデコードフェーズを処理する新しい圧縮手法ShotKVを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:37:50 GMT)
Parameter-Efficient Fine-Tuning via Circular Convolution [29.4] Low-Rank Adaptation (LoRA)は、微調整された大規模な基盤モデルで人気を博している。
本稿では,Circular Convolution Adaptation (C$3$A)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:58:40 GMT)
Improving the statistical efficiency of cross-conformal prediction [29.4] Vovkは、予測セットの幅を改善するために設計された分割コンフォメーションの修正であるクロスコンフォーマル予測を導入した。
我々は、後者の理論的保証を妥協することなく、より小さな予測セットを生成する2つの手法の新たな変種を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:19:47 GMT)
RePPL: Recalibrating Perplexity by Uncertainty in Semantic Propagation and Language Generation for Explainable QA Hallucination Detection [29.3] 幻覚は大きな言語モデルにとって 重要な障害です
これら2つの側面により不確実性の測定を補正するRePPLを提案する。
提案手法は,様々なQAデータセットにまたがる最高の包括的検出性能を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:23:05 GMT)
The Jumping Reasoning Curve? Tracking the Evolution of Reasoning Performance in GPT-[n] and o-[n] Models on Multimodal Puzzles [29.2] OpenAIのo-[n]シリーズ(o1、o3、o4-mini)のリリースは、大規模言語モデルにおける重要なパラダイムシフトである。
GPT-[n] および o-[n] 級数モデルの進化を、挑戦的なマルチモーダルパズル上で追跡する。
以上の結果から, o-[n] 級数,特に o3 や o4-mini のような後続の反復は GPT-[n] 級数を著しく上回り,マルチモーダル推論において高いスケーラビリティを示すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:57:40 GMT)
DISCO Balances the Scales: Adaptive Domain- and Difficulty-Aware Reinforcement Learning on Imbalanced Data [29.1] 本稿では,グループ間不均衡と2つの重要なイノベーションに対処するGRPOの原理的拡張を提案する。
ドメイン対応報酬スケーリングは、ドメインの頻度に基づいて最適化を再重み付けすることで周波数バイアスに対処する。
難解な報酬のスケーリングは、学習価値を提供する不確実なプロンプトを特定し、優先順位付けするために、プロンプトレベルの自己整合性を活用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:43:29 GMT)
VARD: Efficient and Dense Fine-Tuning for Diffusion Models with Value-based RL [29.0] VAlue-based Reinforced Diffusion (VARD) は、中間状態から報酬の期待を予測する値関数を初めて学習する新しい手法である。
提案手法は,バックプロパゲーションによる効果的な,安定したトレーニングを可能にしつつ,事前訓練されたモデルに近づき続ける。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:44:37 GMT)
Efficient and Direct Duplex Modeling for Speech-to-Speech Language Model [28.4] 本稿では,連続的なユーザ入力とチャネル融合を伴うエージェント出力を特徴とする,新しい2重音声合成(S2S)アーキテクチャを提案する。
ユーザ入力に事前トレーニングされたストリーミングを使用することで、音声事前トレーニングを必要とせずに、第1の二重S2Sモデルを実現できる。
実験結果から,提案モデルが従来の2次モデルよりも,推論,ターンテイク,バージイン能力に優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:48:30 GMT)
Multiple Weaks Win Single Strong: Large Language Models Ensemble Weak Reinforcement Learning Agents into a Supreme One [28.3] モデルアンサンブルは強化学習(RL)において有効なエージェントの訓練に有用である。
LLM-Ensは,タスク固有の意味理解を用いてRLモデルのアンサンブルを強化する手法である。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:35:43 GMT)
LLM-Explorer: A Plug-in Reinforcement Learning Policy Exploration Enhancement Driven by Large Language Models [28.3] 政策探究は強化学習(RL)において重要であり、既存のアプローチには欲求、ガウス過程などが含まれる。
大規模言語モデル(LLM)を用いたタスク固有探索戦略を適応的に生成するLLM-Explorerを設計する。
我々の設計は、DQNシリーズ、DDPG、TD3など、広く使われているRLアルゴリズムと互換性のあるプラグインモジュールである。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:24:23 GMT)
Word Level Timestamp Generation for Automatic Speech Recognition and Translation [28.2] カナリアモデルにおいて,単語レベルのタイムスタンプ予測を可能にするためのデータ駆動型手法を提案する。
提案手法は,4言語で20~120msのタイムスタンプ予測誤差を用いて,80%から90%の精度とリコール率を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:24:29 GMT)
Second-Order Convergence in Private Stochastic Non-Convex Optimization [28.0] 微分プライベート(DP)非次元同定最適化における2次定常点(SOS)の探索問題について検討する。
既存手法はサドル点エスケープ解析における勾配変動による不正確な収束誤差に悩まされている。
我々は,先行研究で報告された収束誤差を補正する新しいDPアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:25:23 GMT)
LyapLock: Bounded Knowledge Preservation in Sequential Large Language Model Editing [27.9] 現在の位置情報編集アプローチは、逐次編集中に徐々にパフォーマンスが低下している。
textbfLyapLockは、長期制約付きプログラミングを、効率的な解法のために、段階的に抽出可能なサブプロブレムに分解するために提案されている。
実験結果から,本フレームワークは汎用性を安定させ,SOTAベースラインよりも平均編集効率を11.89%向上させるとともに,1万回以上の編集能力に拡張可能であることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:16:33 GMT)
Reward Is Enough: LLMs Are In-Context Reinforcement Learners [27.9] 強化学習(Reinforcement Learning、RL)は、シーケンシャルな意思決定問題を解決するための人間設計のフレームワークである。
本研究では,LLM(Large Language Model)推論時間内にRLが出現することを示す。
ICRLプロンプトと呼ばれる新しいマルチラウンドプロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:15:01 GMT)
When LLMs meet open-world graph learning: a new perspective for unlabeled data uncertainty [27.9] 大規模言語モデル (LLM) はテキスト分散グラフ (TAG) の学習に大きく進歩している。
Open World Graph Assistant (OGA) は適応的なラベルトレーサビリティを組み合わせたフレームワークで、意味論とトポロジを統合して未知のクラスを拒絶する。
総合的な実験はOGAの有効性と実用性を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:23:56 GMT)
FlowKV: Enhancing Multi-Turn Conversational Coherence in LLMs via Isolated Key-Value Cache Management [27.7] FlowKVはKVキャッシュ管理のための新しいマルチターン分離機構である。
蓄積された圧縮KVキャッシュを過去のターンから保存する。
古い文脈の再圧縮を防ぎ、破滅的な忘れを和らげる。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:20:46 GMT)
Dress-1-to-3: Single Image to Simulation-Ready 3D Outfit with Diffusion Prior and Differentiable Physics [27.7] 本稿では,動的衣料アニメーションを用いた仮想試着などのアプリケーションにおいて重要な領域である3D衣料生成に焦点を当てた。
そこで我々はDress-1-to-3という新しいパイプラインを紹介した。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:30:13 GMT)
Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries [27.7] 本稿では,良質なクエリを通じてRAGシステム上で知識抽出を行うImplicit Knowledge extract Attack (IKEA)を紹介する。
IKEAはまずアンカーの概念を活用し、自然な外観でクエリを生成し、2つのメカニズムを設計し、RAGのプライバシーに関する知識を徹底的に「明らかに」する。
各種防御下でのイケアの有効性を実証し, 抽出効率の80%以上, 攻撃成功率の90%以上を基準線を超える実験を行った。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:04:42 GMT)
P2P: Automated Paper-to-Poster Generation and Fine-Grained Benchmark [27.6] 高品質なHTMLレンダリングの学術ポスターを生成するLLMベースのマルチエージェントフレームワークであるP2Pを紹介する。
P2Pは、ビジュアル要素処理、コンテンツ生成、および専用のチェッカーモジュールと統合された最後のポスターアセンブリーの3つの特殊エージェントを使用している。
P2PEvalは121枚の紙とポストのペアと2つの評価手法を組み合わせた総合的なベンチマークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:06:05 GMT)
Prolonged Reasoning Is Not All You Need: Certainty-Based Adaptive Routing for Efficient LLM/MLLM Reasoning [27.5] チェーン・オブ・ソート(CoT)推論への過剰依存はモデル性能を損なう可能性がある。
我々はCAR(Adaptive Reasoning)を提案する。
CARは、モデルの難易度に基づいて、短い回答と長い形式の推論を切り替える。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:20:17 GMT)
RL Tango: Reinforcing Generator and Verifier Together for Language Reasoning [27.0] Tangoは、LLMジェネレータと検証器の両方を同時にトレーニングするためにReinforcement Learningを使用する、新しいフレームワークである。
Tangoの中心的な革新は、生成プロセスレベルのLCM検証であり、RLを介してトレーニングされ、ジェネレータと共進化する。
実験により,Tangoの2つのコンポーネントが7B/8Bスケールモデルで最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:43:15 GMT)
Causal Interventions Reveal Shared Structure Across English Filler-Gap Constructions [26.9] 大言語モデル (LLMs) は、文法理論を発展させようとする言語学者の強力な証拠源として登場した。
本稿では, LLMに適用された因果解釈可能性法が, これらの証拠の価値を大幅に向上させることができることを論じる。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:37:57 GMT)
Resource Heterogeneity-Aware and Utilization-Enhanced Scheduling for Deep Learning Clusters [26.9] 本稿では,資源利用を促進できる最適化フレームワークに基づくタスクレベルスケジューラHadarを提案する。
Hadarは、最先端のGavelと比較して、総時間の長さを1.20倍に加速する。
HadarEはDLモデルのトレーニングにおいてかなりのスピードアップを示しており、AmazonのAWS(あるいは当社のラボ)クラスタ上での合計期間を50%(または80%)短縮しています。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:39:17 GMT)
Human-centered Interactive Learning via MLLMs for Text-to-Image Person Re-identification [26.7] 外部マルチモーダル知識によるテキストクエリの識別性を高めるための対話型クロスモーダル学習フレームワーク(ICL)を提案する。
そこで本研究では,THI(Test-time Humane-centered Interaction)モジュールを提案する。
THIはマルチモーダル大言語モデル(MLLM)に基づいてユーザクエリを洗練し、最高のマッチング画像とのギャップを減らす。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:26:17 GMT)
MIRe: Enhancing Multimodal Queries Representation via Fusion-Free Modality Interaction for Multimodal Retrieval [26.6] 我々は、アライメント中にテキストの特徴を融合させることなく、モダリティインタラクションを実現する検索フレームワークMIReを紹介する。
提案手法では,テキスト駆動型信号を視覚表現に戻すことなく,テキストクエリを視覚埋め込みに対応させることができる。
実験により,我々の事前学習戦略はマルチモーダルクエリの理解を著しく向上させることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:30:01 GMT)
Guidelines for the Quality Assessment of Energy-Aware NAS Benchmarks [26.4] エネルギーを意識したベンチマークは、NASがモデルエネルギー消費を精度から引き離すことを可能にすることを目的としている。
これらの原則に基づいてEA-HAS-Benchを分析し、GPU測定APIの選択が結果の品質に大きな影響を与えることを発見した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:16:41 GMT)
VocalBench: Benchmarking the Vocal Conversational Abilities for Speech Interaction Models [26.3] 音声通信における音声対話モデルの能力を評価するためのベンチマークであるVocalBenchを提案する。
VocalBenchは、セマンティック品質、アコースティックパフォーマンス、会話能力、ロバストネスの4つの重要なディメンションにわたって、9,400の慎重にキュレーションされたインスタンスで構成されている。
実験結果から、現在のモデル能力に有意な変動が見られ、それぞれ異なる強度と弱点が示される。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:34:07 GMT)
EndoVLA: Dual-Phase Vision-Language-Action Model for Autonomous Tracking in Endoscopy [26.1] VLA(Vision-Language-Action)モデルは、視覚知覚、言語接地、モーションプランニングをエンドツーエンドのフレームワークに統合する。
EndoVLAは,(1)ポリープ追跡,(2)異常粘膜領域の脱線・追尾,(3)周囲切削時の円形マーカーへの付着の3つのコアタスクを実行する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:35:00 GMT)
DeFTX: Denoised Sparse Fine-Tuning for Zero-Shot Cross-Lingual Transfer [26.0] DeFT-X(DeFT-X)は,事前学習したモデルの重み行列を大まかに刈り取る新しい構成可能なSFT手法である。
感情分類(NusaX)と自然言語推論(AmericasNLI)のための多種多様な低リソース言語上でDeFT-Xを評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:20:30 GMT)
Discovering Pathology Rationale and Token Allocation for Efficient Multimodal Pathology Reasoning [25.7] 多モード画像理解は、診断精度を向上させる可能性から、広く関心を集めている。
既存の手法では推論能力が限られており、複雑な診断シナリオを扱う能力を妨げている。
本稿では,2つの相乗的分枝からなる二元的強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:03:03 GMT)
Evaluate Bias without Manual Test Sets: A Concept Representation Perspective for LLMs [25.6] 大規模言語モデル(LLM)のバイアスは、その信頼性と公平性を著しく損なう。
モデルベクトル空間の構造に基づくテストセットのないバイアス分析フレームワークであるBiasLensを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:50:23 GMT)
MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems [25.5] MoEアーキテクチャは、LLM(Large Language Models)を効率的にスケーリングするためにますます好まれている。
既存のベンチマークは、これらのトレードオフを正確に捉えることができないことが多い。
我々は,MoEシステム用に特別に設計されたベンチマークであるMoE-CAPを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:20:21 GMT)
MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems [25.5] MoEアーキテクチャは、LLM(Large Language Models)を効率的にスケーリングするためにますます好まれている。
既存のベンチマークは、これらのトレードオフを正確に捉えることができないことが多い。
我々は,MoEシステム用に特別に設計されたベンチマークであるMoE-CAPを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:19:51 GMT)
NOVER: Incentive Training for Language Models via Verifier-Free Reinforcement Learning [25.4] NOVERは強化学習フレームワークであり、外部検証を必要とせず、標準的な教師付き微調整データのみを必要とする。
NOVERは、幅広いテキスト・テキスト・タスクにわたるインセンティブトレーニングを可能にし、DeepSeek R1 671Bのような大規模な推論モデルから抽出した同じサイズのモデルを7.7%向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:12:35 GMT)
Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval [25.2] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃に対して脆弱であり、敵は危険または非倫理的な反応を引き起こすために慎重に設計されたプロンプトを悪用する。
安全コンテキスト検索(SCR, Safety Context Retrieval)は,LLMの脱獄防止のためのスケーラブルで堅牢な安全保護パラダイムである。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:58:14 GMT)
CP-LLM: Context and Pixel Aware Large Language Model for Video Quality Assessment [25.1] CP-LLM(Context and Pixel aware Large Language Model)を紹介する。
CP-LLMは、言語デコーダとともに、高レベル(ビデオコンテキスト)と低レベル(ピクセル歪み)の粒度の両方で知覚品質を独立に解析するために設計されたデュアルビジョンエンコーダを備えている。
実験により, CP-LLMは, 確立されたVQAベンチマーク上での最先端のクロスデータセット性能と, 画素歪みに対する優れたロバスト性を実現することを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:13:19 GMT)
Kernel PCA for Out-of-Distribution Detection: Non-Linear Kernel Selections and Approximations [25.0] OoD(Out-of-Distribution)検出は、ディープニューラルネットワークの信頼性に不可欠である。
本研究では,OoDとIn-Distribution(In-Distribution,In-Distribution,InD)データの相違を,非線形特徴部分空間の新たな視点を通じて活用する。
我々は、カーネル主成分分析(KPCA)のフレームワークを活用して、識別非線形部分空間を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:06:44 GMT)
CAD: A General Multimodal Framework for Video Deepfake Detection via Cross-Modal Alignment and Distillation [25.0] クロスモーダルアライメント・蒸留(CAD)を用いたビデオディープフェイク検出のための一般的なフレームワークを提案する。
1)高レベルのセマンティックシンセシスにおける矛盾を識別するクロスモーダルアライメント(例:リップ音声ミスマッチ)、2)モダリティ特異的な法医学的痕跡(例:合成音声のスペクトル歪み)を保存しながらミスマッチを緩和するクロスモーダル蒸留(例:合成音声のスペクトル歪み)である。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:11:07 GMT)
Last Layer Empirical Bayes [24.9] ベイズニューラルネットワーク(BNN)とディープアンサンブル(ディープアンサンブル)は、この課題に対処するための最も顕著なアプローチの一つである。
近年の研究では、アンサンブルが使用する分布が、学習データに依存した先行データに対応する後続データとして理解できることに着想を得て、最後の層実験ベイズ(LLEB)を提案する。
LLEBは既存のアプローチと同等に機能し、経験的ベイズが将来の不確実性定量化研究の有望な方向であることを強調した。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:00:00 GMT)
An Efficient Private GPT Never Autoregressively Decodes [24.9] 生成事前学習型トランスフォーマー(GPT)は、クライアントとサーバの両方のプライバシー上の懸念を提起している。
本研究では,公開GPTモデルを用いた公開復号化とセキュアな検証手法を提案する。
実験では、3組のパブリック・プライベート・モデルの標準デコードと比較して2.1タイムのsim 6.0times$スピードアップが示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:28:56 GMT)
MoRE-Brain: Routed Mixture of Experts for Interpretable and Generalizable Cross-Subject fMRI Visual Decoding [24.8] MoRE-Brainは、高忠実で適応性があり、解釈可能な視覚再構成のために設計された、神経にインスパイアされたフレームワークである。
階層的なMixture-of-Expertsアーキテクチャを採用しており、専門家がfMRI信号を処理している。
MoRE-Brainは、より一般化され、解釈可能なfMRIベースのビジュアルデコードへと大きく進歩している。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:02:54 GMT)
Blind Spot Navigation: Evolutionary Discovery of Sensitive Semantic Concepts for LVLMs [24.8] 最近の研究では、モデルは視覚入力の特定の意味に特に敏感であり、エラーを起こしやすいことが示唆されている。
そこで本研究では,大規模視覚言語モデル(LVLM)の最初の探索を行った。
画像中の特定の意味概念に直面すると,LVLMは幻覚や様々な誤りの影響を受けることが判明した。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:45:43 GMT)
Covert Attacks on Machine Learning Training in Passively Secure MPC [24.7] マルチパーティ計算(MPC)により、データ所有者は、基礎となるトレーニングデータをプライベートに保ちながら、複合データ上でマシンラーニングモデルをトレーニングすることができる。
MPC脅威モデルは、全体行動に影響を与えることなく一部の政党を受動的に破壊する敵や、腐敗した政党の行動を積極的に修正する敵を考察する。
本研究では,既存のMPCトレーニングプロトコル上で,アクティブな相手が実行可能な,明示的でシンプルで効果的な攻撃方法を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:46:45 GMT)
Review: Quantum Architecture Search with Unsupervised Representation Learning [24.7] 教師なし表現学習は量子アーキテクチャ探索(QAS)を前進させる新しい機会を提供する
QASは変分量子アルゴリズム(VQA)のための量子回路を最適化するように設計されている
論文参考訳(メタデータ) (Wed, 21 May 2025 06:34:06 GMT)
Selective Structured State Space for Multispectral-fused Small Target Detection [24.6] 高解像度リモートセンシング画像におけるターゲット検出は、小さなターゲットの認識精度が低く、計算コストが高いため、課題に直面している。
これらの計算制約に対処するために、効率性のためにMambaの線形複雑性を利用する。
我々は,拡張小型目標検出(ESTD)モジュールと畳み込み注意残差ゲート(CARG)モジュールを開発することで,マンバを強化した。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:57:34 GMT)
Can Large Language Models Understand Internet Buzzwords Through User-Generated Content [24.6] 大型言語モデル(LLM)が中国語のインターネットバズワードの正確な定義を生成できるかどうかを検討する。
CHEERは中国のインターネットバズワードの最初のデータセットであり、それぞれに定義と関連性がある。
我々は,より正確なバズワード定義を生成するために,LLMの解釈過程を効果的に制御する新しい手法 RESS を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:38:47 GMT)
Multimodal Conditional Information Bottleneck for Generalizable AI-Generated Image Detection [24.5] InfoFDはテキスト誘導型AI生成画像検出フレームワークである。
TGCIB(Text-Guided Conditional Information Bottleneck)とDTO(Dynamic Text Orthogonalization)の2つの重要なコンポーネントを紹介する。
我々のモデルは、GenImageデータセットと最新の生成モデル上で、例外的な一般化性能を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:46:26 GMT)
RadioDiff-Inverse: Diffusion Enhanced Bayesian Inverse Estimation for ISAC Radio Map Construction [24.4] 無線地図(RM)は、環境に配慮した通信やセンシングに不可欠であり、位置固有の無線チャネル情報を提供する。
既存のRM構築法は、しばしば正確な環境データと基地局(BS)の場所に依存しており、動的またはプライバシーに敏感な環境では必ずしも利用できない。
本稿では、粗い環境知識とノイズスパース測定の下でのベイズ逆問題としてRM構築を定式化する。
拡散強化ベイズ逆推定フレームワークであるRadioDiff-Inverseを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:11:40 GMT)
An In-Depth Investigation of Data Collection in LLM App Ecosystems [24.4] OpenAIのGPTアプリエコシステムをケーススタディとして検討する。
我々は,GPTアクションの自然言語仕様を分析し,それらのデータ収集の実践を評価するLLMベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:58:04 GMT)
NESTFUL: A Benchmark for Evaluating LLMs on Nested Sequences of API Calls [24.2] API呼び出しのネストシーケンスに基づいて,大規模言語モデル(LLM)を評価するベンチマークであるNESTFULを提案する。
最適性能モデル (GPT-4o) は, 完全一致精度が28%, 勝率が60%であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:36:42 GMT)
Interpretability Illusions with Sparse Autoencoders: Evaluating Robustness of Concept Representations [24.0] 本研究では,SAE表現を操作するために対向的摂動が構築される現実的なシナリオを特徴とする評価フレームワークを開発する。
逆入力摂動は,ほとんどのシナリオにおいて,概念に基づく解釈を効果的に操作できることがわかった。
以上の結果から,SAEの概念表現は脆弱であり,モデル監視や監視に不適である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:42:05 GMT)
GenFT: A Generative Parameter-Efficient Fine-Tuning Method for Pretrained Foundation Models [23.9] Generative Fine-Tuning (GenFT) は、効率的な$Delta W$トレーニングのために$Delta W$から構造化された、転送可能な情報を抽出する新しい方法である。
VTAB-1K、FGVC、GLUEベンチマークの実験により、GenFTは最先端のPEFT法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:33:26 GMT)
UrduFactCheck: An Agentic Fact-Checking Framework for Urdu with Evidence Boosting and Benchmarking [23.8] 既存のファクトチェックの自動化ソリューションは圧倒的に英語に重点を置いており、世界中の2億人以上のUrduスピーカーにとって大きなギャップを残している。
Urduに特化して最適化された、初めての総合的でモジュール化されたファクトチェックフレームワークであるUrduFactCheckを紹介します。
本システムは,モノリンガルと翻訳に基づくアプローチを組み合わせた動的,マルチストラテジーなエビデンス検索パイプラインを備えている。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:31:44 GMT)
FaVoR: Features via Voxel Rendering for Camera Relocalization [23.8] カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:39:25 GMT)
Learn to Reason Efficiently with Adaptive Length-based Reward Shaping [23.6] 大規模共振モデル(LRM)は、強化学習(RL)を通して複雑な問題を解く際、顕著な能力を示した。
本稿では,長さに基づく報酬形成のレンズを用いて,様々な効率的な推論手法を定式化する統一フレームワークを提案する。
DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-32Bの実験により、本手法は推論性能と応答長の効率を大幅に向上させることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:03:26 GMT)
ReflAct: World-Grounded Decision Making in LLM Agents via Goal-State Reflection [23.5] ReflActは、推論を単に次のアクションを計画することから、その目標に対してエージェントの状態を継続的に反映することに移行する。
決定を明示的に下し、進行中のゴールアライメントを実施することで、ReflActは戦略的信頼性を劇的に向上します。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:57:39 GMT)
Text-to-Pipeline: Bridging Natural Language and Data Preparation Pipelines [23.4] データ作成命令をDPパイプラインに変換するタスクであるText-to-Pipelineを導入する。
また,システム評価を支援するベンチマーク PARROT も開発した。
この改善にもかかわらず、Text-to-Pipelineには相当な進歩の余地がある。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:40:53 GMT)
MoHAVE: Mixture of Hierarchical Audio-Visual Experts for Robust Speech Recognition [23.4] MoHAVE(Mixture of Hierarchical Audio-Visual Experts)は、スケーラビリティの制約に対処するために設計された、新しい堅牢なAVSRフレームワークである。
MoHAVEは、モダリティ固有の専門家グループを活性化し、計算オーバーヘッドを最小限にした様々なオーディオ視覚入力への動的適応を保証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:07:33 GMT)
Long-Short Chain-of-Thought Mixture Supervised Fine-Tuning Eliciting Efficient Reasoning in Large Language Models [23.3] LS-Mixture SFT(Long-Short Chain-of-Thought Mixture Supervised Fine-Tuning)を提案する。
LS-Mixture SFTでトレーニングしたモデルと直接SFTでトレーニングしたモデルでは,平均精度が2.3%向上した。
この研究は、教師付き微調整によって推論能力を持つ非推論モデルを実現するアプローチを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:17:56 GMT)
Constructing a 3D Town from a Single Image [23.2] 3DTownは、単一のトップダウンビューからリアルで一貫性のある3Dシーンを合成するために設計された、トレーニング不要のフレームワークである。
入力画像を重なり合う領域に分解し、事前訓練された3Dオブジェクトジェネレータを用いてそれぞれを生成する。
以上の結果から,1枚の画像から高品質な3Dタウンジェネレーションが実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:10:47 GMT)
Distance Adaptive Beam Search for Provably Accurate Graph-Based Nearest Neighbor Search [23.2] そこで本研究では,ビーム幅に基づくビームサーチのための距離に基づく新しい終端条件を提案する。
探索グラフがナビゲート可能である限り, 得られたアダプティブビームサーチ法は, ほぼ隣り合う問題を解くことが保証されている。
アダプティブビームサーチは、様々なリコール値、データセット、グラフ構造、および最も近い隣人のターゲット数において、標準ビームサーチより優れています。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:18:53 GMT)
Robo-DM: Data Management For Large Robot Datasets [23.0] 我々は,ロボットデータによる収集,共有,学習を行う,効率的なクラウドベースのデータ管理ツールキットであるRobo-DMを提案する。
Robo-DMは、トレーニング中のロボット軌跡データ、転送コスト、データ負荷時間を著しく削減することができる。
我々は,ロボDMで訓練されたモデルに,ロボ圧縮,ピック・アンド・プレイス・タスク,インコンテキスト・ロボット・トランスフォーマを用いて物理的に評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:17:06 GMT)
CineTechBench: A Benchmark for Cinematographic Technique Understanding and Generation [22.9] CineTechBenchは、調味された撮影の専門家による正確な手動アノテーションに基づいて作られたベンチマークである。
私たちのベンチマークでは、撮影スケール、ショットアングル、コンポジション、カメラの動き、照明、色、焦点距離の7つの重要な側面をカバーしています。
生成タスクでは,映像の質の高いカメラの動きを再現するための高度な映像生成モデルの評価を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:02:39 GMT)
CRAKEN: Cybersecurity LLM Agent with Knowledge-Based Execution [22.9] 大規模言語モデル(LLM)エージェントは、サイバーセキュリティタスクを自動化することができ、再設計することなく、進化するサイバーセキュリティの状況に適応することができる。
トレーニングデータ以外の最新のサイバーセキュリティの専門知識にアクセスし、複雑なタスク計画に新たな知識を統合することだ。
本稿では,3つのコア機構を通じて,サイバーセキュリティ能力を向上させる知識ベースLLMエージェントフレームワークであるCRAKENを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:01:11 GMT)
Reinforced MLLM: A Survey on RL-Based Reasoning in Multimodal Large Language Models [22.8] 本稿では,Multimodal Large Language Models(MLLM)における強化学習(RL)に基づく推論の最近の進歩を体系的にレビューする。
本稿では,2つの主要なRLパラダイム,値モデルフリーおよび値モデルベース手法に注目し,推論軌道の最適化とマルチモーダル情報の整合化により,RLが推論能力を高める方法を分析する。
本稿では,ベンチマークデータセット,評価プロトコル,現在の制限について概観し,スパース報酬,非効率なクロスモーダル推論,実世界の展開制約といった課題に対処するための今後の研究方向を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:08:31 GMT)
GRIT: Teaching MLLMs to Think with Images [22.7] Grounded Reasoning with Images and Texts (GRIT) はMLLMを画像で考えるための新しい手法である。
GRITは自然言語と明示的な境界ボックス座標をインターリーブする推論連鎖を生成する。
GRITは例外的なデータ効率を実現し、既存のデータセットから20のイメージクエスト・アンサートレットを必要とする。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:54:49 GMT)
Do different prompting methods yield a common task representation in language models? [22.7] デモと指示は、言語モデルにコンテキスト内学習タスクの実行を促す2つの主要なアプローチである。
テキスト機能ベクトル (FVs) を用いてこれを解析し, 少数ショットICLタスク表現を抽出する機構として最近提案されている。
実演型と命令型関数ベクトルが異なるモデル成分を利用するという証拠が得られ,タスク性能への貢献を解離するためのいくつかの制御が提供される。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:58:38 GMT)
Large Language Models are Miscalibrated In-Context Learners [22.3] 本研究では,学習方法の異なる選択にまたがる行動の詳細な分析を行う。
低リソース環境における全ての学習手法に誤校正問題が存在することを観察する。
最大確率で自己認識を行うことで,ロバストかつ校正された予測が得られることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:54:04 GMT)
Extracting Probabilistic Knowledge from Large Language Models for Bayesian Network Parameterization [22.3] LLM(Large Language Models)は、現実的な知識基盤としての可能性を示している。
本稿では, LLMにおける確率的知識を用いて, 事象に関する言明の確率推定を導出する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:15:05 GMT)
Mitigating Spurious Correlations with Causal Logit Perturbation [22.3] 本研究では,個々のサンプルに対して因果ロジット摂動を発生させた分類器を訓練するための新しい因果ロジット摂動(CLP)フレームワークを提案する。
このフレームワークは、オンラインのメタ学習ベースの学習アルゴリズムによって最適化され、人間の因果知識を利用して、反事実的および事実的両方の方法でメタデータを増強する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:21:02 GMT)
Steering Generative Models with Experimental Data for Protein Fitness Optimization [22.1] タンパク質の適合性最適化は、可能なシーケンスの大きな設計空間において、所望の量的特性を最大化するシーケンスを見つけることを含む。
ステアリングタンパク質生成モデル(例えば拡散モデル、言語モデル)の最近の発展は、有望なアプローチである。
本稿では,タンパク質言語モデルを用いた強化学習などの代替手法と比較して,プラグ・アンド・プレイ指導方式が有利であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:30:48 GMT)
Boosting Text-to-Chart Retrieval through Training with Synthesized Semantic Insights [22.0] 既存のテキストからチャートへの検索ソリューションは、しばしばチャートのセマンティックコンテンツとコンテキスト情報をキャプチャするのに失敗する。
本稿では,グラフの階層的意味的洞察を自動的に合成する学習データ開発パイプラインを提案する。
私たちはCLIPベースのモデルChartFinderをトレーニングし、テキストからチャートへの検索のためのチャートのより良い表現を学習します。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:08:15 GMT)
Nonparametric Teaching for Graph Property Learners [22.0] 本稿では,新しい非パラメトリック教育の観点から学習過程を再解釈するグラフニューラル・インストラクション(GraNT)を提案する。
GraNTは、例の選択を通じて暗黙的に定義された(非パラメトリック)マッピングを教える理論的枠組みを提供する。
グラフ特性学習者が構造認識非パラメトリック学習者と整合性を示すのはこれが初めてである。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:09:21 GMT)
Faster Video Diffusion with Trainable Sparse Attention [21.6] ビデオ拡散トランス (DiTs) のスケーリングは、注意質量の大部分が少数の位置に集中しているにもかかわらず、2次元の注意によって制限される。
私たちはこの観察を、トレーニング可能なハードウェア効率の良いスパースアテンションであるVSAに変換し、Emphbothのトレーニングと推論の完全なアテンションを置き換える。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:36:51 GMT)
Pura: An Efficient Privacy-Preserving Solution for Face Recognition [21.5] そこで我々はPuraという顔認識のための効率的なプライバシー保護ソリューションを提案する。
Puraは個人の顔のプライバシーを保護し、暗号化されたデータに対する顔認識を効率的にサポートする。
Puraは、最先端技術よりも最大16倍高速な認識を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:50:25 GMT)
Advancing LLM Safe Alignment with Safety Representation Ranking [21.5] モデル自体から隠れ状態を用いて安全な応答を選択するリストワイズランキングフレームワークを提案する。
本手法は、内部モデル状態とリストレベルの監督を直接利用して、微妙な安全信号を捕捉する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:21:29 GMT)
Exploring Generalized Gait Recognition: Reducing Redundancy and Noise within Indoor and Outdoor Datasets [21.5] 一般化歩行認識は、多様な領域にわたる堅牢なパフォーマンスを実現することを目的としている。
混合データセットトレーニングは一般化を高めるために広く利用されている。
クロスドメイン歩行認識を体系的に改善する統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:46:09 GMT)
Angle Domain Guidance: Latent Diffusion Requires Rotation Rather Than Extrapolation [21.2] テキスト画像のアライメントが大幅に向上する高い誘導重みの下では、分類器なし誘導(CFG)は生成された画像に顕著な色歪みをもたらす。
CFGにより誘導されるノルム増幅と異常拡散現象のメカニズムを解明する理論的枠組みを提案する。
テキスト・イメージアライメントの強化を保ちながら色歪みを軽減するアングル・ドメイン・ガイダンス(ADG)アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:36:56 GMT)
Multilingual Prompting for Improving LLM Generation Diversity [21.1] 大きな言語モデル(LLM)は、その世代における文化的表現と全体的な多様性が欠如していることが知られている。
多言語プロンプト(multilingual prompting) - 複数の文化からの文化的・言語的手がかりを付加したベースプロンプトの様々なバリエーションを生成するプロンプト手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:59:21 GMT)
Pixels Versus Priors: Controlling Knowledge Priors in Vision-Language Models through Visual Counterfacts [20.9] 我々は、世界的知識を視覚入力と直接衝突させる視覚的現実的反事実のデータセットであるVisual CounterFactを紹介した。
モデル予測は、当初記憶された先行を反映していたが、中期から後期の層における視覚的エビデンスに移行したことを示す。
このダイナミクスは、2つのモダリティ間の競合を明らかにし、視覚的な入力は評価中に最終的に事前をオーバーライドする。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:56:55 GMT)
Exploring Neural Granger Causality with xLSTMs: Unveiling Temporal Dependencies in Complex Data [20.8] 時系列における因果関係は、特に非線形依存の存在下では決定が難しい。
本稿では,変数間の長距離関係を捉えるために,Granger causal xLSTM(GC-xLSTM)を提案する。
提案したGC-xLSTMモデルの総合的有効性を示す6つの多様なデータセットに関する実験的検討を行った。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:55:05 GMT)
Classifying and Tracking International Aid Contribution Towards SDGs [20.7] 国際援助は、発展途上国の経済成長と豊かさを促進するための重要なメカニズムである。
労働集約的なデータ管理と不完全な記録のため、支援の追跡は依然として困難である。
我々は、手動の分類を補完し、主観的解釈において人間の偏見を緩和するAIモデルを開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:50:40 GMT)
On the Generalization vs Fidelity Paradox in Knowledge Distillation [20.6] 知識蒸留(KD)は、大きな言語モデルを小さな言語に圧縮し、性能を保ちながら圧縮する技術である。
0.5B から 7B までの範囲で KD の大規模および統計的解析を行った。
以上の結果から,KD は小型モデルの平均性能を最大10% 向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:23:32 GMT)
Information-Theoretic Foundations for Machine Learning [20.6] 本稿では,機械学習における既存の実践に厳密な情報提供を試みる理論的枠組みを提案する。
我々はベイズ統計とシャノンの情報理論に根ざしたフレームワークを提供し、機械学習における多くの現象の分析を統一するのに十分一般的なものである。
データ複雑性の増大に伴って弱まる既存の分析とは異なり、理論的ツールはさまざまな機械学習設定に対して正確な洞察を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:17:04 GMT)
When to Continue Thinking: Adaptive Thinking Mode Switching for Efficient Reasoning [20.2] 大規模推論モデル(LRM)は、長い推論チェーンを通じて顕著な性能を達成するが、しばしば冗長な推論のために過剰な計算オーバーヘッドを引き起こす。
本稿では、不必要な推論を抑え、暗黙の回復を可能にするフレームワークである適応自己回復推論(ASRR)を提案する。
本研究は, LRMの効率, 適応性, 安全性を高めるためのASRRの可能性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:41:39 GMT)
Think When You Need: Self-Adaptive Chain-of-Thought Learning [20.2] 思考の連鎖(CoT)推論は言語モデルの性能を高めるが、単純な問題では非効率な「過剰思考」につながることが多い。
推論長を直接罰する既存の手法は、様々な問題の複雑さを考慮に入れない。
提案手法は,解の正しさと簡潔さを両立させる理論的な仮定によって導かれる,長さと品質の比較を通じて報酬を構成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:26:54 GMT)
Investigating and Enhancing Vision-Audio Capability in Omnimodal Large Language Models [20.2] 本稿では,OLLMの視覚テキストコンポーネントが教師として,視覚音声コンポーネントが学生として機能する自己知識蒸留(Self-KD)トレーニング手法を提案する。
実験結果から,自己KDはOLLMの視覚音響能力を高める有効な方法であることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:59:57 GMT)
An Empirical Study of LLM Reasoning Ability Under Strict Output Length Constraint [20.1] 異なる大言語モデルの推論能力が厳密な制約の下で有効であるかどうかは不明だ。
我々は、幅広い出力長予算の下で、共通推論データセット上で30個のLCMを試験する。
その結果,LCM推論能力について,いくつかの興味深い知見が得られた。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:05:29 GMT)
SoftHGNN: Soft Hypergraph Neural Networks for General Visual Recognition [19.9] ハイパーグラフは高次相互作用をモデル化することによって従来のグラフを拡張する。
既存のハイパーグラフニューラルネットワークは通常、静的およびハードなハイパーエッジ割り当てに依存している。
本稿では,ハイパーグラフ計算の方法論を拡張したソフトハイパーグラフニューラルネットワーク(SoftHGNN)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:01:30 GMT)
UncertainSAM: Fast and Efficient Uncertainty Quantification of the Segment Anything Model [19.9] 本稿では,ベイズエントロピーの定式化に基づく理論的動機付けの不確実性定量化モデルを提案する。
この定式化を利用して、軽量なポストホックUQ手法USAMを訓練する。
提案した決定論的USAMは,SA-V,MOSE,ADE20k,DAVIS,COCOデータセットに優れた予測能力を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:35:01 GMT)
Learning Joint ID-Textual Representation for ID-Preserving Image Synthesis [19.9] マルチモーダル符号化戦略を用いたID保存のための新しいフレームワークを提案する。
FaceCLIPは、アイデンティティとテキストセマンティクスの両方のための共同埋め込み空間を学習する。
次に、ID保存画像合成パイプラインであるFaceCLIP-SDXLを構築する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:56:33 GMT)
Multilingual Test-Time Scaling via Initial Thought Transfer [19.9] テストタイムのスケーリングは、推論性能を高めるための推論タイム戦略として広く採用されている。
本研究は,DeepSeek-R1-Distill-LLama-8BとDeepSeek-R1-Distill-Qwen-7Bを評価し,多言語環境でのテスト時間スケーリングに関する最初の体系的研究である。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:27:38 GMT)
Learning Fused State Representations for Control from Multi-View Observations [19.9] MVRL(Multi-view Reinforcement Learning)は、エージェントに多視点観察を提供し、より有効で精度の高い環境を認識できるようにする。
MVRLの最近の進歩は、多視点観測から潜在表現を抽出し、制御タスクに活用することに焦点を当てている。
まず,MVRLにバイシミュレートメトリック学習を取り入れ,タスク関連表現を学習する多視点統合制御(MFSC)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:42:25 GMT)
InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition [19.7] InstructSAMは、命令駆動オブジェクト認識のためのトレーニング不要のフレームワークである。
我々は、地球観測のための最初のインストラクトCDSベンチマークであるEarthInstructを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:56 GMT)
PlaySlot: Learning Inverse Latent Dynamics for Controllable Object-Centric Video Prediction and Planning [19.7] PlaySlotはオブジェクト中心のビデオ予測モデルであり、未ラベルのビデオシーケンスからオブジェクト表現と潜在アクションを推論する。
PlaySlotは、ビデオのダイナミックスから推測できる潜在アクションで条件付けられた複数の可能な先物の生成を可能にする。
その結果,PlaySlotは,異なる環境における映像予測において,オブジェクト中心のベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:44:50 GMT)
DUSK: Do Not Unlearn Shared Knowledge [19.6] Machine Unlearningは、ユーティリティと情報を“保持”セットから保持しながら、そのような“忘れる”データを削除することを目的としている。
DUSKは実データ重なりの非学習手法を評価するためのベンチマークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:37:35 GMT)
AudioJailbreak: Jailbreak Attacks against End-to-End Large Audio-Language Models [19.6] 近年,大規模音声言語モデル (LALM) に対するジェイルブレイク攻撃について検討されている。
本稿では,非同期性,普遍性,ステルス性,強靭性を備えた新しいオーディオジェイルブレイク攻撃であるAudioJailbreakを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:36:20 GMT)
SpectralGap: Graph-Level Out-of-Distribution Detection via Laplacian Eigenvalue Gaps [19.6] グラフ上でのOOD検出に有効なポストホック手法であるSpecGapを提案する。
SpecGapは、複数のベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:47:44 GMT)
ThinkRec: Thinking-based recommendation via LLM [19.4] ThinkRec は LLM4Rec を System 1 から System 2 (レーショナルシステム) に移行する思考ベースのフレームワークである。
ThinkRecは、キーワードの要約でアイテムメタデータを拡張し、合成推論トレースを注入するシンクアクティベーションメカニズムを導入している。
ThinkRecは、ユーザの潜在機能に基づいて専門家モデルに重みを動的に割り当てることで、個々のユーザへの推論パスを適応させ、精度とパーソナライゼーションを向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:25:18 GMT)
Audio Jailbreak: An Open Comprehensive Benchmark for Jailbreaking Large Audio-Language Models [19.4] LAMのjailbreak脆弱性を評価するために特別に設計された最初のベンチマークであるAJailBenchを紹介します。
このデータセットを使用して、いくつかの最先端のLAMを評価し、攻撃間で一貫性のある堅牢性を示すものはありません。
以上の結果から, セマンティックに保存された摂動でさえ, 先行するLAMの安全性を著しく低下させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:47:47 GMT)
When Can Large Reasoning Models Save Thinking? Mechanistic Analysis of Behavioral Divergence in Reasoning [19.3] 大規模推論モデル(LRM)は複雑なタスクにおいてかなり高度な性能を持つが、非効率性を導入する傾向にある。
本研究では,Regress Learning (RL) 学習における内的メカニズムについて考察した。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:55:35 GMT)
R&D-Agent-Quant: A Multi-Agent Framework for Data-Centric Factors and Model Joint Optimization [19.3] 金融市場は、その高次元性、非定常性、持続的ボラティリティにより、資産返却予測に根本的な課題を提起する。
大規模言語モデルやマルチエージェントシステムの進歩にもかかわらず、現在の定量的研究パイプラインは、限定された自動化、弱い解釈可能性、ファクタマイニングやモデル革新といった重要なコンポーネント間の断片的な調整に悩まされている。
本稿では,量的ファイナンスのためのR&D-Agentを提案する。RD-Agent(Q)は,コーディネート・ファクターモデルによる量的戦略の完全な研究と開発を自動化するために設計された,最初のデータ中心型マルチエージェントフレームワークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:20:56 GMT)
ChemHGNN: A Hierarchical Hypergraph Neural Network for Reaction Virtual Screening and Discovery [19.3] ChemHGNNはハイパーグラフニューラルネットワークフレームワークで、反応ネットワーク内の高次関係をキャプチャする。
我々の研究は、反応の仮想スクリーニングと発見のためのGNNの優れた代替品としてHGNNを確立し、反応の発見を加速するための化学的に情報を得たフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:58:25 GMT)
ClickSight: Interpreting Student Clickstreams to Reveal Insights on Learning Strategies via LLMs [19.3] デジタル学習環境からのクリックストリームデータは、生徒の学習行動に関する貴重な洞察を提供するが、解釈することは困難である。
学生のクリックストリームを解釈して学習戦略を明らかにする,LLM(In-context Large Language Model)ベースのパイプラインであるClickSightを紹介した。
我々は,4つの異なるプロンプト戦略を評価し,自己抑制が解釈品質に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:52:57 GMT)
A Survey on Multilingual Mental Disorders Detection from Social Media Data [19.2] 本研究は,多言語ソーシャルメディアデータを用いたメンタルヘルス障害の検出に関する第1回調査である。
オンライン言語パターンと自己開示行動に影響を与える文化的ニュアンスについて検討する。
メンタルヘルススクリーニングのためのNLPモデルの開発に使用できる多言語データ収集の包括的リストを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:15:54 GMT)
Deep Policy Gradient Methods Without Batch Updates, Target Networks, or Replay Buffers [19.1] アクション・バリュー・グラディエント(AVG)は、新たなディープ・ポリシー・グラディエント法である。
インクリメンタルアップデートのみを使用して、実際のロボットによる効果的な深層強化学習を初めて示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:30:43 GMT)
DLO-Splatting: Tracking Deformable Linear Objects Using 3D Gaussian Splatting [19.1] DLO-Splattingは、多視点RGB画像とグリップ状態情報から変形可能な線形物体(DLO)の3次元形状を推定するアルゴリズムである。
このアルゴリズムは、形状の滑らかさと剛性減衰補正を備えた位置ベース力学モデルを用いて、物体の形状を予測する。
実験では、既存の視覚のみの手法では難しいノットタイリングのシナリオで有望な結果を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:32:36 GMT)
Reconsider the Template Mesh in Deep Learning-based Mesh Reconstruction [19.0] メッシュ再構築は、シリコン内試験、デジタル双生児、手術計画、ナビゲーションなど、さまざまな応用の基盤となるプロセスである。
近年のディープラーニングの進歩は、メッシュ再構築速度を著しく向上させた。
適応テンプレートを生成するATMRN(Adaptive-Template-based Mesh Restruction Network)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:10:31 GMT)
Privacy-Preserving Conformal Prediction Under Local Differential Privacy [19.0] 局所微分プライバシー(LDP)に基づく2つの相補的アプローチを提案する。
最初のアプローチでは、ユーザーはモデルにアクセスするのではなく、k-aryランダム化応答を使用して入力機能と摂動ラベルを提供する。
厳格なプライバシー制約を強制する第2のアプローチでは、ユーザはバイナリ検索応答によって適合度スコアにノイズを加える。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:29:44 GMT)
DB-Explore: Automated Database Exploration and Instruction Synthesis for Text-to-SQL [18.9] 大規模言語モデルとデータベースの知識を体系的に整合させる新しいフレームワークであるDB-Exploreを提案する。
我々のフレームワークは、多様なサンプリング戦略と自動命令生成を通じて、包括的なデータベース理解を可能にする。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:14:08 GMT)
Swarm Intelligence Enhanced Reasoning: A Density-Driven Framework for LLM-Based Multi-Agent Optimization [18.9] 本稿では,新しいエージェントベースのSwarm Intelligence(ASI)パラダイムを導入することにより,Swarmインテリジェンスを推論プロセスに統合することを提案する。
そこで我々は,Swarm Intelligence Enhancing Reasoningフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:48:13 GMT)
ChartCards: A Chart-Metadata Generation Framework for Multi-Task Chart Understanding [18.9] マルチタスクチャート理解のための統合チャートメタタ生成フレームワークであるChartCardsを提案する。
ChartCardsを用いて,10,862データテーブル,85Kチャート,170Kチャートキャプションを含む大規模高品質データセットであるMetaChartを構築した。
MetaChartの6つのモデルを微調整した結果、すべてのタスクの平均性能は5%向上した。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:07:47 GMT)
Volumetrically Consistent 3D Gaussian Rasterization [18.8] また,スプレイティングにおけるコア近似は,ビューライザ内においても不要であることを示す。
この分析透過率を用いて3DGSよりも高精度なアルファ値を得る。
本手法は, 3DGSよりも精度が高く, 点数が少ない表面を表現している。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:44:37 GMT)
Agentic Feature Augmentation: Unifying Selection and Generation with Teaming, Planning, and Memories [18.8] 本稿では,特徴生成と選択の統一をエージェントチームと計画としてモデル化したエージェント機能拡張概念を提案する。
具体的には、冗長な特徴を除去するセレクタエージェントと、情報的新しい次元を生成するジェネレータエージェントと、その動作を戦略的に調整するルータエージェントからなる、長短期記憶付きマルチエージェントシステム(MAGS)を開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:49:24 GMT)
Towards Explainable Temporal Reasoning in Large Language Models: A Structure-Aware Generative Framework [18.8] 本稿では,多種多様な時間的粒度を網羅したベンチマークを導入し,説明可能な時間的推論における大規模言語モデルの能力を体系的に評価する。
提案するGETERは,グラフ構造を記述可能なテンポラル推論のためのテキストと統合した新しい構造認識型生成フレームワークである。
GETERは最先端の性能を実現し、その効果と強力な一般化能力を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:20:35 GMT)
Learning Task-preferred Inference Routes for Gradient De-conflict in Multi-output DNNs [18.8] マルチ出力ディープニューラルネットワークは複数のタスクブランチを含む。
これらのタスクは、通常、異なるタスク推論経路の絡み合いにつながる部分的なネットワークフィルタを共有する。
本研究では,DR-MGFという新しい勾配分解アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:54:35 GMT)
VP Lab: a PEFT-Enabled Visual Prompting Laboratory for Semantic Segmentation [18.7] VP Labは、堅牢なセグメンテーションモデル開発のための視覚的プロンプトを強化する包括的な反復フレームワークである。
E-PEFTは、視覚的なプロンプトパイプラインを特定の領域に適応させるために設計されたパラメータ効率の良い微調整技法の新たなアンサンブルである。
E-PEFTと視覚的プロンプトを組み合わせることで、様々な技術データセット間でセマンティックセグメンテーションmIoUの性能が50%向上することを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:46:57 GMT)
Sculpting Features from Noise: Reward-Guided Hierarchical Diffusion for Task-Optimal Feature Transformation [18.7] DIFFTは報酬誘導型生成タスクとしてフィーチャートランスフォーメーションを再定義する。
構造的かつ離散的な特徴を生成し、機能内依存関係を保持しながら、並列な機能間生成を可能にする。
予測精度とロバスト性において、最先端のベースラインを一貫して上回り、トレーニングや推論時間を大幅に低下させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:18:42 GMT)
Decouple and Orthogonalize: A Data-Free Framework for LoRA Merging [18.7] 分離直交メルジング手法(DO-Merging)を提案する。
パラメータを大きさと方向の成分に分離することにより、マージしたモデルの方向アライメントに対する大きさ差の影響を低減する。
我々は、視覚、言語、マルチモーダル領域にわたる広範な実験を通じて、提案したDO-Mergingは、既存のマージメソッドよりも、最小限のコストで大幅に高いパフォーマンスを達成することができることを検証した。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:34:37 GMT)
Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima [18.6] 固定信頼条件下でのマルチアームバンディットにおけるベストアーム識別の問題について検討する。
我々の分析では、複数の最適なアームを明示的に説明できる新しい情報理論の下限を導入している。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:22:37 GMT)
Few-Shot Test-Time Optimization Without Retraining for Semiconductor Recipe Generation and Beyond [18.6] 我々は、事前訓練されたAIモデルやデプロイされたハードウェアシステムへの入力を最適化するためのテスト時最適化フレームワークであるモデルフィードバック学習を紹介する。
モデルパラメータの調整に依存する既存の手法とは対照的に、MFLは軽量のリバースモデルを利用して最適な入力を反復的に探索する。
半導体プラズマエッチングタスクにおけるMFLの有効性を検証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:24:23 GMT)
Position: Agentic Systems Constitute a Key Component of Next-Generation Intelligent Image Processing [18.5] 画像処理コミュニティは、純粋にモデル中心の開発からエージェントシステム設計まで、その焦点を広げるべきである。
現在のアプローチでは、一般化、適応性、現実の問題解決の柔軟性において限界に直面している。
本稿では、モデル中心のパラダイムの重要な制約を分析し、エージェント画像処理システムの設計原則を確立し、そのようなエージェントの能力レベルを概説する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:47:29 GMT)
Localizing Before Answering: A Hallucination Evaluation Benchmark for Grounded Medical Multimodal LLMs [18.4] LMMのローカライズ能力とロバスト性を評価するためのベンチマークであるHEAL-MedVQAを紹介する。
そこで本研究では,LMMが関心のある対象領域をローカライズするためのLobA(Lobize-before-Answer)フレームワークを提案する。
実験の結果, HEAL-MedVQA ベンチマークでは, バイオメディカル LMM よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:21:21 GMT)
Segmentation-Variant Codebooks for Preservation of Paralinguistic and Prosodic Information [18.4] SSL音声モデルの量子化は、韻律情報とパラ言語情報を捨てる。
本稿では,異なる言語単位で音声を定量化するSVCを提案する。
SVCは、探索タスク全体にわたる韻律情報やパラ言語情報の保存において、はるかに効果的である。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:44:32 GMT)
An Inclusive Foundation Model for Generalizable Cytogenetics in Precision Oncology [18.3] CHROMAは、染色体異常の一般化可能な表現を学習することで、課題を克服するために設計された細胞ゲノム学の基礎モデルである。
84,000点以上の検体(400万点の染色体画像)で、自己教師による学習によって事前訓練されている。
CHROMAは、信頼性と自動化された臨床分析のためのスケーラブルで一般化可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:03:37 GMT)
RAG or Fine-tuning? A Comparative Study on LCMs-based Code Completion in Industry [18.2] 本稿では,産業コード補完のためのRAG(Retrieval-Augmented Generation)とFT(Final-tuning)の2つのパラダイムを比較した。
その結果,RAGは,コードスニペットを高密度ベクトル表現にマッピングする適切な埋め込みモデルを用いて実装すると,微調整のみよりも高い精度が得られることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:51:25 GMT)
PRUNE: A Patching Based Repair Framework for Certifiable Unlearning of Neural Networks [18.2] トレーニングされたニューラルネットワークモデルからトレーニングデータの特定の部分(すなわち未学習)を取り除くことが望ましい。
既存のアンラーニング手法では、残ったデータで代替モデルを訓練する。
我々は、要求されたデータのターゲットの「偽造」を除去するために、元のニューラルネットワークに慎重に構築された「パッチ」を付与して、新しいアンラーニングアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:04:41 GMT)
UrbanMind: Urban Dynamics Prediction with Multifaceted Spatial-Temporal Large Language Models [18.1] UrbanMind は多面的都市動態予測のための空間時空間 LLM フレームワークである。
UrbanMindのコアとなるMuffin-MAEは、特殊なマスキング戦略を備えた多面式フュージョンマスク自動エンコーダである。
複数の都市にまたがる実世界の都市データセットの実験は、UrbanMindが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:56:05 GMT)
FlexQuant: A Flexible and Efficient Dynamic Precision Switching Framework for LLM Quantization [18.0] 推論速度と精度のトレードオフを最適化する動的精度スイッチングフレームワークFlexQuantを提案する。
我々の研究は量子化戦略の包括的分析を提供し、最適な切替のための精度要求モデルを導入し、効率的なきめ細かな精密管理を実現する。
実験の結果、FlexQuantは様々な言語タスクで1.3倍のエンドツーエンドのスピードアップを達成し、精度の損失は無視できることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:42:53 GMT)
Breaking the Memory Wall for Heterogeneous Federated Learning via Progressive Training [17.9] ProFLはFLのメモリ制約に効果的に対処する新しいフレームワークである。
モデルを元のアーキテクチャに基づいてブロックに分割し、プログレッシブな方法で各ブロックをトレーニングする。
ProFLはピークメモリのフットプリントを57.4%削減し、モデル精度を82.4%向上させた。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:38:20 GMT)
Adaptive Estimation and Learning under Temporal Distribution Shift [17.8] 本研究では,時間分布シフトによる推定と学習の問題について検討する。
長さ$n$の観測シーケンスを考えてみましょう。
本研究では,ウェーブレットのソフトスレッディング推定器が基底に対して最適推定誤差を与えることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:56:07 GMT)
Beyond Empathy: Integrating Diagnostic and Therapeutic Reasoning with Large Language Models for Mental Health Counseling [17.8] PsyLLMは、メンタルヘルスカウンセリングの診断と治療的推論を統合するために設計された大きな言語モデルである。
このパイプラインは現実世界のメンタルヘルスポストを処理し、マルチターン対話構造を生成する。
厳密な多次元フィルタリングは、高品質で臨床的に整合した対話データを生成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:24:49 GMT)
Fast Rate Bounds for Multi-Task and Meta-Learning with Different Sample Sizes [17.6] マルチタスクとメタラーニングのための新しい高速な一般化境界をアンバランスな環境で提示する。
我々の新しい境界は数値計算可能であり、解釈可能である。
我々は、バランスの取れない状況が2つの意味のあるマルチタスクリスクの定義を可能にするという事実に光を当てた。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:22:07 GMT)
Exploring Flow-Lenia Universes with a Curiosity-driven AI Scientist: Discovering Diverse Ecosystem Dynamics [17.4] 本稿では,フローレニア$-$a連続セルオートマトン(CA)におけるシステムレベルダイナミクスの自動発見法を提案する。
この方法は、CAの進化的・生態系的ダイナミクスの自己組織化につながる過程を明らかにすることを目的としている。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:28:58 GMT)
Unified Cross-Modal Attention-Mixer Based Structural-Functional Connectomics Fusion for Neuropsychiatric Disorder Diagnosis [17.4] ConneXはマルチモーダル核融合法であり、多層パーセプトロン(MLP)-ミクサーとクロスアテンション機構を統合する。
2つの異なる臨床データセット上での性能向上を示し、提案フレームワークの堅牢性を強調した。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:49:13 GMT)
Spark: A System for Scientifically Creative Idea Generation [17.3] 大規模言語モデル(LLM)は、科学における新しい研究のアイデアを生み出す有望な能力を示している。
我々は、LLMを用いた検索強化アイデア生成と、OpenReviewから600Kの科学的レビューに基づいて訓練された審査員モデルとを結合したSparkというアイデア生成システムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:26:09 GMT)
GradPCA: Leveraging NTK Alignment for Reliable Out-of-Distribution Detection [17.3] ニューラル・タンジェント・カーネル(NTK)アライメントによって誘導されるニューラルネットワーク勾配の低ランク構造を利用する、アウト・オブ・ディストリビューション(OOD)検出法であるGradPCAを紹介する。
GradPCAは、勾配クラス平均に対して主成分分析(PCA)を適用し、標準画像分類ベンチマークにおける既存の手法よりも一貫したパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:00:39 GMT)
Towards Real-world Debiasing: Rethinking Evaluation, Challenge, and Solution [17.1] 我々は、このギャップを埋め、現実のデバイアスのための体系的な評価フレームワークを構築するために、2つの新しい現実世界に着想を得たバイアスを導入します。
この課題に対処するため,Debias in Destruction (DiD) というシンプルなアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:16:49 GMT)
Physics-Guided Multi-View Graph Neural Network for Schizophrenia Classification via Structural-Functional Coupling [16.8] 統合失調症(SZ)などの神経精神疾患における脳構造接続(SC)と機能接続(FC)の障害に関する臨床的研究
伝統的なアプローチは、統合失調症(SZ)の機能的データ可用性と認知的理解にのみ依存するかもしれない
論文参考訳(メタデータ) (Wed, 21 May 2025 05:41:48 GMT)
Neurons Speak in Ranges: Breaking Free from Discrete Neuronal Attribution [16.5] 高度に正常なニューロンでも,多節性行動が持続的に発現していることが示される。
この観察は、ニューロンの属性からレンジベースの解釈へのシフトを動機付けている。
本稿では,新しいレンジベースの解釈・操作フレームワークであるNeuronLensを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:16:45 GMT)
SpecOffload: Unlocking Latent GPU Capacity for LLM Inference on Resource-Constrained Devices [16.4] SpecOffloadは投機的デコーディングをオフロードに埋め込む。
最高のベースラインと比較して、SpecOffloadはGPUコアの利用率を4.49倍改善し、推論スループットを2.54倍向上させた。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:54:38 GMT)
Convex Relaxation for Robust Vanishing Point Estimation in Manhattan World [16.4] GlobustVPは、マンハッタンの世界における点の消滅のための、グローバルに最適なアウトリー・ロバスト反復解法である。
合成データと実世界のデータの両方の実験により、GlobustVPは効率、堅牢性、大域的最適性の間の好適なバランスを達成していることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:59:11 GMT)
Red-Teaming for Inducing Societal Bias in Large Language Models [16.3] 有害なコンテンツに対する標準安全対策がバイアスに与える影響を評価するために,2つのバイアス特異的なレッドチーム法を提案する。
我々はこれらの攻撃戦略を用いて、複数のオープンソースおよびクローズドソース言語モデルからバイアス応答を誘導する。
我々の手法は、安全ガードレールで訓練された者でさえ、すべてのモデルのバイアスを増加させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:29:49 GMT)
Aligning Explanations with Human Communication [16.3] 本稿では,実践的推論の原理に基づく反復的手続きと,コミュニケーションの利便性を最大化する説明文を生成する合理的な発話法を提案する。
本手法を画像分類タスクにおいて評価し、3つのデータセット間の説明とリスナーの嗜好の整合性の向上を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:14:05 GMT)
DS-Bench: A Realistic Benchmark for Data Science Code Generation [16.2] 我々は、複雑で現実的なデータサイエンスコード生成タスクにおいて、大規模言語モデル(LLM)を評価するために設計された新しいベンチマークであるDS-benchを紹介する。
DS-benchは、広く使用されている10のPythonデータサイエンスライブラリでGitHubからソースされた1,000の慎重に構築された問題で構成されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:11:26 GMT)
Federated Learning with Unlabeled Clients: Personalization Can Happen in Low Dimensions [16.2] FLowDUPは、ラベルのないデータを持つフォワードパスのみを使用してパーソナライズされたモデルを生成することができる。
新たなトランスダクティブマルチタスク PAC-Bayesian 一般化バウンダリは、ラベルのないクライアントに対して性能保証を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:30:59 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1] 本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。
計算効率,近似誤差,プライバシ保護,解釈可能性の4つの主な課題について考察した。
異なるDAタスクでSVアプリケーションを開発するための,モジュール的でオープンソースなフレームワークであるSVBenchを実装している。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:52:12 GMT)
Pierce the Mists, Greet the Sky: Decipher Knowledge Overshadowing via Knowledge Circuit Analysis [16.1] PhantomCircuitは知識の共有を分析・検出するフレームワークである。
注目の頭脳の内部動作を識別し、競合する知識経路がオーバーシャドーイング現象にどのように貢献するかを追跡する。
この幻覚に関する新たな洞察を提供し、その潜在的な緩和のための新しい方法論のレンズを研究コミュニティに提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:11:58 GMT)
AvatarShield: Visual Reinforcement Learning for Human-Centric Video Forgery Detection [16.0] AvatarShieldは人間中心のフェイクビデオを検出する最初の解釈可能なMLLMベースのフレームワークである。
低コストのテキストアノテーションデータの使用を効果的に回避し、正確な時間的モデリングと偽造検出を可能にする。
また、高レベルの意味的推論と低レベルの成果物増幅を組み合わせたデュアルエンコーダアーキテクチャを設計し、MLLMを効果的な偽造検出に導く。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:43:34 GMT)
Highlighting What Matters: Promptable Embeddings for Attribute-Focused Image Retrieval [16.0] 我々は属性中心クエリの処理において,現在のテキスト・トゥ・イメージ(T2I)レトリバーを評価する。
CLIPライクなレトリバーは性能が悪く不均衡であることがわかった。
本稿では,これらのマルチモーダルレトリバーで実現可能な高速な画像埋め込みを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:38:06 GMT)
The Atlas of In-Context Learning: How Attention Heads Shape In-Context Retrieval Augmentation [15.8] 我々は、情報成分の合成としてプロンプトを眺めることで、質問応答のための文脈内検索強化のメカニズムについて光を当てた。
そこで本研究では,属性に基づく特殊注意ヘッドの同定手法を提案し,指示を理解し,関連するコンテキスト情報を検索するコンテキスト内ヘッドを明らかにする。
得られた洞察を活用して、推論時に使用される知識のソースをトレースし、より安全で透明な言語モデルへの道を開く。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:01 GMT)
SHARP: Synthesizing High-quality Aligned Reasoning Problems for Large Reasoning Models Reinforcement Learning [15.7] STEM領域での強化学習を伴う大規模推論モデル(LRM)の訓練は、高品質で多様性があり、検証可能な問題セットの不足によって妨げられる。
検証可能な報酬(RLVR)を用いたLRM強化学習における高品質アラインド推論問題の一元化手法であるSHARPを導入する。
我々は、最先端のLEMを活用して、難解なSTEM質問を推論し、検証し、次に、強化学習ループを使用して、検証可能な報酬信号によってモデルの推論を洗練する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:15:03 GMT)
Systematic Parameter Decision in Approximate Model Counting [15.7] 本稿ではハッシュベースの近似モデルカウントアルゴリズム$mathsfApproxMC$の内部パラメータを決定する新しい手法を提案する。
削減後、結果の最適化問題は極めて単純な形で行われ、基本的な探索アルゴリズムが利用可能となる。
実験の結果,最新の$mathsfApproxMC$のパラメータを1.6~2.4で改善した。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:50:58 GMT)
Mechanistic Insights into Grokking from the Embedding Layer [15.7] ニューラルネットワークの遅延一般化であるGrokkingは、トランスフォーマーやスタタネートで観測されているが、それを駆動するコンポーネントはまだ探索されていない。
埋め込みはグルーキングの中心であり、インプットの導入はモジュラー演算タスクにおける遅延一般化を誘導する。
我々の手法はグルーキング力学を改良するだけでなく、バイ線形相互作用が効率的なトレーニングを妨げるトランスフォーマー最適化の幅広い課題にまで拡張する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:12:34 GMT)
Generalization Through Growth: Hidden Dynamics Controls Depth Dependence [15.7] 本稿では、奥行き(k)ネットワークが連続隠蔽写像(f:mathcalXto MathcalX)と出力写像(h:mathcalXto mathbbR)の合成である任意のブループシュード計量空間に対する統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:32:30 GMT)
From Low Intrinsic Dimensionality to Non-Vacuous Generalization Bounds in Deep Multi-Task Learning [15.6] 低次元空間において,マルチタスクネットワークを直接パラメータ化する手法を提案する。
高い精度のマルチタスクソリューションは、シングルタスク学習が必要とするものよりも、本質的な次元でより小さく見つけることができることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:59:55 GMT)
Clapper: Compact Learning and Video Representation in VLMs [15.6] 現在の視覚言語モデル(VLM)は、多様なビデオ理解アプリケーションにまたがる顕著な機能を示している。
本稿では,映像表現の速度を遅くする手法であるクラッパーを提案し,時間空間符号化を効率的にするためのTimePerceiverという新しいモジュールを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:52:17 GMT)
Learning Novel Skills from Language-Generated Demonstrations [15.5] DemoGenは、ロボットが自然言語命令から新しいスキルを習得することを可能にするスキル学習フレームワークである。
ロボットが新しいスキルを効果的に学習できるように、新しいスキルのデモビデオを生成する。
生成された実演を用いて、様々なスキル学習アルゴリズムは、新しいタスクで元の3倍の達成率を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:15:25 GMT)
ALN-P3: Unified Language Alignment for Perception, Prediction, and Planning in Autonomous Driving [15.5] 我々は,「高速」な視覚に基づく自律運転システムと「スロー」な言語駆動推論モジュールの相互接続を実現する統合共蒸留フレームワークALN-P3を提案する。
ALN-P3には3つの新しいアライメント機構が組み込まれており、視覚トークンと対応する言語出力を、完全な知覚、予測、計画スタックにわたって明示的にアライメントする。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:23:01 GMT)
Automate Strategy Finding with LLM in Quant Investment [15.5] 本稿では,大規模言語モデル(LLM)をリスク認識型マルチエージェントシステム内で活用し,定量的ファイナンスにおける戦略発見を自動化する新しい3段階フレームワークを提案する。
本手法は,金融分野における従来のディープラーニングモデルの脆さに対処するものである。
実験結果は、確立されたベンチマークと比較して、中国とアメリカの市場体制における戦略の堅牢な性能を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:05:34 GMT)
Model-Based Exploration in Truthful Monitored Markov Decision Processes [15.4] 強化学習の要点は、エージェントが常に報酬を観察することである。
Mon-MDPアルゴリズムにはいくつかの制限がある。
我々はこれらの欠点に対処するMon-MDPのモデルベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:13:39 GMT)
RUSplatting: Robust 3D Gaussian Splatting for Sparse-View Underwater Scene Reconstruction [15.4] 本稿では,水中深部レンダリングの視覚的品質と精度を両立させる,ガウススプラッティングに基づくフレームワークを提案する。
水中減衰の物理によって導かれるRGBチャネルの分離学習を提案し,より正確な色復元を実現する。
また,深海コンテンツに不可欠なエッジを保ちながらノイズ低減を目的とした新たな損失関数も導入した。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:42:15 GMT)
Dynamic Spectrum Sharing Based on the Rentable NFT Standard ERC4907 [15.3] ダイナミックスペクトラム共有(DSS)は、データセキュリティ、高い管理コスト、限られたスケーラビリティといった課題に直面します。
我々は、スペクトルリソースのユニークな識別子として機能し、レンタルを容易にするNFST(Non-Fungible Spectrum Tokens)を縮小するために、ERC4907標準を使用する。
我々は、ユーザがアイドルスペクトルデータにアクセスし、利用可能なスペクトルに対応するNFSTリースのオークションに参加することができるWeb3スペクトルオークションプラットフォームを構築した。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:03:39 GMT)
A Federated Splitting Framework for LLMs: Security, Efficiency, and Adaptability [15.2] FL-LLaMAはLLaMA2をベースとしたセキュアで効率的で適応的なフェデレーション分割フレームワークである。
我々は、並列トレーニングを実現するためにクライアントバッチとサーバ階層戦略、そして推論を高速化するために注目マスク圧縮とKVキャッシュ機構を採用する。
NLU、要約、会話型QAタスクの実験では、FL-LLaMAは集中型LLaMA2に匹敵する性能を維持し、最大2倍の列車スピードアップと8倍の推論スピードアップを実現している。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:58:08 GMT)
Conformal Language Model Reasoning with Coherent Factuality [15.0] 我々は,言語モデル出力のコヒーレントな事実性を保証するための共形予測に基づく手法を開発した。
我々はMATHおよびFELMデータセットから数学的推論問題を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:40:51 GMT)
PO-Flow: Flow-based Generative Models for Sampling Potential Outcomes and Counterfactuals [15.0] PO-Flowは因果推論のための新しい連続正規化フロー(CNF)フレームワークである。
それは、個人化された潜在的な結果予測、反事実予測、不確実性認識密度学習のための統一されたフレームワークを提供する。
一連の因果推論タスクで先行メソッドを一貫して上回る。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:02:48 GMT)
Object-Focus Actor for Data-efficient Robot Generalization Dexterous Manipulation [15.0] 我々は,汎用デキスタラス操作のための新しいデータ効率のアプローチであるObject-Focus Actor (OFA)を紹介する。
OFAは、厳密な操作タスクで観測される一貫した終端軌道を利用して、効率的なポリシートレーニングを可能にする。
OFAは10のデモで堅牢なパフォーマンスを実現し、そのデータ効率を強調している。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:37:56 GMT)
Unsupervised Detection of Distribution Shift in Inverse Problems using Diffusion Models [14.9] 本稿では,間接的(破損した)測定のみを用いて分布変化を推定するための教師なしの指標を提案する。
この結果から, クリーンな画像から算出したKLの偏差を近似したスコアベースの測定値が得られた。
この結果から,分布外分布スコアと分布内分布スコアとの整合性はKLのばらつきを減少させ,複数の逆問題における再構成品質の向上につながることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:14:37 GMT)
VoiceCloak: A Multi-Dimensional Defense Framework against Unauthorized Diffusion-based Voice Cloning [14.9] 拡散モデル(DM)は現実的な音声クローニング(VC)において顕著な成功を収めた
DMは、拡散の複雑な生成機構により、プロアクティブな防御と相容れないことが証明されている。
我々はVoiceCloakを紹介した。VoiceCloakは多次元のプロアクティブ・ディフェンス・フレームワークで、話者のアイデンティティを曖昧にし、潜在的な不正なVCの品質を劣化させることを目的としている。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:08:03 GMT)
An Alternative to FLOPS Regularization to Effectively Productionize SPLADE-Doc [14.9] DF-FLOPS規則化は、高DF語の使用を罰し、投稿リストを短縮し、検索遅延を低減する。
DF-FLOPSは実運用用エンジンにおいて,高DF項の出現率を低減し,検索遅延(約10倍高速)を低下させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:35:51 GMT)
Video-GPT via Next Clip Diffusion [14.8] GPTは自然言語処理において顕著な成功を収めた。
我々は映像を視覚世界モデリングの新しい言語として扱う。
本稿では,ビデオ-GPTの事前学習のための新しいクリップ拡散パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:44:19 GMT)
UniKnow: A Unified Framework for Reliable Language Model Behavior across Parametric and External Knowledge [14.8] パラメトリックおよび外部知識にまたがる信頼性LM動作のための統一フレームワークUniKnowを紹介する。
UniKnowは、知識の衝突、気晴らし、不在状態などの知識シナリオにおける制御された評価を可能にする。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:46:51 GMT)
LSCodec: Low-Bitrate and Speaker-Decoupled Discrete Speech Codec [14.7] LSCodecは低話者分離能力と低話者分離能力を持つ離散音声である。
リコンストラクション評価により、LSCodecは単一のコードブックだけで、ベースラインよりも語彙サイズが小さく、優れたインテリジェンス性とオーディオ品質を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:46:32 GMT)
NOMAD Projection [14.6] 非線形次元の減少による非構造データ可視化のための最初の手法であるNomaD(Negative Or Mean Affinity Discrimination)射影を導入する。
我々は,NOMAD投影をInfoNC-t-SNE損失の近似上界とする理論を提案する。
我々は,多言語ウィキペディアの最初の完全なデータマップを計算することで,NOMADプロジェクションのスケーラビリティを実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:35:13 GMT)
Quantifying Feature Space Universality Across Large Language Models via Sparse Autoencoders [14.6] 普遍性仮説 (University hypothesis) は、異なるモデルがその潜在空間における同様の概念表現に収束すると主張している。
アナロガス特徴普遍性(Analogous Feature Universality)と呼ばれる普遍性仮説の新たなバリエーションを導入する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:01:46 GMT)
Learning better representations for crowded pedestrians in offboard LiDAR-camera 3D tracking-by-detection [14.6] 我々は、LiDAR点雲とマルチビュー画像から歩行者軌道を再構築するオフボード自動ラベルシステムを構築した。
提案手法は, 3次元歩行者追跡性能を大幅に向上し, オートラベルの効率化に寄与する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:18:26 GMT)
From Pixels to Images: Deep Learning Advances in Remote Sensing Image Semantic Segmentation [14.6] リモートセンシング画像(RSI)は、地球表面の自然と人為的な変化の両方を捉えている。
RSIのセマンティックセグメンテーション(SS)は表面特徴のきめ細かい解釈を可能にする。
深層学習(DL)は、リモートセンシング画像セマンティックセグメンテーションの大幅な進歩を可能にするトランスフォーメーションアプローチとして登場した。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:02:57 GMT)
Towards Reliable and Interpretable Traffic Crash Pattern Prediction and Safety Interventions Using Customized Large Language Models [14.5] TrafficSafeは、テキストレベルの推論として、再フレームのクラッシュ予測と機能属性に適応するフレームワークである。
飲酒運転が深刻な事故の要因となっている。
TrafficSafeは、戦略的クラッシュデータ収集の改善を導くモデルトレーニングにおいて、重要な機能を強調している。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:38:02 GMT)
Fooling the LVLM Judges: Visual Biases in LVLM-Based Evaluation [14.5] 大規模視覚言語モデル (LVLM) はテキスト画像のアライメントを判断するツールとして好まれている。
対人的視覚操作は、LVLM審査員が不当に膨らんだスコアを割り当てることを体系的に騙すことができるか?
敵対的な視覚操作は、LVLM審査員を体系的に騙して不当に膨らませたスコアを割り当てることができるか?
論文参考訳(メタデータ) (Wed, 21 May 2025 08:24:28 GMT)
Reverse Engineering Human Preferences with Reinforcement Learning [14.5] 大規模言語モデル(LLM)は、人間の嗜好を予測するために訓練された他のLLMによって日常的に評価される。
これまでの研究では、候補LLMが生成した回答をポストホックで編集して、審査員LLMが割り当てたスコアを最大化できることが示されている。
我々は、異なるアプローチを採用し、判定LLMによって提供される信号を、逆向きにモデルをチューニングする報酬として利用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:48:16 GMT)
No Need for Explanations: LLMs can implicitly learn from mistakes in-context [14.5] 我々は,大規模な言語モデルが誤りからより効果的に学習する理由を,明確な正当性を持たずに研究する。
我々は、誤答がLLM学習にとってより有益である一方で、モデルに過度に拘束された明確な補正的合理性を示す証拠を見出した。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:09:44 GMT)
Bilinear Sequence Regression: A Model for Learning from Long Sequences of High-dimensional Tokens [14.4] トークン列の最も基本的なモデルの一つとして,双線形シーケンス回帰(BSR)を導入,研究する。
トークン列のベクトル化や単純な線形回帰による学習に関して、最適な学習がもたらす改善を定量化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:57:11 GMT)
COOKIEGUARD: Characterizing and Isolating the First-Party Cookie Jar [14.3] サードパーティ製スクリプトは、サードパーティ製スクリプトを含むサードパーティ製のクッキーにアクセスし、公開することができる。
2万のウェブサイトにまたがる第1のクッキーへのクロスドメインアクセスの大規模な測定を行った。
ブラウザベースの実行時実行機構であるCookieGuardを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:57:45 GMT)
Are Vision-Language Models Safe in the Wild? A Meme-Based Benchmark Study [14.3] 一般ユーザーが共有するミーム画像と対面した場合、現在の視覚言語モデルはどのくらい安全か?
MemeSafetyBenchは、有害な命令と良質な命令の両方で、実際のミームイメージをペアリングするベンチマークである。
視覚言語モデルでは、合成画像やタイポグラフィ画像よりも、ミームベースの有害なプロンプトの脆弱性が大きいことが判明した。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:26:40 GMT)
Identification of Probabilities of Causation: A Complete Characterization [14.2] 本稿では、因果関係の完全な代表的確率のセットを提案し、それらが構造因果モデル(SCM)の枠組みの中で因果関係のすべての確率を特徴付けるのに十分であることを示す。
次に、形式的な数学的証明を用いて、これらの代表量に対して厳密な境界を導出する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:50:12 GMT)
Linguistic Generalizations are not Rules: Impacts on Evaluation of LMs [13.9] LMがいかにうまく一般化するかの言語学的評価は、自然言語は象徴的な規則によって生成されるという当然の事である。
ここでは、LMが象徴的なルールに従わなかったことはバグではなく機能かもしれないことを示唆する。
新しい発話は、柔軟性、相互関連性、文脈に依存した構成の組み合わせによって生成され、理解される。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:55:57 GMT)
Learning-based Airflow Inertial Odometry for MAVs using Thermal Anemometers in a GPS and vision denied environment [13.9] 本研究は, 熱量計, IMU, ESC, およびバロメーターを含む多センサデータ融合を用いた気流式オドメトリーシステムを示す。
我々は,GRUをベースとした深部ニューラルネットワークを用いて,ノイズおよび乱れ計測から相対的な空気速度を推定する。
離陸や地上への着陸を含む完全な飛行データから、プロペラと地上効果によって引き起こされる下水によって引き起こされる風速を分離することができることが示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:53:49 GMT)
Human in the Loop Adaptive Optimization for Improved Time Series Forecasting [13.9] 時系列予測モデルは、エネルギー、金融、医療といった重要な領域においても、体系的で予測可能なエラーを生み出すことが多い。
トレーニングやアーキテクチャの変更を伴わずに予測精度を向上する,新たなトレーニング適応最適化フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:30:02 GMT)
Dial-In LLM: Human-Aligned LLM-in-the-loop Intent Clustering for Customer Service Dialogues [13.9] 本稿ではLLM-in-the-loopインテントクラスタリングフレームワークを提案する。
LLMのセマンティック理解機能を従来のクラスタリングアルゴリズムに統合する。
95%以上の精度で人間の判断に合致する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:32:03 GMT)
LiveVLM: Efficient Online Video Understanding via Streaming-Oriented KV Cache and Retrieval [13.9] LiveVLMは、ストリーミング、オンラインビデオ理解、リアルタイムインタラクションに特化したトレーニング不要のフレームワークである。
LiveVLMはストリーミング指向のKVキャッシュを構築し、ビデオストリームをリアルタイムで処理し、長期のビデオの詳細を保持し、冗長なKVを排除する。
新しい質問が提案されると、LiveVLMは、短期と長期の両方の視覚情報を効率的に取得するオンラインの質問回答プロセスを導入する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:47:15 GMT)
Few-Shot Adversarial Low-Rank Fine-Tuning of Vision-Language Models [13.8] アドリアリトレーニングは,PEFTにおけるモデルロバスト性を改善するための最も効果的な戦略である。
本稿では,LRAで微調整されたCLIPモデルを少数の設定で拡張する最初のアルゴリズムであるAdvCLIP-LoRAを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:35:24 GMT)
BiMarker: Enhancing Text Watermark Detection for Large Language Models with Bipolar Watermarks [13.7] 既存の透かし技術は、低い透かし強度と厳しい偽陽性要件に苦しむ。
ツールは生成されたテキストを正極と負極に分割し、追加の計算リソースを必要とせずに検出を強化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:32:17 GMT)
GUI-G1: Understanding R1-Zero-Like Training for Visual Grounding in GUI Agents [13.7] 最近のGUIエージェントは、R1-Zeroパラダイムを再現し、オンライン強化学習(RL)と、オブジェクトの接地前に明確な連鎖推論を結合する。
まず、入力設計、出力評価、ポリシー更新という、トレーニングパイプラインの3つの重要なコンポーネントについて、広範囲な分析実験を行った。
このGUI-G1-3Bは,Qwen2.5-VL-3B-Instructで17Kの公開サンプルをトレーニングし,ScreenSpotで90.3%,ScreenSpot-Proで37.1%の精度を実現した。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:09 GMT)
After Retrieval, Before Generation: Enhancing the Trustworthiness of Large Language Models in RAG [13.6] RAGシステムは、内部(パラメトリック)と外部(検索)の知識のバランスをとる際の課題に直面します。
本稿では,大規模言語モデルの包括的応答戦略を動的に決定するBRIDGEフレームワークを提案する。
実験では、BRIDGEはすべてのシナリオでバランスの取れたパフォーマンスを維持しながら、ベースラインを5~15%精度で上回っている。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:29:19 GMT)
Parameter Efficient Fine-tuning via Explained Variance Adaptation [13.6] 本稿では、最もアクティベーションのばらつきを捉えた方向を利用するEVA(Explained Variance Adaptation)を提案する。
EVAを言語生成・理解、画像分類、強化学習など様々な微調整タスクに適用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:57:40 GMT)
Ranking Free RAG: Replacing Re-ranking with Selection in RAG for Sensitive Domains [13.6] 本稿では,RAGにおける再ランク付けを合理的な選択手法で置き換える新しい方法であるMETEORAを提案する。
METEORAは、最先端の再評価手法よりも約50%少ないチャンクを使用しながら、生成精度を33.34%向上させる。
敵対的な設定では、METEORAはF1スコアを0.10から0.44に大幅に改善する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:57:16 GMT)
Efficient Partitioning Vision Transformer on Edge Devices for Distributed Inference [13.5] 本稿では,複数のエッジデバイスにまたがる複雑な視覚変換器を効率的に分割・実行するための新しいフレームワークED-ViTを提案する。
私たちのアプローチでは、Vision Transformerモデルをいくつかのサブモデルに分割し、それぞれがデータクラスの特定のサブセットを処理する。
本研究では,エッジデバイスにおける推論遅延を大幅に削減し,モデルサイズを最大28.9倍,34.1倍に削減できることを実証した。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:20:50 GMT)
VRoPE: Rotary Position Embedding for Video Large Language Models [13.5] テキストベース大規模言語モデル(LLM)における位置埋め込み(RoPE)の性能は高い。
RoPE-3Dのようなビデオ適応は、空間次元と時間次元を別々に符号化しようとするが、2つの大きな制限に悩まされる。
ビデオLLMに適した新しい位置符号化法である位置ロータリー埋め込み(VRoPE)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:40:36 GMT)
LFTF: Locating First and Then Fine-Tuning for Mitigating Gender Bias in Large Language Models [13.4] 我々はGenBiasEvalとGenHintEvalというデータセットを提案する。
GenBiasEvalは、LDMにおける性別バイアスの程度を評価する責任がある。
GenHintEvalは、性ヒントを含むプロンプトと一致した応答を提供することができるかを評価するために使用される。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:49:37 GMT)
Stronger ViTs With Octic Equivariance [13.4] ViT(Vision Transformers)は、画像パッチ上の重み共有を重要な帰納バイアスとして組み込んでいる。
我々は,オクティック・平等な層を用いた新しいアーキテクチャであるオクティック・ヴァイツを開発し,教師付き学習と自己教師型学習の両面でのテストに投入する。
また,VT-HのFLOPの約40%の削減を実現し,分類とセグメンテーションの両面で改善した。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:22:53 GMT)
Examining the Prevalence and Dynamics of AI-Generated Media in Art Subreddits [13.3] Dall-Eのような生成AIモデルは、誰でも魅力的なビジュアルアートを作れるようにした。
オンラインコミュニティでは、AIGCの導入が社会力学に影響を及ぼす可能性がある。
AIGCがRedditのアート関連コミュニティに与える影響について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:23:09 GMT)
Laplace Sample Information: Data Informativeness Through a Bayesian Lens [13.3] 本稿では,情報理論に基づくサンプル情報のLSI(Laplace Sample Information)尺度を提案する。
LSIは, 典型的データの順序付け, ラベルミス検出, クラスワイド情報度測定, データセットの難易度評価に有効であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:34:27 GMT)
Temporal Robustness in Discrete Time Linear Dynamical Systems [13.3] いくつかの問題では、システムが実行する時間的地平線について不確実性がある。
これにより、システム停止時の状態分布に基づくコスト(または報酬)の不確実性が発生する。
確率単純度上の離散時間マルコフ連鎖と大域安定時間(GAS)離散時間線形力学系との等価性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:54:47 GMT)
Bandit based Dynamic Candidate Edge Selection in Solving Traveling Salesman Problems [13.2] 旅行セールスマン問題(TSP)に対するLin-Kernighan-Helsgaun(LKH)アルゴリズムのバンディットに基づく手法を提案する。
各イテレーションにおいて最も適したエッジを動的に選択するために、マルチアームのバンディットモデルを組み込むことで、LKHはよりスマートな選択を可能にし、改善されたソリューションへと導くことができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:11:00 GMT)
Prompt Tuning Vision Language Models with Margin Regularizer for Few-Shot Learning under Distribution Shifts [13.2] 視覚言語基礎モデルが、分布やクラスが全く異なるデータセットに適応できるかどうかを解析する。
本稿では,少数のサンプルに対して,このような大規模VLMを直接適用するための新しいプロンプトチューニング手法であるPromptMarginを提案する。
PromptMarginは、このタスクのテキストと視覚的なプロンプトを効果的に調整し、2つのメインモジュールを持っている。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:26:56 GMT)
A Unified Theoretical Analysis of Private and Robust Offline Alignment: from RLHF to DPO [13.2] 本稿では,オフラインアライメントにおけるノイズラベルの影響を理論的に検討する。
異なるプライバシー破壊シナリオ下では、人間のフィードバックからの強化学習と直接選好最適化の両方を総合的に分析する。
われわれの発見は、プライバシーのみまたは汚職のみのシナリオ下でのオフラインアライメントにおける最先端の理論結果も前進させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:07:47 GMT)
Automated Visualization Code Synthesis via Multi-Path Reasoning and Feedback-Driven Optimization [13.2] VisPathは構造化されたマルチステージ処理を通じて、不特定クエリを処理する。
最初はChain-of-Thoughtプロンプトを通じてユーザ入力をリフォームする。
VisPathは、最適な最終結果を合成するために集約されたターゲットフィードバックを生成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:10:54 GMT)
Do RAG Systems Suffer From Positional Bias? [13.1] 我々は、最先端の検索パイプラインが、関連するパスを検索する一方で、体系的に非常に気を散らすパイプラインをトップにもたらす方法を示す。
以上の結果から, LLM位置選択に基づいて経路を再構成しようとする高度戦略は, ランダムシャッフルよりも性能が良くないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:18:01 GMT)
TimeCausality: Evaluating the Causal Ability in Time Dimension for Vision Language Models [13.0] 時間的因果性、特に現実世界の知識によって支配される物体の不可逆的な変換に関する推論は、人間の視覚的理解の基本的な側面である。
時間次元における視覚言語モデル(VLM)の因果推論能力を評価するために設計された新しいベンチマークである textbfTimeCausality を紹介する。
現在のSOTAオープンソースVLMは、GPT-4oのようなクローズドソースモデルに匹敵するパフォーマンスレベルを達成していますが、クローズドソースの競合製品と比べてベンチマークに大きく遅れています。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:18:02 GMT)
SynEVO: A neuro-inspired spatiotemporal evolutional framework for cross-domain adaptation [13.0] ドメイン間の知識を増やすための鍵は、集合的および時間的インテリジェンスモデルの進化を可能にすることである。
本稿では,SynEVOがモデル独立性を破り,ドメイン間知識の共有と集約を可能にするSynaptic EVOticネットワークを提案する。
実験により、SynEVOはクロスドメインシナリオのほとんどで一般化を改善することが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:45:51 GMT)
Causality Pursuit from Heterogeneous Environments via Neural Adversarial Invariance Learning [12.9] データから因果関係を抽出することは、科学的発見、治療介入、伝達学習における根本的な問題である。
本稿では,複数の環境における回帰モデルにおける非パラメトリック不変性と因果学習に対処するアルゴリズムを提案する。
提案したFocused Adrial Invariant Regularizationフレームワークは、逆検定により回帰モデルを予測不変解へ向ける革新的なミニマックス最適化手法を利用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:46:07 GMT)
Web-Shepherd: Advancing PRMs for Reinforcing Web Agents [12.9] ステップレベルのWebナビゲーショントラジェクトリを評価するために,Web-Shepherdと呼ばれる最初のプロセス報酬モデル(PRM)を提案する。
実験では,WebRewardBenchでGPT-4oを使用する場合と比較して,Web-Shepherdの精度は約30ポイント向上した。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:56:55 GMT)
MentalMAC: Enhancing Large Language Models for Detecting Mental Manipulation via Multi-Task Anti-Curriculum Distillation [12.8] 精神的な操作は微妙だが広範囲にわたる心理的虐待であり、精神的な健康に深刻な脅威をもたらす。
MentalMACはマルチタスクの反キュリキュラム蒸留法であり、マルチターン対話におけるメンタル操作の検出能力を高める。
i)進化的操作と音声行動理論に基づく教師なしデータ拡張手法であるEvoSA,(ii)教師モデル生成マルチタスク監視,(iii)複雑なタスクから単純なタスクへの進化的知識蒸留。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:34:06 GMT)
BiSSL: Enhancing the Alignment Between Self-Supervised Pretraining and Downstream Fine-Tuning via Bilevel Optimization [12.7] BiSSLは、微調整の前に下流タスクと自己教師付き事前訓練されたモデルのアライメントを強化する、新しいバイレベルトレーニングフレームワークである。
本稿では,BiSSLのトレーニングアルゴリズムを提案する。
提案手法は,12の下流画像分類データセットの大部分とオブジェクト検出の精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:32:08 GMT)
Model Performance-Guided Evaluation Data Selection for Effective Prompt Optimization [12.7] IPOMPは、セマンティッククラスタリングとバウンダリ分析を使用して、代表的で多様なサンプルを選択する2段階のアプローチである。
我々は、IPOMPがSOTAベースラインと比較して、効率を1.6%から5.3%改善し、安定性を少なくとも57%向上させることを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:19:30 GMT)
A Multilingual, Culture-First Approach to Addressing Misgendering in LLM Applications [12.6] ミスジェンダー(英: missgendering)とは、性別によって、選択したアイデンティティと一致しない人を指す行為である。
英語に基づくアプローチは、その代名詞の使用など、誤解を避けるための明確なアプローチを持つ
論文参考訳(メタデータ) (Wed, 21 May 2025 05:39:43 GMT)
HAMF: A Hybrid Attention-Mamba Framework for Joint Scene Context Understanding and Future Motion Representation Learning [12.6] 本研究では,シーンコンテキストを協調的に符号化した将来の動き表現を学習する動き予測フレームワークであるHAMFを提案する。
我々は,我々のハイブリッドアテンション・マンバモデルにより,シンプルで軽量なアーキテクチャで最先端のモーション予測性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:16:52 GMT)
Neuro-Argumentative Learning with Case-Based Reasoning [12.5] 本稿では,データ駆動型ニューロシンボリック分類モデルであるGradual Abstract Argumentation for Case-Based Reasoning (Gradual AA-CBR)を紹介する。
議論の各議論は、トレーニングデータから観察されたケースであり、ラベル付けを好んでいる。
ケースは、各議論の強さと、勾配に基づく手法で学んだ関係によって、反対または同意するラベルを持つ人々を攻撃するか、または支援する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:49:47 GMT)
An Empirical Study of the Anchoring Effect in LLMs: Existence, Mechanism, and Potential Mitigations [12.5] 本研究は、心が第一の情報に大きく依存する認知バイアスであるアンカー効果を考察し、影響のある判断を下す。
アンカー効果の大規模研究を容易にするため,新しいデータセットであるSynAnchorsを導入する。
以上の結果から, LLMのアンカリングバイアスは一般に浅層作用とともに存在し, 従来の手法では排除されないことが示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:33:54 GMT)
Procedure of tuning up a three-site artificial Kitaev chain based on transmon measurements [12.5] トランスモン回路のスペクトルに基づいて3地点のAKCをそのスイートスポットに調整するためのステップバイステップの手順を提案する。
3地点のAKCのスイートスポットは, 弾性コツネリング (ECT) と交差Andreev反射 (CAR) の相対的な強度に基づいて3つのタイプに分類される。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:48:05 GMT)
Oh SnapMMD! Forecasting Stochastic Dynamics Beyond the Schrödinger Bridge's End [12.4] 科学者はしばしば、潜伏力学の後に観測された「スナップショット」データの時間的地平線を超えた予測をしたいと考える。
本研究では,状態測定と観測時間の両方のジョイント分布を直接適合させることで,ダイナミクスを学習する新しいフレームワークであるSnapMMDを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:52:57 GMT)
SNAP: A Benchmark for Testing the Effects of Capture Conditions on Fundamental Vision Tasks [12.2] カメラパラメータや照明などの捕捉条件が3つの視覚課題におけるディープラーニングモデルの性能に与える影響を解析する。
我々は、制御された照明条件下で撮影されたオブジェクトの画像と、密集したカメラ設定からなる新しいベンチマークSNAPを作成する。
以上の結果から,コンピュータビジョンデータセットのバイアスが大きく,このデータに基づいてトレーニングされたモデルでは,露呈した画像でも人間の精度が得られず,カメラ設定の大きな露出変化と微小変動の両方の影響を受けやすいことがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:14:34 GMT)
Effective and Efficient Schema-aware Information Extraction Using On-Device Large Language Models [12.2] 非構造化テキストを構造化知識に変換することにより、自然言語処理(NLP)において情報抽出が重要な役割を果たす。
本稿では,インクリメンタルキャッシングを用いた2段階情報抽出手法Dual-LoRAを提案する。
特に、DLISCは、指定されたクエリに最も関連性の高いスキーマを検索するための識別LoRAモジュールと、以前選択されたスキーマに基づいて情報抽出を行う抽出LoRAモジュールを採用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:40:05 GMT)
Exploring the Limits of Vision-Language-Action Manipulations in Cross-task Generalization [12.1] AGNOSTOSは、操作においてクロスタスクゼロショットの一般化を厳格に評価するために設計された新しいシミュレーションベンチマークである。
X-ICMは、コンテキスト内デモで大きな言語モデルを条件付け、目に見えないタスクに対するアクションシーケンスを予測する手法である。
我々はAGNOSTOSとX-ICMが汎用的なロボット操作を促進する貴重なツールになると信じている。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:35:57 GMT)
Gated Integration of Low-Rank Adaptation for Continual Learning of Language Models [12.0] ローランク適応(ローランク適応、LoRA)は、PEFT法の一つである。
GainLoRAは新しいタスクごとに新しいLoRAブランチを拡張し、新しい古いLoRAブランチを統合するためのゲーティングモジュールを導入した。
CLベンチマークの実験結果は、GainLoRAが既存の最先端手法より優れていることを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:08:15 GMT)
CRAFT: Training-Free Cascaded Retrieval for Tabular QA [12.0] TQA(Table Question Answering)は、大きなコーパスから関連するテーブルを取得して、自然言語クエリに応答する。
textbfCRAFT$は、まずスパース検索モデルを使用して候補テーブルのサブセットをフィルタリングするカスケード検索手法である。
textbfCRAFT$は、最先端(SOTA)スパース、密度、ハイブリッドレトリバーよりも優れた検索性能を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:09:34 GMT)
CoT-ICL Lab: A Synthetic Framework for Studying Chain-of-Thought Learning from In-Context Demonstrations [11.9] CoT-ICL Labは、合成トークン化されたデータセットを生成するためのフレームワークと方法論である。
我々は,言語モデルにおける文脈内学習(ICL)のチェーン・オブ・シント(CoT)を体系的に研究する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:21:59 GMT)
Large Language Models as Computable Approximations to Solomonoff Induction [11.8] 我々は,大規模言語モデル (LLM) とアルゴリズム情報理論 (AIT) の間の最初の公式な接続を確立する。
我々はAITを活用し、文脈内学習、少数ショット学習、スケーリング法則の統一的な理論的説明を提供する。
我々の枠組みは理論的基礎と実践的LLM行動のギャップを埋め、将来のモデル開発に説明力と実用的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:35:08 GMT)
LaM-SLidE: Latent Space Modeling of Spatial Dynamical Systems via Linked Entities [11.8] 本稿では、LaM-SLidE(リンクされたエンティティによる空間力学系のラテント空間モデリング)を提案する。
LaM-SLidEは、(1)潜在システム表現における個々のエンティティのトレーサビリティを維持すること、(2)画像およびビデオ生成における最近の進歩の効率性とスケーラビリティを活用することのギャップを埋める。
本稿では,LaM-SLidEが速度,精度,一般化性において良好に動作することを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:58:58 GMT)
SegMatch: A semi-supervised learning method for surgical instrument segmentation [11.7] 腹腔鏡およびロボット手術画像に対する高価なアノテーションの必要性を低減するための半教師付き学習手法であるSegMatchを提案する。
SegMatchは、一貫性の正規化と擬似ラベリングを組み合わせた、広範な半教師付き分類パイプラインであるFixMatch上に構築されている。
以上の結果から,SegMatchは非競合データを組み込むことで,完全教師付きアプローチよりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:37:07 GMT)
Kalman Filter Enhanced GRPO for Reinforcement Learning-Based Language Model Reasoning [11.7] グループ相対政策最適化(GRPO)は、グループ内のすべての出力に対して平均報酬をベースラインとして減算することで、各出力の利点を計算するために提案される。
これは、非常にノイズの多い報奨を伴う環境において、不正確な有利な見積もりをもたらし、バイアスをもたらす可能性がある。
本稿では,KRPO(Kalman Filter Enhanced Group Relative Policy Optimization)と呼ばれるモデルを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:49:01 GMT)
X-WebAgentBench: A Multilingual Interactive Web Benchmark for Evaluating Global Agentic System [11.3] X-WebAgentBenchは対話型Web環境における新しい多言語エージェントベンチマークである。
複数の言語にまたがる言語エージェントの計画と相互作用性能を評価する。
以上の結果から, GPT-4oのような高度なモデルでも, 言語横断技術と組み合わせると, 良好な結果が得られないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:07:02 GMT)
LCDB 1.1: A Database Illustrating Learning Curves Are More Ill-Behaved Than Previously Thought [11.3] 学習曲線は以前考えられていたよりもあまり良くないことを示す。
統計的に厳密な手法を用いて,学習曲線の約14%において,有意な不振を観測した。
どの学習者が責任を負うかを特定し、特定の学習者が他の学習者よりも悪質であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:32:42 GMT)
How Real Are Synthetic Therapy Conversations? Evaluating Fidelity in Prolonged Exposure Dialogues [11.2] 医療における合成データの採用の増加は、プライバシの懸念、現実世界のデータへのアクセスの制限、アノテーションのコストの高騰によって引き起こされる。
本研究は、外傷後ストレス障害(PTSD)に対するPE(Prolonged Exposure)治療会話の使用について検討する。
我々は、ターンテイクパターンや治療の忠実度を含む言語、構造、プロトコル固有のメトリクスを用いて、実際の対話と合成対話を比較した。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:26:35 GMT)
DC-Scene: Data-Centric Learning for 3D Scene Understanding [11.2] 3Dシーン理解は、ロボット工学、自律運転、拡張現実といったビジョン応用において、基本的な役割を担っている。
本稿では,3次元シーン理解に適したデータ中心型フレームワークDC-Sceneを提案する。
本稿では,CLIP-driven dual-indicator Quality (DIQ) フィルタを導入し,視覚言語アライメントスコアとキャプションロスパープレキシティを組み合わせたカリキュラムスケジューラを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:05:27 GMT)
Flashback: Memory-Driven Zero-shot, Real-time Video Anomaly Detection [11.2] Flashbackはゼロショットおよびリアルタイムビデオ異常検出パラダイムである。
異常を即座に判断する人間の認知メカニズムにインスパイアされたFlashbackは、RecallとRespondの2つの段階で動作する。
推論時にすべてのLSMコールを削除することで、FlashbackはコンシューマグレードのGPU上でもリアルタイムのVADを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:32:29 GMT)
Superconducting qubit readout enhanced by path signature [11.1] 量子非破壊測定は量子技術において重要な役割を果たす。
本稿では,この測定記録の「パスシグネチャ」を考慮した読み出し精度の向上手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:26:37 GMT)
One-Layer Transformers are Provably Optimal for In-context Reasoning and Distributional Association Learning in Next-Token Prediction Tasks [11.1] そこで本研究では,一層変圧器の非雑音・雑音環境における近似能力と収束挙動について検討した。
我々の研究は、線形およびReLUの両方の注意を払って、確実にベイズ最適である一層変圧器のクラスが存在することを示すことによってギャップに対処する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:26:44 GMT)
MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving [11.0] 視覚言語モデル(VLM)は、自律運転における汎用的なエンドツーエンドモデルとして機能する。
既存のほとんどの手法は計算コストのかかるビジュアルエンコーダと大言語モデル(LLM)に依存している。
提案するFE-MoE(Feature Engineering Mixture of Experts)モジュールとDI-Adapter(Dynamic Instruction Adapter)を組み込んだMiniDriveという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:38:11 GMT)
The Pursuit of Empathy: Evaluating Small Language Models for PTSD Dialogue Support [10.9] TIDEは500種類のPTSDクライアントペルソナにまたがる1万の2ターン対話のデータセットである。
PTSDを専門とする臨床心理学者により,すべてのシナリオと基準応答について,リアリズムとトラウマ感受性について検討した。
IRBが承認した人的評価と自動測定は、微調整は一般的に共感を改善するが、利得はシナリオとユーザに依存していることを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:32:46 GMT)
Better Safe Than Sorry? Overreaction Problem of Vision Language Models in Visual Emergency Recognition [10.9] 200画像(100対の対照的なペア)の診断ベンチマークであるVERIを導入する。
各緊急シーンは、多段階の人間の検証と反復的な改善によって、視覚的に類似しているが安全なものとマッチングされる。
モデルは実際の緊急事態を特定するのに優れているが、誤報の発覚率に悩まされている。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:57:40 GMT)
SQL-o1: A Self-Reward Heuristic Dynamic Search Method for Text-to-SQL [10.8] SQL-o1は、モデル推論機能を強化するためにエージェントベースのアーキテクチャ上に構築された、自己回帰駆動の検索フレームワークである。
複雑なBirdデータセット上で+10.8の精度向上を実現し、GPT-4ベースのモデルさえ超えている。
オープンソースのLLMにまたがって、強力な数ショットの一般化と堅牢なクロスモデル転送能力を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:21:35 GMT)
Spectral-Aware Global Fusion for RGB-Thermal Semantic Segmentation [10.8] マルチモーダル機能の強化と融合を図るため,SGFNet(Spectral-aware Global Fusion Network)を提案する。
SGFNetは、MFNetとPST900データセットの最先端メソッドよりも優れている。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:17:57 GMT)
A Taxonomy of Structure from Motion Methods [10.7] Structure from Motion (SfM) は、複数の画像の点対応から始まる動きと3次元の点の座標を復元する問題である。
本稿では, SfM法の概念的考察として, 焦点を絞った3つのカテゴリに分類し, 課題のどの部分, 動きと構造に焦点をあてるかを考察する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:44 GMT)
GT^2-GS: Geometry-aware Texture Transfer for Gaussian Splatting [10.7] GT2-GSはガウス分割のための幾何学的テクスチャ伝達フレームワークである。
テクスチャ特徴をシーン表現に最適化するために,テクスチャの幾何一貫性を欠くテクスチャロスを提案する。
提案手法は,人間の視覚知覚とよりよく一致したテクスチャ伝達結果を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:37:29 GMT)
On the Evolution of Knowledge Graphs: A Survey and Perspective [10.7] 知識グラフ(KGs)は、多様な知識の構造化された表現であり、様々なインテリジェントなアプリケーションで広く使われている。
我々は,様々な種類のKGの進化と知識抽出・推論技術に関する総合的な調査を行う。
本稿では,知識工学の今後の方向性について考察する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:54:17 GMT)
Empowering the Deaf and Hard of Hearing Community: Enhancing Video Captions Using Large Language Models [10.7] 難聴と難聴(DHH)コミュニティは、正確で信頼性の高いキャプションを提供する上で、自動音声認識(ASR)システムが不十分であるために、ビデオコンテンツにアクセスする際の課題に直面していることが多い。
本稿では,大言語モデル(LLM)の統合を探求し,ASRシステムによって生成されたキャプションの精度と文脈認識性を向上する研究を行う。
以上の結果から,LLM強調字幕の精度は,ChatGPT-3.5による単語誤り率(WER)が顕著に低いことが示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:43:46 GMT)
Training Step-Level Reasoning Verifiers with Formal Verification Tools [10.6] 本稿では,形式的検証ツールによって自動的に注釈付けされたステップレベルのエラーラベルに対して,PRMをトレーニングするためのアプローチであるFoVerを提案する。
FoVerは形式的検証と互換性のあるタスクに対してのみ使用可能である。
LLMをベースとしたPRMは,多種多様な推論タスクの検証を改善し,クロスタスクの一般化を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:23:45 GMT)
Meta-Chunking: Learning Text Segmentation and Semantic Completion via Logical Perception [10.6] 本稿では,チャンキング品質を特に向上させるメタチャンキングフレームワークを提案する。
我々は不確実性に基づく2つの適応的チャンキング手法、すなわちPerplexity ChunkingとMargin Sampling Chunkingを設計する。
我々は,2段階の階層的要約生成プロセスと3段階のテキストチャンク書き換え手順を含むグローバル情報補償機構を確立する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:45:06 GMT)
Can Large Language Models be Effective Online Opinion Miners? [10.6] オンラインオピニオンマイニングベンチマーク(OOMB, Online Opinion Mining Benchmark)は, 大規模言語モデルによる意見のマイニング能力を評価するための新しいデータセットと評価プロトコルである。
OOMBは、広範囲にわたる(関心、機能、意見)アノテーションと、各コンテンツの主要な意見トピックを強調する包括的な意見中心の要約を提供する。
我々は、現実的なオンラインシナリオにおいて、どの側面が困難なままで、LLMが適応性を示すのかを総合的に分析し、意見マイナーとして効果的に機能できるかを探索する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:09:44 GMT)
MoTime: A Dataset Suite for Multimodal Time Series Forecasting [10.6] MoTimeは、データセットのマルチモーダル時系列予測スイートである。
時間信号とテキスト、メタデータ、画像などの外部モダリティをペアリングする。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:39:42 GMT)
PlanGPT-VL: Enhancing Urban Planning with Domain-Specific Vision-Language Models [10.6] そこで我々は,都市計画地図に特化して設計された,ドメイン固有の視覚言語モデルであるPlanGPT-VLを紹介した。
PlanGPT-VLは,(1)高品質なVQAデータ合成のためのPlanAnno-Vフレームワーク,(2)構造化検証による幻覚の低減のためのクリティカルポイント思考,(3)スーパーバイザードファインタニングと凍結視覚エンコーダパラメータを組み合わせた総合的なトレーニング手法,の3つの革新的アプローチを採用している。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:04:58 GMT)
CausalVLBench: Benchmarking Visual Causal Reasoning in Large Vision-Language Models [10.5] 大規模視覚言語モデル(LVLM)は、認識や視覚的質問応答といったタスクにおいて顕著な性能を示している。
LVLMからのマルチモーダルインコンテキスト学習のための総合因果推論ベンチマークを導入する。
3つの因果表現学習データセットの因果推論タスクにおいて、最先端のオープンソースLVLMの能力を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:45:15 GMT)
VITAL: Interactive Few-Shot Imitation Learning via Visual Human-in-the-Loop Corrections [10.5] イミテーション・ラーニング(IL)はロボット工学において強力なアプローチとして登場し、ロボットは人間の行動を模倣することで新しいスキルを身につけることができる。
その可能性にもかかわらず、ILのデータ収集プロセスは、ロジスティックな困難と高品質なデモンストレーションの獲得に伴う高コストのため、依然として重要な課題である。
本稿では,シミュレーションにおけるデータ拡張を通じて,少数の実演から大規模データ生成を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:45:48 GMT)
TinyDrive: Multiscale Visual Question Answering with Selective Token Routing for Autonomous Driving [10.4] TinyDriveは、シナリオ駆動におけるマルチビューVQAのための軽量なVLMである。
本モデルは,マルチスケールビジョンエンコーダとトークンとシーケンスの二重レベル優先順位付け機構を含む2つの重要なコンポーネントから構成される。
TinyDriveは、私たちのカスタムキュレートされたVQAデータセットで最初に評価され、その後、パブリックなDriveLMベンチマークでテストされます。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:19:24 GMT)
Understanding the Repeat Curse in Large Language Models from a Feature Perspective [10.4] 大規模言語モデル(LLM)は、しばしば反復的なテキスト生成に悩まされる。
本稿では,Repeat Curse を誘導・解析するための新しい手法 "Duplicatus Charm" を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:59:26 GMT)
A Risk Taxonomy for Evaluating AI-Powered Psychotherapy Agents [10.4] 我々は、会話型AI心理療法士の体系的評価に特化して設計された新しいリスク分類法を導入する。
我々は、カウンセリング会話中に認知モデルに基づくリスクファクターを監視して、安全でない逸脱を検出するという2つのユースケースと、シミュレーションされた患者とのAI心理療法士の自動ベンチマークについて詳細に論じる。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:01:39 GMT)
Large Language models for Time Series Analysis: Techniques, Applications, and Challenges [10.3] 大規模言語モデル (LLMs) は、時系列解析において、その横断的な知識の統合と固有の注意機構を活用することによって、変革的なポテンシャルを提供する。
本稿では,LLM駆動型時系列解析の体系的レビューを行う。
技術、潜在的なアプリケーション、オープンな課題の実現に重点を置いています。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:45:11 GMT)
Know When to Abstain: Optimal Selective Classification with Likelihood Ratios [10.3] 我々は、Neyman-Pearson補題のレンズを通して最適な選択関数の設計を再考する。
この視点は、いくつかのポストホック選択ベースラインの挙動を統一し、選択分類への新たなアプローチを動機付けていることを示す。
提案手法は,教師付き学習モデルと視覚言語モデルの両方を含む,様々な視覚・言語タスクにまたがって評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:26:21 GMT)
Toward Theoretical Insights into Diffusion Trajectory Distillation via Operator Merging [10.3] 拡散軌道蒸留は、高品質な出力を生成するがサンプリング速度の遅い拡散モデルのサンプリングを加速することを目的としている。
信号の忠実度を最大に保存する最適なマージ戦略を計算するためのプログラミングアルゴリズムを提案する。
本研究は, 拡散軌道蒸留の理論的理解を高め, 蒸留戦略改善のための実践的洞察を提供するものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:13:02 GMT)
CoT Information: Improved Sample Complexity under Chain-of-Thought Supervision [10.3] チェーン・オブ・思想(CoT)の監督は、最終的なアウトプットとともに中間的推論ステップを提供する。
本稿では,CoT監督下での学習の統計的理論について述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:28:54 GMT)
Prototypical Human-AI Collaboration Behaviors from LLM-Assisted Writing in the Wild [10.2] 大規模言語モデル(LLM)は、複雑な記述において、ニーズに合うように世代を操るために使用される。
本研究では,タスク作成に携わるユーザを対象に,この協調行動の大規模分析を行う。
そこで本研究では,LLMとユーザが対話する際の特徴的行動の同定を行った。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:13:01 GMT)
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities [10.2] GlODGenは、世界中の関心のある都市に対して、Origin-Detination(OD)フローを生成するツールである。
衛星画像には、高品質なODフロー生成をサポートするリッチな都市意味信号が含まれている。
GlODGenは、異なる大陸の様々な都市環境にまたがる大きな一般化性を持っている。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:17:34 GMT)
A Qualitative Investigation into LLM-Generated Multilingual Code Comments and Automatic Evaluation Metrics [10.2] 我々は,5つの最先端コードモデルによって生成されたコードコメントの誤りを分析するために,オープンコーディング研究を行う。
モデル生成コードコメントにおいて26の異なるエラーカテゴリの分類を同定する。
分析の結果、これらのモデルはしばしば部分的に正しいコメントを生成するが、現代のニューラルネットワークは、意味のある完了をランダムノイズと確実に区別することができないことがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:45:49 GMT)
A Unified Approach to Quantum Contraction and Correlation Coefficients [10.1] 作用素単調関数によって誘導される非可換$L2(p)$空間の族を導入する。
量子最大相関係数と量子 $chi2$-divergences の族を同定する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:58:45 GMT)
RAZER: Robust Accelerated Zero-Shot 3D Open-Vocabulary Panoptic Reconstruction with Spatio-Temporal Aggregation [10.1] 我々は,GPUで加速した幾何再構成をオープン語彙の視覚言語モデルとシームレスに統合するゼロショットフレームワークを開発した。
トレーニングフリーシステムは、インクリメンタル処理と統合幾何系列更新により、優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:07:25 GMT)
UniSTPA: A Safety Analysis Framework for End-to-End Autonomous Driving [10.1] 我々はUnified System Theoretic Process Analysis (UniSTPA)フレームワークを提案する。
UniSTPAはコンポーネントレベルだけでなく、モデルの内部レイヤ内でもハザード分析を行います。
提案手法は,エンド・ツー・エンドの自動運転システムの安全開発と展開のための理論的および実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:23:31 GMT)
Boosting Few-Shot Open-Set Object Detection via Prompt Learning and Robust Decision Boundary [10.1] FOOD(Open-set Object Detection)は、多くのオープンワールドシナリオにおいて課題となる。
訓練サンプルが不足している未知の物体を拒絶しながら、既知の物体を検出するためにオープンセット検出器を訓練することを目的としている。
本手法は,従来の最先端手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:14:39 GMT)
Language Specific Knowledge: Do Models Know Better in X than in English? [9.9] コードスイッチングは、異なる言語間で同じ発話、思考、会話を交互に行う一般的な現象である。
我々はこの現象を表すために言語特化知識(LSK)という用語を作った。
英語以外の言語でチェーン・オブ・シークレット・推論を用いることで,言語モデルの性能が向上することがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:31:13 GMT)
Who "Controls" Where Work Shall be Done? State-of-Practice in Post-Pandemic Remote Work Regulation [9.9] 本研究は,企業がいかにソフトウェアエンジニアを雇用し,支援役が職場の立地を規制するかを検討する。
我々は68社の法人人事及び管理担当者からリモートワーク規制に関するデータを収集した。
柔軟性が向上した企業は存在しないが、フルタイムのオフィスワークには4社しか戻っていない。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:50:09 GMT)
Reducing Hallucinations in Language Model-based SPARQL Query Generation Using Post-Generation Memory Retrieval [9.9] 大型言語モデル (LLM) は、KG要素の生成時に幻覚や分布外誤差に感受性がある。
この結果、このような誤りの検出と緩和を目的とした研究が増加している。
本稿では,非パラメトリックメモリモジュールを組み込んだ KG 要素検索用モジュール PGMR を紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:49:49 GMT)
Generalizing Medical Image Representations via Quaternion Wavelet Networks [9.8] 医用画像から健全な特徴を抽出できる,新しい,一般化可能な,データに依存しないフレームワークを提案する。
提案する4元ウェーブレットネットワーク(quaVE)は,既存の医用画像解析や合成作業と容易に統合できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:27:16 GMT)
Small Language Models in the Real World: Insights from Industrial Text Classification [9.7] ChatGPTは、テキスト分類と関連するタスクが大幅に進歩している。
より小さな言語モデルがテキスト分類タスクを効果的に扱えるかどうかという問題は、重要な関心事として浮上する。
本研究は,トランスフォーマーを用いたテキスト分類のための,プロンプトエンジニアリングと教師付き微調整手法の総合評価を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:39:24 GMT)
Visual Perturbation and Adaptive Hard Negative Contrastive Learning for Compositional Reasoning in Vision-Language Models [9.7] 視覚言語モデル(VLM)はマルチモーダルタスク、特に構成推論(CR)タスクに必須である。
既存の手法は主にテキストベースのハードネガティブサンプルを生成することによってモデルを微調整する。
AHNPLはテキストベースのハードネガティブを視覚領域に翻訳し、モデルをトレーニングするために意味的に乱された画像ベースのネガティブを生成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:28:43 GMT)
Average Reward Reinforcement Learning for Omega-Regular and Mean-Payoff Objectives [9.7] 絶対寿命仕様を平均回帰目標に変換するモデルフリー強化学習フレームワークを提案する。
また,語彙的多目的最適化のための報酬構造も導入する。
実験結果から,ベンチマークごとの割引方式の精度向上を継続する上で,我々の平均回帰アプローチを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:06:51 GMT)
PiFlow: Principle-aware Scientific Discovery with Multi-Agent Collaboration [9.6] 自動科学的発見のための情報理論フレームワークである textttPiFlow を紹介する。
提案手法は,曲線下面積の73.55%増加を反映して,発見効率を著しく向上させる。
全体として、textttPiFlowはPlug-and-Playメソッドとして機能し、高度に効率的な自動科学的発見における新しいパラダイムシフトを確立する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:09:39 GMT)
R3GS: Gaussian Splatting for Robust Reconstruction and Relocalization in Unconstrained Image Collections [9.6] R3GSは、制約のないデータセットに適した堅牢な再構築と再ローカライゼーションフレームワークである。
過渡的物体の復元過程に対する悪影響を軽減するため,軽量な人検出ネットワークを構築した。
本研究では,屋外シーンにおける空域の課題に対処するために,事前の奥行きを制約として組み込んだ効果的なスカイハンドリング手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:25:22 GMT)
On the Performance Analysis of Momentum Method: A Frequency Domain Perspective [9.6] 本稿では,モーメント法を時間変動フィルタとして解釈する周波数領域解析フレームワークを提案する。
我々の実験はこの視点を支持し、関連するメカニズムをより深く理解する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:12:56 GMT)
Semantic-Aware Remote Estimation of Multiple Markov Sources Under Constraints [9.5] 我々は,情報文のエフェスマンティクスを利用して,リモートアクチュエータが推定誤差に対して異なる耐性を有することを考察する。
送信周波数制約下での予測誤差の長期的テキスト状態依存コストを最小限に抑える最適スケジューリングポリシーを見いだす。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:29:30 GMT)
PhysicsArena: The First Multimodal Physics Reasoning Benchmark Exploring Variable, Process, and Solution Dimensions [9.4] PhysicsArenaは、MLLMのマルチモーダル物理推論能力の評価と向上のための総合的なプラットフォームを提供することを目指している。
MLLMは様々な推論タスクにおいて顕著な能力を示してきたが、複雑な物理推論への応用は未解明のままである。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:48:16 GMT)
FR-Mamba: Time-Series Physical Field Reconstruction Based on State Space Model [9.3] 物理場再構成は、限られたセンサ測定に基づいて物理量の状態分布を予測することを目的としている。
既存のディープラーニングメソッドは、長い時間的・時間的依存関係のキャプチャに失敗することが多い。
状態空間モデリングに基づく新しい流れ場再構成フレームワークFR-Mambaを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:54:36 GMT)
Moonbeam: A MIDI Foundation Model Using Both Absolute and Relative Music Attributes [9.3] Moonbeamは、シンボリック音楽のためのトランスフォーマーベースの基礎モデルである。
大量のMIDIデータを事前訓練し、合計81.6K時間の音楽と18億のトークンを収集する。
コードをオープンソース化し、事前訓練されたモデルを作成し、Githubでサンプルを生成しました。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:17:25 GMT)
MolLangBench: A Comprehensive Benchmark for Language-Prompted Molecular Structure Recognition, Editing, and Generation [9.2] MolLangBenchは分子言語インタフェースの基本的なタスクを評価するために設計されたベンチマークである。
自動ケミノフォマティクスツールを用いて認識タスクを構築する。
厳密な専門家アノテーションと検証を通じて編集・生成タスクをキュレートする。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:22:01 GMT)
TurnaboutLLM: A Deductive Reasoning Benchmark from Detective Games [9.2] 本稿では,Large Language Models(LLM)の推論能力を評価するための新しいフレームワークとデータセットであるTurnaboutLLMを紹介する。
このフレームワークは、長い物語の文脈の中で、証言と証拠の間の矛盾を識別するLLMを処理します。
提案手法は,12種類のLLMをデータセット上で評価し,導出的推論を向上するための一般的な戦略の限界を示唆した。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:22:32 GMT)
Say It Another Way: Auditing LLMs with a User-Grounded Automated Paraphrasing Framework [9.2] 本稿では,言語構造とユーザ人口統計に基づく,制御された現実的なプロンプトフレーズを生成するフレームワークであるAUGMENTを紹介する。
AUGMENTは、セマンティック、スタイリスティック、命令追従の基準を組み合わせることで、パラフレーズの品質を保証する。
この結果から,大規模言語モデルにおいて,より代表的で構造化されたアプローチの必要性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:55:08 GMT)
CatCMA : Stochastic Optimization for Mixed-Category Problems [9.1] ブラックボックス最適化の問題は、連続変数、整数変数、カテゴリー変数など、異なるタイプの変数を同時に最適化する必要があることが多い。
いくつかのベイズ最適化手法は混合カテゴリブラックボックス最適化(MC-BBO)を扱うことができるが、高次元問題へのスケーラビリティの欠如と内部計算コストに悩まされている。
本稿では,MC-BBO問題に対する新しい最適化手法であるCatCMAを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:44:09 GMT)
The P$^3$ dataset: Pixels, Points and Polygons for Multimodal Building Vectorization [9.1] P$3$データセットは、ベクトル化を構築するための大規模マルチモーダルベンチマークである。
データセットは100億点以上のLiDAR点を含み、デシメータレベルの精度と、地上サンプリング距離25cmのRGB画像を含んでいる。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:16:29 GMT)
Privacy-Preserving Socialized Recommendation based on Multi-View Clustering in a Cloud Environment [9.1] 本稿では、オンラインソーシャルネットワークから収集した情報を導入し、推薦の質を高めるためのプライバシー保護・ソーシャル化・レコメンデーションプロトコルを提案する。
提案手法は,ユーザ間の類似性を算出し,潜在的な関係や関心を判断し,ユーザのプライバシを信頼できない第三者にリークすることを防ぐ。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:21:21 GMT)
A Probabilistic Perspective on Model Collapse [9.1] 本研究の目的は,モデル崩壊の発生条件と,その緩和方法である。
軽度条件下では,モデルの崩壊を防止するために,各トレーニングステップにおけるサンプルサイズを徐々に増加させる必要があることを厳格に示す。
また, 合成データを用いた学習が, 実データのみを用いた学習よりも優れるモデルを生み出す可能性についても検討した。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:43:02 GMT)
Diffusion-based Method for Satellite Pattern-of-Life Identification [9.1] 本稿では,新しい拡散型衛星パタン・オブ・ライフ(PoL)識別法を提案する。
我々は時系列エンコーダを用いて衛星位置データの隠れ表現をキャプチャする。
提案手法は高い識別精度を示し,データサンプリング率の低下を伴っても堅牢な解を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:09:15 GMT)
OSoRA: Output-Dimension and Singular-Value Initialized Low-Rank Adaptation [9.0] 大規模言語モデル(LLM)のための新しいPEFT法であるOSoRAを提案する。
OSoRAは、微調整中にトレーニング可能なパラメータの数を最小化することで、計算リソースの要求を大幅に削減する。
数学的推論、常識推論、その他のベンチマークの総合的な評価は、OSoRAが最先端の手法と同等または優れた性能を達成していることを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:25:30 GMT)
Dual Decomposition of Weights and Singular Value Low Rank Adaptation [9.0] 重み行列を大きさと方向成分に分解する新しいアプローチであるDuDeを提案する。
評価の結果,MMLUでは48.35%,GSM8Kでは62.53%(pm$1.59)の精度が得られた。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:18:20 GMT)
Children's Mental Models of AI Reasoning: Implications for AI Literacy Education [9.0] AI推論の3つのモデルを特定します。
以上の結果から, 幼児(3~5歳)はAIの推論を, 高齢者(6~8歳)はAIをパターン認識器として認識していることが明らかとなった。
子どもたちのAI推論に対する理解に表れた3つの緊張点を強調し、AIカリキュラムの足場化や説明可能なAIツールの設計に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:20:12 GMT)
ThinkLess: A Training-Free Inference-Efficient Method for Reducing Reasoning Redundancy [9.0] ThinkLessは推論効率のよいフレームワークで、推論生成を早期に終了し、モデルを変更することなく出力品質を維持する。
我々はThinkLessが完全長のChain-of-Thought(CoT)デコードに匹敵する精度を実現し,デコード時間とメモリ消費を大幅に削減することを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:58:16 GMT)
On the creation of narrow AI: hierarchy and nonlocality of neural network skills [9.0] 私たちは、強く、狭く、AIシステムを作るという問題を研究します。
特定の狭義のスキルを学習するためには、幅広いデータ分布上のネットワークをトレーニングする必要がある場合があります。
また, 蒸留法は, 蒸留法よりも高い結果が得られている。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:21 GMT)
Exploring the Innovation Opportunities for Pre-trained Models [8.9] 事前訓練されたモデルは、AIイノベーションの世界を変えました。
事前訓練されたモデルが成功する場所を理解することは、AIイノベーションをサポートする上で重要である。
研究アプリケーションは、技術的な能力を示し、実際のユーザニーズに対処し、倫理的な課題を避ける。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:43:46 GMT)
Emotional Supporters often Use Multiple Strategies in a Single Turn [8.9] 感情支援会話タスクの既存の定義は、サポート的応答の構造を単純化する。
感情的な支持者は、1ターン以内に複数の戦略を連続的に採用することが多い。
戦略発話対の完全列を生成することを必要とする改訂形式を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:46:19 GMT)
VideoGameQA-Bench: Evaluating Vision-Language Models for Video Game Quality Assurance [8.8] ビデオゲームは今やエンターテイメント業界で最高の収入を生み出している。
VLM(Vision-Language Models)の最近の進歩は、ゲーム開発における様々な側面を自動化し、拡張する大きな可能性を秘めている。
ビデオゲームのQAタスクにおけるVLMの性能を正確に評価するには、標準化されたベンチマークが必要である。
VideoGameQA-Benchは、幅広いゲームQAアクティビティをカバーする包括的なベンチマークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:08:38 GMT)
Harnessing Large Language Models Locally: Empirical Results and Implications for AI PC [8.8] エッジデバイス上の大規模言語モデル(LLM)は、大きなプライバシー上のメリットを提供する。
これらのオンデバイスLSMは、モデル容量の削減と必要な圧縮技術のために本質的に性能上の制限に直面している。
デバイス上でのLCMを評価するために,モデル能力,開発効率,システム資源を包含する体系的方法論を導入する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:23:01 GMT)
Navigating Data Corruption in Machine Learning: Balancing Quality, Quantity, and Imputation Strategies [8.8] 欠落や騒々しいデータを含むデータの破損は、現実世界の機械学習において重大な課題を生じさせる。
本研究では,データ破損がモデル性能に与える影響について検討し,これらの効果を緩和するための戦略を探る。
データセットサイズの増加は軽減されるが,データ破損の影響を完全に克服することはできない。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:56:48 GMT)
Multispectral Detection Transformer with Infrared-Centric Sensor Fusion [8.8] ICフュージョン(IC-Fusion)は、可視光と赤外線を融合する多スペクトル物体検出器である。
ウェーブレット解析と経験的観察により、IR画像は、物体の局在に重要な構造的にリッチな高周波情報を含んでいることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:44:14 GMT)
SQLCritic: Correcting Text-to-SQL Generation via Clause-wise Critic [8.7] そこで我々は,sqlCriticBenchというベンチマークとともに,節単位の批判生成タスクを導入し,詳細なエラーローカライゼーションを行う。
また,自動トレーニングデータセットキュレーションパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:48:22 GMT)
A Trajectory-Based Bayesian Approach to Multi-Objective Hyperparameter Optimization with Epoch-Aware Trade-Offs [8.6] 機械学習モデルのトレーニングには、本質的にリソース集約的でノイズの多い反復的な学習手順が含まれる。
本稿では,2つの特徴を特徴とするトラジェクトリベース多目的ベイズ最適化アルゴリズムを提案する。
実験により,提案アルゴリズムは,チューニング効率を向上しつつ,望ましいトレードオフを効果的に識別できることが示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:52:07 GMT)
RRTL: Red Teaming Reasoning Large Language Models in Tool Learning [8.5] ツール学習の文脈における新たな推論LPM(RLLMs)の安全性はいまだ検討されていない。
ツール学習におけるRLLMの評価に特化して設計された赤いチーム化手法RRTLを提案する。
主要な7つのRLLMについて総合的な評価を行い,3つの重要な知見を明らかにした。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:21:19 GMT)
Explain What You Mean: Intent Augmented Knowledge Graph Recommender Built With An LLM [8.4] Intent Knowledge Recommender (IKGR)は、検索拡張生成と知識グラフの構築と密度化のための符号化アプローチを活用する新しいフレームワークである。
IKGRは知識ギャップを克服し、公開と内部レコメンデーションデータセットの両方で最先端のベースラインよりも大幅に向上します。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:33:20 GMT)
DiffProb: Data Pruning for Face Recognition [8.4] 本稿では,顔認識における最初のデータ解析手法であるDiffProbについて述べる。
DiffProbは、いくつかの設定でデータセットの最大50%をプルーするが、検証精度は向上する。
本手法はトレーニングコストとデータ量を大幅に削減し,効率的な顔認識訓練を実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:49:07 GMT)
An Analysis for Reasoning Bias of Language Models with Small Initialization [8.4] 大規模言語モデル(LLM)は、さまざまなタスクにまたがる例外的なパフォーマンスを示すことによって、自然言語処理に革命をもたらした。
本研究では,パラメータ初期化尺度がLLMの訓練行動とタスク嗜好に及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:17:46 GMT)
Aug2Search: Enhancing Facebook Marketplace Search with LLM-Generated Synthetic Data Augmentation [8.4] Aug2Searchは、Generative AI(GenAI)モデルによって生成された合成データを活用するEBRベースのフレームワークである。
本稿では,GenAI,特にLarge Language Models(LLMs)の高品質な合成データ生成能力について検討する。
Aug2Searchは1億の合成データサンプルを使用して、ROC_AUCの最大4%の改善を実現している。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:33:40 GMT)
Local Loss Optimization in the Infinite Width: Stable Parameterization of Predictive Coding Networks and Target Propagation [8.4] 局所目標の2つの代表的設計に対して、無限幅極限における最大更新パラメータ化(mu$P)を導入する。
深層線形ネットワークを解析した結果,PCの勾配は1次勾配とガウス・ニュートン様勾配の間に介在していることが判明した。
我々は、特定の標準設定において、無限幅制限のPCは、一階勾配とよりよく似た振る舞いをすることを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:26:14 GMT)
MAPS: A Multilingual Benchmark for Global Agent Performance and Security [8.3] 多様な言語やタスクにまたがるエージェントAIシステムを評価するためのベンチマークスイートであるMAPSを提案する。
それぞれのデータセットを10の多様な言語に変換し、805のユニークなタスクと8,855の言語固有のインスタンスを生成します。
我々は、英語から他の言語に移行する際に、パフォーマンスとセキュリティの両面で一貫した劣化を観察する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:42:00 GMT)
Let's Be Self-generated via Step by Step: A Curriculum Learning Approach to Automated Reasoning with Large Language Models [8.3] カリキュラム学習にインスパイアされたtextbfLBS3 自動推論のための新しいプロンプト手法を提案する。
LBS3はLLMを操り、ターゲットクエリに関連付けられた簡単にハードなプロキシクエリをリコールする。
これは、簡単なプロキシクエリから派生した例的なプロンプトを利用して、ハードプロキシクエリの解決にLSMを向けるプログレッシブ戦略を起動する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:32:13 GMT)
Multi-Hop Question Generation via Dual-Perspective Keyword Guidance [8.2] マルチホップ質問生成(MQG)は、文書から複数の情報スニペットを合成して目的の回答を導き出す必要がある質問を生成することを目的としている。
主な課題は、質問応答(QA)ペアに関連する重要な情報スニペットを効果的に特定することである。
本稿では,キーワードをマルチホップ質問生成プロセスにシームレスに統合するDual-Perspective Keyword-Guidedフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:30:31 GMT)
Towards Zero-Shot Differential Morphing Attack Detection with Multimodal Large Language Models [8.1] 本研究は, 差動モーフィング攻撃検出(D-MAD)における多モード大言語モデル (LLM) の導入を紹介する。
我々の知る限りでは、実バイオメトリックデータを用いてマルチモーダルLLMをD-MADに採用するのはこれが初めてである。
CoT(Chain-of-Thought)ベースのプロンプトを設計し、回答の失敗率を低減し、意思決定の背後にある推論を強化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:05:19 GMT)
Explaining Puzzle Solutions in Natural Language: An Exploratory Study on 6x6 Sudoku [8.1] 5つの大言語モデル(LLM)の性能を6つのスドクパズルの解法と説明法として評価した。
1つのLSMはパズルの解法において限られた成功を示すが、戦略的推論や直感的な問題解決を反映した方法で解法プロセスを説明することはできない。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:22:37 GMT)
Exploring Pretraining via Active Forgetting for Improving Cross Lingual Transfer for Decoder Language Models [8.0] 大規模言語モデル(LLM)は、多数のNLPタスクにおいて例外的な機能を示す。
英語以外の言語に対するそのようなモデルの有効性は制限されることが多い。
能動的忘れを前提としたLLMは,新しい言語や目に見えない言語に適応する上で非常に有効であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:58:45 GMT)
"Alexa, can you forget me?" Machine Unlearning Benchmark in Spoken Language Understanding [7.9] UnSLU-BENCHは、音声言語理解における機械学習のための最初のベンチマークである。
我々は、特定の話者からのデータの未学習を、潜在的な"忘れられる権利"要求の品質を評価する方法として扱う。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:13:57 GMT)
Entanglement-Enabled Connectivity Bounds for Quantum Networks [7.9] 量子インターネット(Quantum Internet)では、マルチパーティント・エンタングルメント(multipartite entanglement)は、人工トポロジーと呼ばれるリッチで動的なオーバーレイトポロジーを物理的に実現し、通信目的に利用することができる。
元のマルチパートの絡み合った状態から$n$-qubitsのGHZ状態とEPRペアを抽出する能力は、エンドツーエンドおよびオンデマンドの量子通信のためのリソースプリミティブを構成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:54:02 GMT)
Reranking with Compressed Document Representation [7.9] 文書を固定サイズの埋め込み表現に圧縮することで、入力サイズを小さくする。
次に、蒸留により圧縮された入力を使用するようにリランカーに教える。
この圧縮された入力を用いたトレーニングされたリランカーは、数十億のモデルに基づいているが、有効性と効率の両面でより小さなリランカーに挑戦することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:35:11 GMT)
SLMEval: Entropy-Based Calibration for Human-Aligned Evaluation of Large Language Models [7.9] 少数の人選好データに対するエントロピーに基づく校正手法SLMEvalを提案する。
実世界の2つの実運用ユースケースと公開ベンチマークで人的評価と強く相関する。
SLMEval は G-eval などの GPT-4 ベースの評価器に比べて 5-30 倍のコスト削減を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:40:30 GMT)
OMAC: A Broad Optimization Framework for LLM-Based Multi-Agent Collaboration [7.8] 複数のエージェントが協調して相互に通信するマルチエージェントシステム(MAS)は、複雑なタスクにおいて強化された機能を示す。
LLMをベースとしたMASの全体最適化を目的とした汎用フレームワークであるOMACを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:38:23 GMT)
LogiCase: Effective Test Case Generation from Logical Description in Competitive Programming [7.7] CCFG(Context-Free Grammars with Counters)は、入力仕様における構文構造と意味構造の両方をキャプチャする形式である。
微調整のCodeT5モデルを用いて、自然言語入力仕様をCFGに変換し、高品質なテストケースを体系的に生成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:48:01 GMT)
HybridProver: Augmenting Theorem Proving with LLM-Driven Proof Synthesis and Refinement [7.7] HybridProverは、戦術ベースの生成と全防御合成を組み合わせたデュアルモデル証明フレームワークである。
最適化されたデータセット上にIsabelle定理証明器とファインチューンLPMにHybridProverを実装した。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:45:43 GMT)
A Methodology to Evaluate Strategies Predicting Rankings on Unseen Domains [7.7] 既知のドメインのアセスメントに基づいて、どのエンティティが新しいドメインで最高のパフォーマンスを発揮するかを予測できますか?
本稿では,アプリケーション固有の嗜好に対して,この課題に対処する独自の手法を提案する。
53ドメイン(ビデオ)上の40のエンティティ(教師なしバックグラウンドサブトラクション手法)のランク付けを30の戦略で予測する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:50:09 GMT)
Learning Heuristics for Transit Network Design and Improvement with Deep Reinforcement Learning [7.7] 深層強化学習を用いてグラフネットをトレーニングし、進化的アルゴリズムにニューラルネットワークを提供する。
これらのニューラルネットワークは、70ノード以上のベンチマーク合成都市におけるアルゴリズムの結果を改善し、挑戦的なMumfordベンチマークの最先端の結果を達成する。
また、カナダのラヴァル市における実際の交通ネットワークのシミュレーションを、2つの主要な指標で52%と25%改善し、既存の交通ネットワークの最大19%のコスト削減を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:44:53 GMT)
Exploring the Robustness of Language Models for Tabular Question Answering via Attention Analysis [7.5] 大規模言語モデル(LLM)は、特定の訓練なしにテーブル理解タスクに取り組むことが示されている。
In-context Learning (ICL), model scale, instruction tune, and domain bias が Tabular QA (TQA) に与える影響を考察する。
摂動による注意分散の変化と性能低下との間には強い相関関係がみられた。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:45:38 GMT)
StmtTree: An Easy-to-Use yet Versatile Fortran Transformation Toolkit [7.5] 私たちはこの問題に対処するための新しいFortranコード変換ツールキットであるStmtTreeを紹介します。
StmtTreeはFortran文法をステートメントツリーに抽象化し、低レベル表現操作APIと、高レベルで使いやすいクエリとミニ言語操作の両方を提供する。
実験によると、StmtTreeはレガシーなFortran-77コードによく適応しており、未使用のステートメントを削除するなどの複雑なツールは100行未満のpythonコードで開発することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:55:51 GMT)
Probing Semantic Routing in Large Mixture-of-Expert Models [7.5] 大規模MoEモデルにおけるエキスパートルーティングが,入力のセマンティクスに影響されているかを検討する。
大規模MoEモデルにおいて意味的ルーティングの統計的に有意な証拠を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:32:41 GMT)
Judgment-of-Thought Prompting: A Courtroom-Inspired Framework for Binary Logical Reasoning with Large Language Models [7.5] 素早いエンジニアリングにもかかわらず、既存の論理的推論タスクにはループがある。
本稿では,エージェントの役割,検事の役割,裁判官の役割の3つについて論じる。
Wingrandeの評価はベンチマークとして機能し、引数を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:07:39 GMT)
Learning Cross-Spectral Point Features with Task-Oriented Training [7.4] この研究は、既存のカメラベースのナビゲーションシステムに熱画像を統合する手段として、学習されたクロススペクトル(熱可視)点の特徴を探求する。
熱可視画像ペア上で機能ネットワークを実行し、ネットワーク応答を異なる登録パイプラインに供給します。
我々の選択したモデルは、マッチングタスクに基づいて訓練され、MultiPointデータセット上の75%以上の推定値に対して、10ピクセル未満の登録誤差を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:48:29 GMT)
A re-calibration method for object detection with multi-modal alignment bias in autonomous driving [7.4] 自律走行における多モード物体検出は、異なるセンサからの補完情報を融合させることにより、大きなブレークスルーを達成した。
実際には、キャリブレーション行列は車両が工場を出る際に固定されるが、振動、バンプ、データラグはキャリブレーションバイアスを引き起こす可能性がある。
我々は,SOTA検出方式EPNet++の実験を行い,キャリブレーションの偏りをわずかに示し,性能を著しく低下させることを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:35:22 GMT)
EventSplat: 3D Gaussian Splatting from Moving Event Cameras for Real-time Rendering [7.4] イベントカメラは例外的な時間分解能と高いダイナミックレンジを提供する。
ガウススプラッティングによる新しいビュー合成におけるイベントカメラデータの利用法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:38:19 GMT)
Sparsity May Be All You Need: Sparse Random Parameter Adaptation [7.3] アライメントとタスク適応のための大規模言語モデルの完全な微調整は、モデルのサイズが大きくなるにつれて、極めて高価になっている。
そこで本研究では,トレーニング対象のモデルパラメータのごく一部をランダムに選択することで,トレーニング可能なパラメータの数を減らすことを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:33:56 GMT)
Learning Small Decision Trees with Few Outliers: A Parameterized Perspective [7.2] 決定木は、データの表現、分類、一般化のための機械学習の基本的なツールである。
textitize$s$) か textitdepth $(d)$ のいずれかを最小化する(textscDT)。
textscDTSO と textscDTDO という2つの問題を考えます。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:25:57 GMT)
GiFT: Gibbs Fine-Tuning for Code Generation [7.2] Gibbs Fine-Tuning (GiFT)は、Gibbsサンプリングにインスパイアされた新しい自己学習手法である。
GiFTは、ジョイント空間の限界分布から自己生成データを描画することを可能にする。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:29:49 GMT)
Stay Focused: Problem Drift in Multi-Agent Debate [7.2] 複数のターンに対するマルチエージェントの議論が、初期問題から脱却し、タスク性能を損なうかを分析する。
この漂流に関する最も一般的な問題は、進歩の欠如、低品質のフィードバック、明確さの欠如である。
DRIFTPolicyは,問題ドリフトケースを軽減し,タスク性能を向上させる手法である。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:02:49 GMT)
Multisetting protocol for Bell correlated states detection with spin-$f$ systems [7.1] 本稿では,2体ベル相関検出のためのマルチセットプロトコルを提案する。
我々は、スピン-f$原子ボース=アインシュタイン凝縮体内のSU(2)サブシステムの$f$対で実現されたスピンネマティック圧縮状態に適用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:58:31 GMT)
Diagnosing our datasets: How does my language model learn clinical information? [7.1] 大規模言語モデル(LLM)は様々な自然言語処理タスクでよく機能している。
我々は,オープンソースのLLMが大規模コーパスから臨床情報をいかに学習するかを検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:13:24 GMT)
DisCoPatch: Batch Statistics Are All You Need For OOD Detection, But Only If You Can Trust Them [7.0] アウト・オブ・ディストリビューション(OOD)検出は多くのアプリケーションにおいて重要な意味を持つ。
本稿では,この機構を利用した教師なし適応変分自動エンコーダフレームワークであるDisCoPatchを紹介する。
DisCoPatchは、公開OOD検出ベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:06:04 GMT)
Coloring Between the Lines: Personalization in the Null Space of Planning Constraints [6.9] 汎用ロボットは、長期ユーザーの多様なニーズや嗜好を満たすために、夢中をパーソナライズする必要がある。
本稿では,制約満足度問題のnull空間を利用したパーソナライズ手法であるCBTLを提案する。
CBTL は,(1) 多様なシミュレーション環境,(2) Web ベースのユーザスタディ,(3) リアルタイムロボット支援給餌システムにおいて評価される。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:24:05 GMT)
Reconstruction of Graph Signals on Complex Manifolds with Kernel Methods [6.9] グラフ信号処理(GSP)は、そのような信号の解析、処理、サンプリングを容易にするために登場した。
本稿では,複素多様体上のカーネル手法を用いたグラフ信号再構成フレームワークを提案する。
合成および実世界のデータセットの結果は、このフレームワークの有効性を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:27:38 GMT)
BadSR: Stealthy Label Backdoor Attacks on Image Super-Resolution [6.9] 超高解像度(SR)モデルは、データ中毒によるバックドア攻撃を受けることができる。
我々は,有毒なHR画像のステルスネスを改善するBadSRを提案する。
BadSRは様々なモデルやデータセットで高い攻撃成功率を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:36:35 GMT)
Beyond The Rainbow: High Performance Deep Reinforcement Learning on a Desktop PC [6.8] BTR(Beyond The Rainbow)は、RL文学からレインボーDQNへの6つの改良を統合する新しいアルゴリズムである。
我々は、複雑な3Dゲームを扱うBTRの能力を実証し、スーパーマリオギャラクシー、マリオカート、モルタルコンバットをプレイするエージェントのトレーニングに成功した。
計算効率を念頭に設計したBTRでは、エージェントは12時間以内に2億のAtariフレーム上のハイエンドデスクトップPCを使って訓練することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:49:19 GMT)
Alignment Under Pressure: The Case for Informed Adversaries When Evaluating LLM Defenses [6.7] アライメント(Alignment)は、迅速な注射や脱獄といった攻撃を防御するために使われる主要なアプローチの1つである。
グレディ・コーディネート・グラディエント(GCG)に対する攻撃成功率(ASR)の報告
論文参考訳(メタデータ) (Wed, 21 May 2025 16:43:17 GMT)
Analyzing Hierarchical Structure in Vision Models with Sparse Autoencoders [6.7] ImageNet階層は、オブジェクトカテゴリの構造的な分類を提供し、ディープビジョンモデルによって学習された表現を分析するための貴重なレンズを提供する。
本研究では,視覚モデルがイメージネット階層をエンコードする方法を包括的に分析し,スパースオートエンコーダ(SAE)を用いて内部表現を探索する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:38:48 GMT)
From Words to Collisions: LLM-Guided Evaluation and Adversarial Generation of Safety-Critical Driving Scenarios [6.7] 大規模言語モデル(LLM)と構造化シナリオ解析と迅速なエンジニアリングは、安全クリティカルな運転シナリオを生成するために使用される。
2次元シミュレーションフレームワークと複数の事前学習LDMを用いて,本手法の有効性を検証した。
ドメインインフォームドプロンプト技術を備えたLLMは、安全クリティカルな運転シナリオを効果的に評価し、生成することができると結論付けている。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:47:01 GMT)
From Features to Transformers: Redefining Ranking for Scalable Impact [6.7] LiGRはLinkedInが開発した大規模ランキングフレームワークである。
本稿では,学習の正規化とユーザ履歴とランキング項目への同時注意を取り入れた改良型トランスフォーマーアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:15:59 GMT)
Lossless Token Merging Even Without Fine-Tuning in Vision Transformers [6.6] トークン圧縮技術は、しばしば深刻な情報損失に悩まされる。
本稿では、ロスレストークンのマージを保証する新しい手法であるAdaptive Token Merging(ATM)を提案する。
我々は、幅広い事前訓練されたモデルにまたがって、我々の手法を実証的に検証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:26:28 GMT)
SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba [6.5] リアルタイムの外科的位相認識のための新しいフレームワークであるSPRMambaを提案する。
MambaアーキテクチャとScaled Residual TranMambaブロックを統合して、時間的モデリングと局所的な詳細抽出を相乗化する。
最先端のパフォーマンス(ESD385では87.64%、以前の方法では1.0%)を達成し、外科手術全体にわたって堅牢な一般化性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:18:46 GMT)
Fair Supervised Learning Through Constraints on Smooth Nonconvex Unfairness-Measure Surrogates [6.5] 公正な教師付き機械学習のための新しい戦略を提案する。
文献上の他のものと比較して提案された戦略の主な利点は以下の通りである。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:41:06 GMT)
Energy-Efficient Computation with DVFS using Deep Reinforcement Learning for Multi-Task Systems in Edge Computing [6.4] 本研究は、強化学習に基づくDVFSを用いたマルチタスク、マルチデッドラインシナリオを備えた一般化システムについて研究する。
この方法は、Linuxカーネル内の時系列データを、強化学習に容易に解釈可能な情報に符号化する。
テスト結果から,Linuxの組込み知事と比較して3%~10%の省電力化が可能であった。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:02:06 GMT)
How Managers Perceive AI-Assisted Conversational Training for Workplace Communication [6.3] 本研究では,マネージャがコミュニケーションスキルの向上を支援する上で,AIが果たす役割について考察する。
我々は、AIを使ってコミュニケーションスキルを実践するマネージャの予測方法を理解するために、会話型ロールプレイシステムであるCommCoachを機能的プローブとして設計した。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:59:56 GMT)
M3TR: A Generalist Model for Real-World HD Map Completion [6.3] 実地図の変更についての研究は、HDマップの全ての部分が変化せず、前もって使用することができることを示している。
我々は、オフラインのHDマッププリエンプションと非オフラインのHDマッププリエンプションの両方に対する一般的なアプローチであるM3TRを紹介する。
以前のHDマップ要素を完全に活用し、クエリ設計を最適化することで、M3TRは既存のメソッドを+4.3 mAPで上回っている。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:09:13 GMT)
Uhlmann and scalar Wilczek-Zee phases of degenerate quantum systems [6.3] ウィルツェク・ゼーホロノミーは退化状態に現れ、ウルマンホロノミーは有限温度トポロジーを特徴づける。
ウルマン位相とスカラーWZ位相の関係について検討し、それぞれウルマンホロノミーとWZホロノミーを反映している。
いくつかの条件は解析解析によって導出され、その下では、0温度極限のウルマン相はスカラーWZ相に収束する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:01:52 GMT)
WhiSPA: Semantically and Psychologically Aligned Whisper with Self-Supervised Contrastive and Student-Teacher Learning [6.3] 本研究は,後続のテキスト-LMが不要となるような音声モデルにおけるLMの改善手法を提案する。
本稿では,教師としての言語モデル埋め込みによる対照的な損失という,新たな学習目標を生かしたWhiSPAを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:00:05 GMT)
Bitcoin: A Non-Continuous Time System [6.3] 本稿では,確率的ブロック生成,フォークの発生,トランザクションの非線形確認によって形成される非連続時間システムとしてBitcoinを検討する。
これはエントロピーに基づく解釈を導入し、各ブロックは経済的に検証された歴史への不確実性の解決を表す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:22:29 GMT)
Hallucinate at the Last in Long Response Generation: A Case Study on Long Document Summarization [6.3] 幻覚は、生成された長い反応の後半部分に不均等に集中する傾向がある。
我々は、長いシーケンス上での注意と復号のダイナミクスに関連する潜在的寄与要因について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:22:11 GMT)
LURK-T: Limited Use of Remote Keys With Added Trust in TLS 1.3 [6.3] LURK-Tは、TLS 1.3の信頼性を付加したリモートキーの限定的な使用を可能にする、証明可能なセキュアなフレームワークである。
我々はTLS 1.3のサーバ側をLURK-T暗号サービス(CS)とLURK-Tエンジン(E)に効率的に分離する。
CSはTrusted Execution Environment(TEE)で全ての暗号処理を実行する
TLS-クライアントの観点からは、従来のTLS-サーバではなく、LURK-Tを使用したHTTPSサーバは、1MB以上のファイルを提供する場合、目立ったオーバーヘッドを伴わないことを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:23:17 GMT)
HAVA: Hybrid Approach to Value-Alignment through Reward Weighing for Reinforcement Learning [6.2] 私たちの社会は、安全、公正、信頼など、私たちが大切にしている価値をもたらす一連の規範によって支配されています。
バリューアライメントの目標は、タスクだけでなく、振る舞いを通じてこれらの価値を促進するエージェントを作成することだ。
本稿では,これらの規範を強化学習プロセスに統合する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:32:54 GMT)
LiDDA: Data Driven Attribution at LinkedIn [6.2] 我々は,メンバレベルのデータ,集約レベルのデータ,外部マクロファクタの統合を処理可能な,統一型トランスフォーマーベースの属性アプローチを導入する。
LinkedInでのアプローチの大規模実装について詳述し、大きな影響を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:19:59 GMT)
Detecting and removing bloated dependencies in CommonJS packages [6.1] サーバサイドJavaScriptアプリケーションにおける肥大した依存関係を調査するための最初の研究について述べる。
そこで我々は,OSファイルシステムをモニタし,実行中にどの依存関係にアクセスできないかを決定するトレースベースの動的解析手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:20:25 GMT)
NEXT-EVAL: Next Evaluation of Traditional and LLM Web Data Record Extraction [6.1] 本稿では,Webデータ抽出のための具体的な評価フレームワークを提案する。
本フレームワークは,評価スナップショットを生成し,監視ラベルを注釈付けし,一貫したスコア付けに構造対応メトリクスを用いる。
また、LLM(Large Language Model)ベースのアプローチの入力を最適化する前処理も組み込まれている。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:03:37 GMT)
SPD: Sync-Point Drop for efficient tensor parallelism of Large Language Models [6.1] 我々は、注意出力に同期を選択的にドロップすることで、テンソル並列性における通信オーバーヘッドを低減するために、Sync-Point Drop (SPD)を導入する。
SPDは8つのGPU上でのLLaMA2-70B推論に対して、全体の推論遅延を約20%削減し、1%の精度のレグレッションを提供した。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:23:44 GMT)
Leveraging Large Language Models for Command Injection Vulnerability Analysis in Python: An Empirical Study on Popular Open-Source Projects [6.0] コマンドインジェクションの脆弱性は、Pythonのような動的言語において重大なセキュリティ上の脅威である。
テストなどのコード関連タスクにおけるLLM(Large Language Models)の有効性が証明されたことから、研究者たちは脆弱性分析の可能性を探った。
本研究は,GPT-4のような大規模言語モデル(LLM)の潜在的な可能性を,脆弱性検出のための自動テストの代替手法として評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:14:35 GMT)
Hadamax Encoding: Elevating Performance in Model-Free Atari [6.0] 本研究では,画素ベースモデルフリー強化学習のための新しいエンコーダアーキテクチャを提案する。
Hadamaxエンコーダは、GELUによって活性化された並列隠蔽層間でHadamard製品を最大プールすることで、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:19:49 GMT)
Co-Designing Eigen- and Singular-value Transformation Oracles: From Algorithmic Applications to Hardware Compilation [5.9] 我々は、ハイブリッド離散/連続変数(qubit/qumode)ハードウェア上で効率的に実装できる量子固有値変換オラクルのファミリーを共同設計する。
エンド・ツー・エンドのコンパイル -- 短期および大規模の量子プロセッサの両方に適用できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:24:15 GMT)
SIMCOPILOT: Evaluating Large Language Models for Copilot-Style Code Generation [5.9] SIMCOPILOTは、対話型"コパイロット"スタイルのコーディングアシスタントとして、大規模言語モデル(LLM)の役割をシミュレートするベンチマークである。
ベンチマークには、Java(SIMCOPILOTJ)とPython用の専用のサブベンチマークが含まれている。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:59:44 GMT)
Exploring In-Image Machine Translation with Real-World Background [5.8] In-Image Machine Translationは、ある言語から別の言語に画像内のテキストを翻訳することを目的としている。
本稿では,背景画像とテキスト画像とを分離したDebackXモデルを提案する。
実験結果から,本モデルは翻訳品質と視覚効果の両面で向上することが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:02:53 GMT)
Optimizing Adaptive Attacks against Watermarks for Language Models [5.8] 大規模言語モデル(LLM)は、望ましくないコンテンツを大規模に拡散するために誤用することができる。
透かしは、内容にメッセージを隠すことで誤用を抑え、秘密の透かしキーを使ってその検出を可能にする。
目的関数として透かしのロバスト性を定式化し、特定の透かし手法に対して適応的な攻撃を調整するために選好に基づく最適化を用いる。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:37:27 GMT)
Benchmarking Chest X-ray Diagnosis Models Across Multinational Datasets [5.8] 視覚言語事前学習を利用した基礎モデルは胸部X線(CXR)解釈において有望であることが示されている。
本研究は,多国籍CXRデータセット上での従来の畳み込みニューラルネットワーク(CNN)と比較して,基礎モデルの診断性能と一般化性を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:16:50 GMT)
Depth-Efficient Quantum Circuit Synthesis for Deterministic Dicke State Preparation [5.8] ディック状態は量子コンピューティングに広く応用された、絡み合った量子状態の重要なクラスを表す。
一般に見られる2つの量子ビット接続制約の下でDicke状態生成のための決定論的量子回路を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:55:17 GMT)
Spontaneous Giving and Calculated Greed in Language Models [5.8] 大規模言語モデルは、チェーン・オブ・ソート・プロンプトやリフレクションのような推論技術を通じて、強力な問題解決能力を示す。
社会ジレンマをシミュレートする経済ゲームを用いて,この問題を考察する。
推論モデルは、協調と規範の強制を一貫して減らし、個人の合理性を支持する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:04:15 GMT)
Refining Neural Activation Patterns for Layer-Level Concept Discovery in Neural Network-Based Receivers [5.7] ニューラルネットワークの概念発見は、分散層全体のパターンを見渡すことで、個々のニューロンや人間の解釈可能な特徴をターゲットとすることが多い。
本研究では,階層レベルの概念を識別するために,全層活性化分布をクラスタ化するニューラルネットワーク活性化パターン(NAP)手法について検討する。
無線受信機モデルでは、異なる概念が出現せず、代わりにSignal-to-Noise Ratio (SNR) によって形作られた連続活性化多様体が観察された。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:23:38 GMT)
CEBSNet: Change-Excited and Background-Suppressed Network with Temporal Dependency Modeling for Bitemporal Change Detection [5.7] 変更検出はリモートセンシングとコンピュータビジョンにおいて重要なタスクである。
現在のメソッドは一時的な依存関係を見落とし、顕著な変更を過度に強調します。
textbfCEBSNetは、変更検出のための新しい変更励起およびバックグラウンド抑圧ネットワークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:57:30 GMT)
Time Tracker: Mixture-of-Experts-Enhanced Foundation Time Series Forecasting Model with Decoupled Training Pipelines [5.5] 時系列はしばしば、異なる時間帯と領域にまたがる時間パターンに顕著な多様性を示す。
Time Trackerは、精度、モデルの一般化、適応性を予測する際に最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:18:41 GMT)
Predictive Learning in Energy-based Models with Attractor Structures [5.5] 本稿では、エネルギーベースモデル(EBM)を用いて、ニューラルシステム内の動作後の観測を予測するための微妙なプロセスをキャプチャするフレームワークを提案する。
実験による評価では,様々なシナリオにまたがって有効性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:37:25 GMT)
Learning-based Autonomous Oversteer Control and Collision Avoidance [5.5] オーバーステア(Oversteer)は、車両の後部タイヤが牽引力を失い、意図しない過剰なヨーを誘導し、重大な安全上の課題を引き起こす。
本稿では,オーバーステア制御と衝突回避を同時に行う新しいエンド・ツー・エンド(E2E)自動運転手法を提案する。
本稿では,Q-Compared Soft Actor-Critic (QC-SAC)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:53:38 GMT)
Sharper Risk Bound for Multi-Task Learning with Multi-Graph Dependent Data [5.4] 既存の一般化解析では、Emphsub-Optimal risk bound of $O(frac1sqrtn)$, where $n$は各タスクのトレーニングサンプルの数である。
本稿では,新たなベネット型不等式を提案し,よりシャープなリスク境界である$O(fraclog nn)$を導出する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:15:38 GMT)
Systematic Evaluation of Machine-Generated Reasoning and PHQ-9 Labeling for Depression Detection Using Large Language Models [5.4] うつ病のような初期のメンタルヘルス検出のための大規模言語モデル(LLM)は、しばしば機械生成データによって最適化される。
本稿では,機械による検出と解釈に対する推論を体系的に評価する。
次に、モデルの推論能力を使用して、パフォーマンスを向上させるための緩和戦略を探索します。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:30:50 GMT)
Enhancing Monte Carlo Dropout Performance for Uncertainty Quantification [5.4] ディープニューラルネットワークの出力に関連する不確実性を知ることは、信頼できる決定を行う上で最重要となる。
我々は,モンテカルロ・ドロップアウト(MCD)を,異なる検索ソリューションを統合することで拡張する革新的なフレームワークを紹介する。
提案手法は,従来の精度と不確実性の両方の観点から,平均2-3%のMCDベースラインを上回ります。
これらの結果は、安全クリティカルなアプリケーションにおけるディープラーニングモデルの信頼性を高めるためのアプローチの可能性を強調している。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:50:03 GMT)
Ask, Fail, Repeat: Meeseeks, an Iterative Feedback Benchmark for LLMs' Multi-turn Instruction-Following Ability [5.4] Meeseeksは,反復的なフィードバックフレームワークを通じて,現実的な人間-LLMインタラクションをシミュレートする。
MeeseeksはマルチターンシナリオにおけるLLMの命令フォロー機能に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:33:21 GMT)
An Empirical Analysis of Vulnerability Detection Tools for Solidity Smart Contracts Using Line Level Manually Annotated Vulnerabilities [5.4] 本稿では,Solidityスマートコントラクトに特化して設計された自動脆弱性解析ツールの実証評価を行う。
行レベルの脆弱性ラベルを手動でアノテートした2,182インスタンスのアノテートデータセットを用いて評価を行った。
私たちは、最大76.78%の脆弱性を発見できる3つのツールのセットを特定しました。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:01:18 GMT)
Are the confidence scores of reviewers consistent with the review content? Evidence from top conference proceedings in AI [5.3] 本研究は,ディープラーニングとNLP会議データを用いて,単語,文,アスペクトレベルでの一貫性を評価する。
我々は、ヘッジ文やアスペクトを検出するためにディープラーニングを使用し、レポートの長さ、ヘッジワード/文頻度、アスペクト参照、感情を分析し、テキストスコアアライメントを評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:26:47 GMT)
Meta-Learning an In-Context Transformer Model of Human Higher Visual Cortex [5.3] BraInCoRLは、いくつかの例からボクセルワイドな神経応答を予測するために、コンテキスト内学習を使用している。
我々は、BraInCoRLが、既存のボクセルワイドエンコーダ設計を低データ方式で一貫して上回っていることを示す。
BraInCoRLは、意味的に関連する刺激に参加することによって、高次視覚野における神経信号のより良い解釈性を促進する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:41 GMT)
Learning Memory Kernels in Generalized Langevin Equations [5.3] 一般化ランゲヴィン方程式におけるメモリカーネル学習のための新しい手法を提案する。
このアプローチは最初、軌道データから相関関数を推定するために正規化Prony法を使用し、続いてRKHS正則化を伴うソボレフノルムに基づく損失関数の回帰を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:14:49 GMT)
A Simple Approximation Algorithm for Optimal Decision Tree [5.3] 最適決定木(odt)は、アクティブラーニング、エンティティ識別、医療診断などの応用における基本的な問題である。
各クエリはコストを発生させ、各仮説に対して既知の応答を持つ。
odt の簡単なアルゴリズムと解析を行い,近似比が 8 ln m$ であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:21:56 GMT)
Optimal Piecewise-based Mechanism for Collecting Bounded Numerical Data under Local Differential Privacy [5.3] ローカルディファレンシャルプライバシ(LDP)は、サードパーティプラットフォームが信頼できない場合でも、証明可能な個々のプライバシを提供するフレームワークとして示されている。
本稿では, LDP 下でのデータ有効性を最大化するために, ピースワイズ方式の最適設計について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:01:41 GMT)
Analyzing the Effect of Linguistic Similarity on Cross-Lingual Transfer: Tasks and Experimental Setups Matter [5.2] 低リソース環境下でのNLPタスクのトレーニングデータ量を増やすために、言語間転送が一般的なアプローチである。
本研究では,263言語間の言語間移動を多種多様な言語群から分析する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:27:36 GMT)
DEBATE, TRAIN, EVOLVE: Self Evolution of Language Model Reasoning [5.2] 大規模言語モデル(LLM)は、大規模なデータセットの広範なトレーニングを通じて、その推論において大幅に改善されている。
Debate, Train, Evolve (DTE) は,複数エージェントの議論トレースを用いて単一の言語モデルを進化させる,基礎となる真理のないトレーニングフレームワークである。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:40:12 GMT)
Exploring The Visual Feature Space for Multimodal Neural Decoding [5.2] MLLM(Multimodal Large Language Models)における事前学習された視覚成分からの視覚特徴空間の選択について分析する。
MG-BrainDub(Multi-Granularity Brain Detail Understanding Benchmark)を提案する。
このベンチマークには2つの重要なタスクが含まれている。詳細な説明と、オブジェクト、属性、リレーションシップといった重要な視覚要素をハイライトするメトリクスを含む。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:01:08 GMT)
Are Sparse Autoencoders Useful for Java Function Bug Detection? [5.1] ソフトウェア脆弱性はセキュリティ侵害の主な原因である。
従来の脆弱性検出方法は、高い偽陽性率、スケーラビリティの問題、手作業への依存によって制限されている。
Sparse Autoencoderはこの問題に対して有望な解決策を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:27:04 GMT)
R-TOFU: Unlearning in Large Reasoning Models [5.1] この設定に合わせた最初のベンチマークであるReasoning-TOFUを紹介します。
R-TOFUは、既存の未学習タスクを現実的なCoTアノテーションで強化する。
本稿では,コヒーレントで不確定な推論を保持する優先最適化変種であるReasoned IDKを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:44:30 GMT)
NeuBM: Mitigating Model Bias in Graph Neural Networks through Neutral Input Calibration [5.1] グラフニューラルネットワーク(GNN)におけるモデルバイアスを緩和する新しいアプローチであるNeuBMを導入する。
NeuBMは動的に更新された中立グラフを利用して、モデル固有のバイアスを推定し、修正する。
本手法は既存のGNNアーキテクチャとトレーニング手順をシームレスに統合し,計算オーバーヘッドを最小限に抑える。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:52:10 GMT)
The Strawberry Problem: Emergence of Character-level Understanding in Tokenized Language Models [4.9] 大きな言語モデル(LLM)は、基本的制限であるトークン化のため、文字を単語にカウントするといった単純な文字レベルのタスクで一貫して失敗する。
サブワードモデルの帰納的優位性を保ちながら文字レベルの推論を大幅に改善する軽量なアーキテクチャ修正を提案する。
その結果,トークン化LMにおける低レベルの知覚ギャップを橋渡しし,それらの構造的盲点の理解と緩和のための原則的枠組みを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:38:48 GMT)
Operator entanglement in $\mathrm{SU}(2)$-symmetric dissipative quantum many-body dynamics [4.9] 対称性の存在は、オープン量子多体系における作用素の絡み合いの非自明なダイナミクスをもたらす可能性がある。
散逸性量子多体系における演算子絡み合いの遠方平衡力学を数値的に研究する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:35:38 GMT)
A Temporal Difference Method for Stochastic Continuous Dynamics [4.9] ベルマンの最適性の原理はハミルトン・ヤコビ・ベルマン方程式(HJB)の形を取る。
HJB方程式を対象とするモデルフリーアプローチを提案し,対応する時間差分法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:08:34 GMT)
Mean-Field Sampling for Cooperative Multi-Agent Reinforcement Learning [4.9] 我々は、新しい$textttSUBPLE-MFQ$(textbfSubsample$-$textbfMean-$textbfF$ield-$textbfQ$-learning)と、$n$エージェントを持つシステムの分散ランダム化ポリシーを提案する。
我々は、この学習されたポリシーが$tilde$O (1/sqrtk)$の順序の最適ポリシーに収束することを証明する。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:29:28 GMT)
Voicing Personas: Rewriting Persona Descriptions into Style Prompts for Controllable Text-to-Speech [4.9] 汎用的なペルソナ記述を音声指向のプロンプトに変換するための2つのペルソナ書き換え戦略を提案する。
本手法は,合成音声の自然性,明瞭性,一貫性を高める。
我々は、ペルソナ駆動型AI対話システムにおいて、音声スタイルを重要な要素として評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:28:56 GMT)
FastKV: KV Cache Compression for Fast Long-Context Processing with Token-Selective Propagation [4.9] 大きな言語モデル(LLM)は、長いコンテキストシーケンスを扱うのに優れている。
コンテキスト情報を格納するために、かなりのキーバリュー(KV)キャッシュが必要である。
FastKVは、長文推論のレイテンシを低減するために設計されたKVキャッシュ圧縮方式である。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:45:58 GMT)
Finding separatrices of dynamical flows with Deep Koopman Eigenfunctions [4.8] 本稿では,Deep Neural Networksと組み合わせたクープマン理論を応用し,セパラトリクスを効果的に特徴付ける数値的枠組みを提案する。
具体的には、実正の固有値に付随するクープマン固有関数(KEF)を近似し、セパラトリクスで正確に消滅する。
ニューロサイエンスにインスパイアされたタスクでトレーニングされた、合成ベンチマーク、生態ネットワークモデル、およびリカレントニューラルネットワークについて、我々のアプローチを実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:04:31 GMT)
"AI just keeps guessing": Using ARC Puzzles to Help Children Identify Reasoning Errors in Generative AI [4.8] 生成人工知能(genAI)の日常生活への統合は、これらの技術に批判的に取り組むために必要な能力に関する疑問を提起する。
genAIの視覚的エラーとは異なり、テキストの誤りは検出し、特定のドメイン知識を必要とすることが多い。
我々は,抽象推論コーパス(ARC)に基づく対話型システムであるAI Puzzlersを開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:27:23 GMT)
SAMA-UNet: Enhancing Medical Image Segmentation with Self-Adaptive Mamba-Like Attention and Causal-Resonance Learning [4.8] 医用画像セグメンテーションのための新しいアーキテクチャであるSAMA-UNetを紹介する。
鍵となる革新は、自己適応的マンバ様の凝集注意ブロック(SAMA)である。
MRI、CT、内視鏡画像での実験では、SAMA-UNetは現在の方法よりもセグメンテーション精度が良いことが示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:12:31 GMT)
Fast filtering of non-Gaussian models using Amortized Optimal Transport Maps [4.7] 本稿では、最適輸送フィルタ(OTF)のリアルタイムトレーニングに伴う計算負担を軽減するために設計された、償却最適輸送フィルタ(A-OTF)を提案する。
A-OTFは、オンライン計算における推論コストを低減するために、初期/オフラインのトレーニング段階におけるOTFマップ間の類似性を利用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:52:07 GMT)
Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning [4.7] この研究は、訓練されたモデルによる物理場の生成における物理方程式の相当な相違に直面する。
HMT-PFという名称の物理場生成モデルは、ハイブリッドのMamba-Transformerアーキテクチャに基づいて開発されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:36:58 GMT)
Transformer-based deep imitation learning for dual-arm robot manipulation [4.7] デュアルアームの操作設定では、追加のロボットマニピュレータによって引き起こされる状態次元の増加が注意をそらす。
本稿では、逐次入力における要素間の依存関係を計算し、重要な要素に焦点をあてる自己認識機構を用いてこの問題に対処する。
自己注意型アーキテクチャの変種であるTransformerは、実世界のデュアルアーム操作タスクを解決するために、深層模倣学習に適用される。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:09:12 GMT)
Goal-conditioned dual-action imitation learning for dexterous dual-arm robot manipulation [4.7] バナナの皮剥きなどの変形可能な物体の長時間条件付きデキスタスロボット操作は問題となる。
本稿では,目標条件付きデュアルアクション・ディープ・模倣学習(DIL)アプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:12:04 GMT)
Gaze-based dual resolution deep imitation learning for high-precision dexterous robot manipulation [4.7] 針のスレッディングのような高精度な操作作業は困難である。
人間の視線に基づく双対分解能ビジュモータ制御システムにインスパイアされた、深層模倣学習に基づく手法は、ニードルスレッディングタスクを解くことができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:10:39 GMT)
SmoothCache: A Universal Inference Acceleration Technique for Diffusion Transformers [4.7] Diffusion Transformer (DiT)は、画像、ビデオ、音声合成など、様々なタスクのための強力な生成モデルとして登場した。
本稿では,DiTアーキテクチャのモデルに依存しない推論高速化手法であるSmoothCacheを紹介する。
我々の実験は、SmoothCacheが71%のスピードアップを実現し、多様なモダリティをまたいだ生成品質の維持や改善を実現していることを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:52:59 GMT)
Integrating Robotic Navigation with Blockchain: A Novel PoS-Based Approach for Heterogeneous Robotic Teams [4.7] この研究は、ブロックチェーンシステムで一般的に使用されるProof of Stake(PoS)メカニズムをWAVNフレームワークのciteLyons_2022に導入した。
このプロジェクトでは、自律ナビゲーションの大幅な進歩と、従来の財務状況を超えたブロックチェーン技術の広範な応用が期待されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:11:36 GMT)
Multimodal Biomarkers for Schizophrenia: Towards Individual Symptom Severity Estimation [4.6] 本研究は,マルチモーダルアプローチによる個々の症状推定に焦点を移す。
精度と重大性を改善するために,各モードに対する一様モデルとマルチモーダル・フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:55:35 GMT)
MIRB: Mathematical Information Retrieval Benchmark [4.6] 検索モデルのMIR能力を評価するためにMIRB(Mathematical Information Retrieval Benchmark)を導入する。
MIRBには、セマンティックステートメント検索、質問応答検索、前提検索、公式検索の4つのタスクが含まれており、合計12のデータセットにまたがる。
このベンチマークで13の検索モデルを評価し、MIRに固有の課題を分析した。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:40:27 GMT)
Flexible Heteroscedastic Count Regression with Deep Double Poisson Networks [4.6] 本稿ではDDPN(Deep Double Poisson Network)を提案する。
DDPNは既存の離散モデルを大幅に上回っている。
これは様々なカウント回帰データセットに適用できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:59:09 GMT)
Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities [4.6] 多言語大言語モデル(MLLM)における覚書の総合的研究について紹介する。
様々なモデルスケール、アーキテクチャ、記憶定義のモデルを用いて95の言語を分析します。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:30:18 GMT)
Optimal Control of Nonlinear Systems with Unknown Dynamics [4.6] 本稿では,閉ループ最適制御器の探索のためのデータ駆動方式を提案する。
任意の初期状態が与えられた未知の力学を持つ系に対する特定の無限水平コスト関数を最小化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:30:51 GMT)
Large Language Models are Powerful Electronic Health Record Encoders [4.5] 汎用大規模言語モデル(LLM)は、下流臨床予測タスクの表現にERHデータをエンコードするために用いられる。
LLMをベースとした埋め込みは、特殊EHRファンデーションモデルの性能にマッチしたり、超えたりできることを示す。
検査されたLSMモデルのうちの1つは、疾患発症、入院、死亡予測において優れた性能を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:31:35 GMT)
Enhanced Textual Feature Extraction for Visual Question Answering: A Simple Convolutional Approach [4.5] 確立されたVQAフレームワーク内の局所的なテキスト機能に焦点をあてた、長距離依存を利用したモデルと、よりシンプルなモデルの比較を行う。
本稿では,畳み込み層を組み込んだモデルであるConvGRUを提案する。
VQA-v2データセットでテストされたConvGRUでは、NumberやCountといった質問タイプに対するベースラインよりも、わずかながら一貫性のある改善が示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:25:26 GMT)
Beyond Classification: Evaluating Diffusion Denoised Smoothing for Security-Utility Trade off [4.5] Diffusion Denoized Smoothingは、モデルロバスト性を高めるための有望なテクニックとして登場している。
4つの異なる下流タスクを持つ3つのデータセットを3つの異なる逆攻撃アルゴリズムで解析する。
歪みのないクリーニング画像への高ノイズ拡散は、性能を最大57%低下させる。
我々は,拡散過程自体をターゲットとした新たな攻撃戦略を導入し,低雑音体制における防御を回避した。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:49:24 GMT)
Internal and External Impacts of Natural Language Processing Papers [4.5] 学術コミュニティと一般大衆の両方で異なるNLPトピックが消費されるかを検討する。
その結果,言語モデルが最も内的・外的影響が大きいのに対して,言語基盤は影響が低いことが明らかとなった。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:25:58 GMT)
The Representational Alignment between Humans and Language Models is implicitly driven by a Concreteness Effect [4.5] 本研究では,人間によって暗黙的に使用される意味距離を,慎重に選択された抽象名詞と具体名詞の集合として推定する。
参加者の暗黙的表現空間と言語モデルの意味的表現が著しく一致していることが判明した。
結果は、人間と言語モデルは具体性次元に収束するが、他の次元には収束しないことを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:57:58 GMT)
Which Retain Set Matters for LLM Unlearning? A Case Study on Entity Unlearning [4.4] 大規模言語モデル(LLM)は、トレーニングデータから無許可または機密情報を保持するリスクがあり、プライバシー上の懸念を引き起こす。
LLMは、モデル全体のパフォーマンスを維持しながら、指定されたデータを選択的に削除することで、これらのリスクを軽減することを目指している。
我々は、類似した構文構造と削除を目的としたデータを共有するクエリ群であるSyntactically similar Neighbor Setを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:51:45 GMT)
Embedding principle of homogeneous neural network for classification problem [4.4] 本稿では,ニューロン分割により発生する異なる幅のネットワーク間のKKT点の関係について検討する。
我々はtextbfKKT 点埋め込みの原理を導入・定式化し、同種ネットワークの最大マージン問題の KKT 点をより大きなネットワークの問題 KKT 点に埋め込むことができることを確認した。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:02:52 GMT)
TRACE: Time SeRies PArameter EffiCient FinE-tuning [4.4] TRACE: Time Series Efficient Fine-tuning と呼ばれる時系列基礎モデルの効率的な微調整法を提案する。
長期予測タスクでは、調整された微調整がパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:07:15 GMT)
Toward Informed AV Decision-Making: Computational Model of Well-being and Trust in Mobility [4.4] 動的ベイズネットワーク(DBN)の形での新しい計算モデルを提案する。
我々のモデルは、AVユーザーと対話する道路ユーザーの両方の幸福を、信頼と共に認知状態として捉えている。
本評価は,ユーザの状態を正確に予測し,人間中心のAV決定を導く上で,モデルの有効性を示すものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:02:39 GMT)
Symmetry-Robust 3D Orientation Estimation [4.3] そこで我々は,2段階の配向パイプラインを導入し,アップアクティビティ推定におけるアートパフォーマンスの状態を把握した。
従来の作業とは異なり、クラスのサブセットではなく、すべてのShapenet上でメソッドをトレーニングし、評価します。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:57:55 GMT)
HCRMP: A LLM-Hinted Contextual Reinforcement Learning Framework for Autonomous Driving [4.3] 強化学習(RL)を備えた大規模言語モデル(LLM)は、複雑なシナリオにおける自律運転(AD)のパフォーマンスを向上させることができる。
しかし、現在のRL法はLLM出力に過剰に依存しており、幻覚を起こす傾向にある。
本稿では,幻覚の問題を解決するためのLLM-Hinted RLパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:47:24 GMT)
Adaptive Group Policy Optimization: Towards Stable Training and Token-Efficient Reasoning [4.3] 本稿では,ゆらぎ学習とゼロ・アドバンテージを緩和する目的関数を改良したAdaptive Group Policy Optimization (AGPO)を提案する。
実験により,提案手法は推論ステップにおけるトークンを著しく少なくして,より安定した訓練と優れた性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:54:08 GMT)
LAGO: Few-shot Crosslingual Embedding Inversion Attacks via Language Similarity-Aware Graph Optimization [4.3] LAGOは、数発の言語間埋め込みインバージョンアタックのための新しいアプローチである。
グラフベースの制約付き分散最適化フレームワークを通じて言語関係を明示的にモデル化する。
実験により、ベースラインよりも10~20%のルージュ-Lスコアが増加し、攻撃の転送可能性を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:48:24 GMT)
LAMP: Extracting Locally Linear Decision Surfaces from LLM World Models [4.3] 我々は,ブラックボックス言語モデルの決定面に光を照射するLAMPを紹介する。
LAMPは、モデル自身の自己報告された説明を座標系として扱う。
どの要因がモデルの判断を決定づけるか、そしてどの程度の量によって明らかになる。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:41:43 GMT)
Towards Identifiability of Interventional Stochastic Differential Equations [4.2] 本結果より, 定常分布から得られたサンプルからSDEパラメータを一意に回収するための最初の証明可能なバウンダリが得られた。
合成データにおける真のパラメータの回復を実験的に検証し、理論的結果から動機付け、学習可能なアクティベーション関数を用いたパラメータ化の利点を実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:10:54 GMT)
Leveraging the Powerful Attention of a Pre-trained Diffusion Model for Exemplar-based Image Colorization [4.2] Exemplar-based image colorizationは、基準色画像を用いてグレースケールイメージを彩色することを目的としている。
本稿では,事前学習した拡散モデルに基づく,新しい微調整不要な手法を提案する。
実験の結果,提案手法は画像の画質と忠実度において既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:40 GMT)
Mouse Lockbox Dataset: Behavior Recognition for Mice Solving Lockboxes [4.2] 複雑な機械パズル、いわゆるロックボックスを解く個々のマウスのビデオデータセットを提示する。
110時間以上のプレイタイムは、3つの異なる視点から記録された行動を示す。
フレームレベルの行動分類手法のベンチマークとして、2つの異なるマウスのすべてのビデオに対して、人間のアノテーション付きラベルを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:51:51 GMT)
Entropic Diagram Characterization of Quantum Coherence: Degenerate Distillation and the Maximum Eigenvalue Uncertainty Bound [4.1] 不整合操作下での全ての資源理論公理を満たす多種多様なコヒーレンス測度スイートを導入する。
この統一的アプローチは、フォン・ノイマン=ツァリスエントロピー空間における物理的に実現可能な状態の幾何学的境界を明らかにする。
本研究では, エントロピーに基づく不確実性関係を, マーセン・ウフィンク境界を精製し, 異なる測定基準をまたいだ最大の固有値を求めることにより強化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:47:31 GMT)
Signals of Provenance: Practices & Challenges of Navigating Indicators in AI-Generated Media for Sighted and Blind Individuals [4.1] 自己開示指標によるAIGコンテンツとの相互作用を検討するため,視覚障害者とBLV参加者にインタビューを行った。
我々は、一貫性のない指標配置、不明確なメタデータ、認知的過負荷から生じるユーザビリティの課題を明らかにした。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:16:59 GMT)
Versatile Reservoir Computing for Heterogeneous Complex Networks [4.1] 大規模複雑なネットワークにおいて,要素のサブセットから時系列で訓練された単一の小規模貯水池コンピュータが,任意の要素のダイナミクスを再現可能であることを示す。
ネットワークの集合力学を有限時間水平線上で正確に保存できることを実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:46:49 GMT)
Resource Management and Circuit Scheduling for Distributed Quantum Computing Interconnect Networks [4.1] 本稿では,MILP(Mixed-Integer Linear Programming)の定式化と手法を組み合わせた回路スケジューリングと資源割当アルゴリズムを提案する。
提案手法は, 回路実行時間と資源利用量を大幅に改善し, メースパン, スループット, およびQPU使用量によって測定した。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:29:02 GMT)
Fourier-Invertible Neural Encoder (FINE) for Homogeneous Flows [4.1] 可逆ニューラルネットワークは、そのコンパクト性、解釈可能性、および情報保存特性に注目されている。
本稿では,可逆な単調活性化関数と可逆なフィルタ構造を組み合わせたフーリエ可逆ニューラルネットワーク(FINE)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:02:59 GMT)
TAGS: 3D Tumor-Adaptive Guidance for SAM [4.1] 本稿では, SAM 用腫瘍適応ガイダンス (TAGS: tumor Adaptive Guidance for SAM) という適応フレームワークを提案する。
マルチプロンプト融合により、2D FMを3D医療タスクにアンロックする。
我々のモデルは最先端の医療画像セグメンテーションモデルを上回る。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:02:17 GMT)
Oversmoothing, "Oversquashing", Heterophily, Long-Range, and more: Demystifying Common Beliefs in Graph Machine Learning [4.0] 我々は,過密・過密,ホモフィリー・ヘテロフィリー二分法,長期的課題に焦点をあてる。
このことが研究課題の曖昧さを招き、研究者が正確な研究課題に焦点を合わせるのを妨げていると我々は主張する。
私たちのコントリビューションは、このような共通の信念を明確にし、これらのトピックに関して批判的な思考を奨励したいと思っています。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:11:59 GMT)
SAeUron: Interpretable Concept Unlearning in Diffusion Models with Sparse Autoencoders [4.0] 拡散モデルは、必然的に有害または望ましくないコンテンツを生成できる。
最近の機械学習アプローチは潜在的な解決策を提供するが、透明性を欠いていることが多い。
本稿では,スパースオートエンコーダが学習した特徴を利用して不要な概念を除去する手法であるSAeUronを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:35:16 GMT)
Bloch oscillation with a diatomic tight-binding model on quantum computers [4.0] 我々は状態ベクトル基底表現の下で少数体ハミルトン行列を用いることを提案する。
1次元鎖上の単一粒子励起状態に対して、$Gamma$ qubitsは$N=2Gamma$個のサイトをシミュレートすることができる。
二バンド二原子強結合モデルを用いて状態ベクトル基底表現の有効性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:02:16 GMT)
EC-LDA : Label Distribution Inference Attack against Federated Graph Learning with Embedding Compression [4.0] Federated Graph Learning(FGL)は、さまざまなクライアントからグラフデータを協調的にトレーニングする、新たな学習フレームワークである。
本稿では,クライアントのローカルデータのラベル分布を推定することを目的としたラベル分散攻撃(LDAs)に焦点を当てる。
本稿では,ノード埋め込みを圧縮することで攻撃効率を大幅に向上させるEC-LDAという新しい攻撃法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:54:37 GMT)
Adaptive Plan-Execute Framework for Smart Contract Security Auditing [4.0] 大規模言語モデル(LLM)は、コード分析と監査において大きな可能性を示しています。
LLMは幻覚と限定的な文脈認識推論に苦しむ。
スマートコントラクトセキュリティ分析を強化する新しいPlan-ExecuteフレームワークであるSmartAuditFlowを紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:18:41 GMT)
Detection of Underwater Multi-Targets Based on Self-Supervised Learning and Deformable Path Aggregation Feature Pyramid Network [4.0] 本稿では,水中ターゲット検出のための特別なデータセットを開発し,水中マルチターゲット検出のための効率的なアルゴリズムを提案する。
変形可能な畳み込みと拡張畳み込みを導入した水中目標検出に適した検出モデルを提案する。
実験の結果,提案した検出器により,水中目標検出の精度が向上したことがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:43:26 GMT)
Convolutional Long Short-Term Memory Neural Networks Based Numerical Simulation of Flow Field [4.0] ベースラインネットワークとして改良された畳み込み長短期記憶(Con-vLSTM)ニューラルネットワークを提案する。
円柱まわりの流れの数値シミュレーションを行った。
その結果、改良されたConvLSTMモデルにより、より時間的および空間的特徴を抽出できることが示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:54:37 GMT)
Are machine learning interpretations reliable? A stability study on global interpretations [3.9] 我々は、一般的な機械学習のグローバルな解釈に関する、最初の体系的で大規模な実験的安定性の研究を行う。
この結果,一般的な解釈法は予測法よりも不安定であり,特に安定性が低いことが判明した。
ベンチマークデータセットをまたいだ最も安定した解釈を一貫して提供するメソッドは存在しない。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:34:11 GMT)
DeepKD: A Deeply Decoupled and Denoised Knowledge Distillation Trainer [3.9] DeepKDは、デュアルレベルのデカップリングと適応的なデヌーシングを統合した、新しいトレーニングフレームワークである。
トレーニングが進むにつれて、Kを小さな初期値から徐々に増加させ、より多くの非ターゲットクラスを組み込む動的トップkマスク(DTM)機構を導入する。
CIFAR-100、ImageNet、MS-COCOの大規模な実験はDeepKDの有効性を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:38:57 GMT)
Worse than Zero-shot? A Fact-Checking Dataset for Evaluating the Robustness of RAG Against Misleading Retrievals [3.9] 本稿では,RAGシステムの不正検索に対する堅牢性を評価するために設計されたファクトチェックデータセットであるRAGuardを紹介する。
RAGuardは、回収された証拠を3つのタイプに分類する。
ベンチマーク実験の結果,LLM方式のRAGシステムはすべて,ゼロショットベースラインよりも性能が劣っていることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:12:31 GMT)
An Empirical Analysis of EOS Blockchain: Architecture, Contract, and Security [3.9] 本研究は,システムアーキテクチャ,分散化,パフォーマンス,スマートコントラクト,行動セキュリティという5つの重要な側面から,EOSブロックチェーンを包括的に調査する。
XBlockのデータ共有プラットフォームのデータに基づく分散化とパフォーマンス評価は、いくつかの重要な問題を明らかにしている。
スマートコントラクトの次元では,5種類のコントラクト脆弱性が特定され,主要な脆弱性検出プラットフォームが4つ導入され,比較的解析された。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:16:07 GMT)
BanglaByT5: Byte-Level Modelling for Bangla [3.9] ここでは,Banglaに適した最初のバイトレベルのエンコーダデコーダモデルであるBanglaByT5を紹介する。
BanglaByT5は、GoogleのByT5アーキテクチャの小さなバージョンをベースに構築され、高品質の文学記事と新聞記事を組み合わせた14GBのキュレートコーパスで事前訓練されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:39:07 GMT)
Solving General-Utility Markov Decision Processes in the Single-Trial Regime with Online Planning [3.9] 我々は, 単審制における無限水平割引型汎用マルコフ決定過程(GUMDP)の解法を最初に提案する。
本稿では,特にモンテカルロ木探索アルゴリズムを用いて,GUMDPを単一審理体制で解く方法を紹介する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:32:23 GMT)
ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement [3.9] 臨床画像では、MRI画像のボリュームはスキャン時間を短縮し、信号-雑音比を改善し、2次元MRパルスシーケンスに特有のコントラストを持つ2次元スライススタックとして取得されることが多い。
これは臨床評価に十分であるが、3次元解析のために設計された自動アルゴリズムはマルチスライス2次元MRボリューム、特にスライス厚みとスライス間ギャップを有するものには不十分である。
超解像法(SR)はこの問題に対処することを目的としているが、以前の手法ではスライスプロファイル形状推定、スライスギャップ、ドメインシフト、非整数または任意のアップといった全ての問題に対処していない。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:23:59 GMT)
FG-CLIP: Fine-Grained Visual and Textual Alignment [3.8] 本稿では,3つの重要なイノベーションを通じて微細な理解を深めるファイングラインドCLIPを提案する。
我々は、大容量マルチモーダルモデルを用いて、世界レベルのセマンティックディテールをキャプチャするために、160億の長いキャプションイメージペアを生成する。
我々は、高品質な領域固有のアノテーションと、きめ細かい負のサンプルを統合することで、FinHARDと呼ばれる包括的データセットを構築した。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:18:41 GMT)
Auxiliary Field Quantum Monte Carlo for Electron-Photon Correlation [3.8] ハイブリッド光マター偏光子状態は、既に知られているものを変え、新しい化学反応を可能にするという大きな期待を示している。
ab 極性現象のモデリングは 一般的に使われている電子構造法を 更新しました
論文参考訳(メタデータ) (Wed, 21 May 2025 21:10:49 GMT)
Restricted Spectral Gap Decomposition for Simulated Tempering Targeting Mixture Distributions [3.8] 模擬テンパリングと任意の局所連鎖モンテカルロサンプリング器を組み合わせることを考える。
混合分布からサンプリングするアルゴリズムの制限スペクトルギャップを下限とした新しい分解定理を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:28:55 GMT)
DayDreamer at CQs-Gen 2025: Generating Critical Questions through Argument Scheme Completion [3.7] 本稿では,ArgMining 2025におけるCQ(Critical Questions Generation)共有タスクについて紹介する。
提案手法は,大規模言語モデル (LLM) とチェーン・オブ・シントを利用して,ウォルトンの議論スキームに導かれる重要な質問を生成する。
パイプラインは最終テストセットで競合的なパフォーマンスを達成し、議論的なテキストを与えられた批判的思考を育み、欠落や不正なクレームを検出する可能性を示しています。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:15:49 GMT)
Domain Adaptive Skin Lesion Classification via Conformal Ensemble of Vision Transformers [3.7] 本稿では,コンフォーマル・アンサンブル・オブ・ビジョン・トランスフォーマー(CE-ViT)と呼ばれる新しいフレームワークを提案する。
領域適応とモデルロバスト性を優先し,不確実性を考慮し,画像分類性能の向上を図る。
このフレームワークは、HAM10000モデルと比較して9.95%の改善を示す90.38%という高いカバレッジ率を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:28:43 GMT)
Fine-tuning Large Language Models for Entity Matching [3.7] 生成型大規模言語モデル(LLM)は、エンティティマッチングのための事前訓練された言語モデルに代わる有望な代替品である。
本稿では,エンティティマッチングのための微調整LDMの可能性について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:10:06 GMT)
Depth-Weighted Detection of Behaviours of Risk in People with Dementia using Cameras [3.7] 認知症の行動・心理的症状、例えば扇動や攻撃といった症状は、在宅ケアの環境において重大な健康・安全リスクを生じさせる。
医療施設は公共空間のデジタル監視のためにビデオカメラを設置しており、リスク検出システムの自動動作を開発するために利用することができる。
前回の研究の課題の1つは、距離による事象の重要性の相違による誤報の存在であった。
我々は,カメラの近距離と遠距離の両方で発生する事象に匹敵する重要性を示すために,新たに深度重み付き損失を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:26:50 GMT)
Keep Security! Benchmarking Security Policy Preservation in Large Language Model Contexts Against Indirect Attacks in Question Answering [3.6] 大規模言語モデル(LLM)は、企業や政府のような機密性の高いドメインにますますデプロイされている。
我々は,質問応答における文脈的非開示ポリシーに対するLCMの適合性を評価する,新しい大規模ベンチマークデータセットであるCoPrivaを紹介した。
私たちはベンチマークで10個のLSMを評価し、重大な脆弱性を明らかにします。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:58:11 GMT)
How Do Large Vision-Language Models See Text in Image? Unveiling the Distinctive Role of OCR Heads [3.6] 光文字認識ヘッド(OCRヘッド)と呼ばれる画像からテキストを認識するための頭部を特定する。
1)少ないスパース:以前の検索ヘッドとは異なり、画像からテキスト情報を抽出するために多数のヘッドが活性化される。
我々は,OCRと従来の検索ヘッドの両方にCoT(Chain-of-Thought)を適用し,これらのヘッドをマスキングすることで,下流タスクにおける知見を検証した。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:53:41 GMT)
What is Cognitive Computing? An Architecture and State of The Art [3.6] 認知コンピューティング(COC)は、リアルタイムに応答する計算資源の少ない高い認知マシンを構築することを目的としている。
本稿では,COCに関する文献を無数の統計的解析手法を用いて分析し,COCのアーキテクチャを提案する。
研究によると、認知計算の構造を包括的に補完する、Von-Neuman、Neuromorphic Engineering、Quantum Computingの3つの下層コンピューティングパラダイムが存在することがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:13:18 GMT)
Projection-Based Correction for Enhancing Deep Inverse Networks [3.6] 本稿では,深い逆ネットワークの推論を強化するため,プロジェクションに基づく補正手法を提案する。
理論的には、回復モデルが十分に訓練された深い逆ネットワークであれば、その解はレンジ空間とヌル空間の構成要素に分解できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:28:14 GMT)
Khan-GCL: Kolmogorov-Arnold Network Based Graph Contrastive Learning with Hard Negatives [3.4] Khan-GCL は Kolmogorov-Arnold Network (KAN) を GCL エンコーダアーキテクチャに統合する新しいフレームワークである。
我々は、KAN係数パラメータ内に埋め込まれたリッチな情報を利用して、2つの新しい重要な特徴識別技術を開発した。
これらの手法により、各グラフ表現に対して意味論的に有意な強陰性サンプルを生成することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:54:18 GMT)
Causal LLM Routing: End-to-End Regret Minimization from Observational Data [3.4] LLMルーティングは、クエリ毎に最も適切なモデルを選択することを目的としている。
従来のアプローチでは、メトリクスを最初に予測し、モデルがこれらの見積に基づいて選択される、分離された戦略が一般的だった。
観測データから意思決定の後悔を最小化してルーティングポリシーを学習する因果的エンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:34:18 GMT)
Exploring LLM-Generated Feedback for Economics Essays: How Teaching Assistants Evaluate and Envision Its Use [3.3] 本研究は,AIによるフィードバックを人的インストラクターのフィードバック提供の迅速化と向上のための提案として活用する可能性を検討する。
学生のエッセイからフィードバックを得られるフィードバックエンジンを開発した。
我々は、20回の1時間のセッションで5つのTAでシンクアラウド研究を行い、AIのフィードバックを評価し、手書きのフィードバックとAIのフィードバックを対比させ、もし提案された場合、AIのフィードバックを使ってどのように想定するかを共有した。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:50:30 GMT)
DPO: A Differential and Pointwise Control Approach to Reinforcement Learning [3.3] 連続状態行動空間における強化学習(RL)は、科学計算において依然として困難である。
本稿では,連続時間制御の観点からRLを再構成する新しいフレームワークである差分強化学習(Differential RL)を紹介する。
我々は,局所運動演算子を洗練させる段階的アルゴリズムである微分ポリシー最適化(DPO)を開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:15:48 GMT)
In-Domain African Languages Translation Using LLMs and Multi-armed Bandits [3.2] 本稿では,帯域幅に基づくアルゴリズムを用いて,与えられた領域に対して最適なNMTモデルを選択する方法を検討する。
提案手法は,信頼性の高い最適モデル選択を容易にすることにより,資源制約を効果的に解決する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:33:27 GMT)
ABPT: Amended Backpropagation through Time with Partially Differentiable Rewards [3.2] クアドロター制御ポリシーは、報酬の正確な勾配を使って高い性能で訓練することができる。
部分的に微分可能な報酬は、訓練性能を低下させるバイアス付き勾配伝播をもたらす。
本稿では,BPTTのトレーニング効率を維持しつつ,勾配バイアスを緩和する手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:27:06 GMT)
Hybrid Audio Detection Using Fine-Tuned Audio Spectrogram Transformers: A Dataset-Driven Evaluation of Mixed AI-Human Speech [3.2] 我々は、人間、AI生成、クローン化、混合オーディオサンプルを組み込んだ、新しいハイブリッドオーディオデータセットを構築した。
本手法は, 混合音響検出において既存のベースラインを著しく上回り, 97%の分類精度を達成している。
本研究は,音声認識システムの堅牢性向上におけるハイブリッドデータセットと調整モデルの重要性を強調した。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:43:41 GMT)
Direct reconstruction of the quantum density matrix elements with classical shadow tomography [3.2] 従来のシャドウトモグラフィーを用いて、未知の量子状態の多重密度行列要素を再構成するための直接推定フレームワークを提案する。
我々は (K) 対角行列要素を加法誤差 (epsilon) まで推定するには (mathcalO(log K/epsilon2) サンプルのみが必要であることを証明した。
フルステートトモグラフィに拡張すると,サンプルの複雑さ (mathcalO(d3 log d/)) を伴うトレース距離誤差 (le epsilon) が得られる。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:19:39 GMT)
Learning with Differentially Private (Sliced) Wasserstein Gradients [3.2] 本稿では,データ依存的経験的尺度間のワッサーシュタイン距離に依存する目的をプライベートに最適化するための新しい枠組みを提案する。
我々の主要な理論的貢献は、ワッサーシュタイン勾配を完全に離散的に明示的に定式化することに基づいている。
本研究では,有限サム構造を持つ問題に対するDP学習を目的とした,勾配とアクティベーションのクリッピングを取り入れたディープラーニング手法を開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:01:30 GMT)
Mesh-free sparse identification of nonlinear dynamics [3.1] メッシュフリーなSINDyは高いノイズレベルと限られたデータに対して、計算効率を保ちながら頑健であることを示す。
本稿では,バーガーズ方程式,熱方程式,コルテヴェーグ・デ・ブリーズ方程式,および2次元対流拡散方程式を含む一連のPDEに対して有効性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:18:37 GMT)
MRAG: A Modular Retrieval Framework for Time-Sensitive Question Answering [3.1] 大規模言語モデル(LLM)を用いた質問応答システムにおいて,時間的関係と応答時間に敏感な質問
我々は、時間的摂動と金のエビデンスラベルを組み込むことで、既存のデータセットを再利用するTempRAGEvalベンチマークを導入する。
TempRAGEvalでは、MRAGが検索性能においてベースラインレトリバーを著しく上回り、最終回答精度がさらに向上した。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:40:11 GMT)
REMS: a unified solution representation, problem modeling and metaheuristic algorithm design for general combinatorial optimization problems [3.1] 離散変数と有限探索空間を持つ組合せ最適化問題(COP)は、多くの分野において重要な問題である。
リソース中心モデリングおよび問題解決フレームワーク(REMS)を初めて紹介する。
REMSはこれらのCOPを統一パラダイム内でモデル化し、設計したメタヒューリスティックアルゴリズムで効果的に解決することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:21:58 GMT)
HOPSE: Scalable Higher-Order Positional and Structural Encoder for Combinatorial Representations [3.0] HOPSEは、Hasseグラフ分解を用いて効率的なエンコーディングを導出する表現力のあるエンフェセージパスフリーフレームワークである。
実験によると、HOPSEは最先端のパフォーマンスと一致または超え、最大7ドルのスケーラブルなスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:47:40 GMT)
A Survey of Pathology Foundation Model: Progress and Future Directions [3.0] コンピュータ病理学では、自動がん診断のためにスライド画像全体を解析する。
最近の病理基盤モデル (PFM) は, 大規模な病理組織学的データに基づいて, 抽出器と凝集器の双方を大幅に強化している。
PFMを組織する階層的な分類法を,任意の領域の基盤モデル解析に適用可能なトップダウンの哲学を通じて提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:27:37 GMT)
Merge to Mix: Mixing Datasets via Model Merging [3.0] 大規模モデル(LM)を微調整するためのデータセットの混合は、下流タスクのパフォーマンスを最大化するために重要になっている。
モデルマージによるデータセットの合成を高速化する新しい手法であるtextitMerge to Mix$を提案する。
実験により、Merge to Mixは、微調整LMのためのデータセット選択において最先端の手法を超越していることが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:34:13 GMT)
Set-LLM: A Permutation-Invariant LLM [3.0] 本論文は,大規模言語モデル(LLM)の順序感度という,特定の脆弱性によって動機付けられている。
本研究では,事前学習型LLMに対する新しいアーキテクチャ適応であるSet-LLMを導入し,置換不変性を保証する混合集合文入力の処理を可能にする。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:14:26 GMT)
Image-to-Image Translation with Diffusion Transformers and CLIP-Based Image Conditioning [3.0] Diffusion Transformers (DiT) は画像から画像への変換のための拡散ベースのフレームワークである。
DiTは拡散モデルのデノナイジング能力と変換器のグローバルなモデリング能力を組み合わせる。
実際の顔を漫画風のイラストに翻訳する face2comics と、エッジマップをリアルなシューズイメージに変換する edges2shoe の2つのベンチマークデータセットに対するアプローチを検証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:37:33 GMT)
Neural Quantum Digital Twins for Optimizing Quantum Annealing [2.9] 量子多体系のエネルギー景観を再構築するニューラル量子ディジタルツイン(NQDT)フレームワークを提案する。
NQDTは量子臨界性や相転移を含む重要な量子現象を正確に捉えている。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:38:55 GMT)
Nek Minit: Harnessing Pragmatic Metacognitive Prompting for Explainable Sarcasm Detection of Australian and Indian English [2.9] サルカズムは、述べられた感情と暗示された感情の間に矛盾があるため、感情分析への挑戦である。
PMP(Pragmatic Metacognitive prompting)は、実用的推論に使用される認知にインスパイアされた技法である。
オーストラリア英語とインド英語のSarcasm検出にPMPを用いた。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:34:22 GMT)
How to Construct Random Unitaries [2.8] 量子セキュアな片方向関数が存在すると仮定して、PRUが存在することを証明する。
本研究では,Haar-randomユニタリに対するクエリを量子コンピュータ上で効率的にシミュレートできることを証明した。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:26:16 GMT)
Non-rigid Motion Correction for MRI Reconstruction via Coarse-To-Fine Diffusion Models [2.8] モーションアーティファクトは診断ユーティリティ、特にダイナミックイメージングに妥協する可能性がある。
そこで本稿では, ベスパイク拡散モデルを用いて, 動乱k空間データを共同で再構成し, 補正する, 交代最小化フレームワークを提案する。
実世界の心臓MRIデータセットと複雑なシミュレートされた剛性変形と非剛性変形の両方に対して,本手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:27:21 GMT)
I Can't Believe It's Not Real: CV-MuSeNet: Complex-Valued Multi-Signal Segmentation [2.8] 認知無線システムは、ニューラルネットワークにおける最近のイノベーションの助けを借りて、ダイナミックスペクトルアクセスを可能にする。
従来の実数値ニューラルネットワーク(RVNN)は、低信号対雑音比(SNR)環境では困難に直面している。
この研究は、広帯域スペクトルセンシングのための複素値多重信号分割ネットワークであるCMuSeNetを提示する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:08:02 GMT)
A Review of Pseudo-Labeling for Computer Vision [2.8] ディープニューラルネットワークは、しばしば効果的に一般化するためにラベル付きサンプルの大きなデータセットを必要とする。
活発な研究の重要な領域は半教師あり学習であり、代わりに大量の(容易に取得された)未ラベルのサンプルを使おうとする。
本研究では,自己監督手法と教師なし手法の両方において,擬似ラベルのより広範な解釈について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:28:25 GMT)
Improving planning and MBRL with temporally-extended actions [2.8] 連続時間システムは離散時間力学を用いてモデル化されることが多いが、精度を維持するには小さなシミュレーションステップが必要である。
モデルフリー強化学習における従来の研究は、個別の行動期間を決定するためにポリシーを学習するアクションリピートを用いて、この問題に部分的に対処してきた。
本稿では、時間的に拡張されたアクションを使用して、連続的な決定時間を直接制御し、プランナーが追加の最適化変数としてアクションの持続時間を扱わせることを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:59:32 GMT)
Towards Machine-Generated Code for the Resolution of User Intentions [2.8] AIの出現は、モデル生成コードのデプロイを通じて、ユーザが提供する意図解決のシフトを示唆する可能性がある。
本稿では,具体的なユーザ意図で LLM をプロンプトするコード生成による生成と実行の実現可能性について検討する。
本稿では,ユーザ意図,結果のコード,実行の詳細な分析と比較を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:55:40 GMT)
Impact of Data Sparsity on Machine Learning for Fault Detection in Power System Protection [2.8] 再生可能エネルギーベースの電力システムへのドイツの移行は、グリッドの運用を再構築し、分散発電を管理するために高度な監視と制御を必要としている。
機械学習(ML)は、特に送電網における故障検出(FD)と故障線識別(FLI)のために、電力システム保護のための強力なツールとして登場した。
センサ障害、通信障害、サンプリングレートの削減によるデータの分散は、MLベースのFDとFLIにとって課題となる。
MLに基づくFDとFLIの性能に及ぼすデータ分散度の影響を評価するためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:17:58 GMT)
Learning from Algorithm Feedback: One-Shot SAT Solver Guidance with GNNs [2.7] この研究は、グラフニューラルネットワーク(GNN)を用いたSATソルバ分岐をガイドするパラダイムとして、RLAF(Reinforcement Learning from Algorithm Feedback)を導入している。
RLAFを訓練したポリシーは、多様なSAT問題分布にまたがる様々なベースソルバの平均解時間を著しく削減し、場合によっては2倍以上のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:07:08 GMT)
Likelihood Variance as Text Importance for Resampling Texts to Map Language Models [2.6] 本稿では,各テキストのモデル間でのログ類似度の違いに比例した重み付き重要なテキストを選択する再サンプリング手法を提案する。
提案手法は,KL分散推定の精度を保ちながら,必要なテキスト数を大幅に削減する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:10:40 GMT)
The Landau-Feynman transiently open quantum system: entanglement and density operators [2.6] 私たちがランダウ=ファインマン(Landau-Feynman)と呼ぶ状況について、いまだに混乱が続いている。
本論文の目的は,ランドー=ファインマンの状況に直面するとき,適切な概念が混在状態のものではないことを強調することである。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:13:36 GMT)
Exploring the Delocalization of Dark States in a Multimode Optical Cavity [2.6] 実験装置の三次元特性を考慮した多モードキャビティにおける分子の暗黒状態の非局在化について検討した。
我々の研究は、特定の現象に対して、強い光と物質を結合した暗黒状態を理解するには、光空洞の適切な多重モード記述が必要であることを示唆している。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:19:50 GMT)
"I will never pay for this" Perception of fairness and factors affecting behaviour on 'pay-or-ok' models [2.6] 本研究は,クッキーペイウォールに対する利用者の認識,公平性判断,支払を検討するための条件について検討した。
私たちの発見は、プライバシーとデータ保護が基本的権利よりも特権になるかもしれない経済排除に関する懸念を提起します。
これらの懸念に対処するため、透明性を高め、強制力を減らし、有料コンテンツの価値を確実にし、包括的代替策を探る、ユーザ中心のアプローチを推奨する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:14:54 GMT)
Learning Fourier series with parametrized quantum circuits [2.5] 変分量子アルゴリズム(VQA)とそのパラメタライズド量子回路(PQC)による量子機械学習分野への応用は、ノイズの多い中間スケール量子コンピューティングデバイスを活用する主要な方法の1つであると考えられている。
本稿では,PQC においてよく使われているアンス・アゼが,異なる一次元のトランケートされたフーリエ級数を学ぶかを比較することによって,Schuld らの研究に基づいて構築する。
また、Beerらが導入した散逸性量子ニューラルネットワーク(dQNN)についても検討し、その能力を高めるために、dQNNのデータ再ロード構造を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:32:20 GMT)
A Generative Diffusion Model to Solve Inverse Problems for Robust in-NICU Neonatal MRI [2.5] 新生児集中治療室(NICU)におけるMRI(MRI)の初回取得・診断拡散生成モデルについて紹介する。
In-NICU MRIスキャナーは、脳の潜在的な異常を非侵襲的に評価するために、低磁場強度の永久磁石を利用する。
この設定では、トレーニングデータのサイズは小さく、本質的には低信号対雑音比(SNR)に悩まされている。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:36:11 GMT)
The Devil is in Fine-tuning and Long-tailed Problems:A New Benchmark for Scene Text Detection [2.5] シーンテキスト検出手法は、現実のシナリオでこのような成功を再現できないことが多い。
この相違に寄与する2つの重要な要因を、広範な実験を通して明らかにした。
本稿では,様々な長期課題に対処する能力を評価するために,Long-Tailed Benchmark (LTB)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:26:46 GMT)
Physics-based machine learning for mantle convection simulations [2.5] 本研究では,温度を保ちながら温度の関数としてクリープ流速度を予測する機械学習手法を提案する。
有限体積ソルバは予測速度を用いて次の時間に温度場を拡散させ、推論時の自己回帰ロールアウトを可能にする。
全体として、我々のモデルは数値解法よりも89倍高速である。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:47:43 GMT)
Improving the fact-checking performance of language models by relying on their entailment ability [2.5] 現在のファクトチェックアプローチは、言語モデルの組み込み知識に依存している。
本稿では,言語モデルの包含と生成能力に依存する,シンプルで効果的な手法を提案する。
これらの正当化に基づいて言語モデルを訓練し、優れた結果を得た。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:15:06 GMT)
seg_3D_by_PC2D: Multi-View Projection for Domain Generalization and Adaptation in 3D Semantic Segmentation [2.5] 3Dセマンティックセグメンテーションは、自動運転と道路インフラ分析において重要な役割を果たす。
ドメイン一般化(DG)と教師なしドメイン適応(UDA)を両立させる新しい多視点プロジェクションフレームワークを提案する。
UDAでは最先端の成果が得られ、DGでは最先端の成果に近づき、特に大規模で静的なクラスでは大きな利益が得られます。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:08:42 GMT)
Revealing Language Model Trajectories via Kullback-Leibler Divergence [2.4] KLの発散によって測定された言語モデルの軌跡は、事前学習中に渦巻き構造を示し、層間におけるスレッドのような進行が進行することを示す。
拡散指数の観点では、対数様空間のモデル軌道は重み空間のモデルよりもより制約される。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:27:54 GMT)
Enhancing Certified Robustness via Block Reflector Orthogonal Layers and Logit Annealing Loss [2.4] リプシッツニューラルネットワークは、ディープラーニングにおいて証明された堅牢性を提供することでよく知られている。
我々は、より表現力のあるリプシッツニューラルネットワーク構築における直交層の性能を高める、新しい効率的なブロック直交層(BRO)を提案する。
BRO層と損失関数を用いることで、最先端の証明されたロバスト性を実現する、シンプルだが効果的なリプシッツニューラルネットワークであるBRONetを設計する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:44:51 GMT)
Helpful assistant or fruitful facilitator? Investigating how personas affect language model behavior [2.4] 大きな言語モデル(LLM)から世代をパーソナライズし、ステアリングする方法の1つは、ペルソナを割り当てることである。
本稿では,ペルソナがモデル行動の多様な側面に与える影響について考察する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:52:49 GMT)
An Asymptotic Equation Linking WAIC and WBIC in Singular Models [2.4] 統計的学習において、モデルはパラメータから確率分布への写像が射影的であるかどうかによって、正規または特異に分類される。
階層構造や潜伏変数を持つほとんどのモデルは特異であり、従来の基準は確率と後部の正規近似の分解のために適用できない。
この理論的な貢献は、特異モデルにおけるモデル選択の計算効率における将来の発展の基礎となる。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:10:20 GMT)
4,500 Seconds: Small Data Training Approaches for Deep UAV Audio Classification [2.3] 本研究では,UAV分類における深層学習のアプローチについて,データ不足の重要な問題に着目して検討する。
合計4,500秒のオーディオサンプルを使用してモデルをトレーニングし、9クラスのデータセットに均等に分散する。
我々は、畳み込みニューラルネットワーク(CNN)とアテンションベースのトランスフォーマーの使用を比較した。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:34:07 GMT)
15,500 Seconds: Lean UAV Classification Leveraging PEFT and Pre-Trained Networks [2.3] 無人航空機(UAV)は、消費者と軍事用UAVの市場が拡大するにつれて、セキュリティ上の懸念がエスカレートする。
本稿では,UAV音声分類における重要データ不足問題に対処する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:53:19 GMT)
AllMetrics: A Unified Python Library for Standardized Metric Evaluation and Robust Data Validation in Machine Learning [2.3] さまざまな機械学習タスクのメトリクス評価を標準化するために設計された,オープンソースの統一PythonライブラリであるAllMetricsを紹介した。
このライブラリは、すべてのユースケースをカバーするパラメータを通して、マルチクラスタスクのクラス固有のレポートを実装している。
医療、金融、不動産といった分野のさまざまなデータセットを私たちのライブラリに適用し、Python、Matlab、Rコンポーネントと比較しました。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:36:05 GMT)
Inter-Subject Variance Transfer Learning for EMG Pattern Classification Based on Bayesian Inference [2.2] 筋電図に基づく運動認識では、被験者固有の分類器が十分なラベル付きデータで訓練されるのが一般的である。
本稿では,ベイズ的手法に基づく物体間分散伝達学習法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:18:39 GMT)
Large Language Model-Powered Agent for C to Rust Code Translation [2.2] 現代のシステムプログラミング言語であるRustは、C言語に代わるメモリセーフな代替言語として登場した。
C-to-Rust翻訳のエージェント能力の適用は、異なる課題をもたらす。
数学や常識 QA とは異なり、C-to-Rust に必要な中間ステップは十分に定義されていない。
我々は、新しい中間ステップ、仮想ファジィングに基づく等価テスト(VFT)、エージェント計画フレームワーク、LLMを利用したC-to-Rustコード翻訳のためのエージェント(LAC2R)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:26:23 GMT)
BR-TaxQA-R: A Dataset for Question Answering with References for Brazilian Personal Income Tax Law, including case law [2.1] このデータセットには、ブラジル内国歳入庁が発行した2024年の公式Q&A文書から715の質問が含まれている。
検索用OpenAI埋め込みと応答生成用GPT-4o-miniを用いた検索用RAGパイプラインを実装した。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:11:41 GMT)
Effective Learning with Node Perturbation in Multi-Layer Neural Networks [2.1] バックプロパゲーション(BP)は、ディープニューラルネットワークモデルのパラメータをトレーニングするための支配的かつ最も成功した方法である。
NPは、ネットワークアクティベーションへのノイズ注入による学習を提案する。
NPはデータ非効率であり、ノイズベースの探索プロセスのため不安定である。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:01:54 GMT)
An Empirical Bayes Analysis of Object Trajectory Representation Models [2.1] 本稿では,物体軌道のモデル化におけるモデル複雑性と適合誤差のトレードオフについて,詳細な実験的検討を行った。
この結果から, 線形モデルは高忠実度な実世界の軌道を表現し, 非常に適度なモデル複雑性を示すことがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:43:11 GMT)
Evolutionary Computation and Large Language Models: A Survey of Methods, Synergies, and Applications [2.1] 大規模言語モデル (LLM) と進化的計算 (EC) は、人工知能を進化させるための有望な道の1つである。
本書は, LLMとECの相乗的ポテンシャルを考察し, 交点, 相補的強み, 新興アプリケーションについて概説する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:48:28 GMT)
Aggregation Schemes for Single-Vector WSI Representation Learning in Digital Pathology [2.0] 計算病理学においてWSI(Whole Slide Images)を効率的に統合するための重要なステップは、1つの高品質な特徴ベクトル、すなわち1つの埋め込みを各WSIに割り当てることである。
本稿では,最近開発された複数の集約手法のWSI検索性能を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:05:27 GMT)
Developing clinical informatics to support direct care and population health management: the VIEWER story [2.0] VIEWERは、患者の直接ケアと人口健康管理を強化するために設計された臨床情報プラットフォームである。
本稿では、イギリスのメンタルヘルス・ナショナル・ヘルス・サービス・ファンデーション・トラストにおけるVIEWERの開発と実践について述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:39:58 GMT)
Efficient Deep Learning with Decorrelated Backpropagation [2.0] 深層畳み込みニューラルネットワークのより効率的なトレーニングは、Decorrelated backpropagationを学習のメカニズムとして受け入れることによって実現可能であることを示す。
我々は、50層ResNetモデルまで複数の深層ネットワークをトレーニングする際に、バックプロパゲーションと比較して、2倍以上のスピードアップと高いテスト精度を達成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:02:12 GMT)
Recognition of Unseen Combined Motions via Convex Combination-based EMG Pattern Synthesis for Myoelectric Control [2.0] 本稿では,合成筋電図データを用いて協調動作を効率よく認識する手法を提案する。
実験結果から,提案手法は未確認複合動作の分類精度を約17%向上した。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:46:26 GMT)
EEG-Based Inter-Patient Epileptic Seizure Detection Combining Domain Adversarial Training with CNN-BiLSTM Network [2.0] 畳み込みニューラルネットワーク(CNN)と双方向長短期記憶(BiLSTM)を併用したドメイン逆行訓練の検知フレームワークを提案する。
局所てんかん20例の脳波記録による評価は,非逆行法よりも優れていた。
対人訓練と時間的モデリングの統合により、堅牢な患者間発作検出が可能となる。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:27:55 GMT)
Unsupervised Log Anomaly Detection with Few Unique Tokens [1.9] 本稿では,欧州XFEL加速器の制御系ノードからログデータの異常を検出する新しい手法を提案する。
確率比に基づいて個々のログエントリをスコアリングすることで異常を識別する。
高いスコアは、ノードのルーチンの振る舞いから逸脱する潜在的な異常を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:21:20 GMT)
Protoknowledge Shapes Behaviour of LLMs in Downstream Tasks: Memorization and Generalization with Knowledge Graphs [1.9] 本稿では,知識グラフを符号化したトークンのシーケンスが事前学習中に内部化される方法の定式化と測定を行うために,protoknowledgeの概念を導入する。
我々は,アクティベートが必要な知識の種類によって異なる,語彙的,階層的,トポロジ的な形式に分類する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:22:34 GMT)
OpenEthics: A Comprehensive Ethical Evaluation of Open-Source Generative Large Language Models [1.9] 生成可能な大規模言語モデルは大きな可能性を秘めているが、批判的な倫理的懸念も引き起こす。
我々は、新しいデータ収集を用いて、29のオープンソース大規模言語モデルの幅広い倫理的評価を行う。
我々は、一般的に使われている言語、英語、低リソース言語、トルコ語のモデル行動を分析する。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:31:35 GMT)
Generative AI for Autonomous Driving: A Review [1.9] 本研究では, 静的マップ生成, 動的シナリオ生成, 軌道予測, 車両の運動計画など, 生成モデルが自動車のタスクを向上する方法について検討する。
本稿では,安全性,解釈可能性,リアルタイム性,画像生成,動的シナリオ生成,計画の3つの課題について論じる。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:59:18 GMT)
CodeSSM: Towards State Space Models for Code Understanding [1.9] 状態空間モデル(SSM)は、コード理解タスクのためのトランスフォーマーの潜在的な代替品である。
SSMはトランスよりも計算効率が高い。
また,SSMはよりサンプリング効率が高く,より長いコンテキストに効果的に外挿できることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:24:04 GMT)
Trends and Challenges in Authorship Analysis: A Review of ML, DL, and LLM Approaches [1.9] 著者分析は、法医学言語学、アカデミア、サイバーセキュリティ、デジタルコンテンツ認証など、様々な領域で重要な役割を果たしている。
本稿では,著者分析の2つの重要なサブタスクである著者属性と著者検証について,体系的な文献レビューを行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:06:08 GMT)
Augmenting Chest X-ray Datasets with Non-Expert Annotations [1.9] 非専門的アノテーションを組み込むことで,2つの公開胸部X線データセットを強化する。
専門家ラベルによく一般化する非専門アノテーションで胸部ドレイン検出器を訓練する。
本研究は,基礎的真理アノテーションの品質に対する意識を高めるための病理学的合意研究である。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:08:16 GMT)
MIRACL-VISION: A Large, multilingual, visual document retrieval benchmark [1.8] MIRACL-VISIONは多言語視覚文書評価評価ベンチマークである。
MIRACL-VISIONは18の言語をカバーし、MIRACLデータセットの拡張である。
我々は,多言語機能に対する最先端のVLMベースの埋め込みモデルのギャップを観察する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:26:12 GMT)
AdUE: Improving uncertainty estimation head for LoRA adapters in LLMs [1.8] 本稿では,AdUE1を提案する。AdUE1は,ソフトマックスに基づく評価を改善するための,効率的なポストホック不確実性推定(UE)手法である。
私たちのアプローチは軽量(ベースモデルの変更なし)で、よりキャリブレーションの高い信頼性を実現しています。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:23:40 GMT)
Semantic-based Unsupervised Framing Analysis (SUFA): A Novel Approach for Computational Framing Analysis [1.8] 本研究はセマンティック・リレーショナル・ベース・アントラクショナル・フレーミング・アナリシス(SUFA)と呼ばれる計算フレーミング・アナリシスに対する新しいアプローチを提案する。
SUFAは、セマンティックリレーションと依存性解析アルゴリズムを利用して、ニュースメディアレポートにおいてエンティティ中心の強調フレームを特定し評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:19:22 GMT)
Towards Safer Pretraining: Analyzing and Filtering Harmful Content in Webscale datasets for Responsible LLMs [1.7] 大規模言語モデル(LLM)は、Common Crawl、C4、FineWebといった大規模なWebソースデータセットを事前トレーニングに活用して、さまざまな現実世界のアプリケーションに不可欠なものになっている。
このようなフィルタリングされていないデータに対するLCMの訓練は、有害な行動の継続、誤報の拡散、社会的偏見の増幅といったリスクを負う。
本稿では,これらのデータセットにまたがる不適切なコンテンツを大規模に分析し,有害なWebページをその意図に基づいてトピカル・トキシックに分類する包括的分類法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:50:54 GMT)
VoteMate: A Decentralized Application for Scalable Electronic Voting on EVM-Based Blockchain [1.7] 大規模な選挙を操作するために、単一の脆弱性が悪用される可能性がある。
システムは安全だが、透明性と機密性の欠如がある。
暗号レイヤを追加することで、投票者の機密性も確保できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:50:18 GMT)
Visual Question Answering on Multiple Remote Sensing Image Modalities [1.7] リモートセンシングのような多くの分野において、視覚的特徴抽出のステップは、異なる画像のモダリティを活用することで大きな恩恵を受けることができる。
TAMMIと呼ばれる新しいVQAデータセットを導入し、3つの異なるモードで記述されたシーンについて多様な質問を行う。
また,視覚言語変換器であるVisualBERTをベースとしたMM-RSVQAモデルを提案し,複数の画像のモダリティとテキストを効果的に組み合わせた。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:42:47 GMT)
Holstein mechanism in single-site model with unitary evolution [1.7] 単体進化を持つ単一電子(一部位)系におけるホルスタイン機構を考える。
ユニタリダイナミクスとボソン周波数依存性は、量子相転移の証拠となる。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:08:08 GMT)
A packing lemma for VCN${}_k$-dimension and learning high-dimensional data [1.6] 本研究では,非認識型高アリティPAC学習性は,Husslerパッケージ特性の高アリティバージョンを意味することを示す。
これは古典的なPAC学習性は古典的なハウスラーパッキング特性を意味するという直接的な証明を得ることによってなされる。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:03:12 GMT)
Deep Learning for Continuous-time Stochastic Control with Jumps [1.6] 本研究では,ジャンプによる有限水平連続時間制御問題を解くためのモデルに基づくディープラーニング手法を提案する。
我々は2つのニューラルネットワークを反復的に訓練する: 1つは最適ポリシーを表現するもので、もう1つは値関数を近似するものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:57:39 GMT)
Stroke Disease Classification Using Machine Learning with Feature Selection Techniques [1.6] 心臓病は世界中で致死率と死亡率の主要な原因である。
我々は,心臓病の分類を高度化するための特徴選択技術を備えた新しい投票システムを開発した。
XGBoostは、99%の精度、F1スコア、98%のリコール、100%のROC AUCを達成した。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:42:15 GMT)
Initialisation and Network Effects in Decentralised Federated Learning [1.6] 分散フェデレーション学習は、通信デバイスの分散ネットワーク上で、個々の機械学習モデルの協調トレーニングを可能にする。
このアプローチは、集中的な調整を避け、データのプライバシを高め、単一障害点のリスクを取り除く。
本稿では,基盤となる通信ネットワークの固有ベクトル集中度分布に基づく,ニューラルネットワークの非協調初期化戦略を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:25:18 GMT)
MambaFlow: A Mamba-Centric Architecture for End-to-End Optical Flow Estimation [1.6] MambaFlowは,Mambaアーキテクチャの精度と効率性を活用するために設計された,新しいフレームワークである。
MambaFlowは、エンドツーエンドの光学フロー推定において、グローバル情報を保存しながら、ローカルに関連付けられた特徴をキャプチャする。
Sintelベンチマークでは、MambaFlowは1.43のエラーエンドポイント(EPE)と0.113秒の推論速度を記録している。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:31:14 GMT)
Transparency in Healthcare AI: Testing European Regulatory Provisions against Users' Transparency Needs [1.6] 欧州連合(EU)では、医療はAIのリスクの高いアプリケーション分野である。
IFU(Instructions for Use)は、ユーザに対して明確かつ関連性を持たなければならない。
本研究は, 後者の要件がIFU構造によって満たされるかどうかを検証した。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:34:05 GMT)
Objective Bicycle Occlusion Level Classification using a Deformable Parts-Based Model [1.6] 道路安全は、特に最も脆弱な道路利用者であるサイクリストにとって重要な課題である。
本研究では,高度なコンピュータビジョン技術を用いた自転車閉塞レベル分類のための新しいベンチマークを提案する。
提案手法を広範に使用することで,閉塞したサイクリストに対するサイクリスト検出アルゴリズムの正確な性能報告が容易になる。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:42:41 GMT)
Leveraging Foundation Models for Multimodal Graph-Based Action Recognition [1.5] 動的視覚符号化のためのビデオMAEとコンテキストテキスト埋め込みのためのBERTを統合したグラフベースのフレームワークを提案する。
提案手法は,多様なベンチマークデータセット上で,最先端のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:15:14 GMT)
SCENIR: Visual Semantic Clarity through Unsupervised Scene Graph Retrieval [1.5] 本稿では,グラフオートエンコーダに基づく教師なし検索フレームワークSCENIRを提案する。
提案モデルは,既存のビジョンベース,マルチモーダル,教師付きGNNアプローチよりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:56:09 GMT)
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model [1.5] 本研究では、アクセス可能なオンラインデータを活用することで、小規模言語モデルにおける医療知識の強化について検討する。
我々は、キュレートされたデータを用いてベースラインモデルを微調整し、その医療的知識を改善した。
ベンチマーク評価により, 微調整モデルにより, 医療質問応答の精度が向上することが示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:30:47 GMT)
Enrich the content of the image Using Context-Aware Copy Paste [1.5] 本稿では,By Latent Information Propagation (BLIP) を組み込んだコンテキスト認識手法を提案する。
抽出したコンテンツ情報とカテゴリ情報とをマッチングすることにより,Segment Anything Model (SAM) と You Only Look Once (YOLO) を用いて対象物の密結合性を確保する。
各種データセットを対象とした実験により,データ多様性の向上と高品質な擬似画像の生成において,本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:05:17 GMT)
My Face Is Mine, Not Yours: Facial Protection Against Diffusion Model Face Swapping [1.3] 拡散に基づくディープフェイク技術は、無許可で非倫理的な顔画像操作に重大なリスクをもたらす。
本稿では,顔画像の早期保護を目的とした対人攻撃による新たな防御戦略を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:07:46 GMT)
Positive Moments Forever: Undecidable and Decidable Cases [1.3] ユニタリおよび実固有値行列に対する決定可能性およびある種の可換環および非可換環に対する決定性を示す。
また、ポリアの定理の自由版も証明する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:58:52 GMT)
A Linear Approach to Data Poisoning [1.3] 機械学習モデルにおけるデータ中毒攻撃の理論的基礎について検討する。
以上の結果から,ヘッセン系は毒素検出の診断ツールとして有用であることが判明した。
ネットワークが汚染されているかどうかを判断する予備アルゴリズムを開発し、さらなるトレーニングを必要としない治療を行う。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:45:06 GMT)
MaxPoolBERT: Enhancing BERT Classification via Layer- and Token-Wise Aggregation [1.3] MaxBERTはレイヤとトークン間で情報を集約することで[BERT]表現を洗練します。
提案手法は,事前学習やモデルサイズを著しく増加させることなく,BERTの分類精度を向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:10:02 GMT)
Versatile Quantum-Safe Hybrid Key Exchange and Its Application to MACsec [1.3] 量子コンピューティングは、現在展開されている暗号に重大な脅威をもたらす。
脅威を和らげるための暗号ビルディングブロックはすでに利用可能です。
アジャイルの防御的アプローチに続き、Hybrid Authenticated Key Exchangeプロトコルが最近注目を集めている。
提案するHAKEプロトコルは VMuckle と呼ばれるプロトコルで,MACsec で LAN 参加者にセキュアな通信を確保するためのハイブリッド鍵材を提供するのに十分柔軟である。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:54:58 GMT)
InTreeger: An End-to-End Framework for Integer-Only Decision Tree Inference [1.2] InTreegerは、トレーニングデータセットを入力として、ツリーベースの機械学習モデルのアーキテクチャに依存しない整数のみのC実装を出力するエンドツーエンドフレームワークである。
このフレームワークは、機械学習の経験のない人でも、高度に最適化された整数のみの分類モデルを生成することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:28:43 GMT)
A First Runtime Analysis of NSGA-III on a Many-Objective Multimodal Problem: Provable Exponential Speedup via Stochastic Population Update [1.2] NSGA-IIIは進化的多目的最適化において顕著なアルゴリズムである。
本稿では,多目的$OJZJfull$ベンチマーク上でNSGA-IIIの厳密なランタイム解析を行う。
NSGA-IIIは, ω(nd/2ln)$ の $mu に対して$mu/nd/2$ の係数で NSGA-II よりも高速であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:20:56 GMT)
A Participatory Strategy for AI Ethics in Education and Rehabilitation grounded in the Capability Approach [1.2] AIは学習経験を高め、生徒に力を与え、教師とリハビリテーション者の両方をサポートする。
しかしながら、それらの使用法は、体系的・生態的なビジョン、倫理的考察、参加研究を必要とする課題を提示する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:45:01 GMT)
Measurement-free quantum error correction optimized for biased noise [1.2] ノイズバイアスのある誤差モデルに最適化された普遍ゲートセットの実装と量子誤り訂正のための無測定プロトコルを導出する。
ノイズバイアスは中性原子プラットフォームに適応し、Rydberg相互作用により2ビットと複数ビットのゲートが実現される。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:46:13 GMT)
FastDraft: How to Train Your Draft [1.2] 我々はFastDraftを紹介します。FastDraftは、ドラフトモデルを任意の大きな言語モデルに事前トレーニングし、調整するための、新しく効率的なアプローチです。
我々は、人気のあるPhi-3-miniとLlama-3.1-8Bモデルの2つの高パラメータ効率ドラフトをトレーニングすることで、FastDraftを実証する。
FastDraftを使って、Intel$circledR$Gaudi$circledR$2アクセラレータを1つのサーバに約100億のトークンを持つドラフトモデルを24時間以内に作成することができました。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:28:22 GMT)
Towards a Working Definition of Designing Generative User Interfaces [1.2] ジェネレーティブUIは、デザイナと計算システム間のAI駆動のコラボレーションを促進することによって、インターフェース設計を変革している。
本研究では,マルチメソッド定性的アプローチによる生成UIの動作定義を確立する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:14:09 GMT)
RLBenchNet: The Right Network for the Right Reinforcement Learning Task [1.2] 強化学習(Reinforcement Learning, RL)は、さまざまなニューラルネットワークアーキテクチャの適用を通じて、大幅な進歩を遂げている。
本稿では,LLタスクにおける複数のニューラルネットワークの性能について検討する。例えば,Long Short-Term Memory (LSTM), Multi-Layer Perceptron (MLP), Mamba/Mamba-2, Transformer-XL, Gated Transformer-XL, Gated Recurrent Unit (GRU)である。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:49:25 GMT)
Impact of Fixing Spins in a Quantum Annealer with Energy Rescaling [1.1] 本研究では,固定スピン,有望なサイズ縮小法,およびエネルギー再スケーリングの影響について検討した。
量子アニール器を用いた数値シミュレーションと実験により、固定スピン法が量子アニール性能を向上させることを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:37:38 GMT)
Clustering and Pruning in Causal Data Fusion [1.1] Do-calculusは因果データ融合のための唯一の汎用ツールである。
本稿では,前処理操作としてプルーニング(不要変数の除去)とクラスタリング(組み合わせ変数)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:44:39 GMT)
Local Clustering for Lung Cancer Image Classification via Sparse Solution Technique [1.1] 重み付きグラフの頂点としてのイメージと,グラフのエッジとしてのイメージの対の類似性について検討する。
私たちのアプローチは、他の最先端のアプローチと比較して、はるかに効率的で、好ましくないか、等しく効果的です。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:14:09 GMT)
Real-Time Stress Monitoring, Detection, and Management in College Students: A Wearable Technology and Machine-Learning Approach [1.0] 大学生はストレス、不安、うつにますます影響を受ける。
本研究は、モバイルヘルス(mHealth)介入、メンタルヘルス評価およびルックアウトプログラム(mHELP)の有効性を評価する。
mHELPは、リアルタイムストレス検出と自己管理のためのスマートウォッチセンサーと機械学習(ML)アルゴリズムを統合している。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:45:42 GMT)
Optimizing Asynchronous Federated Learning: A~Delicate Trade-Off Between Model-Parameter Staleness and Update Frequency [1.0] 我々は、非同期FLアルゴリズムにおける設計選択の影響をよりよく理解するために、モデリングと分析を用いる。
非同期FLを最適化するための基本的なトレードオフを特徴付ける。
これらの最適化は精度を10%から30%向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:55:35 GMT)
On the Robustness of Medical Vision-Language Models: Are they Truly Generalizable? [1.0] 我々は、複数の医療画像データセットに複数の摂動を適用した汚職ベンチマークであるMediMeta-Cを紹介する。
本稿では,事前訓練されたMVLMの視覚的エンコーダ適応であるRobustMedCLIPを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:08:31 GMT)
In the shadow of the Hadamard test: Using the garbage state for good and further modifications [0.9] この作業は、1つの補助的な読み出しキュービット上のアダマールテストと、残りの$n$-qubitのワークレジスタ上の古典的なシャドウを組み合わせる。
そこでは、アダマール検定を用いて補助量子ビット上の固有値を推定し、残りの$n$量子ビット上の古典的影は追加機能へのアクセスを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:06:58 GMT)
Graph Conditional Flow Matching for Relational Data Generation [0.9] 本稿では,外部キー関係によって生成されたグラフから関係データセットの内容を生成する関係データ生成モデルを提案する。
我々は、フローマッチングにより、関係データベース全体の内容の深い生成モデルを学ぶことによって、これを行う。
我々の方法は、複雑な構造を持つ関係データセットをサポートでき、各レコードの生成は、同じ接続されたコンポーネント内の他のレコードの影響を受けられるので、柔軟である。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:45:15 GMT)
An Exploratory Approach Towards Investigating and Explaining Vision Transformer and Transfer Learning for Brain Disease Detection [0.9] 本研究では、視覚変換器(ViT)と伝達学習(TL)モデルを用いて脳疾患の分類を行った。
その結果,ViTは伝達学習モデルを超え,94.39%の分類精度が得られた。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:38:22 GMT)
Improving the Predictability of the Madden-Julian Oscillation at Subseasonal Scales with Gaussian Process Models [0.9] マデン・ジュリアン振動(マデン・ジュリアン・オシレーション、英語: Madden-Julian Oscillation、MJO)は、地球規模の気象パターンを調節する上で重要な役割を担っている気候現象である。
ニューラルネットワークのようなほとんどの機械学習アルゴリズムは、MJO予測における不確実性レベルを直接提供できない。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:40:40 GMT)
Dynamics in the presence of local symmetry-breaking impurities [0.9] 連続対称性は、量子多体系における相関関数の普遍的な緩やかな緩和をもたらす。
局所対称性を破る不純物がこれらの相関関数の力学にブラウン量子回路を用いてどのように影響するかを考察する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:25:14 GMT)
A Matrix Product State Model for Simultaneous Classification and Generation [0.8] 量子機械学習(Quantum Machine Learning, QML)は、量子コンピューティングの原理と機械学習の技法を融合させる、急速に拡大する分野である。
本稿では,MPSモデルを提案する。MPSは分類器とジェネレータの両方として機能する。
我々のコントリビューションは、生成タスクのためのテンソルネットワークメソッドのメカニズムに関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:31:24 GMT)
Spatially scalable recursive estimation of Gaussian process terrain maps using local basis functions [0.8] 非線形地形のオンラインマッピングは、エージェントが以前にマッピングされた領域に戻るときの位置推定を改善するために使用できる。
GPマッピングアルゴリズムは、マッピングされた領域が拡大するにつれて、計算要求が増大している。
提案手法は,地図面積が大きい場合,既存の手法よりも高速であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:11:29 GMT)
PlantDreamer: Achieving Realistic 3D Plant Models with Diffusion-Guided Gaussian Splatting [0.8] 我々は3D合成プラント生成の新しいアプローチであるPlantDreamerを紹介した。
複雑な植物形状やテクスチャに対して、利用可能なテキストから3Dモデルよりも高いレベルのリアリズムを実現することができる。
我々は、その出力を最先端のテキスト・ツー・3Dモデルと比較することで、我々のアプローチを評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:51:57 GMT)
Social Media Harm Abatement: Mechanisms for Transparent Public Health Assessment [0.8] ソーシャルメディアプラットフォームは、広範囲の損害を被ったとして非難され、司法管轄区域で数十件の訴訟が起こされている。
本稿では、虐待を軽減できる収賄・和解計画の実現可能なメカニズムについて概説する。
本稿は、そのようなメカニズムの要件、プライバシーと監視への示唆、そしてそのような手続きが関係するトレードオフについて説明する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:53:25 GMT)
Contrastive Learning-Enhanced Trajectory Matching for Small-Scale Dataset Distillation [0.8] 画像合成におけるコントラスト学習を統合した新しいデータセット蒸留法を提案する。
提案手法は,データセットのサイズが著しく制約された場合でも,より情報的かつ多様な合成サンプルを生成する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:46:29 GMT)
Simulation Agent: A Framework for Integrating Simulation and Large Language Models for Enhanced Decision-Making [0.7] 大規模言語モデル(LLM)は直感的で言語ベースの相互作用を提供するが、複雑な実世界の力学を確実にモデル化するために必要な構造的、因果的理解が欠如している。
シミュレーションモデルとLLMの長所を統合する新しい手法であるシミュレーションエージェントフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:17:07 GMT)
Loss-Guided Auxiliary Agents for Overcoming Mode Collapse in GFlowNets [0.7] Loss-Guided GFlowNets(LGGFN)は、GFlowNetのトレーニング損失によって補助的なGFlowNetが探索される新しいアプローチである。
LGGFNは、ベースラインに比べて探索効率とサンプルの多様性を一貫して向上させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:27:10 GMT)
A Systematic Literature Review of Cyber Security Monitoring in Maritime [0.7] サイバーセキュリティ監視は、自動的な方法でサイバー攻撃をタイムリーに検出することを目的としている。
これまでの研究では、サイバーセキュリティの監視に重点を置いていなかった。
本稿では,海洋分野におけるサイバーセキュリティ監視の今後の研究方針について概説する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:19:44 GMT)
Model Checking the Security of the Lightning Network [0.7] Lightning NetworkはBitcoin用に構築された支払いチャネルネットワークで、すでに使われている。
我々はTLA+でプロトコルを定式化し、正直なユーザーが正しいバランスを取り戻すことが保証されるセキュリティ特性を正式に規定する。
証明を用いて検証する2つの改良ステップを用いて、Lightning Networkのモデルチェックを可能にする。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:22:34 GMT)
Projection Methods for Operator Learning and Universal Approximation [0.7] 任意のバナッハ空間における連続(おそらく非線形)作用素に対する新しい普遍近似定理を得る。
複数の変数の射影に基づくバナッハ空間における演算子学習手法を導入・研究する。
本稿では,演算子学習における深層学習方法論の理論的枠組みとして機能する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:16:50 GMT)
Breast Cancer Classification Using Gradient Boosting Algorithms Focusing on Reducing the False Negative and SHAP for Explainability [0.7] 本研究は,乳がん予測のためのブースティングに基づく各種機械学習アルゴリズムの性能評価に焦点をあてる。
本研究の目的は,AdaBoost,XGBoost,CatBoost,LightGBMといった最先端の促進アルゴリズムを用いて乳癌の予測と診断を行うことである。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:48:31 GMT)
VideoPASTA: 7K Preference Pairs That Matter for Video-LLM Alignment [0.7] ビデオ言語モデル(Video-LLMs)は、ビデオコンテンツを理解するのに優れているが、空間的関係、時間的順序付け、フレーム間の連続性に苦慮している。
対象の選好最適化を通じてビデオLLMを強化するフレームワークであるVideoPASTAを紹介する。
VideoPASTAは、正確なビデオ表現と慎重に作られた敵の例を区別するためにモデルを訓練する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:27:17 GMT)
How Well Can a Long Sequence Model Model Long Sequences? Comparing Architechtural Inductive Biases on Long-Context Abilities [0.7] システム工学の最近の進歩により、拡張コンテキスト長をサポートするために用意されたモデルのスケールアップが可能になった。
このような主張は理論的に聞こえるかもしれないが、実証的に観察される大きな実践的ギャップが残っている。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:53:51 GMT)
Predicting Field Experiments with Large Language Models [0.6] フィールド実験の結果を予測するための自動LLMベースのフレームワークを提案し,評価する。
結果の分布はバイモーダルか高度に歪んでいるかのどちらかであることが判明した。
この異常を更に調査することで、複雑な社会問題に関連するフィールド実験が予測性能に重大な課題をもたらすことが判明した。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:06:29 GMT)
Fault-Tolerant Multi-Robot Coordination with Limited Sensing within Confined Environments [0.6] マルチロボットシステムにおける物理的接触相互作用を利用した新しいフォールトトレランス手法を提案する。
そこで本研究では, ロボットの動作を, 操作不能なロボットに遭遇する可能性に基づいて調整する「アクティブコンタクト応答(ACR)」手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:43:36 GMT)
Q-gen: A Parameterized Quantum Circuit Generator [0.6] 本稿では、15個の現実的量子アルゴリズムを取り入れた高レベルパラメータ化量子回路生成器Q-genを紹介する。
Q-genは、古典的なコンピュータサイエンスの背景を持つユーザが量子コンピューティングの世界に飛び込むための入り口として機能するオープンソースプロジェクトである。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:08:16 GMT)
Device-Independent Ternary Quantum Key Distribution Protocol Based on the Impossible Colouring Game [0.6] TDIQKDプロトコルは、Impossible Colouring pseudo-telepathyゲームに基づくプロトコルである。
最大絡み合ったクォート状態を使用して、遠くのパーティ間で安全なキー生成を可能にする。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:52:31 GMT)
Lessons From an App Update at Replika AI: Identity Discontinuity in Human-AI Relationships [0.6] 人気の高い米国ベースのAIコンパニオンであるReplika AIを使って、これらの質問に光を当てています。
アプリがエロティックロールプレイ(ERP)機能を削除した後、このイベントはAIコンパニオンのアイデンティティが停止されたという顧客からの認識を引き起こしました。
この結果は、損失を嘆くことや、"オリジナル"に対する"新しい"AIを非評価することを含む、損失に関連する消費者福祉とマーケティングの負の成果を予測した。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:42:22 GMT)
Learning the Complexity of Weakly Noisy Quantum States [0.6] ターゲット量子状態の古典的シャドウ表現を利用して、弱雑音量子状態の回路複雑性を予測する。
本研究は,学習アルゴリズムと量子状態複雑性の橋渡しを行い,量子状態の固有特性を特徴付ける学習アルゴリズムのパワーを強調した。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:54:59 GMT)
Long-Form Text-to-Music Generation with Adaptive Prompts: A Case Study in Tabletop Role-Playing Games Soundtracks [0.6] 本稿では,長大な音楽制作におけるテキストからオーディオまでの音楽生成モデルの有用性について考察する。
Babel BardoはLarge Language Models(LLM)を用いて音声の書き起こしを音楽記述に変換するシステムで、テキストから音楽へのモデルを制御する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:52:11 GMT)
Comparative Evaluation of Prompting and Fine-Tuning for Applying Large Language Models to Grid-Structured Geospatial Data [0.5] 我々は、構造化されたプロンプトを通してベースモデルの性能を評価し、ユーザ・アシスタントインタラクションのデータセットに基づいて訓練された微調整された変種と対比する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:27:51 GMT)
Comprehensive Lung Disease Detection Using Deep Learning Models and Hybrid Chest X-ray Data with Explainable AI [0.5] 本研究では,ハイブリッドデータセットを用いた深層学習と移動学習の有効性について検討した。
その結果、VGG16、Xception、ResNet50V2、DenseNet121のハイブリッドデータセットでは、それぞれ99%の精度でパフォーマンスが向上した。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:17:47 GMT)
Toward Task Capable Active Matter: Learning to Avoid Clogging in Confined Collectives via Collisions [0.5] タスク対応の高密度アクティブマターにおいて、単純な学習ルールが避けられない機能をどのように活用できるかを示す。
本研究は,タスクの複雑さのように見えるが,単純な学習規則は,タスク対応高密度能動物質における避けられない特徴を活用することができることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:42:32 GMT)
Zero-Shot Gaze-based Volumetric Medical Image Segmentation [0.4] 対話型セグメンテーションのための新しい情報モダリティとして視線を導入した。
我々は、SAM-2とMedSAM-2を用いた視線情報を用いた視線データと実視線データの両方を用いて、視線情報を用いた視線情報の有効性を評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:34:13 GMT)
Deep greedy unfolding: Sorting out argsorting in greedy sparse recovery algorithms [0.4] greedy sparseリカバリアルゴリズムは、ニューラルネットワークへの統合を妨げる非微分可能なアーグソート演算子に依存している。
直交マッチング法(OMP)と反復的ハード閾値法(IHT)の置換に基づく変種を提案する。
We demonstrate that Soft-OMP and Soft-IHT, as differentable equivalent of OMP and IHT and fully compatible with neural network training, effectively almost that these algorithm with a controllable degree of accuracy。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:36:38 GMT)
Decoding Phone Pairs from MEG Signals Across Speech Modalities [0.4] 脳磁図信号を用いて、音声生成や知覚タスク中の脳活動から携帯電話を復号する方法について検討した。
その結果,受動聴取や再生モダリティと比較して,音声生成時の復号精度が有意に高かった。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:31:34 GMT)
Antimatter Annihilation Vertex Reconstruction with Deep Learning for ALPHA-g Radial Time Projection Chamber [0.4] 本稿では,PointNetディープラーニングアーキテクチャに基づくモデルアンサンブルを用いた再構成手法を提案する。
新たなモデルであるPointNet Ensemble for Annihilation Reconstruction (PEAR) は,頂点の位置とrTPC空間点の関係を直接学習する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:49:11 GMT)
Lung Nodule-SSM: Self-Supervised Lung Nodule Detection and Classification in Thoracic CT Images [0.4] 肺癌はここ数十年で最も致命的な種類のがんである。
注釈付き医用画像データの限られた利用は、正確なコンピュータ支援診断(CAD)システムの開発においてボトルネックとなっている。
本稿では,DINOv2をバックボーンとする自己教師型学習システム「LungNodule-SSM」を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:13:11 GMT)
Sonnet: Spectral Operator Neural Network for Multivariable Time Series Forecasting [0.3] 我々は新しいアーキテクチャ、すなわちスペクトル演算子ニューラルネットワーク(Sonnet)を提案する。
ソンネットは入力に学習可能なウェーブレット変換を適用し、クープマン作用素を用いたスペクトル解析を取り入れている。
われわれの実証分析によると、Sonnetは予測タスクの47ドルのうち34ドルで最高のパフォーマンスを得ている。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:43:12 GMT)
Employing Continuous Integration inspired workflows for benchmarking of scientific software -- a use case on numerical cut cell quadrature [0.3] 本稿では、確立された継続的インテグレーションツールとプラクティスを利用して、ベンチマークの実行とレポートの自動化を実現する、実証済みのアプローチを提案する。
我々のユースケースは、任意の領域上の数値積分(四分法)であり、2Dまたは3Dで暗黙的にあるいはパラメトリックに定義された曲線や曲面によって境界づけられる。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:45:21 GMT)
Multi-modal Integration Analysis of Alzheimer's Disease Using Large Language Models and Knowledge Graphs [0.3] 本稿では,大規模言語モデル(LLM)と知識グラフを用いたアルツハイマー病(AD)研究において,断片化されたマルチモーダルデータを統合するための新しい枠組みを提案する。
本手法は,MRI,遺伝子発現,バイオマーカー,脳波,臨床指標の集団レベルでの統合を実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:51:49 GMT)
Strong Hilbert space fragmentation and fractons from subsystem and higher-form symmetries [0.3] 1次元の強い断片化モデルと、サブシステム対称性を用いた高次元への「リフト」が、高次元の強い断片化ダイナミクスをもたらすことを示す。
これにより、高次元の強い断片化への新たな経路が提供され、またフラクトロニックな挙動への新たな経路も提供される。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:00:00 GMT)
The abelian state hidden subgroup problem: Learning stabilizer groups and beyond [0.3] 量子状態の対称性の同定は、量子情報理論と量子多体物理学における中心的なテーマである。
本研究では,未知の量子状態の隠れ対称性を同定することを目的とする量子学習問題について検討する。
この場合、隠れ対称性の部分群を効率的に学習するための量子アルゴリズムアプローチを開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:21:51 GMT)
GitHub Repository Complexity Leads to Diminished Web Archive Availability [0.3] 私たちは、主にGitHubから12,000以上のWebホストされたGitリポジトリプロジェクトのホームページを調査しました。
調査対象のアーカイブされたリポジトリホームページの31%以上は、何らかの小さなページの損傷を示していた。
平均して5%未満のソースファイルがアーカイブされ、ほとんどのリポジトリはインターネットアーカイブに保存されていない。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:51:30 GMT)
Towards a Science of Causal Interpretability in Deep Learning for Software Engineering [0.3] ソフトウエアエンジニアリングのための深層学習(DL4SE)における因果解釈性を達成するための論文演説
Dissertationがニューラルネットワークモデル(NCM)の新しいポストホック解釈方法であるDoCodeを導入
DoCodeは因果推論を使用して、モデル予測のプログラミング言語指向の説明を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:13:11 GMT)
Pivot Language for Low-Resource Machine Translation [0.3] 私たちはヒンディー語をネパール語を英語に翻訳する重要な言語として使用しています。
本稿では,ネパール語を英語に翻訳するための2つの手法について論じる。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:30:39 GMT)
Deeply Optimizing the SAT Solver for the IC3 Algorithm [0.2] 観測結果に基づいて,IC3におけるSATソルバの最適化について述べる。
バイナリヒープをバケットに置き換えて、一定時間操作を実現しています。
我々はこれらの最適化を統合した新しい軽量CDCL SATソルバであるGipSATを開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:04:39 GMT)
One Bad NOFO? AI Governance in Federal Grantmaking [0.2] 米国の機関は、連邦政府の財政援助に何十億ドルもの資金を投入する際に、見過ごされているAIガバナンスの役割を持っている。
裁量的な助成金メーカーとして、機関は、AIガバナンスのための隠されたレバーである、受賞者の行為をガイドし、制限する。
2009年から2024年にかけて、米国連邦助成金のウェブサイトに投稿された4万件以上の連邦助成金の申告書(NOFO)のデータセットを使用します。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:33:28 GMT)
TinyClick: Single-Turn Agent for Empowering GUI Automation [0.2] 視覚言語モデル Florence-2-Base を用いたユーザインタフェース(UI)インタラクションタスクのためのUIエージェントを提案する。
エージェントの主なタスクは、ユーザのコマンドに対応するUI要素の画面座標を特定することである。
これはScreenspotとOmniActアノテーションで非常に強力なパフォーマンスを示し、非常に小さなサイズの0.27Bパラメータと最小のレイテンシを維持している。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:52:31 GMT)
VET-DINO: Learning Anatomical Understanding Through Multi-View Distillation in Veterinary Imaging [0.2] VET-DINOは、同じ研究から複数の標準化されたビューの可用性を活用するフレームワークである。
我々は,668,000犬種調査から得られた500万個の獣医学的放射線画像のデータセットに対するアプローチを実証した。
実際の多視点対からの学習は、純粋に合成オーグメンテーションよりも解剖学的理解が優れていることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:23:48 GMT)
Bridging the Gap: Physical PCI Device Integration Into SystemC-TLM Virtual Platforms [0.2] 仮想プラットフォーム(VP)は、未修正のターゲットソフトウェアを初期設計時に実行し、デバッグするためのプラットフォームとして機能する。
VPは、ターゲットソフトウェアが適切な時間内に実行されることを保証するために、高いシミュレーション速度を提供する必要がある。
本稿では,PCIデバイスをSystemC-TLM-2.0ベースのVPに統合するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:46:41 GMT)
Infinite hierarchical contrastive clustering for personal digital envirotyping [0.0] 日々の環境は私たちの健康と行動に大きな影響を与えます。
デジタルエンビロタイピングは、環境特徴と関心の健康的結果の間の有意義な関係を識別するために用いられる。
この課題に対処するために、無限階層的コントラストクラスタリングを導入します。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:11:23 GMT)
How to factor 2048 bit RSA integers with less than a million noisy qubits [0.0] Gidney+Ekeraa 2019では、2048ビットRSAを2000万のノイズ量子ビットを持つ量子コンピュータで8時間で分解できるという推定を共同で発表しました。
2048ビットのRSA整数は、100万のノイズ量子ビット未満の量子コンピュータによって1週間以内に分解できると見積もっています。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:11:44 GMT)
EmoHopeSpeech: An Annotated Dataset of Emotions and Hope Speech in English and Arabic [0.0] 本研究では,アラビア語の23,456項目と英語の10,036項目からなるバイリンガルデータセットを提案する。
このデータセットは、感情の強さ、複雑さ、原因を捉える包括的なアノテーションと、希望のスピーチのための詳細な分類とサブカテゴリを提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:06:55 GMT)
Zero-Trust Mobility-Aware Authentication Framework for Secure Vehicular Fog Computing Networks [0.0] 本稿では,VFCネットワークにおけるセキュア通信のためのZTMAF(Zero-Trust Mobility-Aware Authentication Framework)を提案する。
このフレームワークは、軽量な暗号プリミティブによるコンテキスト認識認証、分散信頼評価システム、およびフォグノード支援セッションバリデーションを使用して、偽造、リプレイ、偽造攻撃と戦う。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:03:39 GMT)
World Models as Reference Trajectories for Rapid Motor Adaptation [0.0] リフレクティブ・ワールド・モデル(Reflexive World Models、RWM)は、世界モデル予測を暗黙の基準軌跡として使用し、迅速な適応を行うための二重制御フレームワークである。
本手法は、強化学習とロバストモータ実行により、制御問題を長期報酬に分離する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:46:41 GMT)
Universal scaling laws for correlated decay of many-body quantum systems [0.0] 量子システムはオープンであり、周囲の環境とエネルギーと情報を継続的に交換している。
巨大量子系の最大崩壊速度はどのくらいで、その大きさはどのようにスケールするか?
ハミルトンの複雑性理論における最近の研究に触発され、最大崩壊速度の厳密で一般的な上と下の境界を定めている。
多くの物理的関連系において、境界は普遍的であり、結果としてシステムサイズによる正確なスケーリング法則が導かれる。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:19:37 GMT)
Unified Microphone Conversion: Many-to-Many Device Mapping via Feature-wise Linear Modulation [0.0] 統一マイクロホン変換(Unified Microphone Conversion)は、音声イベント分類システムにおいて、デバイス変動を抑えるために設計された統合生成フレームワークである。
提案手法は最先端技術よりも2.6%優れ,マクロ平均F1スコアの変動率を0.8%低減する。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:10:18 GMT)
Uncertainty quantification for improving radiomic-based models in radiation pneumonitis prediction [0.0] 近年,放射能特性を持つ機械学習モデルにより,空間情報の取得による放射線肺炎の予測が改善している。
食道癌101例のコホートを経時的に解析した。
放射線とドシオミックの特徴は識別性能と校正性能の両方を改善している。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:00:56 GMT)
Uncertainty Quantification in SVM prediction [0.0] ニューラルネットワークとは異なり、SVMソリューションは一般的により安定で、スパースで、最適で、解釈可能である。
スパースサポートベクトル量子回帰(SSVQR)モデルを提案する。
我々は、テストセットの保証が有限であるより安定した予測セットを得るために、コンフォーマル回帰設定でSVMモデルを拡張します。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:11:07 GMT)
Tunable anharmonicity in cavity optomechanics in the unresolved sideband regime [0.0] 機械的アンハーモニック性によって残される測定可能なシグネチャを予測する理論を提案する。
特に,機械的変位スペクトルを解析的,数値的に取得し,空洞光場における機械的不調和のインプリントを探索する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:03:55 GMT)
Transfer of Structural Knowledge from Synthetic Languages [0.0] この研究は、いくつかの合成言語から英語への変換学習を探求する。
我々は,従来の研究で使用されていた言語よりも,英語への移行に寄与する新しい合成言語を導入する。
我々はTiny-Cloze Benchmarkを使用して、いくつかのドメインで微調整されたモデルを評価する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:18:51 GMT)
Training NTK to Generalize with KARE [0.0] 我々は、明示的に訓練されたカーネルが従来のエンドツーエンドDNN最適化よりも優れていることを示す。
我々はNTKの明示的な訓練は過度にパラメータ化された特徴学習の一形態であると主張している。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:58:43 GMT)
Tractable downfall of basis pursuit in structured sparse optimization [0.0] 我々は,線形最適制御問題に対する最適解を求める問題に対処する。
特に、ゼロでないエントリの事前知識を必要とせずに、最短解の計算に失敗したことについて検討する。
これらの保証は、AI設計問題に対する貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:14:52 GMT)
Thermodynamic Analysis for Harmonic Oscillator with Position-Dependent Mass [0.0] その結果,αの増大はエントロピーと比熱の減少を招き,制限によるアクセス可能な状態の減少を反映していることがわかった。
本研究は、質量変形が量子熱応答に与える影響を明らかにし、全体的な熱力学の傾向は文献に報告されているものと一致しているが、特定の特異な特徴は変形の特定の形態によって現れることを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:00:44 GMT)
The Super Emotion Dataset [0.0] 既存のデータセットでは、一貫性のない感情カテゴリを使用するか、限られたサンプルサイズに苦しむか、特定のドメインにフォーカスする。
Super Emotionデータセットは、様々なテキストソースをShaverの実験的に検証された感情分類に基づく統一されたフレームワークに調和させる。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:21:00 GMT)
The DKP Equation in Presence of a Woods-Saxon Potential: Transmission Resonances and Bound States [0.0] 我々は、ウッズ・サクソンポテンシャル障壁の存在下でのダフィン・ケマー・ペティオー方程式を解く。
本結果は,木質サクソンポテンシャル障壁の制限事例を示す正方形ポテンシャル障壁と尖形ポテンシャル障壁に対して得られたものと比較した。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:40:51 GMT)
Tempest: Autonomous Multi-Turn Jailbreaking of Large Language Models with Tree Search [0.0] 本研究では,大規模言語モデル (LLM) の安全性の段階的侵食を木探索の観点からモデル化する多ターン対向フレームワークである Tempest を紹介する。
我々は,Tempest が GPT-3.5-turbo で100%成功率,GPT-4 で97% を達成していることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:06:50 GMT)
Systematic construction of asymptotic quantum many-body scar states and their relation to supersymmetric quantum mechanics [0.0] 量子多体散乱(AQMBS)状態を構築するための体系的手法を開発した。
AQMBS状態は量子多体散乱(QMBS)状態と密接に関連しているが、それらは重要な違いを示す。
我々の定式化は、QMBSと超対称性(SUSY)量子力学の関連を明らかにする。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:36:59 GMT)
Synchronous manipulation of nuclear spins via boron vacancy centers in hexagonal boron nitride [0.0] 我々は、六方晶窒化ホウ素(hBN)の負電荷のホウ素空孔点欠陥を取り巻く核スピンの操作を絡める方法を開発した。
背景磁場の存在下では、$hatU_z$と$hatU_x$回転で核の状態を総合的に操作できることを示す。
我々の研究は、将来の量子技術応用においてhBNの核スピンを利用する基盤として役立てることができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:07:22 GMT)
Super-Resolution with Structured Motion [0.0] 本研究では,高精度な動き情報,スパース画像先行情報,凸最適化を用いることで,大きな要因による解像度向上が可能であることを示す。
擬似ランダム運動を用いることで、単一の低分解能画像を用いて高分解能目標を再構成できることを実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:25:28 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の分布を持つ確率変数に置き換え、結果平均と偏差を計算する。
本稿では、分散算術と呼ばれる統計テイラー展開の実装と分散算術に関する試験について述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:08:24 GMT)
SplitWise Regression: Stepwise Modeling with Adaptive Dummy Encoding [0.0] SplitWiseは、ステップワイズレグレッションを強化する新しいフレームワークである。
浅い決定木を用いて、数値予測器をしきい値ベースのバイナリ特徴に適応的に変換する。
合成データセットと実世界のデータセットの両方で評価される。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:06:43 GMT)
Spin-1 Haldane phase in a chain of Rydberg atoms [0.0] F"オースター共鳴に近い3つのRydberg状態を用いて、Rydberg系にスピン-1連鎖を実装するためのプロトコル。
位相図は、高度に堅牢なハルデン相(対称性に保護された位相の素例)を明らかにする。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:44:35 GMT)
Social Bias in Popular Question-Answering Benchmarks [0.0] 質問応答(QA)と読解理解(RC)ベンチマークは,知識の検索と再生において,大規模言語モデル(LLM)の能力を評価する上で不可欠である。
一般的なQAおよびRCベンチマークは偏りがあり、代表的な方法で異なる人口層や地域に関する質問をカバーしていないことを実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:14:47 GMT)
Simple Sufficient Criteria for Optimality of Entanglement Witnesses [0.0] エンタングルメントブレーキングチャネルによるスパンニング特性の斬新な特徴について紹介する。
分散プロパティよりもわずかに弱いが、手動でも数値でもテストがずっと簡単で、ほとんどすべての目撃者に適用できる。
第2の基準は、与えられた証人の期待値を最大絡み合った状態で簡単に計算できるものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:05:16 GMT)
Short-Range Dependency Effects on Transformer Instability and a Decomposed Attention Solution [0.0] 自己アテンション機構(SA)は、トークンの豊富なベクトル表現を、他者との関係をシーケンスでモデル化することによって学習する。
SAの短距離依存関係をキャプチャする能力に制限があるため、急速に成長し、トレーニングを不安定にする。
本稿では,ロジット爆発を緩和するLong Short-attention (LS-attention)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:12:30 GMT)
Separability and entanglement in classical eigenfunctions as a criterion for Hamiltonian chaos [0.0] 古典的リウヴィル作用素の固有函数について研究する。
製品状態として分離するために従わなければならない条件について検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:32:24 GMT)
Self-distributive structures, braces & the Yang-Baxter equation [0.0] 私たちは棚、ラック、クエンドルと呼ばれる構造を思い出します。
これらの対象は自己分布条件を満たし、ヤン・バクスター方程式の解につながる。
これらが準三角ホップ代数であることを示し、普遍集合論的なドリンフェルのねじれを導出する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:15:32 GMT)
Self-Interpretability: LLMs Can Describe Complex Internal Processes that Drive Their Decisions, and Improve with Training [0.0] 現代における大規模言語モデル(LLM)は,その内部プロセスの正確かつ定量的な記述を提供することができることを示す。
我々は GPT-4o と GPT-4o-mini を微調整し、様々な複雑な文脈で意思決定を行った。
これらのLCMは、より正確に意思決定を説明するために微調整可能であることを実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:35:02 GMT)
Securing RAG: A Risk Assessment and Mitigation Framework [0.0] Retrieval Augmented Generation (RAG)は、ユーザ向けNLPアプリケーションのためのデファクト業界標準として登場した。
本稿では,RAGパイプラインの脆弱性を概観し,データ前処理からLLM(Large Language Models)の統合に至るまで,攻撃面の概要を述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:45:04 GMT)
Search for Dark Photon Dark Matter of a Mass around $36.1\text{ }\mathrmμ\mathrm{eV}$ Using a Frequency-tunable Cavity Controlled through a Coupled Superconducting Qubit [0.0] 本稿では,トランスモンキュービットを周波数調整成分として用いたキャビティを用いた暗黒光子暗黒物質の探索結果について報告する。
我々は、黒光子質量のダークフォトンパラメータ領域を、質量範囲$[36.0791, 36.1765]のマチュルムeV$に対して、ピーク感度が$chi sim 10-12$の約36.1のマチュルムeV$に対して除外し、既存の宇宙的境界を超えた。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:09:12 GMT)
SUS backprop: linear backpropagation algorithm for long inputs in transformers [0.0] 本稿では,1パラメータ$c$で制御される単純な確率的ルールを提案する。
これにより、注意バックプロパゲーションに必要な計算量が$c/n$削減される。
我々は,典型的な変圧器モデルにおいて,注意勾配流の99%をカットすると,相対勾配分散が約$n sim 2000$で1%程度増加し,$n$で減少することを示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:00:38 GMT)
SPhyR: Spatial-Physical Reasoning Benchmark on Material Distribution [0.0] データセットには、部分構造内のマスクされた領域を埋めることから、完全な物質分布を予測することまで、さまざまなタスクが含まれている。
本データセットは2次元設定における空間的および物理的推論能力の評価を目標とし,従来の言語と論理的ベンチマークを補完する視点を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:00:20 GMT)
Roughening dynamics of interfaces in the two-dimensional quantum Ising model [0.0] 2次元量子イジングモデルの強磁性相における界面粗化遷移のシグネチャについて検討する。
この結果は、Rydberg原子系で容易に実験できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:21:47 GMT)
Robust Multi-Modal Forecasting: Integrating Static and Dynamic Features [0.0] 時系列予測は様々な応用、特に医療において重要な役割を担っている。
これらのタスクに責任を負うモデルの透明性と説明可能性を保証することは、重要な設定で採用するために不可欠である。
最近の研究は、予測時系列の傾向と特性を理解することに焦点を当てた、双方向透明性に対するトップダウンアプローチを探求している。
論文参考訳(メタデータ) (Wed, 21 May 2025 04:12:12 GMT)
Rigorous lower bound of the dynamical critical exponent of the Ising model [0.0] グラウバー力学下での運動イジングモデルについて検討する。
これまでに知られていた$z geq 2 - eta$を厳格に改善する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:26:11 GMT)
Riemannian Optimization on the Oblique Manifold for Sparse Simplex Constraints via Multiplicative Updates [0.0] スパース単純性制約による低ランク最適化問題は、非負性、疎性、一対一条件を満たさなければならない変数を含む。
本稿では,これらの問題に効率的に対処するための新しい多様体最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:54:57 GMT)
Relative phase and dynamical phase sensing in a Hamiltonian model of the optical SU(1,1) interferometer [0.0] 相対位相を感知する最適演算点が$phi = pi$であることが示される。
結果は、複数の光ダウンコンバージョンプロセスを含む一般的な光量子センサを記述するための第一原理のアプローチを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:18:18 GMT)
Relational Quantum Dynamics (RQD): An Informational Ontology [0.0] 本稿では、物理学の基礎に、孤立した物体ではなく、関係や情報を置くという解釈である量子ダイナミクス(RQD)を紹介する。
RQDは単一のオブザーバーに依存しない現実を否定し、その代わりに、事実は特定の観察コンテキスト内でのみ明確となる。
RQDは、量子力学、時空、観測者がもはや独立したドメインではなく、1つの相互接続された情報ウェブの側面を持つ統一された図を提供するかもしれない。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:58:30 GMT)
Reinforcement Twinning for Hybrid Control of Flapping-Wing Drones [0.0] 本稿では,提案手法に基づくハイブリッドモデルフリー/モデルベースによる飛行制御手法を提案する。
このアルゴリズムは、羽ばたき翼ドローンの縦方向のダイナミクスを制御するために評価される。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:27:09 GMT)
Real-Time Detection of Insider Threats Using Behavioral Analytics and Deep Evidential Clustering [0.0] 本稿では,行動分析と深層的クラスタリングを組み合わせた,インサイダー脅威をリアルタイムに検出するフレームワークを提案する。
本システムは,ユーザの行動を捉え,分析し,文脈に富んだ行動特徴を適用し,潜在的な脅威を分類する。
我々は,CERTやTWOSなどのベンチマークインサイダー脅威データセットについて,平均検出精度94.7%,偽陽性率38%を従来のクラスタリング手法と比較し評価した。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:21:33 GMT)
Readout sweet spots for spin qubits with strong spin-orbit interaction [0.0] 二重量子ドットにおける半導体スピン量子ビットに対する電荷センシングに基づく読み出しをモデル化する。
我々は、センサの電荷ノイズ、残留トンネル、および$g$テンソル変調が読み出し精度を低下させる方法について定量化する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:54:48 GMT)
RGBX-DiffusionDet: A Framework for Multi-Modal RGB-X Object Detection Using DiffusionDet [0.0] RGBX-DiffusionDetはDiffusionDetモデルを拡張するオブジェクト検出フレームワークである。
適応型マルチモーダルエンコーダにより、不均一な2Dデータ(X)をRGB画像と融合する。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:03:05 GMT)
RAVEN: Query-Guided Representation Alignment for Question Answering over Audio, Video, Embedded Sensors, and Natural Language [0.0] RAVENは、クエリ条件のクロスモーダルゲーティングモジュールであるQuARTをコアとする統一QAアーキテクチャである。
RAVENは、単調な事前トレーニング、クエリ整合融合、不一致指向の微調整を含む3段階のパイプラインを通じてトレーニングされる。
実験の結果、RAVENは最先端のマルチモーダル言語モデルと比較して14.5%と8.0%の精度で向上した。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:33:36 GMT)
Quantum-Resilient Blockchain for Secure Transactions in UAV-Assisted Smart Agriculture Networks [0.0] 無人航空機(UAV)をスマート農業に統合することで、リアルタイムモニタリング、データ収集、自動農業活動が可能になった。
本稿では,UAV支援型スマート農業ネットワークにおけるデータおよびリソーストランザクションの確保を目的とした,量子レジリエントなブロックチェーンフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:12:39 GMT)
Quantum steganography using catalytic and entanglement-assisted quantum codes [0.0] ステガノグラフィー(Steganography)は、無邪気なデータに隠蔽するためにサブターフュージを用いて秘密のメッセージを伝達する技法である。
まず, 初期共有資源を最小化する触媒量子コードに基づくスキーム, 第二に, QECCに事前の絡み合いを組み込んだスキーム, 第三に, QECCと組み合わさった前共有エビットの位相ビットを用いたスキームの3つのステガノグラフプロトコルを開発する。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:58:57 GMT)
Quantum simulation of the microscopic to macroscopic crossover using superconducting quantum impurities [0.0] 我々はフェルミの黄金律の開始を、モードの離散的な微視的な入浴が、マクロ的な熱力学の限界に近づくと見ている。
単一光子モードごとに小さいが有限なエスケープレートを保って、有限な長時間減衰率を得る必要があることを示す。
我々の定式化は超伝導回路における最近の実験を分析するのに利用できる。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:46:15 GMT)
Quantum emitters in silicon: Purcell-enhanced lifetime modulation as a probe of local refractive index changes [0.0] シリコンフォトニックキャビティに埋め込まれた量子エミッタは、ナノスケールでの屈折率検知のための強力でスケーラブルなプラットフォームを提供する。
本稿では,エミッタの自発寿命のパーセル変調に基づく新しいセンシング機構を提案し,理論的に解析する。
シリコン中のT中心のような長寿命エミッタは、一意に有利であり、秒単位の寿命シフトを解消できることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:37:52 GMT)
Quantum anomalous Hall domains in a Quenched Topological Mott Insulator [0.0] トポロジカルモット絶縁状態を実現するスピンレス二次バンドタッチモデルについて検討する。
時間依存型Hartree-Fockシミュレーションを行い、クエンチ後、システムが励起されたディラック半金属状態を実現することを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:24:41 GMT)
Quantitative analysis of the value of investment in research facilities, with examples from cyberinfrastructure [0.0] 研究施設への投資額は、長年、高等教育や研究政策において疑問視されてきた。
本研究では,研究施設への投資によって生み出された量的価値を評価する手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:56:14 GMT)
Qiskit Variational Quantum Classifier on the Pulsar Classification Problem [0.0] 本研究では,高時間ユニバース2データセットのパルサー分類候補問題に対して,変分量子計算アルゴリズムを適用した。
我々は、Qiskit Machine Learningを用いて、異なる特徴選択法を用いてモデルの性能回路を比較する。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:53:29 GMT)
Pursuit and Review of Magnetic Resonance Imaging (MRI) based Quantum Computing -- Qubit Generation, Spin Purification, Tailored RF Pulses and MRI Sequences for Quantum Computing [0.0] 水プロトンNMR(1H-NMR)を用いた新しいMRI技術を用いた量子ビット(量子ビット)生成法を提案する。
本稿では,NMRによる先行技術について,量子コンピューティングの文脈で概観する。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:36:37 GMT)
Prethermalization, shadowing breakdown, and the absence of Trotterization transition in quantum circuits [0.0] 実効エネルギーはトロッター誤差より安定であることを示す。
以前の主張とは対照的に、積分不可能な多体量子系ではトロッター化遷移は存在しない。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:46:39 GMT)
Predicting At-Risk Programming Students in Small Imbalanced Datasets using Synthetic Data [0.0] この研究は、プログラミング教育における学生のエンゲージメントを測定し、理解し、改善することに焦点を当てた大規模なプロジェクトの一部である。
そこで本研究では,導入プログラミングモジュールから無バランスの小さなデータセットを用いて,リスクのある学生を早期に識別する上で,合成データ生成が有効かどうかを検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:14:25 GMT)
Perception-Driven Bias Detection in Machine Learning via Crowdsourced Visual Judgment [0.0] 本稿では,クラウドソースによる人的判断を活用するバイアス検出のための,新しい認知駆動型フレームワークを提案する。
本稿では,reCAPTCHAなどのクラウド・パワーシステムに触発されて,数値データの取り除かれた可視化を表示する軽量なWebプラットフォームを提案する。
ユーザの視覚的知覚は、レイアウト、間隔、質問のフレーズによって、潜在的な相違を示唆することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:09:18 GMT)
Parameter-Efficient Fine-Tuning of Multispectral Foundation Models for Hyperspectral Image Classification [0.0] 下流タスクのための微調整されたハイパースペクトル基盤モデルは困難であり、しばしばかなりのメモリとストレージを必要とする。
ハイパースペクトル画像分類(HSIC)のための多スペクトル基盤モデルであるSpectralGPTの高精細化のための効率的なフレームワークを提案する。
LoRA+にインスパイアされたKronA+は、Kronecker行列に類似の機構を適用する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:05:33 GMT)
Pair Production in time-dependent Electric field at Finite times [0.0] 真空中におけるペア生成の有限時間挙動を時間依存性のソーターパルス電場を用いて検討する。
粒子の長手運動量スペクトルにおける振動を有限時間で観測する。
これらの振動は、様々な動的過程/チャネルから生じる量子干渉効果によって生じる。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:05:34 GMT)
Optically Switchable Fluorescence Enhancement at Critical Interparticle Distances [0.0] プラズモニックナノ構造は、蛍光ベースの応用において効率向上ツールとして使用される局所的な磁場増強を提供する。
そこで本研究では,CdSe/ZnSコア殻QDの発光効率を,銀ナノ粒子を光学的に励起することによって,光スイッチで実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:48:54 GMT)
On Dequantization of Supervised Quantum Machine Learning via Random Fourier Features [0.0] 古典的RFFモデルと回帰および分類タスクの量子モデルとの一般化性能ギャップを導出する。
我々の発見は、RFFに基づく量子化の適用可能性を広げるだけでなく、実用的な機械学習タスクにおける潜在的な量子アドバンテージの理解を深める。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:00:03 GMT)
Neural Conditional Transport Maps [0.0] 本稿では,カテゴリー型と連続型の両方の条件変数を同時に処理できる条件付け機構を提案する。
提案手法のコアとなるハイパーネットワークは,これらの入力に基づいてトランスポート層パラメータを生成し,適応的なマッピングを生成する。
この研究は、条件付き最適輸送の最先端を推し進め、複雑な高次元領域への最適な輸送原理の広範な適用を可能にした。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:59:02 GMT)
Multi-omic Causal Discovery using Genotypes and Gene Expression [0.0] 転写データの祖先関係を推定するための制約に基づく因果アルゴリズムであるGENESISを導入する。
遺伝子型を固定因果アンカーとして統合することにより、genESISは古典因果発見アルゴリズムに「原則的出発」を提供する。
この枠組みは、複雑な形質の因果経路を明らかにするための強力な経路を提供し、機能ゲノム学、薬物発見、精密医療への有望な応用を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:52:23 GMT)
Mitigating Cyber Risk in the Age of Open-Weight LLMs: Policy Gaps and Technical Realities [0.0] オープンウェイト汎用AI(GPAI)モデルには大きなメリットがあるが、重大なサイバーセキュリティリスクも伴う。
本稿では、オープンウェイトAIリリースによって拡大した、マルウェア開発とソーシャルエンジニアリングの強化を含む、特定の脅威を分析する。
本稿では,モデル全体ではなく,特定のハイリスク機能の評価と制御に重点を置く経路を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:35:52 GMT)
Metasurface-mediated quantum entanglement via bound states in the continuum [0.0] QE間の絡み合いは自由空間よりも早く生成され、著しく増幅され、複数の共振波長で持続する。
本研究は、先端量子フォトニクスのための実用的でスケーラブルなプラットフォームとして、全誘電体準曲面を確立した。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:57:47 GMT)
Maxwell's Demon Is Foiled by the Entropy Cost of Measurement, Not Erasure [0.0] 従来の熱力学の第2法則は、情報消去のエントロピーコストによって「マクスウェルのデーモン」から救われるという主張である。
第2法則を保存する基本的な原理は、量子不確実性原理である、と私は主張する。
私は、Szilardエンジン内の分子を局在させるための特定のエントロピーコストを取得し、ランダウアーの原理による量と一致することを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 01:17:29 GMT)
Magnetic noise in macroscopic quantum spatial superposition [0.0] 磁場のランダムなゆらぎが、物質波干渉計の経路をランダムに揺らぎ、量子重ね合わせをデコヒートすることを示す。
このような物質波干渉計は、物理学における多くの新しい基礎的な進歩の基盤となっている。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:52:39 GMT)
Machine Learning Derived Blood Input for Dynamic PET Images of Rat Heart [0.0] ラット心臓の動的FDG PET画像に対するMCIFと運動速度定数の同時推定のための二重出力モデルを開発した。
半自動セグメンテーションを用いて,IDIFと心筋入力の結合を用いて,テストデータ中のMCIFをトレーニングし,予測するLong-Short-Term Memory (LSTM) セルネットワークを構築した。
モデルミッドポイントは以前の平均正方形誤差(MSE)よりも56.4%改善することができた。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:10:44 GMT)
MIKU-PAL: An Automated and Standardized Multi-Modal Method for Speech Paralinguistic and Affect Labeling [0.0] 本稿では、ラベルなしビデオデータから高一貫性の感情音声を抽出する完全自動マルチモーダルパイプラインMIKU-PALを提案する。
以上の結果から,MIKU-PALは人間レベルの精度(MELDでは68.5%)と優れた一貫性(0.93Fleiss kappaスコア)を達成できることが示された。
さらに,感情的テキスト音声と視覚的音声のクローニングのための新しいベンチマークとして,微粒な感情音声データセットMIKU-EmoBench(131.2時間)をリリースした。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:23:12 GMT)
Lawful but Awful: Evolving Legislative Responses to Address Online Misinformation, Disinformation, and Mal-Information in the Age of Generative AI [0.0] 本稿では,誤報,偽報,誤報による潜在的な被害に対する認識の変化について分析する。
国民一人当たりGDPで測定されるように、自由度が低く、自由度が低い国で法制化の転換が始まった。
初期の保留地にもかかわらず、こうした法律の成長は西部州で最も急激である。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:33:13 GMT)
LLMs Outperform Experts on Challenging Biology Benchmarks [0.0] 本研究は8つの生物学ベンチマークで27のフロンティア大言語モデルを体系的に評価する。
トップモデルのパフォーマンスは、Virology Capabilities Testの挑戦的なテキストのみのサブセットで4倍以上に向上した。
いくつかのモデルは、他の挑戦的なベンチマークで専門家レベルのパフォーマンスに適合または超えている。
論文参考訳(メタデータ) (Wed, 21 May 2025 20:34:27 GMT)
KernelOracle: Predicting the Linux Scheduler's Next Move with Deep Learning [0.0] 本研究は,CFS(Complettly Fair Scheduler)が選択したタスクの順序を予測するためのディープラーニング手法の先駆者となる。
私たちのコアコントリビューションは、実行中のLinuxカーネルから新しいスケジューリングデータセットを体系的に生成し、キュレーションすることです。
本稿では,そのような予測モデルをカーネルのスケジューリングフレームワークに統合する実践的経路と意義について述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:43:52 GMT)
Is (Selective) Round-To-Nearest Quantization All You Need? [0.0] RTN (Round-to-Nearest) はおそらく、Large Language Models (LLM) よりずっと前から存在していた最も単純な量子化技術である。
この研究は、RTNの適用がより安価であるだけでなく、トークン生成スループットがより良くなり、精度がより高度な代替品と類似することを示しながら、この確立された視点を排除することを目的としている。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:01:32 GMT)
Inverse Design of Metal-Organic Frameworks Using Quantum Natural Language Processing [0.0] 本稿では、量子自然言語処理(QNLP)を用いて、ターゲット特性を持つ金属-有機系フレームワーク(MOF)を逆設計する可能性について検討する。
450の仮説MOF構造を細孔体積の4つの異なるクラスと、Henryの定数値$CO_2$に分類する。
量子回路の確率的性質に合わせて,多クラス分類モデルを開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:43:52 GMT)
Integrability and Chaos via fractal analysis of Spectral Form Factors: Gaussian approximations and exact results [0.0] 量子カオスの開始と、量子多体系のスクランブルを同定する。
我々は,Bethe Ansatz 歩行者が非可積分歩行者と同様のカテゴリーに陥ることを数値的に示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:04:19 GMT)
Information Constraints in Quantum Measurements and State Collapse [0.0] 測定システムにおける情報伝達に関する量子力学的制約とその測定結果への影響について検討した。
測定中、これらの制約が$cal A$による情報の取得を妨げ、$cal S$アンサンブルの純度を特徴付けることが示されている。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:13:47 GMT)
Hyperscaling of Fidelity and Operator Estimations in the Critical Manifold [0.0] 本研究では, 減速運動量モードで支持される観測値の基底状態予測値を, QFTが流れる固定点理論に基づく平均値で近似できることを示す。
以上の結果から,予測値の計算において,QFTをスケール不変の制限で置き換えることが可能なケースの明確化が可能となった。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:20:54 GMT)
Hybrid Quantum Walks Dynamics and Construction of a Quantum Cryptographic Primitive [0.0] ハイブリッド進化演算子は、バイナリ入力メッセージ中のビットの選択に応じて、連続時間量子ウォークと不連続量子ウォークからなる。
提案手法により生成された量子ハッシュ値は,感度解析,衝突解析,統計的特徴解析,誕生日攻撃,均一解析において強い暗号特性を示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:25:34 GMT)
How far can we go with ImageNet for Text-to-Image generation? [0.0] 我々は、よく設計されたテキストと画像拡張で拡張されたImageNetのみを使用して、大規模なWebスクラッドコレクションでトレーニングされたモデルに適合または性能良く対応できることを示す。
GenEvalではSD-XLで+1%, DPGBenchでは+0.5%, パラメータは1/10, トレーニング画像は1/1000に過ぎなかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:26:34 GMT)
Hitchhiker's guide on the relation of Energy-Based Models with other generative models, sampling and statistical physics: a comprehensive review [0.0] エネルギーベースモデル(英語版)は、生成モデリングの領域において強力なフレームワークとして登場した。
このレビューは、物理学者にESMの包括的理解を提供し、他の生成モデルとの関係を説明することを目的としている。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:09:58 GMT)
Heuristic ansatz design for trainable ion-native digital-analog quantum circuits [0.0] 変分量子アルゴリズムは、近未来の量子コンピュータにおいて幅広い問題を解決するための標準的なアプローチとなっている。
本稿では,イオンネイティブデジタルアナログ回路のトレーニング性を高める問題固有アンサッツ構成の同定手法を提案する。
提案手法は、最大15キュービットのシェリントン・カークパトリック・ハミルトンのランダムな例に体系的に適用され、良好なコスト景観を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:00:02 GMT)
Geometrically Regularized Transfer Learning with On-Manifold and Off-Manifold Perturbation [0.0] MAADAは、敵の摂動をオン・マニフォールドとオフ・マニフォールドに分解する新しいフレームワークである。
また,MAADAは,教師なし設定と少数ショット設定の両方において,既存の敵・適応手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:13:09 GMT)
Generalized flux trajectories: New insights into partially coherent Airy beams [0.0] 本稿では,部分コヒーレントビームに対するフラックス軌道の概念の一般化に基づく,新規で洞察に富んだ方法論を提案する。
この方法論は相関係の役割を強調し、なぜビームが伝播に沿って空間的に抜け出すのかを明らかにするのに役立つ。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:08:07 GMT)
GDPRShield: AI-Powered GDPR Support for Software Developers in Small and Medium-Sized Enterprises [0.0] 本稿では,中小企業ソフトウェア開発者の意識を高めることを目的とした,AIを活用した新しいフレームワーク"ShieldShield"を紹介する。
ShieldShield"は、ソフトウェア開発の初期段階からデータ侵害に従おうとする開発者のモチベーションを高める。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:24:34 GMT)
GAMA: Geometry-Aware Manifold Alignment via Structured Adversarial Perturbations for Robust Domain Adaptation [0.0] GAMAは,幾何情報によって誘導される対角摂動による明示的な多様体アライメントを実現する構造的フレームワークである。
GAMAは、構造化正則化と明示的なアライメントにより、一般化を締め付ける。
DomainNet、VisDA、Office-Homeの実証的な結果は、GAMAが既存の敵対的および適応的手法を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:16:42 GMT)
GAMA++: Disentangled Geometric Alignment with Adaptive Contrastive Perturbation for Reliable Domain Transfer [0.0] GAMA++ は (i) ラベルに一貫性のある多様体方向をニュアンス因子から分離するための潜在空間歪みを導入し、 (ii) クラス固有の多様体曲率とアライメントの差分を、オン・アンド・オフ・マニフォールド探索の両方を調整する適応的コントラスト摂動戦略を導入する新しいフレームワークである。
本手法は,標準設定と数ショット設定の両方でDomainNet,Office-Home,VisDAベンチマークの最先端結果を実現し,クラスレベルのアライメント忠実度とバウンダリロバスト性に顕著な改善を加えた。
論文参考訳(メタデータ) (Wed, 21 May 2025 08:16:35 GMT)
Fundamental Complement of a Gravitating Region [0.0] EW$(B)$ は EW$(bar B)$ の空間的な補集合であることを示す。
ビッグバンの宇宙論は、閉じられているにもかかわらず、自明に再構築可能であることが分かりました。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:00:00 GMT)
Functional SDE approximation inspired by a deep operator network architecture [0.0] ディープニューラルネットワークによる微分方程式(SDE)の近似解の導出と解析を行う。
このアーキテクチャはDeep Operator Networks(DeepONets)の概念にインスパイアされたもので、ネットワークに表される基盤の削減という観点からの演算子学習に基づいている。
提案したSDEONetアーキテクチャは,Wienerカオス拡張の最適スパース切り込みを学習することにより,指数複雑性の問題を緩和することを目的としている。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:33:25 GMT)
Federated Learning-Enhanced Blockchain Framework for Privacy-Preserving Intrusion Detection in Industrial IoT [0.0] 産業用IoT(Industrial Internet of Things, IIoT)システムはスマートマニュファクチャリングに不可欠なものになっています。
従来の侵入検知システム(IDS)は、データプライバシやレイテンシ、単一障害点に対する懸念を高める集中型アーキテクチャに依存することが多い。
我々は、IIoT環境に適したプライバシー保護侵入検知のための新しいFederated Learning-Enhanced Framework(FL-BCID)を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:11:44 GMT)
Fast quantum interferometry at the nanometer and attosecond scales with energy-entangled photons [0.0] 2光子干渉は損失や背景の影響を受けないが、ナノメートルスケールの分解能は物理的に実現が困難である。
我々は177Hzで分離された光子周波数を特徴とする非縮退エネルギー絡みによる2光子干渉を強化する。
我々は,背景と損失の有無に関わらず,O(104)$光子対のみのナノメートル(アト秒)スケールで測定分解能を観察した。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:16:19 GMT)
Fast and robust detection of single Rydberg excitations in mesoscopic ensembles [0.0] メソスコピックアンサンブルにおける単一Rydberg励起の検出のための新しい非破壊法を提案する。
このプロトコルは、マイクロ秒の時間スケールで高い忠実度を達成し、プローブレーザ周波数の変化に対して堅牢である。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:49:08 GMT)
Exploring the Potentials and Challenges of Deep Generative Models in Product Design Conception [0.0] DGM-families (VAE, GAN, Diffusion, Transformer, Radiance Field) を解析し,その強度,弱点,製品設計概念の適用性について検討した。
我々の目標は、エンジニアが意思決定プロセスを簡単にし、特定の課題に対してどの方法が最も効果的かを決定するのに役立つ洞察を提供することです。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:55:54 GMT)
Explainable embeddings with Distance Explainer [0.0] 本稿では,機械学習モデルにおける組込み空間の局所的・ポストホックな説明を生成する新しい手法であるDistance Explainerを紹介する。
提案手法は, マスク選択と距離ランクマスクフィルタリングによる帰属値の割り当てにより, 組込みデータ点間の距離を説明するために, RISEのサリエンシに基づく手法に適応する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:42:28 GMT)
Estimation methods of Matrix-valued AR model [0.0] 本稿では,行列自己回帰モデル(MAR)の新しい推定法を提案する。
MARモデルは、高次元の時系列に類似するが、効果的である。
実験の結果,提案手法を用いて推定したMARモデルは,MAEやRMSEなどのメトリクスにまたがるVARモデルに匹敵する適合性を示した。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:47:05 GMT)
Entanglement of Inhomogeneous Free Bosons and Orthogonal Polynomials [0.0] 本論文では,不均一な自由粒子模型の1次元における基底状態の絡み合いエントロピーについて検討する。
非均質ポテンシャルの解析的性質に基づいて, 絡み合いスケーリングにおける先行項を抽出する強力な手法を開発した。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:01:57 GMT)
Entanglement Entropy of a Scalar Field in Anti-de Sitter Space [0.0] 大域座標における3+1次元AdS空間の基底状態における自由質量スカラー場の絡み合いエントロピーについて検討する。
我々は、絡み合いエントロピーにおけるUV-発散項の構造を決定し、各係数の数値を計算する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:59:13 GMT)
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification [0.0] 本研究では, 変圧器アーキテクチャの構造化プルーニングと量子化手法に着目し, 最適化手法の体系的研究を行う。
実験の結果,静的量子化は分類性能を維持しながらエネルギー消費量を29.14%削減し,L1プルーニングは最小精度で推論速度を63%向上させることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 00:52:31 GMT)
Energy transfer between localized emitters in photonic cavities from first principles [0.0] フォトニックキャビティにおける欠陥間のエネルギー伝達の予測を可能にするための第一原理的アプローチを提案する。
我々のアプローチは、量子メモリや超高密度光メモリにおけるエネルギー伝達の制御方法を予測する方法である。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:57:55 GMT)
Encodings of the weighted MAX k-CUT on qubit systems [0.0] 本稿では,重み付きMAX k-CUT問題の量子ビットシステム上での符号化法について検討する。
各種符号化方式について検討し,これらの手法の有効性について検討する。
重み付きおよび非重み付きグラフインスタンスの数値シミュレーションは、これらの符号化方式の有効性を実証する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:24:23 GMT)
Enabling the Reuse of Personal Data in Research: A Classification Model for Legal Compliance [0.0] 本稿では,音素単位のデータを分類し,研究者にその管理方法を伝えるモデルを提案する。
この分類は、欧州一般データ保護規則の原則とスペイン法に基づくその実施に基づいている。
また、個人情報を保管し、データ保護規則の遵守とプライバシーの保護を確実に行える状況についても述べる。
論文参考訳(メタデータ) (Wed, 21 May 2025 06:59:26 GMT)
Dynamics of Correlations and Entanglement Generation in Electron-Molecule Inelastic Scattering [0.0] 核動力学を含む粒子-分子散乱の力学と過程を記述し、解析する。
研究の主なプロセスは、標的分子の解離を引き起こす非弾性過程である原子間電子捕獲(ICEC)である。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:05:51 GMT)
Distillation of multipartite entangled states for arbitrary subsets of parties in noisy quantum networks of increasing size [0.0] 量子ネットワーク状態(quantum network state)は、パーティ間でペアの絡み合いを分散することによって構築される多部状態である。
ネットワーク内の接続性を測定するグラフ理論パラメータが,そのサイズで十分に高速に成長すれば,部分蒸留が実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:54:38 GMT)
Dissipative phase transition of interacting non-reciprocal fermions [0.0] 非相反的な利得と損失過程の存在下で相互作用するフェルミオン鎖について検討した。
ユニタリ進化と2つの散逸過程の間の相互作用は、異なる非相互シグネチャをもたらす。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:21:51 GMT)
Disorder-Order Interface Propagating over the Ferromagnetic Ground State in the Transverse Field Ising Chain [0.0] 横磁場イジング鎖の強磁性相における秩序パラメータと絡み合いの時間的変化を考察する。
本研究では,命令パラメータがゼロでない値に到達した乱数順序インタフェースについて,基底状態と異なる点に着目する。
我々は、サブシステムのR'enyiエンタングルメント対称性を解析し、フォン・ノイマン極限でも保持されると予想される予測を得る。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:05:23 GMT)
Directional Non-Commutative Monoidal Structures for Compositional Embeddings in Machine Learning [0.0] 指向性非可換モノイド作用素上に構築された合成埋め込みのための新しい構造を導入する。
我々の構成では、各軸 i に対して異なる合成演算子 circ_i を定義し、大域的な可換性を与えることなく、各軸に沿って連想結合を保証する。
すべての軸特異作用素は互いに可換であり、一貫した交叉軸合成を可能にする大域的交換法則を強制する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:27:14 GMT)
Deterministic Quantum Search for Arbitrary Initial Success Probabilities [0.0] 本研究では、任意の初期成功確率に対して効果的に動作する決定論的量子探索アルゴリズムを提案する。
提案手法は、確率的量子探索アルゴリズムが必要とする最適数を超える少なくとも1つの追加イテレーションを導入する。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:35:42 GMT)
Determination of language families using deep learning [0.0] 我々は,c-GAN (convolutional generative adversarial) ニューラルネットワークを用いて,現存する,致命的,理解不能なテキスト断片と1つの非解読言語(Cypro-Minoan)を解析した。
論文参考訳(メタデータ) (Wed, 21 May 2025 22:07:11 GMT)
Detector Based Evaluation of Extractable Entanglement in Flat spacetime [0.0] エンタングルメントエントロピーは場の理論における量子相関の定量化に広く用いられている。
エンタングルメントのどれだけが局所的な測定によって物理的に抽出できるかは、まだ不明である。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:25:14 GMT)
Defining Atomicity (and Integrity) for Snapshots of Storage in Forensic Computing [0.0] 我々は,そのような記憶装置の「法的な健全な」取得のための品質基準に関する議論を再考する。
本稿では,単一ターゲットシステムから瞬間的なスナップショットを取得する意図を捉えるための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:19:24 GMT)
Deep Learning Enabled Segmentation, Classification and Risk Assessment of Cervical Cancer [0.0] 世界で4番目に多い女性がんの原因である頸部がんは、パパ・スミアテストによる早期発見が必要である。
本研究では,細胞の境界を区分けし,がん細胞を分離するために境界ボックスを描画することにより,焦点を絞った解析を行った。
様々な解像度とアスペクト比の画像を効果的に処理するために,新しいディープラーニングアーキテクチャであるMulti-Resolution Fusion Deep Convolutional Networkを提案した。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:25:27 GMT)
Data-driven Verification of Procedural Programs with Integer Arrays [0.0] 整数のパラメトリックサイズ配列を操作する手続きプログラムを自動検証する問題に対処する。
本稿では,ループ不変量と手続き前/後条件を合成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:19:21 GMT)
Data-Driven Dynamic Friction Models based on Recurrent Neural Networks [0.0] ゲーテッド・リカレント・ユニット(GRU)アーキテクチャに基づくリカレントニューラルネットワーク(RNN)は、合成データからレート・アンド・ステート摩擦法則の複雑な力学を学習する能力を有する。
その結果, GRUをベースとしたRNNは, 速度ジャンプによる摩擦係数の変化を効果的に予測できることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:54:34 GMT)
DOLCE: Decomposing Off-Policy Evaluation/Learning into Lagged and Current Effects [0.0] オフ政治評価(OPE)とオフ政治学習(OPL)は、歴史的データを利用して対象の政策を評価し最適化する。
複数の時間点からの文脈情報を利用して、報酬をラグと現在の効果に分解する新しい推定器であるラグとカレントエフェクトに非政治評価/学習を分解するDOLCEを提案する。
実験の結果,DOLCE は OPE と OPL の大幅な改善を実現していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:24:02 GMT)
Cultural Value Alignment in Large Language Models: A Prompt-based Analysis of Schwartz Values in Gemini, ChatGPT, and DeepSeek [0.0] 本研究では,大きな言語モデル(LLM)における文化的価値のアライメントを,Gemini,ChatGPT,DeepSeekがSchwartzのバリューフレームワークからどのように価値を優先するかを分析することによって検討する。
ベイズ順序回帰モデルの結果は、自己超越値(例えば、ベネヴァレンス、普遍主義)が全てのモデルで高い優先順位付けがなされていることを示している。
DeepSeekは、ChatGPTやGeminiと比べて独自の自己啓発価値を軽視し、集合主義的な文化的傾向と一致した。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:03:19 GMT)
CrossRF: A Domain-Invariant Deep Learning Approach for RF Fingerprinting [0.0] CrossRFは、クロスチャネルRFフィンガープリントの問題に対処するドメイン不変のディープラーニングアプローチである。
我々は,UAVSigデータセットを用いて,同一のドローンモデルから現実の空中RF信号を含むアプローチを検証する。
実験はCrossRFの効率を示し、Channel 3からChannel 4に適応する際の精度は99.03%に達し、従来の手法では26.39%であった。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:20:10 GMT)
Connectivity matters: Impact of bath modes ordering and geometry in open quantum system simulation with Tensor Network States [0.0] テンソルネットワークに基づく手法は、数値的に正確なシミュレーションを行うための最先端の手法である。
調和系+環境状態が行列積状態として記述され、収束に必要な結合次元を著しく減少させるボソニック環境モードの単純な順序付けを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:36:53 GMT)
Comparative study of the butterfly velocity in holographic QCD models at finite temperature and chemical potential [0.0] 有限温度および化学ポテンシャルにおける様々なホログラムQCDモデルにおける量子カオスについて検討する。
我々は3つの異なる手法を用いてカオスパラメータ、蝶の速度の計算に焦点をあてる。
これら3つの手法で検討した全ホログラムQCDモデルに対して,バタフライ速度について同じ結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:40:11 GMT)
Compact Circuits for Constrained Quantum Evolutions of Sparse Operators [0.0] 我々は、コンパクトな量子回路を構築するための一般的な枠組みを導入し、ハミルトンのリアルタイム進化を$H = sigma P_B$という形で実現する。
我々はまた、量子コンピューティングで広く使われているトランスポジションゲートを構築し、文学における最もよく知られた構成よりも効率的にスケールする。
論文参考訳(メタデータ) (Wed, 21 May 2025 14:02:58 GMT)
Citation Parsing and Analysis with Language Models [0.0] 文書引用をインデックス化可能な形式でマークアップするオープンウェイト言語モデルの能力について検討する。
ボックスからでも、今日の言語モデルでは、各引用の構成要素を特定する上で高いレベルの精度が得られます。
論文参考訳(メタデータ) (Wed, 21 May 2025 19:06:17 GMT)
Characterizing errors in parameter estimation by local measurements [0.0] 本研究では, 1次元鎖に対して設計したスキームを, 最寄りの近傍以外の相互作用を持つトポロジーに適用可能であるか検討する。
平均すると, 隣り合う隣り合う場所と隣り合う場所の間には, 平均的な結合が存在し, 高い誤差が生じることを示す。
また、次のアネレスト近傍相互作用の存在下で、$varepsilon$の関数として推定できる鎖の長さについても検討する。
論文参考訳(メタデータ) (Wed, 21 May 2025 02:02:23 GMT)
Characterization of Efficient Influence Function for Off-Policy Evaluation Under Optimal Policies [0.0] オフ・ポリティィ・アセスメント(OPE)は、カウンターファクト・ポリシーの価値を推定するための強力なフレームワークを提供する。
最適条件下での値関数に対する効率的な影響関数(EIF)の簡潔な特徴付けを確立する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:42:11 GMT)
Causal Predictive Optimization and Generation for Business AI [0.0] 本稿では,営業最適化とビジネスAI,すなわちCausal Predictive Optimization and Generationへの原則的アプローチを紹介する。
我々は、LinkedInにおけるシステムの実装とデプロイについて詳述し、レガシーシステムに対する大きな勝利を示し、この分野に適用可能な学習と洞察を共有する。
論文参考訳(メタデータ) (Wed, 21 May 2025 16:12:30 GMT)
Can LLMs $\textit{understand}$ Math? -- Exploring the Pitfalls in Mathematical Reasoning [0.0] 大規模言語モデル (LLM) は、様々な自然言語処理において大きな可能性を秘めているが、数学的推論において重大な課題に直面している。
そこで本研究では,誤り率,冗長性,妥当性を総合的に評価し,不一致の推論を均一に定量化するMAPLEスコア(Maple score)という評価指標を提案する。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:12:20 GMT)
Calculating the energy profile of an enzymatic reaction on a quantum computer [0.0] 量子コンピューティングは、量子化学計算を可能にするための有望な道を提供する。
最近の研究は、ノイズ中間量子(NISQ)デバイスのためのアルゴリズムの開発とスケーリングに向けられている。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:57:20 GMT)
BiasLab: Toward Explainable Political Bias Detection with Dual-Axis Annotations and Rationale Indicators [0.0] BiasLabは、イデオロギー的偏見を意識した300の政治ニュース記事のデータセットである。
各記事は2つの独立したスケールでクラウドワーカーによってラベル付けされ、民主党と共和党に対する感情を評価している。
我々は、アノテータ間の合意を定量化し、ソースレベルの出口バイアスによる誤調整を分析し、その結果のラベルを解釈可能なサブセットに整理する。
論文参考訳(メタデータ) (Wed, 21 May 2025 23:50:42 GMT)
Beyond Log-Concavity and Score Regularity: Improved Convergence Bounds for Score-Based Generative Models in W2-distance [0.0] 生成モデル(SGM)における$mathcalW$-convergenceを解析するための新しいフレームワークを提案する。
データ分布の弱い対数共振器は時間とともに対数共振器へと進化することを示す。
本手法は,スコア関数とその推定器上での厳密な規則性条件の必要性を回避するものである。
論文参考訳(メタデータ) (Wed, 21 May 2025 09:15:17 GMT)
Benchmarking Energy and Latency in TinyML: A Novel Method for Resource-Constrained AI [0.0] この研究は、エネルギーと遅延の測定を統合する代替のベンチマーク手法を導入する。
設定を評価するために、ニューラルネットワークを実行するためのNPUを含むSTM32N6 MCUをテストした。
その結果,コア電圧とクロック周波数の低減により,前処理と後処理の効率が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 21 May 2025 15:12:14 GMT)
Are LLMs reliable? An exploration of the reliability of large language models in clinical note generation [0.0] 本研究は,CNG における Anthropic, Meta, Mistral, OpenAI のオープンウェイトおよびプロプライエタリ LLM の信頼性を評価する。
全体的にMetaのLlama 70Bが最も信頼性が高く、続いてMistralのSmallモデルが続いた。
論文参考訳(メタデータ) (Wed, 21 May 2025 03:44:13 GMT)
Are AI Agents interacting with Online Ads? [0.0] 本研究では、異なるAIエージェントがオンライン広告とどのように相互作用するか、広告を意思決定プロセスに組み込むか、どの広告フォーマットが最も効果的かを検討する。
我々は,OpenAI GPT-4o, Anthropic Claude, Google Gemini 2.0 Flashなどのマルチモーダル言語モデルを用いた実験を通じて,インタラクションパターン,クリック行動,意思決定戦略を分析した。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:57:26 GMT)
An average case efficient algorithm for solving two-variable linear Diophantine equations [0.0] 2変数線型ディオファント方程式を解くために2つのアルゴリズムを再検討する。
拡張ユークリッドアルゴリズムの反復バージョンを提案する。
我々のアルゴリズムによる平均的な反復回数は、既存の2つのアルゴリズムよりも少ないことがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 07:04:11 GMT)
An Efficient TLS 1.3 Handshake Protocol with VC Certificate Type [0.0] 本稿では,トランスポート層セキュリティ(TLS)ハンドシェイクプロトコルの設計と実装について述べる。
RFC-8446への完全準拠を維持しつつ、TLS 1.3のセキュリティ機能をすべて保持しながら、検証認証(VC)の使用を可能にする。
その結果、大規模モノのインターネット(IoT)システムにおける自己主権のアイデンティティの採用の道が開かれた。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:35:06 GMT)
An Approach Towards Identifying Bangladeshi Leaf Diseases through Transfer Learning and XAI [0.0] 本研究の目的は,深層学習モデルを用いて6植物に21の異なる葉病を分類することである。
VGG19とXceptionは、それぞれ98.90%と98.66%という高い精度を達成している。
論文参考訳(メタデータ) (Wed, 21 May 2025 21:25:57 GMT)
Alpay Algebra: A Universal Structural Foundation [0.0] Alpay Algebraは普遍的、圏論的なフレームワークとして紹介されている。
古典的代数構造と記号的再帰と説明可能なAIの現代的ニーズを統一する。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:18:49 GMT)
AM-PPO: (Advantage) Alpha-Modulation with Proximal Policy Optimization [0.0] 本稿では、動的非線形スケーリング機構を用いて利点推定を適応的に変調するPPOの新たな拡張であるAdvantage Modulation PPO(AM-PPO)を紹介する。
AM-PPOは、勾配の更新を安定させ、方針勾配のランドスケープの条件付けを改善するために、利点信号を再確認する。
これらの知見は、強化学習最適化の強化に広く応用できる手法として、有利な変調の可能性を示している。
論文参考訳(メタデータ) (Wed, 21 May 2025 13:38:45 GMT)
AI-guided Antibiotic Discovery Pipeline from Target Selection to Compound Identification [0.0] タンパク質構造予測と機械学習の最近の進歩は、薬物発見を加速する有望な機会を提供する。
我々は3次元構造認識生成モデルのエンド・ツー・エンドでガイド付き実現を実現する。
この研究は、初期の抗生物質開発に人工知能をデプロイするための比較ベンチマークと青写真を提供する。
論文参考訳(メタデータ) (Wed, 21 May 2025 11:33:14 GMT)
AI-based Decision Support System for Heritage Aircraft Corrosion Prevention [0.0] 本稿では,保護施設に展示・保管されている航空遺産の長期保存のための意思決定支援システムを提案する。
DSSは、チェコのプラハ軍事史研究所(英語版)の航空博物館(英語版)で展示されている第二次世界大戦の航空機の遺産でテストされている。
論文参考訳(メタデータ) (Wed, 21 May 2025 12:40:51 GMT)
AI-Driven Dynamic Firewall Optimization Using Reinforcement Learning for Anomaly Detection and Prevention [0.0] 本稿では,新しいAI駆動動的ファイアウォール最適化フレームワークを提案する。
進化するネットワーク脅威に対応するために、自動でファイアウォールルールを適応し、更新する。
その結果、検出精度、偽陽性の低減、ルール更新のレイテンシが大幅に改善された。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:05:33 GMT)
AI vs. Human Judgment of Content Moderation: LLM-as-a-Judge and Ethics-Based Response Refusals [0.0] 本稿では,モデルに基づく評価手法がユーザと異なる反応を評価できるかどうかを検討する。
LLM-as-a-Judgeシステムでは,人間よりも倫理的拒絶が有意に良好であることがわかった。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:56:16 GMT)
A partition function framework for estimating logical error curves in stabilizer codes [0.0] 最大分割関数復号における成功確率を測定する分割関数の比率を定義する。
この比は、同様に定義された順序確率と異なり、成功率を順序確率で記述した復号戦略を記述する。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:03:15 GMT)
A Temperature Change can Solve the Deutsch-Josza Problem : An Exploration of Thermodynamic Query Complexity [0.0] 我々は、キュービット熱機械がオーラクルとしてどのように振る舞うかを示し、プローブと熱交換によって問い合わせる。
また、線形熱オラクルと1つの熱クエリー解を持つベルンシュタイン・ヴァジラニ問題についても検討する。
この研究は熱力学と複雑性理論を橋渡しし、量子熱力学コンピューティングのための新しいテストベッドを示唆している。
論文参考訳(メタデータ) (Wed, 21 May 2025 18:00:00 GMT)
A Survey On Secure Machine Learning [0.0] セキュアマルチパーティ計算(MPC)の最近の進歩は、機械学習(ML)領域における適用性を著しく改善している。
このレビューでは、MPCを活用して、データのプライバシを損なうことなく、複数のパーティがMLタスクに参加できるようにする重要なコントリビューションについて検討する。
特殊なソフトウェアフレームワークやドメイン固有言語といった革新は、MLにおけるMPCの採用を合理化している。
論文参考訳(メタデータ) (Wed, 21 May 2025 05:19:45 GMT)
A Framework for Non-Linear Attention via Modern Hopfield Networks [0.0] 現代ホップフィールドネットワーク(MNH)の線に沿ったエネルギー関数計算を提案する。
エネルギーランドスケープを埋め込んだ$n$のトークンは、その勾配が注意に一致するように定義される。
論文参考訳(メタデータ) (Wed, 21 May 2025 10:33:01 GMT)
A Deep Learning Framework for Two-Dimensional, Multi-Frequency Propagation Factor Estimation [0.0] このコミュニケーションは、パターン伝播係数を推定するためにディープニューラルネットワークを用いた新しいアプローチを探索する。
ディープニューラルネットワークは、複数の周波数を分析し、パターン伝播係数を合理的に予測するように訓練することができる。
論文参考訳(メタデータ) (Wed, 21 May 2025 17:56:02 GMT)