Fugu-MT: arxivの論文翻訳(概要)

Sampling and Uniqueness Sets in Graphon Signal Processing [125.1]
グラフとグラフの極限の理論を活用して、大きなグラフの族上のサンプリング集合の性質について検討する。我々は、収束結果を利用して、ほぼ最適なサンプリングセットを得るアルゴリズムを提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:31:24 GMT)
Convolutional Filtering with RKHS Algebras [110.1]
我々は、Kernel Hilbert Spaces(RKHS)の再生のための畳み込み信号処理とニューラルネットワークの理論を開発する。任意の RKHS が複数の代数的畳み込みモデルの形式的定義を可能にすることを示す。本研究では,無人航空機による実測値から無線通信を予測できる実データに関する数値実験について述べる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:43:53 GMT)
QuantFace: Low-Bit Post-Training Quantization for One-Step Diffusion Face Restoration [109.9]
拡散モデルは顔修復において顕著な性能を発揮している。拡散モデルの重い計算は、スマートフォンのようなデバイスにそれらを展開するのを困難にしている。一段階拡散面復元モデルのための新しい低ビット量子化法であるQuantFaceを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:52:59 GMT)
Mixture of insighTful Experts (MoTE): The Synergy of Thought Chains and Expert Mixtures in Self-Alignment [103.1]
MoTE(Mixture of insightful Experts)は、推論チェーンとエキスパートミックスを組み合わせて自己調整を改善する新しいフレームワークである。 MoTEはモデルの安全性、脱獄耐性、過剰な拒否機能を大幅に改善し、OpenAIの最先端のo1モデルに匹敵するパフォーマンスを実現している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:48:57 GMT)
Not Every Token Needs Forgetting: Selective Unlearning to Limit Change in Utility in Large Language Model Unlearning [95.5]
従来のアンラーニングアプローチでは、ターゲットドキュメント内のすべてのトークンを忘れるために、モデルのパラメータを無差別に更新する。本研究では,選択的アンラーニング(SU)を提案する。これは,不要な情報に関連付けられた,忘れる集合内のトークンの重要なサブセットを識別する。 2つのベンチマークと6つのベースラインのアンラーニングアルゴリズムの実験により、SUは対象の忘れたデータに対して効果的なアンラーニングを達成するだけでなく、保持セットにおけるモデルの実用性を著しく維持することを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:36:45 GMT)
How Do LLMs Acquire New Knowledge? A Knowledge Circuits Perspective on Continual Pre-Training [92.9]
大きな言語モデル(LLM)は、どのようにして新しい知識を内部化するかを理解する上で、重大なギャップに直面します。知識記憶と処理を容易にする計算サブグラフを同定する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:43:20 GMT)
FINEREASON: Evaluating and Improving LLMs' Deliberate Reasoning through Reflective Puzzle Solving [90.9]
FINEREASONは、大規模言語モデルの推論能力を評価するための論理パズルベンチマークである。状態チェックと状態遷移という2つのタスクを導入し、モデルが現在の状況をどのように評価するかを総合的に評価し、次の動きを計画する。状態チェックと遷移データに基づいてトレーニングされたモデルでは、GSM8Kで最大5.1%の精度で数学推論が向上することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:57:10 GMT)
Toward a Theory of Agents as Tool-Use Decision-Makers [89.3]
真の自律性は、エージェントが、彼らが知っていること、必要なこと、そしてその知識を効率的に獲得する方法を統治する、一貫性のある疫学の枠組みに根ざす必要がある、と我々は主張する。本研究では,内的推論と外的行動を等価な疫学ツールとして扱う統一理論を提案し,エージェントが内観と相互作用を体系的に調整することを可能にする。この視点は、エージェントの設計を単なるアクションエグゼクタから知識駆動インテリジェンスシステムにシフトさせ、適応的で効率的でゴール指向の行動が可能な基礎エージェントを構築するための原則化された道筋を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:52:16 GMT)
VLM-3R: Vision-Language Models Augmented with Instruction-Aligned 3D Reconstruction [86.8]
本稿では,視覚言語モデル(VLM)のための統合フレームワークであるVLM-3Rについて紹介する。 VLM-3Rは、空間的理解を表す暗黙の3Dトークンを導出する幾何学エンコーダを用いて、モノクロビデオフレームを処理する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:20:16 GMT)
FORT: Forward-Only Regression Training of Normalizing Flows [85.7]
我々は,古典正規化フローを,精度の高い一段階生成モデルとして再考する。本稿では,従来の最大度学習で用いられる可変式の変更を計算する必要のない,スケーラブルな学習目標を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:32:27 GMT)
SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement [81.3]
SynWorldは、エージェントが自律的に環境を探索し、最適化し、アクションに対する理解を深めることを可能にするフレームワークである。実験の結果,SynWorldは新しい環境下での行動知識の学習に効果的で汎用的なアプローチであることを実証した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:35:07 GMT)
Flash3D: Feed-Forward Generalisable 3D Scene Reconstruction from a Single Image [80.5]
Flash3Dは、1つの画像からシーン再構成と新しいビュー合成を行う方法である。一般性については、単分子深度推定のための「基礎」モデルから始める。効率性のために、我々はこの拡張をフィードフォワードガウススプラッティングに基づける。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:23:12 GMT)
CoVoMix2: Advancing Zero-Shot Dialogue Generation with Fully Non-Autoregressive Flow Matching [79.0]
CoVoMix2はゼロショットマルチトーカー対話生成のためのフレームワークである。フローマッチングに基づく生成モデルを用いて、マルチストリームの転写からメルスペクトルを予測する。提案手法は,MoonCastやSesameといった強力なベースラインを,音声品質,話者の整合性,推論速度で上回り,最先端の性能を実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:51:45 GMT)
Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases [78.6]
テキストリッチなグラフ知識ベース(TG-KB)は、テキストおよび構造的知識を提供することで、クエリに応答する上でますます重要になっている。本研究では,これら2種類の知識を計画・推論・組織化フレームワークを用いて検索するための構造・テキスト検索(MoR)の混合を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:30:58 GMT)
ProtInvTree: Deliberate Protein Inverse Folding with Reward-guided Tree Search [77.6]
ProtInvTreeはタンパク質逆フォールディングのための報酬誘導ツリー検索フレームワークである。シークエンス生成は、意図的に、ステップワイズな意思決定プロセスとして再構成される。検索深度と幅を広げて、再トレーニングすることなく、フレキシブルなテストタイムスケーリングをサポートする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:34:20 GMT)
The Nature of NLP: Analyzing Contributions in NLP Papers [77.3]
我々は,NLP研究論文の要約として,NLPコントリビューション(NLPコントリビューション)の分類法を提案し,NLPコントリビューション(NLPコントリビューション)を導入した。 NLPの研究は、1970年代から80年代にかけて言語と人間中心の研究に焦点が当てられ、1990年代と2000年代に打ち切られ、2010年代後半から再び上昇し始めた。私たちのデータセットと分析は、研究トレンドをトレースするための強力なレンズを提供し、インフォグラフィックでデータ駆動の文献調査を生成する可能性を提供します。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:12:08 GMT)
Text-To-Speech Synthesis In The Wild [76.7]
我々は、VoxCeleb1データセットに適用された完全に自動化されたパイプラインを通じて生成されるTS In the Wildデータセットを紹介します。 TITW-Hardは、生のVoxCeleb1データの転写、セグメンテーション、選択から派生したTITW-Hardと、DNSMOSに基づいたさらなる拡張とデータ選択を含むTITW-Easyの2つのトレーニングセットで構成されている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:29:36 GMT)
LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews [74.9]
この研究は、微粒な遅延思考カテゴリで注釈付けされたピアレビュー文のデータセットであるLazyReviewを紹介している。大規模言語モデル(LLM)は、ゼロショット設定でこれらのインスタンスを検出するのに苦労する。命令ベースのデータセットの微調整により、パフォーマンスが10～20ポイント向上する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:08:28 GMT)
A Survey of LLM $\times$ DATA [72.0]
大規模言語モデル(LLM)とデータ管理(Data4LLM)の統合は、両方のドメインを急速に再定義しています。一方、Data data4LLMは、事前トレーニング、後トレーニング、検索強化生成、エージェント生成などの段階に必要なデータの高品質、多様性、タイムラインをLLMに提供する。一方、LLMはデータ管理のための汎用エンジンとして登場しつつある。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:00:34 GMT)
SocialEval: Evaluating Social Intelligence of Large Language Models [70.9]
ソーシャルインテリジェンス(英語版) (SI) は、社会的目標を達成するために社会的相互作用をナビゲートする際に賢明に行動する対人能力を持つ人間を装備する。結果指向の目標達成評価とプロセス指向の対人能力評価という,運用評価パラダイムを提示する。スクリプトベースのバイリンガルSIベンチマークであるSocialEvalを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:36:51 GMT)
LAQuer: Localized Attribution Queries in Content-grounded Generation [69.6]
グラウンドドテキスト生成モデルは、しばしば元の資料から逸脱したコンテンツを生成し、正確性を保証するためにユーザの検証を必要とする。既存の属性メソッドは、全文とソース文書を関連付けるが、これは特定のクレームを事実チェックしようとするユーザにとって圧倒的に多い。これは、生成された出力の選択したスパンを対応するソーススパンにローカライズし、きめ細かな、ユーザ指向のアトリビューションを可能にする新しいタスクである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:46:23 GMT)
REALM: A Dataset of Real-World LLM Use Cases [69.6]
REALMは、Redditやニュース記事から収集された94,000以上のLarge Language Models (LLM)ユースケースのデータセットである。 LLMの多様な応用とユーザの人口統計の2つの重要な側面を捉えている。 LLMアプリケーションを分類し、ユーザの職業が使用するアプリケーションの種類とどのように関連しているかを調査する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:21:49 GMT)
SynPO: Synergizing Descriptiveness and Preference Optimization for Video Detailed Captioning [69.3]
我々は、選好学習を活用し、細粒度ビデオキャプションにおける視覚言語モデルの性能を向上させる。本稿では,DPOとその変種に対する大きな優位性を示す新しい最適化手法を提案する。その結果、SynPOはトレーニング効率を20%向上しつつ、DPOの変種を一貫して上回っていることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:51:49 GMT)
Measuring What Makes You Unique: Difference-Aware User Modeling for Enhancing LLM Personalization [68.8]
本稿では,Large Language Models (LLM) のパーソナライゼーションを強化するために,差分認識パーソナライズ学習(DPL)を提案する。 DPLは、戦略的に代表ユーザを比較のために選択し、タスク関連の違いを抽出するための構造化標準を確立する。実世界のデータセットの実験により、DPLはLLMのパーソナライゼーションを大幅に向上させることが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:09:47 GMT)
OG-VLA: 3D-Aware Vision Language Action Model via Orthographic Image Generation [68.1]
3D対応のポリシーは、精密なロボット操作タスクにおいて最先端のパフォーマンスを実現するが、見えない指示、シーン、オブジェクトへの一般化に苦慮している。我々は,視覚言語行動モデル(VLA)の一般化強度と3D対応ポリシーの堅牢性を組み合わせた,新しいアーキテクチャと学習フレームワークであるOG-VLAを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:15:45 GMT)
FreeInsert: Disentangled Text-Guided Object Insertion in 3D Gaussian Scene without Spatial Priors [67.3]
FreeInsertは空間配置からオブジェクト生成を分離する新しいフレームワークである。意味的コヒーレント、空間的正確、視覚的にリアルな3D挿入を実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:44:11 GMT)
GOBench: Benchmarking Geometric Optics Generation and Understanding of MLLMs [66.6]
本稿では,光学的認証画像の生成と光現象の理解という,MLLMの能力を評価する最初のベンチマークであるGOBenchを紹介する。次に、光学的正当性、審美的品質、指示忠実度に基づいて、生成した画像を評価するための主観的な実験を組織する。本研究は,11個の著名なMLLMの光学的理解能力をテストするために,手作業による評価手法を適用した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:46:14 GMT)
Calling a Spade a Heart: Gaslighting Multimodal Large Language Models via Negation [65.9]
本稿では,様々なベンチマークにおいて最先端MLLMを体系的に評価する。本稿では,MLLMの脆弱性を否定的議論に対して評価するために設計された,最初のベンチマークであるGaslightingBenchを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:45:54 GMT)
Language in the Flow of Time: Time-Series-Paired Texts Weaved into a Unified Temporal Narrative [65.8]
テキスト・アズ・タイム・シリーズ(TaTS)は、既存の数値のみの時系列モデルにプラグインできる。 TaTSはモデルアーキテクチャを変更することなく予測性能を向上させることができることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:46:24 GMT)
MFCLIP: Multi-modal Fine-grained CLIP for Generalizable Diffusion Face Forgery Detection [64.3]
フォトリアリスティック・フェイスジェネレーション手法の急速な発展は、社会やアカデミックにおいて大きな関心を集めている。既存のアプローチは主に画像モダリティを用いて顔の偽造パターンをキャプチャするが、きめ細かいノイズやテキストのような他のモダリティは完全には探索されていない。そこで本研究では,画像ノイズの多点にわたる包括的かつきめ細かなフォージェリートレースをマイニングする,MFCLIP(MF-modal Fine-fine-fine-fine-fine-fine CLIP)モデルを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:50:35 GMT)
GraphPad: Inference-Time 3D Scene Graph Updates for Embodied Question Answering [63.2]
GraphPadは変更可能な構造化メモリで、エージェントはAPI呼び出しを通じてタスクのニーズに合わせて調整できる。環境を表す可変なシーングラフと、フレームごとにインデックスするナビゲーションログと、タスク固有のノート用のスクラッチパッドとを備える。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:13:38 GMT)
Can Graph Neural Networks Learn Language with Extremely Weak Text Supervision? [62.1]
本稿では,事前学習したグラフニューラルネットワークを下流タスクやデータに適用するためのマルチモーダル・プロンプト学習パラダイムを提案する。我々の新しいパラダイムは、グラフプロンプトとテキストプロンプトの両方を同時に学習することで、Large Language Models(LLM)と直接同じ空間にグラフを埋め込む。私たちは、GNNを極めて弱いテキスト管理で見えないクラスに一般化できるCLIPスタイルのゼロショット分類プロトタイプを構築した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:26:04 GMT)
CoP: Agentic Red-teaming for Large Language Models using Composition of Principles [61.4]
本稿では,Large Language Models (LLM) のリピートプロセスを自動化するエージェントワークフローを提案する。ヒューマンユーザは、AIエージェントへの指示として、効果的な赤チーム戦略を自動オーケストレーションし、ジェイルブレイクプロンプトを生成する、一連の赤チームの原則を提供する。先進的なLLMに対して試験すると、CoPは新しいジェイルブレイクプロンプトを見つけ、最もよく知られているシングルターン攻撃の成功率を19.0倍に改善することで、前例のない安全リスクを明らかにしている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:18:41 GMT)
3D Skeleton-Based Action Recognition: A Review [60.1]
3Dスケルトンに基づく行動認識は、コンピュータビジョンの分野において顕著な話題となっている。以前のレビューでは主にモデル指向の視点を採用しており、しばしば骨格に基づく行動認識に関わる基本的なステップを無視している。本稿では,骨格に基づく行動認識を理解するための包括的,タスク指向のフレームワークを提案することによって,これらの制約に対処することを目的とする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:04:12 GMT)
NTPP: Generative Speech Language Modeling for Dual-Channel Spoken Dialogue via Next-Token-Pair Prediction [59.4]
話者に依存しない双方向音声対話学習を実現するために,新しい生成モデルパラダイムであるNext-Token-Pair Prediction(NTPP)を導入する。提案手法であるNTPPは, ターンテイク予測, 応答コヒーレンス, 自然性の観点から, SLMの会話能力を大幅に向上することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:01:40 GMT)
Compress, Gather, and Recompute: REFORMing Long-Context Processing in Transformers [59.0]
REFORMは、2フェーズアプローチによって、長いコンテキストを効率的に処理する新しい推論フレームワークである。 RULERとBABILongでそれぞれ1Mコンテキスト長で50%以上と27%のパフォーマンス向上を達成した。また、Infinite-BenchとMM-NIAHのベースラインを上回り、さまざまなタスクやドメインの柔軟性を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:49:14 GMT)
Mamba Drafters for Speculative Decoding [58.1]
SSM(State-of-the-art State Space Model)であるMambaをベースとした新しいドラフトモデルを提案する。 SSMの線形構造を活用することにより、従来のトランスフォーマー法に固有の二次的複雑性を回避することができる。高品質なドラフト候補を生成するための新しいテスト時間木探索アルゴリズムにより、効率をさらに向上する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:52:47 GMT)
Generalization Performance of Ensemble Clustering: From Theory to Algorithm [57.2]
本稿では,アンサンブルクラスタリングにおける一般化誤差,過剰リスク,一貫性に着目した。有限クラスタリングに様々な重みを割り当てることで、経験的平均クラスタリングと期待値との誤差を最小化する。我々は、新しいアンサンブルクラスタリングアルゴリズムを開発するために、我々の理論をインスタンス化する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:34:52 GMT)
Motion-Aware Concept Alignment for Consistent Video Editing [57.1]
MoCA-Video (Motion-Aware Concept Alignment in Video) は、画像ドメインのセマンティックミキシングとビデオのギャップを埋めるトレーニング不要のフレームワークである。生成されたビデオとユーザが提供した参照画像が与えられた後、MoCA-Videoは参照画像のセマンティックな特徴をビデオ内の特定のオブジェクトに注入する。我々は、標準SSIM、画像レベルLPIPS、時間LPIPSを用いてMoCAの性能を評価し、新しいメトリクスCASS(Conceptual Alignment Shift Score)を導入し、ソースプロンプトと修正ビデオフレーム間の視覚的シフトの一貫性と有効性を評価する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:28:04 GMT)
UniRestore: Unified Perceptual and Task-Oriented Image Restoration Model Using Diffusion Prior [56.4]
画像復元は、悪天候、ぼやけ、騒音などの様々な要因によって劣化した入力からコンテンツを回復することを目的としている。本稿では,PIRとTIRのギャップを埋める統一画像復元モデルUniRestoreを紹介する。本稿では,分解エンコーダの特徴を再構築するための補足的特徴回復モジュール (CFRM) と,デコーダの適応的特徴融合を容易にするタスク特徴適応モジュール (TFA) を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:49:00 GMT)
How Programming Concepts and Neurons Are Shared in Code Language Models [55.2]
2つのLlamaモデルを用いて,21個のPLペアに対して数ショットの翻訳処理を行う。概念空間は英語に近づき(PLキーワードを含む)、中間層後半の英語トークンに高い確率を割り当てる。我々は11個のPLと英語のニューロンの活性化を分析し、言語特異的ニューロンが主に下層に集中しているのに対し、各PL専用のニューロンは上層に現れる傾向にあることを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:24:13 GMT)
GAMEBoT: Transparent Assessment of LLM Reasoning in Games [54.5]
GAMEBoTは、大規模言語モデルの厳格な評価のために設計されたゲームアリーナである。我々は,8つのゲームにまたがる17の卓越したLSMをベンチマークし,様々な戦略能力とゲーム特性について検討した。以上の結果から,LDMに詳細なCoTプロンプトが付与されている場合でも,GAMEBoTは大きな課題となることが示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:49:56 GMT)
CAPAA: Classifier-Agnostic Projector-Based Adversarial Attack [54.0]
プロジェクタをベースとした対向攻撃は、深い画像分類を騙すために、シーンに光パターンを投影することを目的としている。プライバシー保護やより堅牢な分類器の開発に応用できる可能性がある。これらの問題に対処するために、重み付け型プロジェクタベースアドリアアタック(CAPAA)を導入する。 CAPAAは、既存のベースラインよりも高い攻撃成功率と高いステルスネスを達成する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:17:49 GMT)
Enhancing Multimodal Unified Representations for Cross Modal Generalization [52.2]
我々は、コードブック(TOC)のトレーニング不要最適化と、FCID(Fin and Coarse Cross-modal Information Disentangling)を提案する。これらの方法は、各モードの特定の特性に合わせて、事前学習から統一された離散表現を洗練し、きめ細かな情報と粗い情報の絡み合わせを行う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:09:27 GMT)
ObjectAdd: Adding Objects into Image via a Training-Free Diffusion Modification Fashion [52.0]
我々は,ユーザ指定領域にユーザ予測オブジェクトを追加するトレーニング不要な拡散修正手法であるObjectAddを紹介する。テキストをプロンプトした画像では、ユーザがボックスとオブジェクトを指定することができ、(1) ボックス領域内にオブジェクトを追加すること、(2) ボックス領域の外で正確なコンテンツを追加すること、(3) ボックス領域間の不完全な融合を実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:12:43 GMT)
Exploring Model Kinship for Merging Large Language Models [52.0]
本稿では,大規模言語モデル間の類似性や関連性の程度であるモデル親和性を紹介する。モデル統合後の性能向上とモデル親和性の間には,一定の関係があることが判明した。我々は新しいモデルマージ戦略を提案する。Top-k Greedy Merging with Model Kinship。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:39:29 GMT)
FlexSelect: Flexible Token Selection for Efficient Long Video Understanding [51.5]
長ビデオ処理のためのフレキシブルで効率的なトークン選択戦略であるFlexSelectを提案する。クロスモーダルなアテンションパターンを活用することで、最も意味のあるコンテンツを識別し、保持する。 VideoMME、MLVU、LongVB、LVBenchなど、複数の長ビデオベンチマークで大きく伸びている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:49:39 GMT)
FlowMo: Variance-Based Flow Guidance for Coherent Motion in Video Generation [51.1]
FlowMoは、テキスト・ビデオ・モデルにおける動きコヒーレンスを高めるためのトレーニング不要のガイダンス手法である。時間次元のパッチワイドな分散を測定して動きのコヒーレンスを推定し、サンプリング中にこの分散を動的に減少させるためにモデルを導く。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:55:33 GMT)
NFIG: Autoregressive Image Generation with Next-Frequency Prediction [50.7]
textbfNext-textbfFrequency textbfImage textbfGeneration (textbfNFIG) は、画像生成プロセスを複数の周波数誘導段階に分解する新しいフレームワークである。提案手法では,まず低周波成分を生成し,より少ないトークンで大域構造を確立する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:52:55 GMT)
Taming LLMs by Scaling Learning Rates with Gradient Grouping [49.9]
大きな言語モデル(LLM)のトレーニングは、その大規模で異質なアーキテクチャのため、課題を提起する。 SGG(Scaling with Gradient Grouping)は、動的グルーピングとグループ固有のスケーリングによる適応的な学習率推定を改善するグラデーションラッパーである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:30:37 GMT)
PromptVFX: Text-Driven Fields for Open-World 3D Gaussian Animation [49.9]
フィールド予測タスクとして3Dアニメーションを再構成し、3Dガウスに作用する時間変化の4Dフロー場を推定するテキスト駆動フレームワークを導入する。大規模言語モデル(LLM)と視覚言語モデル(VLM)を関数生成に活用することにより,任意のプロンプトを解釈し,色,不透明度,位置をリアルタイムで更新する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:22:59 GMT)
Multiresolution Analysis and Statistical Thresholding on Dynamic Networks [49.1]
ANIE(Adaptive Network Intensity Estimation)は、ネットワーク構造が進化する時間スケールを自動的に識別する多段階フレームワークである。 ANIEは適切な時間分解能に適応し、ノイズに頑健でありながら鋭い構造変化を捉えることができることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:55:55 GMT)
FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control [49.1]
FastTD3は強化学習(RL)アルゴリズムで、1つのA100 GPU上で3時間以内のHumanoidBenchタスクを解く。我々はまた、ロボット工学におけるRL研究を加速するために、FastTD3の軽量で使いやすい実装を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:51:56 GMT)
CC-Tuning: A Cross-Lingual Connection Mechanism for Improving Joint Multilingual Supervised Fine-Tuning [48.7]
CC-Tuningは、多言語間接続機構を潜在レベルで明確に確立する、新しい多言語ファインチューニングパラダイムである。訓練中、CC-Tuningは英語と非英語の両方からのフィードフォワードアクティベーションを融合させ、モデルが両方の言語資源の恩恵を受けることを可能にする。 22の言語をカバーする6つのベンチマークの実験では、CC-TuningはバニラSFTより優れており、データレベルの拡張方法に代わる強力な潜在レベルを提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:20:55 GMT)
Test Automation for Interactive Scenarios via Promptable Traffic Simulation [48.2]
本稿では,対話型シナリオにおけるAVプランナ評価のための,現実的かつ安全クリティカルな人間の行動を生成する自動化手法を提案する。我々は低次元目標位置を用いて複雑な人間の行動のパラメータ化を行い、それをプロンプト可能な交通シミュレータProSimに入力する。テスト生成を自動化するために,目標領域を探索し,ベイズ最適化を用いて安全クリティカルな動作を効率的に識別するプロンプト生成モジュールを導入する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:29:32 GMT)
Efficient conversion from fermionic Gaussian states to matrix product states [48.2]
フェミオンガウス状態から行列積状態に変換する高効率なアルゴリズムを提案する。翻訳不変性のない有限サイズ系に対しては定式化できるが、無限系に適用すると特に魅力的になる。この手法のポテンシャルは、2つのキラルスピン液体の数値計算によって示される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:32:09 GMT)
MEXA: Multilingual Evaluation of English-Centric LLMs via Cross-Lingual Alignment [48.0]
MEXAは、英語中心の大規模言語モデルの多言語能力を評価する方法である。 MEXAは並列文を用いて英語と非英語のアライメントを計算する。このアライメントは、異なる言語でのモデルパフォーマンスを推定するために使用することができる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:44:36 GMT)
Improving Model Factuality with Fine-grained Critique-based Evaluator [47.4]
我々は、請求レベルの事実性フィードバックをLMジェネレータに提供するファクトリティー評価器であるFenCEを訓練する。本稿では、FenCEを活用してトレーニングデータを構築することにより、LMジェネレータの現実性を向上するフレームワークを提案する。実験の結果,LLM-AggreFactでは評価器の精度が2.9%向上した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:27:41 GMT)
Toward Global Convergence of Gradient EM for Over-Parameterized Gaussian Mixture Models [47.3]
ガウス混合モデル(GMM)の勾配予測-最大化(EM)アルゴリズムについて検討する。これは、2ドル以上の成分を持つガウス混合に対する最初の大域収束結果である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:43:10 GMT)
PCoreSet: Effective Active Learning through Knowledge Distillation from Vision-Language Models [46.6]
本稿では,能動学習と知識蒸留を統合したフレームワークであるActiveKDを紹介する。特徴空間よりも確率空間のカバレッジを最大化する選択戦略であるPCoreSetを提案する。 PCoreSetはActiveKDフレームワーク内の既存の選択メソッドよりも一貫して優れています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:54:37 GMT)
Bridging the Gap: From Ad-hoc to Proactive Search in Conversations [46.5]
会話における能動的検索 (PSC) は、会話の文脈に与えられた有用な情報を積極的に検索することで、明示的なクエリを定式化する際のユーザの労力を減らすことを目的としている。以前のPSCの作業では、このコンテキストをオフザシェルのアドホックレトリバーへの入力として直接使用するか、PSCデータ上でそれらを微調整する。アドホック検索は短く簡潔なクエリで事前訓練されるが、PSCの入力は長くノイズが多い。アドホック検索とPSCの入力ギャップを埋めることで、アドホック検索をPSCに適応させる新しいフレームワークであるConv2Queryを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:30:58 GMT)
Learning Successor Features with Distributed Hebbian Temporal Memory [45.0]
本稿では,不確実性のある意思決定におけるオンラインシーケンス学習の課題に対処するための新しいアプローチを提案する。提案アルゴリズムは,因子グラフ形式と多成分ニューロンモデルに基づく分散ヘビアンテンポラルメモリ (DHTM) である。実験の結果, DHTMは非定常データセット上でLSTM, RWKV, 生物学的にインスパイアされたHMMライクなアルゴリズムCSCGより優れていた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:53:35 GMT)
Neuro-Symbolic Generative Diffusion Models for Physically Grounded, Robust, and Safe Generation [44.8]
Neuro-Symbolic Diffusion (NSD)は、拡散ステップをシンボル最適化でインターリーブする新しいフレームワークである。本稿では,ユーザ定義機能制約および論理制約の下で,確実に一貫したサンプルを生成するNSDを提案する。この能力は,(1)非毒性分子生成と衝突のない軌道最適化の文脈における安全性,(2)薬物発見や材料工学などの領域におけるデータ不足,(3)領域外一般化の3つの課題にまたがる課題において実証される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:58:59 GMT)
GuessBench: Sensemaking Multimodal Creativity in the Wild [44.8]
広汎でノイズの多い,多元的な人間の創造性をモデル化する上で,視覚言語モデル(VLM)を評価する新しいベンチマークであるGuessBenchを提案する。 GuessBenchは、オンラインマルチプレイヤーMinecraftミニゲーム「Guess the Build」のデータを入手している。静的画像設定や動的画像設定,自然言語ヒントなど,2000年問題の実際のゲームプレイから1500枚の画像をキュレートする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:32:36 GMT)
AfriHuBERT: A self-supervised speech representation model for African languages [44.7]
AfriHuBERTは、147言語で事前訓練された、コンパクトな自己教師付き学習(SSL)モデルであるmHuBERT-147の拡張である。 mHuBERT-147は16のアフリカの言語をカバーしていたが、様々な情報源から10K時間以上の音声データを事前学習することで1,226に拡張した。音声言語識別(SLID)と音声認識(ASR)の2つの重要なタスクについてAfriHuBERTを評価する。 SLIDは3.6%, 平均単語誤り率(WER)は2.1%, 平均単語誤り率(WER)はmHuBERT-147。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:49:58 GMT)
Projection Pursuit Density Ratio Estimation [44.7]
密度比推定(DRE)は、複数の領域にまたがる幅広い応用のために、機械学習において最重要課題である。密度比を推定するパラメトリック法は、モデルが不特定であればバイアスのある結果をもたらす可能性がある。従来の非パラメトリック手法は、データ次元が大きければ次元の呪いに悩まされる。本稿では,投射追跡近似に基づく新しいDRE手法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:15:07 GMT)
"My life is miserable, have to sign 500 autographs everyday": Exposing Humblebragging, the Brags in Disguise [44.6]
テキスト中のハンブルブラッグを自動的に検出するタスクを導入する。本研究では, 機械学習, ディープラーニング, および大規模言語モデルを用いて, ハンブルブラッギングを4タプルで定義し, 評価する。実験の結果,ヒトでもハンブルブラッグの検出は容易ではないことがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:44:14 GMT)
Marine Saliency Segmenter: Object-Focused Conditional Diffusion with Region-Level Semantic Knowledge Distillation [44.5]
海洋衛生(MSS)は、様々な視覚に基づく海洋探査において重要な役割を担っている。拡散モデルに基づく新しい海洋塩分セグメンタDiffMSSを提案する。我々は、過度に信頼された誤認識を抑制するために、専用決定論的コンセンサスサンプリングを開発する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:20:14 GMT)
Unlabeled Data Improves Fine-Grained Image Zero-shot Classification with Multimodal LLMs [44.2]
AutoSEPは、きめ細かい分類機能を強化するために設計された、自己教師型プロンプト学習フレームワークである。私たちの中核となる考え方は、ラベルのないデータを活用して、MLLMに重要な差別的特徴を特定するための説明プロンプトを学ぶことです。 AutoSEPは、標準のゼロショット分類よりも平均で13%、最高のパフォーマンスのベースラインよりも5%改善している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:04:07 GMT)
Wanda++: Pruning Large Language Models via Regional Gradients [44.2]
大規模言語モデル(LLM)プルーニングは、最小限の精度で推論スピードアップのための重要でない重みを取り除こうとする。本稿では,デコーダブロックレベルのtextbf 局所勾配を利用して,最先端の手法より優れた新しいプルーニングフレームワーク Wanda++ を提案する。 We show that Wanda++ improves perplexity as up 32% over the Wanda in the language modeling task and effectiveizes to downstream task。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:48:29 GMT)
Relevant or Random: Can LLMs Truly Perform Analogical Reasoning? [44.2]
自己生成例は,特定のタスクにおいて同等あるいはさらに優れたパフォーマンスが得られることを示す。自己生成例の精度が重要な要素であることに気付き、その後2つの新しい手法を設計する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:07:35 GMT)
Electrically tunable quantum interference of atomic spins on surfaces [43.7]
走査トンネル顕微鏡における絶縁膜上の原子スピンを用いた量子干渉の電気的制御を実証する。我々は、プローブ先端と表面原子間の原子間磁気相互作用を強い電場で変調し、エネルギーレベルの反交差を通じてスピン状態を高速に駆動する。その結果、スピンベースの量子プロセッサにおける全電気量子操作のための新しい道が開かれた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:28:36 GMT)
TIGeR: Text-Instructed Generation and Refinement for Template-Free Hand-Object Interaction [43.6]
本稿では,物体形状の精細化とポーズ推定を行うためのTIGeR(Text-Instructed Generation and Refinement)フレームワークを提案する。テキストで指示された事前生成と視覚誘導による洗練という2段階のフレームワークを使用します。 TIGeRは、広く使用されているDex-YCBおよびObmanデータセット上でのChamfer距離、すなわち1.979および5.468オブジェクトの競合性能を達成する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:56:16 GMT)
Think Small, Act Big: Primitive Prompt Learning for Lifelong Robot Manipulation [43.4]
本稿では,再利用可能なロボットとプリミティブを用いて,生涯にわたるロボット操作を実現するプリミティブ・プロンプト・ラーニングを提案する。まず、マルチスキル事前学習段階を通じて、共有プリミティブを表現するプリミティブプロンプトのセットを学習する。新しいプロンプトは、凍結した事前訓練されたプロンプトで追加され、最適化される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:46:06 GMT)
Aligned Contrastive Loss for Long-Tailed Recognition [43.3]
そこで本研究では,ACL(Aligned Contrastive Learning)アルゴリズムを提案する。これらの結果から,マルチビュー学習が性能を向上させる一方で,コントラスト学習はビュー数の増加とともにモデル一般化を継続的に向上させるものではないことが示唆された。我々のACLアルゴリズムは,これらの問題を排除し,複数のベンチマークで高い性能を示すように設計されている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:19:30 GMT)
CKnowEdit: A New Chinese Knowledge Editing Dataset for Linguistics, Facts, and Logic Error Correction in LLMs [43.1]
大規模言語モデル(LLM)における言語的・事実的・論理的誤りの訂正を目的とした,中国初の知識編集データセットであるCKnowEditを紹介する。我々は、古典的なテキスト、イディオム、Baidu Tieba Ruozhibaのコンテンツを含む、幅広い情報源から7種類の知識を収集します。このデータセットを解析することにより、中国語を習得する上で、現在のLLMが直面する課題を強調します。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:49:57 GMT)
SemanticDraw: Towards Real-Time Interactive Content Creation from Image Diffusion Models [43.0]
本稿では,複数の手書き領域から高品質な画像がほぼリアルタイムで生成されるインタラクティブコンテンツ作成の新たなパラダイムであるSemanticDrawを紹介する。提案フレームワークは,既存の拡散モデルや加速度スケジューラに対して一般化可能であり,サブ秒(0.64秒)の画像コンテンツ作成アプリケーションを実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:29:54 GMT)
Trick or Neat: Adversarial Ambiguity and Language Model Evaluation [42.6]
我々は,言語モデルのあいまいさに対する感度を,敵対的あいまいさデータセットを導入することによって評価する。モデル表現で訓練された線形プローブは、曖昧さを高精度に復号できるのに対し、直接的プロンプトは曖昧さを確実に識別できないことを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:50:06 GMT)
SuperRL: Reinforcement Learning with Supervision to Boost Language Model Reasoning [42.5]
SuperRLは、オフライン監視を強化学習に適応的に組み込む統合トレーニングフレームワークである。 SuperRLは、スパース報酬の下でサンプル効率、一般化、堅牢性を向上させることで、標準強化学習を一貫して上回る。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:43:54 GMT)
PFMBench: Protein Foundation Model Benchmark [42.4]
PFMBenchは、タンパク質科学の8つの重要な領域にまたがる38のタスクにわたるタンパク質基盤モデルを評価するベンチマークである。タスク間の固有の相関を明らかにし、トップパフォーマンスモデルを特定し、合理化された評価プロトコルを提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:40:07 GMT)
ECP-Mamba: An Efficient Multi-scale Self-supervised Contrastive Learning Method with State Space Model for PolSAR Image Classification [42.0]
本稿では,マルチスケールの自己教師型コントラスト学習と状態空間モデル(SSM)のバックボーンを組み合わせた効率的なフレームワークであるECP-Mambaを提案する。 Flevoland 1989データセットでは、ECP-Mambaは99.70%、平均精度99.64%、Kappa係数99.62e-2で最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:52:54 GMT)
Large Language Models Struggle with Unreasonability in Math Problems [42.0]
大規模言語モデル(LLM)は、幅広い数学と推論のベンチマークで顕著な成功を収めている。我々は、不合理な数学問題に直面した時にしばしば苦労するのを観察する。我々は,不合理な数学問題文を検出し,応答するLLMの能力を評価するために,textbfUnreasonable Math Problems (UMP)ベンチマークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:53:04 GMT)
Talking to Data: Designing Smart Assistants for Humanities Databases [41.9]
本研究では,デジタル人文科学データとの自然言語通信を容易にするLLMベースのスマートアシスタントを提案する。このツールは、研究者が複雑なデータベースを自然言語でクエリできるようにすることで、人文科学におけるアクセシビリティと効率を高めることを目的としている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:41:44 GMT)
Do LLMs Understand Why We Write Diaries? A Method for Purpose Extraction and Clustering [41.9]
本研究では,大規模言語モデル(LLM)に基づく,日記作成のさまざまな目的を識別・クラスタリングするための新しい手法を提案する。本手法はソ連時代の日記(1922-1929)において,Prozhitoデジタルアーカイブから適用した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:38:01 GMT)
Replay Attacks Against Audio Deepfake Detection [41.1]
リプレイ攻撃がディープフェイク検出を損なうことを示す。様々なスピーカーやマイクロホンを通じてディープフェイク音声を再生・再生することにより,スプーフされたサンプルを検出モデルに忠実に表示する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:46:35 GMT)
IMPROVE: Iterative Model Pipeline Refinement and Optimization Leveraging LLM Experts [41.0]
機械学習のワークフローを自動化するための有望なソリューションとして、大規模言語モデル(LLM)エージェントが登場した。 LLM駆動のMLパイプライン設計のための新しい戦略であるIterative Refinementを紹介します。実際のトレーニングフィードバックに基づいて個々のコンポーネントを体系的に更新することにより、イテレーティブリファインメントはモデル全体のパフォーマンスを改善する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:08:57 GMT)
Beyond Decoder-only: Large Language Models Can be Good Encoders for Machine Translation [40.7]
普遍的で効率的で、最適化が容易な翻訳モデルを探求する。大規模な言語モデル(LLM)をNMTエンコーディングに適用し,NMTデコーダをそのまま残す。我々は,機械翻訳システムの一般化度を評価するために,複数のタスクを含む新しいデータセットを構築した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:36:07 GMT)
RedTeamCUA: Realistic Adversarial Testing of Computer-Use Agents in Hybrid Web-OS Environments [40.4]
コンピュータ利用エージェント(CUA)はOS(OS)とウェブにまたがる複雑なタスクを自動化することを約束するが、間接的なプロンプトインジェクションには弱いままである。我々は,VMベースのOS環境とDockerベースのWebプラットフォームを統合する,新しいハイブリッドサンドボックスを備えた,敵対的なテストフレームワークであるRedTeamCUAを提案する。 RedTeamCUAは、CUAの脆弱性を現実的で、制御され、体系的に分析するために必要なフレームワークを提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:04:07 GMT)
Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning [40.2]
タスク固有のデータに対する細調整された大規模言語モデル(LLM)は、その効果的なデプロイメントには不可欠である。データウィスペラ (Data Whisperer) は,数発のインコンテクスト学習とモデルによる微調整を併用した,効率的でトレーニング不要なアテンションベースの手法である。 Data Whispererは、Llama-3-8B-インストラクトモデルの完全なGSM8Kデータセットよりも優れたパフォーマンスを実現し、データの10%しか使用せず、既存のメソッドよりも3.1ポイントの改善と7.4$times$スピードアップを実現している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:57:00 GMT)
RLZero: Direct Policy Inference from Language Without In-Domain Supervision [40.0]
自然言語は、強化学習エージェントを指示する直感的な代替手段を提供する。本稿では、未ラベルのオフラインインタラクションを用いてトレーニングされた事前学習されたRLエージェントを用いた新しいアプローチを提案する。我々は、RLのコンポーネントが、クロスエボダイドビデオからゼロショットのポリシーを生成するために使用できることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:15:39 GMT)
A Graph-Retrieval-Augmented Generation Framework Enhances Decision-Making in the Circular Economy [40.0]
CircuGraphRAGは検索拡張世代(RAG)フレームワークで、LLMの出力を循環経済のためのドメイン固有の知識グラフに根拠付ける。このグラフは117,380の産業・廃棄物を分類コードとGWP100排出データと結びつけ、構造化されたマルチホップ推論を可能にする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:49:47 GMT)
Beyond Output Matching: Bidirectional Alignment for Enhanced In-Context Learning [39.5]
大規模言語モデル(LLM)は、コンテキスト内学習(ICL)を通じて、多くのタスクにおいて印象的な数ショットの一般化を示している。我々は,学生モデルのICL能力を向上させるために,ICL事例に対するモデルの嗜好を十分に活用するための双方向アライメント(Bidirectional Alignment, BiAlign)を提案する。具体的には、新しいランキング損失を取り入れることで、学生と教師のモデル間の入力好みのアライメントを導入する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:02:02 GMT)
SWE-bench Goes Live! [39.3]
大規模言語モデル(LLM)のためのライブ更新可能なベンチマークであるSWE-bench-Liveを提案する。最初のリリースは、2024年以降に作成された実際のGitHubイシューから派生した1,319のタスクで構成されています。私たちのベンチマークの中心は、インスタンス生成から環境設定までのプロセス全体を合理化する自動キュレーションパイプラインであるメソッドです。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:53:40 GMT)
Jailbreak-R1: Exploring the Jailbreak Capabilities of LLMs via Reinforcement Learning [39.2]
我がアッパチは自動化されたレッド・チーム・トレーニング・フレームワークです強化学習を利用して、より効果的な攻撃プロンプトを探索し、生成する。私たちの作業は、レッドチームの探索の効率を大幅に改善し、自動化されたレッドチームに対する新たな視点を提供します。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:19:46 GMT)
Are We in the AI-Generated Text World Already? Quantifying and Monitoring AIGT on Social Media [39.0]
ソーシャルメディアプラットフォームはAIGT(AI-Generated Texts)の存在感が高まっているその重要性にもかかわらず、AIGTがソーシャルメディア上でどの程度普及しているかは不明だ。本稿では,オンラインソーシャルメディアプラットフォーム上でAIGTを定量化し,監視することを目的とする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:06:21 GMT)
Affordance Benchmark for MLLMs [38.6]
A4Benchはマルチモーダル大規模言語モデルの可視性を評価するために設計された新しいベンチマークである。我々は17個のMLLM(9つのプロプライエタリと8つのオープンソース)を人的パフォーマンスに対して評価する。プロプライエタリなモデルは一般的にオープンソースモデルよりも優れていますが、いずれも機能に制限があります。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:26:34 GMT)
ADS-Edit: A Multimodal Knowledge Editing Dataset for Autonomous Driving Systems [38.6]
大規模マルチモーダルモデル(LMM)は自律運転システム(ADS)において有望であることを示す本稿では,モデル動作のターゲット変更を,完全なリトレーニングを必要とせずに行える知識編集手法を提案する。 ADSに特化して設計されたマルチモーダル知識編集データセットであるADS-Editを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:52:54 GMT)
DS-VTON: High-Quality Virtual Try-on via Disentangled Dual-Scale Generation [38.5]
DS-VTONは、より効果的なモデリングのために目的を絞ったデュアルスケール仮想試行フレームワークである。提案手法では, パーシングマップやセグメンテーションマスクへの依存を排除し, マスクフリーな生成パラダイムを採用する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:52:57 GMT)
Generalizable LLM Learning of Graph Synthetic Data with Reinforcement Learning [38.5]
本稿では、グラフ合成データの一般化可能な学習を強化学習で解き放つことを提案する。まず、合成グラフ問題に対するソリューションベースおよびプロセスベース報酬を設計する。実験により、我々のRLレシピは5つのデータセットに対して統計的に有意な改善をもたらすことが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:39:56 GMT)
Learning What Matters: Prioritized Concept Learning via Relative Error-driven Sample Selection [38.4]
Prioritized cOncept learninG by Relative Error-driven Sample Selection (PROGRESS)を提案する。 PROGRESSはデータと計算効率のよいフレームワークで、視覚言語モデルで次に何を学習するかを動的に選択できる。 PROGRESSは、データや監督をはるかに少なくして、最先端のベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:05:35 GMT)
Are Your LLMs Capable of Stable Reasoning? [38.0]
G-Pass@$k$は、複数のサンプリング試行においてモデル性能を継続的に評価する新しい評価指標である。私たちはG-Pass@$k$と最先端の大規模言語モデルを使って、その潜在能力と運用上の一貫性に関する包括的な洞察を提供しています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:40:28 GMT)
Unlearning Inversion Attacks for Graph Neural Networks [37.7]
未学習のGNNへのブラックボックスアクセスと部分グラフ知識のみを考慮すれば、敵は削除されたエッジを再構築できるのだろうか? 我々は、未学習エッジと保持エッジの確率相似性しきい値の変化と、未学習エッジの特定が困難である2つの主要な課題を特定し、TrendAttackでそれらに対処する。実世界の4つのデータセットの実験では、TrendAttackが最先端のGNNメンバシップ推論ベースラインを大幅に上回っており、現在のグラフアンラーニングメソッドで重要なプライバシの脆弱性が明らかにされている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:23:04 GMT)
In-the-wild Audio Spatialization with Flexible Text-guided Localization [37.6]
没入感を高めるために、オーディオはAR、VR、組み込みAIアプリケーションにおける音の物体を空間的に認識する。既存のオーディオ空間化法は一般に任意のモノラルオーディオを音声信号にマッピングできるが、複雑なマルチオブジェクトのユーザ対話環境において必要とされる柔軟性と対話性に欠けることが多い。フレキシブルテキストプロンプトを利用したテキスト誘導型音声空間化(TAS)フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:41:56 GMT)
Know You First and Be You Better: Modeling Human-Like User Simulators via Implicit Profiles [37.4]
我々は,人間と機械のインタラクションから暗黙のユーザプロファイルを推論し,パーソナライズされたリアルな対話をシミュレートする,インプリシットプロファイル付きユーザシミュレータ(USP)を紹介する。 USPは、同等の一貫性を維持しながら、信頼性と多様性の点で、強力なベースラインを上回ります。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:16:38 GMT)
CoBRA: Quantifying Strategic Language Use and LLM Pragmatics [37.4]
我々は3つの解釈可能な指標とともにCoBRAを導入し、談話の動きの認識された戦略的効果を定量化する。また、実際の法廷横断試験の注釈付きデータセットであるCHARMも提示する。 LLMは一般的に,戦略言語に対する限定的な実践的理解を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:07:20 GMT)
DISCO: Efficient Diffusion Solver for Large-Scale Combinatorial Optimization Problems [37.2]
DISCOは、大規模な組合せ最適化問題に対する効率的な拡散解法である。サンプリング空間は、解残基によって導かれるより有意義な領域に制約され、出力分布のマルチモーダルな性質は保たれる。大規模なトラベリングセールスマン問題や最大独立セットのベンチマークに挑戦し、他の拡散手段よりも最大5.28倍の速度で推論を行う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:35:31 GMT)
Infinity Parser: Layout Aware Reinforcement Learning for Scanned Document Parsing [37.1]
layoutRLは、レイアウトを明示的に認識するようにモデルをトレーニングするエンドツーエンドの強化学習フレームワークである。堅牢なドキュメント理解の進歩を加速するために、コードとデータセットを公開します。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:19:52 GMT)
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers [36.5]
深度(MoD)の混合は、重要でない層をスキップすることで計算深度を動的に調整する。 MoDアプローチの主な課題は2つある: 1) 重要なレイヤをバイパスする際のパフォーマンス劣化のリスクを回避できるルータとともに、モデル全体をトレーニングする必要があるため、トレーニングコストが高くなる。本稿では,小さなデータセット上でのみルータを微調整し,フルモデルトレーニングに伴う計算オーバーヘッドを大幅に削減するルータチューニングを提案する。第2の課題として、動的深さで注意を配置するMindSkipを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:25:50 GMT)
Divide-Fuse-Conquer: Eliciting "Aha Moments" in Multi-Scenario Games [36.2]
大規模言語モデル(LLM)は、強化学習(RL)中に突然高度な推論能力を示すことが観察されている。マルチシナリオRLにおける一般化を促進するためのフレームワークであるDivide-Fuse-Conquerを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:49:25 GMT)
Jailbreak-AudioBench: In-Depth Evaluation and Analysis of Jailbreak Threats for Large Audio Language Models [35.9]
大規模言語モデル(LLM)は、広範囲の自然言語処理タスクで印象的なゼロショット性能を示す。様々なモダリティエンコーダを統合することで、テキストだけでなく視覚や聴覚のモダリティ入力を処理するマルチモーダル大言語モデル(MLLM)が生まれる。これらの高度な機能は、ジェイルブレイク攻撃を通じて有害または不適切なコンテンツを生成するためにモデルを利用することができるため、重大なセキュリティリスクを引き起こす可能性がある。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:57:27 GMT)
RARE: Retrieval-Aware Robustness Evaluation for Retrieval-Augmented Generation Systems [35.5]
Retrieval-Augmented Generation (RAG)は、回答の正確性と事実性を高める。既存の評価では、これらのシステムが現実世界のノイズ、内部と外部の取得したコンテキストの衝突、あるいは急速に変化する事実にどのように対処するかを検査することはめったにない。本稿では,動的で時間に敏感なコーパス上でのストレステストクエリと文書摂動を共同で行う,統一されたフレームワークと大規模ベンチマークであるRetrieval-Aware Robustness Evaluation (RARE)を紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:42:36 GMT)
GThinker: Towards General Multimodal Reasoning via Cue-Guided Rethinking [35.1]
GThinkerは、一般的なシナリオ、数学、科学にまたがるマルチモーダル推論に優れた新しい推論MLLMである。 GThinker氏はCue-Rethinkingを紹介した。Cue-Rethinkingは視覚的手がかりを推論し、矛盾を解決するために反復的にこれらの手がかりを再解釈する柔軟な推論パターンである。トレーニングを支援するため,GThinker-11Kの構築を行った。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:28:26 GMT)
One for All: Update Parameterized Knowledge Across Multiple Models [35.1]
大きな言語モデル(LLM)は、膨大な世界の知識を符号化するが、最新の状態を維持するのに苦労し、しばしば誤りや幻覚を引き起こす。知識編集は、特定のモデルパラメータを更新することで、ターゲット変更を可能にする、リトレーニングの効果的な代替手段を提供する。編集モジュールとしてプラグインモデルを用いる新しいアンサンブルベースのアプローチである OnceEdit を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:48:54 GMT)
ProstaTD: A Large-scale Multi-source Dataset for Structured Surgical Triplet Detection [35.0]
ProstaTDは、外科的三重項検出のための大規模な多施設データセットである。ロボット補助前立腺切除術の技術的要求領域から開発された。データセットは60,529のビデオフレームと165,567の注釈付きトリプルトインスタンスで構成されている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:29:39 GMT)
Temporal In-Context Fine-Tuning for Versatile Control of Video Diffusion Models [34.1]
我々は,事前学習した映像拡散モデルを条件付き生成タスクに適用するための効率的なアプローチであるTIC-FT(Temporal In-Context Fine-Tuning)を導入する。 TIC-FTはアーキテクチャの変更を必要とせず、10-30のトレーニングサンプルで高いパフォーマンスを実現している。我々は,CagVideoX-5B や Wan-14B といった大規模ベースモデルを用いて,映像映像生成や映像映像生成など,様々なタスクにまたがる手法を検証する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:57:43 GMT)
Distributionally Robust Policy Learning under Concept Drifts [33.4]
本稿では、より曖昧な問題、つまり、コンセプトドリフトの下でのロバストな政策学習について研究する。まず、与えられた政策の最悪の平均報酬を評価するための2倍のロバスト推定器を提供する。次に、所定のポリシークラス内で推定されたポリシー値を最大化するポリシーを出力する学習アルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:50:33 GMT)
Handling Label Noise via Instance-Level Difficulty Modeling and Dynamic Optimization [33.1]
ディープニューラルネットワークは、ノイズの多い監視の下で一般化性能が低下する。既存のメソッドでは、クリーンなサブセットの分離やノイズのあるラベルの修正に重点を置いている。本稿では,インスタンスレベルの最適化が可能な新しい2段階雑音学習フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:54:56 GMT)
LIFT the Veil for the Truth: Principal Weights Emerge after Rank Reduction for Reasoning-Focused Supervised Fine-Tuning [32.9]
LLMの教師付き微調整により、強い推論能力が得られる。フル微調整(Full FT)は計算コストが高く、過度にフィットしたり忘れたりする可能性がある。以前大きな成功を収めたスパース微調整は、効率性と有効性の間に有望なトレードオフを提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:31:50 GMT)
Pilot Contamination-Aware Graph Attention Network for Power Control in CFmMIMO [32.8]
CFmMIMOシステムにおけるダウンリンク電力制御のためのグラフアテンションネットワークを提案する。パイロットの汚染を効果的に処理し、多数のユーザ機器に適応しながら、自己管理的な操作を行う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:28:36 GMT)
From Objectives to Questions: A Planning-based Framework for Educational Mathematical Question Generation [32.8]
本稿では,自己回帰法(EQPR)を用いた数学的質問生成のための教育的質問計画を提案する。モンテカルロ木探索に基づく計画アルゴリズムと大規模言語モデルの生成機能を組み合わせることで,質問を継続的に最適化する。我々は,EQPRが多次元の教育目的を満たす質問生成において,大幅な改善を達成できることを実証した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:23:18 GMT)
Improve MLLM Benchmark Efficiency through Interview [32.6]
大規模データに対する完全なカバレッジのQ&Aテストは、リソース集約的で時間を要する。より少ない質問を解き放つことで,MLLMのパフォーマンス指標を迅速に取得することを目的としたMLLMインタビュー戦略を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:51:15 GMT)
Attributing Response to Context: A Jensen-Shannon Divergence Driven Mechanistic Study of Context Attribution in Retrieval-Augmented Generation [32.3]
我々は、コンテキストに対する属性応答(ARC-JSD)のための新しいJensen-Shannon Divergence駆動方式を提案する。従来のサロゲート法に比べて精度が向上し,計算効率も向上した。メカニスティック解析により、コンテキスト属性に責任を持つ特定の注意頭と多層パーセプトロン(MLP)層が明らかになった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:42:30 GMT)
A Semantic-Aware Layer-Freezing Approach to Computation-Efficient Fine-Tuning of Language Models [32.2]
下流のデータやタスクにモデルを適応させるには、微調整言語モデル(LM)が不可欠である。本稿では,バックプロパゲーション(層レベルでの)のコスト削減に向けた先駆的な取り組みを提案する。我々は、よく知られたLMとデータセットにまたがる広範な実験を行う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:10:59 GMT)
zip2zip: Inference-Time Adaptive Vocabularies for Language Models via Token Compression [32.0]
zip2zipは、大規模言語モデルで推論時にトークン語彙を動的に調整できるフレームワークである。パラメータ効率の良い微調整により,既存のLLMを10GPU時間でzip2zip-fiedできることを示す。結果として得られるzip2zip LLMは、推論時にハイパートークンを使用することを効果的に学習し、入力および出力シーケンスの長さを20-60%削減する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:03:02 GMT)
Conditional Image Synthesis with Diffusion Models: A Survey [31.9]
ユーザ指定要求に基づく条件付き画像合成は、複雑な視覚コンテンツを作成する上で重要な要素である。拡散に基づく生成モデリングは、条件付き画像合成の非常に効果的な方法となり、文献の指数的成長につながった。本研究では,拡散モデルの基礎となる2つの要素に条件がどのように組み込まれているかに基づいて,既存の研究を分類する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:24:23 GMT)
Cognitive Guardrails for Open-World Decision Making in Autonomous Drone Swarms [31.9]
スモール・アンクルード・エアリアル・システムズ(SUAS)は、捜索救助任務において自律的な群れとしてますます配備されている。本稿では, サーチ・レスキューミッションにおける sUAS Swarm のための認知ガードレールの設計, シミュレーション, 実世界の統合について述べる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:27:23 GMT)
Accurate Differential Operators for Hybrid Neural Fields [31.8]
レンダリングとシミュレーションでは、ハイブリッドニューラルネットワークは顕著で不合理なアーティファクトを引き起こす可能性がある。これは、これらの下流アプリケーションに必要な正確な空間微分が得られないためである。本稿では,局所的な磁場フィッティングを用いて,事前学習したニューラルネットワークからより正確な微分を求めるポストホック演算子を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:32:20 GMT)
Probing the Geometry of Truth: Consistency and Generalization of Truth Directions in LLMs Across Logical Transformations and Question Answering Tasks [31.4]
我々は,大規模言語モデル (LLM) が真理性を「真理方向」と呼ぶ線形特徴としてエンコードするかどうかを考察する。以上の結果から,全てのLLMが一貫した真理方向を示すわけではなく,より有能なモデルでより強い表現が観察されることがわかった。宣言的原子文に基づいて訓練された真理性プローブは、論理変換、質問応答タスク、文脈内学習、外部知識ソースに効果的に一般化できることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:55:53 GMT)
Fighting Fire with Fire (F3): A Training-free and Efficient Visual Adversarial Example Purification Method in LVLMs [31.3]
視覚言語モデル(LVLM)は、視覚的敵攻撃に対して脆弱である。 F3は反直感的な「火と戦う火」戦略を駆使した、新たな敵の浄化フレームワークである。 F3はトレーニングフリーで実装が簡単で、計算効率が大幅に向上している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:07:30 GMT)
Towards Diverse and Efficient Audio Captioning via Diffusion Models [31.1]
Diffusion-based Audio Captioning (DAC) は、多種多様な効率的なオーディオキャプションに適した非自己回帰拡散モデルである。我々のフレームワークは、キャプションにおけるその本質性と包括的文脈モデリングに起因した独特なアドバンテージを提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:01:51 GMT)
Navigating Rifts in Human-LLM Grounding: Study and Benchmark [30.6]
我々は、WildChat、MultiWOZ、Bing Chatという3つの人間支援データセットのログを分析した。ヒトとヒトのLLMグラウンドリングでは有意な差が認められた。初期のグラウンディングの失敗は、後続の相互作用の破壊を予測する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:44:56 GMT)
LLM Cannot Discover Causality, and Should Be Restricted to Non-Decisional Support in Causal Discovery [30.2]
LLMの自己回帰的相関モデルが本質的に因果推論の理論的根拠を欠いていることを実証する。我々は、故意にプロンプトエンジニアリングが彼らの業績を誇張し、現在の文献の多くで報告された一貫した好ましい結果を説明するのに役立つことを示している。我々は,LLMを鼻で適用することから,因果発見の根本原理を尊重する専門的なモデルや訓練方法の開発に焦点を移すことをコミュニティに求めて結論付けた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:38:56 GMT)
How to set AdamW's weight decay as you scale model and dataset size [30.0]
我々はAdamWが学んだ重みを最近の更新の指数移動平均(EMA)と解釈できることを示した。これは、AdamWにおける重量減衰の設定方法と、重量減衰をモデルとデータセットサイズでスケールする方法に関する重要な洞察を与える。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:35:40 GMT)
The Measurement Imbalance in Agentic AI Evaluation Undermines Industry Productivity Claims [29.7]
本稿では,エージェントAIシステムに対する現在の評価手法が,業界生産性の主張に疑問を呈するシステム的不均衡を示すことを示す。 84論文(2023年-2025年)の体系的レビューでは,技術指標が評価を支配している評価の不均衡が明らかとなった。バランスの取れた4軸評価モデルを提案し、このパラダイムシフトをリードするようコミュニティに呼びかける。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:45:04 GMT)
An Adaptive Approach for Infinitely Many-armed Bandits under Generalized Rotting Constraints [29.6]
本研究では、休息状態において、アームの平均報酬が各プルで減少する可能性があるが、そうでなければ変化しない、無限に多くの武器を持つバンディット問題を考察する。本稿では,ゆがみ報酬に起因するバイアスや分散トレードオフを管理するために,適応的なスライディングウィンドウを備えたUTBを利用するアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:41:13 GMT)
LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding [29.4]
LLaVA-STは空間的・時間的マルチモーダル理解のためのMLLMである。 LLaVA-STでは,座標の特別なトークンを視覚空間に埋め込んだLanguage-Aligned Positional Embeddingを提案する。また、時間分解能と空間分解能の特徴圧縮を2つの異なるポイント・ツー・リージョンのアテンション処理ストリームに分離する空間-テンポラル・パッカーを設計する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:32:19 GMT)
A Little Human Data Goes A Long Way [28.8]
Fact Verification (FV) と Question Answering (QA) における合成データの利用について検討する。純粋に合成されたデータに基づいてトレーニングされたモデルは、125個の人為的なデータポイントを含むことで、確実に改善できることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:02:34 GMT)
SCOPE: Optimizing Key-Value Cache Compression in Long-context Generation [28.8]
SCOPEは、プリフィルとデコードフェーズでKVキャッシュを最適化するフレームワークである。メモリ使用量とメモリ転送は、適応的かつ不連続な戦略によってさらに最適化される。 LongGenBenchの実験はSCOPEの有効性と一般化を示している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:31:46 GMT)
CASE -- Condition-Aware Sentence Embeddings for Conditional Semantic Textual Similarity Measurement [28.4]
Condition-Aware Sentence Embeddings (CASE) は、条件下で文の埋め込みを作成するための効率的で正確な方法である。ケースは、既存の標準ベンチマークデータセット上で条件付きセマンティックテキスト類似性(C-STS)メソッドよりも大幅に優れています。本稿では,LLMをベースとした埋め込みの次元性を低減するだけでなく,性能を著しく向上する,教師付き次元性低減手法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:19:22 GMT)
Reconsidering LLM Uncertainty Estimation Methods in the Wild [28.0]
実用環境でUEメソッドをデプロイする際の4つの重要な側面を体系的に検討する。評価の結果,キャリブレーションデータセットに分布シフトがある場合,そのほとんどが閾値選択に非常に敏感であることが判明した。既存のUE手法は様々な戦略によって長文生成に適応できるが、改善の余地は大きい。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:42:24 GMT)
Iterative Deepening Sampling as Efficient Test-Time Scaling [27.8]
OpenAIのO1シリーズのような最近の推論モデルは、複雑な推論タスクにおいて例外的なパフォーマンスを示している。本稿では,自己補正の強化と高品質なサンプル生成を目的とした,新しい反復型深層サンプリングアルゴリズムフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:14:16 GMT)
Evaluating the Unseen Capabilities: How Many Theorems Do LLMs Know? [27.7]
未知の知識を定量化することによって、より包括的な評価を提供するために設計された統計フレームワークであるKnowSumを紹介する。 KnowSumは、観測された知識インスタンスの頻度の出現から外挿することで、観測されていない部分を推定する。実験の結果,観測されたLLMの性能にのみ依存する場合,かなりの量の知識が省略されることが判明した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:32:44 GMT)
Predicting Empirical AI Research Outcomes with Language Models [27.1]
AI研究における有望なアイデアの多くは提供されないが、その検証には相当な人的労力と計算が必要だ。このタスクの最初のベンチマークを構築し、LMと人間の専門家を比較します。私たちはカンファレンス論文からアイデアと実験結果を取り除き、ベースモデルがテストの切り離し日後に公表された1,585人の人間による検証されたアイデアペアを生成しました。我々は,精巧なGPT-4.1と紙検索エージェントを組み合わせたシステムを開発し,25人の人間専門家を雇って比較する。 NLP領域では、我々のシステムは人間の専門家を64.4%対48.で破る。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:46:31 GMT)
Higher-Order Responsibility [26.9]
本稿は、高次責任を$d$まで決定することが、責任ギャップを埋めるのに十分であるかどうかを判断する問題について考察する。主な技術的結果は、この問題は$Pi_2d+1$-completeである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:22:05 GMT)
What's Missing in Vision-Language Models? Probing Their Struggles with Causal Order Reasoning [26.7]
因果推論は、複雑な高レベルの推論タスクを解決するのに基本である。既存のベンチマークには、しばしば推論の質問が混在している。 VQA-CausalとVCR-Causalを導入し,因果推論能力の分離と厳密な評価を行った。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:17:46 GMT)
IRT-Router: Effective and Interpretable Multi-LLM Routing via Item Response Theory [26.4]
大規模言語モデル (LLM) は、幅広い自然言語タスクにおいて例外的な性能を示した。強力なモデルはより良い結果をもたらすが、より小さなモデルはよりコスト効率が良いが、能力は低い。ユーザクエリを最適なLLMに効率的にルーティングするマルチLLMルーティングフレームワークであるIRT-Merciを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:14:58 GMT)
Do not Abstain! Identify and Solve the Uncertainty [25.7]
bftextConfuseBenchは、主に文書不足、限られた能力、クエリのあいまいさの3つのタイプの不確実性に焦点を当てたベンチマークである。実験によると、現在のLLMは不確実性の根本原因を正確に特定し、解決するのに苦労している。まず、元のクエリの紛らわしい側面を浮き彫りにするコンテキストアウェアな問い合わせを生成します。そして,質問の答えの特異性に基づいて不確実性の原因を判断する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:15:17 GMT)
Data Heterogeneity Modeling for Trustworthy Machine Learning [25.7]
データの不均一性は、機械学習(ML)システムの性能を決定する上で重要な役割を果たす。伝統的なアルゴリズムは、しばしばデータセットの固有の多様性を見落としている。データ多様性の深い理解によって、モデルの堅牢性、公正性、信頼性が向上することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:36:56 GMT)
Position: An Empirically Grounded Identifiability Theory Will Accelerate Self-Supervised Learning Research [25.6]
自己監視学習(SSL)は多くの現在のAIシステムを動かしている。 SSLのプラトン的見解は、異なる方法や工学的アプローチにもかかわらず、すべての表現は同じプラトン的イデアルに収束することを示唆している。我々は Identifiability Theory (IT) を Singular Identifiability Theory (SITh) と呼ぶものに拡張することを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:15:07 GMT)
Hidden Representation Clustering with Multi-Task Representation Learning towards Robust Online Budget Allocation [25.5]
マーケティング最適化は、一般的にオンライン予算配分問題として定式化され、ユーザーの成長を促進する重要な要因となっている。本稿では,クラスタの観点から問題を解く新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:09:07 GMT)
Beyond Pairwise Learning-To-Rank At Airbnb [25.5]
我々はこの制限をランキングアルゴリズムのSAT定理と呼ぶ。 Airbnbでの現在の作業は、大規模にデプロイされた作業ソリューションによって、答を提供しています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:17:37 GMT)
SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers [25.4]
SkyReels-Audioは高忠実で時間的コヒーレントなポートレート映像を合成するための統一的なフレームワークである。我々のフレームワークは、無限長の生成と編集をサポートし、マルチモーダル入力による多様かつ制御可能な条件付けを可能にする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:27:13 GMT)
Contrastive Explainable Clustering with Differential Privacy [25.2]
本稿では、クラスタリングアルゴリズムの差分プライバシーと対照的な説明を組み合わせ、説明可能なAI(XAI)に新しいアプローチを提案する。そこで本研究では,k-median問題とk-means問題に着目し,あるデータポイントに固定されたセントロイドを用いたクラスタリングと,元のクラスタリングとクラスタリングとの実用的差異として,コントラッシブな説明を計算する。私たちの重要な貢献は、これらの微分プライベートな説明が、本質的に非プライベートな説明と同じユーティリティ境界を達成することを示すことです。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:38:47 GMT)
Translation Consistent Semi-supervised Segmentation for 3D Medical Images [25.1]
3次元医用画像分割法は成功したが, 大量のボクセルレベルのデータへの依存は不利である。半教師付き学習(SSL)は、大きなラベル付きデータセットと小さなラベル付きデータセットでモデルをトレーニングすることで、この問題を解決する。本稿では,一貫性学習型SSL手法であるTranslation Consistent Co-training (TraCoCo)を紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:52:18 GMT)
TESS 2: A Large-Scale Generalist Diffusion Language Model [24.9]
TESS 2は命令追従拡散言語モデルであり、命令追従拡散モデルより優れている。適応学習とベースモデルの選択は,優れた指示追従拡散モデルの訓練に不可欠であることがわかった。モデル出力の調整を基礎となるモデルのトレーニングを必要とせずに行うための,新しい,モジュール型の推論時ガイダンス手法である報奨ガイダンスを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:59:12 GMT)
ItTakesTwo: Leveraging Peer Representations for Semi-supervised LiDAR Semantic Segmentation [24.7]
本稿では,ItTakesTwo (IT2) と呼ばれる半教師付きLiDARセマンティックセマンティックセマンティクスフレームワークを提案する。 IT2は、ピアLiDAR表現からの一貫性のある予測を保証するために設計されており、一貫性学習における摂動効率を改善する。その結果,本手法は従来のSOTA法よりも顕著に改善されていることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:18:39 GMT)
Whose Boat Does it Float? Improving Personalization in Preference Tuning via Inferred User Personas [24.7]
選好データに対する帰納的推論をパーソナライズの表面パラメータに適用する。本稿では,Persona Tailoring(PT)トレーニングによってパーソナライズが促進され,ユーザによるペルソナ支援が一般化されることを示す。我々は、パーソナライズのための選好の誘惑的な見解を論じ、どの反応が良いかだけでなく、いつ、なぜ、誰が良いのかを問う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:03:00 GMT)
IVY-FAKE: A Unified Explainable Framework and Benchmark for Image and Video AIGC Detection [24.7]
説明可能なマルチモーダルAIGC検出のための,新規で統一された大規模データセットであるIVY-FAKEを紹介する。 Ivy Explainable Detector (IVY-XDETECTOR)を提案する。我々の統合視覚言語モデルは、複数の画像およびビデオ検出ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:20:22 GMT)
Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions [24.6]
Chain-of-Talkers (CoTalk)は、アノテートされたサンプルの数を最大化するように設計されたAI-in-the-loop方法論である。パラレル法よりアノテーション速度 (0.42 vs. 0.30 Unit/sec) と検索性能 (41.13% vs. 40.52%) が向上したことを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:55:39 GMT)
EvoGit: Decentralized Code Evolution via Git-Based Multi-Agent Collaboration [24.3]
EvoGitは、自律的なコード進化によって駆動されるソフトウェア開発のための分散マルチエージェントフレームワークである。すべての調整はGitベースのフィロジェネティックグラフを通じて行われ、完全なバージョンラインを追跡する。ユーザはハイレベルな目標を定義し、定期的にグラフをレビューし、軽量なフィードバックを提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:20:42 GMT)
GIA-MIC: Multimodal Emotion Recognition with Gated Interactive Attention and Modality-Invariant Learning Constraints [24.2]
マルチモーダル感情認識(MER)は、視覚、音声、テキスト入力を含むマルチモーダルデータから感情を抽出し、人間とコンピュータの相互作用において重要な役割を果たす。本稿では,相互の相互作用を通じて感情情報を高めつつ,モダリティ特有の特徴を適応的に抽出する対話型アテンション機構を提案する。 IEMOCAPの実験では、我々の手法は最先端のMERアプローチより優れており、WA 80.7%、UA 81.3%を達成している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:07:02 GMT)
FedRPCA: Enhancing Federated LoRA Aggregation Using Robust PCA [24.2]
LoRAは、特に連合学習において、最も有望な微調整技法の1つとして登場した。 FedAvgに基づく従来のアグリゲーション戦略は、緩やかな収束と準最適精度に悩まされている。我々は、スケールド平均化を用いてクライアントLoRAパラメータを集約するFedRPCAを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:07:00 GMT)
LLM-as-an-Interviewer: Beyond Static Testing Through Dynamic LLM Evaluation [24.1]
LLM-as-an-Interviewerは,大規模言語モデル(LLM)を評価するための新しいパラダイムである。このアプローチはマルチターンインタラクションを活用し、インタビュアーは応答に対するフィードバックを積極的に提供し、評価されたLCMにフォローアップ質問を提示する。このフレームワークを用いてMATHとDepthQAタスクの6つのモデルを評価する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:25:13 GMT)
Communication-Efficient and Tensorized Federated Fine-Tuning of Large Language Models [24.1]
大規模言語モデルの適応手法であるFedTTとFedTT+を紹介する。 FedTTは汎用的で、クロスサイロFLと大規模クロスデバイスFLの両方に適用できる。提案手法は,データ不均一性の問題に対処し,既存のPEFT手法よりも同等あるいはそれ以上の精度で処理する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:41:09 GMT)
State-Covering Trajectory Stitching for Diffusion Planners [23.9]
State-Covering Trajectory Stitching (SCoTS)は、短いトラジェクトリセグメントを縫合する報酬のないトラジェクトリ拡張法である。 SCoTSは,オフラインの目標条件付きベンチマーク上での拡散プランナの性能と一般化能力を大幅に向上することを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:32:22 GMT)
Local Manifold Approximation and Projection for Manifold-Aware Diffusion Planning [23.9]
Local Manifold Approximation and Projection (LoMAP) は、オフラインデータセットから近似した低ランクのサブスペースにガイドされたサンプルを投影するトレーニング不要の手法である。階層型拡散プランナにLoMAPを組み込むことにより,さらなる性能向上が期待できることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:16:39 GMT)
Best Practices for Multi-Fidelity Bayesian Optimization in Materials and Molecular Research [23.9]
MFBO(Multi-fidelity Bayesian Optimization)は、物質や分子の発見を高速化するためのフレームワークである。化学的タスクに使用される可能性があるが、MFBOで果たす多くのパラメータの体系的な評価が欠如している。実験環境でMFBOをいつ使用するかを決めるためのガイドラインと勧告を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:17:40 GMT)
AuralSAM2: Enabling SAM2 Hear Through Pyramid Audio-Visual Feature Prompting [23.8]
AuralSAM2は、新しいAuralFuserモジュールで構成されており、SAM2に外部にアタッチして異なるモジュールの機能を統合している。この統合は、機能ピラミッドによって促進され、セマンティック理解をさらに洗練し、オブジェクトの認識を高める。公開ベンチマークの結果から,本手法は従来の手法よりも顕著に改善されていることが示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:57:42 GMT)
Spatio-Temporal Decoupled Learning for Spiking Neural Networks [23.7]
スパイキング人工ニューラルネットワーク(SNN)は、エネルギー効率の良いインテリジェンスを実現する可能性に大きな注目を集めている。時間によるバックプロパゲーション(BPTT)は高い精度を達成するが、かなりのメモリオーバーヘッドを引き起こす。本研究では,SNNの精度と訓練効率を両立させるため,空間的および時間的依存関係を分離する新たなトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:46:36 GMT)
L3A: Label-Augmented Analytic Adaptation for Multi-Label Class Incremental Learning [23.6]
CIL(Class-incremental Learning)は、モデルが獲得した知識を忘れずに、新しいクラスを継続的に学習することを可能にする。本稿では,過去のサンプルを格納することなく,例のない手法であるラベル拡張分析適応(L3A)を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:45:19 GMT)
Autoregressive Images Watermarking through Lexical Biasing: An Approach Resistant to Regeneration Attack [23.5]
Lexical Bias Watermarking (LBW)は、自動回帰(AR)画像生成モデル用に設計された新しいフレームワークである。 LBWは、トークン選択を生成中に定義されたグリーンリストにバイアスすることで、トークンマップに直接透かしを埋める。 LBWは、特に再生攻撃に対する耐性において、優れた透かしの堅牢性を達成する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:44:20 GMT)
Bridging Supervised and Temporal Difference Learning with $Q$-Conditioned Maximization [23.5]
教師付き学習(SL)は, 簡易性, 安定性, 効率性から, オフライン強化学習(RL)の効果的なアプローチとして出現している。近年の研究では、SL法は、典型的には時間差(TD)に基づくアプローチと関連する、軌道縫合能力が欠如していることが示されている。オフライン目標条件付きRLのためのQ$条件付き教師あり学習を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:49:26 GMT)
Why Does Little Robustness Help? A Further Step Towards Understanding Adversarial Transferability [23.4]
DNNの逆例(AE)は転送可能であることが示されている。本稿では,敵対的伝達可能性の理解に向けてさらなる一歩を踏み出す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:44:50 GMT)
Inference-Time Text-to-Video Alignment with Diffusion Latent Beam Search [23.4]
アライメント問題に大きな注目を集めており、コンテンツの良さに基づいて拡散モデルの出力を操縦する。本稿では,アライメント報酬を最大化するために,より優れた拡散潜時を選択できるルックアヘッド推定器を用いた拡散潜時ビーム探索を提案する。本手法は,モデルパラメータを更新することなく,校正報酬,VLM,人的評価に基づいて評価された知覚品質を向上することを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:45:32 GMT)
HSCR: Hierarchical Self-Contrastive Rewarding for Aligning Medical Vision Language Models [23.2]
我々は,Med-VLMアライメントにおける2つの重要な課題に対処する新しいアプローチである階層型自己コントラスト・リワード(HSCR)を提案する。 HSCRは高品質な嗜好データを生成し、改善されたアライメントのためにニュアンス付きおよびコンテキスト対応の嗜好をキャプチャする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:11:00 GMT)
A Review on Coarse to Fine-Grained Animal Action Recognition [23.0]
動物行動認識の分野を概観し、粗粒(FGCG)と細粒(FGG)技術に注目した。動物行動認識研究の現状を調べ、屋外環境における微妙な動物行動の認識に関連する固有の課題を解明する。種間の行動分析の精度と一般化性を改善することを目的とした、きめ細かい行動認識の進歩に向けた今後の方向性を概説する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:31:25 GMT)
AnomalyGFM: Graph Foundation Model for Zero/Few-shot Anomaly Detection [22.6]
AnomalyGFMは、GADのためのゼロショット推論と少数ショットプロンプトチューニングをサポートするグラフ基盤モデルである。 AnomalyGFMは、ゼロショットと少数ショットのGAD設定の両方で、最先端の競合手法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:38:06 GMT)
AliBoost: Ecological Boosting Framework in Alibaba Platform [22.6]
AliBoostは、ユーザ指向の自然なレコメンデーションを補完するために設計されたエコロジー強化フレームワークである。 AliBoostは10億以上の新しいアイテムをコールドスタートし、180日以内にクリックとGMVの両方のコールドアイテムを60%以上増やした。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:56:18 GMT)
From Plain Text to Poetic Form: Generating Metrically-Constrained Sanskrit Verses [22.1]
我々は、英語の散文を構造化サンスクリット詩に翻訳するためのデータセットを提案する。我々は,距離や意味の忠実度に合わせた制約付き復号法と命令ベースの微調整について検討する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:35:46 GMT)
HouseTS: A Large-Scale, Multimodal Spatiotemporal U.S. Housing Dataset [22.1]
HouseTSは、2012年3月から2023年12月まで、アメリカの30の主要都市圏の6000のコードにわたって、月々の住宅価格をカバーする大規模なマルチモーダルデータセットである。データセットには890K以上のレコードが含まれており、興味点(POI)、社会経済指標、詳細な不動産指標が豊富である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:52:41 GMT)
Aligning VLM Assistants with Personalized Situated Cognition [22.0]
無害で幻覚のない視覚言語モデル(VLM)は、視覚的なタスクを管理する上で、人間の貴重なアシスタントとなっている。多様な背景を持つ人々は、同じ状況でも異なる認識を持っている。このことは、VLMアシスタントを現実の援助のためにパーソナライズされた位置認識と整合させる緊急の必要性を強調している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:50:54 GMT)
MOOSE: Pay Attention to Temporal Dynamics for Video Understanding via Optical Flows [22.0]
MOOSEは、光フローと空間埋め込みを統合し、時間情報を効率的にモデル化する新しい時間中心ビデオエンコーダである。従来のモデルとは異なり、MOOSEはビデオモデルをスクラッチからトレーニングする代わりに、リッチで広く訓練済みの視覚的および光学的フローエンコーダを利用する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:53:27 GMT)
ITA-MDT: Image-Timestep-Adaptive Masked Diffusion Transformer Framework for Image-Based Virtual Try-On [21.9]
本稿では、画像ベース仮想トライオン(IVTON)のための画像時間行列拡散変換フレームワークであるITA-MDTを紹介する。 IVTONタスクは、ある画像から別の人物に衣服をシームレスに重ね合わせ、指定された衣服を身に着けている人の現実的な描写を作成する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:43:24 GMT)
Accelerated Learning with Linear Temporal Logic using Differentiable Simulation [21.8]
国家の回避やマルコフ決定プロセスのような伝統的な安全保証アプローチは、しばしば軌道要求を不適切に捉えている。本稿では,特定可能なシミュレータと統合した最初の手法を提案する。本手法では, 客観的な正当性を損なうことなく, スパース・リワード問題を本質的に緩和し, 相異なる報酬と状態を得るためのソフトラベリングを導入する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:59:40 GMT)
NavBench: Probing Multimodal Large Language Models for Embodied Navigation [21.8]
NavBenchは、ゼロショット設定下でMLLMの実施したナビゲーション機能を評価するためのベンチマークである。実世界の展開を支援するため,MLLMの出力をロボットアクションに変換するパイプラインを導入する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:21:02 GMT)
Addressing the Collaboration Dilemma in Low-Data Federated Learning via Transient Sparsity [21.7]
フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。 FLにおける階層的慣性現象を同定し,グローバルモデルの中間層は早期通信ラウンド後に最小限のアップデートを行う。 LIPS(Layer-wise Inertia Phenomenon with Sparsity)は,周期的に過渡的なスパーシリティを導入し,意味のある更新を刺激し,グローバルアグリゲーションを増強する,シンプルかつ効果的な手法である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:53:54 GMT)
ChemAU: Harness the Reasoning of LLMs in Chemical Research with Adaptive Uncertainty Estimation [21.3]
化学問題は通常、特定の用語を含む長い複雑な推論ステップを含む。 ChemAUは化学知識のギャップを特定し、特殊なドメインモデルで化学の専門知識を正確に補う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:45:49 GMT)
Four-hour thunderstorm nowcasting using deep diffusion models of satellite [21.2]
我々は,AIを用いた対流流流速報システムを構築するために,ディープ拡散モデル衛星(DDMS)を提案する。 FengYun-4A衛星による長期試験と客観的検証において,本システムは4時間までの有効対流を初めて達成した。我々のシステムは、地球対流放送のために複数の衛星と協調する可能性があるため、高度に転送可能である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:44:14 GMT)
Protap: A Benchmark for Protein Modeling on Realistic Downstream Applications [21.2]
$textbfProtap$は、バックボーンアーキテクチャ、事前トレーニング戦略、ドメイン固有のモデルを体系的に比較するベンチマークである。 Protapは3つの一般的なタスクと2つの新しい特殊タスクの5つのアプリケーションをカバーする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:48:42 GMT)
Tuning Sequential Monte Carlo Samplers via Greedy Incremental Divergence Minimization [21.2]
本稿では,SMCサンプリング器のMarkovカーネルをチューニングするための一般的な適応フレームワークを提案する。本稿では,Langevin Monte Carlo (LMC) などのカーネルに適用可能な勾配およびチューニング不要なアルゴリズムを提案する。我々の実装では、数回のバニラSMC実行を犠牲にして、チューニングされたパラメータの完全なスケジュールを得ることができます。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:39:22 GMT)
Understanding the Statistical Accuracy-Communication Trade-off in Personalized Federated Learning with Minimax Guarantees [21.2]
この研究は、グローバルモデルとローカルモデルの両方を同時に学習するパーソナライズされた学習環境について考察する。純粋にローカルトレーニングにはコミュニケーションがないが、協調学習は知識を活用して統計的精度を向上させることができる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:17:31 GMT)
NEXT: Multi-Grained Mixture of Experts via Text-Modulation for Multi-Modal Object Re-ID [21.2]
属性信頼度に基づく信頼性の高いマルチモーダルキャプション生成手法を提案する。また,マルチモーダルオブジェクト再識別のためのテキスト変調による多粒度エキスパート混在型 ReID フレームワーク NEXT を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:32:50 GMT)
DiTASK: Multi-Task Fine-Tuning with Diffeomorphic Transformations [21.1]
DiTASKは、複数のタスクに対してトレーニング済みの視覚変換器を効率的に適応するための新しいアプローチである。重み行列特異ベクトルを保存し、タスク固有の適応を可能にすることで、事前訓練された表現を維持する。 PASCAL MTLとNYUDを用いた実験により、DiTASKは4つの密集予測タスクで最先端の性能を達成することが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:34:36 GMT)
SIFBench: An Extensive Benchmark for Fatigue Analysis [20.9]
機械学習はストレス強度因子(SIF)の予測に大きな可能性を示している SIFBenchはMLベースのSIF予測をサポートするために設計されたオープンソースの大規模ベンチマークデータベースである。 SIFBenchは、500万以上の異なるクラックと、高忠実度有限要素シミュレーションから派生したコンポーネントジオメトリを含んでいる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:13:26 GMT)
Breaker: Removing Shortcut Cues with User Clustering for Single-slot Recommendation System [20.9]
シングルスロットレコメンデーションシステムでは、ユーザは一度に1つのアイテムにのみ露出し、複数のアイテムに対して同時にユーザフィードバックを収集することはできない。本稿では、ユーザ表現クラスタリングの補助タスクと、クラスタ固有の選好モデリングのためのマルチトウア構造を統合したBreakerモデルを提案する。すでにデプロイされており、Meituanでは毎日数千万人のユーザーが利用している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:23:06 GMT)
Generalization in VAE and Diffusion Models: A Unified Information-Theoretic Analysis [20.4]
本稿では,エンコーダとジェネレータの両方の一般化を保証する統一理論フレームワークを提案する。合成データと実データの両方に対する実験結果から,提案理論の有効性が示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:11:38 GMT)
anyECG-chat: A Generalist ECG-MLLM for Flexible ECG Input and Multi-Task Understanding [20.3]
マルチモーダルな大言語モデル(MLLM)は、心電図(ECG)解析への関心を喚起している。既存のECGにフォーカスしたMLLMは、レポート生成タスクに重点を置いており、多くの場合、単一の12リードの短いECG入力(10秒)に制限される。動的長のECG入力と複数のECG入力をサポートする anyECG-chat モデルを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:17:13 GMT)
Understanding Model Reprogramming for CLIP via Decoupling Visual Prompts [20.3]
視覚的リプログラミングのためのデカップリング・アンド・リウェイト化フレームワークを提案する。分離視覚プロンプト(DVP)は、明示的な原因によってグループ化された記述を用いて最適化される。我々はこれらの視覚的プロンプトの出力を確率的再重み付け行列(PRM)と統合し、各下流クラスへの貢献度を測定する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:12:13 GMT)
From Words to Waves: Analyzing Concept Formation in Speech and Text-Based Foundation Models [20.2]
音声モデルとテキストモデルによって学習された概念構造を,個人的,共同的に分析する。ニューラルネットワークの潜在表現を探索する教師なし手法である潜在概念解析を用いて、意味的抽象がモーダル間にどのように形成されるかを調べる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:33:21 GMT)
Deontological Keyword Bias: The Impact of Modal Expressions on Normative Judgments of Language Models [20.1]
本研究は,LLMにおいて,モーダル表現でプロンプトが強化された場合の義務として非拘束的文脈を判断する傾向が強いことを示す。モーダル表現が存在する場合、LLMはコモンセンスシナリオの90%以上を義務と判断する。 DKB を緩和するために,少数ショット例と推論プロンプトを統合した判定戦略を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:04:51 GMT)
Underestimated Privacy Risks for Minority Populations in Large Language Model Unlearning [20.0]
大規模言語モデル(LLM)は、センシティブで人間の生成したデータを埋め込んで、未学習の方法の必要性を喚起する。既存のフレームワークの盲点を強調するために,補完的な少数派対応評価フレームワークを導入する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:24:01 GMT)
EGA-V2: An End-to-end Generative Framework for Industrial Advertising [19.9]
EGA-V2(End-to-End Generative Advertising)は、ユーザ興味、POI(point-of-interest)、クリエイティブジェネレーション、広告アロケーション、支払い最適化を体系的にモデル化する最初の統合フレームワークである。当社の結果は、次世代産業広告システムへの道を開く、完全生成型広告ソリューションのパイオニアとしての可能性を浮き彫りにしている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:54:02 GMT)
Counterfactual Activation Editing for Post-hoc Prosody and Mispronunciation Correction in TTS Models [19.9]
既存の韻律操作のアプローチは、しばしば特別なモジュールや追加の訓練に依存し、ポストホック調整の能力を制限する。本稿では,韻律と発音のポストホック制御を実現するために,事前学習されたTSモデルの内部表現を操作するモデル非依存の手法であるCounterfactual Activation Editingを紹介する。実験の結果,提案手法は韻律的特徴を効果的に調整し,合成品質を保ちながら誤認識を補正することがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:33:37 GMT)
NeuronSeek: On Stability and Expressivity of Task-driven Neurons [19.8]
プロトタイピングタスク駆動ニューロン(NeuronSeekと呼ばれる)は、最適なニューロンの定式化を発見するためにシンボリックレグレッション(SR)を用いる。この研究は、最適な神経細胞の定式化を発見するために、シンボリック回帰をテンソル分解(TD)に置き換える。我々は,任意の連続関数を任意に小さな誤差で近似するために,共通のアクティベーション関数でアグリゲーション関数を変更することで,パラメータの固定数のネットワークを拡張できることを理論的に保証する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:36:27 GMT)
Speaking Beyond Language: A Large-Scale Multimodal Dataset for Learning Nonverbal Cues from Video-Grounded Dialogues [19.7]
テキストとともに非言語的手がかりを理解・生成するためのマルチモーダル言語モデルであるMARSを紹介する。私たちの重要な革新はVENUSです。VENUSは、タイムアラインなテキスト、表情、ボディランゲージを備えた注釈付きビデオからなる大規模なデータセットです。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:07:25 GMT)
Dynamic Modes as Time Representation for Spatiotemporal Forecasting [19.6]
提案手法は動的モード合成(DMD)を用いて観測データから直接時間モードを抽出する。都市移動性,高速道路交通,気候に関する実験により,DMDをベースとした埋没は長期水平予測の精度を一貫して改善し,残差相関を低減し,時間的一般化を高めることが示されている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:16:39 GMT)
Can Compressed LLMs Truly Act? An Empirical Evaluation of Agentic Capabilities in LLM Compression [19.4]
学習後圧縮は大規模言語モデル(LLM)の計算コストとメモリコストを削減する既存の圧縮ベンチマークは、言語モデリングと自然言語理解タスクのみに焦点を当てている。圧縮がLLMのエージェント能力に与える影響を評価するための,最初の包括的なベンチマークであるACBenchを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:59:15 GMT)
Attention Retrieves, MLP Memorizes: Disentangling Trainable Components in the Transformer [19.4]
Transformerアーキテクチャは、現代の大規模言語モデルの成功の中心である。 Transformerのコアコンポーネントは自己アテンションメカニズムですが、パフォーマンス向上のどの面、どの面がそれに起因するのか疑問に思っています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:42:39 GMT)
Universal logical operations with a dynamical qubit in Floquet code [19.3]
超伝導量子プロセッサ上でFloquet-Bacon-Shor符号を実験的に実装する。我々は,従来の静的論理量子ビットとともに,データ量子ビットの3ドル3セント格子内に動的論理量子ビットをエンコードする。この結果は、スケーラブルで資源効率の良いFT量子計算のためのFloquet符号の可能性を強調した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:24:19 GMT)
CLAP-ART: Automated Audio Captioning with Semantic-rich Audio Representation Tokenizer [18.9]
本稿では,意味豊かで離散的なトークンを入力として利用するAAC手法であるCLAP-ARTを提案する。 CLAP-ARTは2つのAACベンチマークにおいて,ベースラインのEnCLAPよりも優れていることを確認した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:01:16 GMT)
Multiverse Through Deepfakes: The MultiFakeVerse Dataset of Person-Centric Visual and Conceptual Manipulations [18.5]
GenAI技術は、非常にリアルなディープフェイクコンテンツ生成に寄与している。進行中の努力にもかかわらず、研究コミュニティには、大規模で推論能力を備えたディープフェイクベンチマークデータセットがまだ欠けている。本稿では,大規模人物中心のディープフェイクデータセットであるMultiFakeVerseを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:17:16 GMT)
LLM Safety Alignment is Divergence Estimation in Disguise [18.3]
この視点は、アライメント後の安全なプロンプトと有害なプロンプトの間の潜伏空間における分離の出現を説明する。標準の嗜好に基づくデータセットではなく、コンプライアンス拒否データセットを使用することで、分離がより強くなり、安全性の整合性が向上することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:50:53 GMT)
Improving Keystep Recognition in Ego-Video via Dexterous Focus [18.1]
我々は、自我中心的な視点から人間の活動を理解するという課題に対処する。本研究では,エゴビデオの入力を手作業による安定な映像に制限することにより,これらの課題に対処する枠組みを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:22:02 GMT)
Uncertainty-Aware Multi-view Arrhythmia Classification from ECG [18.1]
本稿では,心電図から不確実性を考慮した不整脈の多視点分類を行うディープニューラルアーキテクチャを提案する。融合技術を用いて、ECGデータ内のノイズとアーティファクトによって引き起こされる異なるビュー間の衝突を低減する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:44:35 GMT)
Uncertainty-Aware Metabolic Stability Prediction with Dual-View Contrastive Learning [18.0]
TrustworthyMSは、不確実性を認識した代謝安定性予測のために設計された、新しい対照的な学習フレームワークである。以上の結果から,TrustworthyMSは現在の最先端手法よりも予測性能が優れていることが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:05:11 GMT)
Scalable Fine-tuning from Multiple Data Sources: A First-Order Approximation Approach [17.8]
目的タスクに対する言語モデル(LM)の微調整の問題について,$n$補助タスクの情報を用いて最適に検討する。この問題には、NLPにおけるターゲット命令チューニングや、チェーン・オブ・ファインタニングにおけるデータ選択など、幅広い応用がある。繰り返しトレーニングを必要とせずにモデル微調整性能を推定する新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:17:27 GMT)
RecLM: Recommendation Instruction Tuning [17.8]
本稿では,大規模言語モデルと協調フィルタリングをシームレスに統合するモデル非依存の指導訓練パラダイムを提案する。提案した$underlineRec$ommendationは、慎重に設計された強化学習報酬関数により、ユーザの好みの多様性を捕捉する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:04:04 GMT)
Understanding and Mitigating Cross-lingual Privacy Leakage via Language-specific and Universal Privacy Neurons [17.6]
本研究は,言語間プライバシー漏洩の情報フローについて検討する。プライバシ・ユニバーサルニューロンと言語固有のプライバシニューロンを識別する。これらのニューロンを不活性化することにより、言語間プライバシー漏洩リスクは23.3%-31.6%減少する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:10:30 GMT)
CaReAQA: A Cardiac and Respiratory Audio Question Answering Model for Open-Ended Diagnostic Reasoning [17.5]
CaReAQAは、基礎的なオーディオモデルと大きな言語モデルの推論機能を統合するオーディオ言語モデルである。メタデータを付加したアノテートされた医療オーディオ記録のベンチマークデータセットであるCaReSoundを紹介する。評価の結果、CaReAQAは、オープンエンド診断推論タスクにおいて86.2%の精度を達成していることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:47:18 GMT)
HyGenar: An LLM-Driven Hybrid Genetic Algorithm for Few-Shot Grammar Generation [17.4]
数ショットの文法生成のための大規模言語モデル(LLM)の能力について検討・改善する。以上の結果から,既存のLLMは文法生成に準最適であることが明らかとなった。文法生成を最適化するLLM駆動型ハイブリッド遺伝的アルゴリズムHyGenarを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:49:41 GMT)
DeepVerse: 4D Autoregressive Video Generation as a World Model [16.9]
DeepVerseは、4Dインタラクティブな新しい世界モデルであり、過去の時系列から幾何学的予測を現在の行動予測に明示的に取り入れている。実験では、明示的な幾何学的制約を組み込むことで、DeepVerseはより豊かな時間的関係と基礎となる物理力学を捉えている。この機能はドリフトを大幅に低減し、時間的一貫性を高め、モデルが確実に将来的なシーケンスを生成することを可能にする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:58:36 GMT)
Advancing from Automated to Autonomous Beamline by Leveraging Computer Vision [16.7]
現在の最先端のシンクロトロンビームは、人間の安全の監視に大きく依存している。リアルタイム衝突検出のためのディープラーニングとマルチビューカメラを統合したコンピュータビジョンに基づくシステムを提案する。実ビームラインデータセットの実験では、高精度、リアルタイムな性能、そして自律的なシンクロトロンビームライン操作の強いポテンシャルが示される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:53:55 GMT)
Uni-MuMER: Unified Multi-Task Fine-Tuning of Vision-Language Model for Handwritten Mathematical Expression Recognition [16.7]
手書き数学的表現認識(HMER)は、光学文字認識(OCR)における永続的な課題であるアーキテクチャを変更することなく,HMERタスクの視覚言語モデルを完全に微調整するUni-MuMERを提案する。構造的空間推論のためのTree-CoT(Tree-CoT)、視覚的に類似した文字間の混乱を減らすためのエラー駆動学習(EDL)、長い表現における認識整合性を改善するためのシンボルカウント(SC)の3つのデータ駆動タスクを統合した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:04:41 GMT)
Boosting Bot Detection via Heterophily-Aware Representation Learning and Prototype-Guided Cluster Discovery [16.5]
BotHPはグラフベースのボット検出器を強化するために設計された、生成的なグラフ自己監視学習フレームワークである。ノードの共通性をキャプチャするためにグラフ対応エンコーダと、ノードの特異性を保存するためにグラフに依存しないエンコーダからなるデュアルエンコーダアーキテクチャを使用する。グラフベースのボット検出器を一貫して強化し、検出性能を改善し、ラベル依存を緩和し、一般化能力を向上する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:44:53 GMT)
Leveraging Large Language Models for Sarcastic Speech Annotation in Sarcasm Detection [16.4]
サルカズムは基本的にトーンと文脈を通して意味を変化させるが、音声でそれを検出することはデータ不足による課題である。本稿では,大規模言語モデル(LLM)を利用してサルカズムデータセットを生成するアノテーションパイプラインを提案する。本研究では,アノテーションの品質と検出性能を比較して,提案手法の有効性を検証した。最後に,このパイプラインを通じて作成した大規模サーカシック音声データセットであるPodSarcを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:00:18 GMT)
A Unified Solution to Diverse Heterogeneities in One-shot Federated Learning [16.1]
One-Shot Federated Learning (OSFL)は、サーバとクライアント間の通信を1ラウンドに制限する。 FedHydraは、モデルとデータの不均一性の両方に効果的に対処するために設計された、統一された、データフリーのOSFLフレームワークである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:54:51 GMT)
Why Prompt Design Matters and Works: A Complexity Analysis of Prompt Search Space in LLMs [15.9]
いくつかのプロンプトが成功し、他が失敗する理由を説明する理論的フレームワークを提供する。与えられたタスクに対して、最適なプロンプトを見つけ、プロンプト空間のサイズを特徴付ける複雑さを解析する。私たちの理論は効果的なプロンプト設計の背景にある原則を明らかにし、CoTを使用する自己指導的なプロンプトである"ステップバイステップ"がパフォーマンスを著しく阻害することを示している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:23:51 GMT)
LEMONADE: A Large Multilingual Expert-Annotated Abstractive Event Dataset for the Real World [15.9]
本稿では,20言語と171カ国にわたる39,786のイベントからなる大規模コンフリクトイベントデータセットLEMONADEを提案する。本稿では,抽象イベント抽出(AEE)とそのサブタスク,抽象エンティティリンク(AEL)を紹介する。我々はこれらのタスク上で様々な大規模言語モデル(LLM)を評価し、既存のゼロショットイベント抽出システムに適応し、ベンチマーク教師付きモデルを構築した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:24:05 GMT)
TESU-LLM: Training Speech-LLMs Without Speech via Unified Encoder Alignment [15.9]
textbfTESU-LLMは,テキストデータのみを用いた音声対応言語モデルの学習を可能にする新しいフレームワークである。我々の重要な洞察は、意味論的に等価なテキストと音声入力を共有潜在空間にマッピングする統一エンコーダを活用することである。 TESU-LLMはテキストのみに訓練されているにもかかわらず、様々な音声関連ベンチマークで高い性能を達成している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:27:55 GMT)
ALPCAHUS: Subspace Clustering for Heteroscedastic Data [15.8]
本稿では,ALPCAHUSというヘテロスセダスティックなサブスペースクラスタリング手法を提案する。サンプル単位のノイズ分散を推定し、この情報を用いて、データの低ランク構造に関連するサブスペースベースの推定を改善する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:48:10 GMT)
ModuLM: Enabling Modular and Multimodal Molecular Relational Learning with Large Language Models [15.6]
分子学習は分子対間の相互作用を理解することを目的としており、生化学研究の進展に重要な役割を果たしている。近年の大規模言語モデル (LLM) の発展に伴い, MRL と LLM の統合に関する研究が増えている。フレキシブルLLMモデル構築と多様な分子表現をサポートするためのフレームワークであるModuLMを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:44:16 GMT)
Probing Neural Topology of Large Language Models [15.3]
LLMニューロンの機能的接続トポロジーを明らかにするためのグラフ探索法を提案する。ニューラルトポロジのみを用いて次点予測性能の普遍的予測可能性を求める。この予測可能性は、わずか8段階の事前訓練の後、ニューロン接続のわずか1%を維持したり、モデルを探したりしても堅牢である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:57:03 GMT)
The Impact of Token Granularity on the Predictive Power of Language Model Surprisal [15.1]
認知モデリングにおいて見過ごされてきた要素の1つは、サブワードトークンの粒度である。自然主義的読解時間を用いた実験は、トークンの粒度が副次的に与える影響を顕著に示している。ガーデンパスの構成では、粗い粒度のトークンで訓練された言語モデルが、一般に臨界領域に対して高い確率を割り当てた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:05:19 GMT)
DriveMind: A Dual-VLM based Reinforcement Learning Framework for Autonomous Driving [15.0]
DriveMindは、自動運転のためのセマンティック報酬フレームワークである。平均速度は19.4 +/- 2.3 km/h、経路完了は0.98 +/- 0.03、衝突はゼロに近い。そのセマンティック報酬は、最小分散シフトでゼロショットから実際のダッシュカムデータを一般化する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:51:09 GMT)
Reflection-Window Decoding: Text Generation with Selective Refinement [14.9]
大規模言語モデル(LLM)におけるテキスト生成の自己回帰復号化は、生成されたコンテンツの洗練や修正を行うための内蔵機構が欠如しているため、本質的には準最適である。本稿では, すべり反射窓と舗装基準を組み込んだ手法を提案し, 復号化が進むにつれて, 改良と生成を相互に行なえるようにした。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:23:43 GMT)
NR4DER: Neural Re-ranking for Diversified Exercise Recommendation [14.8]
エクササイズ・レコメンデーション・コースは、学生の学習成果の改善に力を入れている。既存の手法は、学生の多様な学習ペースと一致しない。ダイバーシファイド・エクササイズ・レコメンデーションのためのニューラルリグレード(略称NR4DER)を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:36:52 GMT)
Decentralized Low-Rank Fine-Tuning of Large Language Models [14.8]
我々は,Low-Rank Adaptation (LoRA)に基づく大規模言語モデル(LLM)のための分散微調整アルゴリズムであるDec-LoRAを提案する。 BERT と LLaMA の実験により,Dec-LoRA は様々な条件下で集中型 LoRA に匹敵する性能を示した。これらの結果は、分散環境におけるスケーラブルな微調整のためのDec-LoRAの可能性を強調している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:01:21 GMT)
Speech Unlearning [14.8]
音声タスクのための機械学習を導入し,新しい研究課題について紹介する。本研究の目的は、訓練された音声モデルから特定のデータの影響を、完全に再訓練することなく効率的に効果的に除去することである。プライバシー保護、時代遅れまたはノイズの多いデータの削除、バイアス軽減に重要な応用がある。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:04:16 GMT)
Unlocking Personalized Knowledge in Federated Large Language Model: The Power of Mixture of Experts [14.7]
我々は,大規模言語モデル(LLM)に特化して設計された新しいフェデレーション学習フレームワークFLExを提案する。 FLExはグローバルなMoEモデルをプルーニングすることで効率よくパーソナライズし、クライアント毎に1人の専門家しか保持せず、適応的なゲーティングメカニズムを使用して、パーソナライズされた専門家をトレーニング済みのMoE層に再統合する。これらのパーソナライズされた専門家はローカルデータでトレーニングされ、各クライアントにローカルに保存され、共有モジュールはグローバルに集約される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:24:43 GMT)
Which of These Best Describes Multiple Choice Evaluation with LLMs? A) Forced B) Flawed C) Fixable D) All of the Above [14.6]
複数の選択質問応答(MCQA)は、単純さと人間らしいテストのため、LCMの評価に人気がある。 1) テスト生成/サブジェクティビティ,2) LLM のユースケースにマッチする,3) 完全なテスト知識。我々は,人間のテストに基づく生成形式を提唱し,LCMが回答を構築・説明し,ユーザニーズや知識をよりよく把握し,評価しやすくする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:05:44 GMT)
Persona Dynamics: Unveiling the Impact of Personality Traits on Agents in Text-Based Games [14.4]
PANDA: Personality Adapted Neural Decision Agentsは,人格特性をエージェントに投影する新しい手法である。我々は、25のテキストベースのゲームに16の異なるパーソナリティタイプを配置し、それらのトラジェクトリを分析する。これらの知見は、対話型環境におけるより整合性があり、効果的で、人間中心の意思決定を促進するためのパーソナリティ適応エージェントの約束を裏付けるものである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:48:37 GMT)
FusionAudio-1.2M: Towards Fine-grained Audio Captioning with Multimodal Contextual Fusion [14.4]
高品質で大規模な音声キャプションは、音声理解の進歩に不可欠である。現在の自動化手法は、細かな細部や文脈の正確さに欠けるキャプションを生成することが多い。本稿では,複雑な音声環境のよりきめ細やかで正確な理解方法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:29:17 GMT)
Learning Macroeconomic Policies through Dynamic Stackelberg Mean-Field Games [14.3]
政府(リーダー)はポリシーを設定し、エージェント(フォロワー)は時間とともに彼らの行動を最適化することで対応します。エージェントの数が増加するにつれて、エージェントエージェントとエージェントの相互作用を明示的にシミュレートすることは、計算的に不可能になる。エージェント・ポピュレーションと政府・ポピュレーションの結合による複雑な相互作用を近似する動的スタックバーグ平均場ゲームフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:18:46 GMT)
Pseudo-Labeling Driven Refinement of Benchmark Object Detection Datasets via Analysis of Learning Patterns [14.3]
本報告では,MS-COCO の更新版である MJ-COCO について述べる。提案手法は損失と勾配に基づく誤り検出から始まり,潜在的にラベルのずれや難解なサンプルを同定する。この統合パイプラインは、手動でリラベルすることなく、スケーラブルで正確なアノテーションエラーの修正を可能にする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:57:58 GMT)
Manipulating 3D Molecules in a Fixed-Dimensional SE(3)-Equivariant Latent Space [14.1]
本稿では,3次元分子の共有潜在空間をナビゲートすることで,フレキシブルなゼロショット分子操作法を提案する。 MolFLAEはSE(3)同変ニューラルネットワークを用いて3D分子を固定数の潜伏ノードに符号化する。 MolFLAEは、標準的な無条件の3D分子生成ベンチマーク上での競合性能を実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:30:15 GMT)
Optimistic critics can empower small actors [14.1]
非対称なセットアップの利点、特により小さいアクターの使用について論じる。一般的に、より小さなアクターはパフォーマンスの劣化と批評家の過度な適合をもたらす。分析の結果,この行動の主な原因の一つとして,価値過小評価によるデータ収集が不十分であることが示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:00:03 GMT)
NeuroStrata: Harnessing Neurosymbolic Paradigms for Improved Design, Testability, and Verifiability of Autonomous CPS [14.0]
本稿では,自律型CPSの試験と検証を強化するニューロシンボリック・フレームワークであるNeuroStrataを紹介する。主要なコンポーネントの概要、初期の成果、今後の計画について詳述する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:30:25 GMT)
DA-VPT: Semantic-Guided Visual Prompt Tuning for Vision Transformers [14.0]
計測学習技術を利用して、プロンプトの分布が微調整性能にどのように影響するかを調べる。本稿では,プロンプトの分布を案内する新しいフレームワークであるDis Distribution Aware Visual Prompt Tuning (DA-VPT)を提案する。本手法は,画像パッチとクラストークン間で意味情報を共有するための効果的なブリッジとして,プロンプトが有効であることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:02:18 GMT)
The Coming Crisis of Multi-Agent Misalignment: AI Alignment Must Be a Dynamic and Social Process [14.0]
人間の価値観や好みとAIの整合性は依然として重要な課題だ。エージェントは互いに関与するので、個々の目標と集合目標の両方を達成するために調整する必要があります。社会構造は、グループや個人の価値を減らしたり、壊したりすることができる。私たちは、人間、優先的、客観的なアライメントを相互依存的な概念として扱うようにAIコミュニティに呼びかけます。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:39:43 GMT)
Uni-LoRA: One Vector is All You Need [13.9]
Low-Rank Adaptation (LoRA) は、大規模言語モデルのための事実上のパラメータ効率の微調整(PEFT)手法となっている。本稿では,これらの LoRA 変種が用いたパラメータ空間削減戦略を統一的な枠組みで定式化できることを示す。 Uni-LoRAの統一的なビューの下では、LLM全体のLoRAパラメータを再構築するためには、単一のトレーニング可能なベクトルしか必要としない。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:00:09 GMT)
WATCH: Adaptive Monitoring for AI Deployments via Weighted-Conformal Martingales [13.8]
非パラメトリックシーケンシャルテストのメソッド -- 特にコンフォーマルテストマーチンチャル(CTM)と任意の時間価推論 -- は、この監視タスクに有望なツールを提供する。既存のアプローチは、限られた仮説クラスやアラーム基準の監視に限られています。」
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:18:25 GMT)
Less is More: Local Intrinsic Dimensions of Contextual Language Models [13.6]
本研究では,テクスチュアな埋め込みの幾何学的特性に基づく新しい視点を導入し,トレーニングと微調整の効果について検討する。局所的な次元はモデルのトレーニング力学と一般化能力に関する洞察を与える。実験では, 平均局所次元の減少が伴う傾向にあり, その後のパフォーマンス向上が予測される傾向がある。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:30:46 GMT)
Mind Your Theory: Theory of Mind Goes Deeper Than Reasoning [13.5]
LLMにおける心の理論(ToM)は近年,研究の中心的対象となっている。 LLMベンチマーク、ToMアドオン、ToM Probing、ToMの公式モデルなど、AIのさまざまなコミュニティにおけるいくつかの作業行を特定します。認知タスクに使用される動的環境にインスパイアされたToM能力の評価を改善することを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:40:43 GMT)
The Inverse Scaling Effect of Pre-Trained Language Model Surprisal Is Not Due to Data Leakage [13.4]
データ漏洩は、訓練中に言語モデルがテキスト刺激を見る原因となったデータ漏洩によるものかもしれないと推測されている。本稿では,この問題を大規模に扱うための2つの研究について述べる。最初の研究は、2つの事前学習データセットにおける5つの自然な読解時間コーパスのリークが、トークンの$n$-gramの重複の長さと頻度の点で比較的少ないことを示している。第2の研究では,読解時間コーパスと最小限に重なる「解答自由」データに基づいて学習したモデルを用いて,読解時間に対する言語モデルサイズと推定値の適合性の間の負の関係を再現した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:12:36 GMT)
Data-Efficient Machine Learning Potentials via Difference Vectors Based on Local Atomic Environments [13.3]
局所原子環境(DV-LAE)に基づく新しい差分ベクトルを提案する。 DV-LAEは、ヒストグラムベースの記述子を用いて構造的差異を符号化し、t-S次元減少による視覚解析を可能にする。 DV-LAEは, 各種材料システムにおけるデータセットサイズとトレーニング時間を著しく短縮することを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:32:01 GMT)
Camera Trajectory Generation: A Comprehensive Survey of Methods, Metrics, and Future Directions [13.3]
カメラの軌跡生成はコンピュータグラフィックス、ロボティクス、バーチャルリアリティー、シネマトグラフィーの基盤となっている。その名声が高まりつつあるにもかかわらず、この分野には、本質的な知識と進歩を集約する体系的で統一された調査が欠如している。本稿では、カメラ表現に対する様々なアプローチを紹介し、利用可能なカメラ軌跡生成モデルの詳細なレビューを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:58:25 GMT)
MCP-Zero: Proactive Toolchain Construction for LLM Agents from Scratch [13.0]
MCP-Zeroは、LCM自身がいつ、どの外部ツールを取得すべきかを判断できるプロアクティブエージェントフレームワークである。フレームワークは以下の3つのコンポーネントの上に構築されている。 (1) Proactive Tool Request、モデルが構造化された$leftnametool_assistantright>$ blockを出力し、所望のサーバとタスクを明確に指定する。実験の結果,MSP-Zeroは既存の検索手法のコンテキストオーバーヘッド問題に効果的に対処できることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:48:53 GMT)
MMSciBench: Benchmarking Language Models on Chinese Multimodal Scientific Problems [12.9]
MMSciBenchは,テキストのみおよびテキストイメージ形式を用いて数学的および物理的推論を評価するためのベンチマークである。 MMSciBenchを厳密な標準として確立し、複雑な推論と視覚的テキストの統合において重要なギャップを明らかにする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:49:16 GMT)
Inferring Functionality of Attention Heads from their Parameters [12.9]
本稿では,モデルトレーニングや推論を伴わずに,そのパラメータから注目点の機能を推定するフレームワークを提案する。 6大言語モデル(LLM)における20の操作に対するMAPSの評価を行った。我々のパイプラインは、人間の判断によって評価されるように、ほとんどの頭部に対して、多彩な操作記述を生成しながら、多様な操作を明らかにします。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:37:01 GMT)
Quality-Aware Decoding: Unifying Quality Estimation and Decoding [12.8]
本稿では,部分翻訳を確実に評価できる新しいトークンレベルQEモデルを提案する。次に、品質認識復号のためのQEモデルを統合する復号戦略を提案する。私たちのアプローチは文書翻訳タスクにおいて大きなメリットをもたらします。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:02:13 GMT)
Transport Network, Graph, and Air Pollution [12.7]
この研究は、大気汚染を示す輸送ネットワークの幾何学的パターンを、世界の都市を0.3百万のイメージで解釈することで発見する。改善された接続性、よりバランスの取れた道路タイプ、極端なクラスタリング係数の回避といった戦略は、緩和された汚染にとって有益である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:54:14 GMT)
ARIANNA: An Automatic Design Flow for Fabric Customization and eFPGA Redaction [12.7]
ARIANNAはすべての段階においてデザイナを支援する完全なフローである。本報告では, 織物の安全性評価を行い, 新規な製布流の調整方法について述べる。その結果、ARIANNAを使用してリアクションファブリックをカスタマイズすると、オーバーヘッドが最大3.3倍、eFPGAファブリックの利用率が4倍になることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:35:40 GMT)
A Two-Stage Hierarchical Deep Filtering Framework for Real-Time Speech Enhancement [12.6]
本稿では、サブバンド処理とディープフィルタリングを統合して、ターゲット時間周波数(TF)ビンとその周辺TFビンからの情報を利用して、単一チャネル音声強調を行うモデルを提案する。サブバンドモジュールは、入力時の周辺周波数ビン情報をキャプチャし、ディープフィルタリングモジュールは、ターゲットTFビンとその周辺TFビンの両方に出力にフィルタリングを適用する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:09:27 GMT)
Measurement to Meaning: A Validity-Centered Framework for AI Evaluation [12.6]
我々は、利用可能な証拠から得られる評価的クレームのタイプを推論するための構造化されたアプローチを提供する。私たちのフレームワークは、機械学習の現代的なパラダイムに適しています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:36:56 GMT)
LensCraft: Your Professional Virtual Cinematographer [12.5]
インディーの映画製作者からアニメーションスタジオまで、デジタルクリエイターたちは、創造的なビジョンを正確にカメラの動きに変換するという、永続的なボトルネックに直面している。 LensCraftは、データ駆動アプローチを使用して、プロの撮影技師の専門知識を模倣することで、この問題を解決する。 LensCraftは、高い出力品質を維持しながら、計算の複雑さを著しく低減し、推論を高速化する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:43:55 GMT)
Learning DNF through Generalized Fourier Representations [12.4]
学習理論では, 統一型および製品分布下でのDNF(Disjunctive Normal Form)の学習性は, このような表現を通じて確立されている。本稿では,フーリエ表現を用いた学習分野への5つの主要な貢献について述べる。最後の貢献は、差分有界木BN分布を学習するためのアルゴリズムを開発することである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:24:44 GMT)
Learning to Drift in Extreme Turning with Active Exploration and Gaussian Process Based MPC [12.1]
レースにおける極端なコーナーリングは、しばしば大きなサイドスリップ角につながり、車両制御にとって重要な課題である。モデル予測制御(MPC)とガウス過程回帰(GPR)を統合するモデル補正ドリフトコントローラを提案する。 GPRは、ドリフト平衡解法とMPC最適化過程の両方において、車両モデルのミスマッチを補正するために使用される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:26:04 GMT)
Enhancing Text Editing for Grammatical Error Correction: Arabic as a Case Study [12.0]
データから直接編集タグを導出するテキスト編集手法を導入し、言語固有の編集の必要性を排除した。我々はその効果をアラビア語、古典的、形態学的に豊かな言語で実証し、異なる編集表現がモデル性能に与える影響について検討する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:57:11 GMT)
Structured Semantics from Unstructured Notes: Language Model Approaches to EHR-Based Decision Support [11.9]
本稿では,臨床診断支援のための多種多様なデータソースを活用するための先進言語モデルの適用について検討する。従来の高次元のEHR分析では見過ごされがちなテキストベースの特徴が意味的に豊かな表現を提供する方法について論じる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:07:51 GMT)
Breaking Latent Prior Bias in Detectors for Generalizable AIGC Image Detection [11.9]
現在のAIGC検出器は、トレーニングに使用される同じジェネレータで生成された画像に対してほぼ完璧な精度を達成するが、目に見えないジェネレータからの出力に一般化するのに苦労する。検出器は、堅牢な生成アーティファクトを学ぶのではなく、初期ノイズベクトルから発生するパターンに関連するショートカットを学習する。そこで我々は, 発電機の出力多様体に残る逆数例を生成するオン・マニフォールド・逆数訓練(OMAT)を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:20:45 GMT)
A Large Language Model-Supported Threat Modeling Framework for Transportation Cyber-Physical Systems [11.9]
TraCR-TMF(Transportation Cybersecurity and Resiliency Threat Modeling Framework)は、大規模言語モデル(LLM)ベースのフレームワークで、専門家の介入を最小限に抑える。 MITRE ATT&CKマトリックスを利用することで、脅威、潜在的な攻撃手法、および対応する対策を特定する。 TraCR-TMFはまた、カスタマイズされたLLMを使用して脆弱性を分析することで、攻撃経路を重要な資産にマップする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:33:34 GMT)
Strategy-Augmented Planning for Large Language Models via Opponent Exploitation [11.8]
LLMエージェントの攻撃的利用能力を大幅に向上させる2段階戦略拡張計画(SAP)フレームワークを提案する。オフラインの段階では、明示的な戦略空間を構築し、その後戦略評価ネットワーク(SEN)をトレーニングするための戦略アウトカムペアデータを収集する。オンラインフェーズでは、SAPは相手の戦略を動的に認識し、よく訓練されたSEN上で最良のレスポンス戦略を探索することにより、それらを強引に活用する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:53:16 GMT)
CODEMENV: Benchmarking Large Language Models on Code Migration [11.7]
CODEMENVは、19のPythonとJavaパッケージにまたがる922のサンプルで構成されている。特定のバージョンと互換性のない関数の識別、関数定義の変更の検出、ターゲット環境へのコード適応という3つのコアタスクをカバーしている。 CODEMENV上での7つのLLMによる実験的評価では平均パス@1レートが26.50%となり、GPT-4Oは43.84%で最高スコアに達した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:29:59 GMT)
SciEvo: A 2 Million, 30-Year Cross-disciplinary Dataset for Temporal Scientometric Analysis [11.7]
SciEvoは200万以上の学術出版物からなる縦型サイエントメトリックデータセットである。 SciEvoを用いて、30年以上にわたる時間的研究を行い、サイエントメトリックスにおける重要な疑問を探求する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:58:47 GMT)
Fourier Asymmetric Attention on Domain Generalization for Pan-Cancer Drug Response Prediction [11.6]
本稿では,この課題に対処するため,FourierDrugと呼ばれる新しいドメイン一般化フレームワークを提案する。実験により,本モデルは多様なソースドメインからタスク関連特徴を効果的に学習し,未確認癌に対する薬物応答の正確な予測を行うことができた。これらの知見は,本手法の現実的臨床応用の可能性を明らかにするものである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:16:38 GMT)
OpenGait: A Comprehensive Benchmark Study for Gait Recognition towards Better Practicality [11.6]
既存の手法では、新しくリリースされた現実世界の歩行データセットに適用すると、満足のいく結果が得られることが多い。我々は,DeepGaitV2,SkeletonGait,SkeletonGait++の3つの構造的単純かつ経験的に強力なベースラインモデルを開発した。最終的に、我々は現在の歩行認識における重要なトレンドと課題について論じ、より良い実践性に向けてさらなる進歩を促すことを目的としている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:31:17 GMT)
New Lower Bounds for Stochastic Non-Convex Optimization through Divergence Decomposition [11.5]
L-凸性(QC)、擬似成長(SmoothQG)、制限不等式(RSI)などの非次元設定における一階最適化の基本的限界を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:08:58 GMT)
ClusComp: A Simple Paradigm for Model Compression and Efficient Finetuning [11.5]
ClusCompは圧縮パラダイムで、重み行列をコードブックにまとめ、ブロック単位で微調整する。 ClusCompは、A6000-48GBのGPU上で70B LLMの圧縮と微調整をサポートする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:03:12 GMT)
Keystep Recognition using Graph Neural Networks [11.4]
我々は,エゴセントリックビデオにおけるキーステップ認識のためのフレキシブルなグラフ学習フレームワークを提案する。構築されたグラフはスパースで計算効率が良く、既存のより大きなモデルを大幅に上回っている。 Ego-Exo4Dデータセット上で広範な実験を行い、提案したフレキシブルグラフベースのフレームワークが既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:54:58 GMT)
Continual-MEGA: A Large-scale Benchmark for Generalizable Continual Anomaly Detection [11.4]
実世界の展開シナリオをよりよく反映することを目的とした,異常検出における連続学習のための新しいベンチマークを導入する。私たちのベンチマークであるContinual-MEGAには、既存の評価設定を大幅に拡張する、大規模で多様なデータセットが含まれています。本稿では、ゼロショットの一般化を、連続的適応中に観測されない未確認のクラスに測定する新しいシナリオを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:00:24 GMT)
Fast or Slow? Integrating Fast Intuition and Deliberate Thinking for Enhancing Visual Question Answering [11.3]
マルチモーダルな大言語モデル(MLLM)は、ビジュアル質問回答において複雑な推論タスクに苦戦している。質問の複雑さに動的に適応するプラグイン・アンド・プレイアプローチである FOCUS を提案する。 ScienceQA、TextQA、VizWiz、MMEの4つのベンチマークの実験では、FOCUSはオープンソースとブラックボックス両方のMLLMの性能を一貫して改善している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:15:29 GMT)
RoCoFT: Efficient Finetuning of Large Language Models with Row-Column Updates [11.1]
RoCoFTは大規模言語モデルのためのパラメータ効率の良い微調整法である。提案手法は,最先端PEFT法と同等あるいは良好な精度を示すことを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:27:22 GMT)
A Finite-Time Analysis of TD Learning with Linear Function Approximation without Projections nor Strong Convexity [11.1]
線形関数近似を用いた時間差分学習(TD)の有限時間収束特性について検討する。単純な射影自由多様体は、マルコフノイズの存在下でさえ$tildemath||theta*||2sqrtT$の速度で収束することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:39:00 GMT)
Incorporating Hierarchical Semantics in Sparse Autoencoder Architectures [10.9]
概念のセマンティック階層を明示的にモデル化する改良されたSAEアーキテクチャを導入する。このアーキテクチャを大規模言語モデルの内部表現に適用すると、意味的階層が学習可能であることと、再構築性と解釈可能性の両方を改善することが示される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:20:07 GMT)
A Unified Framework for Human AI Collaboration in Security Operations Centers with Trusted Autonomy [10.9]
本稿では,セキュリティ・オペレーション・センター(SOC)におけるヒューマン・AI連携のための構造化された枠組みについて述べる。我々は,手動から完全自律までの5段階のAI自律性に基づく,新しい自律型フレームワークを提案する。これにより、監視、保護、脅威検出、警告トリアージ、インシデント応答を含む、コアSOC関数間の適応的で説明可能なAI統合が可能になる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:54:31 GMT)
Infinite-Width Limit of a Single Attention Layer: Analysis via Tensor Programs [10.8]
本稿では,現実的なアーキテクチャ次元の下で,単一注意層内の変数の無限幅極限分布を同定する。この極限法則の正確な形を無限ヘッド近似や調整されたスケーリングに頼ることなく導き出す。我々の研究成果は、無限幅政権における深層トランスフォーマーアーキテクチャの統一理論開発の基礎となるものである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:53:47 GMT)
FourierFlow: Frequency-aware Flow Matching for Generative Turbulence Modeling [10.7]
本稿では,スペクトルバイアスと共通モード雑音を暗黙的かつ明示的に緩和することにより,周波数認識学習を向上させる新しい生成乱流モデリングフレームワークを提案する。 FourierFlowは,3つの重要なイノベーションで構成されている。まず,局地的認識を備えた健全なフローアテンションブランチと,センシティブな乱流領域に焦点を当てたデュアルブランチバックボーンアーキテクチャを採用する。第3に、マスク付きオートエンコーダの高周波モデリング機能を活用し、生成モデルの特徴を高周波成分に暗黙的にアライメントする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:59:27 GMT)
Enhancing Parallelism in Decentralized Stochastic Convex Optimization [10.6]
本稿では,並列性の限界を著しく拡張する新しい分散学習アルゴリズムである分散Anytime SGDを提案する。凸最適化(SCO)フレームワーク内では、現在の最先端を超越した並列性理論上の上限を確立する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:17:32 GMT)
Speeding Up Hyper-Heuristics With Markov-Chain Operator Selection and the Only-Worsening Acceptance Operator [10.4]
古典的なCliff$_d$とJump$_m$関数クラスを含む、多数のベンチマーククラスで印象的なパフォーマンスを示す。我々は、全ての動きの受け入れ演算子を、悪化を受け入れるのみの演算子に置き換える。我々はマルコフ移動受容超ヒューリスティックに対して$O(nk+1 log n)$の驚くほど良いランタイムを証明した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:16:06 GMT)
Towards Predicting Any Human Trajectory In Context [10.3]
歩行者軌道予測のためのインコンテキスト学習フレームワークであるTrajICLを紹介する。 TrajICLはシナリオ固有のデータを微調整することなく、迅速な適応を可能にする。我々は、予測能力を高めるために、大規模な合成データセットでモデルをトレーニングする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:18:47 GMT)
On the Generalization of Handwritten Text Recognition Models [10.3]
本研究では,HTRモデルにおける分布外データ(OOD)の一般化に関する制約について検討する。我々は、広く使用されている7つのデータセットにまたがる8つの最先端HTRモデルから、336のOODケースを分析し、5つの言語にまたがる。我々は,OODシナリオにおけるHTRモデルの誤差を確実に推定し,70%のケースで10点以下に減少することを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:11:31 GMT)
LLMs can Perform Multi-Dimensional Analytic Writing Assessments: A Case Study of L2 Graduate-Level Academic English Writing [10.2]
我々は,L2大学院生による文献レビューのコーパスを用いて,9つの分析基準に対して,人間専門家による評価を行った。フィードバックコメントの品質を評価するために,新しいフィードバックコメント品質評価フレームワークを適用した。 LLMは、合理的に良好で信頼性の高い多次元解析アセスメントを生成することができる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:11:17 GMT)
TabXEval: Why this is a Bad Table? An eXhaustive Rubric for Table Evaluation [10.2]
本稿では,マルチレベル構造記述子と微粒なコンテキスト信号を統合するルーブリックに基づく評価フレームワークを提案する。本稿では,eXhaustiveとeXplainableの2相評価フレームワークであるTabXEvalを紹介する。我々はTabXBench上でTabXEvalを評価する。TabXBenchは現実的なテーブル摂動と人間のアノテーションを特徴とする多種多様なマルチベンチマークである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:12:03 GMT)
Doubly Robust Alignment for Large Language Models [10.1]
本稿では,人からのフィードバックから,大規模言語モデルと人間の嗜好を整合させる強化学習について検討する。本稿では、優先モデルと参照ポリシーのどちらが正しく指定された場合でも、一貫性が保たれる2つの頑健な選好最適化アルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:34:37 GMT)
A Large Convolutional Neural Network for Clinical Target and Multi-organ Segmentation in Gynecologic Brachytherapy with Multi-stage Learning [10.0]
本研究では,セグメンテーション性能の向上を目的とした多段階学習フレームワークであるGynBTNetを提案する。 Dice similarity Coefficient (DSC)、95th percentile Hausdorff Distance (HD95)、Average Surface Distance (ASD) を用いた最先端技術の評価を行った。 CTVは0.837+/-0.068、膀胱は0.940+/-0.052、直腸は0.842+/-0.070、子宮は0.871+/-0.047である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:21:48 GMT)
Open Source at a Crossroads: The Future of Licensing Driven by Monetization [9.9]
オープンソースソフトウェアライセンス(OSSライセンス)は、ロイヤリティや手数料を必要とせずに、様々なソースからの集約プログラムの一部としてソフトウェアを販売または配布することを保証する。オープンソースはクロスロードであり、ライセンスモデルを再定義し、コミュニティと重要なソフトウェアをサポートする必要性が高まっています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:34:11 GMT)
Research Borderlands: Analysing Writing Across Research Cultures [9.9]
我々は、言語に基づく文化規範を発見し、測定するために、人間中心のアプローチを取る。私たちは1つの文化、研究文化、そして1つのタスクに集中し、研究文化にまたがって文章を適応させます。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:23:55 GMT)
LD-RPMNet: Near-Sensor Diagnosis for Railway Point Machines [9.9]
本研究では,トランスフォーマーと畳み込みニューラルネットワークを統合したLD-RPMNetという軽量モデルを提案する。鉄道車両の運転中に収集した音信号に基づく実験結果から, 最適化されたモデルによりパラメータ数と計算複雑性を50%低減できることが示された。このことは、鉄道車両における近接センサ故障診断の応用の可能性を示している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:30:19 GMT)
Self-supervised ControlNet with Spatio-Temporal Mamba for Real-world Video Super-resolution [9.9]
本稿では,自己教師付き学習とMambaを事前学習した潜在拡散モデルに組み込むことにより,ノイズバストな実世界VSRフレームワークを提案する。 Self-supervised ControlNetはHR機能をガイダンスとして使用し、LRビデオから劣化に敏感な特徴を抽出するために対照的な学習を採用している。 VSRトレーニングを安定させるために,HR-LRビデオの混合に基づく3段階トレーニング戦略を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:36:25 GMT)
Learning Provably Improves the Convergence of Gradient Descent [9.8]
我々は L2O が自身の収束ハイライトに対する理論的裏付けを欠いていることを示す。我々はL2Oモデルの収束を証明して、そのギャップを経験的に橋渡しする。そこで我々は,勾配爆発を緩和し,理論結果の支持と拡張最適化を促進する戦略を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:08:25 GMT)
Can AI Master Econometrics? Evidence from Econometrics AI Agent on Expert-Level Tasks [9.5]
オープンソースのMetaGPTフレームワーク上に構築された「計量AIエージェント」を開発した。本発明のエージェントは,(1)エコノメトリタスクを戦略的に計画し,(2)コードの生成と実行,(3)堅牢性向上のためのエラーベースのリフレクション,(4)多ラウンド会話による反復的洗練,といった優れた性能を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:34:42 GMT)
FedSDAF: Leveraging Source Domain Awareness for Enhanced Federated Domain Generalization [9.3]
本稿では,FedSDAF(Federated Source Domain Awareness Framework)を提案する。 FedSDAFフレームワークは2つの相乗的コンポーネントで構成されている。重要なドメイン不変の機能を保持するDomain-Invariant Adapterと、ソースドメイン固有の知識を抽出し統合するDomain-Aware Adapterだ。標準的な4つのベンチマーク(OfficeHome,PACS,VLCS,DomainNet)において、我々の手法は最先端のフェデレーションドメイン一般化アプローチを一貫して上回り、精度は5.2～13.8%向上した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:13:10 GMT)
Modeling Cell Dynamics and Interactions with Unbalanced Mean Field Schrödinger Bridge [9.2]
CytoBridgeは、Un Balanced MeanField Schr"odinger Bridge (UMFSB) 問題を近似するために設計されたディープラーニングアルゴリズムである。ニューラルネットワークを通じて細胞移行、増殖、相互作用を明示的にモデル化することで、CytoBridgeはこれらのプロセスをデータから直接学習する柔軟性を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:40:08 GMT)
Generalized Linear Markov Decision Process [9.2]
一般化線形モデル(GLM)を用いた一般化線形MDP(GLMDP)フレームワークモデル報酬一般化悲観的値イテレーション(GPEVI)と半教師付き変種(SS-GPEVI)の2つのオフラインRLアルゴリズムを開発した。提案アルゴリズムは,政策準最適性に関する理論的保証を達成し,報酬ラベルが高価あるいは制限された設定におけるサンプル効率の向上を実証する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:50:41 GMT)
Beyond Fixed Variables: Expanding-variate Time Series Forecasting via Flat Scheme and Spatio-temporal Focal Learning [9.2]
現実世界のアプリケーションでは、Cyber-Physical Systemsはしばしば新しいセンサーが登場するにつれて拡張され、MTSFの変数が増加する。本課題は,(1)新しい変数の追加による不整合データ処理,(2)時間的不整合学習に対処する,というユニークな課題を提示する。これらの課題に対処するため, フレキシブル時間予測フレームワークSTEVを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:03:33 GMT)
Mispronunciation Detection Without L2 Pronunciation Dataset in Low-Resource Setting: A Case Study in Finland Swedish [8.8]
フィンランド語に対するMDモデルを導入し,89時間の第1言語(L1)話者の自然発話を訓練した。エントロピー正則化と温度スケーリング,トップk正規化を併用した多言語wav2vec 2.0モデルを訓練した。提案アルゴリズムでは,ベースラインモデルのリコール (77.5%) と精度 (17.6%) と比較して,リコール (43.2%) と精度 (29.8%) のバランスをとることができる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:28:35 GMT)
Probing LLM Hallucination from Within: Perturbation-Driven Approach via Internal Knowledge [8.8]
LLM生成テキストを3つのカテゴリに分類する新しいタスクである幻覚探索を導入する。本稿では,これらの3種類のテキストをLLMの生成に異なる影響を与えるキーエンティティをインプロンプトで摂動させることを,新たな発見として提案する。シネは、3つの近代LLMの幻覚探索に有効であり、幻覚検出における最先端の性能を達成する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:40:32 GMT)
Unfolding Boxes with Local Constraints [8.8]
既存のSATエンコーディングは、グローバルな制約の存在によって妨げられていると我々は主張する。我々はこれらのグローバル制約を単純なローカル制約で置き換える新しいSATベースのアプローチを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:30:07 GMT)
ANVIL: Anomaly-based Vulnerability Identification without Labelled Training Data [8.7]
教師付き学習ベースの脆弱性検知器は、ラベル付きトレーニングデータに制限があるため、しばしば不足する。本稿では,脆弱性検出を異常検出として再設定する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:41:06 GMT)
AceVFI: A Comprehensive Survey of Advances in Video Frame Interpolation [8.6]
ビデオフレーム補間(VFI)は、既存のフレーム間で中間フレームを合成する基本的な低レベルビジョン(LLV)タスクである。これまでにVFIに関する最も包括的な調査であるAceVFIを紹介します。中心時間フレーム補間(CTFI)と任意時間フレーム補間(ATFI)の学習パラダイムを分類する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:01:24 GMT)
Breiman meets Bellman: Non-Greedy Decision Trees with MDPs [8.5]
我々は、欲求と最適なアプローチのギャップを埋めるフレームワークDPDT(Dynamic Programming Decision Trees)を提案する。 DPDTはマルコフ決定プロセスの定式化と分割生成を組み合わせ、ほぼ最適決定木を構築する。実験の結果,DPDTは既存の最適解法よりも桁違いに少ない演算でほぼ最適損失を達成できた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:37:37 GMT)
Leveraging Randomness in Model and Data Partitioning for Privacy Amplification [8.5]
トレーニングプロセスにおける固有のランダム性は、プライバシーの増幅にどのように活用できるかを考察する。この中には、(1)データパーティショニング、(2)サンプルがトレーニングイテレーションのサブセットのみに参加し、(2)モデルパーティショニング、(2)サンプルがモデルのパラメータのサブセットだけを更新する。以上の結果から、複雑な方法でデータと相互作用する訓練プロセスのランダム性は、重要なプライバシーの増幅のために体系的に活用できることが示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:08:11 GMT)
Bound by semanticity: universal laws governing the generalization-identification tradeoff [8.4]
有限分解能の類似性は、単なる玩具・模型の人工物ではなく、基本的な創発的な情報制約であることを示す。これらの結果は、一般化識別トレードオフの正確な理論を提供し、意味論的解決がディープネットワークや脳の表現能力をどのように形成するかを明らかにする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:56:26 GMT)
TransAug: Translate as Augmentation for Sentence Embeddings [8.3]
本稿では,翻訳文ペアをテキスト用データ拡張として活用するための最初の調査であるTransAugについて述べる。他の言語設定で訓練されたエンコーダを採用する代わりに、まず中国語のエンコーダをSimCSEエンコーダから蒸留し、その埋め込みが意味空間に近いようにし、暗黙のデータ拡張として分解することができる。提案手法は,SimCSEとSentence-T5の両性能を向上し,SentEvalが評価したトランスファータスクにおいて,対応するトラックにおける最高のパフォーマンスを実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:17:47 GMT)
Toward Structured Knowledge Reasoning: Contrastive Retrieval-Augmented Generation on Experience [8.3]
大規模言語モデル(LLM)は、平易なテキストタスクでは高いパフォーマンスを達成するが、テーブルやデータベースのような構造化データでは性能が低い。本稿では,体験記憶表現を構築するフレームワークであるContrastive Retrieval-Augmented Generation on Experience (CoRE)を紹介する。実験の結果、CoREはパフォーマンスを著しく改善し、平均利得は3.44%と4.24%となり、挑戦的なタスクは最大17.2%向上した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:22:00 GMT)
Enhancing LLM Reasoning for Time Series Classification by Tailored Thinking and Fused Decision [8.3]
ReasonTSC は時系列分類のための LLM 推論を活用するために設計されたフレームワークである。時系列データの本質的な特性について、モデルを熟考する。これは、例えばドメイン固有の時系列モデルのようなプラグイン分類器からの予測と信頼スコアを、インコンテキストの例として統合する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:15:54 GMT)
XAI-Units: Benchmarking Explainability Methods with Unit Tests [8.2]
特徴属性法は説明可能なAI(XAI)に広く用いられている異なるFAモデルは、しばしば同じモデルに対して不一致の重要度スコアを提供する。我々は、さまざまな種類のモデル行動に対してFAメソッドを評価するために、オープンソースのXAI-Unitsベンチマークを導入する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:58:27 GMT)
POQD: Performance-Oriented Query Decomposer for Multi-vector retrieval [8.1]
Performance-Oriented Query Decomposer (POQD)は、Multi-Retrieval(MVR)のための新しいクエリ分解フレームワークである。 POQDは、Retrieval-Augmented Generation (RAG)システムのような任意の検索ベースのシステムにシームレスに統合できる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:41:09 GMT)
KG-TRACES: Enhancing Large Language Models with Knowledge Graph-constrained Trajectory Reasoning and Attribution Supervision [8.0]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な進歩を遂げてきたが、複雑な推論問題におけるそれらの性能は、説明責任と信頼性の欠如によって妨げられている。我々は,LLMの推論能力を高めるために,知識グラフ制約トラジェクトリ推論属性と連鎖説明スーパービジョン(KG-TRACES)を提案する。 KG-TRACES は,(1) 記号関係経路の予測,(2) 完全三重レベル推論経路の予測,(3) 帰属対応推論過程の推論経路の予測を共同で行う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:20:45 GMT)
SafeGenes: Evaluating the Adversarial Robustness of Genomic Foundation Models [8.0]
本稿では,ゲノム基盤モデルのセキュア解析のためのフレームワークであるSafeGenesを提案する。我々は、高速勾配符号法とソフトプロンプト攻撃という2つのアプローチを用いて、GFMの敵の脆弱性を評価する。ターゲットとしたソフトプロンプト攻撃は、ESM1bやESM1vのような大型モデルでも大幅に性能が低下した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:54:03 GMT)
IDCloak: A Practical Secure Multi-party Dataset Join Framework for Vertical Privacy-preserving Machine Learning [7.8]
本稿では,vPPMLのための最初の実用的セキュアなマルチパーティデータセット結合フレームワークであるIDCloakを提案する。我々は、IDCloakは、パーティ数が増えると、二者間設定において高い効率と同等の性能を示すことを示した。提案したcmPSIプロトコルは,より強力なセキュリティ保証を提供するとともに,通信サイズが最大7.78times$と8.73times$の効率向上を実現している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:20:39 GMT)
What is Stigma Attributed to? A Theory-Grounded, Expert-Annotated Interview Corpus for Demystifying Mental-Health Stigma [7.7]
メンタルヘルスのスティグマは、治療の探究と回復を阻害する広範な社会問題のままである。本稿では,人間-チャットボットインタビューの専門的,理論的インフォームドコーパスについて述べる。我々の実験は最先端のニューラルネットワークをベンチマークし、スティグマ検出の課題を実証的に解き放った。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:55:38 GMT)
Understanding Inequality of LLM Fact-Checking over Geographic Regions with Agent and Retrieval models [7.6]
オープンモデルとプライベートモデルの実際の精度を、さまざまな領域やシナリオで評価する。以上の結果から,グローバル・ノースの発言は,シナリオやLLMによらず,グローバル・サウスの発言よりも格段に優れていたことが判明した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:44:34 GMT)
The Evolution and Future Perspectives of Artificial Intelligence Generated Content [7.6]
レビューでは、AIGCの進化が4つの発展的なマイルストーンを辿っている。本研究は,AIGCモデルの選択と最適化における研究者や実践者の指導を目的とする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:15:17 GMT)
SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models [7.5]
本稿では,SEarch-Augmented Languageモデルを評価するための新しい課題ベンチマークであるSealQAを紹介する。 SealQAには、Seal-0、Seal-Hard、LongSealの3つのフレーバーがある。 DeepSeek-R1-671Bやo3-miniのような高度な推論モデルは、ノイズの多い検索結果に対して非常に脆弱であることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:04:34 GMT)
Modality Translation and Registration of MR and Ultrasound Images Using Diffusion Models [7.5]
前立腺癌の診断にはMR-US多剤の登録が重要である。既存のメソッドは、無関係な詳細に過度に敏感でありながら、重要な境界を整列することができない。階層的特徴分散設計に基づく解剖学的に整合したモダリティ変換ネットワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:10:06 GMT)
PolyBERT: Fine-Tuned Poly Encoder BERT-Based Model for Word Sense Disambiguation [7.4]
本稿では,Word Sense Disambiguation (WSD) のためのバッチコントラスト学習を用いたポリエンコーダBERTモデルを提案する。実験の結果,PolyBERTはF1スコアにおいて,ベースラインWSD法よりも2%優れていた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:35:49 GMT)
MDMP: Multi-modal Diffusion for supervised Motion Predictions with uncertainty [7.4]
本稿では,運動予測のための多モード拡散モデルを提案する。骨格データと行動のテキスト記述を統合し、定量性のある不確実性を伴う洗練された長期動作予測を生成する。我々のモデルは、長期動作を正確に予測する上で、既存の生成技術よりも一貫して優れている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:34:23 GMT)
Comparison-based Active Preference Learning for Multi-dimensional Personalization [7.3]
大きな言語モデル(LLM)は目覚ましい成功を収めていますが、それらを人間の好みに合わせることは、依然として重要な課題です。近年,多次元のパーソナライゼーションが研究されている。これはモデルが明示的な嗜好に合った応答を生成できるようにすることを目的としている。対話的に収集された比較フィードバックから暗黙的なユーザの嗜好を捉えるために,能動多次元選好学習(AMPLe)を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:31:59 GMT)
Learning Juntas under Markov Random Fields [7.3]
我々はマルコフランダム場(MRFs)に関して、$O(log n)$ juntasをリアルタイムで学習するアルゴリズムを提供する。これは、非方向性のグラフィカルモデルの構造を学習するアルゴリズムが、教師あり学習のための証明可能なアルゴリズムをもたらす最初の例である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:43:46 GMT)
Simple Prompt Injection Attacks Can Leak Personal Data Observed by LLM Agents During Task Execution [7.2]
本稿では,タスク実行中に観察された個人データをツールコールエージェントが漏出させる要因について検討する。架空の銀行エージェントを使用して、データフローベースの攻撃を開発し、エージェントセキュリティの最近のベンチマークであるAgentDojoに統合します。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:48:06 GMT)
Flexible Selective Inference with Flow-based Transport Maps [7.2]
本稿では,フローベース生成モデルからのツールを利用して,潜在的に複雑な条件分布を近似する手法を提案する。本研究では、適応的に選択された仮説とパラメータに対して有効なp値と信頼セットを提供することにより、柔軟な選択的推論を可能にすることを実証する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:05:20 GMT)
SafeSteer: Interpretable Safety Steering with Refusal-Evasion in LLMs [7.1]
本稿では,大規模言語モデル(LLM)の出力を誘導するSafeSteerという手法について検討する。テキストの品質,トピックの関連性,明示的な拒絶を保ちながら,安全ステアリングを高めるために,簡単な,勾配のない教師なしの手法を用いている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:19:37 GMT)
Nearly-Linear Time Private Hypothesis Selection with the Optimal Approximation Factor [7.1]
分布の密度をサンプルから推定することは統計学の基本的な問題である。仮説選択は、サンプルセットに加えて、$n$の候補分布が与えられる設定に対処する。本稿では,仮説の数に関して,ほぼ直線時間で実行される中央モデルに差分プライベートなアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:46:46 GMT)
Improving Automatic Evaluation of Large Language Models (LLMs) in Biomedical Relation Extraction via LLMs-as-the-Judge [7.1]
大規模言語モデル (LLM) は, 生物医学的関係抽出において顕著な性能を示した。本稿では, LLMs-as-the-Judgeをバイオメディカルな関係抽出のための代替評価法として利用することを検討した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:01:52 GMT)
Developing a Risk Identification Framework for Foundation Model Uses [7.0]
特定のファンデーションモデルの使用に関連するリスクを決定する方法について、実践者にとってのガイダンスはほとんどありません。基本モデルでリスクを識別するフレームワークを構築する上での課題を特定し、4つの設計要件を合成するために使用法ガバナンスからアイデアを適用する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:37:41 GMT)
Earley-Driven Dynamic Pruning for Efficient Structured Decoding [6.9]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、その出力が厳密な構造的制約や文法的制約に適合することを保証することは依然として困難である。そこで本稿では,Earey アルゴリズムをベースとした新しい手法を提案し,無効あるいは冗長なEarey 状態をリアルタイムに識別・排除する。既存の最適化も取り入れたFormatronと呼ばれる制約付きデコードエンジンを実装した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:05:30 GMT)
HERGC: Heterogeneous Experts Representation and Generative Completion for Multimodal Knowledge Graphs [6.6]
マルチモーダル知識グラフ(MMKG)は、画像やテキストなどの多様なモダリティを統合することで、伝統的な知識グラフ(KG)を豊かにする。 MMKGCは、これらの異種信号を利用して、行方不明な事実を推測し、MMKGの本質的な不完全性を緩和しようとする。近年,高度大言語モデル (LLMs) による生成的補完手法は,一助的知識グラフ補完において強い推論能力を示している。本稿では,MMKGのためのヘテロジニアスエキスパート表現および生成コンプリートフレームワークであるHERGCを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:12:25 GMT)
Nash Equilibria, Regularization and Computation in Optimal Transport-Based Distributionally Robust Optimization [6.5]
本研究では, 有限の輸送コストで所定の基準分布による不確実な問題パラメータの分布を選択することができるような, 最適輸送に基づく分布安定度最適化問題について検討する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:47:47 GMT)
CountingFruit: Real-Time 3D Fruit Counting with Language-Guided Semantic Gaussian Splatting [6.5]
FruitLangGSはリアルタイムな3Dフルーツカウントフレームワークで、リコンストラクション、セマンティック埋め込み、言語誘導のインスタンス推定を通じて制限に対処する。その結果,FruitLangGSは従来の手法に比べて高いレンダリング速度,セマンティック・フレキシビリティ,カウント精度を実現していることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:19:47 GMT)
Online Control of Linear Systems under Unbounded Noise [6.3]
我々は,非有界雑音下では,$ tildeO(sqrtT)$ 高確率の後悔が達成可能であることを示す。コストが強く凸であり、ノイズがガウス以下であれば、$ O(rm poly (log T)) $ regret bound が成立する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:19:21 GMT)
Quantum Key Distribution by Quantum Energy Teleportation [6.3]
我々はQETベースの量子鍵分布プロトコルを構築し、古典的および量子チャネルの両方において、そのセキュリティとノイズに対するロバスト性を解析する。我々は、不正な参加者を検知できる機能を持つ、$N$のパーティー情報共有プロトコルに構築を一般化する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:44:23 GMT)
Generic Token Compression in Multimodal Large Language Models from an Explainability Perspective [6.3]
既存のMultimodal Large Language Models (MLLM) は多数の視覚トークンを処理し、計算コストと非効率性をもたらす。トークン圧縮はLLMの入力段階では不可能な性能損失で実現可能であることを示す。本稿では,第1のLCMレイヤのアテンションマップから説明結果へのマッピングを学習し,完全な推論パスの必要性を回避することを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:44:16 GMT)
CogAD: Cognitive-Hierarchy Guided End-to-End Autonomous Driving [6.1]
我々は,人間の運転者の階層的認知機構をエミュレートする,新しいエンドツーエンドの自律運転モデルであるCogADを提案する。 CogADは、人間のような知覚のためのグローバルからローカルまでのコンテキスト処理と、認知に着想を得た計画のための意図条件付き多モード軌道生成という、二重階層的なメカニズムを実装している。 CogADは、エンド・ツー・エンドの計画において最先端のパフォーマンスを達成し、ロングテールのシナリオにおいて特に優位性を示し、複雑な現実世界の運転条件に対する堅牢な一般化を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:19:21 GMT)
Uncovering Bias Mechanisms in Observational Studies [6.1]
偏差度とニュアンス関数推定器の予測性能の関係は,一般的な因果バイアス源の識別に有効であることを示す。我々のフレームワークは、観察研究におけるバイアスの理解と特徴付けのための新しいレンズを提供し、因果推論を改善するための実践的な意味を持つ。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:58:09 GMT)
SPD: Sync-Point Drop for Efficient Tensor Parallelism of Large Language Models [6.1]
我々は、注意出力に同期を選択的にドロップすることで、テンソル並列性における通信オーバーヘッドを低減するために、Sync-Point Drop (SPD)を導入する。 SPDは8つのGPU上でのLLaMA2-70B推論に対して、全体の推論遅延を約20%削減し、1%の精度のレグレッションを提供した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:33:25 GMT)
EVALOOP: Assessing LLM Robustness in Programming from a Self-consistency Perspective [5.8]
大規模言語モデル(LLM)のプログラミング能力を評価することは、ソフトウェア工学における効果的な利用に不可欠である。本稿では,自己整合性の観点からロバスト性を評価する新しいアセスメントフレームワークEVALOOPを紹介する。我々は、EVALOOP上で16個の著名なLCM(例えば、GPT-4.1, O4-mini)を評価し、EVALOOPは通常10ループで5.01%-19.31%のパス@1性能低下を誘導することを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:54:31 GMT)
Graph-Based Spectral Decomposition for Parameter Coordination in Language Model Fine-Tuning [5.7]
目標は、訓練中の微調整効率と構造意識の両方を改善することである。重み付きグラフを構築し、周波数領域モデリングを可能にするためにラプラシアンスペクトル分解を適用した。最適化フェーズ中にスペクトルフィルタリング機構を導入し、モデルのトレーニング安定性と収束挙動を向上させる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:38:52 GMT)
Reconstruction and Prediction of Volterra Integral Equations Driven by Gaussian Noise [5.6]
本研究は、ガウス雑音によって駆動されるボルテラ積分方程式におけるパラメータ同定問題、あるいは方程式再構成問題に対処する。本稿では,これらの方程式のドリフト項における未知パラメータを推定するための改良されたディープニューラルネットワークフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:54:50 GMT)
Neural Path Guiding with Distribution Factorization [5.5]
レンダリングにおけるモンテカルロ(MC)統合を支援する神経経路案内法を提案する。十分表現力があり、合理的に高速な、単純で効果的な表現を提案する。我々のアプローチは、特に複雑な光輸送を伴う挑戦的なシーンにおいて、既存の方法よりも優れている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:04:56 GMT)
Quantum Concolic Testing [5.4]
本稿では,量子プログラム用に明示的に設計された最初のココリックテストフレームワークを提案する。量子プログラムの具体的な実行経路ごとに経路制約を生成し、量子制約解決器が結果を決定し、新しい入力サンプルを生成する。我々のフレームワークはPythonで実装され、実践的な評価のためにQiskitと統合されています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:21:37 GMT)
MedBookVQA: A Systematic and Comprehensive Medical Benchmark Derived from Open-Access Book [5.3]
MedBookVQAは、オープンアクセス医療教科書から派生した、体系的で包括的なマルチモーダルベンチマークである。当科では, モダリティ認識, 分類, 解剖学的診断, 症状診断, 外科的手術を含む, 5000の臨床的関連質問項目を作成した。我々は、プロプライエタリ、オープンソース、医療、推論モデルを含む幅広いMLLMを評価し、タスクタイプとモデルカテゴリ間での大幅なパフォーマンス格差を明らかにした。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:28:36 GMT)
Conformal Arbitrage: Risk-Controlled Balancing of Competing Objectives in Language Models [5.3]
Conformal Arbitrageは、データ駆動しきい値を学び、主目的のために最適化されたプライマリモデルとより保守的なGuardianの間を仲介するフレームワークです。提案手法は,精度において,モデル間のランダムなルーティングに一致したコストで優れた性能を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:55:10 GMT)
Perceptual Inductive Bias Is What You Need Before Contrastive Learning [5.3]
デビッド・マーの人間知覚の理論は、視覚処理は多段階の過程であると定めている。対照的表現学習フレームワークは典型的にこの明示的な多段階的アプローチを回避し、目的をオブジェクトの意味表現空間の直接学習として定義する。本稿では,Marr の多段階理論を利用する場合,ResNet18 上での知覚的コンバージェンスによる境界表現と表面表現を2倍に高速化することを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:32:37 GMT)
Kernel $ε$-Greedy for Multi-Armed Bandits with Covariates [5.1]
オンライン重み付きカーネルリッジ回帰推定器を用いて、未知の平均報酬関数を推定する。カーネルの任意の選択と対応するRKHSに対して、RKHSの内在的次元に依存するサブ線形後悔率を達成することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:43:39 GMT)
Nonlinear Assimilation via Score-based Sequential Langevin Sampling [5.1]
本稿ではスコアベースシーケンシャルランゲヴィンサンプリング(SSLS)を提案する。提案手法は,同化過程を交互に予測・更新ステップに分解する。特定の条件下での総変動(TV)距離におけるSSLS収束の理論的保証を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:27:52 GMT)
How do Transformer Embeddings Represent Compositions? A Functional Analysis [5.0]
Mistral、OpenAI Large、Googleの埋め込みモデルで構成性をテストし、BERTと比較します。リッジ回帰は線形ではあるが、構成性には最適である。驚いたことに、古典的ベクトル加算モデルは、他のどのモデルよりもほぼ同等に機能する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:02:56 GMT)
Reinforcement Learning with Random Time Horizons [5.0]
複数の実世界のアプリケーションは、自然にランダムな(潜在的に軌道依存的な)停止時間を示す。これらの停止時間は一般的にポリシーに依存するため、それらのランダム性はポリシー勾配公式に影響を及ぼす。我々は、軌道または状態空間に基づく2つの相補的な視点を示し、最適制御理論との接続を確立する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:22:45 GMT)
Guided-SPSA: Simultaneous Perturbation Stochastic Approximation assisted by the Parameter Shift Rule [4.9]
本稿では,パラメータシフト則とSPSAに基づく勾配近似を有意に組み合わせた新しい勾配推定手法である Guided-SPSAを提案する。 Guided-SPSAは、同じもしくはより良い解の最適性のためのトレーニング中に必要となる回路評価回数を15%から25%削減する。本稿では、回帰、分類、強化学習など、量子機械学習の様々なパラダイムにおけるガイド付きSPSAの性能を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:33:13 GMT)
Multimodal Fusion with Semi-Supervised Learning Minimizes Annotation Quantity for Modeling Videoconference Conversation Experience [4.9]
準教師あり学習を用いて,ビデオ会議セッションにおける非流動的あるいは不快な瞬間を予測する。モダリティを融合したコトレーニングSSLは、ROC-AUC0.9とF1スコア0.6を達成し、同じラベル付きデータで最大4%の差でSLモデルを上回った。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:09:08 GMT)
Unified Game Moderation: Soft-Prompting and LLM-Assisted Label Transfer for Resource-Efficient Toxicity Detection [4.8]
ゲームコミュニティにおける毒性の検出は、複数のゲームや言語にまたがる拡張において、大きなスケーリング上の課題に直面している。 BERTベースのリアルタイム毒性検出システムであるToxBusterに関するこれまでの研究に基づいて,これらの課題に対処するための2つの重要な知見を提示する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:50:43 GMT)
Functional BART with Shape Priors: A Bayesian Tree Approach to Constrained Functional Regression [4.6]
本稿では,FBART(Functional BART)と呼ばれる非パラメトリックベイズ法を提案する。効率的な後部推論を容易にするため,カスタマイズしたベイズバックフィッティングアルゴリズムを開発した。形状事前の使用は、後続のサンプルが指定された機能的制約を尊重することを保証します。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:43:00 GMT)
Phenotypic Profile-Informed Generation of Drug-Like Molecules via Dual-Channel Variational Autoencoders [4.5]
スマイルスゲン(SmilesGEN)は、変異型オートエンコーダ(VAE)アーキテクチャに基づく新しい生成モデルであり、潜在的な治療効果を持つ分子を生成する。 SmilesGENは、事前訓練された薬物VAEと発現プロファイルVAE(ProfileNet)を統合し、薬物様分子を生成する。実験により, SmilesGENは, 高い妥当性, 特異性, 新規性, および関連するタンパク質を標的とした高次谷本類似性を有する分子の生成において, 現在の最先端モデルよりも優れていた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:46:39 GMT)
Investigating Language Preference of Multilingual RAG Systems [4.4]
MRAGシステムは、クエリとドキュメント間の言語的バリエーションによって、関連する情報を取得するのに苦労する。 DKM-RAG(Dual Knowledge Multilingual RAG)は,翻訳された多言語パスを相補的なモデル知識で融合するフレームワークである。実験結果から,DKM-RAGは言語嗜好を緩和し,多様な言語環境における性能向上を図っている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:23:34 GMT)
Exploring Persona Sentiment Sensitivity in Personalized Dialogue Generation [4.4]
偏極化ユーザプロファイルを用いてダイアログを大規模に解析する。実験の結果, ネガティブな偏りを伴う対話はペルソナ属性を過度に強調する傾向にあることがわかった。本稿では、ターンベースの生成戦略とプロファイル順序付け機構と感情認識プロンプトを組み合わせることで、人格極性を明確に説明できる対話生成手法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:29:30 GMT)
Deformable registration and generative modelling of aortic anatomies by auto-decoders and neural ODEs [4.3]
本研究は, 形状登録のための深層学習モデルであるAD-SVFDを導入する。 AD-SVFDの特徴的な特徴はオートデコーダ構造であり、形状コホートをまたいだ一般化を可能にし、効率的な重量共有を好んでいる。新しい解剖学は、潜在空間から適切にサンプリングし、対応する逆変換を基準幾何学に適用することで合成することができる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:30:58 GMT)
Content Moderation by LLM: From Accuracy to Legitimacy [4.2]
本稿では, 難易度と難易度を区別できないため, 正確さは不十分であり, 誤解を招くものであると主張している。 LLMの最大の目標は、モデレーション決定を正しくする代わりに、それらを合法化することだ。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:04:14 GMT)
SVarM: Linear Support Varifold Machines for Classification and Regression on Geometric Data [4.2]
本研究は, 形状の変数表現を測度として利用し, テスト関数との双対性を評価するためのSVarMを提案する。トレーニング可能なテスト関数のニューラルネットワークに基づく表現を導入することにより,形状データセットの分類と回帰モデルを開発する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:55:15 GMT)
Descriptor: C++ Self-Admitted Technical Debt Dataset (CppSATD) [4.1]
自己申告技術的負債(SATD)は技術的負債(TD)のサブタイプである SATDに関するこれまでの研究は、主にJavaプログラミング言語に焦点を当ててきた。 531,000以上の注釈付きコメントとそのソースコードコンテキストからなる専用C++ SATDデータセットであるCppSATDを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:49:01 GMT)
Estimating Motor Symptom Presence and Severity in Parkinson's Disease from Wrist Accelerometer Time Series using ROCKET and InceptionTime [4.1]
InceptionTimeとRandOm Convolutional KErnel TransformをParkinsonの症状モニタリングに有効であるとして検討した。 InceptionTimeの高学習能力は複雑なムーブメントパターンのモデリングに適しており、ROCKETは小さなデータセットに適している。以上の結果から, 震度とブラジキネジアの有無を適度に評価できるが, ジスキネジア検出の課題に遭遇する可能性が示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:54:50 GMT)
Distill CLIP (DCLIP): Enhancing Image-Text Retrieval via Cross-Modal Transformer Distillation [4.1]
Distill CLIP (DCLIP) はCLIPモデルの微調整版である。オリジナルのモデルの強力なゼロショット分類機能を保ちながら、マルチモーダルな画像テキスト検索を強化する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:56:32 GMT)
Can Uniform Meaning Representation Help GPT-4 Translate from Indigenous Languages? [4.0]
GPT-4プロンプトに組み込むことで、低リソース言語に対する統一意味表現(UMR)の下流ユーティリティについて検討する。テストケースの大部分では、UMRを即時的な結果に統合することで、統計的に顕著なパフォーマンス向上が得られます。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:53:16 GMT)
Linear regression with overparameterized linear neural networks: Tight upper and lower bounds for implicit $\ell^1$-regularization [3.9]
過パラメータ線形回帰問題に対する深度Dge 2$の対角線形ニューラルネットワークの暗黙正則化について検討した。 D ge 3$ の場合、誤差は$alpha$ で線形的に減少するが、$D=2$ の場合、$alpha1-varrho$ で減少する。数値実験は、我々の理論的な発見を裏付け、より深いネットワーク、すなわち$D ge 3$がより良い一般化をもたらすことを示唆している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:55:31 GMT)
Learning distributed representations with efficient SoftMax normalization [3.9]
有界ノルムを持つ埋め込みベクトルに対して$rm SoftMax(XYT)$の正規化定数を計算する線形時間近似を提案する。本稿では,提案手法が競合手法よりも高い精度あるいは同等の精度を達成できるような事前学習した埋め込みデータセットについて述べる。提案アルゴリズムは解釈可能で,任意の埋め込み問題に容易に適応できる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:02:31 GMT)
Towards Resource-Efficient Streaming of Large-Scale Medical Image Datasets for Deep Learning [3.8]
医療画像ストリーミングツールキット(MIST)は、単一の高解像度コピーから異なる解像度とフォーマットで医療画像のストリーミングを可能にする。 MISTは、画像の品質に影響を与えることなく、データセットのホスティングとダウンロードに必要なストレージと帯域幅を削減する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:40:04 GMT)
Decoupled Hierarchical Reinforcement Learning with State Abstraction for Discrete Grids [3.8]
本稿では、状態抽象化(DcHRL-SA)を統合した分離階層型RLフレームワークを提案する。 2つのグリッド環境における実験により,提案手法は探索効率,収束速度,累積報酬,政策安定性においてPPOを一貫して上回ることを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:36:19 GMT)
If Attention Serves as a Cognitive Model of Human Memory Retrieval, What is the Plausible Memory Representation? [3.8]
本研究では,トランスフォーマー文法(TG)の注意機構が,人間の記憶検索の認知モデルとして機能するかどうかを検討する。実験により,TGの注意力は,バニラ変圧器と比較して,セルフペースト読影時間において優れた予測力を発揮することが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:45:26 GMT)
LoRA-BAM: Input Filtering for Fine-tuned LLMs via Boxed Abstraction Monitors over LoRA Layers [3.7]
微調整された大きな言語モデル(LLM)は、ドメイン固有のタスクのパフォーマンスを改善するが、過度に適合する可能性があるため、アウト・オブ・ディストリビューション(OoD)クエリでは信頼性が低い。ボックス化された抽象化を用いて,OoD検出モニタをLoRA層に追加し,モデルの能力を超えた質問をフィルタリングする手法であるLoRA-BAMを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:58:32 GMT)
Q-learning with Posterior Sampling [3.6]
本稿では,Q-値のガウス後部を探索に用いる単純なQ-ラーニングアルゴリズムであるPosterior Smpling (P=KH) を用いたQ-ラーニングを提案する。我々は、P が $tilde O(H2sqrtSAT)$ の後悔境界を達成し、既知の $Omega(HsqrtSAT)$ の低い境界と密接に一致することを示す。我々の研究は、後続サンプリングと動的プログラミングとTD学習に基づくRLアルゴリズムを組み合わせる上での課題に対する新たな技術的洞察を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:11:24 GMT)
Legal Compliance Evaluation of Smart Contracts Generated By Large Language Models [3.6]
本稿では,大規模言語モデルが法的に適合するスマートコントラクトを生成する能力について検討する。 5つの法的契約に基づいて20のスマートコントラクトを生成し、そのコンプライアンスを分析する。以上の結果から,LSMは厳格なレビューを伴って,法的に準拠したスマートコントラクトのスタータコード生成を支援することが示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:20:13 GMT)
TIME: TabPFN-Integrated Multimodal Engine for Robust Tabular-Image Learning [3.6]
タブラル・イメージ・マルチモーダル・ラーニングは,特に医学的応用において,様々な課題に対して大きな期待を抱いている。最近導入されたTabPFNをベースにした新しいマルチモーダルフレームワークであるTabPFN-Integrated Multimodal Engine (TIME)を提案する。 TIMEは、自然に欠落したデータに対して回復力のある堅牢で強力な埋め込みを生成し、事前訓練された視覚バックボーンの画像特徴と組み合わせる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 03:29:30 GMT)
PBEBench: A Multi-Step Programming by Examples Reasoning Benchmark inspired by Historical Linguistics [3.6]
我々は,事例によるプログラミングとして定式化された,歴史的言語学にヒントを得た帰納的推論問題に焦点をあてる。ほぼ1kのインスタンスでテストセットを生成します。最良のモデル(Claude-3.7-Sonnet)は、わずか54%のパスレートを達成し、LCoT LLMが歴史的言語学においてユビキタスなクラスや推論といまだに苦労していることを示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:35:39 GMT)
Quantum-Classical Embedding via Ghost Gutzwiller Approximation for Enhanced Simulations of Correlated Electron Systems [3.5]
現在の量子ハードウェア上での相関物質のシミュレーションは、限られた量子資源のために難しいままである。量子埋め込み法は計算複雑性を減らして有望な経路を提供する。この研究はゴーストグッツウィラー近似に基づく量子古典的な埋め込みフレームワークを開発する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:47:31 GMT)
XGUARD: A Graded Benchmark for Evaluating Safety Failures of Large Language Models on Extremist Content [3.4]
我々は,Large Language Models (LLMs) が生成する過激派コンテンツの重大さを評価するためのベンチマークおよび評価フレームワーク XGUARD を提案する。 XGUARDには、ソーシャルメディアやニュースなどの現実世界のデータから得られた3,840のレッド・チーム・プロンプトが含まれており、イデオロギー的なシナリオを幅広くカバーしている。本フレームワークでは, モデル応答を5つの危険レベル(0～4)に分類し, 故障頻度と重大度の両方をより微妙に分析する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:48:54 GMT)
From Past to Present: A Survey of Malicious URL Detection Techniques, Datasets and Code Repositories [3.3]
悪意のあるURLは、ユーザーを騙してプライベートデータを拡散させたり、ホストシステムに侵入するために有害なペイロードを配布することで、サイバーセキュリティエコシステムを絶えず脅かしている。本稿では,従来のブラックリストから高度なディープラーニングアプローチまで,手法を体系的に分析する。従来の調査とは違って,既存の研究を主要なデータモダリティに応じて分類する,新しいモダリティに基づく分類法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 05:32:37 GMT)
Learning More with Less: Self-Supervised Approaches for Low-Resource Speech Emotion Recognition [3.2]
音声感情認識(SER)は、ディープラーニングにおいて大きな進歩を遂げているが、注釈付きデータの不足により、低リソース言語(LRL)では依然として困難である。言語間の一般化を促進する自己指導的アプローチとして,コントラスト学習 (CL) とBootstrap Your Own Latent (BYOL) を検討した。提案手法はウルドゥー語で10.6%,ドイツ語で15.2%,バングラ語で13.9%,LRLでの有効性を示した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:49:40 GMT)
Knowledge-augmented Pre-trained Language Models for Biomedical Relation Extraction [3.1]
自動関係抽出(RE)のための微調整事前学習言語モデル(PLM)における追加コンテキスト情報の導入による性能向上に関する研究本研究は,一貫した評価枠組み内での4つの関係シナリオにまたがる5つのデータセットの文脈情報によって強化されたPLMを評価することで,この研究ギャップに対処する。文脈情報の導入は, 全体的な改善に留まらず, 微調整中に外部データを含む場合, より小さなPLMに対して大きなメリットが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:08:10 GMT)
Disambiguating Reference in Visually Grounded Dialogues through Joint Modeling of Textual and Multimodal Semantic Structures [3.0]
フレーズ接頭辞を含むマルチモーダル参照解決は、言及と現実世界のオブジェクト間の意味的関係を理解することを目的としている。本稿では,オブジェクトの埋め込みに参照埋め込みをマッピングすることで,テキストとマルチモーダルの参照解決を統一するフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:32:37 GMT)
What do self-supervised speech models know about Dutch? Analyzing advantages of language-specific pre-training [2.8]
既存の研究は、音声記録のみに基づいて訓練されたエンドツーエンドモデルから、様々な言語的特徴を復号化することができることを示した。ここでは、自己教師型Wav2Vec2モデルの内部表現において、オランダ語および語彙情報の符号化をテストする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:25:13 GMT)
Humanoid World Models: Open World Foundation Models for Humanoid Robotics [2.8]
本稿では,Humanoid World Models (HWM) を紹介する。我々は,100時間のヒューマノイド実験において,Masked TransformersとFlowMatchingの2種類の生成モデルを訓練した。パラメータ共有技術は、性能や視覚的忠実度に最小限の影響を伴って、モデルサイズを33から53に削減する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:33:36 GMT)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [2.8]
本研究は, 心臓疾患の自動診断のための, 迅速かつ正確かつ費用対効果の高い手法を提供する新しいディープラーニングアーキテクチャを開発し, 評価する。まず,多様な畳み込みフィルタサイズを利用して人間の聴覚処理をエミュレートするマルチブランチディープ畳み込みニューラルネットワーク(MBDCN)と,特徴抽出のためのパワースペクトル入力の2つの革新的な手法を提案する。第二に、LSTMブロックをMBDCNに統合し、時間領域の特徴抽出を改善するLong Short-Term Memory-Convolutional Neural (LSCN)モデルである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:07:05 GMT)
OODTE: A Differential Testing Engine for the ONNX Optimizer [2.7]
ONNXは、ONNXモデルにグラフベースの最適化を適用するためのデフォルトツールである。広く使われているにもかかわらず、最適化中にモデルの精度を維持する能力は十分に研究されていない。 OODTEは,ONNXの正しさを自動的かつ包括的に評価するユーティリティである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:58:34 GMT)
Quantifying Misalignment Between Agents: Towards a Sociotechnical Understanding of Alignment [2.6]
最近の社会技術的アプローチは、複数の人間とAIエージェント間の複雑なミスアライメントを理解する必要性を強調している。我々は、人間の競合の計算社会科学モデルをアライメント問題に適用する。我々のモデルは、潜在的に矛盾する目標を持つ多種多様なエージェントグループにおけるミスアライメントを定量化する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:41:48 GMT)
ACCESS DENIED INC: The First Benchmark Environment for Sensitivity Awareness [2.6]
大規模言語モデル(LLM)は、様々な文書フォーマットからテキストを処理する能力のため、企業データ管理にとってますます価値が増している。この研究は、敏感な言語モデルの基礎を確立し、企業環境におけるプライバシ中心のAIシステムを強化するための洞察を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:24:23 GMT)
Depth-Aware Scoring and Hierarchical Alignment for Multiple Object Tracking [2.5]
現在の動きに基づく複数物体追跡手法は、オブジェクトアソシエーションにおいてIntersection-over-Union (IoU) に大きく依存している。ゼロショットアプローチを用いて深度を推定し,それをアソシエーションプロセスにおける独立した特徴として組み込む。階層的アライメントスコアを導入し、粗いバウンディングボックスのオーバーラップと細粒度(ピクセルレベルの)アライメントを統合してIoUを洗練させる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:44:56 GMT)
Self-supervised contrastive learning performs non-linear system identification [2.4]
自己教師型学習は潜在空間においてシステム識別を行うことができることを示す。線形スイッチング, 線形および非線形のダイナミクスを明らかにするためのフレームワークである, 動的コントラスト学習を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:12:44 GMT)
Emergent Risk Awareness in Rational Agents under Resource Constraints [2.3]
この研究は、生存圧力下で活動するAIエージェントの創発的行動の理解と解釈可能性を高めることを目的としている。我々は、生存駆動の嗜好シフトの影響を定量化する理論的および経験的な結果を提供する。リスク探索やリスク回避行動の出現を緩和するメカニズムを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:48:45 GMT)
Assessing and Enhancing Quantum Readiness in Mobile Apps [2.2]
量子コンピュータはRSA、DSA、ECCなどの広くデプロイされた暗号プリミティブを脅かす。暗号処理能力を評価するために,4000以上のAndroidアプリの大規模なバイナリ解析を行う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:42:46 GMT)
Recycling Reflections for Perfect Photon Capture [2.2]
任意のパルスの完全捕捉を実現するために,初期反射をリサイクルする2パスピッチ・アンド・キャッチ方式を提案する。この方法は光子放出に拡張され、任意のパルス整形が可能となる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:21:20 GMT)
Enhancing Speech Instruction Understanding and Disambiguation in Robotics via Speech Prosody [2.1]
従来の方法では、音声をテキストに書き起こすには音声認識に頼っている。本稿では,音声韻律を直接活用して指示意図を推測・解決する手法を提案する。予測意図は、コンテキスト内学習を通じて大きな言語モデルに統合され、適切なタスク計画の曖昧化と選択を行う。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:06:57 GMT)
A Fully Generative Motivational Interviewing Counsellor Chatbot for Moving Smokers Towards the Decision to Quit [1.9]
大規模言語モデル(LLM)は、自動トークセラピストとして機能する可能性がある。喫煙者に対して喫煙をやめるよう動機づけることに焦点を当てたカウンセラーチャットボットを提示する。最先端のLCMと、Motivational Interviewing (MI)と呼ばれる広く応用された治療アプローチを使用している。被験者106名を対象に実験を行い,1週間後の会話前に喫煙をやめられるという自信を計測した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:47:38 GMT)
Localized Forest Fire Risk Prediction: A Department-Aware Approach for Operational Decision Support [1.9]
気候変動による火災行動と頻度の増大により、正確な予測は人工知能(AI)における最も急進的な課題の1つとなっている。本稿では,火災リスク評価を部署の状況に合わせて調整する新しい手法を提案する。我々は、比較的探索されていないデータセット上で最先端のAIモデルを使用して、フランス大都市圏における最初の全国規模のAIベンチマークを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:54:48 GMT)
Holstein mechanism in single-site model with unitary evolution [1.7]
単電子系におけるホルスタイン機構について検討し, 一元的進化は非断熱条件下でのフェルミオンとボソン作用素の両方に本質的に関係することを示した。結果として生じるユニタリダイナミクスとボソン周波数依存は、異なる短時間(強弱崩壊)と長時間(指数崩壊)の挙動によって証明された量子相転移を示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:27:26 GMT)
Quantum nonlinear optics with counter-propagating photons [1.6]
我々は,Rydberg偏光子を介する反伝播光子間の強い相互作用を実験的に実証した。この結果は、量子光場における工学的相互作用のための強力なプラットフォームとして、Rydberg polaritonsを確立した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:10:01 GMT)
DragPoser: Motion Reconstruction from Variable Sparse Tracking Signals via Latent Space Optimization [1.6]
DragPoserは、新しいディープラーニングベースのモーションリコンストラクションシステムである。ハードでダイナミックな制約を正確に表現します。自然なポーズと時間的コヒーレントな動きを生み出す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:02:53 GMT)
Primus: A Pioneering Collection of Open-Source Datasets for Cybersecurity LLM Training [1.5]
大規模言語モデル(LLM)は、金融、法律、医学などの専門分野において顕著な進歩を見せている。本稿では,プレトレーニング,命令微調整,蒸留の推論など,すべての主要な訓練段階をカバーする包括的なデータセットについて紹介する。データセットの継続事前トレーニングでは、集計スコアが15.88%向上し、蒸留の推論ではセキュリティ認証が10%向上した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:28:01 GMT)
Principled Input-Output-Conditioned Post-Hoc Uncertainty Estimation for Regression Networks [1.5]
不確実性は安全性に敏感なアプリケーションでは重要であるが、予測性能に悪影響を及ぼすため、市販のニューラルネットワークから排除されることが多い。本稿では,従来の入力と凍結モデルの両方に補助モデルを適用することにより,回帰タスクにおけるポストホック不確実性推定のための理論的基盤となるフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:13:27 GMT)
Choices and their Provenance: Explaining Stable Solutions of Abstract Argumentation Frameworks [1.4]
本稿では、この証明を安定なAFソリューションに拡張するための新しいアプローチを提案する。我々のアプローチでは、最小限のクリティカルアタックのセットを特定し、安定モデルによる選択と仮定をピンポイントする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:09:55 GMT)
A Reinforcement Learning Approach for RIS-aided Fair Communications [1.4]
再構成可能なインテリジェントサーフェス(RIS)は、電磁波特性を動的に変化させ、ビームフォーミングを強化する物理要素で構成されている。本稿では,複数の正則UEユニットに対して,効率的かつ公平なRIS-RLシステムを実現するための新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:00:26 GMT)
General-purpose audio representation learning for real-world sound scenes [1.4]
汎用実世界音響モデル(GRAM)のための新しい自己教師型学習手法を提案する。 GRAMトレーニングアプローチは、自然な雑音のある音のシーンに対して、頑健な空間的音声表現学習を可能にする。提案手法は, ドライ, 非空間, シングルソースのサウンドシーンと自然主義的なサウンドシーン間の性能ギャップを最小化することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:56:33 GMT)
A Dynamic Stiefel Graph Neural Network for Efficient Spatio-Temporal Time Series Forecasting [1.4]
動的時間関係を効率的に処理する動的動的スティフェルグラフニューラルネットワーク(DST-SGNN)を提案する。既存のグラフニューラルネットワークは、動的時間関係のモデリングにおいて効率と効率のバランスをとるのに苦労している。 DST-SGNNは比較的低い計算コストを維持しながら最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:58:41 GMT)
No Soundness in the Real World: On the Challenges of the Verification of Deployed Neural Networks [1.3]
理論的健全性は実用的健全性を意味するものではないと論じる。私たちは、デプロイメント環境の特徴を検出し、活用する敵ネットワークを作成します。テスト対象の検証対象がすべて,新たなデプロイメントアタックに対して脆弱であることを実証しています。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:47:37 GMT)
AI4Contracts: LLM & RAG-Powered Encoding of Financial Derivative Contracts [1.3]
大規模言語モデル(LLM)と検索拡張生成(RAG)は、AIシステムが構造化されていないテキストから情報を抽出し整理する方法を再構築している。本稿では,テンプレート駆動型LLMフレームワークであるCDMizerと,構造化テキスト変換のためのRAGベースのフレームワークを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:05:00 GMT)
Generative diffusion posterior sampling for informative likelihoods [1.1]
統計的効率を向上した新しい拡散後SMCサンプリング器を提案する。鍵となる考え方は、拡散モデルと相関する観測経路を構築し、この相関を利用してサンプルを設計することである。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:01:14 GMT)
Single Qubit Multi-Party Transmission Using Universal Symmetric Quantum Cloning [1.1]
我々は、アリスが1量子ビットの情報を$M$パーティーに送信したいという仮説的な量子ネットワークを考える。我々は、Aliceがメッセージキュービットの直接送信よりもはるかに少ないキュービットをM$リモートレシーバーに送信できることを示します。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:57:18 GMT)
Self-Supervised Multi-View Representation Learning using Vision-Language Model for 3D/4D Facial Expression Recognition [1.0]
SMILE-VLMは3D/4D FERのための自己教師型視覚言語モデルである。多視点視覚表現学習と自然言語指導を一体化する。本フレームワークは,複数のベンチマーク上での最先端性能を実現する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:47:11 GMT)
Language-Guided Multi-Agent Learning in Simulations: A Unified Framework and Evaluation [1.0]
本稿では,大規模言語モデル(LLM)をマルチエージェント強化学習(MARL)に組み込んだ統合フレームワークを提案する。フレームワークにはCoordinator、Communicator、Memoryの3つのモジュールコンポーネントがあり、サブゴールを動的に生成する。 Google Research Football、Magent Battle、StarCraft IIで評価されている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:46:49 GMT)
StatWhy: Formal Verification Tool for Statistical Hypothesis Testing Programs [1.0]
本稿では,統計プログラムの正当性を公式に特定し,自動検証するツール支援手法を提案する。プログラマは、統計プログラムのソースコードに、これらのメソッドの要件をアノテートする必要がある。我々のソフトウェアツールStatWhyは、プログラマが統計手法の要件を適切に指定したかどうかを自動的にチェックする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:09:55 GMT)
Quantization-based Bounds on the Wasserstein Metric [0.8]
ワッサーシュタイン計量は、多くの機械学習アプリケーションにおいてますます重要になっている。その魅力にも拘わらず、計算にはコストがかかりすぎることが多い。より厳密な上界や下界としても機能するワッサーシュタイン計量の効率的な近似計算の課題を考察する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:06:31 GMT)
Deep Learning Framework for Infrastructure Maintenance: Crack Detection and High-Resolution Imaging of Infrastructure Surfaces [0.7]
本研究では、畳み込みニューラルネットワーク(CNN)と効率的なサブピクセル畳み込みニューラルネットワーク(ESPCNN)からなるフレームワークを開発した。軽量超解像法であるESPCNNは,CNNから得られた正の苦難の高分解能インフラストラクチャ画像を生成する。提案手法は,高速道路の災害検知を高精度に行うとともに,効率的な資産管理の実践を支援することが期待されている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:40:18 GMT)
The dark side of the forces: assessing non-conservative force models for atomistic machine learning [0.7]
顕微鏡シミュレーションにおける非保守モデルの適用性について検討する。我々は、幾何最適化の不明確な収束から、様々な種類の分子動力学における不安定性まで、いくつかの根本的な問題を特定する。直接力予測によって得られる加速度を利用するための最良のアプローチは、それを保守的なモデルと組み合わせて使うことであるかもしれない。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:43:05 GMT)
Finite Sample Analysis of Tensor Decomposition for Learning Mixtures of Linear Systems [0.6]
入力出力データから線形力学系の混合を学習する問題について検討する。混合モデルのインパルス応答パラメータを推定するためにテンソル分解を用いたモーメントベース推定器を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:59:33 GMT)
EWGN: Elastic Weight Generation and Context Switching in Deep Learning [0.6]
本稿では,2つのタスク間のコンテキスト切替のアイデアとして,Elastic Weight Generative Networks (EWGN)を紹介した。 EWGNアーキテクチャは、学習した重みを集約しながら、プライマリネットワークの重みを動的に生成する追加ネットワークを使用する。標準的なコンピュータビジョンデータセット、すなわちMNISTとファッションMNISTを用いて、以前に学習されたタスク表現の保持を分析する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:59:53 GMT)
Optical states with higher stellar rank [0.6]
移動光場の量子非ガウス状態は、量子情報処理プロトコルの重要な構成要素である。我々は,光子数分解検出器の量子効率に課される最小限の要件と3,4,5光子の個々の光子状態の証明可能な量子非ガウス状態の実験的実現におけるスクイーズ操作の質について論じる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:11:41 GMT)
Weight-Space Linear Recurrent Neural Networks [0.6]
WARP(Weight-space Adaptive Recurrent Prediction)は、重み空間学習を線形反復で統一する強力なフレームワークである。 WARPは、様々な分類タスクにおいて最先端のベースラインと一致しているか、あるいは超越しているかを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:13:28 GMT)
Adversarial bandit optimization for approximately linear functions [0.6]
非滑らかかつ非滑らかな関数に対する帯域最適化問題を考える。それぞれのトライアルでは、損失関数は線形関数の和であり、プレイヤーの選択を観察した後に選択された小さいが任意の摂動である。その結果、最適化のために高確率の後悔を省くことが示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:19:26 GMT)
L3Cube-MahaEmotions: A Marathi Emotion Recognition Dataset with Synthetic Annotations using CoTR prompting and Large Language Models [0.6]
L3Cube-MahaEmotionsは,11個の微粒な感情ラベルを持つ高品質なマラーティ感情認識データセットである。トレーニングデータは、大きな言語モデル(LLM)を使用して合成注釈付けされ、検証とテストセットは、信頼できるゴールドスタンダードベンチマークとして手動でラベル付けされる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:01:34 GMT)
Catastrophic Liability: Managing Systemic Risks in Frontier AI Development [0.5]
フロンティアAI開発は、社会に大規模な影響を及ぼす可能性のある、システム的リスクをもたらす可能性がある。多くのAIラボでの現在のプラクティスでは、安全対策、テスト手順、ガバナンス構造に関する十分な透明性が欠如している。我々は、フロンティアAI開発における安全性ドキュメントと説明責任に関する包括的なアプローチを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:23:44 GMT)
VUSA: Virtually Upscaled Systolic Array Architecture to Exploit Unstructured Sparsity in AI Acceleration [0.5]
VUSAは、より大きな行列乗算を実行するために現在の空間に基づいて仮想的に成長する、シストリックアレイアーキテクチャである。提案アーキテクチャは, それぞれ37%, 68%の省電力化を実現している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:59:20 GMT)
A Neuromorphic Electronic Nose Design [0.5]
2つの異なる経路のパルス間の時間差でガス濃度を符号化する1つのMOxセンサのための単純なアナログフロントエンドを導入する。一定の気流中に注入されたガスパルスに対して,嗅球内の2つの主出力ニューロン間のスパイク時間差と同様,パルス間の時間差はガス濃度の増加とともに減少することを示す。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:34:05 GMT)
AEQUAM: Accelerating Quantum Algorithm Validation through FPGA-Based Emulation [0.5]
AEQUAMは、より高速でアクセスしやすい量子回路検証を可能にするツールチェーンである。 OpenQASM 2.0をRISCライクな命令に変換するコンパイラと、数値表現とシミュレート回路を選択するCythonソフトウェアモデルと、FPGAベースのハードウェアエミュレータ用のRTL記述を生成するVHDLジェネレータで構成される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:17:23 GMT)
Resonant Tunneling in Tri-layer 2H-MoTe2 grown by Molecular Beam Epitaxy Coupled with layered WSe2 carrier Reservoir [0.4]
2H-MoTe2系共振トンネル構造の導電率に顕著な量子振動を報告した。本研究は, 分子線エピタキシー (MBE) によるn-WSe2/HfO2/i-MoTe2/HfO2/Au共振トンネル装置 (RTD) を作製し, CVD (Chemical Vapor Deposition) を作製した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:42:43 GMT)
Bridging Quantum and Classical Computing in Drug Design: Architecture Principles for Improved Molecule Generation [0.4]
分子発見における生成逆数ネットワーク(GAN)の量子古典的ブリッジアーキテクチャを体系的に最適化する。我々の最適化モデル(BO-QGAN)は、従来の量子ハイブリッドベンチマークよりも2.27倍高い薬物候補スコア(DCS)を達成することで、性能を著しく向上させる。この研究は、ハイブリッドモデルに実証的に基礎を置いた最初のアーキテクチャガイドラインを提供し、現在の量子コンピュータを薬学研究パイプラインにより効果的に統合することを可能にする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:24:43 GMT)
Effective faking of verbal deception detection with target-aligned adversarial attacks [0.3]
偽りの文を書き直して真に見せる自動敵攻撃は深刻な脅威となる。我々は,人間と機械学習モデルに対する騙し検出タスクにおいて,243の真偽と262の自伝的ストーリーのデータセットを使用した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:16:18 GMT)
Probabilistic Counters for Privacy Preserving Data Aggregation [0.2]
確率的カウンタは、余分なランダム化なしにプライバシ保護機構として使用できることを示す。モリスカウンタとマックスジオカウンタに基づく特定のプライバシー保護データアグリゲーションプロトコルを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:26:51 GMT)
Graph Neural Networks for Jamming Source Localization [0.2]
本稿では、無線ネットワークにおける妨害攻撃の差し迫った脅威に対処するため、ソースローカライゼーションを妨害するグラフベースの学習を初めて導入する。提案手法は,局所的および大域的な信号集約を符号化し,空間的コヒーレンスと適応的な信号融合を保証する構造ノード表現を統合する。その結果,新しいグラフベースの学習フレームワークは,確立されたローカライゼーションベースラインを著しく上回っていることがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:29:25 GMT)
Beyond Attention: Learning Spatio-Temporal Dynamics with Emergent Interpretable Topologies [0.2]
グラフ注意ネットワーク(GAT)は空間的依存をモデル化するために人気があるが、事前に定義された隣接構造と動的注意スコアに依存している。マスクされた注意を、完全に学習可能な対称なノード相互作用行列に置き換える簡易な代替手段であるInterGATを提案する。当社のフレームワークであるInterGAT-GRUは,ベースラインGAT-GRUよりも精度が高く,SZ-Taxiデータセットでは少なくとも21%,Los-Loopデータセットでは6%向上している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:27:32 GMT)
Bridging Subjective and Objective QoE: Operator-Level Aggregation Using LLM-Based Comment Analysis and Network MOS Comparison [0.2]
本稿では,ネットワーク操作者側品質評価(QoE)のための2層フレームワークを提案する。目的としては、ITU-T P.1203参照実装を用いて平均世論スコア(MOS)に基づいて学習した機械学習モデルを開発する。主観的側面では、ユーザコメントをライブストリームから処理し、パフォーマンス関連のフィードバックを抽出するセマンティックフィルタリングとスコアリングパイプラインを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:31:55 GMT)
MC-NEST: Enhancing Mathematical Reasoning in Large Language Models leveraging a Monte Carlo Self-Refine Tree [0.2]
我々はモンテカルロ木探索の拡張としてモンテカルロ自給木(MC-NEST)を提案する。 MC-NESTは、複雑な推論タスクにおける意思決定の改善のための自己補正と自己評価を統合している。 Olympiadレベルのベンチマークで、最先端のpass@1スコアを達成している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:26:17 GMT)
Domain-Agnostic Stroke Lesion Segmentation Using Physics-Constrained Synthetic Data [0.2]
合成定量的MRI(qMRI)画像を生成するための物理制約付きアプローチを2つ導入する。私たちの最初のメソッドである$textttqATLAS$は、標準的なMPRAGE画像からqMRIマップを推定するためにニューラルネットワークを訓練する。 2番目のメソッドである$textttq Synth$は、組織ラベルから直接qMRIマップを合成する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:17:19 GMT)
LLM-Mixer: Multiscale Mixing in LLMs for Time Series Forecasting [0.1]
LLM-Mixerは、マルチスケールの時系列分解と事前学習したLCMを組み合わせることで予測精度を向上させるフレームワークである。データを複数の時間分解能に分解することで、短期的変動と長期的傾向の両方をキャプチャする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:07:27 GMT)
Yambda-5B -- A Large-Scale Multi-modal Dataset for Ranking And Retrieval [0.0]
本稿では,Yandex Musicストリーミングプラットフォームをベースとした大規模オープンソースデータセットであるYambda-5Bを紹介する。 Yambda-5Bは、939万のトラックで100万人のユーザーから479億のユーザー・イテム・インタラクションを提供している。 Yambda-5Bの重要な特徴は、オーガニックユーザアクションとレコメンデーション駆動イベントを分離するis_organicフラグの追加である。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:48:42 GMT)
Work Extraction from Classically Correlated States in Noisy Quantum Channels with Memory [0.0]
振幅減衰チャネルは量子相関を誘導し、追加の抽出作業を可能にすることを示す。この結果から,非単位雑音は量子プロトコルにおいて,限界ではなく,貴重な熱力学資源として機能することが判明した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:45:52 GMT)
Will Agents Replace Us? Perceptions of Autonomous Multi-Agent AI [0.0]
本研究は、AIエージェントの能力、影響、およびガバナンスに関する調査に対する130人の参加者からの回答を分析する。我々は、AIがプログラマを置き換える予定のタイムラインを調べ、デプロイの障壁を認識し、エージェントが決定を下すときの責任に関する信念を調べます。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:02:52 GMT)
Visualizing Public Opinion on X: A Real-Time Sentiment Dashboard Using VADER and DistilBERT [0.0]
本稿では企業評価モニタリングに適した総合的な感情分析システムを提案する。自然言語処理(NLP)と機械学習技術を組み合わせて、世論をリアルタイムで正確に解釈する。私たちの分析では、Amazon (81.2) やSamsung (45.8) のような企業が優れた感情スコアを受け取っており、Microsoft (21.7) とWalmart (21.9) は低い感情プロファイルを示している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:42:50 GMT)
Un-considering Contextual Information: Assessing LLMs' Understanding of Indexical Elements [0.0]
本稿では,大言語モデルがインデクティックスを英語でどのように解釈するかを初めて検討する。 GPT-4o, Claude 3.5 Sonnet, Gemini 1.5 Pro, DeepSeek V3 などの先駆的 LLM の評価を行った。以上の結果から,LSMは指標(I)で印象的な性能を示す一方で,他者(ここでは明日)と戦っていることが明らかとなった。構文的手がかり(例: quotation)はLLMのパフォーマンスにいくつかの指標で寄与するが、他の指標では性能を低下させる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:21:49 GMT)
Trilevel Memetic Algorithm for the Electric Vehicle Routing Problem [0.0]
本稿では、顧客シーケンス、経路割り当て、充電ステーション挿入を階層的に最適化するTrilevel Memetic Algorithm(TMA)を提案する。 WCCI 2020インスタンスのベンチマークテストでは、小規模なケースでよく知られた結果と競合するパフォーマンスを示している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:08:43 GMT)
Towards a Neural Lambda Calculus: Neurosymbolic AI Applied to the Foundations of Functional Programming [0.0]
我々は、プログラム全体の実行方法を学ぶニューラルネットワークの能力を分析する。統合型ニューラルラーニングと電卓形式化の導入について紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:21:19 GMT)
Towards Neural No-Resource Language Translation: A Comparative Evaluation of Approaches [0.0]
最小あるいは非デジタル表現の非オープンソース言語は、機械翻訳(MT)に固有の課題を提起する。制限はあるが既存のコーパスに依存している低リソース言語とは異なり、非リソース言語は訓練に使える文章が100文未満であることが多い。本研究は,3つの異なるアプローチによるノンリソース翻訳の問題について考察する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:33:07 GMT)
Towards Edge-Based Idle State Detection in Construction Machinery Using Surveillance Cameras [0.0]
未使用の建設機械は、運用コストとプロジェクト遅延を増大させる。本稿では, アイドル機械検出のためのエッジIMIフレームワークを提案する。提案手法は,オブジェクト検出,トラッキング,アイドル状態同定という3つのコンポーネントから構成される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:43:33 GMT)
Towards Data Governance of Frontier AI Models [0.0]
私たちは、フロンティアAIモデルに対して、データが新たなガバナンス能力を実現する方法について検討する。データは非リバルで、しばしば非排除可能で、容易に複製可能で、ますます合成可能になっている。データサプライチェーンに沿ってキーアクターをターゲットにした一連のポリシー機構を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:36:28 GMT)
The Bloch Equation Generator -- SimuFísica [0.0]
本稿では,Bloch方程式の生成と数値解を自動化するブラウザベースのフリーな計算ツールであるBloch Equation Generatorを提案する。ユーザーはレベルダイアグラムを設定し、許容される遷移を選択し、減衰率を定義し、回転波近似を適用するかどうかを選択することができる。 i) 2レベルシステム, (ii) CPT, EIT, および Autler-Townes 効果を解析した$Lambda$-typeシステム, (iii) Zeeman-resolved 5,S_0 に基づく現実的な12レベルシステム。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:16:08 GMT)
Spectral and Thermal Analysis of the Morse Potential within the Dunkl Formalism: Analytical Approximations and Applications [0.0]
ダンクル量子力学の枠組みの中で,モースポテンシャルを受ける粒子の量子力学について検討する。得られたエネルギースペクトルと波動関数は、ダンクルパラメータが有効ポテンシャルと振動状態をどのように変化させるかを明らかにする。また, 分配関数, 自由エネルギー, 内部エネルギー, エントロピー, 比熱などの熱力学関数も計算する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 07:36:58 GMT)
Spectral Multifractality and Emergent Energyscales Across the Many-Body Localisation Transition [0.0]
創発的,特徴的エネルギースケールの観点から,多体局所化遷移のスケーリング理論を提案する。これらの特徴的エネルギースケールの多体局所化遷移へのスケーリングは、コステリッツ=チューレス型のシナリオと矛盾する理論を受け入れている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:13:31 GMT)
Slow Feature Analysis on Markov Chains from Goal-Directed Behavior [0.0]
本研究では,ゴール指向行動が理想化環境での値関数近似に及ぼす影響について検討する。有害なスケーリング効果を軽減できる3つの補正経路を評価し,検討した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:57:41 GMT)
SCC-YOLO: An Improved Object Detector for Assisting in Brain Tumor Diagnosis [0.0]
You Only Look Once (YOLO)シリーズは、医用画像検出において優れた精度を示している。本稿では,SCConvモジュールをYOLOv9に統合した新しいSCC-YOLOアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:37:01 GMT)
Revolutionizing Radiology Workflow with Factual and Efficient CXR Report Generation [0.0]
本稿では,胸部X線自動生成に特化して開発されたLLM中心の基盤モデルであるCXR-PathFinderを紹介する。本稿では,専門的な臨床フィードバックを相手の学習フレームワークに統合する,ユニークな訓練パラダイムであるCGAFTを提案する。我々の実験は、CXR-PathFinderが、様々なメトリクスで既存の最先端の医療ビジョン言語モデルを大幅に上回っていることを実証した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:47:49 GMT)
Revolutionizing Blood Banks: AI-Driven Fingerprint-Blood Group Correlation for Enhanced Safety [0.0]
本研究は,生体認証ツールとしての指紋パターンとABO血液群との関係に焦点を当てた。研究によると、ループは最も一般的な指紋パターンであり、O+血液型が最も多い。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 16:18:24 GMT)
Regulatory Graphs and GenAI for Real-Time Transaction Monitoring and Compliance Explanation in Banking [0.0]
本稿では,グラフに基づくモデリング,物語フィールドの埋め込み,生成的説明を統合したリアルタイムトランザクション監視フレームワークを提案する。このシステムは動的トランザクショングラフを構築し、構造的特徴と文脈的特徴を抽出し、グラフニューラルネットワークを用いて不審な振る舞いを分類する。シミュレーションデータを用いた実験により, 98.2%のF1スコア, 97.8%の精度, 97.0%のリコールが得られた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:34:57 GMT)
Real-time Chest X-Ray Distributed Decision Support for Resource-constrained Clinics [0.0]
本稿では,FastDDSを用いた遠隔地病院におけるリアルタイム胸部X線分類システムを提案する。我々はResNet50ニューラルネットワークを88.61%の精度、88.76%の精度、88.49%のリコールに微調整した。提案システムでは,遠隔地の医師をインターネットで支援する方法を実証する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:45:18 GMT)
Quotient Network -- A Network Similar to ResNet but Learning Quotients [0.0]
ResNetは、非常に深いネットワークをトレーニングするための強力なツールです。我々は、ResNetの利点を生かしながら、これらの2つの問題を完璧に解決する新しいネットワークを提案する。具体的には、既存の機能で対象の機能の商を学習するので、これを商ネットワークと呼ぶ。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 12:46:43 GMT)
Quantum Adaptive Self-Attention for Quantum Transformer Models [0.0]
本稿では,量子アテンション機構を備えた古典的トランスフォーマーモデルを強化するハイブリッドアーキテクチャであるQuantum Adaptive Self-Attention (QASA)を提案する。 QASAはドット積の注意をパラメータ化量子回路(PQC)に置き換え、量子ヒルベルト空間におけるトークン間の関係を適応的に捉える。合成時系列タスクの実験により、QASAは標準変圧器と古典的変圧器の双方と比較して、より高速な収束と優れた一般化を実現することが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:39:41 GMT)
Quantifying First-Order Markov Violations in Noisy Reinforcement Learning: A Causal Discovery Approach [0.0]
強化学習 (Reinforcement Learning, RL) 法は、それぞれの新しい観測が環境の状態を完全に反映していると仮定する。実際には、部分的な可観測性やセンサ/アクチュエータノイズは、この仮定を無効にすることが多い。本稿では,新しいマルコフ・ヴァイオレーションスコア(MVS)を用いて,このような違反を検出するための体系的手法を提案する。 MVSは、ノイズや不完全な状態情報がマルコフプロパティを乱すときに現れる多段階依存関係を測定する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:06:22 GMT)
Privacy-Aware, Public-Aligned: Embedding Risk Detection and Public Values into Scalable Clinical Text De-Identification for Trusted Research Environments [0.0]
直接的および間接的識別子がレコードタイプ,臨床設定,データフローによってどのように変化するかを示し,ドキュメントの実践の変化が時間とともにモデルのパフォーマンスを低下させるかを示す。われわれの調査結果は、プライバシーリスクは文脈に依存し、累積的であり、適応的でハイブリッドな非識別アプローチの必要性を強調している。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:45:57 GMT)
Predicting Blood Type: Assessing Model Performance with ROC Analysis [0.0]
この研究は200人の個人を分析し、指紋をループ、輪郭、アーチの3つのタイプに分類しました。統計学的には指紋パターンと血液型との間に有意な相関は認められなかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:04:12 GMT)
Post-Training Language Models for Continual Relation Extraction [0.0]
本研究では,事前学習言語モデル(PLM),特に大規模言語モデル(LLM)を知識グラフに適用することを検討した。我々は,TACREDおよびFewRelデータセット上で,デコーダのみのモデル(Mistral-7BとLlama2-7B)とエンコーダ-デコーダモデル(Flan-T5 Base)を評価する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:19:20 GMT)
Position as Probability: Self-Supervised Transformers that Think Past Their Training for Length Extrapolation [0.0]
PRISMは、トランスフォーマーがトレーニング長の10倍まで正確に外挿できる新しい位置符号化機構である。解析により、PRISMの位置エンコーディングは鋭く解釈可能な内部状態を維持しており、信頼性のある長さ一般化の理論的基礎となっていることが示された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:20:44 GMT)
Parity-Time Symmetric Spin-1/2 Richardson-Gaudin Models [0.0]
任意の磁場中におけるスピン-1/2$粒子に対する積分可能な$mathcalPT$-symmetric Richardson-Gaudinモデルについて検討する。我々は$mathcalPT$-symmetric conserved chargeのエルミート式を導出する。このモデルのスピンダイナミクスを数値的に研究し、閉量子系と開量子系の両方におけるエルミートの場合と比較する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:29:11 GMT)
Optimizing RAG Pipelines for Arabic: A Systematic Analysis of Core Components [0.0]
Retrieval-Augmented Generation (RAG) は、検索システムの精度と大規模言語モデルの流速を結合する強力なアーキテクチャとして登場した。本研究では,最先端のRAGコンポーネントの包括的評価,チャンキング戦略,埋め込みモデル,リランカー,言語モデルなど,さまざまなアラビアデータセットの集合を包括的に比較した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:04:58 GMT)
Opportunities and Challenges of Frontier Data Governance With Synthetic Data [0.0]
合成データがもたらす3つの重要なガバナンスと説明責任の課題を特定します。相関学習, バイアス緩和, 値強化に対する合成データの適用性について検討した。これらは合成データのリスクに対処するだけでなく、将来のフロンティアの統治にとって重要なレバーとして機能する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:31:13 GMT)
Moduli space of Conformal Field Theories and non-commutative Riemannian geometry [0.0]
崩壊するコンフォーマル場の理論とグロモフ・ハウスドルフ極限の類似性について論じる。この類似に動機付けられて、非可換(量子)の概念を提案する。この構造が、d=1の場合のコンヌのスペクトル三重項とどのように関係しているかを説明する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:32:23 GMT)
Modular Speaker Architecture: A Framework for Sustaining Responsibility and Contextual Integrity in Multi-Agent AI Communication [0.0]
マルチエージェントシステム間のコヒーレントでロールアウェアなコミュニケーションを持続することは、AIの基本的な課題である。講演者の振る舞いを,役割追跡,責任継続性,コンテキストコヒーレンスのためにモジュールコンポーネントに分解するフレームワークである,モジュール型話者アーキテクチャ(MSA)を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:39:51 GMT)
Moderating Harm: Benchmarking Large Language Models for Cyberbullying Detection in YouTube Comments [0.0]
本研究は,OpenAI GPT-4.1, Google Gemini 1.5 Pro, Anthropic Claude 3 Opusの3つの主要な言語モデルを,5,080コメントのコーパスでベンチマークする。 YouTubeのデータセットは、英語、アラビア語、インドネシア語で1,334件の有害メッセージと3,746件の有害メッセージで構成されている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:17:36 GMT)
Leveraging CLIP Encoder for Multimodal Emotion Recognition [0.0]
マルチモーダル感情認識(MER)は、言語、音声、視覚などの様々なモダリティからのデータを組み合わせて人間の感情を識別することを目的としている。本稿では,CLIP(MER-CLIP)に基づくラベルエンコーダ誘導型MERフレームワークを提案する。本手法では,ラベルをテキスト埋め込みとして扱って意味情報を組み込むラベルエンコーダを導入し,より代表的な感情的特徴を学習する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:42:57 GMT)
Integrating Emerging Technologies in Virtual Learning Environments: A Comparative Study of Perceived Needs among Open Universities in Five Southeast Asian Countries [0.0]
本研究では,新興技術が支援する仮想学習環境における学生のニーズについて検討する。東南アジアの主要5大学を対象に調査を行った。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:27:23 GMT)
Improving population size adapting CMA-ES algorithm on step-size blow-up in weakly-structured multimodal functions [0.0]
パラメータ設定を調整することで、探索と利用のバランスを維持することができる。集団サイズ適応共分散行列適応進化戦略アルゴリズム(PSA-CMA-ES)は,集団サイズを動的に調整することにより,このバランスを実現する。しかし、弱い構造を持つマルチモーダル問題では、アルゴリズムはステップサイズの増大を効果的に管理するのに苦労する。本研究では,この制限を克服するため,ステップサイズ補正戦略を改訂した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 04:10:44 GMT)
Improving LLM Agents with Reinforcement Learning on Cryptographic CTF Challenges [0.0]
random-crypto"は暗号のCapture-the-Flagチャレンジジェネレータフレームワークである。ツール強化されたLlama-3.1-8Bをガイド強化プロンプト最適化で微調整するために使用される。 Pass@8では、"random-crypto"タスクに対して、+53%の絶対的なジャンプが得られます。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 01:59:52 GMT)
Hypergraph Neural Sheaf Diffusion: A Symmetric Simplicial Set Framework for Higher-Order Learning [0.0]
本稿では,HNSD(Hypergraph Neural Sheaf Diffusion)をハイパーグラフに導入する。 HNSD は対称単純集合上の正規化次数 0 のラプラシアンを通して作用し、向きのあいまいさと隣接の間隔を解消する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:48:25 GMT)
Human-AI Governance (HAIG): A Trust-Utility Approach [0.0]
本稿では,人間とAIの関係が進化する中で,信頼のダイナミクスを分析するためのHAIGフレームワークを紹介する。我々の分析は、自己監督、推論権限、分散意思決定の技術的進歩が、不均一な信頼の進化をいかに引き起こすかを明らかにする。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:20:31 GMT)
HBT Interferometry and Quantum Nature of Primordial Gravitational Waves in Hořava-Lifshitz Gravity [0.0]
ホヴラヴァ・リフシッツ重力は、重力の正規化可能でユニタリで変分自由な量子場理論として認識されている。本稿では,Hovrava-Lifshitz重力下で発生した原始重力波の量子的性質について検討する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 10:35:19 GMT)
HADA: Human-AI Agent Decision Alignment Architecture [0.0]
HADAはプロトコルとフレームワークのリファレンスアーキテクチャであり、大きな言語モデル(LLM)エージェントとレガシーアルゴリズムの両方を組織的目標と値に一致させる。技術的および非技術的アクターは、戦略的、戦術的、リアルタイムな地平線を越えて、あらゆる決定をクエリ、ステア、監査、または競合することができる。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 14:04:52 GMT)
GeoChain: Multimodal Chain-of-Thought for Geographic Reasoning [0.0]
GeoChainはマルチモーダル大言語モデル(MLLM)におけるステップバイステップの地理的推論を評価するためのベンチマークであるそれぞれの画像を21ステップのチェーン・オブ・シークレット(CoT)質問シーケンス(3000万以上のQ&Aペア)とペアリングする。これらのシーケンスは、粗い属性から4つの推論カテゴリにわたるきめ細かい局所化までモデルを導く。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:24:46 GMT)
FlashNorm: fast normalization for LLMs [0.0]
本稿ではRMSNormの正確な実装であるが高速な実装であるFlashNormについて述べる。 FlashNormはまたLayer Normalizationを高速化し、最近発表されたDynamic Tanh (DyT) arXiv:2503.10622を置き換えた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:12:10 GMT)
Fast numerical generation of Lie closure [0.0]
少数の行列のリー代数閉包を見つけることは、量子コンピューティングや量子制御において重要な応用となる。標準構成アルゴリズムは、行列が潜在的に大きな行列集合から線形に独立であるかどうかを決定するサブルーチンへの繰り返し呼び出しを行う。本稿では,計算複雑性とメモリフットプリントを同時に低減する線形独立性チェックの効率的な代替手法を提案する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 18:58:49 GMT)
Faithful Logic Embeddings in HOL -- Deep and Shallow [0.0]
本稿では,古典的高次論理学における深層・浅層埋め込みの同時展開法を提案する。この手法は論理学の教育、研究、応用に有用であり、ここでは単純な命題のモーダル論理を用いて説明される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 11:17:37 GMT)
Explainable-AI powered stock price prediction using time series transformers: A Case Study on BIST100 [0.0]
本研究では,変圧器を用いた時系列モデルと説明可能な人工知能(XAI)を組み合わせることで,株価予測の解釈可能性と精度を高める手法を提案する。この分析は、2015年1月から2025年3月までの期間を対象とする、BIST100指数に記載されている5大銀行の日物株価と、XBANK、XU100指数に焦点を当てている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 13:29:25 GMT)
Efficient Training of Deep Neural Operator Networks via Randomized Sampling [0.0]
本稿では,DeepONetのトレーニングに採用するランダムサンプリング手法を提案する。従来のトレーニングアプローチと比較して、テスト全体のエラーを同等あるいは低いものにしながら、トレーニング時間の大幅な削減を実証する。この結果から,訓練中のトランクネットワーク入力にランダム化を組み込むことで,DeepONetの効率性とロバスト性を高めることが示唆された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 23:35:59 GMT)
EEG2TEXT-CN: An Exploratory Study of Open-Vocabulary Chinese Text-EEG Alignment via Large Language Model and Contrastive Learning on ChineseEEG [0.0]
中国語に適した新しいオープン語彙EEG-to-text生成フレームワークを提案する。脳波エンコーダ(NICE-EEG)と小型事前学習言語モデル(MiniLM)に基づいて構築され,脳信号と自然言語表現を協調する。 1500以上のトレーニング検証文と300件の保持試験サンプルによる評価は、最高のBLEU-1スコアが6.38%である、有望な語彙的アライメントを示している。この研究は、多言語脳-テキスト研究における新たな方向性を開き、中国における未来の認知言語インターフェースの基礎を築いた。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 06:26:32 GMT)
Designing DSIC Mechanisms for Data Sharing in the Era of Large Language Models [0.0]
大規模言語モデル(LLM)のトレーニングには、法的、プライバシー、戦略的制約に直面している機関からの大量の高品質なデータが必要である。本稿では,信頼度を最小化したデータ共有のためのメカニズム設計フレームワークを提案する。我々は、プロバイダがデータコストと品質をプライベートに知るモデルを定式化し、その価値は、モデルの性能に対するデータの貢献からのみ生じます。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 22:17:18 GMT)
Deep Temporal Reasoning in Video Language Models: A Cross-Linguistic Evaluation of Action Duration and Completion through Perfect Times [0.0]
時間的推論に基づいてビデオ言語モデル(VLM)を評価するために設計された,4次的(英語,イタリア語,ロシア語,日本語)な質問応答ベンチマークである textbfPerfect Times データセットを紹介した。実験結果から、現状のモデルは、テキストベースのタスクで成功したにも拘わらず、ビデオに根ざした時間的・因果的推論の反映に苦慮していることが明らかとなった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 09:45:41 GMT)
Culturally-Grounded Chain-of-Thought (CG-CoT):Enhancing LLM Performance on Culturally-Specific Tasks in Low-Resource Languages [0.0]
大規模言語モデル(LLM)は、特に低リソース言語において、文化的に特定の推論タスクに苦しむ。本稿では,文化的文脈の高密度ベクトル検索と明示的な推論シーケンスを組み合わせた新しいプロンプト戦略であるCG-CoTを紹介する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 21:57:02 GMT)
Correlation Functions and Chaotic Behavior of the SYK Chain Model in Pure States [0.0]
我々は,SYK鎖の個々のエネルギー固有状態における情報の熱化とスクランブルについて,正確な対角化を用いて検討した。その結果, 絡み合い力学で観測される緩やかな熱化は, 純粋な状態であっても, 熱化と揺らぎの全てのプローブに及ばないことがわかった。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:51:20 GMT)
Contextual Candor: Enhancing LLM Trustworthiness Through Hierarchical Unanswerability Detection [0.0]
本稿では,大規模言語モデル(LLM)のための新しいハイブリッド学習パラダイムであるReinforced Unanswerability Learning (RUL)を紹介する。 RULは、多段階学習戦略によって導かれるLLMの生成コアに、識別不能な予測ヘッドを統合する。実験は、RULの優れた性能を示し、文、段落、ランキングレベルにわたる解答不能検出において、はるかに高い精度を達成する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 17:59:27 GMT)
Behavioral Augmentation of UML Class Diagrams: An Empirical Study of Large Language Models for Method Generation [0.0]
本研究では, 大規模言語モデル(LLM)を用いて, 21 の構造化廃棄物処理事例を用いて, メソドレスダイアグラム(21 クラス, 17 の関係性)を増強する。合計90の図(3,373の方法)が6回にわたって評価された。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:33:40 GMT)
Analogs of deconfined quantum criticality for non-invertible symmetry breaking in 1d [0.0]
非可逆対称性の破れの異なるパターンに対応する1dスピン鎖の2階相転移を探索する。臨界点は、分解された量子臨界点のよく理解された例といくつかの特徴を共有している。また、非可逆順序パラメータ間の分解量子臨界点を含む関連するモデルにおける近相相と相転移についても検討する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 19:29:44 GMT)
An Integrated Platform for LEED Certification Automation Using Computer Vision and LLM-RAG [0.0]
本稿では,LEED認証の重要な側面を合理化する自動化プラットフォームを提案する。このプラットフォームには、PySide6ベースのユーザインターフェース、プロセスオーケストレーションのためのレビューマネージャ、クレジットコンプライアンスのための複数の分析エンジン、EnergyPlusによるエネルギーモデリング、ロケーションベースの評価が含まれている。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:05:35 GMT)
Alzheimers Disease Classification in Functional MRI With 4D Joint Temporal-Spatial Kernels in Novel 4D CNN Model [0.0]
本研究では,新しい4次元畳み込みネットワークを開発し,時間空間カーネルを抽出する。 4D CNNモデルは、RS-fMRIデータに対するアルツハイマー病の診断を改善し、早期発見とより良い介入を可能にする。今後の研究は、タスクベースのfMRIアプリケーションと回帰タスクを探求し、認知能力と疾患進行の理解を深める。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 15:57:53 GMT)
Aiding Medical Diagnosis through Image Synthesis and Classification [0.0]
本稿では,テキスト記述からリアルな医用画像を生成するシステムを提案する。 PathMNISTデータセット上で,Low-Rank Adaptation (LoRA) を用いて事前訓練した安定拡散モデルを微調整した。 ResNet-18の分類モデルは同じデータセットで訓練され、正確なラベルを検出する精度は99.76%に達した。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:25:43 GMT)
Adaptive Two Sided Laplace Transforms: A Learnable, Interpretable, and Scalable Replacement for Self-Attention [0.0]
本稿では,従来の自己注意をトランスフォーマーベースLLMに置き換える,革新的で学習可能な2面短時間ラプラス変換(STLT)機構を提案する。我々のSTLTは各Laplaceノードに対してトレーニング可能なパラメータを導入し、崩壊率のエンドツーエンド学習を可能にした。さらに、効率の良いFFTベースの関係行列計算と適応ノード割り当て機構を組み込んで、アクティブなLaplaceノードの数を動的に調整する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 00:32:24 GMT)
Action Dependency Graphs for Globally Optimal Coordinated Reinforcement Learning [0.0]
行動依存型個別政策は多エージェント強化学習におけるグローバルな最適性を達成するための有望なパラダイムとして浮上している。本研究では、必ずしも自己回帰形式に従わない、より一般化された行動依存型ポリシーを考察する。協調グラフによって構成されたMARL問題の文脈内では、疎ADGを用いた行動依存ポリシーがグローバルな最適性を達成することが証明される。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 02:58:20 GMT)
A Word is Worth 4-bit: Efficient Log Parsing with Binary Coded Decimal Recognition [0.0]
本稿では,文字埋め込みを集約するニューラルアーキテクチャを用いた文字レベルログを提案する。提案手法は,高粒度なログテンプレート抽出を実現するために,バイナリコード付き十進数列を推定する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 20:00:00 GMT)
A Geometric Square-Based Approach to RSA Integer Factorization [0.0]
幾何学的解釈と二乗差に触発されたRSA因子化に対する新しいアプローチを提案する。この方法は、完全正方形間の距離の観点から問題を再構成し、迅速な収束を可能にする反復関係を提供する。
論文参考訳（メタデータ） (Sun, 01 Jun 2025 08:55:25 GMT)