Humanity's Last Exam [253.5] HumanityのLast Exam(HLE)は、人間の知識の最前線におけるマルチモーダルベンチマークである。
数学、人文科学、自然科学など、数十の科目にわたる3000の質問で構成されている。
各質問には、曖昧で容易に検証できる既知のソリューションがあるが、インターネット検索ではすぐには答えられない。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:36:17 GMT)
Long-VITA: Scaling Large Multi-modal Models to 1 Million Tokens with Leading Short-Context Accuracy [111.1] Long-VITAは、長いコンテキストの視覚言語理解タスクのための大規模なマルチモーダルモデルである。
4Kフレームまたは1Mトークン上で、画像、ビデオ、テキストのモダリティを同時に処理し、分析するのに適している。
Long-VITAは完全に再現可能で、トレーニングとテストのためにNPUとGPUプラットフォームの両方をサポートする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:10:06 GMT)
Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.5] SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:23:03 GMT)
Mixture of insighTful Experts (MoTE): The Synergy of Thought Chains and Expert Mixtures in Self-Alignment [103.1] 本稿では,自己アライメントを改善するために,推論チェーンとエキスパートミックスを組み合わせた新しいフレームワークを提案する。
MoTEは、質問分析、回答ガイダンス、安全回答、安全チェックの4つの主要なステージからなる構造化推論チェーンを採用している。
MoTEはモデルの安全性、脱獄耐性、過剰な拒否機能を大幅に改善し、OpenAIの最先端のo1モデルに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:26:09 GMT)
eQMARL: Entangled Quantum Multi-Agent Reinforcement Learning for Distributed Cooperation over Quantum Channels [98.3] 量子コンピューティングは、マルチエージェント環境における量子絡み合いと協調の潜在的なシナジーを引き起こした。
現在の最先端量子MARL(QMARL)の実装は、古典的な情報共有に依存している。
eQMARL(eQMARL)は、量子チャネル上での協調を容易にする分散型アクター批判フレームワークである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:02:59 GMT)
FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [93.7] FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:27:35 GMT)
Multi-Agent Risks from Advanced AI [90.7] 先進的なAIのマルチエージェントシステムは、新規で未発見のリスクを生じさせる。
エージェントのインセンティブに基づく3つの重要な障害モードと7つの重要なリスク要因を同定する。
各リスクのいくつかの重要な事例と、それらを緩和するための有望な方向性を強調します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:03:21 GMT)
Model Evolution Framework with Genetic Algorithm for Multi-Task Reinforcement Learning [85.9] マルチタスク強化学習は、様々なシナリオにまたがって一般化可能なエージェントを開発することを目的として、様々なタスクを完遂するために単一のポリシーを採用する。
既存のアプローチでは、ルーティングネットワークを使用して各タスクの特定のルートを生成し、モジュールのセットをさまざまなモデルに再構築し、複数のタスクを同時に完了させるのが一般的である。
本稿では,遺伝的アルゴリズム(MEGA)を用いたモデル進化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:22:34 GMT)
Generative Large Recommendation Models: Emerging Trends in LLMs for Recommendation [85.5] このチュートリアルでは、大規模言語モデル(LLM)を統合するための2つの主要なアプローチを探求する。
これは、最近の進歩、課題、潜在的研究の方向性を含む、生成的な大規模なレコメンデーションモデルの包括的な概要を提供する。
主なトピックは、データ品質、スケーリング法則、ユーザの行動マイニング、トレーニングと推論の効率性である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:48:25 GMT)
MMTEB: Massive Multilingual Text Embedding Benchmark [85.2] 我々はMMTEBベンチマーク(Massive Multilingual Text Embedding Benchmark)を紹介する。
MMTEBは250以上の言語で500以上の品質管理された評価タスクをカバーしている。
我々は複数の多言語ベンチマークを開発し、モデルを代表的に評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:13:43 GMT)
Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF [80.3] オンラインとオフラインのRLHFに統一的なアプローチを導入します。
VPOは、報酬関数の最大値推定を対応する値関数で正規化する。
テキスト要約とダイアログの実験は、VPOの実用性と有効性を検証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:51:58 GMT)
LongReD: Mitigating Short-Text Degradation of Long-Context Large Language Models via Restoration Distillation [79.9] 回復蒸留(LongReD)による長期事前トレーニング
LongReDは、選択されたレイヤの隠れた状態をオリジナルのモデルから短いテキストで蒸留する。
一般的なテキストベンチマークの実験では、LongReDはモデルの短文性能を効果的に維持することを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:49:24 GMT)
How Do LLMs Perform Two-Hop Reasoning in Context? [76.8] 我々は合成二脚推論タスクで三層変圧器を訓練する。
モデルが乱れをランダムに推測する方法を学習するための内部メカニズムを説明する。
私たちの研究は、トレーニング中に推論がどのように現れるかについて、新たな洞察を与えてくれます。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:46:30 GMT)
A Template Is All You Meme [76.0] 5,200以上のmemeテンプレート、それらに関する情報、および54,000のテンプレートインスタンスの例で構成された知識ベースを作成します。
ミームテンプレートのセマンティック信号を調べるために,データセット中のミームと知識ベースに含まれるベーステンプレートを距離ベースで検索することでマッチングできることを示す。
メメテンプレートの検証により,検討対象のデータセット毎の最先端性能が得られ,テンプレート性に基づく解析方法が確立された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:08:32 GMT)
Vector-ICL: In-context Learning with Continuous Vector Representations [76.0] 大規模言語モデル (LLM) はテキストデータに顕著なコンテキスト内学習能力を示す。
ブラックボックス事前学習エンコーダから得られる様々な領域から連続ベクトルに拡張できるかどうかを検討する。
特に,汎用言語モデリング目的のプロジェクタを事前学習することで,Vector-ICLの実現が期待できる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:48:13 GMT)
TrustRAG: An Information Assistant with Retrieval Augmented Generation [73.8] TrustRAGは、インデックス付け、検索、生成という3つの視点から、acRAGを強化する新しいフレームワークである。
我々はTrustRAGフレームワークをオープンソース化し、抜粋ベースの質問応答タスク用に設計されたデモスタジオを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:45:27 GMT)
DEMO: Reframing Dialogue Interaction with Fine-grained Element Modeling [73.1] 大規模言語モデル (LLM) によって実現された対話システムは、人間と機械の相互作用において中心的なモードの1つとなっている。
本稿では,新しい研究課題--$textbfD$ialogue $textbfE$lement $textbfMO$delingを紹介する。
本稿では,包括的対話モデリングと評価のために設計された新しいベンチマークである$textbfDEMO$を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:42:25 GMT)
Theory on Mixture-of-Experts in Continual Learning [72.4] 継続学習(CL)は、時間とともに現れる新しいタスクに適応する能力のため、大きな注目を集めている。
モデルが新しいタスクに適応するにつれて、(古いタスクの)破滅的な忘れがCLの大きな問題として認識されるようになった。
MoEモデルは近年,ゲーティングネットワークを用いることで,CLの破滅的忘れを効果的に軽減することが示されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:35:07 GMT)
Diffusion Models as Network Optimizers: Explorations and Analysis [71.7] 生成拡散モデル(GDM)は,ネットワーク最適化の新しいアプローチとして期待されている。
本研究ではまず,生成モデルの本質的な特徴について考察する。
本稿では,識別的ネットワーク最適化よりも生成モデルの利点を簡潔かつ直感的に示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:25:27 GMT)
Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual Evaluation [71.6] 多言語データセットの文化的バイアスは、グローバルベンチマークとしての有効性に重大な課題をもたらす。
MMLUの進歩は西洋中心の概念の学習に大きく依存しており、文化に敏感な知識を必要とする質問の28%がそうである。
改良されたMMLUであるGlobal MMLUをリリースし,42言語を対象に評価を行った。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:30:23 GMT)
Enhancing Input-Label Mapping in In-Context Learning with Contrastive Decoding [71.0] 大規模言語モデル(LLM)は、コンテキスト内学習(ICL)を通じて、様々なタスクで優れる
In-Context Contrastive Decoding (ICCD)を導入する。
ICCDは、正と負のインコンテキストの例の出力分布を対比することで、入力ラベルマッピングを強調する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:04:46 GMT)
Reasoning with Reinforced Functional Token Tuning [71.0] 本稿では,大規模言語モデル(LLM)に自己学習能力を持たせるためにRFTT(Reinforced Functional Token Tuning)を提案する。
RFTTは、学習可能な関数トークンの豊富なセットをモデル語彙に直接埋め込んで、多様な人間のような推論行動によるチェーン・オブ・思想の構築を可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:59:42 GMT)
Betsu-Betsu: Multi-View Separable 3D Reconstruction of Two Interacting Objects [68.0] 本稿では, 近接相互作用中の2つの物体の形状と外観を再構成し, 両者を3次元で解離させるニューロ・インシシシット法を提案する。
フレームワークはエンドツーエンドのトレーニングが可能で、新しいアルファブレンディング正規化を使用して管理されている。
我々は,人間と物体の密接な相互作用からなる新しいデータセットを導入するとともに,武道を行う人間の2つの場面について評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:59:56 GMT)
Bridging the Data Provenance Gap Across Text, Speech and Video [67.7] 我々は、人気テキスト、音声、ビデオデータセットのモダリティにまたがって、最大かつ第1級の経時的監査を行う。
私たちの手動分析では、1990年から2024年の間に、608言語、798のソース、659の組織、67の国で4000近い公開データセットをカバーしています。
マルチモーダル機械学習アプリケーションは、トレーニングセットのために、YouTubeのようなWebcrawled、synthetic、ソーシャルメディアプラットフォームに圧倒的に移行した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:05:56 GMT)
EHOP: A Dataset of Everyday NP-Hard Optimization Problems [66.4] Everyday Hard Optimization Problems (EHOP) は、自然言語で表されるNPハード最適化問題の集合である。
EHOPには、コンピュータサイエンスの教科書で見られる問題の定式化、実生活で起こりうる問題として着飾られたバージョン、逆ルールでよく知られた問題の変種が含まれている。
現状のLLMは、複数のプロンプト戦略にまたがって、実生活や逆転型よりも教科書問題を体系的に高精度に解決していることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:39:59 GMT)
Evaluating Implicit Bias in Large Language Models by Attacking From a Psychometric Perspective [66.3] 我々は、ある人口層に対する大きな言語モデルの暗黙の偏見を厳格に評価する。
心理測定の原則にインスパイアされた我々は,3つの攻撃的アプローチ,すなわち,軽視,軽視,指導を提案する。
提案手法は,LLMの内部バイアスを競合ベースラインよりも効果的に引き出すことができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:37:38 GMT)
Estimating Commonsense Plausibility through Semantic Shifts [66.1] セマンティックシフトを測定することでコモンセンスの妥当性を定量化する新しい識別フレームワークであるComPaSSを提案する。
2種類の細粒度コモンセンス可視性評価タスクの評価は,ComPaSSが一貫してベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:31:06 GMT)
Collaborative Retrieval for Large Language Model-based Conversational Recommender Systems [65.8] 対話レコメンデーションシステム(CRS)は、ユーザとの対話を通じてパーソナライズされたレコメンデーションを提供することを目的としている。
大規模言語モデル(LLM)は、コンテキスト対応のユーザの好みに対する理解が優れているため、CRSを強化する。
CRAG(Collaborative Retrieval Augmented Generation for LLM-based CRS)を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:47:40 GMT)
PILOT: A Pre-Trained Model-Based Continual Learning Toolbox [65.6] 本稿では,PILOTとして知られるモデルベース連続学習ツールボックスについて紹介する。
一方、PILOTはL2P、DualPrompt、CODA-Promptといった事前学習モデルに基づいて、最先端のクラスインクリメンタル学習アルゴリズムを実装している。
一方、PILOTは、事前学習されたモデルの文脈に典型的なクラス増分学習アルゴリズムを適合させ、それらの効果を評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:44:10 GMT)
Transferring Textual Preferences to Vision-Language Understanding through Model Merging [65.4] 本稿では,テキストベース報酬モデル (RM) と大規模視覚言語モデル (LVLM) を併用した学習自由な代替案について検討する。
提案手法は,これらのモデルを統合することで,LVLMのスコアリングやテキストベースのRMよりも性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:20:07 GMT)
MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models [65.1] MLaKEは5言語にわたる知識編集手法の適応性のベンチマークである。
MLaKEは、ウィキペディアから言語にまたがるファクトチェーンを集約し、フリーフォームとマルチチョイスの両方で質問を生成する。
MLaKEにおける既存手法の多言語知識編集の一般化能力を評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:51:44 GMT)
Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration [64.8] 拡散モデルを用いて,雑音空間を介して領域適応を行うことが可能であることを示す。
特に、補助的な条件入力が多段階の復調過程にどのように影響するかというユニークな性質を活用することにより、有意義な拡散損失を導出する。
拡散モデルにおけるチャネルシャッフル層や残留スワッピング型コントラスト学習などの重要な戦略を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:20:13 GMT)
Escaping from the Barren Plateau via Gaussian Initializations in Deep Variational Quantum Circuits [63.8] 近年、変分量子回路は量子シミュレーションや量子機械学習に広く用いられている。
しかし、ランダムな構造を持つ量子回路は、回路深さと量子ビット数に関して指数関数的に消える勾配のため、トレーニング容易性が低い。
この結果は、ディープ量子回路が実用的なタスクでは実現できないという一般的な見解に繋がる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:34:55 GMT)
Uncertainty quantification for Markov chains with application to temporal difference learning [63.5] マルコフ連鎖のベクトル値および行列値関数に対する新しい高次元濃度不等式とベリー・エッシー境界を開発する。
我々は、強化学習における政策評価に広く用いられているTD学習アルゴリズムを解析する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:33:55 GMT)
Many Heads Are Better Than One: Improved Scientific Idea Generation by A LLM-Based Multi-Agent System [62.8] Virtual Scientists (VirSci) は、科学研究に固有のチームワークを模倣するために設計されたマルチエージェントシステムである。
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新しい科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:07:47 GMT)
AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons [62.5] 本稿ではAI製品リスクと信頼性を評価するための業界標準ベンチマークとして,AIluminate v1.0を紹介する。
このベンチマークは、危険、違法、または望ましくない行動を12の危険カテゴリーで引き起こすように設計されたプロンプトに対するAIシステムの抵抗を評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:58:52 GMT)
ETS: Efficient Tree Search for Inference-Time Scaling [61.6] テストタイムの計算スケーリングにおいて有望なアプローチのひとつは、プロセス報酬モデルに対する検索である。
木探索過程における軌跡の多様性は、多様性の増大がさらなる探索を促進するため、探索の精度に影響を与える。
本稿では,冗長なトラジェクトリを抽出し,必要な多様なトラジェクトリを維持しながら,KVの共有を促進する効率的なツリー探索(ETS)を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:30:38 GMT)
LOVA3: Learning to Visual Question Answering, Asking and Assessment [61.5] 質問への回答、質問、評価は、世界を理解し、知識を得るのに不可欠な3つの人間の特性である。
現在のMLLM(Multimodal Large Language Models)は主に質問応答に焦点を当てており、質問や評価スキルの可能性を無視することが多い。
LOVA3は、"Learning tO Visual Question Answering, Asking and Assessment"と名付けられた革新的なフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:28:40 GMT)
Refining Sentence Embedding Model through Ranking Sentences Generation with Large Language Models [60.0] 多くのNLPタスクには文の埋め込みが不可欠であり、NLIのようなデータセットを使用して強いパフォーマンスを達成する対照的な学習方法がある。
近年の研究では、大きな言語モデル(LLM)を利用して文ペアを生成し、アノテーション依存を減らしている。
本稿では,潜在空間におけるLLMの生成方向を制御する手法を提案する。
複数のベンチマークによる実験により,本手法は文合成に要するコストを最小限に抑えつつ,新たなSOTA性能を実現することを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:07:53 GMT)
Autellix: An Efficient Serving Engine for LLM Agents as General Programs [59.7] 大規模言語モデル(LLM)アプリケーションは、単純なチャットボットを超えて、動的で汎用的なエージェントプログラムへと進化している。
既存のLLMサービスシステムは、プログラムと呼び出し間の依存関係を無視し、最適化のための大きな機会を欠いている。
プログラムを第一級市民として扱い、エンドツーエンドのレイテンシを最小限に抑えるLLMサービスシステムであるAutellixを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:59:30 GMT)
Large Continual Instruction Assistant [59.6] CIT(Continuous Instruction Tuning)は、大規模モデルにデータによる人間の意図データに従うよう指示するために用いられる。
既存の更新勾配は、CITプロセス中に前のデータセットのパフォーマンスを著しく損なうことになる。
本稿では,この課題に対処する汎用的な連続的命令チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:01:35 GMT)
Learning to Discover Regulatory Elements for Gene Expression Prediction [59.5] Seq2Expは、ターゲット遺伝子発現を駆動する制御要素を発見し、抽出するために設計されたSequence to Expressionネットワークである。
本手法は, エピジェノミックシグナル, DNA 配列とその関連因子の因果関係を捉える。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:25:49 GMT)
Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.5] この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:12:49 GMT)
Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.4] 3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:21:25 GMT)
Scoring Verifiers: Evaluating Synthetic Verification in Code and Reasoning [59.3] 本稿では,合成検証手法が解の正当性評価に与える影響を評価するためのベンチマークを紹介する。
我々は,標準,推論,報酬に基づくLLMにおける合成検証手法を解析した。
その結果,最近の推論モデルではテストケースの生成が大幅に改善され,スケールテストケースの精度が向上した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:32:11 GMT)
Raising the Bar in Graph OOD Generalization: Invariant Learning Beyond Explicit Environment Modeling [58.2] 実世界のグラフデータは、従来のモデルでは一般化できない、多様で変化する環境を示すことが多い。
マルチプロトタイプ超球形不変学習(MPHIL)と呼ばれる新しい手法を提案する。
MPHILは最先端のパフォーマンスを実現し、様々なドメインからのグラフデータと異なる分散シフトで既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:41:12 GMT)
Towards Fusing Point Cloud and Visual Representations for Imitation Learning [57.9] 本稿では,ポイントクラウドとRGBの両特性を効果的に組み合わせた新しい模倣学習手法であるFPV-Netを提案する。
適応層ノルム条件付けを用いて,グローバルおよびローカル画像トークン上のポイントクラウドエンコーダを条件付けする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:04:01 GMT)
LESA: Learnable LLM Layer Scaling-Up [57.1] LLM(Large Language Models)をスクラッチからトレーニングするには膨大な計算資源が必要であるため、非常に高価である。
モデルスケーリングアップは、より小さなモデルのパラメータを活用してより大きなモデルを作成することで、有望なソリューションを提供する。
深度スケールアップのための新しい学習方法である textbfLESA を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:58:48 GMT)
Mixed Signals: A Diverse Point Cloud Dataset for Heterogeneous LiDAR V2X Collaboration [56.8] 車両間協調認識(V2X)は、単車知覚システムの限界に対処するための有望な解決策として登場した。
これらのギャップに対処するために、45.1kの点雲と240.6kのバウンディングボックスを備えた総合的なV2XデータセットであるMixed Signalsを紹介した。
私たちのデータセットは、正確に整合したポイントクラウドと10クラスにわたるバウンディングボックスアノテーションを提供し、認識トレーニングのための信頼性の高いデータを確保します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:53:00 GMT)
Compression-Aware One-Step Diffusion Model for JPEG Artifact Removal [56.3] CODiffはJPEGアーティファクト削除のための圧縮対応ワンステップ拡散モデルである。
明示的な学習と暗黙的な学習を組み合わせた二重学習戦略を提案する。
その結果,CODiffは定量的および視覚的品質指標の両方において,最近の先行手法を超越していることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:00:01 GMT)
Dehumanizing Machines: Mitigating Anthropomorphic Behaviors in Text Generation Systems [56.0] このようなシステムアウトプットにどのように介入すれば人為的行動が緩和され、その付随する有害な結果が未検討のままである。
我々は,先行研究とクラウドソース研究の両方に根ざした介入の目録を整理し,参加者がシステム出力を編集し,人間らしくないようにした。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:06:37 GMT)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [55.9] Mol-LLaMAは、分子を中心とした一般的な知識をマルチモーダル命令チューニングによって把握する大規模な分子言語モデルである。
分子の特徴の理解を深めるために,異なる分子エンコーダの相補的な情報を統合するモジュールを導入する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:49:10 GMT)
Hybrid Explicit Representation for Ultra-Realistic Head Avatars [55.8] 我々は,超現実的な頭部アバターを作成し,それをリアルタイムにレンダリングする新しい手法を提案する。
UVマップされた3Dメッシュは滑らかな表面のシャープでリッチなテクスチャを捉えるのに使われ、3Dガウス格子は複雑な幾何学構造を表現するために用いられる。
モデル化された結果が最先端のアプローチを上回る実験を行ないました。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:20:12 GMT)
Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model [55.7] 本稿では,高品質な映像再構成を実現するために,意味情報を抽出し,送信するスケーラブルなビデオ意味コミュニケーションフレームワークを提案する。
具体的には、送信機では、それぞれテキストと構造的意味論として機能するソースビデオから記述と他の条件信号を抽出する。
受信機では、拡散に基づくGenAI大モデルを用いて、ビデオの再構成のために複数のモーダルのセマンティクスを融合させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:59:07 GMT)
SCOPE: A Self-supervised Framework for Improving Faithfulness in Conditional Text Generation [55.6] LLM(Large Language Models)は、しばしば幻覚(幻覚)を生成する。
本稿では,不信なサンプルのトレーニングセットを生成するための,新たな自己指導手法を提案する。
そしてトレーニングプロセスを使ってモデルを洗練し、不信なものよりも基礎的なアウトプットの生成を奨励します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:31:58 GMT)
Understanding SGD with Exponential Moving Average: A Case Study in Linear Regression [55.2] 指数移動平均(EMA)は近年,現代のディープラーニングモデルのトレーニングにおいて大きな人気を集めている。
本稿では,高次元線形回帰のためのオンラインSGDとEMAのリスクバウンダリを確立する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:55:11 GMT)
Optimizing Research Portfolio For Semantic Impact [55.2] サイテーション指標は学術的影響を評価するために広く用いられているが、社会的偏見に悩まされている。
本稿では,研究効果を予測する新しいフレームワークであるrXiv Semantic Impact (XSI)を紹介する。
XSIは学術知識グラフにおける研究概念の進化を追跡している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:44:13 GMT)
Generalized Robot 3D Vision-Language Model with Fast Rendering and Pre-Training Vision-Language Alignment [55.1] 本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。
事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。
限定的な再構築の場合、提案手法はWS3D++と呼ばれ、大規模なScanNetベンチマークで1位にランクインした。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:52:00 GMT)
Efficiently Training Deep-Learning Parametric Policies using Lagrangian Duality [55.1] 制約付きマルコフ決定プロセス(CMDP)は、多くの高度な応用において重要である。
本稿では,パラメトリックアクターポリシーを効率的に訓練するための2段階深度決定規則(TS-DDR)を提案する。
現状の手法と比較して, 解の質を高め, 数桁の計算時間を削減できることが示されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:07:52 GMT)
A Comprehensive Survey on Composed Image Retrieval [54.5] Composed Image Retrieval (CIR)は、ユーザがマルチモーダルクエリを使ってターゲットイメージを検索できる、新しくて困難なタスクである。
現在、この分野のタイムリーな概要を提供するため、CIRの包括的なレビューは行われていない。
我々は、ACM TOIS、SIGIR、CVPRなど、トップカンファレンスやジャーナルで120以上の出版物から洞察を合成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:37:24 GMT)
Smoothed Normalization for Efficient Distributed Private Optimization [54.2] フェデレートされた学習は、参加者のプライバシを備えた機械学習モデルを可能にする。
トレーニングやフィードバックのない問題に対して、差分にプライベートな分散手法は存在しない。
証明可能な収束保証付き分散アルゴリズム$alpha$-$sf NormEC$を導入する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:10:32 GMT)
Large Language-Geometry Model: When LLM meets Equivariance [53.9] 本稿では,3次元物理システムを表現するための新しいフレームワークであるEquiLLMを提案する。
EquiLLMは分子動力学シミュレーション,ヒトの動作シミュレーション,抗体設計など,従来の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:41:42 GMT)
Heisenberg scaling based on population coding [53.6] 本研究では, 量子力学のハイゼンベルクスケーリングについて, 集団符号化の観点から検討する。
集団符号化の観点からパラメータ空間の識別可能な要素の数を結合する相互情報を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:21:43 GMT)
Reasoning-Augmented Conversation for Multi-Turn Jailbreak Attacks on Large Language Models [53.6] Reasoning-Augmented Conversationは、新しいマルチターンジェイルブレイクフレームワークである。
有害なクエリを良心的な推論タスクに再構成する。
RACEは,複雑な会話シナリオにおいて,最先端攻撃の有効性を実現する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:36:47 GMT)
IM360: Textured Mesh Reconstruction for Large-scale Indoor Mapping with 360$^\circ$ Cameras [53.5] 室内環境の3次元マッピングとレンダリングのための360ドルのカメラのための新しい3D再構成パイプラインを提案する。
我々のアプローチ(IM360)は全方位画像の広い視野を活用し、球面カメラモデルをSfMパイプラインのすべてのコアコンポーネントに統合する。
Matterport3DとStanford2D3Dデータセットから大規模屋内シーンのパイプラインを評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:52:15 GMT)
PeerQA: A Scientific Question Answering Dataset from Peer Reviews [52.0] 実世界の科学的、文書レベルの質問回答データセットであるPeerQAを提示する。
データセットには208の学術論文から579のQAペアが含まれており、MLとNLPが多数を占めている。
収集したデータセットを詳細に分析し、3つのタスクのベースラインシステムを確立する実験を行う。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:24:46 GMT)
Toward Robust Non-Transferable Learning: A Survey and Benchmark [51.5] 非伝達学習(NTL)は、ディープラーニングモデルの一般化能力を再構築することを目的とした課題である。
NTLの性能とロバスト性を評価する最初のベンチマークであるNTLBenchを紹介する。
我々はNTLの実践的応用と今後の方向性と課題について論じる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:12:19 GMT)
Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.4] Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:24:11 GMT)
HawkBench: Investigating Resilience of RAG Methods on Stratified Information-Seeking Tasks [50.9] HawkBenchは、RAGのパフォーマンスを厳格に評価するために設計された、人間ラベル付きマルチドメインベンチマークである。
情報探索行動に基づくタスクの階層化により、HawkBenchはRAGシステムが多様なユーザニーズにどのように適応するかを体系的に評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:33:39 GMT)
Exploring Code Language Models for Automated HLS-based Hardware Generation: Benchmark, Infrastructure and Analysis [50.0] LLM(Large Language Model)は、PythonやC++などのプログラミング言語に使用される。
本稿では,LLMを利用してHLS(High-Level Synthesis)ベースのハードウェア設計を行う。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:53:59 GMT)
Assessing Simulation Knowledge and Proficiency Among Undergraduate Computing Students in Brazil: Insights and Results from a Survey Research [50.0] 本報告は,動的技術環境における学術教育の重要性を強調するものである。
学生の認識、使用するツール、直面した課題、そしてより深い研究の展望を探求する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:56:17 GMT)
Specializing Large Language Models to Simulate Survey Response Distributions for Global Populations [49.9] 我々は,調査応答分布をシミュレートする大規模言語モデル (LLM) を最初に開発した。
テストベッドとして、我々は2つの世界文化調査の国レベルの結果を使用します。
予測された応答分布と実際の応答分布のばらつきを最小限に抑えるために, ファースト・ツーケン確率に基づく微調整法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:05:39 GMT)
Can Community Notes Replace Professional Fact-Checkers? [49.5] Twitter/XとMetaによるポリシーの変更は、ファクトチェック組織とのパートナーシップから移行したことを示している。
分析の結果,コミュニティノートでは,過去の報告の最大5倍のファクトチェックソースを引用していることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:26:39 GMT)
LongPO: Long Context Self-Evolution of Large Language Models through Short-to-Long Preference Optimization [49.4] LongPOはショート・ツー・ロングの嗜好データを利用して、ショート・コンテクストの機能をロング・コンテクストのタスクに転送する。
LongPOは短文性能を完全に保持し、長文タスクと短文タスクの両方において単純 SFT と DPO をほぼ上回っている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:59:03 GMT)
IP-Composer: Semantic Composition of Visual Concepts [49.2] 合成画像生成のためのトレーニング不要アプローチであるIP-Composerを提案する。
提案手法は,入力画像のCLIP埋め込みを条件とした新しい画像を生成するIP-Adapter上に構築する。
テキストから特定された概念固有のCLIP-サブスペースに、複数の入力画像の投影から縫い付けられた複合埋め込みを製作することで、このアプローチを複数の視覚的入力に拡張する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:49:31 GMT)
ProjectTest: A Project-level LLM Unit Test Generation Benchmark and Impact of Error Fixing Mechanisms [48.4] 単体テスト生成はLLMの有望かつ重要なユースケースとなっている。
ProjectTestは、Python、Java、JavaScriptをカバーするユニットテスト生成のためのプロジェクトレベルのベンチマークである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:51:32 GMT)
Point Cloud Geometry Scalable Coding Using a Resolution and Quality-conditioned Latents Probability Estimator [47.8] 本稿では、ディープラーニングベースのポイントクラウド(PC)コーディングのためのスケーラブルなコーディングソリューションの開発に焦点をあてる。
この3D表現の特徴は、ソフトウェアの他の機能を損なわない柔軟なソリューションの実装を困難にしている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:58:53 GMT)
A consensus set for the aggregation of partial rankings: the case of the Optimal Set of Bucket Orders Problem [46.8] ランクアグリゲーション問題(RAP)では、解は通常、一連の入力順序を一般化するコンセンサスランキングである。
我々は、RAPの解決策として、入力順序に表される嗜好をよりよく説明するためのランキングのセットを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:32:16 GMT)
FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering [46.4] 大規模言語モデル(LLM)は、しばしば誤応答や幻覚応答を発生させることによって挑戦される。
我々は,KGから検索した検証可能な推論ステップに回答をアンカーすることで,LLM応答の事実性を改善するための統合フレームワークFiDeLiSを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:29:15 GMT)
Craw4LLM: Efficient Web Crawling for LLM Pretraining [45.9] 本稿では,LLM事前学習の嗜好に基づいてWebグラフを探索するWebクローリング手法であるCrawl4LLMを提案する。
商用検索エンジンのインデックスから9億のWebページを含むWebグラフに関する実験は、高品質な事前学習データを得る上で、Crawl4LLMの有効性を実証している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:31:43 GMT)
Taxonomy-Guided Zero-Shot Recommendations with LLMs [45.8] 大規模言語モデル (LLM) はレコメンデータシステム (RecSys) において有望であることを示す。
項目情報の明瞭度と構造を改善するため,分類学辞書を用いた新しい手法を提案する。
TaxRecは従来のゼロショットアプローチに比べて推奨品質を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:05:46 GMT)
Diversity-driven Data Selection for Language Model Tuning through Sparse Autoencoder [45.6] データ多様性対策の課題に取り組むためにスパースオートエンコーダを提案する。
我々は、選択したデータに基づいてトレーニングされたモデルが、モデル能力の点で他の手法より優れていることを実験的に証明した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:12:34 GMT)
Appeal prediction for AI up-scaled Images [45.6] 136のベースイメージと5つの異なるアップスケーリング手法を用いて構築したデータセットについて述べる。
その結果,Real-ESRGANとBSRGANが最適であることが示唆された。
これに加えて,最先端画像の魅力と品質モデルの評価を行ったが,どのモデルも高い予測性能を示しなかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:45:24 GMT)
Spin Squeezing of Macroscopic Nuclear Spin Ensembles [45.0] マクロなスピンアンサンブルのスクイージングは、基礎物理学実験に有用な技術であることが証明される。
脱コヒーレンスと有限スピン偏極の存在下でのスクイージングダイナミクスを解析し、いくつかの核スピン系において7dBスピンスクイージングの実現が可能であることを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:16:54 GMT)
Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments [44.6] 本稿では,特定の個人オブジェクトの位置と到達を具体化するタスクデノマイトされたパーソナライズされたパーソナライズドインスタンスベースのナビゲーション(PIN)を提案する。
各エピソードにおいて、ターゲットオブジェクトは、中性背景上の視覚的参照画像のセットと手動による注釈付きテキスト記述の2つのモードを使用してエージェントに提示される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:31:08 GMT)
Safety Layers in Aligned Large Language Models: The Key to LLM Security [43.8] 整列 LLM の内部パラメータは、微調整攻撃を受けた場合のセキュリティ劣化に対して脆弱である。
我々の研究は、パラメータレベルでのLLMの整列化におけるセキュリティのメカニズムを明らかにし、モデルの中央に小さな連続した層を識別する。
そこで本稿では, 安全部分調整(SPPFT)方式を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:35:31 GMT)
One Model for All: Large Language Models are Domain-Agnostic Recommendation Systems [43.8] 本稿では,事前学習された大規模言語モデル(LLM)をドメインに依存しない推薦に利用するフレームワークを提案する。
具体的には、複数のドメインやアイテムタイトルからのユーザの振る舞いを文に混ぜて、ユーザとアイテムの表現を生成するためにLLMを使用する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:43:51 GMT)
CRVQ: Channel-Relaxed Vector Quantization for Extreme Compression of LLMs [43.8] ポストトレーニング量子化(PTQ)は、この野心を達成するためのスターアプローチとして登場した。
本稿では,PTQベースラインの性能を大幅に向上させる新しい手法であるChannel-Relaxed Vector Quantization (CRVQ)を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:50:37 GMT)
Robust Optimization with Diffusion Models for Green Security [43.6] グリーンセキュリティでは、効果的パトロールを計画するためには、密猟、違法伐採、違法漁などの敵の行動を予測する必要がある。
本稿では,その強い分布適合性を利用した逆挙動モデリングのための条件付き拡散モデルを提案する。
混合戦略の混合戦略を導入し, 正確なサンプリングを行うために, ツイスト型シークエンシャルモンテカルロ (SMC) サンプリング装置を用いる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:30:46 GMT)
EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing [43.6] 我々は,エキスパート選択ルーティングを備えた拡散変圧器のためのMixture-of-Experts(MoE)モデル(EC-DIT)を新たに開発する。
EC-DITは、入力テキストを理解するために割り当てられた計算を適応的に最適化し、各画像パッチを生成する。
テキストと画像のアライメント評価において、我々の最大のモデルでは、最先端のGenEvalスコアが71.68%に達し、直感的に解釈可能な競合推論速度を維持しています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:22:17 GMT)
ActionPiece: Contextually Tokenizing Action Sequences for Generative Recommendation [43.6] ジェネレーティブレコメンデーション(GR)は、ユーザアクションを個別のトークンパターンにトークン化し、予測として自動回帰的に生成する、新たなパラダイムである。
既存のGRモデルはそれぞれのアクションを独立にトークン化し、同じ固定トークンをコンテキスト関係を考慮せずにすべてのシーケンスで同一のアクションに割り当てる。
この文脈認識の欠如は、周囲の文脈によって異なる意味を持つため、最適以下のパフォーマンスをもたらす可能性がある。
ActionPieceは、アクションシーケンスをトークン化する際のコンテキストを明示的に組み込むために、ActionPieceを提案する。ActionPieceは、既存のアクショントークン化メソッドを一貫して上回り、NDCG@$10$を6.00%$から12.82%$に改善する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:45:29 GMT)
Fundamental Bias in Inverting Random Sampling Matrices with Application to Sub-sampled Newton [43.6] 逆バイアス(英: inversion bias)とは、ランダムスケッチ自体の非バイアスにもかかわらず、ランダムスケッチの逆は非バイアスにならない現象である。
このバイアスは、さまざまな機械学習パイプラインでランダムスケッチを使用する際の課題を示す。
本研究では,一様および非一様レバレッジに基づくランダムサンプリング法と,構造化されたランダムプロジェクションに対して,逆バイアスを補正する方法を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:49:38 GMT)
Semantic Role Labeling: A Systematical Survey [43.5] セマンティック・ロール・ラベリング(Semantic Role labeling, SRL)は、テキスト中のセマンティック・ロールを理解することを目的とした自然言語処理(NLP)タスクである。
現在、この分野を徹底的に整理し、合成する総合的な調査が欠落している。
本稿では,過去20年間のSRL研究の軌跡を概観する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:32:15 GMT)
RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision [43.5] RAG-Gymは、情報検索エージェントを、各検索ステップにおけるきめ細かいプロセス管理によって強化する統合最適化フレームワークである。
また、RAG-Gymフレームワーク内での応答推論と検索クエリ生成を相乗化する新しいエージェントアーキテクチャであるReSearchを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:56:03 GMT)
BMIKE-53: Investigating Cross-Lingual Knowledge Editing with In-Context Learning [43.1] BMIKE-53は、53言語にまたがる言語間言語間知識編集(IKE)のベンチマークである。
言語横断的なKEは、無関係な知識を保持しながら、他言語にまたがって一般化するために、ある言語で編集された知識を必要とする。
以上より, モデルスケールと実演アライメントが言語間IKEの有効性を著しく左右することが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:35:47 GMT)
RestoreGrad: Signal Restoration Using Conditional Denoising Diffusion Models with Jointly Learned Prior [42.6] 本稿では,信号復元のための条件付きDDPMの改良を,より情報に富んだ先行手法を用いて提案する。
RestoreGradと呼ばれる提案されたフレームワークは、DDPMを可変オートエンコーダフレームワークにシームレスに統合する。
音声と画像の復元タスクにおいて、RestoreGradはより高速な収束(5~10倍のトレーニングステップ)を示し、復元信号のより良い品質を実現する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:29:46 GMT)
On the Duality between Gradient Transformations and Adapters [42.3] 線形勾配変換を用いたニューラルネットワークのメモリ効率最適化について検討する。
勾配変換は、全パラメータ空間よりも低次元空間に線形にマッピングされる。
この双対性は、メモリ効率のトレーニングに対する既存のアプローチを統一し、トレーニング効率とメモリ使用量を改善するための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:26:18 GMT)
SpecFuse: Ensembling Large Language Models via Next-Segment Prediction [42.3] SpecFuseは、LCM間のコラボレーションを通じて次のセグメントを反復的に生成することで、融合結果を出力するアンサンブルフレームワークである。
上位のセグメントは全LLMに放送され、次のラウンドで高品質なセグメントを生成するように促される。
計算資源を保存するため,前回のラウンドで性能が劣るモデルを動的に排除するモデル出口機構を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:01:59 GMT)
Bursting Filter Bubble: Enhancing Serendipity Recommendations with Aligned Large Language Models [42.1] 大規模言語モデル (LLM) は、その広範な世界知識と推論能力により、セレンディピティー予測の可能性を示している。
本稿では,認知プロファイル生成,セレンGPTアライメント,ニアライン適応の3段階からなるフレームワークSERALを提案する。
オンライン実験によると、SERALはセレンディピティクスアイテムの露出率(PVR)、クリック、トランザクションを5.7%、29.56%、27.6%改善し、全体的な収益に大きな影響を与えずにユーザーエクスペリエンスを向上させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:47:42 GMT)
Conformal Prediction under Lévy-Prokhorov Distribution Shifts: Robustness to Local and Global Perturbations [41.9] 我々は、分布シフトの下で有効であるような頑健な共形予測区間を構築する。
共形予測とLP曖昧性集合とのリンクは自然なものであることを示す。
この分析に基づいて、分布シフトの下でも有効である頑健な等角予測区間を構築する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:18:11 GMT)
Myna: Masking-Based Contrastive Learning of Musical Representations [41.9] 我々は、自己教師付き音楽表現学習のためのシンプルで効果的なアプローチであるMynaを提案する。
Myna氏は2つの重要なイノベーションを紹介している。メル-スペクトログラムをバックボーンとして使用するビジョントランスフォーマー(ViT)と、スペクトログラムトークンの90%をマスクするトークンマスキングだ。
私たちのハイブリッドモデルであるMyna-22M-Hybridは16x16と128x2のパッチを処理し、最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:47:43 GMT)
GMValuator: Similarity-based Data Valuation for Generative Models [41.8] 生成モデル評価器(GMValuator, Generative Model Valuator, GMValuator, GMValuator)を導入した。
GMValuatorは、その有効性を示すために、様々なデータセットや生成アーキテクチャで広く評価されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:22:49 GMT)
Generalizable Humanoid Manipulation with 3D Diffusion Policies [41.2] 我々は、ヒューマノイドロボットによる自律的な操作の問題を解決するために、現実世界のロボットシステムを構築している。
本システムは主に,人型ロボットデータを取得するための全身ロボット遠隔操作システムと,高さ調整可能なカートと3D LiDARセンサを備えた25-DoFヒューマノイドロボットプラットフォームの統合である。
1つのシーンで収集されたデータのみを使用し、オンボードコンピューティングのみで、フルサイズのヒューマノイドロボットが様々な現実世界のシナリオで自律的にスキルを発揮できることが示される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:13:13 GMT)
Which Attention Heads Matter for In-Context Learning? [41.0] 大規模言語モデル(LLM)は、印象的なインコンテキスト学習(ICL)能力を示す。
関連するトークンを見つけてコピーする誘導ヘッドと、ICLタスクの潜在エンコーディングを計算する関数ベクトル(FV)ヘッドの2つの異なるメカニズムが提案されている。
誘導頭部とFV頭部を12言語モデルで検討・比較する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:25:02 GMT)
Contrastive Learning-Based privacy metrics in Tabular Synthetic Datasets [40.7] 合成データは、医療や金融などの分野におけるプライバシー強化技術(PET)として注目されている。
類似度に基づく手法は、トレーニングと合成データとの類似度のレベルを求めることを目的としている。
攻撃に基づく手法は、合成データセットに対する故意の攻撃を誘発する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:52:23 GMT)
Towards Lightweight, Adaptive and Attribute-Aware Multi-Aspect Controllable Text Generation with Large Language Models [40.5] マルチアスペクト制御可能なテキスト生成は、属性のテキスト生成を複数の側面から制御することを目的としている。
改良された微調整手法は、単純さと有効性のためにしばしばこの課題に使用される。
マルチアスペクト制御可能なテキスト生成のための軽量で適応的で属性対応のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:56:02 GMT)
Stacking as Accelerated Gradient Descent [40.4] スタック化は、層数を徐々に増やすことで、ディープ残余ネットワークをトレーニングするテクニックである。
本稿では,積み重ねの有効性に関する理論的説明を提案する。
我々は、ある深い線形残差ネットワークに対して、スタックリングが加速トレーニングをもたらすことを証明した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:46:24 GMT)
Graph Neural Networks for Databases: A Survey [40.3] グラフ計算ネットワーク(GNN)はグラフデータのための強力なディープラーニングモデルであり、さまざまな領域で顕著な成功を収めている。
近年、データベース(DB)コミュニティは、GNNの可能性をますます認識し、GNNベースのアプローチによるデータベースシステムの改善に焦点を当てた研究が急増している。
本調査は,DBシステムにおけるGNNの構造的かつ詳細な概要を提供することで,このギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:09:09 GMT)
Qorgau: Evaluating LLM Safety in Kazakh-Russian Bilingual Contexts [40.0] 大規模言語モデル(LLM)は有害なコンテンツを生成する可能性があることが知られている。
本稿では,カザフ語とロシア語の安全性評価に特化して設計された新しいデータセットであるQorgauを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:33:22 GMT)
Remote Sensing Semantic Segmentation Quality Assessment based on Vision Language Model [39.6] シーンの複雑さと画質の変動は、セマンティックセグメンテーション法の性能において大きな変動をもたらす。
視覚言語モデル(VLM)に基づく意味的セグメンテーションのための教師なし品質評価モデルRS-SQAを提案する。
RS-SQAは、最先端の品質評価モデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:28:12 GMT)
The Self-Improvement Paradox: Can Language Models Bootstrap Reasoning Capabilities without External Scaffolding? [39.6] 本稿では,高品質な質問応答データを完全自律的に生成するフレームワークであるCrescentを提案する。
数学推論のための外部監視信号がゼロであることから、クレセントは真の自己改善の可能性に光を当てている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:37:08 GMT)
ChineseSimpleVQA -- "See the World, Discover Knowledge": A Chinese Factuality Evaluation for Large Vision Language Models [38.9] 我々は,中国語で「 ChineseSimpleVQA」というファクトリティに基づく視覚質問応答ベンチマークを初めて導入した。
このベンチマークの主な特徴は、中国語、多様な知識タイプ、マルチホップ質問の構築、高品質なデータ、静的な一貫性、短い回答による評価、などである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:19:17 GMT)
Pretrained Image-Text Models are Secretly Video Captioners [38.7] 画像ベースモデルにより、複数の特殊映像キャプションシステムよりも優れた性能が得られることが判明した。
適応モデルでは,MSRVTTとMSVDでは2位,VATEXでは3位であった。
資源最適化の観点から、このビデオキャプション研究は、モデルスケールの最適化、データ効率の最大化、強化学習の導入の3つの基本的な要素に焦点を当てている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:53:03 GMT)
Examining Multilingual Embedding Models Cross-Lingually Through LLM-Generated Adversarial Examples [38.2] 対象ドメイン内の言語ペアの並列文ペアのセマンティックセットのみを必要とする新しい言語間検索タスクを提案する。
この課題は、大きな言語モデルによって生成される強陰性よりも高い真の並列文を言語横断的にランク付けするモデルの能力に焦点を当てる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:46:14 GMT)
MuDAF: Long-Context Multi-Document Attention Focusing through Contrastive Learning on Attention Heads [38.0] 大規模言語モデル(LLM)は、入力に無関係な情報があるため、しばしば注意をそらした。
コントラスト学習により,頭部における注意分布を明示的に最適化する新しい手法MuDAFを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:59:15 GMT)
PairJudge RM: Perform Best-of-N Sampling with Knockout Tournament [38.0] Pairwise Judge Reward Model (PariJudge RM) は、BoNサンプリング用のノックアウトトーナメントと組み合わせている。
絶対スコアを割り当てる代わりに、PariJudge RM は2つの候補解の正しさを、チェーン・オブ・ソート推論を同時に判断する。
ノックアウトトーナメントでは、PariJudge RMが候補解間のペアワイズ判定を行い、誤判定を反復的に除去する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:35:48 GMT)
Wavefront shaping enhanced nano-optomechanics down to the quantum precision limit [37.7] 本稿では,ナノオプトメカニカル計測方式の感度を最適化するツールとして,ウェーブフロントシェイピングを導入する。
本研究では,波面形状が350倍に向上できることを実証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:30:21 GMT)
Judging the Judges: A Collection of LLM-Generated Relevance Judgements [37.1] 本稿では,SIGIR 2024におけるLLMJudgeの大規模自動妥当性評価の結果をベンチマークし,報告する。
8つの国際チームが作成したTREC 2023ディープラーニングトラック関連判定のラベルを42 LLMで作成し、ベンチマークする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:40:32 GMT)
CriteoPrivateAd: A Real-World Bidding Dataset to Design Private Advertising Systems [36.8] このデータセットは、Criteoプロダクションログの匿名バージョンを表している。
これは、多くのプライバシー制約の下で、オンライン広告で一般的に使用される入札モデルを学ぶのに十分なデータを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:35:59 GMT)
Multilingual Non-Factoid Question Answering with Answer Paragraph Selection [36.3] この研究は、非ファクトイデアルな質問を持つ多言語QuADであるMuNfQuADを提示する。
データセットは38言語にまたがる578KのQAペアで構成されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:25:39 GMT)
STAR: A Simple Training-free Approach for Recommendations using Large Language Models [36.2] 現在の最先端の手法は、最適な結果を得るために微調整された大規模言語モデル(LLM)に依存している。
LLMを利用するフレームワークを提案し、微調整を必要とせずに様々なレコメンデーションタスクに適用できる。
The method achieves Hits@10 performance of +23.8% on Beauty, +37.5% on Toys & Games, and -1.8% on Sports & Outdoors。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:34:29 GMT)
Template-Based Visual Program Distillation [36.1] 小さな言語モデルは、はるかに高速な推論の利点を付加して高品質なビジュアルプログラムを生成することができる。
パラメータが10億未満のモデルに使用できる,低コストなビジュアルプログラム蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:01:54 GMT)
Beyond Seen Data: Improving KBQA Generalization Through Schema-Guided Logical Form Generation [36.0] 知識ベース質問応答 (KBQA) は、大きなKBに格納された豊富な人間の知識を用いて、自然言語でユーザーの質問に答えることを目的としている。
現在のKBQAメソッドは、テスト時に見知らぬ知識ベース要素と競合する。
本稿では,スキーマコンテキストをエンティティ検索や論理形式生成に注入する新しいモデルであるSG-KBQAを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:32:40 GMT)
SMITE: Segment Me In TimE [35.6] 画像拡散モデルと追加の追跡機構に事前学習したテキストを用いて、ビデオ内のオブジェクトをセグメントする方法を示す。
提案手法は,様々なセグメンテーションシナリオを効果的に管理し,最先端の代替品より優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:58:44 GMT)
Theoretically Grounded Framework for LLM Watermarking: A Distribution-Adaptive Approach [35.3] 大規模言語モデル(LLM)の透かしのための新しい理論的枠組みを提案する。
本手法は,最悪のType-Iエラーとテキスト歪みの制御を維持しつつ,検出性能の最大化に重点を置いている。
本稿では,Gumbel-max の手法と並行してサロゲートモデルを用いた,効率的かつモデルに依存しない分布適応型透かしアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:18:11 GMT)
Enhancing Cognition and Explainability of Multimodal Foundation Models with Self-Synthesized Data [35.2] 自己合成データを用いたLMMの認識と説明性を向上させるための新しい視覚的拒絶サンプリングフレームワークを提案する。
私たちのアプローチは、人間の検証可能な視覚的特徴を含む解釈可能な答えを合成することから始まります。
各ラウンドの微調整の後、最高品質の解答を選択するために報酬モデルのないフィルタリング機構を適用する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:05:45 GMT)
A Transfer Attack to Image Watermarks [34.9] 本研究では,Non-box設定における画像透かしに対する新しい転送回避攻撃を提案する。
我々の主な貢献は、理論的にも経験的にも、既存の透かし法に基づく透かしベースのAI生成画像検出器は、回避攻撃に対して堅牢ではないことを示すことである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:50:04 GMT)
Inter3D: A Benchmark and Strong Baseline for Human-Interactive 3D Object Reconstruction [34.9] 我々は,人間の相互作用対象の新たな状態合成のための新しいベンチマークとアプローチであるInter3Dを提案する。
提案したベンチマークで広範な実験を行い,課題とアプローチの優位性を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:00:00 GMT)
E2ENet: Dynamic Sparse Feature Fusion for Accurate and Efficient 3D Medical Image Segmentation [34.9] E2ENet(Efficient to Efficient Network)と呼ばれる3次元医用画像分割モデルを提案する。
パラメトリックと計算効率の2つの設計が組み込まれている。
さまざまなリソース制約に対して、正確性と効率性のトレードオフを一貫して達成します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:52:07 GMT)
Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization [34.8] 本稿では, 既存の拡散式蒸留法に対する新しい枠組みを提案し, 生成ではなく拡散モデルを用いて選択する。
提案手法は,入力画像とテキストプロンプトに基づいて拡散モデルから発生するノイズを予測し,各ペアの損失を算出する。
この合理化フレームワークは単一段階の蒸留プロセスを実現するとともに,我々の手法が様々なメトリクスにわたって最先端の手法より優れていることを示す広範な実験を行った。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:11:13 GMT)
Shall Your Data Strategy Work? Perform a Swift Study [34.8] この研究は、少数のプローブ例を用いて、特定の種類の命令チューニングデータの有効性を評価するための素早い方法を提案する。
モデル一般化におけるチェーン・オブ・シント(CoT)データ,クエリの明確化データ,および応答評価データの可能性を検討するために,3つの迅速な研究を行った。
本検証では,各研究戦略に適したトレーニングデータセットを開発し,これらのデータセットの使用の有無にかかわらず,モデル性能を比較した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:08:35 GMT)
Beyond Single-Value Metrics: Evaluating and Enhancing LLM Unlearning with Cognitive Diagnosis [34.6] UNCD (UNlearning Evaluation via Cognitive Diagnosis) は、LLMアンラーニングのきめ細かい評価のための新しいフレームワークである。
われわれのベンチマークであるUNCD-Cyberは、危険な能力の除去に関する詳細な評価を提供する。
当社の専用ベンチマークであるUNCD-Cyberは、危険な能力の除去に関する詳細な評価を提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:56:59 GMT)
Exploiting Prefix-Tree in Structured Output Interfaces for Enhancing Jailbreak Attacking [34.5] 大規模言語モデル(LLM)は、重要なアプリケーションをもたらすだけでなく、深刻なセキュリティ脅威も導入している。
我々はAttackPrefixTree (APT)と呼ばれるブラックボックス攻撃フレームワークを導入する。
APTは構造化された出力インタフェースを利用して攻撃パターンを動的に構築する。
ベンチマークデータセットの実験は、このアプローチが既存の手法よりも高い攻撃成功率を達成することを示している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:29:36 GMT)
Simplify RLHF as Reward-Weighted SFT: A Variational Method [34.2] RLHF(Reinforcement Learning from Human Feedback)は、Large Language Models(LLM)と人的価値の整合に不可欠である。
変分推論の観点からRLHFの単純化を提案する。
我々は、アライメント目標を報酬駆動型微調整形式に変換し、トレーニングの安定性と効果を顕著に向上させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:44:40 GMT)
Benchmarking LLMs for Political Science: A United Nations Perspective [34.0] 大規模言語モデル (LLMs) は自然言語処理において大きな進歩を遂げてきたが、政治的意思決定に高い可能性を秘めている。
本稿は、国連(UN)の意思決定プロセスへのLSMの適用に焦点をあてて、このギャップに対処する。
1994年から2024年にかけて、国連安全保障理事会(UNSC)の記録を公開し、草案決議、投票記録、外交演説を含む新しいデータセットを紹介した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:51:01 GMT)
ThinkGuard: Deliberative Slow Thinking Leads to Cautious Guardrails [34.0] ThinkGuardは、高容量言語モデルから知識を抽出する、批判的な拡張されたガードレールモデルである。
平均的なF1とAUPRCを達成し、全てのベースラインを上回ります。
ラベルのみの微調整モデルを超え、構造化された批評によって分類精度とニュアンス付き安全推論の両方が向上することを確認した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:09:58 GMT)
Lost in Sequence: Do Large Language Models Understand Sequential Recommendation? [33.9] 大きな言語モデル(LLM)は、高度なテキスト理解能力とコンテキスト認識のおかげで、推奨のための有望なツールとして登場した。
本稿では,事前学習したSRecモデルから抽出したユーザ表現をLLMに蒸留することにより,LLMへのシーケンシャル情報の統合を向上する手法を提案する。
実験の結果, LLM-SRecは, ユーザの項目間相互作用の系列を理解する能力を高め, 最終的にレコメンデーション性能の向上につながることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:41:09 GMT)
AI Software Engineer: Programming with Trust [33.9] 大きな言語モデル(LLM)は、コードスニペットを生成するのに驚くほどの習熟度を示している。
AIソフトウェアエンジニアのデプロイに成功するためには、人間主導のソフトウェアエンジニアリングプラクティスによって確立された信頼と同等以上の信頼レベルが必要である、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:28:42 GMT)
Perturbation-Restrained Sequential Model Editing [33.5] 現在のモデル編集手法は、編集数が増加するにつれて、大きな言語モデル(LLM)の一般的な能力を損なう。
編集用上層部における摂動抑制フレームワーク(PRUNE)を提案する。
PRUNEは、シーケンシャルモデル編集において、編集性能を効果的に維持しながら、かなりの汎用性を維持できる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:56:19 GMT)
BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching [33.4] ボルツマン分布からサンプリングしたデータの代わりにエネルギー関数を与えられたニューラルサンプリングを学習する。
本稿では, 拡散型サンプリング装置であるノイズエネルギーマッチングを提案し, 理論的には分散度を低くし, 複雑さを増す。
実験の結果,BNEMはより堅牢でありながら最先端の性能を達成できることが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:18:24 GMT)
DataSciBench: An LLM Agent Benchmark for Data Science [33.4] DataSciBenchは、データサイエンスにおけるLarge Language Model(LLM)の機能を評価するためのベンチマークである。
我々は、グラウンド・真実(GT)を生成し、評価指標を検証するための半自動パイプラインを開発した。
我々は、各コード実行結果を評価する革新的なTask-Function-Codeフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:31:51 GMT)
Is That Your Final Answer? Test-Time Scaling Improves Selective Question Answering [33.3] 推論時における計算予算の増加は、モデルがより正確な質問に答えるのに役立つことを示す。
次に,非ゼロレベルの応答リスクの設定を考慮し,評価中のゼロリスク応答の現在のパラダイムを拡張した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:58:31 GMT)
Smaller But Better: Unifying Layout Generation with Smaller Large Language Models [33.2] LGGPT(LGGPT)は、LLMベースの統一レイアウト生成用に設計されたモデルである。
ALIとULRは、過剰なトークンを強制する簡潔な構造を持っている。
本稿では,LGGPTが既存手法に比べて優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:06:42 GMT)
Building Age Estimation: A New Multi-Modal Benchmark Dataset and Community Challenge [32.7] 建築物の建設年を推定することは、持続可能性にとって非常に重要である。
人工知能 (AI) と最近提案されたトランスフォーマーモデルを用いて, 建築物の建設時期を推定することができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:31:13 GMT)
Beyond Single Frames: Can LMMs Comprehend Temporal and Contextual Narratives in Image Sequences? [32.6] StripCipherはLMM(Large Multimodal Models)の機能を評価するために設計されたベンチマークである。
StripCipherは、人間の注釈付きデータセットと、視覚的物語理解、文脈的フレーム予測、時間的物語再構成という3つの挑戦的なサブタスクで構成されている。
GPT-4o や Qwen2.5VL など 16 ドルの最先端 LMM を評価した結果,人的能力と比較して大きな性能差がみられた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:04:44 GMT)
Bias Similarity Across Large Language Models [32.0] 我々は2つのデータセット(4Kと100万の質問)を用いて複数の次元にわたる出力分布を通してバイアスを分析する。
結果から,微調整が出力分布に与える影響は最小限であり,プロプライエタリなモデルは未知として過度に応答し,バイアスを最小化し,精度と実用性を損なう傾向にあることがわかった。
Llama3-ChatやGemma2-itのようなオープンソースモデルは、GPT-4のようなプロプライエタリなモデルに匹敵する公平さを示し、大規模でクローズドソースなモデルは本質的にバイアスが小さいという仮定に挑戦する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:36:26 GMT)
LLM4Tag: Automatic Tagging System for Information Retrieval via Large Language Models [32.0] 大規模言語モデル(LLM)は、多岐にわたる世界知識、意味理解、推論能力のためにタグ付けシステムに適用されている。
パフォーマンスは優れていますが、既存のメソッドには制限があります。
グラフベースのタグリコールモジュールは、小規模で関連性の高いタグセットを効果的かつ包括的に構築するように設計されている。
長期的および短期的な知識注入を伴う正確なタグを生成するために、知識強化タグ生成モジュールが使用される。
タグ信頼度スコアを生成するためにタグ信頼度判定モジュールを導入する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:10:23 GMT)
Mitigating Popularity Bias in Collaborative Filtering through Fair Sampling [31.8] この問題に対処するために、Fair Smpling (FS) アプローチを導入します。
従来の逆確率スコア(IPS)法とは異なり、FSは確率推定を必要としない。
実験結果から,FS はポイントワイドおよびペアワイドのレコメンデーションタスクにおいて,最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:59:49 GMT)
What Is a Good Caption? A Comprehensive Visual Caption Benchmark for Evaluating Both Correctness and Coverage of MLLMs [31.6] 包括的ビジュアルキャプションベンチマークであるCV-CapBenchを提案する。
CV-CapBenchは、6つのビューと13次元のキャプション品質を体系的に評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:55:51 GMT)
Phantom Events: Demystifying the Issues of Log Forgery in Blockchain [31.6] EVMベースのブロックチェーンにおけるトランザクションログの偽造に関する,最初の詳細なセキュリティ分析を提示する。
スマートコントラクトにおける事象偽造の脆弱性を検出するためのツールを提案する。
我々は、複数の分散アプリケーションにまたがる5種類の攻撃に対して、実世界のインスタンスを特定しました。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:07:26 GMT)
NoKSR: Kernel-Free Neural Surface Reconstruction via Point Cloud Serialization [31.5] 我々は不規則点雲を符号付き距離場(SDF)に変換する効率的なフレームワークを開発する。
付近のトークンを集約することで,ある時点でのSDF値を効率的に予測する。
複数のスケールにまたがるアグリゲーションは、シリアライゼーションによってもたらされる近似を克服するために重要であることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:34:42 GMT)
Direct Value Optimization: Improving Chain-of-Thought Reasoning in LLMs with Refined Values [31.4] 直接価値最適化(DVO)は、複雑な推論タスクにおいて大きな言語モデルを拡張するための革新的な強化学習フレームワークである。
DVOは個々の推論ステップで値信号を利用し、平均2乗誤差損失によってモデルを最適化する。
数学的および常識的推論タスクに関する実証分析により、DVOは既存のオフライン優先最適化手法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:51:05 GMT)
High-Quality 3D Creation from A Single Image Using Subject-Specific Knowledge Prior [31.2] 1枚の画像から高品質な3Dモデルを生成するための新しい2段階のアプローチを提案する。
この方法は、効率的な3Dアセット作成の必要性によって動機付けられている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:45:10 GMT)
Are Large Language Models In-Context Graph Learners? [31.2] 大規模言語モデル(LLM)は、幅広いタスクにまたがる顕著なコンテキスト内推論機能を持つ。
しかし、非ユークリッド構造に対する理解の欠如のため、グラフのような構造化データを扱うのに苦労している。
グラフデータの学習は、検索強化生成(RAG)プロセスとして概念化できることを示す。
グラフ学習タスクにおけるLLMの文脈内学習能力を高めるための一連のRAGフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:14:19 GMT)
Rethinking Audio-Visual Adversarial Vulnerability from Temporal and Modality Perspectives [31.0] 本研究では,時間的・モダリティに特有な脆弱性を考慮した音声視覚モデルの対角的ロバスト性について検討する。
このような攻撃を防ぎつつ,新たな対人訓練フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:04:12 GMT)
CipherGuard: Compiler-aided Mitigation against Ciphertext Side-channel Attacks [31.0] CipherGuardは、高い効率とセキュリティで暗号文側チャネルに対処するコンパイラ支援の緩和手法である。
我々は、CipherGuardが既存の最先端防御機構であるCipherFixよりも、より効率的な暗号化実装のセキュリティを強化することを実証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:22:36 GMT)
InsightVision: A Comprehensive, Multi-Level Chinese-based Benchmark for Evaluating Implicit Visual Semantics in Large Vision Language Models [31.0] 画像中の暗黙の意味の理解を評価するための,総合的,多レベルな中国語ベースのベンチマークを初めて紹介する。
このベンチマークは、表面レベルのコンテンツ理解、象徴的な意味解釈、背景知識理解、暗黙的な意味理解の4つのサブタスクに分類される。
このベンチマークを用いて、15個のオープンソースの大規模視覚言語モデル (LVLM) と GPT-4o を評価し、人間のパフォーマンスに最も優れたモデルラグでさえ、暗黙的な意味を理解するのに約14%遅れていることを明らかにする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:42:37 GMT)
Interleaved Gibbs Diffusion for Constrained Generation [30.6] 混合連続離散データのための新しい生成モデリングフレームワークであるInterleaved Gibbs Diffusion (IGD)を紹介する。
IGDは、離散時間ギブスサンプリング型マルコフ連鎖を介して、連続的および離散的復号化アルゴリズムをインターリーブすることによって、これを克服する。
3つの課題である3-SATの解決、分子構造の生成、レイアウトの実証化に関する実証的評価。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:51:24 GMT)
Controllable Unlearning for Image-to-Image Generative Models via $\varepsilon$-Constrained Optimization [30.5] 画像合成モデル(I2I)における機械学習問題について検討する。
従来の研究は主に、単独のソリューションを提供する単一目的最適化問題として扱われていた。
本稿では、制御係数$varepsilon$を用いてトレードオフを制御する制御可能なアンラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:06:59 GMT)
Robotic Table Tennis: A Case Study into a High Speed Learning System [30.3] 本研究では,人間と数百の卓球アライグが可能な実世界のロボット学習システムを提案する。
本システムは,高度に最適化された知覚サブシステム,高速低遅延ロボットコントローラ,現実世界の損傷を防ぐシミュレーションパラダイムを組み込んだ。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:52:54 GMT)
RAG-Optimized Tibetan Tourism LLMs: Enhancing Accuracy and Personalization [30.2] 既存の大規模言語モデル(LLM)は、パーソナライズされたレコメンデーション機能と、時に幻覚を引き起こす可能性のあるコンテンツの生成において、課題に直面している。
本研究では,検索強化世代(RAG)技術に基づくチベット観光LLMの最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:14:33 GMT)
Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study Over Open-ended Question Answering [30.1] 本研究では,Large Language Models(LLM)をオープンエンド環境でより信頼性の高いものにできるかどうかを考察する。
OKGQAは、Knowledge Graphsで強化されたLLMを、オープンエンドの現実世界の質問応答シナリオで評価するために特別に設計されたベンチマークである。
OKGQA-Pは、KGのセマンティクスと構造が意図的に乱れ、汚染された場合のモデル性能を評価するためのベンチマークである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:25:48 GMT)
Efficient and Optimal Policy Gradient Algorithm for Corrupted Multi-armed Bandits [29.8] 我々はSAMBAが最先端の$O(Klog T/Delta) + O(C/Delta)$ regret upper boundを達成することを示す。
また,SAMBAの有効性を実証するためにシミュレーションを行った。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:16:18 GMT)
Instruction Tuning on Public Government and Cultural Data for Low-Resource Language: a Case Study in Kazakh [29.8] カザフスタンの主要な制度的・文化的知識をカバーする大規模な(10,600サンプル)命令追従データセットを導入,オープンソース化する。
データセット構築のためのオープンウェイトモデルとクローズドウェイトモデルを比較し,GPT-4oをバックボーンとして選択する。
データセット上の微調整Qwen、Falcon、Gemmaは、複数の選択タスクと生成タスクの両方において、一貫したパフォーマンス改善をもたらします。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:44:27 GMT)
Self-Regularization with Latent Space Explanations for Controllable LLM-based Classification [29.7] 大規模言語モデル(LLM)潜在空間における意図しない特徴を特定し,規則化する新しいフレームワークを提案する。
本稿では,有毒なチャット検出,報酬モデリング,疾患診断を含む3つの実世界の課題に関する枠組みについて検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:27:59 GMT)
GIMMICK -- Globally Inclusive Multimodal Multitask Cultural Knowledge Benchmarking [29.7] GIMMICKは144か国にまたがる幅広い文化的知識を評価するために設計された広範囲なベンチマークである。
GIMMICKは、728のユニークな文化イベントやファセットにまたがる3つの新しいデータセット上に構築された6つのタスクで構成されている。
本研究では,(1)地域文化バイアス,(2)モデルサイズの影響,(3)入力モダリティ,(4)外部手がかりについて検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:27:40 GMT)
MIH-TCCT: Mitigating Inconsistent Hallucinations in LLMs via Event-Driven Text-Code Cyclic Training [29.6] 本稿では、イベントベースのテキストを利用して対応するコードを生成する新しいフレームワークを提案し、循環学習を用いてコードの論理的一貫性を自然言語に効果的に伝達する。
提案手法は,3つの主要な大規模言語モデル(LLM)と2つの自然言語タスクのカテゴリにおいて,矛盾する幻覚を著しく低減する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:42:33 GMT)
AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence [29.6] 本稿では,モデルが次の単語を予測する自信に基づいて推論ステップを分割する手法であるAdaptiveStepを提案する。
数理推論およびコード生成タスクにおいて,AdaptiveStep-trained PRMを用いた実験により実効性を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:35:55 GMT)
Enhancing LLM-Based Recommendations Through Personalized Reasoning [29.4] CoT-Recは、Chain-of-Thought(CoT)推論を大規模言語モデル(LLM)駆動のレコメンデーションに統合するフレームワークである。
実験により,COT-RecはLLMの推論ポテンシャルをよりよく利用することにより,推薦精度を向上することが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:08:17 GMT)
TabSD: Large Free-Form Table Question Answering with SQL-Based Table Decomposition [29.4] 自由形式のテーブル (TableQA) に対する質問応答は、事前定義されたスキーマがなく、大きなテーブルにノイズが存在するため困難である。
本研究では,大規模言語モデルによる大規模自由形式テーブルの処理能力を向上させるasqlに基づく分解モデルであるTabSDを提案する。
本稿では,大きな自由形式テーブルを持つ2つのテーブルQAデータセット,SLQAとSEQAを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:45:05 GMT)
RGAR: Recurrence Generation-augmented Retrieval for Factual-aware Medical Question Answering [29.1] 現在のパラダイムであるRetrieval-Augmented Generation (RAG)は、大規模なコーパス検索を通じて専門的な医療知識を取得する。
本稿では,2つの情報源から関連する事実知識と概念知識の両方を検索する再帰生成拡張検索フレームワークであるRGARを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:50:10 GMT)
The Computational Advantage of Depth: Learning High-Dimensional Hierarchical Functions with Gradient Descent [29.0] 潜在部分空間次元の階層構造を組み込んだ対象関数のクラスを導入する。
我々の主定理は、勾配降下による特徴学習が有効次元を減少させることを示している。
これらの知見は、ディープネットワークを用いた階層構造学習における深度の重要な役割について、さらに定量的に研究する道を開く。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:58:28 GMT)
Towards Invariance to Node Identifiers in Graph Neural Networks [29.0] グラフニューラルネットワーク(GNN)は、メッセージパッシング構造のため、表現力に制限があることが知られている。
この制限を回避する1つのメカニズムは、ユニークなノード識別子(ID)を追加することである。
本稿では、IDフレームワークの重要な制限を強調し、それに対応するためのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:12:57 GMT)
FLAG-Trader: Fusion LLM-Agent with Gradient-based Reinforcement Learning for Financial Trading [28.6] 大規模言語モデル(LLM)は、マルチモーダルな財務データに基づいて微調整されている。
言語処理(LLM)と勾配駆動強化学習(RL)ポリシーの最適化を統合した統一アーキテクチャであるtextscFLAG-Traderを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:40:56 GMT)
Enhancing Cross-Domain Recommendations with Memory-Optimized LLM-Based User Agents [28.6] 大規模言語モデル(LLM)ベースのユーザエージェントは、レコメンダシステムを改善する強力なツールとして登場した。
本稿では,2層メモリアーキテクチャと2段階融合機構を備えた新しいフレームワークであるAgentCF++を紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:02:59 GMT)
FREE: The Foundational Semantic Recognition for Modeling Environmental Ecosystems [28.2] FREEは利用可能な環境データをテキスト空間にマッピングし、環境科学における従来の予測モデリングタスクを意味認識問題に変換する。
長期予測に使用する場合、FREEは将来予測を強化するために新たに収集した観測を組み込む柔軟性を持つ。
自由は2つの社会的に重要な現実世界の応用の文脈で評価され、デラウェア川流域の河川水温を予測し、イリノイ州とアイオワ州で毎年トウモロコシの収量を予測する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:24:23 GMT)
PedDet: Adaptive Spectral Optimization for Multimodal Pedestrian Detection [28.1] PedDetは適応的なスペクトル最適化フレームワークで、特にマルチスペクトル歩行者検出に最適化されている。
PedDetは最先端の性能を実現し、低照度でも検出精度が良く、mAPを6.6%向上させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:31:51 GMT)
Unlocking Multimodal Integration in EHRs: A Prompt Learning Framework for Language and Time Series Fusion [27.7] 大規模言語モデル(LLM)は、視覚言語タスクにおいて顕著な性能を示してきたが、医療分野におけるそれらの応用はいまだ研究されていない。
ProMedTSは、データ型を統一するために、プロンプト誘導学習を利用する、新しい自己教師型マルチモーダルフレームワークである。
実世界のデータセットを用いた診断タスクにおけるProMedTSの評価を行い,本手法が常に最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:56:48 GMT)
Towards Context-Robust LLMs: A Gated Representation Fine-tuning Approach [27.7] 外部コンテキストで強化された大規模言語モデル(LLM)は、不完全なエビデンスを扱う上で、しばしば課題に直面します。
本稿では,内部知識と外部コンテキストを効果的にバランスさせる,コンテキストローバスト LLM の概念を提案する。
Grftは軽量かつプラグアンドプレイのゲート表現微調整方式である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:59:35 GMT)
Proving Olympiad Inequalities by Synergizing LLMs and Symbolic Reasoning [27.6] 大規模言語モデル(LLM)は、証明システム内で証明ステップを生成することによって、数学的定理を正式に証明することができる。
本稿では,LLMが学習した数学的直観と,記号的手法によって符号化された領域固有の洞察を相乗化する,ニューロシンボリック・戦術生成器を提案する。
複数の数学コンペティションから161の挑戦的不等式を評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:54:21 GMT)
DiffExp: Efficient Exploration in Reward Fine-tuning for Text-to-Image Diffusion Models [27.5] 報酬を最大化するための微調整されたテキスト・ツー・イメージモデルは、モデル性能を向上させるのに有効であることが証明された。
微調整法は、しばしばオンラインサンプル生成による緩やかな収束に悩まされる。
DiffExpは、テキスト・ツー・イメージ・モデルの微調整のための、シンプルで効果的な探索戦略である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:47:58 GMT)
Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs [26.5] ユーティリティ関数を用いたAI選好の内部コヒーレンスについて検討する。
既存の制御対策にもかかわらず, LLM アシスタントの問題点や, しばしば衝撃的な値を明らかにする。
ケーススタディでは,公益事業と市民議会の連携が政治的偏見を減らし,新たなシナリオに一般化することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:48:30 GMT)
MedIAnomaly: A comparative study of anomaly detection in medical images [26.3] 異常検出(AD)は、期待される正常なパターンから逸脱する異常なサンプルを検出することを目的としている。
医学的ADのための多くの方法が出現したにもかかわらず、公平で包括的な評価が欠如しているため、明確な結論が得られなかった。
本稿では,この問題に対処するため,比較を統一したベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:28:48 GMT)
View-Invariant Policy Learning via Zero-Shot Novel View Synthesis [26.2] 本研究では,世界の大規模視覚データから得られる知識が,一般化可能な操作のための一軸の変動にどのように対処できるかを考察する。
本研究では,異なるカメラ視点から同一シーンの画像をレンダリングすることで,シーンレベルの3D認識を学習する単一画像の新規ビュー合成モデルについて検討する。
多様なロボットデータに実用的に応用するには、これらのモデルはゼロショットを動作させ、目に見えないタスクや環境でビュー合成を行う必要がある。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:10:44 GMT)
SCALAR: Scientific Citation-based Live Assessment of Long-context Academic Reasoning [26.1] 本稿では,SCALAR(Scientific Citation-based Live Assessment of Long-context Academic Reasoning)という新しいベンチマークを提案する。
SCALARは、人間のアノテーションを使わずに高品質な基底真理ラベルの自動生成、制御可能な難易度、動的更新機構を備えている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:15:49 GMT)
Robust Concept Erasure Using Task Vectors [26.0] 我々は,ユーザのプロンプトの消去を条件にするのではなく,テキスト・ツー・イメージモデルから概念を無条件に消去することに注力する。
本稿では,モデル入力空間内に単語埋め込みの大規模な集合を見出すDiverse Inversionという手法を提案する。
セットの多様性を奨励することで、予想外のプロンプトに対する評価がより堅牢になることが分かりました。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:38:33 GMT)
CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents [25.9] 既存のコード検索データセットには制限がある。
彼らは、主にセマンティックな理解を通じてコードを評価する人間のアノテータに依存している。
本稿では、CoSQAの高品質なクエリと複数の適切なコードとをペアリングするCoSQA+を紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:12:45 GMT)
Generative Detail Enhancement for Physically Based Materials [25.6] 本稿では,市販拡散モデルと逆レンダリングを用いて,物理材料の詳細性を高めるツールを提案する。
我々のゴールは、装い、老朽化、風化などの兆候を加えることで、しばしば著者にとって面倒な細部で素材の視覚的忠実度を高めることである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:39:51 GMT)
AS-GCL: Asymmetric Spectral Augmentation on Graph Contrastive Learning [25.1] グラフ・コントラシブ・ラーニング(GCL)は,グラフ構造化データの自己教師型学習における最前線として登場した。
グラフのコントラスト学習に非対称スペクトル拡張を取り入れたAS-GCLという新しいパラダイムを提案する。
提案手法は各コンポーネントに大幅な拡張をもたらす。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:22:57 GMT)
From Correctness to Comprehension: AI Agents for Personalized Error Diagnosis in Education [25.0] 大規模言語モデル(LLM)は、GSM8Kのようなベンチマークでほぼ完璧なパフォーマンスを達成し、驚くべき数学的推論能力を示している。
しかし、誤り診断やフィードバック生成よりも正確さが過大評価されているため、パーソナライズされた教育への応用は依然として限られている。
textbfMathCCSは,システム的エラー解析と修正されたフィードバックのためのベンチマークである。
第2に、過去のデータを利用してトレンドを追跡し、診断精度を向上させるシーケンシャルなエラー解析フレームワークを開発する。
第3に、歴史的分析のための時系列エージェントと実時間のためのMLLMエージェントを組み合わせたマルチエージェント協調フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:57:51 GMT)
TESS 2: A Large-Scale Generalist Diffusion Language Model [24.9] TESS 2は命令追従拡散言語モデルであり、命令追従拡散モデルより優れている。
適応学習とベースモデルの選択は,優れた指示追従拡散モデルの訓練に不可欠であることがわかった。
モデル出力の調整を基礎となるモデルのトレーニングを必要とせずに行うための,新しい,モジュール型の推論時ガイダンス手法である報奨ガイダンスを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:50:31 GMT)
NavigateDiff: Visual Predictors are Zero-Shot Navigation Assistants [24.7] 慣れ親しんだ環境をナビゲートすることは、家庭用ロボットにとって大きな課題となる。
既存の強化学習手法は、直接新しい環境に移行することはできない。
我々は、事前学習された基礎モデルの論理知識と一般化能力をゼロショットナビゲーションに転送しようと試みる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:27:47 GMT)
Provably Efficient Multi-Objective Bandit Algorithms under Preference-Centric Customization [24.5] 明示的なユーザ嗜好の存在下で、嗜好を意識したMO-MABフレームワークについて検討する。
これは、明示的なユーザの好みを持つカスタマイズされたMO-MAB最適化に関する最初の理論的研究である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:06:13 GMT)
Sce2DriveX: A Generalized MLLM Framework for Scene-to-Drive Learning [24.5] 我々は,人間ライクな駆動チェーン(CoT)推論フレームワークであるSce2DriveXを紹介した。
人間の運転に固有の暗黙の認知連鎖を再構築し、シーン理解、メタアクション推論、行動解釈分析、行動計画および制御をカバーしている。
CARLA Bench2Driveベンチマークでは、シーン理解からエンドツーエンドの駆動まで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:50:44 GMT)
CardiacMamba: A Multimodal RGB-RF Fusion Framework with State Space Models for Remote Physiological Measurement [24.5] 遠隔光麻痺(rPl)による心拍数(HR)推定は、健康モニタリングに非侵襲的な解決策を提供する。
従来の単一モダリティアプローチ(RGBまたはRF)は、照明のバリエーション、モーションアーティファクト、皮膚のトーンバイアスによるロバストさと精度のバランスをとる上で、課題に直面している。
両モードの相補的強度を利用するマルチモーダルRGB-RF融合フレームワークであるCardiacMambaを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:00:34 GMT)
MotifBench: A standardized protein design benchmark for motif-scaffolding problems [24.5] モチーフ・スキャフォールディング問題は、計算タンパク質設計における中心的な課題である。
MotifBench(モティフベンチ)は、30のベンチマーク問題の集合であり、このベンチマークと、評価.com/blt2114/MotifBenchにおけるリーダーボードの実装である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:51:50 GMT)
Investigating Non-Transitivity in LLM-as-a-Judge [24.4] 本稿では,AlpacaEvalフレームワークにおける非透過性の存在について検討し,モデルランキングに対するその影響を分析する。
ラウンドロビントーナメントの計算コストに対処するため,スイス・ワイズ・イテレーティブ・マッチメイキング(Swim)トーナメントを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:59:16 GMT)
Implicit Geometry of Next-token Prediction: From Language Sparsity Patterns to Model Representations [24.2] 大規模テキストコーパス上でのNTP(Next-token Prediction)は,大規模言語モデルの学習のパラダイムとなっている。
得られたモデル表現の幾何学的特性に対する言語パターンのマッピングにNTPがどう影響するかを考察する。
合成および小規模な実言語データセットについて,本研究の成果を検証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:31:46 GMT)
Does Editing Provide Evidence for Localization? [23.8] 大規模言語モデルにおける解釈可能性研究の基本的な願望は、意味論的に意味のある振る舞いを「局所化」することである。
このような編集によって得られる証拠はどの程度強力か?
キーとなる新しい技術ツールは、LLMアライメント技術を適用して、そのような最適なローカライズされた編集を見つける方法である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:45:25 GMT)
MSVCOD:A Large-Scale Multi-Scene Dataset for Video Camouflage Object Detection [23.6] Video Camouflaged Object Detection (VCOD)は、ビデオの背景にシームレスに隠されたオブジェクトを特定することを目的とした、難しいタスクである。
我々は,新しい大規模マルチドメインVCODデータセットMSVCODを構築した。
私たちのMSVCODは、これまでで最大のVCODデータセットであり、人間、動物、医療、自動車などの複数のカテゴリーを導入しました。
本フレームワークは,既存のVCOD動物データセットと提案したMSVCODの最先端結果を実現する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:27:23 GMT)
Train Small, Infer Large: Memory-Efficient LoRA Training for Large Language Models [23.4] Low-Rank Adaption (LoRA)は、大規模言語モデルに対してコスト効率の良い微調整ソリューションを提供する。
しかし、LoRAのメモリフットプリントは、主にオリジナルのモデルパラメータに支配されている。
メモリ効率のよいLoRA学習手法であるLoRAMを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:39:15 GMT)
The Canary's Echo: Auditing Privacy Risks of LLM-Generated Synthetic Text [23.4] 我々は、事前訓練された大規模言語モデル(LLM)を微調整するために使用されるデータをターゲットにした会員推論攻撃(MIA)を設計する。
このようなデータに基づくMIAは、ランダムな推測よりもはるかに優れていることを示し、これは、合成データがトレーニングデータに関する情報を漏洩することを意味する。
この問題に対処するために、自動回帰モデルの力学を活用して、非分配プレフィックスと高パープレキサフィックスを備えたカナリアを設計する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:30:30 GMT)
BFA: Best-Feature-Aware Fusion for Multi-View Fine-grained Manipulation [23.3] マルチビュー操作タスクのためのBFA融合戦略を提案する。
ポリシーネットワークの視覚的バックボーンに基づいて、各ビューの重要度を予測する軽量ネットワークを設計する。
予測された重要度に基づいて、再重み付けされたマルチビュー機能はその後融合され、エンドツーエンドのポリシーネットワークに入力される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:10:06 GMT)
Dual-level Mixup for Graph Few-shot Learning with Fewer Tasks [23.1] We propose a SiMple yet effectIve approach for graph few-shot Learning with fEwer task, named SMILE。
メタ学習において利用可能なノードとタスクを同時に強化するために、マルチレベルのミックスアップ戦略を導入し、タスク内とタスク間ミックスアップの両方を包含する。
経験的に言えば、SMILEは、ドメイン内設定とクロスドメイン設定で評価されたすべてのデータセットに対して、他の競合モデルよりも大きなマージンで、一貫して優れています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:59:05 GMT)
One Size doesn't Fit All: A Personalized Conversational Tutoring Agent for Mathematics Instruction [23.0] 数学教育のためのtextbfPersontextbfAlized textbfConversational tutoring agtextbfEnt (PACE) を提案する。
PACEは、各生徒のペルソナに合わせて、フェーダーとシルバーマンの学習スタイルモデルに基づいて、生徒の学習スタイルをシミュレートする。
学生の理解を深めるために、PACEはソクラテス教育法を用いて即時フィードバックを提供し、深い思考を促進する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:45:48 GMT)
Assessing the Reasoning Capabilities of LLMs in the context of Evidence-based Claim Verification [22.9] 証拠と組み合わせた主張を原子推論タイプに分解するフレームワークを提案する。
私たちはこのフレームワークを使って、最初のクレーム検証ベンチマークであるRECV(Reasoning in Evidence-based Claim Verification)を作成します。
我々は、複数のプロンプト設定の下で、最先端のLLMを3つ評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:11:43 GMT)
Rectified Lagrangian for Out-of-Distribution Detection in Modern Hopfield Networks [22.6] 本稿では,メモリニューロンに対する新しいラグランジアンを提案する。
RegLagは、任意の相互作用マトリックスに対して自明なポイントアトラクターを生成し、このアトラクターに該当するサンプルをOODとして識別することで、OOD検出を可能にする。
本稿では,エネルギーを用いたOOD検出法と比較して,RecLagを用いたMHNの有効性を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:50:22 GMT)
MoVer: Motion Verification for Motion Graphics Animations [22.5] MoVerは、一階述語論理に基づく動作検証である。
LLMに基づく合成および検証パイプラインでMoVerをどのように利用できるかを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:11:41 GMT)
Local Differences, Global Lessons: Insights from Organisation Policies for International Legislation [22.5] 本稿では、ボトムアップガバナンスアプローチがAIの利用と監視をいかに形成するかを理解するために、ニュース機関と大学という2つの領域におけるAIポリシーを検討する。
私たちは、バイアス、プライバシー、誤情報、説明責任といったリスクに対処する方法において、収束と分散の重要な領域を特定します。
ドメイン固有のAIポリシから学んだことは、グローバルレベルでより適応的で効果的なAIガバナンスに寄与する、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:59:09 GMT)
NVR: Vector Runahead on NPUs for Sparse Memory Access [22.3] スパースDNNワークロードにおけるキャッシュミス問題に対処するために,NPUに適したプリフェッチ機構であるNPU Vector Runahead(NVR)を提案する。
NVRは汎用プロセッサのSOTAプリフェッチに比べて平均90%のキャッシュミス削減を実現している。
評価の結果、16KBのキャッシュを拡張すれば、L2キャッシュサイズを同じ量に増やすよりもパフォーマンスが5倍向上することがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:54:58 GMT)
ArrayBot: Reinforcement Learning for Generalizable Distributed Manipulation through Touch [22.3] ArrayBotは、触覚センサーと統合された垂直にスライドする柱からなる分散操作システムである。
我々は、制御ポリシーの自動発見に強化学習アルゴリズムを利用する。
本稿では,分散操作のためのArrayBot上でのRLの膨大な可能性を示す,実世界の操作タスクを多数提示する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:09:21 GMT)
Democratizing Large Language Model-Based Graph Data Augmentation via Latent Knowledge Graphs [22.2] グラフデータの不足やノイズによるグラフ表現学習には,データ拡張が必要である。
我々は、LCMのガイダンスであるDemoGraphを用いて、ブラックボックスのコンテキスト駆動グラフデータ拡張手法を提案する。
本手法は,電子健康記録(EHRs)のシナリオに優れ,文脈知識の最大限活用を実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:00:32 GMT)
Agentic Information Retrieval [21.7] 本稿では,大規模言語モデル(LLM)とAIエージェントによって駆動されるIRの変換的次世代パラダイムであるエージェント情報検索(Agentic IR)を紹介する。
エージェントIRにおける中心的なシフトは、静的で事前定義された情報項目から動的で文脈に依存した情報状態への「情報の定義」の進化である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:24:30 GMT)
MSEMG: Surface Electromyography Denoising with a Mamba-based Efficient Network [21.6] 表面筋電図(sEMG)記録は、監視された筋肉が心臓に閉じているときに心電図(ECG)信号によって汚染される。
我々は,Mamba状態空間モデルと畳み込みニューラルネットワークを統合し,軽量なsEMG復調モデルとして機能する新しいシステムであるMSEMGを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:53:42 GMT)
Collaborative Deterministic-Diffusion Model for Probabilistic Urban Spatiotemporal Prediction [21.5] データに固有の複雑さを捉える上で,確率論的予測が果たす重要な役割を強調した。
我々は,予測精度と不確実性を扱う能力の両方を改善するために,決定論的・確率的モデルと協調するCoSTを提案する。
CoSTは決定論的指標と確率論的指標の両方において既存の手法を著しく上回り、計算コストの低い20%の改善を実現している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:27:18 GMT)
ModSkill: Physical Character Skill Modularization [21.3] 我々は、複雑な全身スキルを独立した身体部品のための構成的でモジュラーなスキルに分解する新しいスキル学習フレームワークModSkillを紹介した。
提案手法は, 生成サンプリングによって強化された, このモジュール化されたスキル学習フレームワークが, 高精度なフルボディモーショントラッキングにおいて, 既存の手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:55:49 GMT)
Density-Based Algorithms for Corruption-Robust Contextual Search and Convex Optimization [21.3] 対向雑音モデルにおいて、高次元における二項探索の一般化である文脈探索の問題を考察する。
我々は$epsilon$-ballと絶対的な損失に焦点を当てている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:47:40 GMT)
Recursive Inference Scaling: A Winning Path to Scalable Inference in Language and Multimodal Systems [21.0] 本稿では,Recursive Inference Scaling (RINS) を,推論時間をスケーリングするための補完的なプラグインレシピとして紹介する。
与えられた固定モデルアーキテクチャとトレーニング計算予算のために、RINSは言語モデリングのパフォーマンスを大幅に改善する。
RINSは、SigLIP-B/16の0ショット画像Net精度を+2%改善するなど、マルチモーダルシステムでゲインを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:24:45 GMT)
Piece of Table: A Divide-and-Conquer Approach for Selecting Subtables in Table Question Answering [20.9] PieTa - サブテーブルベースの質問応答(QA)のための新しいフレームワーク
テーブルを小さなウィンドウに分割する反復的なプロセスを通じて動作し、LMを使用して各ウィンドウ内で関連する細胞を選択し、これらの細胞をサブテーブルにマージする。
従来のサブテーブルベースのQAアプローチよりもパフォーマンスが向上している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:56:57 GMT)
Slamming: Training a Speech Language Model on One GPU in a Day [20.8] Slamは,1つの学術GPU上で,高品質な言語モデル(SLM)を24時間でトレーニングするためのレシピだ。
我々は、このトレーニングレシピが、計算コストのごく一部で主要なSLMと同等の計算結果を得られるようにも、うまくスケールできることを実証的に実証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:21:15 GMT)
X-IL: Exploring the Design Space of Imitation Learning Policies [20.8] 我々は、模倣学習ポリシーのための広大なデザイン空間を探求するために設計されたオープンソースのフレームワークであるX-ILを紹介する。
このフレームワークのモジュラー設計は、バックボーン(Transformer、Mamba、xLSTMなど)やポリシー最適化技術などのポリシーコンポーネントのシームレスなスワップを可能にする。
本研究は,実践者の実践的参考と,模倣学習における今後の研究を導くための基盤としての役割を担っている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:57:34 GMT)
Sens-Merging: Sensitivity-Guided Parameter Balancing for Merging Large Language Models [20.7] Sens-Mergingはモデルマージのための感度誘導係数調整法である。
本研究では,Sens-Mergingが一般知識,数学的推論,コード生成タスクにおいて,性能を著しく向上させることを示す。
本研究は,タスク固有のスケーリングとタスク間の重要なトレードオフを明らかにし,今後のモデルマージ戦略の洞察を提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:34:46 GMT)
STaR-SQL: Self-Taught Reasoner for Text-to-SQL [20.7] チェーンオブ思考」の理論的根拠は、複雑な推論タスクにおける大規模言語モデルの性能向上に有効であることが証明されている。
テキスト駆動のような構造化されたタスクにそのようなテクニックを適用することは、ほとんど探索されていない。
本稿では、クエリ生成を推論プロセスとして再編成する新しいアプローチである、テキスト駆動型セルフトレーサ(STaR-)を提案する。
挑戦的なスパイダーベンチマークの実験結果によると、STaR-はテキストからパフォーマンスを大幅に改善し、86.6%の精度を実現している。
これらの知見は、推論強化トレーニングの可能性を強調している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:58:44 GMT)
You Only Prune Once: Designing Calibration-Free Model Compression With Policy Learning [20.6] PruneNetは、ポリシー学習プロセスとしてモデルプルーニングを再構成する新しいモデル圧縮手法である。
LLaMA-2-7Bモデルはわずか15分で圧縮でき、ゼロショット性能の80%以上を維持できる。
複雑なマルチタスク言語理解タスクでは、PruneNetはオリジナルのモデルの80%のパフォーマンスを維持することで、その堅牢性を実証している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:34:23 GMT)
Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class [20.6] 最先端の深部生成モデルでは, 多数例よりも極めて低品質な少数例が得られている。
本稿では,少数分布と多数分布が重複する領域のクラスを導入することで,二進分類ラベルを三進分類ラベルに変換する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:36:45 GMT)
WorldGUI: Dynamic Testing for Comprehensive Desktop GUI Automation [20.1] We present WorldGUI, a novel GUI benchmark that design GUI task with various initial state tosimulated real computer-user interaction。
また,GUIインタラクションの予測不能性と複雑性を効果的に管理する総合的なフレームワークであるGUI-Thinkerを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:27:05 GMT)
DH-RAG: A Dynamic Historical Context-Powered Retrieval-Augmented Generation Method for Multi-Turn Dialogue [20.1] DH-RAGは,動的履歴文脈を利用した多言語対話のための検索・拡張生成手法である。
DH-RAGは人間の認知プロセスにインスパイアされ、会話応答における長期記憶と即時史的文脈の両方を利用する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:10:43 GMT)
MM-Verify: Enhancing Multimodal Reasoning with Chain-of-Thought Verification [20.1] MM-VerifierとMM-Reasonerを導入し、より長い推論とより堅牢な検証を通じてマルチモーダル推論を強化する。
MM-ReasonerとMM-Verifierを組み合わせた場合,MathVistaで65.3の精度を実現する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:46:52 GMT)
From Sub-Ability Diagnosis to Human-Aligned Generation: Bridging the Gap for Text Length Control via MARKERGEN [19.7] MarkerGenは、長さ制御可能なテキスト生成を改善する単純なyet効率のプラグアンドプレイアプローチである。
テストの結果、MarkerGenは様々な設定でLCTGを大幅に改善し、優れた有効性と一般化性を示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:52:45 GMT)
Beyond One-Size-Fits-All: Tailored Benchmarks for Efficient Evaluation [19.7] 本論文では,各対象モデルに合わせてカスタマイズした評価を行うTaloredBenchを提案する。
Global-coresetはまず、ターゲットモデル毎に最も一貫性のあるソースモデルを特定するプローブとして構築される。
拡張性のあるK-Medoidsクラスタリングアルゴリズムが提案され、Global-coresetを各ターゲットモデルに適したNative-coresetに拡張する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:31:50 GMT)
Towards Vector Optimization on Low-Dimensional Vector Symbolic Architecture [19.4] ベクトルアーキテクチャ(VSA)は、その効率性から機械学習に登場しているが、超次元性と精度の問題によって妨げられている。
有望な緩和法として、勾配に基づく最適化を用いることで、低次元計算(LDC)法は、精度を維持しながらベクトル次元を100倍削減する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:00:32 GMT)
Algorithmic Content Selection and the Impact of User Disengagement [19.1] デジタルサービスはコンテンツ選択において根本的なトレードオフに直面している。
ユーザーエンゲージメントを維持するという長期的なメリットに対して、ハイリワードコンテンツから得た即時収益をバランスさせなければならない。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:50:47 GMT)
Accelerating Diffusion Transformers with Token-wise Feature Caching [19.1] 拡散変換器は、膨大な計算コストを犠牲にして、画像合成とビデオ合成の両方において有意な効果を示した。
トークンワイズ機能キャッシングを導入し、キャッシングに最も適したトークンを適応的に選択できるようにします。
PixArt-$alpha$、OpenSora、DiTの実験では、トレーニングの必要なく、画像生成とビデオ生成の両方の有効性を実証しています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:39:58 GMT)
Differentially Private Learning Beyond the Classical Dimensionality Regime [19.0] 比例次元の体系における差分私的学習について研究する。
いくつかのよく研究された微分プライベートアルゴリズムの誤差を理論的に推定する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:35:35 GMT)
Cross-View Graph Consistency Learning for Invariant Graph Representations [18.8] リンク予測のための不変グラフ表現を学習するクロスビューグラフ一貫性学習(CGCL)法を提案する。
本稿では,CGCL法の有効性を実証的かつ実験的に実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:51:54 GMT)
d-Sketch: Improving Visual Fidelity of Sketch-to-Image Translation with Pretrained Latent Diffusion Models without Retraining [18.7] 本稿では,大規模な拡散モデルの特徴一般化機能を利用したスケッチ・ツー・イメージ翻訳手法を提案する。
実験結果から,提案手法は定性的,定量的なベンチマークにおいて既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:54:45 GMT)
Exploring Mutual Cross-Modal Attention for Context-Aware Human Affordance Generation [18.7] 本研究では,2次元シーンにおける空き時間予測のためのシーンコンテキストを符号化する新しいクロスアテンション機構を提案する。
まず,グローバルシーンのコンテキストエンコーディングに条件付き可変オートエンコーダを用いて,シーン内の人物の確率的位置をサンプリングする。
次に、局所文脈エンコーディングの分類器を用いて、既存の人間のポーズ候補のセットから潜在的ポーズテンプレートを予測する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:24:45 GMT)
Flow-based generative models as iterative algorithms in probability space [18.7] フローベースの生成モデルは、正確な推定、効率的なサンプリング、決定論的変換を提供する。
本チュートリアルでは,フローベース生成モデルのための直感的な数学的枠組みを提案する。
我々は,信号処理や機械学習にフローベース生成モデルを効果的に適用するために必要なツールを研究者や実践者に提供することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:09:18 GMT)
Where's the Bug? Attention Probing for Scalable Fault Localization [18.7] 本稿では, 直接的位置付けラベルを使わずに, 最先端の故障位置付けを学習するBug Attention Probe(BAP)を提案する。
BAPは計算コストのごく一部で大きなオープンウェイトモデルよりもはるかに効率的である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:59:32 GMT)
EvoP: Robust LLM Inference via Evolutionary Pruning [18.4] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な成功を収めた。
既存の構造化プルーニング手法は、モデルから冗長な構造を取り除き、この問題に対処する。
頑健なLLM推論のための進化的プルーニングフレームワークであるEvoPを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:33:59 GMT)
Regression in EO: Are VLMs Up to the Challenge? [18.3] 視覚言語モデル(VLM)は、認識と推論タスクにおいて顕著な成功を収めた。
本稿では,EO回帰タスクにVLMを適用する際の課題と機会を体系的に検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:27:54 GMT)
On-demand storing time-bin qubit states with optical quantum memory [18.1] 我々は,高効率かつ高忠実度な低コスト光量子メモリを実験的に実証した。
ラウンド当たりの保存効率は95.0%に達し、全体の状態忠実度は99.1%を超える。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:27:26 GMT)
QuanTaxo: A Quantum Approach to Self-Supervised Taxonomy Expansion [17.9] 分類学拡張のための革新的な量子インスパイアされたフレームワークであるQuanTaxoを紹介する。
QuanTaxo は古典的な埋め込みモデルよりも優れていることを示す。
また,広範囲なアブレーションとケーススタディを通じてQuanTaxoの優位性を強調した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:30:17 GMT)
Translation in the Hands of Many:Centering Lay Users in Machine Translation Interactions [17.7] 機械翻訳(MT)はグローバルツールとなり、多言語大言語モデル(LLM)を利用した対話システムでもサポートされるようになった。
本稿では,MTユーザプロファイルの変化をトレースし,非エキスパートユーザに着目した。
ユーザビリティ、信頼、リテラシーという3つの重要な要因を特定します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:45:17 GMT)
Are Rules Meant to be Broken? Understanding Multilingual Moral Reasoning as a Computational Pipeline with UniMoral [17.5] 道徳的推論は、個々の経験と文化的文脈によって形成された複雑な認知過程である。
このギャップを、心理学的根拠とソーシャルメディア由来の道徳ジレンマを統合した統合データセットUniMoralで埋める。
3つの大きな言語モデル(LLM)を4つのタスクでベンチマーク評価することで、UniMoralの実用性を実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:13:24 GMT)
A Chain-of-Thought Subspace Meta-Learning for Few-shot Image Captioning with Large Vision and Language Models [17.1] 大規模データに事前訓練された大規模ビジョンと言語モデルは、視覚的および言語的先行性を符号化する。
画像記述の仕方を改善するための多段階画像キャプション手法として,チェーン・オブ・シント(CoT)メタラーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:35:43 GMT)
Breaking the Clusters: Uniformity-Optimization for Text-Based Sequential Recommendation [17.0] 従来のシーケンシャルレコメンデーションメソッドは、時間の経過とともにユーザの好みをキャプチャするために明示的なアイテムIDに依存している。
近年,テキストのみの情報をレコメンデーションに活用する研究が進んでいる。
我々は3つのペアワイズアイテムサンプリング戦略を利用するフレームワークUniTを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:35:28 GMT)
PitVQA++: Vector Matrix-Low-Rank Adaptation for Open-Ended Visual Question Answering in Pituitary Surgery [17.0] 視覚的質問応答(VQA)における視覚言語モデル(VLM)は、術中意思決定を強化し、直感的な相互作用を促進し、外科教育を著しく進歩させるユニークな機会を提供する。
外科的VQAのためのVLMの開発は、限られたデータセットと、事前訓練された重量の完全な微調整中に過剰適合と破滅的な忘れ込みのリスクのために困難である。
この研究は、開封されたPitVQAデータセットと、下垂体手術にGPT-2を適用するための革新的なVLM微調整アプローチを取り入れたPitVQAを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:28:39 GMT)
Towards Geo-Culturally Grounded LLM Generations [16.9] 生成的大規模言語モデル(LLM)は、世界中の多様な文化的知識にギャップがあることが示されている。
本研究は,LLMが多種多様な国文化に親しみを呈する能力に,検索の強化と検索手法が及ぼす影響について検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:29:58 GMT)
AutoTEE: Automated Migration and Protection of Programs in Trusted Execution Environments [16.9] AutoTEEは、開発者の介入を最小限に抑えて、機密性の高い機能をTEEに識別、分割、変換、ポートすることができる。
変換されたコードを、Intel SGXやAMD SEVなど、さまざまなTEEプラットフォームに自動的に移植するメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:37:00 GMT)
Task-agnostic Prompt Compression with Context-aware Sentence Embedding and Reward-guided Task Descriptor [16.8] Task-Agnostic Prompt Compression (TPC)は、入力質問やテンプレートを必要とせずにタスクやドメイン間の圧縮を一般化する新しいフレームワークである。
TPCは、コンテキストとクエリペアのキュレートされたデータセットに基づいてトレーニングされたタスク記述子を使用して、コンテキスト関連タスク記述を生成する。
我々は,LongBenchおよびZeroSCROLLSベンチマークにおいて,既存の最先端手法よりも優れた3つのモデルサイズ(Base, Large, Huge)を導入する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:16:29 GMT)
FlexTok: Resampling Images into 1D Token Sequences of Flexible Length [16.8] 可変長の1Dトークンシーケンスに2D画像を投影するトークンライザであるFlexTokを紹介する。
簡単なGPT型変換器を用いて, 自己回帰生成設定によるアプローチの評価を行った。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:59:44 GMT)
Explore-Construct-Filter: An Automated Framework for Rich and Reliable API Knowledge Graph Construction [16.7] API Knowledge Graph(API KG)は、APIエンティティとその関係をモデル化する構造化ネットワークである。
大規模言語モデル(LLM)に基づくAPI KG構築の自動化手法を提案する。
提案手法は最先端の手法を超越し,F1スコアの25.2%向上を実現した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:51:31 GMT)
Noise May Contain Transferable Knowledge: Understanding Semi-supervised Heterogeneous Domain Adaptation from an Empirical Perspective [16.4] 半教師付きヘテロジニアスドメイン適応(SHDA)は、異なる特徴表現と分布を持つ領域間の学習に対処する。
約330のSHDAタスクに対して,2つの教師付き学習手法と7つの代表的SHDA手法を用いて広範な実験を行った。
SHDAにおける転送可能な知識は主に、ソースドメインの転送可能性と識別性に起因する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:27:03 GMT)
Deep-Unfolded Massive Grant-Free Transmission in Cell-Free Wireless Communication Systems [16.4] グラントフリー伝送とセルフリー通信は、大規模機械型通信のカバレッジと品質向上に不可欠である。
本稿では,セルフリー無線通信システムにおける大規模許可不要伝送のための,共同アクティブユーザ検出,チャネル推定,データ検出(JACD)の新たな枠組みを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:04:10 GMT)
SPPD: Self-training with Process Preference Learning Using Dynamic Value Margin [16.3] 我々はtextbfDynamic value margin (SPPD) を用いた textbfProcess textbfPreference Learning を統合した textbfSelf-training フレームワークを提案する。
7Bスケールモデルの実験は、ドメイン内およびドメイン外の数学ベンチマークで優れた性能を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:11:26 GMT)
Explorer: Scaling Exploration-driven Web Trajectory Synthesis for Multimodal Web Agents [16.2] 我々は,これまでで最大かつ最も多様な軌跡レベルのデータセットを合成するスケーラブルなレシピを開発した。
このデータセットには、49KのユニークなURL、720Kのスクリーンショット、3300万のWeb要素を含む、94K以上の成功したマルチモーダルWebトラジェクトリが含まれている。
我々は、Mind2Web-Live、Multimodal-Mind2Web、MiniWob++のようなオフラインおよびオンライン両方のWebエージェントベンチマークで強力なパフォーマンスを示します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:38:06 GMT)
A Training-Free Framework for Precise Mobile Manipulation of Small Everyday Objects [16.0] 我々は,小型物体の操作を伴う精密な作業にモバイルマニピュレータが取り組むことができるクローズドループトレーニングフリーフレームワークを開発した。
SVMはRGB-D手首カメラを使用し、制御にビジュアルサーボを使用する。
オープンボキャブラリオブジェクト検出器は,セマンティックターゲットを識別するためのドロップインモジュールとして機能することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:59:17 GMT)
Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection [15.9] **Glimpse**は確率分布推定手法であり、部分的な観測から全分布を予測する。
Intropy, Rank, Log-Rank, Fast-DetectGPTといったホワイトボックスメソッドを最新のプロプライエタリなモデルに拡張します。
実験の結果、Glimpse with Fast-DetectGPT と GPT-3.5 は、5つの最新のソースモデルで平均 0.95 の AUROC を達成することが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:37:55 GMT)
Are generative models fair? A study of racial bias in dermatological image generation [15.8] 臨床皮膚学における生成モデルの妥当性を,人種的偏見から評価した。
Fitzpatrick17kデータセットを用いて、人種的バイアスがこれらのモデルの表現と性能にどのように影響するかを調べる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:53:04 GMT)
ConFit v2: Improving Resume-Job Matching using Hypothetical Resume Embedding and Runner-Up Hard-Negative Mining [15.6] ConFit v2は、分散問題に対処するためのConFitの改善である。
本稿では,エンコーダのコントラスト学習プロセスを強化するための2つの手法を提案する。
実世界の2つのデータセット上でConFit v2を評価し、ConFitおよび先行手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:18:31 GMT)
GneissWeb: Preparing High Quality Data for LLMs at Scale [15.6] GneissWebは10兆トークンの巨大なデータセットです。
GneissWebはデータ品質と量の間の良好なトレードオフを達成する。
我々は、GneissWebデータセットを使用してトレーニングされたモデルが、FineWeb-V1.1.0でトレーニングされたモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:14:29 GMT)
Mitigating Heterogeneity among Factor Tensors via Lie Group Manifolds for Tensor Decomposition Based Temporal Knowledge Graph Embedding [15.6] 我々は、因子テンソルを統一滑らかなリー群多様体に写像し、因子テンソルの分布をテンソル分解において均一に近似させる新しい方法を提案する。
提案手法は, 余分なパラメータを導入することなく, 既存のテンソル分解に基づくTKGE法に直接統合することができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:11:50 GMT)
The Impact of Inference Acceleration on Bias of LLMs [15.4] モデル生成における推定加速度最適化による人口統計バイアスについて検討する。
加速度戦略とバイアスタイプの組み合わせは、あるモデルではバイアスの変化が少ないが、別のモデルでは大きな影響をもたらす可能性がある。
この結果から,モデルバイアスの深度・ケースバイケース評価の必要性が示唆された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:10:09 GMT)
REFIND: Retrieval-Augmented Factuality Hallucination Detection in Large Language Models [15.4] 大規模言語モデル(LLM)における幻覚は、質問応答のような知識集約的なタスクにおいて、その信頼性を著しく制限する。
本稿では, 抽出した文書を直接利用して, LLM出力内のハロゲン化スパンを検出する新しいフレームワークREFINDを紹介する。
REFINDは低リソース設定を含む9つの言語で堅牢性を示し、ベースラインモデルではかなり優れていた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:59:05 GMT)
Continually Learning Structured Visual Representations via Network Refinement with Rerelation [15.4] 現在の機械学習パラダイムは、ニューラルネットワークのような連続的な表現に依存しており、パラメータを近似結果に反復的に調整する。
構造化された連続的な方法で視覚空間を学習する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:18:27 GMT)
Rankify: A Comprehensive Python Toolkit for Retrieval, Re-Ranking, and Retrieval-Augmented Generation [15.3] Rankifyはオープンソースのツールキットで、検索、再ランク付け、RAGをコヒーシブなフレームワーク内で統一するように設計されている。
厳密でスパースなリトリーバーを含む幅広い検索技術をサポートし、最先端のリグレードモデルも備えている。
Rankifyには、Huggingfaceで利用可能なベンチマークを容易にするために、検索済みのデータセットのコレクションが含まれている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:46:25 GMT)
Chasing the Timber Trail: Machine Learning to Reveal Harvest Location Misrepresentation [15.2] 不法伐採は、世界の生物多様性、気候安定に重大な脅威をもたらし、合法的な木材の収穫と責任ある森林製品貿易の国際価格を抑えている。
ここでは,木材の収穫場所を決定するために,同位体値と大気変数を併用した機械学習パイプラインの結果について述べる。
当社のパイプラインは欧州の機関によって、違法なロシアとベラルーシの木材がEU市場に入るのを識別するために使われてきました。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:34:08 GMT)
Semi-supervised Fine-tuning for Large Language Models [14.8] 半教師付き微調整(SemiFT)タスクと,LLMアライメントのためのSemiEvolというフレームワークを導入する。
知識伝播のために、SemiEvolは2段階のアプローチを採用し、ラベル付きデータからラベルなしデータへ知識を伝播する。
知識選択のために、SemiEvolは、高品質な擬応答サンプルを選択する協調学習機構を組み込んでいる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:32:29 GMT)
Mitigating Hallucinations in Large Vision-Language Models via Summary-Guided Decoding [14.7] LVLM(Large Vision-Language Models)は、視覚入力から詳細でコヒーレントな応答を生成する。
言語に対する依存度が高すぎるため、幻覚を起こす傾向にある。
そこで我々は,SumGD (Slide-Guided Decoding) という新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:41:03 GMT)
Vision-Based Generic Potential Function for Policy Alignment in Multi-Agent Reinforcement Learning [14.7] 本稿では,人間共通の感覚に合わせた強化学習の方針を導出するための階層的視覚に基づく報酬形成手法を提案する。
ポリシーが不確実性と長期タスクの変化に適応するのを助けるため、トップレイヤは適応的なスキル選択モジュールを備えている。
提案手法は高い勝利率を達成し,その政策を人間の常識と効果的に整合させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:04:10 GMT)
Which of These Best Describes Multiple Choice Evaluation with LLMs? A) Forced B) Flawed C) Fixable D) All of the Above [14.6] 複数の選択質問応答(MCQA)は、単純さと人間らしいテストのため、LCMの評価に人気がある。
1) テスト生成/サブジェクティビティ,2) LLM のユースケースにマッチする,3) 完全なテスト知識。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:11:52 GMT)
Rate, Explain and Cite (REC): Enhanced Explanation and Attribution in Automatic Evaluation by Large Language Models [14.4] 本稿では,REC-8B,REC-12B,REC-70Bの3種類の汎用LDM自動評価器を紹介する。
それらは、忠実性、指示従順性、一貫性、完全性など、様々な次元で生成されたテキストを評価するように設計されている。
我々の汎用LCM自動評価装置REC-70Bは、より優れた品質説明と最小バイアスによる引用を提供することで、コンテンツ評価に優れ、最先端LCMよりも優れています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:50:10 GMT)
Aligned Multi Objective Optimization [14.3] 機械学習の実践では、このような衝突が起こらないシナリオが数多く存在する。
近年のマルチタスク学習,強化学習,LLMsトレーニングの成果から,多種多様な関連タスクが,目的物間のパフォーマンスを同時に向上する可能性が示唆された。
我々は、アラインド多目的最適化フレームワークを導入し、この設定のための新しいアルゴリズムを提案し、それらの優れた性能の理論的保証を提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:50:03 GMT)
Reinforcement Learning-based Receding Horizon Control using Adaptive Control Barrier Functions for Safety-Critical Systems [14.2] 最適制御法は、安全クリティカルな問題に対する解決策を提供するが、容易に難解になる。
モデル予測制御を利用した強化学習に基づく回帰水平制御手法を提案する。
我々は、コネクテッド・アンド・オートマチック・ビークルにおける自動マージ制御問題に適用し、本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:37:14 GMT)
Is your benchmark truly adversarial? AdvScore: Evaluating Human-Grounded Adversarialness [14.1] 敵対的なデータセットは、人間がうまく機能するサンプルを提供することで、AIの堅牢性を検証するべきである。
本稿では,データセットの逆さを評価する人為的評価指標であるAdvScoreを提案する。
私たちはAdvScoreを使って、現実的で高品質な逆数サンプルのための新しいデータセット生成パイプラインを動機付けています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:56:29 GMT)
Why Safeguarded Ships Run Aground? Aligned Large Language Models' Safety Mechanisms Tend to Be Anchored in The Template Region [14.0] テンプレートアンコレッド型安全アライメントは,多種多様な大言語モデル(LLM)にまたがっていることを示す。
我々の力学解析は、推論時ジェイルブレイク攻撃に遭遇した場合、モデルがどのような影響を受けやすいかを示す。
テンプレート領域から安全メカニズムを分離することで,脆弱性の軽減と脱獄攻撃が期待できることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:42:45 GMT)
Value Residual Learning [13.9] 本稿では,ResFormerについて紹介する。ResFormerは値残差接続を組み込むことで情報フローを向上させるアーキテクチャである。
モデルパラメータが13.3%減少し、Transformerに比べてトレーニングデータが15.4%減少している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:53:11 GMT)
Multimodal Fake News Video Explanation Generation: Dataset, Model, and Evaluation [13.8] 本稿では,ニュースビデオの虚偽を明らかにする自然言語説明を生成するための新しいタスクFake News Video Explanation (FNVE)を提案する。
OnVEとVTSEは、偽ニュースビデオの投稿を説明するための2つの新しいデータセットである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:02:50 GMT)
JL1-CD: A New Benchmark for Remote Sensing Change Detection and a Robust Multi-Teacher Knowledge Distillation Framework [13.7] JL1-CDデータセットは512×512ピクセルの5000対の画像を0.5から0.75メートルの解像度で格納する。
また,CDのためのマルチ教師知識蒸留(MTKD)フレームワークを提案する。
JL1-CDとSYSU-CDデータセットの実験結果は、MTKDフレームワークがCDモデルの性能を大幅に改善することを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:33:54 GMT)
Spiking Point Transformer for Point Cloud Classification [13.7] Spiking Point Transformer (SPT)は、ポイントクラウド分類のためのトランスフォーマーベースのSNNフレームワークである。
SPTは、SNNドメイン内の実世界のデータセットと合成データセットの両方にまたがる3つのベンチマークデータセットに対して、最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:28:55 GMT)
D.Va: Validate Your Demonstration First Before You Use It [13.6] In-context Learning (ICL) は、推論中に大きな言語モデル(LLM)の能力を増強する大きな可能性を証明している。
従来のアプローチは、デモの有効性を評価するために直感的なメトリクスを頼りにしてきた。
本稿では,この分野に実証検証の視点を取り入れた新しい手法である textbfD.Va を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:41:40 GMT)
Brain age identification from diffusion MRI synergistically predicts neurodegenerative disease [13.5] 本稿では,モデルによるマクロ構造情報の利用を緩和する,dMRIによる脳年齢同定手法を提案する。
我々は、dMRIベースの脳年齢とT1w MRIベースの脳年齢の違いを神経変性の段階で観察した。
dMRIベースの脳年齢は、診断の最大5年前までのCNからMCIへの移行を予測する際に、T1w MRIベースの脳年齢よりも有利である可能性がある。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:45:35 GMT)
Theoretical Physics Benchmark (TPBench) -- a Dataset and Study of AI Reasoning Capabilities in Theoretical Physics [13.5] 我々は、高エネルギー理論と宇宙論に焦点をあて、理論物理学における問題を解決するAIの能力を評価するためのベンチマークを導入する。
ベンチマークの最初のイテレーションは、学部レベルから研究レベルまで、難易度が異なる57の問題で構成されています。
我々は、o3-mini、o1、DeepSeek-R1、GPT-4o、LlamaとQwenのバージョンなど、オープンでクローズドな言語モデルでデータセットを評価した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:00:00 GMT)
Na'vi or Knave: Jailbreaking Language Models via Metaphorical Avatars [13.5] 本稿では,大規模言語モデル(LLM)の想像能力を利用してジェイルブレイクを実現する新たな攻撃フレームワークを提案する。
特に、AVATARは、与えられた有害な標的から有害な物質を抽出し、無害な敵性物質にマッピングする。
その結果, AVATAR は脱獄性 LLM を効果的に導入し, 最先端の攻撃成功率を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:09:15 GMT)
Unsupervised CP-UNet Framework for Denoising DAS Data with Decay Noise [13.5] 分散音響センサ(DAS)技術は光ファイバーケーブルを利用して音響信号を検出する。
DASは、ジオフォンよりも低い信号対雑音比(S/N)を示す。
これにより、S/Nの低減は、反転と解釈を含むデータ解析に悪影響を及ぼす。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:09:49 GMT)
Optimistically Optimistic Exploration for Provably Efficient Infinite-Horizon Reinforcement and Imitation Learning [13.4] 無限水平割引線形マルコフ決定過程において, ほぼ最適後悔の保証を実現するための計算効率のよいアルゴリズムを提案する。
正規化された近似的動的プログラミングスキームと組み合わせると、結果のアルゴリズムは、$tildemathcalO (sqrtd3 (1 - gamma)- 7 / 2 T)$, $T$ はサンプル遷移の総数、$gamma in (0,1)$ は割引係数、$d$ は特徴次元を後悔する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:32:35 GMT)
Capturing Rich Behavior Representations: A Dynamic Action Semantic-Aware Graph Transformer for Video Captioning [13.4] 既存のビデオキャプション手法は、単にオブジェクトの振舞いの浅いあるいは単純化した表現を提供するだけである。
本稿では,オブジェクトの振る舞いの本質を包括的に把握する動的アクション意味認識グラフ変換器を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:16:47 GMT)
Using Graph Convolutional Networks to Address fMRI Small Data Problems [13.2] グラフニューラルネットワークを用いた医用画像の小さなデータ問題からの学習に対処する。
本稿では,接続データのスペクトル表現が効率的な伝搬を実現する方法を示す。
本手法の優れた性能は、三角形の不等式を閉じることによって測定できるデータ平滑化結果によるものである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:05:46 GMT)
Adaptive Random Testing with Q-grams: The Illusion Comes True [13.2] 我々は、ペアワイズ距離計算を過去の実行のコンパクトアグリゲーションに置き換える、適応的ランダムテストのための新しいフレームワークを提案する。
実験の結果、平均してq-gramのARTはランダムテストの4倍、ARTの3.5倍のターゲットをカバーしていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:37:46 GMT)
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning [13.2] オフラインの強化学習では、価値関数の過大評価を防ぐために、配布外動作を管理する必要がある。
拡散雑音回帰問題としてクルバック・リブラー (KL) 制約ポリシーの繰り返しを定式化する拡散アクタ・クリティカル (DAC) を提案する。
提案手法はD4RLベンチマークで評価され,ほぼすべての環境において最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:35:05 GMT)
PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation [13.1] 本稿では,この課題に対処するため,PoGDiffと呼ばれる汎用的な微調整手法を提案する。
実世界のデータセットを用いた実験により,拡散モデルにおける不均衡問題に効果的に対処できることが示されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:18:04 GMT)
Animate Your Thoughts: Decoupled Reconstruction of Dynamic Natural Vision from Slow Brain Activity [13.0] 脳活動から人間のダイナミックビジョンを再構築する2段階モデルMind-Animatorを提案する。
fMRIの段階では,fMRIから意味的,構造的,運動的特徴を分離する。
機能とビデオの段階では、これらの機能はインフレータブル拡散(Stable Diffusion)を使ってビデオに統合される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:02:08 GMT)
FantasyID: Face Knowledge Enhanced ID-Preserving Video Generation [12.9] 拡散変換器(DiT)上に構築された事前学習ビデオモデルの顔知識を強化することで、新しいチューニング不要なPT2Vフレームワークを提案する。
本研究では拡散変圧器(DiT)上に構築された事前学習ビデオモデルの顔知識を強化することで、新しいチューニング不要なPT2Vフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:50:27 GMT)
A Query-Driven Approach to Space-Efficient Range Searching [12.8] クエリのほぼ直線的なサンプルは、クエリ中に訪れたノード数がほぼ最適であるパーティションツリーを構築することができることを示す。
我々は、ノード処理を分類問題として扱い、浅いニューラルネットワークのような高速な分類器を活用して、実験的に効率的なクエリ時間を得ることにより、このアプローチを強化する。
我々のアルゴリズムは,クエリのサンプルに基づいて,セパレータに関連付けられたノードを持つバランスのとれたツリーを構築し,クエリの待ち行列を最小化する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:01:00 GMT)
Evaluation for Regression Analyses on Evolving Data Streams [12.7] 進化するデータストリームにおける回帰分析の課題について考察する。
本稿では,ストリーミング環境における回帰と予測間隔タスクの標準化された評価プロセスを提案する。
様々なドリフトタイプを合成できる革新的なドリフトシミュレーション戦略を導入する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:03:33 GMT)
MRS: A Fast Sampler for Mean Reverting Diffusion based on ODE and SDE Solvers [12.6] 平均回帰(MR)拡散は微分方程式(SDE)の構造を直接修飾する
現在のトレーニングフリーの高速サンプリング器はMR拡散には直接適用されない。
MR拡散のサンプリングNFEを削減するため, MRS (MR Sampler) という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:22:54 GMT)
Conditional sampling within generative diffusion models [12.6] 生成拡散モデルにおける条件付きサンプリングに対する既存の計算手法について概説する。
共同分布を利用するか、あるいは明示的な可能性を持つ(事前訓練された)境界分布に依存する重要な手法を強調します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:55:45 GMT)
A Cognitive Writing Perspective for Constrained Long-Form Text Generation [12.4] 大きな言語モデル(LLM)は、1回のパスで厳格な要求に従う高品質の長文を生成するのに苦労する。
認知の原則によって動機づけられた私たちは,CagWriterを通じて,人間のような認知書記能力を備えたLLMの実現を目指しています。
本フレームワークは,(1)タスクを分解する階層的計画を実行する計画エージェントと,(2)これらの計画を並列に実行する複数の生成エージェントの2つの主要なモジュールから構成される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:58:13 GMT)
Reflection of Episodes: Learning to Play Game from Expert and Self Experiences [12.4] 本稿では,専門家の経験と自己経験に基づくROE(Reflection of Episodes)フレームワークを提案する。
実験では,TextStarCraft IIにおける極めて難易度の高い条件下で,本手法がロボットを圧倒した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:53:43 GMT)
Tight Generalization Bounds for Large-Margin Halfspaces [12.3] 与えられたマージン間のトレードオフ、与えられたマージンを持つトレーニングポイントの分数、失敗確率、トレーニングポイントの個数に非常に密接な大マージンハーフスペースに対する最初の一般化を証明した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:04:49 GMT)
An Efficient Permutation-Based Kernel Two-Sample Test [12.3] 2サンプル仮説テストは統計学と機械学習の基本的な問題である。
本研究では,最大平均誤差(MMD)のNystr "om approxation"を用いて,計算効率よく実用的なテストアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:22:48 GMT)
Towards a Learning Theory of Representation Alignment [12.2] 表現アライメントに対する学習理論的な視点を提案する。
この結果は, 表現アライメントを学習理論問題としてキャストする第一歩と見なすことができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:09:14 GMT)
In-Place Updates of a Graph Index for Streaming Approximate Nearest Neighbor Search [12.1] IP-DiskANNは,挿入処理と削除処理を効率よく行うことにより,バッチ統合を回避する最初のアルゴリズムである。
ハイリコールとローリコールの両方で、様々な長い更新パターンに対して安定したリコールを行う。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:41:08 GMT)
Integration of Agentic AI with 6G Networks for Mission-Critical Applications: Use-case and Challenges [12.0] Agentic AI(AAI)は最近、コンテキストレンズを通じてテキストデータを分析できることから、多くの注目を集めている。
本稿では,AAIを実現するために,多層アーキテクチャを用いた新しいフレームワークを提案する。
予備分析の結果、AAIは最初の応答時間を平均5.6分短縮した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:00:53 GMT)
Scalable Decentralized Algorithms for Online Personalized Mean Estimation [12.0] 本研究は,各エージェントが実数値分布からサンプルを収集し,その平均値を推定する,オーバーアーキシング問題の簡易版に焦点を当てた。
1つは信念の伝播からインスピレーションを得ており、もう1つはコンセンサスに基づくアプローチを採用している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:36:58 GMT)
Reliability Across Parametric and External Knowledge: Understanding Knowledge Handling in LLMs [11.9] 大規模言語モデル(LLM)はパラメトリックと外部の知識を活用することで問題解決能力を高める。
本稿では,パラメトリック知識の存在と外部知識の情報性という2つの重要な側面に基づいて,知識処理を解析するための枠組みを提案する。
知識処理シナリオに基づいて構築されたデータによるトレーニングは、知識の統合と活用におけるLLMの信頼性を向上させることを実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:49:23 GMT)
Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks [11.8] 高速な動的タスクのための教師付き学習フレームワークである生成予測制御を導入する。
トレーニングされたフローマッチングポリシが実行時にウォームスタートし,時間的一貫性を維持し,迅速なフィードバック率を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:33:01 GMT)
ExoMiner++ on TESS with Transfer Learning from Kepler: Transit Classification and Vetting Catalog for 2-min Data [11.8] 2分間のTESSデータにおけるトランジット信号の分類を改善するために,ExoMinerの成功に基づく強化されたディープラーニングモデルを提案する。
ExoMiner++には、周期図、フラックストレンド、差画像、展開されたフラックス、宇宙船の姿勢制御データなど、追加の診断入力が含まれている。
本研究では,ExoMiner++の分類と各トランジット信号に対する信頼性スコアを含む新しいTESSカタログを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:42:32 GMT)
Learning from Committee: Reasoning Distillation from a Mixture of Teachers with Peer-Review [11.8] ピアリビュー(FAIR)アプローチによる新しいフォールト・アウェア・ディストイレーション(Fact-Aware DistIllation)を導入する。
本手法は,教師から合理性を得るのではなく,教師に生徒の過ちを特定・説明するよう求めている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:34:19 GMT)
I Want 'Em All (At Once) -- Ultrametric Cluster Hierarchies [11.7] 任意の合理的な階層に対して、中心的なクラスタリングの目的を最適に解決できることを示します。
我々は、データセット、階層、パーティショニングスキームにまたがる提案手法の有用性を検証することで結論付ける。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:03:52 GMT)
MaskPrune: Mask-based LLM Pruning for Layer-wise Uniform Structures [11.7] 本稿では,ミニマックス最適化に基づく新しいマスキング学習パラダイムを提案する。
本手法は, プレナードモデル構造の均一性を確保しつつ高い性能を維持することができ, 既存のSOTA法よりも優れる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:57:31 GMT)
Don't Stop the Multi-Party! On Generating Synthetic Multi-Party Conversations with Constraints [11.6] マルチパーティ会話(MPC)は、ソーシャルメディアを主要なデータソースとして、そのアクセシビリティのために広く研究されている。
本研究は,命令調整型大規模言語モデルを用いた多種多様なMPC生成の実現可能性について検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:10:43 GMT)
New Lower Bounds for Stochastic Non-Convex Optimization through Divergence Composition [11.5] L-凸性(QC)、擬似成長(SmoothQG)、制限不等式(RSI)などの非次元設定における一階最適化の基本的限界を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:21:00 GMT)
Mixup Regularization: A Probabilistic Perspective [11.5] 本稿では,確率的融合に基づく混合正規化のための新しいフレームワークを提案する。
指数族にしたがって分布するデータに対して、可能性関数は解析的に融合可能であることを示す。
本稿では,ニューラルネットワークの任意の中間層における入力の融合を可能にする確率的ミックスアップの拡張を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:39:14 GMT)
AnDB: Breaking Boundaries with an AI-Native Database for Universal Semantic Analysis [11.4] AnDBはAIネイティブデータベースで、従来のOワークロードとAI駆動タスクをサポートする。
AnDBでは、AIの専門知識を必要とせずに、直感的なステートメントを使用してセマンティッククエリを実行することができる。
AnDBは将来的なデータ管理インフラストラクチャを保護し、スクラッチから始めることなく、すべての種類のデータの全潜在能力を効果的かつ効率的に活用することを可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:15:59 GMT)
Identifying metric structures of deep latent variable models [11.4] 深い潜伏変数モデルは、研究された現象の内部の働きを反映したデータの凝縮表現を学習する。
現在のソリューションは、潜在変数モデルに対する追加の制約を通じて、識別可能性の欠如を制限する。
私たちは目的を変える:潜伏変数を識別する代わりに、それらの間の関係を識別する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:20:28 GMT)
Joint Fine-tuning and Conversion of Pretrained Speech and Language Models towards Linear Complexity [11.3] 本稿では,変換器モデルを線形時間置換器に変換し,目標タスクに微調整するクロスアーキテクチャ層蒸留(CALD)手法を提案する。
そこで本研究では,CALDが元のモデルの結果を効果的に回収できることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:08:42 GMT)
A Mousetrap: Fooling Large Reasoning Models for Jailbreak with Chain of Iterative Chaos [11.3] Large Reasoning Models (LRM) は従来のLarge Language Models (LLM) よりも大幅に進歩している。
LRMを標的とした最初のジェイルブレイク攻撃を提案する。
具体的には、多様な1対1マッピングで攻撃プロンプトを変換する新しいコンポーネントであるChaos Machineを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:23:36 GMT)
FairKV: Balancing Per-Head KV Cache for Fast Multi-GPU Inference [11.1] TransformerモデルにおけるKVキャッシュ技術は、メモリ使用量を大幅に増加させ、冗長な計算を減らすことを目的としている。
近年、最先端のKVキャッシュ圧縮手法では、各アテンションヘッドのKVキャッシュ予算を動的に調整する不均衡なヘッドアロケーションアルゴリズムが実装されている。
本研究では,不均衡なKVキャッシュ圧縮を用いたシステムにおいて,アテンションヘッド間のメモリ使用量を確保するためのFair KVを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:14:27 GMT)
Causal Concept Graph Models: Beyond Causal Opacity in Deep Learning [11.1] 因果不透明性(英: Causal opacity)とは、ディープニューラルネットワーク(DNN)モデルの決定の根底にある「隠れた」因果構造を理解することの難しさを指す。
この研究は、因果概念グラフモデル(Causal Concept Graph Models, Causal CGMs)を導入している。
実験の結果, (i) 因果不透明モデルの一般化性能に一致し, (ii) ループ内修正を誤予測中間推論ステップに適用し, (iii) 介入シナリオと反事実シナリオの分析を支援することができた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:46:29 GMT)
Optimizing Gene-Based Testing for Antibiotic Resistance Prediction [11.1] 抗生物質耐性 (AR) は、費用対効果、効率、正確な診断ツールの開発を必要とする重要な世界的な健康問題である。
ARの遺伝的基盤から、特定の抵抗性遺伝子を標的とするPCR(PCR)のような技術は、予測診断に有望なアプローチを提供する。
この研究は、PCR遺伝子テストの選択を最適化し、AR予測を改善するために、強化学習(RL)とトランスフォーマーベースのモデルを統合する新しいフレームワークであるGenoARMを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:34:03 GMT)
Towards Semantic Versioning of Open Pre-trained Language Model Releases on Hugging Face [11.0] モデルレジストリプラットフォームにおけるPTLMの現在のリリースプラクティスは、さまざまな不整合に悩まされています。
本研究は,52,227個のPTLMを,最もよく知られたモデルレジストリHF上でリリースするための混合手法を用いて解析する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:13:37 GMT)
The First Early Evidence of the Use of Browser Fingerprinting for Online Tracking [11.0] オンライン広告の領域におけるブラウザフィンガープリントの利用に関する懸念の高まりに対処することが不可欠である。
本稿では,ブラウザのフィンガープリント調整による広告変化を分析し,フィンガープリントに基づくユーザトラッキングを評価するフレームワークであるFPTraceを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:34:29 GMT)
Dataset Distillation via Knowledge Distillation: Towards Efficient Self-Supervised Pre-Training of Deep Networks [10.9] SSL事前トレーニングのための最初の有効なDD法を提案する。
具体的には、SSLでトレーニングされたより大きな教師モデルの表現に合わせるために、小さな学生モデルを訓練する。
KDの目的はSSLよりもかなり分散度が低いため、我々の手法は、高品質エンコーダの事前訓練に成功できる合成データセットを生成することができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:39:00 GMT)
A Large and Balanced Corpus for Fine-grained Arabic Readability Assessment [10.9] 本稿では,バランスドアラビア可読性評価コーパスBARECを紹介する。
BARECは、100万語を超える68,182の文で構成され、19の可読性レベルをカバーするために慎重にキュレートされている。
コーパスは、アノテーターの大規模なチームによって手動で注釈付けされた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:16:11 GMT)
Universal Semantic Embeddings of Chemical Elements for Enhanced Materials Inference and Discovery [10.8] 本稿では, 化学元素の普遍的なセマンティック埋め込みを創出し, 材料推論と発見を推し進める枠組みを提案する。
このフレームワークは、ドメイン固有のBERTベースの自然言語処理モデルであるElementBERTを利用する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:26:03 GMT)
Learning from End User Data with Shuffled Differential Privacy over Kernel Densities [10.8] エンドユーザに分散したプライベートデータから収集と学習を行う環境について検討する。
差分プライバシーのシャッフルモデルでは、エンドユーザーは共有する前に部分的にデータをローカルに保護する。
我々の主な技術的成果は、分散データセットのカーネル密度関数をプライベートに推定するシャッフルDPプロトコルである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:27:01 GMT)
RSNet: A Light Framework for The Detection of Multi-scale Remote Sensing Targets [10.7] RSNetは、SAR画像における船舶検出を強化する軽量フレームワークである。
Waveletpool-ContextGuided (WCG)は、グローバルなコンテキスト理解を導くバックボーンである。
ウェーブレットプール・スターフュージョン (WSF) は、残っているウェーブレット要素の乗算構造を用いてネックとして導入された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:13:25 GMT)
Rethinking Self-Distillation: Label Averaging and Enhanced Soft Label Refinement with Partial Labels [10.7] マルチラウンド自己蒸留は,高い特徴相関を持つインスタンス間のラベル平均化を効果的に行う。
教師の最上位2つのソフトマックス出力の精巧な部分ラベルを用いた,新規で効率的なシングルラウンド自己蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:04:02 GMT)
AutoParLLM: GNN-guided Context Generation for Zero-Shot Code Parallelization using LLMs [10.6] 我々の研究は、グラフニューラルネットワーク(GNN)からのガイダンスを用いて、効率的な並列コードを生成する新しい方法である ourtool を提案する。
ourtool xspace は最先端の LLM を NAS で19.9%、Rodinia ベンチマークで6.48% 改善し、並列コード生成のタスクに CodeBERTScore を使用する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:30:19 GMT)
What Skills Do Cyber Security Professionals Need? [10.6] サイバー攻撃の増加により、組織に対するサイバーセキュリティの重要性が高まっている。
多くの個人がサイバーセキュリティの分野に参入しようとしています。
しかし、この分野でのキャリアを成功させるために必要なスキルについて、明確な理解が欠如している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:10:53 GMT)
Detecting LLM Fact-conflicting Hallucinations Enhanced by Temporal-logic-based Reasoning [10.6] Drowzeeは、大規模言語モデルのためのエンドツーエンドのメタモルフィックテストフレームワークである。
時相論理を用いて、大規模な言語モデルにおけるファクト・コンフリクト・幻覚(FCH)を識別する。
その結果、ドロージーは24.7%から59.8%までの非時間関連幻覚率と16.7%から39.2%の時間関連幻覚率を効果的に同定した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:21:46 GMT)
Enhancing Chest X-ray Classification through Knowledge Injection in Cross-Modality Learning [10.6] 本研究では,学習過程に医学的知識を明示的に注入することが,モダリティ間分類の性能に与える影響について検討した。
本稿では,CXR画像のキャプションを制御可能な知識粒度で生成する,集合論に基づく新しい知識注入フレームワークを提案する。
その結果, 微粒な医療知識を注入することで分類精度が向上し, 人為的キャプションを用いた場合の72.5%と49.9%を比較した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:45:56 GMT)
Multiview Equivariance Improves 3D Correspondence Understanding with Minimal Feature Finetuning [10.5] 我々は、VTベースのモデルの3次元認識を評価し、強化する。
本稿では,3次元対応に基づく簡易かつ効果的なファインタニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:16:27 GMT)
Modeling Behavior Change for Multi-model At-Risk Students Early Prediction (extended version) [10.4] 現在のモデルは、単純かつ離散的な行動パターンを通じて、一貫してパフォーマンスの悪い学生を識別する。
我々は,中学校の教師の発言データと数値グレードデータを利用した,革新的な予測モデルであるMultimodal-ChangePoint Detection (MCPD)を開発した。
本モデルでは,ベースラインアルゴリズムの平均性能を約5~10%向上させるとともに,70~75%の精度範囲を達成している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:16:46 GMT)
Bridging Adaptivity and Safety: Learning Agile Collision-Free Locomotion Across Varied Physics [10.4] BAS(Bridging Adaptivity and Safety)は、不確実性のある動的環境においても適応的な安全性を提供するように設計されている。
本研究では,BASが平均速度を維持しながら,動的環境におけるベースラインよりも50%高い安全性を実現することを示す。
その結果、BASは19.8%の速度向上を実現し、現実のABSの2.36倍の速度で衝突する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:13:51 GMT)
Reverse Markov Learning: Multi-Step Generative Models for Complex Distributions [10.2] 複雑な分布を学習する能力を向上させるために、エングレスを拡張します。
本稿では,対象の分布から既知の分布へ遷移する一般的なフォワードプロセスを定義するフレームワークを提案する。
この逆工程は、目標分布を段階的に再構成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:10:15 GMT)
Dialogue Language Model with Large-Scale Persona Data Engineering [10.2] PPDSはオープンドメインのペルソナ対話システムであり、ペルソナの一貫性を高めるためにペルソナ対話データセットに広範囲な生成前トレーニングを利用する。
本研究では,自律的かつ高精度な対話データセット生成を目的としたペルソナ抽出モデルを提案する。
また、構築されたデータセットに固有の無効なペルソナバイアスに対処するために、先駆的なペルソナ拡張手法を公表した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:08:06 GMT)
ME-CPT: Multi-Task Enhanced Cross-Temporal Point Transformer for Urban 3D Change Detection [10.2] 多時間ALS点雲を利用することで、都市部の意味的変化を捉えることができる。
既存の3D変化検出手法では,マルチクラスの意味情報や変化特徴を効率的に抽出することが困難である。
本稿では,Multi-task Enhanced Cross-temporal Point Transformer (ME-CPT) ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:03:35 GMT)
Unsupervised Graph Embeddings for Session-based Recommendation with Item Features [10.1] セッションベースのレコメンデーションシステムでは、予測はセッションにおけるユーザの前の振る舞いに基づいて行われる。
本稿では,グラフ表現にアイテム機能を直接組み込んだ新しいグラフ畳み込みネットワーク拡張法(GCNext)を提案する。
我々の柔軟な拡張は最先端のメソッドに簡単に組み込むことができ、MRR@20を最大12.79%向上させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:23:18 GMT)
PRIV-QA: Privacy-Preserving Question Answering for Cloud Large Language Models [10.1] 本稿では,ユーザと大規模言語モデル間のインタラクションにおいて,プライバシとセンシティブな情報を保護するためのプライバシ保護パイプラインを提案する。
プライバシを開放した最初の質問応答データセットであるSensitiveQAを構築した。
提案手法は,クラウド上でのLCMの応答品質を同時に保ちながら,ユーザ情報の事前確保を目的としたマルチステージ戦略を用いている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:17:07 GMT)
Identifying Bug Inducing Commits by Combining Fault Localisation and Code Change Histories [10.0] BIC(Bug Inducing Commit)は、コミットにバグを導入するコード変更である。
我々は、最近修正されたコード要素がある場合、コミットがBICになる可能性が高いというコア概念でBICを識別することを目的としたFonteと呼ばれるテクニックを提案する。
フォンテは最先端のBIC識別技術を大きく上回り、最大45.8%のMRRを達成している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:03:37 GMT)
Reducing Hallucinations in Language Model-based SPARQL Query Generation Using Post-Generation Memory Retrieval [9.9] 大型言語モデル (LLM) は、KG要素の生成時に幻覚や分布外誤差に感受性がある。
この結果、このような誤りの検出と緩和を目的とした研究が増加している。
本稿では,非パラメトリックメモリモジュールを組み込んだ KG 要素検索用モジュール PGMR を紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:08:13 GMT)
Bridging the Editing Gap in LLMs: FineEdit for Precise and Targeted Text Modifications [9.8] 大規模言語モデル(LLM)は自然言語処理に変化をもたらしたが、直接テキスト編集タスクに苦戦している。
本研究では,LLM編集性能を向上させるための2つのアプローチを提案する。
まず、20,000以上の構造化編集タスクからなる高品質なベンチマークデータセットであるInstrEditBenchを紹介する。
第2に、このキュレートされたベンチマークで訓練された特殊なモデルであるFineEditを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:41:44 GMT)
CoRRECT: A Deep Unfolding Framework for Motion-Corrected Quantitative R2* Mapping [9.8] CoRRECTは、定量的MRI(qMRI)のための統合深部展開(DU)フレームワークである
モデルベースのエンドツーエンドニューラルネットワーク、モーションアーティファクトリダクションの方法、自己教師型学習スキームで構成されている。
実験で収集したmGRE(Multi-Gradient-Recalled Echo) MRIデータから,CoRRECTは高速な取得設定で動きと不均一なアーチファクトのないR2*マップを復元することを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:45:36 GMT)
Generalization bounds for mixing processes via delayed online-to-PAC conversions [9.8] 統計的学習アルゴリズムの一般化誤差を非i.d.設定で検討する。
我々は,遅延フィードバックによるオンライン学習の削減に基づく,このシナリオの分析フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:17:33 GMT)
MoM: Linear Sequence Modeling with Mixture-of-Memories [9.7] 我々はMixture-of-Memories (MoM)と呼ばれる新しいアーキテクチャを導入する。
MoMは複数の独立したメモリ状態を利用し、ルータネットワークは入力トークンを特定のメモリ状態に誘導する。
MoMは、既存の線形シーケンスモデリング技術を超え、リコール集約タスクにおいて非常によく機能する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:53:55 GMT)
C2T: A Classifier-Based Tree Construction Method in Speculative Decoding [9.7] 投機的復号法は、しばしばトークンツリーの構築や候補トークンの検証において非効率に直面する。
トークンツリーを動的に生成・生成するための軽量な分類器C2Tを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:57:02 GMT)
Finite Element Operator Network for Solving Elliptic-type parametric PDEs [9.7] 偏微分方程式(PDE)は自然現象の理解と予測の基盤となる。
有限要素演算子ネットワーク(FEONet)を用いたパラメトリックPDEの解法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:47:56 GMT)
MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs [9.6] 本稿では,中国EMRのICD符号化におけるエビデンス検証によるMKE-Coder: Multi-axial Knowledgeを提案する。
診断のための候補コードを特定し,そのそれぞれを4つの符号化軸の下で知識に分類する。
評価モデルを用いて,EMRの包括的内容と信頼性証拠のフィルタリングから,対応する臨床証拠を検索する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:08:53 GMT)
Gradients can train reward models: An Empirical Risk Minimization Approach for Offline Inverse RL and Dynamic Discrete Choice Model [9.5] 機械学習において、動的選択(DDC)モデル(オフライン最大エントロピー正規化逆強化学習(オフラインMaxEnt-IRL))を推定する問題について検討する。
目的は、オフラインの振舞いデータからエージェントの振舞いを管理する$Q*$関数をリカバリすることである。
線形パラメータ化報酬の制限的仮定を使わずにこれらの問題を解くための大域収束勾配法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:22:20 GMT)
An LLM-based Agent for Reliable Docker Environment Configuration [9.4] 環境設定を完全に自動化し、任意のPythonリポジトリに対して実行可能なDockerfileを生成するように設計された、最初のLLMベースのエージェントであるRepo2Runを紹介します。
本稿では,環境汚染防止のためのロールバック機構を備えたデュアル環境アーキテクチャを特徴とする原子構成合成を提案する。
Repo2Runonが提案した420のPythonレポジトリとユニットテストのベンチマークを評価し、86.4%の成功率で、ベースラインを63.9%上回った。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:51:35 GMT)
Learning Novel Transformer Architecture for Time-series Forecasting [9.4] AutoFormer-TSは、時系列予測タスクに適したTransformerアーキテクチャの包括的な検索スペースを活用する新しいフレームワークである。
我々のフレームワークは、既存のDNASアプローチを改善した、差別化可能なニューラルアーキテクチャサーチ(DNAS)手法であるAB-DARTSを導入している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:49:20 GMT)
Adapting Large Language Models for Time Series Modeling via a Novel Parameter-efficient Adaptation Method [9.4] 時系列モデリングは多くの実世界のアプリケーションにおいて重要な意味を持つ。
我々は時系列と自然言語のモダリティを調整するためのTime-LlaMAフレームワークを提案する。
本稿では,提案手法がSOTA(State-of-the-art)性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:52:26 GMT)
Object-centric Binding in Contrastive Language-Image Pretraining [9.4] 本稿では, 強陰性拡張の設計に依存した, 一般的な戦略から分岐する新しいアプローチを提案する。
本研究は,事前学習したCLIP様モデルに誘導バイアスを組み込むことにより,追加のハードネガティブを使わずに構成的理解を改善することに焦点を当てる。
得られたモデルは複雑なシーンのより正確でサンプル効率の良い画像テキストマッチングへの道を開く。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:30:51 GMT)
Interpreting Neurons in Deep Vision Networks with Language Models [9.4] 本稿では,視覚ネットワークにおける隠れニューロンの役割を記述する新しい手法として,Describe-and-Dissect (DnD)を提案する。
DnDはトレーニングなしで、つまり、新しいモデルをトレーニングせず、より有能な汎用モデルを簡単に活用できます。
本稿では,サステナビリティ・アプリケーションのための土地被覆予測モデルに関する重要な知見を提供するユースケースを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:56:14 GMT)
From Tools to Teammates: Evaluating LLMs in Multi-Session Coding Interactions [9.3] MemoryCodeは、無関係な情報の中で単純なコーディング命令を追跡し実行するためのLarge Language Modelsの機能をテストするために設計されたデータセットである。
その結果,LLMの基本的な制限が強調され,長期的相互作用において効果的に協調する能力が制限された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:58:04 GMT)
Know Your Mistakes: Towards Preventing Overreliance on Task-Oriented Conversational AI Through Accountability Modeling [9.3] 本稿では,ユーザ過度に対処するタスク指向対話エージェントのための説明責任モデルを提案する。
実験結果から,提案手法はAIエージェントエラーの信頼性の高い推定を可能にするだけでなく,デコーダがより正確な動作を生成することを示唆している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:39:39 GMT)
Measuring the Effect of Transcription Noise on Downstream Language Understanding Tasks [9.3] 本稿では,様々な雑音環境下でタスクモデルを評価するためのフレームワークを提案する。
タスクモデルは特定のレベルのノイズを許容でき、スクリプタ内のエラーの種類によって異なる影響を受けることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:37:59 GMT)
"Make the Voodoo Box Go Bleep Bloop:" Exploring End Users' Understanding and Information Needs Regarding Microchips [9.2] マイクロチップは現代の電子機器の基本的な構成要素であるが、日々依存しているユーザーには不透明である。
この不透明さは、グローバルサプライチェーンの複雑さとプロプライエタリな情報の隠蔽によって複雑化され、重大なセキュリティ、信頼、説明責任の問題を引き起こす。
エンドユーザーによるマイクロチップの理解について検討し、これらの重要な技術に関する社会的意味と情報ニーズについての認識を探る。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:10:25 GMT)
VITAL: A New Dataset for Benchmarking Pluralistic Alignment in Healthcare [9.1] 既存のアライメントパラダイムは、文化、人口統計学、地域社会における視点の多様性を説明できない。
これは、文化、宗教、個人的価値観、矛盾する意見の影響により複数のことが不可欠である健康関連シナリオにおいて特に重要である。
この研究は、現在のアプローチの限界を強調し、健康固有のアライメントソリューションを開発するための基盤となる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:38:57 GMT)
Black Sheep in the Herd: Playing with Spuriously Correlated Attributes for Vision-Language Recognition [9.0] VLM(Vision-Language Models)は、分布内精度と分布外一般化のバランスをとるジレンマを示す。
近年の研究では、視覚属性などの低レベル概念を活用して一般化を高めている。
この研究は、VLMが、カテゴリと同一であるが本質的にはその一部ではないが、突発的に相関する属性である意思決定に、小さな属性のサブセットを過度に依存していることを明らかにする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:05:33 GMT)
Partially Observable Gaussian Process Network and Doubly Stochastic Variational Inference [8.8] 本研究は,実世界のプロセスネットワークをモデル化するための部分観測可能ガウスプロセスネットワーク(POGPN)を紹介する。
POGPNは観測レンズ(観測可能性)を深いガウス過程の確立した推論法に組み込む。
ベンチマーク問題への応用は、トレーニングと推論の間に部分的な観察を組み込むことによって、ネットワーク全体の予測性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:39:46 GMT)
Diffusion Models in Recommendation Systems: A Survey [8.7] 推薦システムにおける拡散モデルは、複雑なユーザとアイテムの分布を管理するのに優れている。
本稿では,拡散モデルを用いたレコメンデータシステムにおける過去の研究論文の分類法を提案する。
拡散モデルにおける基礎アルゴリズムとそのレコメンデーションシステムへの応用について述べる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:22:32 GMT)
SIFT: Grounding LLM Reasoning in Contexts via Stickers [8.7] 本稿では,大言語モデルの推論過程において,文脈の誤解釈が重要な問題であることを示す。
そこで我々は、***Stick to the Facts (SIFT)**という新しいポストトレーニング手法を導入し、この問題に対処する。
SIFTの中核にある*Sticker*は、コンテキスト内の重要な情報を明示的に強調するためにモデル自身によって生成される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:38:46 GMT)
Highly Dynamic and Flexible Spatio-Temporal Spectrum Management with AI-Driven O-RAN: A Multi-Granularity Marketplace Framework [8.7] 現在のスペクトル共有フレームワークは、静的か不十分に動的であることが多いため、適応性に苦しむ。
我々は、O-RANアーキテクチャ内での適応型AI駆動のスペクトル共有フレームワークを提案し、複数の時間スケールと空間的粒度のスペクトル要求を予測するために、識別型および生成型AI(AI)を統合する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:21:10 GMT)
A Racing Dataset and Baseline Model for Track Detection in Autonomous Racing [8.7] RoRaTrackは、トラック検出のためのレースシナリオからの注釈付きマルチカメライメージデータを含む、新しいデータセットである。
我々はこれらの課題に効果的に対処するGAN(Generative Adversarial Network)に基づくベースラインモデルであるRaceGANを提案する。
提案モデルは,トラック検出における現在の最先端機械学習モデルと比較して,優れた性能を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:43:31 GMT)
Bridging Sensor Gaps via Attention Gated Tuning for Hyperspectral Image Classification [8.6] HSI分類法は高品質なラベル付きHSIを必要とするが、しばしば入手するのにコストがかかる。
本稿では,3重構造トランスモデルであるTri-Formerを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:59:01 GMT)
WRF-GS: Wireless Radiation Field Reconstruction with 3D Gaussian Splatting [8.6] WRF-GSは3次元ガウススプラッティングを用いた無線放射場(WRF)再構成に基づくチャネルモデリングのための新しいフレームワークである。
少数の測定で、WRF-GSは与えられたシーンに対してミリ秒以内に新しい空間スペクトルを合成できる。
WRF-GSは、チャネル状態情報予測タスクにおいて、既存の手法を2.43dB以上のマージンで上回り、優れた性能を達成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:13:32 GMT)
STEER-ME: Assessing the Microeconomic Reasoning of Large Language Models [8.6] マイクロエコノミック推論のための大規模言語モデル(LLM)を評価するためのベンチマークを開発する。
供給と需要のロジックに重点を置いており、それぞれが最大10ドルドメイン、5ドルパースペクティブ、3ドルタイプで構成されています。
我々は,小規模なオープンソースモデルから最先端技術まで,27ドルのLLMのケーススタディを通じて,我々のベンチマークの有用性を実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:54:36 GMT)
Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model [8.6] 対話型エージェント言語モデル(Conversational Agentic Language Model)を導入する。
CoALM-ITを用いて、上位ドメイン固有モデルを上回る3つのモデル、CoALM 8B、CoALM 70B、CoALM 405Bを訓練する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:28:49 GMT)
Poster: SpiderSim: Multi-Agent Driven Theoretical Cybersecurity Simulation for Industrial Digitalization [8.5] SpiderSimは、産業用デジタル化セキュリティ研究のための高速で軽量なシナリオ生成を可能にする理論的サイバーセキュリティシミュレーションプラットフォームである。
統合シナリオモデリングのための構造化フレームワーク、自動生成のためのマルチエージェントコラボレーションメカニズム、柔軟なシナリオ構成のためのモジュール型アトミックセキュリティ機能です。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:42:32 GMT)
FlexDuo: A Pluggable System for Enabling Full-Duplex Capabilities in Speech Dialogue Systems [8.4] 音声対話システムから制御を分離するフレキシブルフルプレイ制御モジュールを開発した。
会話における人間の情報フィルタリング機構に触発されて、明示的なアイドル状態を導入する。
偽の割り込み率を24.9%削減し、統合されたフルプレイ対話システムに比べて応答精度を7.6%向上させる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:51:34 GMT)
Exploring Personalized Health Support through Data-Driven, Theory-Guided LLMs: A Case Study in Sleep Health [8.3] 睡眠の健康を高めるために,新しい大規模言語モデルを用いたチャットボットHealthGuruを紹介する。
HealthGuruは、ウェアラブルデバイスデータ、コンテキスト情報、コンテキスト対応のマルチアームバンディットモデルを統合して、カスタマイズされた睡眠改善アクティビティを提案する。
その結果、睡眠時間や活動スコア、より高い品質の反応、HealthGuruによる行動変化に対するユーザのモチベーションの向上といった指標が改善された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:53:43 GMT)
Indifferential Privacy: A New Paradigm and Its Applications to Optimal Matching in Dark Pool Auctions [8.3] ニューヨーク証券取引所やNASDAQのような公開取引所は、公開二重オークションシステムにおいてオークション業者として機能する。
ダークプールのような高ボリューム取引に関わる競売人は、常に信頼できるとは限らない。
それまでのソリューションでは、完全同型暗号を用いて、マッチが発生した場合にのみ情報が開示されることを保証する命令を暗号化していた。
本稿では,差分プライバシと軽量暗号化を組み合わせた新しいシステムを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:19:25 GMT)
Recurrent Neural Goodness-of-Fit Test for Time Series [8.2] 時系列データは、金融や医療など、さまざまな分野において重要である。
従来の評価基準は、時間的依存関係と潜在的な特徴の高次元性のために不足している。
Recurrent Neural (RENAL) Goodness-of-Fit testは,生成時系列モデルを評価するための新しい,統計的に厳密なフレームワークである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:58:52 GMT)
PFedDST: Personalized Federated Learning with Decentralized Selection Training [8.2] 本稿ではPFedDST(Personalized Federated Learning with Decentralized Selection Training)フレームワークを紹介する。
PFedDSTは、包括的なコミュニケーションスコアに基づいて、デバイスが戦略的に評価し、ピアを選択することによって、モデルトレーニングを強化する。
実験の結果,PFedDSTはモデル精度を向上するだけでなく,収束を加速することがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:21:58 GMT)
Fast algorithms to improve fair information access in networks [8.2] ネットワーク上で$k$のシードノードを選択することで、アクティベーションの最小確率を最大化する問題を考える。
我々は,確率推定を必要としない新しいスケーラブルアルゴリズムを設計し,評価する。
6ドルドメインから引き出された174ドルのネットワークのベンチマークコーパスを新たに提供します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:36:16 GMT)
Who is Responsible? The Data, Models, Users or Regulations? Responsible Generative AI for a Sustainable Future [8.1] 責任人工知能(Responsible Artificial Intelligence, RAI)は、AIシステムの開発と展開における倫理的懸念に対処するための重要なフレームワークとして登場した。
本稿では、ChatGPT後における倫理的、透明性があり、説明可能なAIシステムを実装する上での課題と機会について考察する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:44:21 GMT)
Fleurs-SLU: A Massively Multilingual Benchmark for Spoken Language Understanding [8.0] 音声言語理解(SLU: Spoken Language Understanding)は、形式的な記述システムを持たないすべての言語において必須である。
Fleurs-SLUの大規模言語モデルを用いて、音声からテキストへの書き起こしとその後の分類を併用したエンドツーエンド音声分類モデルとケースケードシステムの評価を行った。
我々は、頑健な多言語ASR、効果的な音声からテキストへの翻訳、強い多言語SLUの間に強い相関関係を見出した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:23:54 GMT)
Learning Variational Inequalities from Data: Fast Generalization Rates under Strong Monotonicity [7.8] 変分不等式(VIs)は最適化問題の幅広いクラスである。
強い単調性を満たすVIを学習するために、高速な$Theta (1/epsilon)$レートを得る方法を示す。
具体的には、凸最小化の標準的な安定性に基づく議論が、ドメインが小さな被覆を許すとき、直接 VI に拡張されることを実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:15:26 GMT)
Prompt Engineering or Fine-Tuning: An Empirical Assessment of LLMs for Code [7.8] 我々は,基本的なプロンプト,コンテキスト内学習,タスク固有のプロンプトという3つのプロンプト技術戦略を用いて,GPT-4を評価する。
コード要約、生成、翻訳という3つのコード関連タスクに関する17の微調整モデルと比較する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:37:08 GMT)
Scaling Trends in Language Model Robustness [7.7] 本研究では,3桁のパラメータ数にまたがる言語モデルのロバスト性について検討する。
他の介入がなければ、モデルのサイズが大きくなるだけでは、ロバスト性は向上しない。
逆行訓練では、より大きなモデルはより標本効率が高く、より小さなモデルよりも計算効率が低いことが分かる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:32:47 GMT)
The Round Complexity of Black-Box Post-Quantum Secure Computation [7.7] 量子後状態におけるセキュアマルチパーティ計算(MPC)のラウンド複雑性について検討する。
私たちの焦点は、完全にブラックボックスの設定であり、建設とセキュリティの削減の両方がブラックボックスであることです。
各種の量子後プリミティブを用いて、マルチパーティ設定において、最初のブラックボックス、コンスタントラウンド構成を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:45:28 GMT)
Hierarchical Spatio-Temporal Uncertainty Quantification for Distributed Energy Adoption [7.5] DERは電力グリッド管理に重大な時間的不確実性を導入した。
既存のアプローチはしばしば、個々の空間単位において過度に保守的な不確実な間隔を生じる。
本稿では,これらの課題に対処するためのコンフォメーション・フレームワークに基づく,新しい階層的予測モデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:33:04 GMT)
Reasoning and the Trusting Behavior of DeepSeek and GPT: An Experiment Revealing Hidden Fault Lines in Large Language Models [7.5] 低知覚のスイッチング摩擦は、より微妙な振る舞いの変化を考慮しない選択につながる可能性がある。
実験では,信頼のゲーム理論的行動経済学モデルを用いて,OpenAIの信頼行動とDeepSeekのモデルとの信頼行動の相違を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:57:19 GMT)
MEX: Memory-efficient Approach to Referring Multi-Object Tracking [7.4] メモリ効率のよいクロスモダリティ(MEX)と呼ばれる実用的なモジュールを紹介します。
このメモリ効率の手法は、iKUNのような市販のトラッカーに直接適用することができる。
提案手法は,メモリ4GBの単一GPU上での推論において有効であることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:58:42 GMT)
LLMPopcorn: An Empirical Study of LLMs as Assistants for Popular Micro-video Generation [7.3] DeepSeek-V3のような先進的な言語モデルによって、マイクロビデオ生成が人間の作ったコンテンツに匹敵する人気を達成できることを示す。
Promptの拡張により、さらに人気が高まり、ベンチマークでは、LLMのDeepSeek-V3とDeepSeek-R1が強調されている。
この先駆的な研究は、AIが支援するマイクロビデオの作成を前進させ、新たな研究機会を明らかにする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:28:34 GMT)
Latent Distribution Decoupling: A Probabilistic Framework for Uncertainty-Aware Multimodal Emotion Recognition [7.3] マルチモーダル・マルチラベル感情認識は,マルチモーダルデータにおける複数の感情の存在を同時に認識することを目的としている。
既存の研究では、マルチモーダルデータに固有のノイズであるテクスブファレラティック不確実性の影響を見落としている。
本稿では,不確かさ認識フレームワークを用いた潜在感情分布分解法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:53:23 GMT)
CND-IDS: Continual Novelty Detection for Intrusion Detection Systems [7.2] 侵入検知システム(IDS)は、システムデータを監視し、不審な活動に警告することで、IoTとネットワークセキュリティにおいて重要な役割を果たす。
機械学習(ML)がIDSの有望なソリューションとして登場し、高精度な侵入検出を提供する。
i)システムデータの新機能表現を継続的に更新する学習ベースの特徴抽出器と,(ii)主成分分析(PCA)再構成を利用して新たなサイバー攻撃を識別する新規性検出器からなる,連続的ノベルティ検出IDSフレームワークであるCND-IDSを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:47:22 GMT)
Giving AI Personalities Leads to More Human-Like Reasoning [7.1] 我々は,人間集団の多様な推論行動を模倣するAIの可能性について検討する。
自然言語推論(NLI)フォーマットを新たに一般化した推論タスクを設計した。
我々は、人格特性を反映したAI応答を誘発するために、ビッグファイブのパーソナリティモデルにインスパイアされたパーソナリティベースのプロンプトを用いた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:51:23 GMT)
Forward and Inverse Simulation of Pseudo-Two-Dimensional Model of Lithium-Ion Batteries Using Neural Networks [7.1] 擬二次元(P2D)モデルの前方及び逆シミュレーションにおいて,バトラー・ボルマー方程式の高非線形性によって生じる課題に対処する。
提案手法は,BV方程式を含む前方問題と逆問題の両方を解くのに有効である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:25:32 GMT)
RLTHF: Targeted Human Feedback for LLM Alignment [7.0] ユーザの好みに合わせて微調整された大きな言語モデルは、高品質なヒューマンアノテーションのコストが高いため、難しい。
LLMをベースとした初期アライメントと選択的人間のアノテーションを組み合わせた人間-AIハイブリッドフレームワークであるRLTHFを提案する。
RLTHFは,ヒトのアノテーション努力の6~7%で全人類のアノテーションレベルのアライメントに達する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:25:11 GMT)
CODEPROMPTZIP: Code-specific Prompt Compression for Retrieval-Augmented Generation in Coding Tasks with LMs [6.9] Retrieval-Augmented Generation (RAG)は、検索したコード例をプロンプトに組み込むことで、コーディングタスクを強化する。
既存の即時圧縮技術は自然言語に重点を置いており、コードの適切なソリューションが欠如している。
RAGに組み込む前にコード例を圧縮するフレームワークであるCodePromptZipを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:15:23 GMT)
FuzzRisk: Online Collision Risk Estimation for Autonomous Vehicles based on Depth-Aware Object Detection via Fuzzy Inference [6.9] このフレームワークは異なるアルゴリズムから2組の予測を受け取り、不整合とファジィ推論による衝突リスクを関連付ける。
IoU(Intersection-over-Union)と深度差測定(deep discrepancy measure)に基づいて,2組の予測の不一致が3次元物体検出器の誤差と強く相関していることを実験的に検証した。
AV衝突率によく一致する既存のオフラインメトリックに対してファジィ推論システムを最適化する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:49:11 GMT)
Data-Efficient Limited-Angle CT Using Deep Priors and Regularization [6.8] 本稿では,Randon変換から元の画像を高度に角度の制限下で再構成する,非常に低データな手法を提案する。
逆問題として,Total Variation, sinogram filter, Deep Image Prior, パッチレベルのオートエンコーダなど,複数の正規化手法を組み合わせる。
本手法はヘルシンキ・トモグラフィー・チャレンジ2022(Helsinki Tomography Challenge 2022)のデータセットを用いて評価され,その目的は2値円盤をその限定角度のシングラムから再構成することである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:54:24 GMT)
TALKPLAY: Multimodal Music Recommendation with Large Language Models [6.8] TalkPlayは、複数のモダリティをエンコードする拡張トークン語彙を通じて音楽を表現する。
モデルは、音楽レコメンデーションの会話において、次のトーケン予測を通じてレコメンデーションを生成することを学習する。
提案手法は従来のレコメンデーション-対話パイプラインの複雑さを排除し,クエリ対応の音楽レコメンデーションのエンドツーエンド学習を可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:28:20 GMT)
Forward-Forward Learning achieves Highly Selective Latent Representations for Out-of-Distribution Detection in Fully Spiking Neural Networks [6.7] 生物学的システムにインスパイアされたスパイキングニューラルネットワーク(SNN)は、限界を克服するための有望な道を提供する。
本研究では,これらの課題に対処するために,スパイクフォワードフォワードアルゴリズム(FFA)の可能性を検討する。
本稿では,クラス分布からサンプルを遠ざける特徴を検出するための,新しい非勾配属性法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:14:17 GMT)
Image compositing is all you need for data augmentation [6.6] 本稿では,オブジェクト検出モデルの性能に及ぼす各種データ拡張手法の影響について検討する。
商用機と軍用機からなるカスタムデータセット上でモデルを微調整し、異なる拡張戦略を適用します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:24:02 GMT)
A Tale of Two Structures: Do LLMs Capture the Fractal Complexity of Language? [6.5] 言語は情報理論の複雑さにおいてフラクタル構造を示す。
大規模言語モデル(LLM)がそのようなフラクタル特性を再現できるかどうかを検討する。
LLMが生成する24万以上の記事からなるデータセットをリリースする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:15:57 GMT)
KOALA: Knowledge Conflict Augmentations for Robustness in Vision Language Models [6.5] segsubは、画像ソースに標的摂動を適用して、視覚言語モデルの堅牢性を研究し改善するフレームワークである。
以前の知見とは対照的に,VLMは画像摂動に強い。
GPT-4oによる幻覚と画像コンテキストの関連性を見出した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:26:38 GMT)
Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition [6.5] サンプル空間の概念を導入し,LiDARを用いた位置認識のための新しいサンプリング手法を提案する。
このアプローチは、さまざまなデータセット間で堅牢なパフォーマンスを示し、屋内シナリオから屋外シナリオへのシームレスな適応を可能にします。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:54:00 GMT)
Fine-grained Fallacy Detection with Human Label Variation [6.4] Fainaは、複数の妥当な回答と自然な不一致を取り入れた、誤検出のための最初のデータセットである。
Faunaには、イタリア語のソーシャルメディア投稿に、20種類の誤字が重複した11万以上のスパンレベルのアノテーションが含まれている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:18:44 GMT)
MobileViM: A Light-weight and Dimension-independent Vision Mamba for 3D Medical Image Analysis [6.4] この原稿は3次元医用画像の効率的なセグメンテーションのための合理化アーキテクチャであるMobileViMを提示する。
我々は,視覚マンバを基盤とした新しい次元非依存機構と二方向トラバースアプローチを考案した。
これらの拡張により、MobileViMは1つのグラフィックス処理ユニットで毎秒90フレームを超えるセグメンテーション速度を達成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:21:59 GMT)
Asking for Help Enables Safety Guarantees Without Sacrificing Effectiveness [6.4] 災害を避けるアルゴリズムも高い報奨を保証することを証明している。
これは、一般のMDPに対する最初のノンレグレット保証である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:01:39 GMT)
Physical Depth-aware Early Accident Anticipation: A Multi-dimensional Visual Feature Fusion Framework [6.3] 本稿では,Depth-Anything という大モデルによって生成される単眼深度特徴を取り入れた物理深度認識学習フレームワークを提案する。
提案手法は, 連続フレームにおける物体間の相互作用関係の解析を通じて, 事故の早期指標を抽出する。
実験結果から,提案手法が最先端性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:07:38 GMT)
Don't Touch My Diacritics [6.3] 我々は、多くの言語やスクリプトを起源とするテキストにおけるダイアクリティカルな文章の扱いに焦点をあてる。
本研究は,いくつかのケーススタディを通じて,ダイアクリティカル文字の非一貫性な符号化と,ダイアクリティカル文字を完全に除去する効果を実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:34:34 GMT)
Quantifying Memorization and Retriever Performance in Retrieval-Augmented Vision-Language Models [6.3] 大言語モデル(LLM)は、質問応答(QA)において顕著な能力を示す
しかし、記憶と検索への依存度を評価する指標は未開発のままである。
これにより、記憶、一般化、検索のトレードオフに関する疑問が持ち上がる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:58:09 GMT)
Generalization error bound for denoising score matching under relaxed manifold assumption [6.2] 非パラメトリックガウス混合による観測密度をモデル化する。
標準多様体の仮定を緩和し、サンプルを多様体から遠ざけるようにする。
評価値の近似と誤差の非漸近的境界を導出する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:14:52 GMT)
OpenSearch-SQL: Enhancing Text-to-SQL with Dynamic Few-shot and Consistency Alignment [6.2] 我々は,テキストからエージェントまでのタスクを,整合性アライメント機構に基づくアライメントモジュールとともに,前処理,抽出,生成,リファインメントの4つの主要なモジュールに分割するOpenSearch-を提案する。
これらの手法はテキスト・ツー・エージェント・タスクにおけるLLMの性能を大幅に向上させた。
実験の結果、OpenSearch-はBIRD開発セットで69.3%、テストセットで72.28%、報酬ベースの効率スコア(R-VES)で69.3で実行精度(EX)を達成した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:51:50 GMT)
Holistic Reasoning with Long-Context LMs: A Benchmark for Database Operations on Massive Textual Data [6.2] HoloBenchは、テキストベースのコンテキストにデータベース推論操作をもたらすフレームワークです。
本研究では,文脈内の情報量が文脈長よりもLCLMの性能に大きく影響していることを示す。
複数の情報の集約を必要とするタスクは、コンテキスト長が増加するにつれて顕著な精度低下を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:36:03 GMT)
Infinite Width Limits of Self Supervised Neural Networks [6.2] NTKと自己教師型学習のギャップを埋め、Barlow Twinsの損失下で訓練された2層ニューラルネットワークに焦点を当てる。
ネットワークの幅が無限大に近づくと、バーロウ・ツインズのNTKは確かに一定となる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:34:27 GMT)
Non-linear reduced modeling of dynamical systems using kernel methods and low-rank approximation [5.9] 我々は,カーネルヒルベルト空間における線形近似に基づく非線形力学のデータ駆動還元モデリングのための新しい効率的なアルゴリズムを提案する。
このアルゴリズムは、カーネルベースの計算を有利に活用しながら、低ランク制約最適化問題の閉形式解を利用する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:54:07 GMT)
MCTS-KBQA: Monte Carlo Tree Search for Knowledge Base Question Answering [5.9] 本研究ではモンテカルロ木探索(MCTS)を利用した知識ベース質問応答(KBQA)における大規模言語モデル(LLM)の推論能力の向上について検討する。
我々は、オープンソース命令LLMの直接的プロンプトのみを必要とするステップワイズ報酬機構を慎重に設計する。
我々は,既存の質問-SPARQLデータセットの中間的推論プロセスを遠隔監視を用いて注釈付けすることで,KBQAコミュニティに新たなデータリソースを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:58:39 GMT)
MAAT: Mamba Adaptive Anomaly Transformer with association discrepancy for time series [5.9] 時系列における異常検出は, 産業モニタリングや環境センシングに不可欠である。
既存の手法では、短期的な文脈に対する感受性や、ノイズの多い非定常環境における非効率性といった制限に直面している。
関連性モデリングと再構成品質を向上させる改良されたアーキテクチャであるMAATを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:48:05 GMT)
ChatWise: AI-Powered Engaging Conversations for Enhancing Senior Cognitive Wellbeing [5.9] AIベースの手法は対話型サポートの提供において有望であることを示しているが、既存の作業は暗黙の戦略に限られており、高齢者に適したマルチターンサポートが欠如している。
高齢者向けのLLM駆動型チャットボットChatWiseにより,先行技術を改善した。
ChatWiseは、主にショートターン交換で優れている従来のLLMとは対照的に、ロングターン会話で成長する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:32:09 GMT)
What are Models Thinking about? Understanding Large Language Model Hallucinations "Psychology" through Model Inner State Analysis [5.8] 大規模言語モデルの推論の内部状態は、多くの研究で広く使われている。
本稿では,前向き推論における各内部状態の特徴を解析し,幻覚検出の能力を評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:23:18 GMT)
Multi-view Video-Pose Pretraining for Operating Room Surgical Activity Recognition [5.8] 外科的活動認識は、多視点カメラ記録から活動やフェーズを検出する重要なコンピュータビジョンタスクである。
既存のSARモデルは、細粒度のクリニックの動きや多視点の知識を説明できないことが多い。
本稿では, マルチビュー・プレトレーニング・フレームワークであるMultiview Pretraining for Video-Pose Surgery Activity Recognition PreViPSを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:08:04 GMT)
Display Field-Of-View Agnostic Robust CT Kernel Synthesis Using Model-Based Deep Learning [5.6] 異なるカーネルは様々な方法で空間分解能、画像ノイズ、コントラストに影響を与える。
Display Field-of-View (DFOV)は、カーネル合成に複雑さを追加する。
本研究は、モデルベースディープラーニングを用いた画像ベースカーネル合成のための効率的DFOV非依存のソリューションを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:29:47 GMT)
Adapting Multilingual Embedding Models to Historical Luxembourgish [5.5] 事前訓練された多言語モデル(典型的には現代テキストで評価される)は、OCRノイズと時代遅れの綴りによる歴史的デジタル化コンテンツによる課題に直面している。
歴史的ルクセンブルク語における言語間セマンティック検索における多言語埋め込みの利用について検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:38:40 GMT)
Navigating Semantic Relations: Challenges for Language Models in Abstract Common-Sense Reasoning [5.4] 大規模言語モデル(LLM)は、人間のようなテキストを生成し、適度な複雑さの問題を解くことで、顕著な性能を達成した。
概念ネット知識グラフを用いて,LLMにおける抽象的常識推論を体系的に評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:20:24 GMT)
The Majority Vote Paradigm Shift: When Popular Meets Optimal [5.4] マジョリティ投票(Majority Vote、MV)は、投票数が最も多いクラスラベルを選択する。
本稿では,MVがラベル推定誤差に基づいて理論的に最適な下界を実現する条件を特徴付ける。
この最適性の証明は、ラベルアグリゲーションのためのモデル選択により原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:01:27 GMT)
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference [5.4] Group Quantization and Sparse Acceleration (GQSA)は、LLMに適した新しい圧縮技術である。
圧縮モデルの性能優位性を保証するための2段階スパース最適化手法を提案する。
実験の結果、GQSA W4S50%圧縮設定の下では、モデルの精度は2:4プルーニングとW2量子化の両方を上回ることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:35:43 GMT)
Addressing the regulatory gap: moving towards an EU AI audit ecosystem beyond the AI Act by including civil society [5.0] 欧州議会は、プラットフォームとAI製品を規制するためのデジタルサービス法(DSA)と人工知能法(AIA)を提案した。
我々は、サードパーティの監査がどちらの法律にもどの程度含まれているか、また、モデルや提供されたデータに関する情報へのアクセス方法についてレビューする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:03:02 GMT)
Models of liquid samples confinement for nanoscale NMR [5.0] 本研究では,ナノNMRを閉じ込めた2つのノイズモデル,すなわち表面相互作用とポロシティについて検討し,典型的なナノNMR実験におけるそれらの影響について考察する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:34:51 GMT)
Hidden Darkness in LLM-Generated Designs: Exploring Dark Patterns in Ecommerce Web Components Generated by LLMs [4.9] この研究は、Claude、GPT、Gemini、Llamaの4つの人気のあるLCMによって生成されたeコマースWebコンポーネントの設計を評価した。
生成した成分の3分の1以上は、少なくとも1つの暗いパターンを含む。
ダークパターンは、企業利益に関連するコンポーネントでも、より頻繁に生成される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:35:07 GMT)
RobustX: Robust Counterfactual Explanations Made Easy [4.9] 本稿では,オープンソースのPythonライブラリであるRobustXについて紹介する。
既存のメソッドのインターフェースを提供し、最先端技術への合理化を可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:12:01 GMT)
Stock Price Prediction Using a Hybrid LSTM-GNN Model: Integrating Time-Series and Graph-Based Analysis [4.8] 本稿では、長寿命メモリ(LSTM)ネットワークとグラフニューラルネットワーク(GNN)を統合した新しいハイブリッドモデルを提案する。
LSTMコンポーネントは、株価データの時間的パターンを積極的に捉え、金融市場の時系列ダイナミクスを効果的にモデル化する。
実験の結果, LSTM-GNNモデルでは平均2乗誤差(MSE)が0.00144であることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:09:13 GMT)
Population Dynamics Control with Partial Observations [4.8] オンラインの非確率的制御の観点から,人口動態の制御の問題について検討する。
我々の主な貢献は、線形動的コントローラを混合する自然なクラスに関して、最適$tildeO(sqrtT)$ regretを達成する新しいコントローラである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:07:56 GMT)
PolyhedronNet: Representation Learning for Polyhedra with Surface-attributed Graph [4.7] PolyhedronNetは3D多面体オブジェクトの表現を学習するための一般的なフレームワークである。
本実験は,ポリヘドロンネットによる3次元多面体物体の包括的および情報的表現の取得の有効性を実証するものである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:45:40 GMT)
EfficientPose 6D: Scalable and Efficient 6D Object Pose Estimation [4.6] 本研究は,GDRNPPに基づく高速かつスケーラブルなポーズ推定器の開発に焦点をあてる。
本稿では,推定時間と精度のトレードオフを考慮したAMISアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:21:23 GMT)
Delving into ChatGPT usage in academic writing through excess vocabulary [4.6] ChatGPTのような大きな言語モデル(LLM)は、人間レベルのパフォーマンスでテキストを生成し、修正することができる。
我々は2010年から2024年にかけての1400万のPubMed抽象語の語彙変化について検討し、LLMの出現がある種の単語の出現頻度の急激な増加につながったことを示す。
我々は,LLMが,コビッドパンデミックなどの世界大イベントの影響を超越して,科学文献に前例のない影響を与えていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:15:24 GMT)
Object-Pose Estimation With Neural Population Codes [4.6] オブジェクト対称性は、感覚入力のオブジェクト回転への直接マッピングを複雑にする。
ニューラルネットワークによる物体回転の表現は,これらの制限を克服することを示す。
我々は、Apple M1 CPU上で3.2ミリ秒で推論を行う。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:23:43 GMT)
GlossGau: Efficient Inverse Rendering for Glossy Surface with Anisotropic Spherical Gaussian [4.5] GlossGauは、バニラ3D-GSに匹敵するトレーニングとレンダリング速度を維持しながら、光沢のある表面でシーンを再構築する効率的な逆レンダリングフレームワークである。
実験によりGrossGauは、光沢のある表面を持つデータセット上で、競争力や優れた再構築を実現することが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:20:57 GMT)
Learning Symbolic Task Decompositions for Multi-Agent Teams [4.5] 協調型マルチエージェント学習におけるサンプル効率向上のための1つのアプローチは、タスク全体を個々のエージェントに割り当てられるサブタスクに分解することである。
本研究では,モデルのない環境との相互作用から最適分解を学習するフレームワークを提案する。
本手法はタスク条件付きアーキテクチャを用いて,各サブタスクに対する最適分解と対応するエージェントのポリシーを同時に学習する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:24:44 GMT)
An explainable transformer circuit for compositional generalization [4.4] 小型変圧器における構成誘導の回路を同定し,機械的に解釈する。
因果解法を用いて回路を検証し,プログラムライクな記述を用いて動作を定式化する。
本研究は, 変圧器における複雑な挙動の理解を推し進め, モデル制御の直接的な経路を提供することができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:30:41 GMT)
V2C-Long: Longitudinal Cortex Reconstruction with Spatiotemporal Correspondence [4.4] V2C-Longは,経時的MRI画像の深層学習による大脳皮質再建法として初めて提案される。
V2C-Longは、被検者や訪問者間で強い時間的対応を示し、表面ベースの後処理の必要性を減らす。
その結果,従来の手法と比較して,経時的整合性と精度が大幅に向上した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:16:37 GMT)
Induced Quantum Divergence: A New Lens on Communication and Source Coding [4.4] 本稿では、位置ベース復号法における仮説検証の発散を代替する新しい量子発散尺度であるインダクション発散法を紹介する。
量子チャネル上の古典的通信と量子状態の再分配の2つの主要な応用が検討されている。
結果は、基本的な単一ショット量子情報プロトコルに関する新たな洞察を与える。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:25:56 GMT)
NRQNN: The Role of Observable Selection in Noise-Resilient Quantum Neural Networks [4.3] 本稿では,ノイズ条件下での量子ニューラルネットワーク(QNN)のトレーニングに伴う複雑さについて検討する。
まず、バレンプラトー(BP)が理想的条件よりもノイズの多い量子環境で容易に現れることを実証した。
そこで我々は,QNNのノイズに対する耐性を高めるために,キュービット計測を慎重に選択することを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:25:24 GMT)
Joint MoE Scaling Laws: Mixture of Experts Can Be Memory Efficient [4.3] 我々は,高密度モデルとMoEモデルに対する共同スケーリング法則を提案し,アクティブパラメータ数,データセットサイズ,エキスパート数といった重要な要素を取り入れた。
驚くべきことに、従来の知恵とは対照的に、MoEモデルは高密度モデルよりもメモリ効率が高いことが示される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:36:33 GMT)
Herglotz-NET: Implicit Neural Representation of Spherical~Data with Harmonic Positional Encoding [4.2] Inlicit Neural representations (INR) は、高忠実度データ表現の有望な代替手段として登場した。
Herglotz-NET(HNET)は、複雑なHerglotzマッピングに基づく高調波位置符号化を利用する新しいINRアーキテクチャである。
我々は,HNETを球面データの正確なモデリングのためのスケーラブルで柔軟なフレームワークとして確立した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:40:02 GMT)
Retrieving Versus Understanding Extractive Evidence in Few-Shot Learning [4.2] 大規模言語モデルにおける文書内証拠の検索と解釈の関係を解析する。
ラベル予測とエビデンス検索の誤りが関連する証拠の質に起因するかどうかを2つのアブレーション研究により調査する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:48:09 GMT)
Causes and Strategies in Multiagent Systems [4.1] 並列ゲーム構造として表現されたマルチエージェントシステムモデルを,所定の構造因果モデルに対して体系的に構築する手法を提案する。
得られたいわゆる因果同時ゲーム構造では、遷移は与えられた因果モデルのエージェント変数に対する介入に対応する。
因果ゲーム構造はエージェントの戦略決定による因果的影響の分析と推論を可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:18:42 GMT)
FakET: Simulating Cryo-Electron Tomograms with Neural Style Transfer [4.1] 低温透過電子顕微鏡のフォワード演算子をシミュレートできるFakETを導入する。
高品質なシミュレートされたマイクログラフや傾きシリーズを生成する基準データに従って、合成トレーニングデータセットを適応するために使用できる。
特筆すべきは、我々の技術は性能にマッチし、データ生成速度を750倍にし、メモリを33倍削減し、典型的な透過型電子顕微鏡検出器サイズによくスケールすることです。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:34:59 GMT)
Bounded Synthesis of Synchronized Distributed Models from Lightweight Specifications [4.1] 本稿では,軽量な形式仕様から同期モデルを自動的に合成する手法を提案する。
我々のアプローチは、グローバルな線形時間制約とともに、分散システムの仕様を入力として受け取ります。
同時実行がグローバルな制約を満たすコンポーネント仕様の実行可能なモデルを生成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:54:32 GMT)
From Local to Global: A Graph RAG Approach to Query-Focused Summarization [4.1] GraphRAGは、プライベートテキストコーパスに対する質問応答のためのグラフベースのアプローチである。
我々は,GraphRAGが従来のRAGベースラインよりも大幅に改善され,生成した回答の包括性と多様性が向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:49:41 GMT)
Properties of quantum emitters in different hBN sample types particularly suited for nanophotonic integration [4.0] 六方晶窒化ホウ素(hBN)の単一光子エミッタは、フォトニックアプリケーションや量子ネットワークのための固体量子エミッタを約束している。
我々は、ナノフォトニックデバイスとの統合に特に役立つ2種類のhBNサンプルに焦点を当てた。
我々は、特にフォトニック量子ネットワークに適した異なるサンプルタイプの特性を比較し、解明し、これらのサンプルに見られるエミッタの起源を絞り込む。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:34:54 GMT)
Unraveling the Localized Latents: Learning Stratified Manifold Structures in LLM Embedding Space with Sparse Mixture-of-Experts [3.9] 大規模な言語モデルでは、埋め込みは入力データの難易度や領域によって異なる次元の局所多様体構造に存在していると推測する。
注意に基づくソフトゲーティングネットワークを組み込むことで,我々のモデルは入力データソースのアンサンブルのために,特別なサブマニフォールドを学習することを確認した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:33:16 GMT)
Quantum Recurrent Neural Networks with Encoder-Decoder for Time-Dependent Partial Differential Equations [3.9] 本研究では,エンコーダ・デコーダ・フレームワーク内のリカレントニューラルネットワークについて検討し,Vari Gatedational Circuit UnitsとLong Short-Term Memory Networkを統合した。
我々はハミルトン・ヤコビマン方程式、バーガーズ方程式、グレイ・スコット反応拡散系および3次元ミヒャエル・メンテン反応拡散方程式のアルゴリズムを評価する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:09:43 GMT)
Through the Looking-Glass: Transparency Implications and Challenges in Enterprise AI Knowledge Systems [3.9] 本稿では,AI知識システムにおける透明性要件と影響のリフレクティブ分析について述べる。
私たちは透明性を、さまざまな見方を形作る上で重要な仲介者として定式化しています。
我々は,AI知識システムの価値を実現するために必要な3つの透明性次元を同定する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:19:29 GMT)
Quantum Logic Spectroscopy of an Electron and Positron for Precise Tests of the Standard Model [3.9] 分光トラップ中の電子または陽電子は、ワイヤを介してリモート論理電子または陽電子に結合され、運動絡みを実現する。
2つのトラップを分離することにより、磁場、マイクロ波特性、検出感度を大幅に改善することができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:53:38 GMT)
Emancipatory Information Retrieval [3.9] 本論文は,コンピュータによる情報アクセスの課題における役割を挑発するものである。
ここでの「解放」という言葉は、すべての人々の普遍的人間化に関する道徳的な懸念を表している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:41:06 GMT)
Quantum Policy Gradient in Reproducing Kernel Hilbert Space [3.9] パラメトリッド量子回路は、機械学習のための表現力とデータ効率の表現を提供する。
量子カーネルにおける量子回路の表現は量子教師あり学習において広く研究されている。
本稿では、量子環境における量子カーネルポリシーを用いたパラメトリックおよび非パラメトリックポリシー勾配とアクタークリティカルアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:20:46 GMT)
Beyond Logit Lens: Contextual Embeddings for Robust Hallucination Detection & Grounding in VLMs [3.8] LMMの中間層からコンテキストトークンを埋め込む洗練された方法であるContextualLensを導入する。
このアプローチは、行動やOCRを含む様々なカテゴリーにおける幻覚の検出と接地を著しく改善する。
我々の貢献は、より信頼性が高く解釈可能なマルチモーダルモデルへの道を開いた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:44:50 GMT)
Triad: Vision Foundation Model for 3D Magnetic Resonance Imaging [3.8] 3次元MRIの視覚基礎モデルであるTriadを提案する。
Triadは131,170個のMRIボリュームから堅牢な表現を学ぶために広く使われているオートエンコーダアーキテクチャを採用している。
臓器・腫瘍区分,臓器・癌分類,医用画像登録という3つの課題にまたがってTriadを評価した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:31:52 GMT)
Comparing the information content of probabilistic representation spaces [3.7] 確率的表現空間はデータセットに関する情報を伝達し、トレーニングデータ、ネットワークアーキテクチャ、損失関数などの要因によって形成される。
一般確率表現空間を比較するための2つの情報理論尺度を提案する。
3つのケーススタディでこれらの尺度の有用性を実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:10:36 GMT)
RevPRAG: Revealing Poisoning Attacks in Retrieval-Augmented Generation through LLM Activation Analysis [3.7] RevPRAGは、LLMの活性化を利用した、柔軟で自動化された検出パイプラインである。
複数のベンチマークデータセットとRAGアーキテクチャによる結果から,提案手法は真正の98%,偽正の1%に近い正の98%を達成できた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:09:14 GMT)
Navigating Demand Uncertainty in Container Shipping: Deep Reinforcement Learning for Enabling Adaptive and Feasible Master Stowage Planning [3.6] 強化学習(RL)は様々な最適化問題を解く上で有望である。
本研究では,コンテナの出荷におけるRLの利用に焦点を合わせ,マスタ・ストージ・プランニングにおける重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:49:48 GMT)
A Study on Monthly Marine Heatwave Forecasts in New Zealand: An Investigation of Imbalanced Regression Loss Functions with Neural Network Models [3.6] 海洋熱波(英: Marine heatwaves、MHWs)は、海洋生態系や関連産業に大きな影響を及ぼす極端な海洋温度の現象である。
予測MHWは、より頻繁な中等度条件と比較して、極端温度異常の希少性に起因する、困難な不均衡回帰課題を示す。
我々は、完全に接続されたニューラルネットワークを用いて、平均二乗誤差(MSE)、平均絶対誤差(MAE)、フーバー、重み付きMSE、焦点R、バランス付きMSE、提案されたスケーリング重み付きMSEなど、標準および特殊回帰損失関数を比較する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:27:51 GMT)
Neurosymbolic artificial intelligence via large language models and coherence-driven inference [3.5] 我々は、コヒーレンス駆動推論をサポートするグラフを客観的にインスタンス化する一連の命題を生成する。
自然言語で表現された命題からコヒーレンスグラフを再構築する大規模言語モデルの能力をベンチマークする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:53:16 GMT)
Finite sample bounds for barycenter estimation in geodesic spaces [3.4] 本研究では,測地空間における分布のバリ中心を推定する問題について検討する。
この結果は、ユークリッド空間から測地空間へのホーフディング型およびベルンシュタイン型濃度不等式を一般化する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:44:54 GMT)
Online Physics-Informed Dynamic Mode Decomposition: Theory and Applications [3.3] 動的モード分解(DMD)は、複雑な力学系を解析・モデル化する能力により、研究の注目を集めている。
提案するオンライン物理インフォームドDMD(OPIDMD)は,新しいDMDの凸最適化フレームワークへの適応である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:36:02 GMT)
Tell Me Why: Incentivizing Explanations [3.3] エージェントからの信念を説明するインセンティブを提供するメカニズムは知られていない。
標準ベイズモデルは説明の必要性を抑える仮定を作る。
この研究は、エージェントのプライベート情報リーダーによるより効率的なアグリゲーションへの合理的な説明を論じている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:47:34 GMT)
3D Gaussian Splatting aided Localization for Large and Complex Indoor-Environments [3.3] 本稿では,画像の追加により,確立された視覚的位置決め手法の精度と信頼性を大幅に向上する手法を提案する。
ランダムにサンプリングされたポーズで3DGSからレンダリングされた画像で参照データをリッチにすることで、幾何学に基づく視覚的ローカライゼーションとScene Coordinate Regression法の両方の性能が大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:12:43 GMT)
Helix-mRNA: A Hybrid Foundation Model For Full Sequence mRNA Therapeutics [3.3] mRNAベースのワクチンは製薬業界において主要な焦点となっている。
この性質のためにmRNA配列を最適化するのは 難しい課題です
これらの課題に対処するために、構造化された状態空間ベースおよび注目ハイブリッドモデルであるHelix-mRNAを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:51:41 GMT)
UM_FHS at TREC 2024 PLABA: Exploration of Fine-tuning and AI agent approach for plain language adaptations of biomedical text [3.2] TREC 2024 PLABA トラックへの投稿は,K8 レベルの学生 (13~14歳) を対象に, バイオメディカル・抽象化の簡易化を目的としている。
我々は,OpenAIのGPt-4oとGPt-4o-miniモデルを用いて,ベースラインプロンプトエンジニアリング,2AIエージェントアプローチ,微調整という3つのアプローチを検証した。
その結果、GPt-4o-miniモデルを用いた2エージェントアプローチとベースラインプロンプトエンジニアリングは質的性能が優れ、微調整モデルは精度と完全性に優れるが、より単純ではないことがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:07:16 GMT)
MindForge: Empowering Embodied Agents with Theory of Mind for Lifelong Collaborative Learning [3.2] 我々は、明示的な視点による生涯学習のためのジェネレーティブ・エージェントフレームワークであるMindForgeを提示する。
本稿では,(1)知覚,信念,欲求,行動をリンクする心的表現の構造化理論,(2)自然な相互通信,(3)多成分記憶システムを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:59:28 GMT)
Homophily Heterogeneity Matters in Graph Federated Learning: A Spectrum Sharing and Complementing Perspective [3.2] 我々は、スペクトルグラフニューラルネットワーク(GNN)を導入し、グラフスペクトル特性(FedGSP)をマイニングする新しいフェデレーション学習法を提案する。
一方、提案したFedGSPでは、クライアントが一般的なスペクトル特性を共有できるため、すべてのクライアントがコラボレーションを通じて利益を得ることができる。
一方、我々の理論的な知見に触発されて、提案したFedGSPは、クライアントが欠落するスペクトル特性を取得することで、非ジェネリックスペクトル特性を補完することを可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:58:08 GMT)
MetaSSC: Enhancing 3D Semantic Scene Completion for Autonomous Driving through Meta-Learning and Long-sequence Modeling [3.1] セマンティックシーン補完(SSC)のためのメタラーニングに基づく新しいフレームワークであるMetaSSCを紹介する。
我々のアプローチは、不完全領域のセマンティックスと幾何学を探求することを目的とした、ボクセルに基づくセマンティックセマンティックセマンティクス(SS)事前訓練タスクから始まる。
シミュレーションされた協調認識データセットを用いて、集約されたセンサデータを用いて1台の車両の知覚訓練を監督する。
このメタ知識は、二重フェーズのトレーニング戦略を通じてターゲットドメインに適応し、効率的なデプロイメントを可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:21:53 GMT)
A General Error-Theoretical Analysis Framework for Constructing Compression Strategies [3.1] 本稿では,各層に対して最適な圧縮レベルを決定するための圧縮誤差理論(CET)フレームワークを提案する。
具体的には、ResNet-34モデルでは、CETはオリジナルのモデルに匹敵する性能を保ちながら、パラメータ圧縮の約11$times$を達成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:12:43 GMT)
Relaxation Critical Dynamics in Measurement-induced Phase Transitions [3.1] 測定誘起相転移(MIPT)近傍における1次元量子回路の初期状態の緩和臨界ダイナミクスについて検討する。
半鎖エンタンジメントエントロピー$S$は、短時間でシステムのサイズに比例する係数を持つ$Spropto t-1$として崩壊する。
対照的に、初期状態が積状態であるとき、$S$は以前の研究と一致して$Spropto lnt$として時間とともに増加する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:39:47 GMT)
The Cure is in the Cause: A Filesystem for Container Debloating [3.1] トップダウンのコンテナの50%以上が60%以上肥大化しており、BAFFSはコンテナのサイズを大幅に削減している。
サーバレス機能の場合、BAFFSはコールドスタートのレイテンシを最大68%削減する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:43:39 GMT)
A New Framework of Software Obfuscation Evaluation Criteria [3.1] 過去には、有効性、レジリエンス、ステルス、コストなどの保護の強さを評価するために、いくつかの基準が提案されている。
我々は、ソフトウェア保護評価基準の新たな枠組みとして、妥当性、有効性(または有効性)、堅牢性、隠蔽性、頑健性、感受性、予測可能性、コストを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:45:47 GMT)
Dynamic Gradient Influencing for Viral Marketing Using Graph Neural Networks [3.1] グラフニューラルネットワークを用いて、トポロジカル情報と属性情報の両方を利用して製品の採用をモデル化する。
結果のDynamic Viral Marketing(DVM)問題は、最小限の予算と最小限の動的属性変更を見つけることを目指している。
本研究では,最適摂動を求めるためにランキングを用いた動的勾配影響(DGI)の考え方を考案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:30:15 GMT)
Geometry of Lightning Self-Attention: Identifiability and Dimension [3.0] 任意の層数に対するパラメトリゼーションの一般的な繊維の表現を提供することにより、深い注意の識別可能性について検討する。
単層モデルでは特異点と境界点を特徴付ける。
最後に,本研究の結果を正規化された自己注意ネットワークに拡張し,単一層として証明し,深部ケースで数値的に検証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:27:34 GMT)
Explaining the Impact of Training on Vision Models via Activation Clustering [2.9] 本稿では,凍結したネットワークの機能的アクティベーションをクラスタリングすることで,エンコーダが取得した情報を抽出するニューロアクティベート・ビジョン・エクスプメンテーション(NAVE)を提案する。
NAVEはモデルの予測を説明するのではなく、どの部分を同じように処理するか、どの情報をより深い層に保持するかといった質問に答える。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:21:07 GMT)
Conditional diffusion model with spatial attention and latent embedding for medical image segmentation [2.9] 医用画像分割のための空間的注意と潜伏埋め込み(cDAL)を備えた新しい条件拡散モデルを提案する。
cDALでは、拡散過程のすべての段階で、畳み込みニューラルネットワーク(CNN)ベースの判別器を使用して、生成されたラベルと実際のラベルを区別する。
現状のアルゴリズムよりも高いDiceスコアとmIoUで有意な質的,定量的な改善が見られた。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:40:15 GMT)
UNION: Unsupervised 3D Object Detection using Object Appearance-based Pseudo-Classes [2.8] 教師なしの3Dオブジェクト検出手法が登場し、トレーニングに手動ラベルを必要とせずに膨大な量のデータを活用するようになった。
最近のアプローチでは、モバイルオブジェクトの検出を学習するために動的オブジェクトに依存しているが、トレーニング中に静的インスタンスの検出をペナルティ化している。
複数の自己学習ラウンドを使用して、検出された静的インスタンスをトレーニング対象セットに追加する。
我々は空間クラスタリングと自己監督型シーンフローを用いて、LiDARから静的および動的オブジェクトの提案セットを得る。
その結果、静的および動的移動物体が一緒に得られ、既存の検出器は単一の訓練で訓練することができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:02:25 GMT)
Secure Federated Data Distillation [2.5] プライバシを保ちながら蒸留プロセスの分散化を図るためのセキュアフェデレーションデータ蒸留フレームワーク(SFDD)を提案する。
蒸留知識でグローバルモデルを訓練することに焦点を当てた既存のフェデレート蒸留技術とは異なり,本手法は局所的な貢献を示さずに蒸留データセットを作成することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:54:44 GMT)
A Baseline Method for Removing Invisible Image Watermarks using Deep Image Prior [2.5] 透かし画像のデータセットや透かしシステムに関する知識を必要とせずに、見えない画像の透かしを除去するブラックボックス方式を提案する。
DIPの中間段階から、見えない透かしを除去できる回避像を確実に見つけることができることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:30:19 GMT)
VaLID: Verification as Late Integration of Detections for LiDAR-Camera Fusion [2.5] 車両物体検出は、LiDARとカメラデータの両方から恩恵を受ける。
本稿では,各予測境界ボックスが許容可能であるかどうかを検証するモデル適応型遅延融合法VaLIDを提案する。
提案手法はモデル適応型であり,汎用カメラ検出器を用いた場合においても最先端の競争性能を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:55:41 GMT)
DiffSampling: Enhancing Diversity and Accuracy in Neural Text Generation [2.5] 本稿では,トークン確率分布の数学的解析を利用した3種類の新しい復号法を提案する。
私たちのアプローチは、品質と多様性の面で、少なくとも現在の代替手段と同様に、一貫して機能します。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:00:02 GMT)
The thermodynamic trilemma of efficient measurements [2.5] 本研究は、量子測定プロセスが熱力学的に閉包可能であると仮定する結果について検討する。
効率的な測定は熱力学の法則と基本的に相反するが、ユニタリ相互作用に基づく間接的測定モデルの普遍的適用性は放棄する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:44:12 GMT)
Does there exist a quantum fingerprinting protocol without coherent measurements? [2.4] 我々は,一方方向LOCC測定の場合,$Omega(sqrtn)$ qubits通信が必要であることを示す。
量子メッセージを古典的メッセージで置き換える新しい手法を考案した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:55:02 GMT)
Astra: Efficient and Money-saving Automatic Parallel Strategies Search on Heterogeneous GPUs [2.4] ヘテロジニアスGPU上での自動並列戦略探索フレームワークAstraを導入する。
Astraは、両方のGPU構成検索空間における効率-最適並列戦略を探索する。
ついにAstraは、貯金に関する自動並行戦略検索を最初に提案した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:08:37 GMT)
Integrating Inverse and Forward Modeling for Sparse Temporal Data from Sensor Networks [2.4] センサネットワークからのスパースデータを解析するためのフレームワークであるCavePerceptionを提案する。
我々は、スパース、ノイズ、および潜在的に不完全なセンサデータの解釈可能性を改善することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:24:51 GMT)
Aligning Human and Machine Attention for Enhanced Supervised Learning [2.3] 人間は特定の学習タスクにおいて機械よりも優れています。
マシン・アテンションと人間のアテンション・メカニズムを合わせることで、マシン・パフォーマンスが豊かになる可能性が考えられる。
本稿では,HuMAL(Human-Machine Attention Learning)と呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:57:37 GMT)
Is This Collection Worth My LLM's Time? Automatically Measuring Information Potential in Text Corpora [2.3] モデルトレーニングや微調整を必要とせずに,テキストコレクションから得られる潜在的な情報を評価する自動パイプラインを提案する。
提案手法はテキストから複数の選択質問(MCQ)を生成し,LLMの性能を原材料へのアクセスの有無に関わらず測定する。
本手法は,有用な新規情報を含むコレクションを効果的に識別し,データ取得と統合作業の優先順位付けを行うための実用的なツールを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:03:06 GMT)
Categorical Symmetries in Spin Models with Atom Arrays [2.3] カテゴリー対称性は近年、物質の相の分類を一般化することが示されている。
本稿では,すべての相のギャップと2次相転移を包含する単純なスピンチェーンモデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:06:51 GMT)
Regularization by Neural Style Transfer for MRI Field-Transfer Reconstruction with Limited Data [2.3] ニューラルスタイルトランスファーによる正規化は、磁場-転送再構成を可能にするために、ニューラルスタイルのトランスファーエンジンをデノイザと統合する新しいフレームワークである。
実験の結果,RNSTは様々な解剖学的面にまたがって高品質な画像を再構成できることを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:24:49 GMT)
Benchmarking Self-Supervised Methods for Accelerated MRI Reconstruction [2.3] 高アンサンプ測定からMRIを再構築することは、医療画像の高速化に不可欠である。
教師付きディープラーニングアプローチは目覚ましい成功を収めてきたが、完全にサンプル化された真実データに依存している。
本研究は,すべてのフィードフォワード自己監督法から得られた損失関数の総合的レビューと,基礎的真実を伴わない高速MRI再構成に関する最初のベンチマークを提示する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:10:44 GMT)
Enhancing interferometry using weak value amplification with real weak values [2.2] 本稿では、弱い値増幅(WVA)と従来の干渉計を組み合わせた超高感度干渉計プロトコルを提案する。
このプロトコルWVA+インターフェロメトリは、2つの経路間の相対遅延の弱い値増幅を用いて、インターフェロメトリ感度を高める。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:25:01 GMT)
Concept Layers: Enhancing Interpretability and Intervenability via LLM Conceptualization [2.2] 本稿では,概念層をアーキテクチャに組み込むことにより,解釈可能性とインターベンタビリティを既存モデルに組み込む新しい手法を提案する。
我々のアプローチは、モデルの内部ベクトル表現を、再構成してモデルにフィードバックする前に、概念的で説明可能なベクトル空間に投影する。
複数のタスクにまたがるCLを評価し、本来のモデルの性能と合意を維持しつつ、意味のある介入を可能にしていることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:10:19 GMT)
$\mathtt{GeLLM^3O}$: Generalizing Large Language Models for Multi-property Molecule Optimization [2.2] 大規模言語モデル(LLM)は、新しいタスクに対するドメイン外の顕著な一般化性を示す。
我々は、複雑なマルチプロパティ分子最適化タスクに特化して、最初の高品質な命令チューニングデータセットである$mathttMoMUInstruct$を紹介した。
$mathttGeLLM3O$sは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:14:11 GMT)
Medical Image Classification with KAN-Integrated Transformers and Dilated Neighborhood Attention [2.1] 一般的な医用画像分類のための医療ビジョン変換器(MedViTV2)を紹介する。
MedViTV2は前バージョンよりも計算効率が44%高い。
MedMNISTでは4.6%、NonMNISTでは5.8%、MedMNIST-Cベンチマークでは13.4%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:05:50 GMT)
Detecting Linguistic Bias in Government Documents Using Large language Models [2.1] 既存の方法論は、しばしば政府文書のユニークな文脈と遠方の影響を見落としている。
本稿では,オランダ下院から得られた,専門家による偏見を示すデータセットであるDGDB(Dutch Government Data for Bias Detection)を紹介する。
このデータセット上に複数のBERTベースのモデルを微調整し、それらの性能を生成言語モデルと比較する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:56:16 GMT)
Classical and quantum algorithms for characters of the symmetric group [2.1] 本稿では,$S_n$ の文字に対する Matrix Product State (MPS) アルゴリズムについて述べる。
アルゴリズムは、与えられた置換の既約文字を全て符号化したMPSを算出する。
我々は、強いシミュレーション(与えられた確率を計算する)から弱いシミュレーション(小さな誤差でサンプリングする)への一般的な還元を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:14:21 GMT)
Identifiability of Autonomous and Controlled Open Quantum Systems [2.1] オープン量子系は、量子力学と解析の交わりにおける豊富な研究領域である。
様々なマスター方程式を考慮し、自律的および制御されたオープン量子系の複数のビューを統一する。
これらの系に対する量子状態同定可能性の対応する概念を定式化する。
我々は、オープン量子系の同定に対する多くの建設的アプローチの基礎を定めている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:19:32 GMT)
Sampling-based Distributed Training with Message Passing Neural Network [2.1] ドメイン分割に基づくメッセージパッシングニューラルネットワーク(MPNN)のための分散トレーニングと推論手法を提案する。
我々はDS-MPNN(DとSは分散してサンプリングされる)と呼ばれるスケーラブルなグラフニューラルネットワークを提案し、最大$O(105)のノードをスケーリングできる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:14:58 GMT)
Selective Reviews of Bandit Problems in AI via a Statistical View [1.9] 強化学習(Reinforcement Learning, RL)は、人工知能の分野で広く研究されている分野であり、エージェントと環境との相互作用を通じて意思決定を教えることに焦点を当てている。
鍵となるサブセットには、マルチアーム・バンディット(MAB)と連続アーム・バンディット(SCAB)の問題が含まれ、不確実性の下でのシーケンシャルな意思決定をモデル化する。
本稿では,バンドイット問題の基本モデルと仮定を概説し,集中不平等やミニマックス後悔境界といった非漸近的理論ツールを探求し,探索-探索トレードオフを管理するための頻繁なアルゴリズムとベイズ的アルゴリズムを比較した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:48:18 GMT)
Extracting Social Connections from Finnish Karelian Refugee Interviews Using LLMs [1.9] フィンランド東部カレリアから戦後に移住した難民家族について,89,339件のフィンランド語インタビューの歴史的収集に関するゼロショット情報抽出研究を行った。
我々は,家族ごとに,インタビューの自由なテキストから,社会団体や趣味を抽出することを目的としている。
複数の生成モデルと教師付き学習アプローチを比較し、これらの異なるアプローチの相対的メリットについてより広範な知見を得る。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:17:41 GMT)
MergePrint: Merge-Resistant Fingerprints for Robust Black-box Ownership Verification of Large Language Models [1.9] モデルマージを継続することのできる頑健な指紋を埋め込むための新しいフィンガープリント手法であるMergePrintを提案する。
MergePrintはブラックボックスのオーナシップの検証を可能にする。モデルが特定の指紋入力に対してターゲット出力を生成するかどうかのみを所有者が確認する必要がある。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:25:08 GMT)
Towards Quantum Tensor Decomposition in Biomedical Applications [1.8] 本稿では, 生体医学的解析におけるテンソル分解の応用と課題について概説する。
テンソル分解のための量子アルゴリズムの進歩について論じ、量子コンピューティングがどのようにしてこれらの課題に対処できるかを考察する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:52:44 GMT)
Meaning Beyond Truth Conditions: Evaluating Discourse Level Understanding via Anaphora Accessibility [1.8] 自然言語理解能力の階層構造を示す。
語彙レベルと文レベルでの理解の評価を超えて、談話レベルに移行することの重要性を論じる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:45:26 GMT)
Graph Signal Inference by Learning Narrowband Spectral Kernels [1.7] グラフ周波数領域における狭帯域カーネルの組み合わせによって信号スペクトルが表現される新しいグラフ信号モデルを提案する。
提案手法は,文献における様々な参照手法と比較して,極めて良好な信号精度を提供することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:54:39 GMT)
DFDT: Dynamic Fast Decision Tree for IoT Data Stream Mining on Edge Devices [1.7] 本稿では,エネルギー効率のよいメモリ制約データストリームマイニングのための新しいアルゴリズムであるDFDT: Dynamic Fast Decision Treeを提案する。
実験により、提案フレームワークは、制限されたメモリとVFDTまたはSVFDTのランタイムのごく一部で予測性能(0.43対0.29ランキング)を向上できることが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:45:42 GMT)
An Overall Real-Time Mechanism for Classification and Quality Evaluation of Rice [1.7] 本研究は, 包括的米粒評価のためのリアルタイム評価機構を提案する。
1段階のオブジェクト検出アプローチ、深層畳み込みニューラルネットワーク、従来の機械学習技術を統合する。
提案手法により,イネ品種の同定,粒度評価,粒度評価が可能となった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:24:25 GMT)
Learning to Reason at the Frontier of Learnability [1.7] 現在、強化学習は大規模言語モデルトレーニングの最終段階として広く採用されている。
私たちは、多くの質問が、すべての試み(つまり、既に学習されている)によって解決されるか、まったく解決されないかを示す。
そこで本研究では,LLM学習の強化学習段階において,強化学習文献(学習可能性のためのサンプリング)から手法を適用した。
我々のカリキュラムは、高い成功のばらつき、すなわちエージェントが成功することもあるが、必ずしも成功しない質問を優先している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:01:25 GMT)
Learning stochastic dynamics from snapshots through regularized unbalanced optimal transport [1.7] 少ない時間分解スナップショットからのサンプルを使用して動的に再構築することは、自然科学と機械学習の両方において重要な問題である。
本稿では、正規化された不均衡な最適輸送(RUOT)を解き、観察されたスナップショットから連続的な不均衡なダイナミクスを推定するための新しいディープラーニング手法を提案する。
本手法は,RUOT形式に基づいて,成長・死過程の事前知識や追加情報を必要とせず,これらのダイナミクスをモデル化する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:52:56 GMT)
Ensemble based approach to quantifying uncertainty of LLM based classifications [1.6] モデルを微調整すると、語彙入力のバリエーションに対するモデル出力の感度が低下する。
予測クラスの確実性を推定する確率的手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:09:59 GMT)
ACROSS: A Deformation-Based Cross-Modal Representation for Robotic Tactile Perception [1.6] ACROSSは、センサーの変形情報を利用して触覚センサ間でデータを翻訳するフレームワークである。
我々はバイオタックセンサの触覚信号をDIGIT触覚画像に転送する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:08:50 GMT)
Planted vertex cover problem on regular random graphs and nonmonotonic temperature-dependence in the supercooled region [1.5] この二スピン二体相互作用系の平衡強磁性相転移は不連続である。
局所的に安定な反強磁性相は、$beta_textrmpf beta_textrmpg$ である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:20:01 GMT)
Robust Counterfactual Inference in Markov Decision Processes [1.5] 現在のアプローチでは、カウンターファクトを識別するために特定の因果モデルを想定している。
反実遷移確率の厳密な境界を計算できる新しい非パラメトリック手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:56:20 GMT)
Reproducing NevIR: Negation in Neural Information Retrieval [1.5] 否定は人間のコミュニケーションの基本的な側面であるが、情報検索(IR)における言語モデル(LM)の課題である。
NevIRは、ほとんどのIRモデルは、否定を扱う際にランダムランキングのレベル以下で機能することを示すベンチマーク研究である。
以上の結果から,最近登場したリストワイド・Large Language Model (LLM) のリランカーは,他のモデルよりも優れているが,人間のパフォーマンスは劣っていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:50:59 GMT)
Emergence of the Primacy Effect in Structured State-Space Models [1.5] 最近開発されたANNアーキテクチャは、心理学的記憶実験を反映した合成タスクの訓練と評価において、優位性を示す。
この結果は、心理学的優越効果に関する新しい視点を提供すると同時に、機械学習の現在の理論に対する非自明なパズルを提起する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:55:32 GMT)
DiffGuard: Text-Based Safety Checker for Diffusion Models [1.4] 本稿では,既存のソリューションよりも優れたテキストベースの安全フィルタを提案する。
我々の研究は、特に情報戦の文脈において、AIが生成するコンテンツの誤用に対処する必要があることによる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:51:43 GMT)
Cyber security of OT networks: A tutorial and overview [1.4] 本書は,オペレーショナル・テクノロジー(OT)ネットワークにおけるサイバーセキュリティの課題について考察する。
OTシステムはインフォメーション4.0イニシアチブによってITシステムとますます統合される。
本研究は、SCADA(Supervisory Control and Data Acquisition)、PLC(Programmable Logic Controllers)、RTU(Remote Terminal Units)などのOTシステムのキーコンポーネントについて検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:23:42 GMT)
Border Ranks of Positive and Invariant Tensor Decompositions: Applications to Correlations [1.4] マルチパートの正および不変なテンソル分解がランクと境界ランクのギャップを示すことを証明した。
また、ある多部確率分布の集合における正の分解とメンバシップの対応性も証明する。
全体として、この研究は階級の不安定性と二部類系のユニークな振る舞いに光を当てている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:42:13 GMT)
Cluster Analysis and Concept Drift Detection in Malware [1.4] 概念ドリフト(concept drift)とは、機械学習モデルの精度に影響を与えるデータの特性の漸進的または突然の変化を指す。
マルウェア領域におけるコンセプトドリフトを検出するためのクラスタリングに基づく手法を提案し,解析する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:42:30 GMT)
Non-Euclidean Hierarchical Representational Learning using Hyperbolic Graph Neural Networks for Environmental Claim Detection [1.4] トランスフォーマーベースのモデルは、感情分析、機械翻訳、クレーム検証といったNLPタスクを支配している。
本研究では,環境クレーム検出のための軽量かつ効果的な代替手段として,グラフニューラルネットワーク(GNN)とハイパーボリックグラフニューラルネットワーク(HGNN)を探索する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:04:59 GMT)
ML-Dev-Bench: Comparative Analysis of AI Agents on ML development workflows [1.4] 本稿ではML-Dev-Benchについて述べる。ML-Dev-Benchは機械学習開発タスクにおけるエージェント機能のテストを目的としたベンチマークである。
我々は、30のタスクの多様なセットでReAct、Openhands、AIDEの3つのエージェントを評価します。
コミュニティの利益のためのベンチマークをオープンソースにしています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:09:01 GMT)
Design an Ontology for Cognitive Business Strategy Based on Customer Satisfaction [1.4] オントロジー(オントロジー、英: Ontology)は、特定の領域で情報を共有したい研究者によって用いられる一般的な用語である。
本研究は,顧客計測と従来のビジネスモデルを結びつける認知オントロジーモデルを設計することを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:29:23 GMT)
PTB-Image: A Scanned Paper ECG Dataset for Digitization and Image-based Diagnosis [1.2] スキャンされた紙ECGと対応するデジタル信号からなるデータセットであるTB-Imageを紹介する。
また、紙ベースのECGをデジタル時系列信号に変換するデジタル化ベースラインであるVinDigitizerも提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:56:27 GMT)
Words are not Wind -- How Public Joint Commitment and Reputation Solve the Prisoner's Dilemma [1.2] 囚人のジレンマにおける共同コミットメントの機能について検討する。
間接的相互性に類似した評価システムを提案する。
この結果、私的に判断を下しても安定した協力が得られます。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:16:38 GMT)
Carefully Blending Adversarial Training, Purification, and Aggregation Improves Adversarial Robustness [1.2] CARSOは、防御のために考案された適応的なエンドツーエンドのホワイトボックス攻撃から自身を守ることができる。
提案手法は,Cifar-10,Cifar-100,TinyImageNet-200の最先端技術により改善されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:39:54 GMT)
Dynamic directed functional connectivity as a neural biomarker for objective motor skill assessment [1.2] 本研究では,神経バイオマーカーとしての動的指向性機能接続(dFC)に基づく運動能力評価手法を提案する。
脳波(EEG)は脳のダイナミクスを捉え、注意に基づくLong Short-Term Memory(LSTM)モデルを用いて非線形グランガー因果解析を行う。
次に、畳み込みニューラルネットワーク(CNN)を使用してスキルレベルを分類し、腹腔鏡下手術で確立されたパフォーマンス指標よりも高い精度と特異性を達成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:51:39 GMT)
Token Adaptation via Side Graph Convolution for Temporally and Spatially Efficient Fine-tuning of 3D Point Cloud Transformers [1.2] 本稿では,近隣グラフ(STAG)上でのサイドトークン適応と呼ばれる,3次元点群変換器のための新しいPEFTアルゴリズムを提案する。
STAGは、下流タスクにトークンを適用するために、凍結バックボーントランスフォーマーと並行して動作するグラフ畳み込みサイドネットワークを使用している。
我々は、さまざまな公開3Dポイントクラウドデータセットからなる新しいベンチマークであるPoint Cloud Classification 13 (PCC13)を提示する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:58:56 GMT)
Zero loss guarantees and explicit minimizers for generic overparametrized Deep Learning networks [1.2] 勾配降下を起こすことなくゼロ損失最小化器を明示的に構築する。
以上の結果から,低パラメタライズドDLと過パラメタライズドDLにおけるゼロ損失到達率の2分断に関する重要な側面が明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:31:05 GMT)
Learning conformational ensembles of proteins based on backbone geometry [1.2] 本稿では,背骨形状のみに基づくタンパク質コンホメーションをサンプリングするためのフローマッチングモデルを提案する。
結果として得られたモデルは、現在の最先端アプローチよりも桁違いに高速で、数日間でスクラッチからトレーニングできる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:16:27 GMT)
Learning to explore when mistakes are not allowed [1.2] 本研究では,悪質なミスを犯すリスクを伴わずに探索する目標条件付き行動の学習を可能にする手法を提案する。
リスクのない探査はパラドックス的に見えるが、環境力学はしばしば宇宙で均一である。
本手法をシミュレーション環境で評価し,目標空間のかなりのカバレッジを提供するだけでなく,ミスの発生を最小限に抑えることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:11:51 GMT)
Universal scaling of Green's functions in disordered non-Hermitian systems [1.2] グリーン関数によって正確に記述された非エルミート系の線形応答について検討する。
外部摂動に対する最大応答を定量化するグリーン関数の行列要素の平均最大値は、異なるスケーリング挙動を特徴とする異なる位相を示す。
我々の研究は、非エルミート皮膚効果とアンダーソン局在の予期せぬ相互作用を強調している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:22:57 GMT)
Near-extremal dumb holes and some aspects of the Hawking effect [1.2] 極端および準極端ブラックホールから放射されるアナログホーキング放射のバック・リアクション効果について検討した。
我々は,背景流体速度の低下につながる急激なホーキング力の存在を推察する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:04:44 GMT)
Kernel Mean Embedding Topology: Weak and Strong Forms for Stochastic Kernels and Implications for Model Learning [1.1] 我々はカーネルに対するカーネル平均埋め込みトポロジーと呼ばれる新しいトポロジーを弱強形式で導入する。
このトポロジーにはいくつかの性質があり、最適性、近似、頑健性、連続性の研究が理想的であることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:19:41 GMT)
Fighter Jet Navigation and Combat using Deep Reinforcement Learning with Explainable AI [1.0] 本稿では,Pygameシミュレーション環境における人工知能(AI)ベースの戦闘機エージェントの開発について述べる。
ジェットの主な目的は、環境を効率的にナビゲートし、目標に達すること、敵を選択的に攻撃または回避することである。
その結果、80%以上のタスク完了率を示し、効果的な意思決定を実証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:14:27 GMT)
Heterophily-Aware Fair Recommendation using Graph Convolutional Networks [1.0] 我々は,アイテム側のフェアネスを改善するために,HetroFairと呼ばれる公正なGNNベースのレコメンデーションシステムを提案する。
HetroFairは2つの別々のコンポーネントを使用して、フェアネスを意識した埋め込みを生成する。
実験の結果,HetroFairはアイテム側の不公平さや人気バイアスを軽減するだけでなく,ユーザ側の精度も向上することがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:15:17 GMT)
Decoherence-induced self-dual criticality in topological states of matter [1.0] 混合状態における自己双対対称性(理論物理学の基本概念)の役割について論じる。
トーリック符号の2次元バルクからの電気的および磁気的渦のデコヒーレンスが、(1+1)Dの量子臨界混合状態を残すことができることを示す。
フェミオン相互作用や非干渉コヒーレント変形による不整合雑音による自己双対の明示的な破れは、RGクロスオーバーを誘導する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:00:02 GMT)
Hybrid Visual Servoing of Tendon-driven Continuum Robots [1.0] 本稿では、腱駆動連続体ロボット(TDCR)の制御のためのハイブリッドビジュアルサーボ(HVS)アプローチを提案する。
HVSシステムは、画像ベースのビジュアルサーボ(IBVS)とディープラーニングベースのビジュアルサーボ(DLBVS)を組み合わせて、各メソッドの制限を克服する。
このアプローチの有効性はシミュレーションや実世界の実験を通じて検証され、HVSはDLBVS単独と比較して、イテレーション時間短縮、収束の高速化、最終エラーの低減、スムーズなパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:35:41 GMT)
CARE: Confidence-Aware Regression Estimation of building density fine-tuning EO Foundation Models [1.0] モデル信頼度認識回帰推定(CARE)を開発し, 訓練し, 評価する
モデルCAREは回帰出力結果に信頼度を計算し割り当てる。
提案したCAREモデルと、建物の密度を推定するためのCopernicus Sentinel-2衛星コンステレーションのデータに関する実験結果について評価した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:02:00 GMT)
Finitely many worlds with finite information flow and Bell theorem [0.9] 空間的に分離された最大絡み合った2つの量子ビット上での射影測定の局所モデルとして、単純なpsi-epistemic, many-worldsを導入する。
ランダム性のため、モデルは2つの分岐と有限情報フローしか必要としない。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:19:08 GMT)
Atomic Proximal Policy Optimization for Electric Robo-Taxi Dispatch and Charger Allocation [0.9] 我々は,ロビータキシーを用いた配車システムの動作を,無限の地平線を持つ離散時間平均報酬マルコフプロセスとしてモデル化する。
艦隊規模が大きくなるにつれて、システム状態のセットと艦隊派遣行動のセットが車両数とともに指数関数的に増加するため、派遣は困難である。
我々は,原子間行動分解による行動空間の低減を図る,スケーラブルな深層強化学習アルゴリズムAtomic Proximal Policy Optimization(Atomic-PPO)を導入する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:05:23 GMT)
DeepSeek-V3, GPT-4, Phi-4, and LLaMA-3.3 generate correct code for LoRaWAN-related engineering task [0.8] 本稿では,LoRaWAN関連エンジニアリングタスクの自動化における大規模言語モデル(LLM)の性能について検討する。
これを評価するため、GPT-4やDeepSeek-V3といった最先端のモデルと比較した。
結果、DeepSeek-V3 と GPT-4 は一貫して正確な解を提供していたが、Phi-4 と LLaMA-3.3 は高い性能を示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:16:29 GMT)
Multi-Scale and Multi-Objective Optimization for Cross-Lingual Aspect-Based Sentiment Analysis [0.8] 言語間ABSAのための新しいフレームワークであるMulti-Scale and Multi-Objective Optimization (MSMO)を提案する。
我々は、異なる文脈環境におけるアスペクト項の特徴を整合させて、言語間の文レベルとアスペクトレベルのアライメントを実現する。
その結果,MSMOは複数の言語やモデルにまたがって最先端の性能を実現することで,言語間ABSAを著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:43:33 GMT)
SNN-Driven Multimodal Human Action Recognition via Event Camera and Skeleton Data Fusion [0.8] マルチモーダル・ヒューマン・アクション認識のための新しいスパイキングニューラルネットワーク(SNN)駆動のフレームワークを提案する。
本フレームワークは,(1)モダリティごとに異なるバックボーンネットワークを利用する新しいマルチモーダルSNNアーキテクチャ,(2)SNNに基づく離散化情報ボトルネック機構のパイオニアである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:50:51 GMT)
Secret extraction attacks against obfuscated IQP circuits [0.8] 我々は,新しいアプローチの双方に対して有効な秘密抽出攻撃を多数開発した。
Bremner氏、Cheng氏、Ji氏が発行したチャレンジデータセットに隠された300ビットのシークレットを復元する方法がいくつかあります。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:35:46 GMT)
Why You've Got Mail: Evaluating Inbox Privacy Implications of Email Marketing Practices in Online Apps and Services [0.7] 本研究は,メールアドレスなどの個人情報を利用者の同意なく共有・販売できるという認識の広汎化を考察する。
私たちは、最も人気のある150のオンラインサービスやアプリにサインアップした後、ユーザーが受信したメールのソース、ボリューム、頻度、内容を収集し、分析しました。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:47:03 GMT)
The dark side of the forces: assessing non-conservative force models for atomistic machine learning [0.7] 顕微鏡シミュレーションにおける非保守モデルの適用性について検討する。
エネルギー保存の欠如は、学習し、制御し、正しいことが難しい。
直接力評価によって得られる加速度を利用する最善の方法は、それを保守的なモデルと組み合わせて使うことであるかもしれない。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:48:32 GMT)
On the Addressability Problem on CSS Codes [0.6] 非ゼロレートのCSS符号は論理的H, HP, PH, CNOTを論理的量子ビットの任意の空でない厳密な部分集合に対応できないことを示す。
CNOTとCZの2つの高速コード間で同様のノーゴー結果を示すことができる。
この研究は、主に符号の自己同型を考えることによって、量子符号における距離保存アドレス可能性の研究の先駆者となった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:18:52 GMT)
Accurate Simulation of the Hubbard Model with Finite Fermionic Projected Entangled Pair States [0.6] 2次元ハバードモデルの基底状態の正確なシミュレーションを行うため,有限サイズのフェルミオン射影対状態と変分モンテカルロを併用して実演する。
我々の研究は、2次元ハバードモデルの物理と関連する問題を解くために有限サイズのフェルミオンテンソルネットワークの力を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:04:20 GMT)
Generalization Bounds for Dependent Data using Online-to-Batch Conversion [0.6] 混合プロセスから抽出したサンプルに基づいて学習したバッチ学習アルゴリズムの一般化誤差を上限とする。
私たちの仕事は、バッチ学習者に対する安定性の仮定を一切必要としません。
我々は、オンライン学習アルゴリズムの教科書ファミリーであるEWAアルゴリズムが、我々の新しい安定性の概念を満たすことを証明した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:27:10 GMT)
Personalized Education with Generative AI and Digital Twins: VR, RAG, and Zero-Shot Sentiment Analysis for Industry 4.0 Workforce Development [0.6] gAI-PT4I4は、学生の理解を評価するために感情分析を採用し、生成AIと有限オートマトンを利用して学習体験をカスタマイズする。
このフレームワークは、Interactive Tutorを特徴とするVRベースのトレーニングのために、低忠実なDigital Twinsを統合している。
LLMを用いたゼロショット感情分析と、エンジニアリングの促進により、学生と教師の相互作用を肯定的または否定的に分類する精度が86%に達する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:11:19 GMT)
Entity Decomposition with Filtering: A Zero-Shot Clinical Named Entity Recognition Framework [0.6] フィルタリングによるエンティティ分解(EDF)という新しいフレームワークを導入する。
私たちのキーとなるアイデアは、エンティティ認識タスクをいくつかのエンティティサブタイプの検索に分解し、それらをフィルタリングすることです。
分析の結果,EDFを用いた未発見物体の認識精度が大幅に向上したことが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:51:20 GMT)
LIDDIA: Language-based Intelligent Drug Discovery Agent [0.5] LIDDiAは、サイリコの薬物発見過程をインテリジェントにナビゲートできる自律エージェントである。
臨床的に関係のある30の標的の70%以上において、重要な医薬品基準を満たす分子を生成することができる。
がんにとって重要な標的であるEGFR上で、有望な新しい薬物候補を特定できる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:56:12 GMT)
MambaLiteSR: Image Super-Resolution with Low-Rank Mamba using Knowledge Distillation [0.5] MambaLiteSRは、Vision Mambaのアーキテクチャを利用する、新しい軽量画像スーパーリゾリューション(SR)モデルである。
我々は,MambaLiteSRが15%少ないパラメータを用いて,ベースラインモデルと他のエッジモデルに匹敵する性能を実現することを示す。
また、訓練中の低エネルギー使用を維持しながら、最先端のSRエッジモデルと比較して消費電力を最大58%改善する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:32:03 GMT)
Intelligent Tutors for Adult Learners: An Analysis of Needs and Challenges [0.5] 本研究は,自己指導型学習環境における知的学習システムの導入と利用に影響を与える社会技術的要因について考察する。
本稿では,成人学習者の独特なニーズに対処するために設計された,知的学習システムであるApprentice Tutorsを紹介する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:08:14 GMT)
2.5D U-Net with Depth Reduction for 3D CryoET Object Identification [0.5] 我々は,CZII-CryoETオブジェクト識別コンペティションから,第4位のソリューションを紹介した。
提案手法は,2種類の2.5D U-Netモデルのアンサンブルと深度低減を用いたヒートマップに基づくキーポイント検出手法を採用した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:13:08 GMT)
Towards Active Participant Centric Vertical Federated Learning: Some Representations May Be All You Need [0.5] 本研究は, VFL, Active Participant Centric VFL (APC-VFL) に対する新しいアプローチを紹介する。
APC-VFLは、参加者間のデータサンプルがトレーニング時に部分的に整列している場合のシナリオで優れている。
これは、F1、精度、通信コストの点で、一般的な3つのVFLデータセットで、他のVFLメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:38:12 GMT)
Efficient Safety Retrofitting Against Jailbreaking for LLMs [0.5] 直接選好最適化 (DPO) は, 選好データに基づく学習により, LLM を好ましい出力に向けて操る, 効率的なアライメント手法である。
本稿では,データ要求とトレーニングコストを最小限に抑えつつ,DPOの脱獄攻撃に対するモデル安全性の有効性について検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:33:18 GMT)
A Framework for Building Point Cloud Cleaning, Plane Detection and Semantic Segmentation [0.5] 私たちは、取得したポイントクラウドデータからアウトリーチを取り除くことに集中しています。
クリーニング処理の後、ロバストなRANSACパラダイムを用いて平面検出を行う。
結果として得られたセグメントは、建物のアーキテクチャ要素を表す正確で詳細なポイントクラウドを生成することができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:57:20 GMT)
Stability of classical shadows under gate-dependent noise [0.5] クラフォードゲート安定化器を含む影推定は、有界雑音回路に対して安定であることを示す。
いわゆるロバストな影は、未緩和の古典的な影に比べてゲート依存のノイズを大量に生じさせることが判明した。
あるレベルでは、影の推定に影響を及ぼす平均ノイズチャンネルを特定し、よりきめ細かなノイズ誘発バイアスの制御を可能にする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:40:21 GMT)
The Energy Cost of Artificial Intelligence of Things Lifecycle [0.4] 我々は,AIライフサイクルのエネルギーコスト(eCAL)という新しい指標を提案する。
eCALは、AI駆動の無線システムのアーキテクチャコンポーネントとライフサイクルを通して、エネルギー消費をキャプチャする。
モデルが良くなるほど、それが使われるほど、推論のエネルギー効率が増すことが示される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:23:57 GMT)
Formal verification in Solidity and Move: insights from a comparative analysis [0.4] SolidityとMoveは、異なる設計と検証アプローチを備えた2つのコントラクト言語である。
本稿では,2つの言語が検証にどのように影響するか,また2つの言語に対する検証ツールの現状について検討する。
我々の調査は、CertoraとAptos Move Proverで実施された検証タスクのオープンデータセットによって支援されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:06:01 GMT)
Evaluating Large Language Models for Public Health Classification and Extraction Tasks [0.4] 本稿では,自由テキストの分類と抽出を含む公衆衛生業務におけるLarge Language Models(LLMs)の評価について述べる。
ゼロショット・イン・コンテクスト学習を用いて,全タスクにまたがるオープンウェイトLLMを11個評価した。
LLMが公衆衛生の専門家にとって、様々な無料テキストソースから情報を抽出するのに有用なツールであることを示す有望な兆候を見出した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:11:10 GMT)
Refining embeddings with fill-tuning: data-efficient generalised performance improvements for materials foundation models [0.3] フィルチューニング」は基礎モデルの事前トレーニングを継続するためのデータセットを生成する新しい手法である。
我々は、O(109)$データポイントでトレーニングされた一連の最先端の材料基盤モデルにフィリングを適用する。
データポイントを100点加えるだけで、ダウンストリームタスクのほぼ1%のモデル改善を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:17:13 GMT)
FragFM: Efficient Fragment-Based Molecular Generation via Discrete Flow Matching [0.3] 分子グラフ生成のためのフラグメントベースの離散フローマッチングフレームワークであるFragFMを紹介する。
FragFMは断片レベルで分子を生成し、原子レベルの詳細を再構築するために粗大から細い自己エンコード機構を利用する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:01:00 GMT)
Understanding Individual-Space Relationships to Inform and Enhance Location-Based Applications [0.3] 本稿では,個人と環境の多面的関係について検討する。
訪問パターンや居住時間を利用して個人と特定の場所との関係を特徴付けるのは、これが初めてである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:36:06 GMT)
MGFI-Net: A Multi-Grained Feature Integration Network for Enhanced Medical Image Segmentation [0.3] 医用画像のセグメンテーションにおける大きな課題は、ノイズ、低コントラスト、複雑な解剖学的構造の存在に対する関心領域の正確な記述を実現することである。
既存のセグメンテーションモデルは、多粒度情報の統合を無視し、エッジの詳細を保存できないことが多い。
我々は,Multi-Grained Feature Integration Network (MGFI-Net)と呼ばれる新しい画像セマンティックセマンティクスモデルを提案する。
私たちのMGFI-Netは、これらの問題に対処するための2つの専用のモジュールで設計されています。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:24:34 GMT)
Varco Arena: A Tournament Approach to Reference-Free Benchmarking Large Language Models [0.3] VARCO Arenaは、大規模言語モデルのための新しく、費用対効果が高く、堅牢なベンチマーク手法である。
VARCO Arenaは信頼性の高いLCMランキングを生成するだけでなく、質的評価のためのスケーラブルで適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 01:34:31 GMT)
Adopting Whisper for Confidence Estimation [0.3] 本稿では,ASRモデル自体(Whisper)を利用して単語レベルの信頼度を生成する手法を提案する。
我々の実験は、サイズが強いCEMベースラインに匹敵する微調整のWhisper-tinyモデルが、ドメイン内のデータセットで同様の性能を達成し、8つのドメイン外のデータセットでCEMベースラインを上回ることを実証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:45:28 GMT)
Multi-Target Radar Search and Track Using Sequence-Capable Deep Reinforcement Learning [0.3] この研究はレーダーシステムのセンサタスク管理に対処する。
強化学習を用いて、複数のターゲットを効率的に探索し、追跡することに焦点を当てている。
重要な貢献は、強化学習がセンサー管理をどのように最適化できるかを示すことである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:55:38 GMT)
Dynamic Activation with Knowledge Distillation for Energy-Efficient Spiking NN Ensembles [0.3] 本研究では、知識蒸留とアンサンブル学習を組み合わせた新しいシステムを導入し、人工知能ニューラルネットワーク(ANN)とSNNのパフォーマンスギャップを埋める。
基礎的AIモデルは教師ネットワークとして機能し、スパイキングニューラル・アンサンブル(SNE)と呼ばれる小学生のSNNをアンサンブルに編成する。
SNEは教師ネットワークよりもはるかに効率的で、CIFAR-10データセットの精度をわずか2%低下させるだけで、計算要求を最大20倍削減できる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:50:08 GMT)
Some Insights of Construction of Feature Graph to Learn Pairwise Feature Interactions with Graph Neural Networks [0.2] グラフニューラルネットワーク(GNN)のための特徴グラフ構築における両面相互作用に着目し,その重要性について検討する。
我々は、GNNが機能間の相互作用を効果的にモデル化できるようにするために、相互作用する機能間のエッジが重要であることを明らかにした。
また、非相互作用エッジを含む場合、ノイズとして機能し、モデル性能を劣化させることも観察する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:47:23 GMT)
Ten Recommendations for Engineering Research Software in Energy Research [0.2] エネルギー研究ソフトウェア(Energy Research Software、ERS)は、エネルギー研究を促進する中心的な基盤である。
多くの場合、ERSはソフトウェア工学の正式なトレーニングを欠いている研究者によって開発されている。
これによりERSの品質が低下し、制限と再利用性が向上する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:57:55 GMT)
Diagnosing chaos with projected ensembles of process tensors [0.2] 我々は,プロセステンソルの純粋状態のアンサンブルを局所的介入に基づいて導入し,よりきめ細かい量子カオスのプローブを定義する。
エンサンブル内の特徴的な絡み合い構造は、量子力学とエンテンポピーの欠陥を克服し、積分可能力学と急激なカオスを区別することができる。
我々の研究は、相互作用する量子プロセスにおけるカオスの指紋を解明し、ユニタリおよびモニタリングされた多体ダイナミクスを解析するための統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:06:07 GMT)
GroundCap: A Visually Grounded Image Captioning Dataset [0.2] 本稿では,一貫したオブジェクト参照追跡とアクションオブジェクトリンクを可能にする新しいIDベースグラウンドシステムを提案する。
77本の映画から52,016枚の画像を含むデータセットであるGroundCapについて,344個の人称注釈と52,016個の字幕を自動生成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:31:59 GMT)
Complex Ontology Matching with Large Language Model Embeddings [0.2] 本稿では,大規模言語モデル(LLM)を表現的対応を生成するアプローチに統合することを提案する。
対応の生成は、例のサブグラフの類似した環境をマッチングすることによって行われる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:56:27 GMT)
Benchmarking of Different YOLO Models for CAPTCHAs Detection and Classification [0.2] 本稿では,WebページCAPTCHA検出のためのYOLOv5,YOLOv8,YOLOv10モデルの解析と比較を行う。
本研究は, YOLOアーキテクチャのナノ (n), 小 (s), 中 (m) 変種について検討し, 精度, リコール, F1スコア, mAP@50, 推測速度などの指標を用いて実生活の実用性を決定する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:05:50 GMT)
Digit quantum simulation of a fermion field in an expanding universe [0.2] この研究では、膨張する宇宙における自由フェルミオンという基本的なシナリオが考慮されている。
量子シミュレーションは進化し、関連する現象を研究するために用いられる。
拡散現象は、運動量赤方偏移の結果であるシミュレーションで観察できる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:23:47 GMT)
Global Ease of Living Index: a machine learning framework for longitudinal analysis of major economies [0.2] 世界経済の急激な変化、地政学的状況、新型コロナウイルス(COVID-19)のパンデミックなどの破壊は、生活費や生活の質に影響を与えている。
本稿では, 生活の質を, 社会経済的・インフラ的要因を1つの複合スコアに組み合わせたGlobal Ease of Living Indexを通じて定量化する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:59:23 GMT)
Bayesian Comparisons Between Representations [0.2] 中間表現からの線形読み出しの予測分布に関する基礎的比較を提案する。
先行予測分布は、モデルの帰納バイアスと一般化の完全な記述である。
ImageNet-1kで訓練されたディープニューラルネットワークを用いた新しい手法を実演する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:55:44 GMT)
Decentralized Planning Using Probabilistic Hyperproperties [0.2] 一つのエージェントが環境の中でどのように機能するかを記述したMDPと、望ましい時間的目的を捉えるための確率的超越性を用いて記述する。
このことは、確率論的超正当性検証の分野において、既存の分散化された計画ツールの使用の基礎を成している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:59:02 GMT)
Zero-Shot Commonsense Validation and Reasoning with Large Language Models: An Evaluation on SemEval-2020 Task 4 Dataset [0.2] 本研究では,SemEval-2020 Task 4データセット上でのLarge Language Models(LLM)の性能を評価する。
モデルは、タスクA(Commonsense Validation)とタスクB(Commonsense Explanation)の2つのタスクでテストされる。
結果、LLaMA3-70BはタスクAで98.40%の最高精度を達成し、タスクBで93.40%の旧モデルより遅れていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:40:49 GMT)
Backpropagation-free Spiking Neural Networks with the Forward-Forward Algorithm [0.1] Spiking Neural Networks (SNN)は、離散スパイクベースの処理を通じて神経活動をエミュレートする生物学的にインスパイアされた計算パラダイムを提供する。
これらの利点にもかかわらず、従来のバックプロパゲーション(BP)を用いたSNNのトレーニングは、計算の非効率性と生物学的妥当性の欠如により、依然として困難である。
本研究では,SNNの代替学習フレームワークとして,フォワードフォワード(FF)アルゴリズムについて検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:44:26 GMT)
Autograding Mathematical Induction Proofs with Natural Language Processing [0.1] 本稿では,自由形式の数学的証明を自動分解できる一連のトレーニング手法とモデルを提案する。
モデルは、誘導問題によって4つの異なる証明から収集された証明データを用いて訓練される。
我々は、トレーニングデータと同じ証明を格付けするために、人間のグルーパーを雇い、最高のグルーパーモデルが、ほとんどの人間のグルーパーよりも正確であることに気付きました。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:18:20 GMT)
Poisoned Source Code Detection in Code Models [0.1] CodeGarrison(CG)は,有毒なコードサンプルを識別するために,コードの埋め込みに依存するハイブリッドディープラーニングモデルである。
その結果、CGは93.5%の精度でONIONを大きく上回った。
また、未知の攻撃に対してCGの堅牢性をテストし、平均精度は85.6%に達した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:16:07 GMT)
pySLAM: An Open-Source, Modular, and Extensible Framework for SLAM [0.0] pySLAMは、Visual SLAMのためのオープンソースのPythonフレームワークである。
モノクロ、ステレオ、RGB-Dカメラに対応している。
pySLAMはコミュニティのコントリビューションを促進し、Visual SLAMの分野での共同開発を促進する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:27:07 GMT)
Whitney extensions on symmetric spaces [0.0] 1934年、H・ホイットニーは、周囲空間上の解析函数に$mathbbRn$の点の集合上の函数を拡張する問題を提起した。
本稿では、ある同次空間上のデータに対するホイットニー型拡張定理を証明する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:47:37 GMT)
Where are the marathon Girls?: An Analysis of Female Representation in the Brazilian ICPC Programming Marathons [0.0] プログラミングマラソンは長年にわたって成長し、プログラマがコーディングの課題を解決するために競うイベントである。
性別に知的差はないという科学的証拠があるが、女性の参加は比較的低い。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:15:04 GMT)
Using Constraints to Discover Sparse and Alternative Subgroup Descriptions [0.0] サブグループ発見法により、ユーザはデータセットで興味深い領域の簡単な記述を取得できる。
まず、サブグループ記述で使用される機能の数を制限し、後者はスパース化します。
第二に、与えられたサブグループと類似したデータオブジェクトの集合をカバーするが、異なる特徴を持つ代替サブグループ記述を見つけるための新しい最適化問題を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:25:01 GMT)
Two-Level System Nanomechanics in the Blue-Detuned Regime [0.0] 本研究では,2レベルシステムに結合したメカニカル発振器について検討した。
弱い機械的減衰では、力学的な不安定さがサイクルの制限につながる。
フォノン数の変動は驚くほど類似した振る舞いを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:22:05 GMT)
Tweezer-assisted subwavelength positioning of atomic arrays in an optical cavity [0.0] 我々は, 87Rb原子の欠陥のないアレイを, 微視的光学的立位波キャビティ内に形成する。
制御能力を活用して、最大7個の原子の配列を、従来の確率的手法を4桁の精度で上回る効率で組み立てる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:14:09 GMT)
TreeCut: A Synthetic Unanswerable Math Word Problem Dataset for LLM Hallucination Evaluation [0.0] 無限に答えられない数学語問題とその解答可能な問題を生成するデータセットであるTreeCutを紹介する。
実験の結果、TreeCutはGPT-4oやo3-miniなどの大規模言語モデルにおいて、それぞれの最悪のシナリオで61%と42%の確率で幻覚を効果的に誘発することが示された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:38:45 GMT)
Towards a perturbation-based explanation for medical AI as differentiable programs [0.0] 医学や医療では、AIモデルが生み出す結果の十分かつ客観的な説明可能性に対して、特に要求がある。
本研究では,入力に加わった小さな摂動に対するモデル応答を安定に測定する,ディープラーニングモデルのヤコビ行列の数値的可用性について検討する。
これは摂動に基づく説明への第一歩であり、臨床応用におけるAIモデルの反応を理解し解釈する医療実践者を支援する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:56:23 GMT)
Towards a Robust Quality Assurance Framework for Cloud Computing Environments [0.0] 現在のQAフレームワークは定義が不十分で、自動化されていないことが多く、オンデマンドのクラウドベースの環境に必要な柔軟性が欠如している。
本稿では、クラウドコンピューティングシステムにおけるQAの詳細な枠組みと、標準化、自動化、適応可能なシステムの提唱について述べる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:29:24 GMT)
Towards Hard and Soft Shadow Removal via Dual-Branch Separation Network and Vision Transformer [0.0] 本稿では,ハードとソフトの影を別々に処理するデュアルパスモデルを提案する。
モデルはシャドウタイプを分類し、それらを適切な経路で処理し、シャドウフリーな出力を生成する。
我々のモデルは最先端の手法より優れ、ISTDデータセット上で2.905 RMSE値を達成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:30:17 GMT)
Stochastic Security as a Performance Metric for Quantum-enhanced Generative AI [0.0] 深部エネルギーベースモデル(EBM)は、トレーニングと推論の両方で連続ドメインギブをサンプリングする必要がある。
量子ギブスサンプリングアルゴリズムを実行できるフォールトトレラントな量子コンピュータの代わりに、モンテカルロ法による拡散過程のシミュレーションを古典的な代替として利用する。
その結果,ギブスサンプリングの計算予算の増大は,モデルのキャリブレーションと対角ロバスト性を両立させることがわかった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:11:03 GMT)
Speech to Speech Translation with Translatotron: A State of the Art Review [0.0] カスケードに基づく音声から音声への翻訳は、非常に長い間、ベンチマークとみなされてきた。
例えば、ある言語から別の言語へのスピーチの翻訳に要する時間と、複雑なエラーなどである。
Translatotronは、Googleがこれらの問題に対処するために設計したものである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:39:35 GMT)
Solving the Encoding Bottleneck: Of the HHL Algorithm, By the HHL Algorithm [0.0] HHL(Harrow-Hassidim-Lloyd)アルゴリズムは、量子線形系問題を解くために指数的スピードアップを提供する。
ここでは,HHLアルゴリズム自体をわずかに修正したバージョンを用いることで,約$O(log N)$のランタイムで状態が作成可能であることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:39:41 GMT)
Simplifying Formal Proof-Generating Models with ChatGPT and Basic Searching Techniques [0.0] 本稿では,ChatGPTと基本探索技術を統合し,形式的証明の簡易化について検討する。
私たちはChatGPTのような大きな言語モデルとLeanのような形式的な言語を組み合わせることで、検証可能なメリットが加わり、形式的な証明生成の効率性とアクセシビリティが向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:52:46 GMT)
SemiHMER: Semi-supervised Handwritten Mathematical Expression Recognition using pseudo-labels [0.0] ラベル付きデータと追加ラベル付きデータの両方を探索し,半教師付き手書き数式認識(HMER)について検討した。
本稿では,二分岐半教師付き学習を導入した新しい一貫性正規化フレームワークであるSemiHMERを提案する。
実験結果から,本研究は大幅な性能向上を実現していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:52:10 GMT)
Semi-supervised classification of bird vocalizations [0.0] 鳥類の個体数の変化は生態系の広範な変化を示す可能性がある。
時間重なり合う鳴き声を検出するための半教師付き音響鳥検知器を提案する。
平均F0.5スコアは315のクラスで0.701で、110種の鳥類をホールドアウトテストセットで記録する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 05:31:13 GMT)
Semantic Decomposition and Selective Context Filtering -- Text Processing Techniques for Context-Aware NLP-Based Systems [0.0] 本稿では,文脈認識システムにおいてセマンティック分解と選択コンテキストフィルタリングという2つの手法を提案する。
我々は,この2つの手法を用いて動的LLM-to-systemインタフェースを実現する方法について検討する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:09:40 GMT)
Secure quantum bit commitment from separable operations [0.0] 分割可能な操作のみを行うようにコミット当事者に制限を課すことで、セキュアな量子ビットコミット方式が実現可能であることを示す。
具体的には、完全に隠蔽されたビットコミットプロトコルにおいて、分割可能な操作に制限された正直なコミットパーティが、コミットを変更しようとする場合、高い確率で検出されることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:59:52 GMT)
Searching Axion-like Dark Matter by Amplifying Weak Magnetic Field with Quantum Zeno effect [0.0] 量子ゼノ効果(QZE)による核スピンを用いた磁場信号の増幅を理論的に提案する。
ダークマターとエキゾチックな相互作用の新たな制約を確立するための実験の設計に有用なガイダンスを提供する可能性がある。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:09:11 GMT)
Scaling up to Problem Sizes: An Environmental Life Cycle Assessment of Quantum Computing [0.0] 本稿は、特定のスケーリング条件下での量子コンピュータと量子エラー訂正符号の環境上の優位性を、利用時間がいかに促進するかを示す。
その結果、量子エラー補正ハードウェアは、100個の論理量子ビットを達成するのに必要な多数の電子部品のために、環境に重大な影響を与えることが強調された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:14:53 GMT)
SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering? [0.0] SWE-LancerはUpworkの1,400以上のフリーランスソフトウェアエンジニアリングタスクのベンチマークである。
独立したタスクは、経験豊富なソフトウェアエンジニアによって三度検証されたエンドツーエンドのテストによって評価される。
モデル性能を評価し、フロンティアモデルが依然としてほとんどのタスクを解決できないことを発見した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:48:26 GMT)
Reconfigurable topological lasing through Thouless pumping in bilayer photonic crystal [0.0] 本稿では,Thouless ポンピングと再構成可能なLasingを二層型フォトニック結晶に組み込んだプログラム可能なフォトニックプラットフォームを提案する。
これら2つの状態における結晶間のヘテロ接合は、境界を越えて位相相転移から生じる界面モードをサポートする。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:40:25 GMT)
Recipes for the Digital Quantum Simulation of Lattice Spin Systems [0.0] 本稿では,局所的な相互作用を持つ正則格子上に量子スピン系のディジタル量子シミュレーションアルゴリズムを構築する方法について述べる。
スピン系の最も重要なケースやクラスに対して、資源推定と量子回路要素を提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:56:55 GMT)
Quantum simulation of a qubit with non-Hermitian Hamiltonian [0.0] 我々は、反復量子シミュレーション法の限界を回避するために、固定深さ変分回路を用いる。
この結果は、変分量子回路と機械学習が量子シミュレーションの境界を押し上げる可能性を強調している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:42:08 GMT)
Quantum reversal: a general theory of coherent quantum absorbers [0.0] コヒーレント量子吸収器は 他の系から放出される光子を吸収できる その系との絡み合いを維持しながら
この研究は、2つのシステムに対していわゆる逆条件を提案することによって、この概念を一般化する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:25:39 GMT)
Quantum reference frames and particle mixing [0.0] 混合粒子のレストフレームを定義しようとする際の量子参照フレームの必要性と出現について論じる。
我々は、フレーム依存的絡み合いの概念と、それが混合中間子とニュートリノの測定に与える影響を分析する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:20:01 GMT)
Quantum geometric tensor determines the i.i.d. conversion rate in the resource theory of asymmetry for any compact Lie group [0.0] 非対称性の資源理論(英: resource theory of asymmetric, RTA)は、非対称性を研究するための資源理論の枠組みである。
量子幾何テンソルは、最適近似変換率を決定する純粋状態に対する非対称性モノトンであることを示す。
また、RTAの可逆可換性について、Marvian-Spekkens予想を肯定的に証明する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:08:33 GMT)
Quantum decision trees with information entropy [0.0] 本稿では,決定木法に着想を得た量子状態の分類アルゴリズムを提案する。
未知の量子状態で撮影された各測定値に対して、アルゴリズムは最も期待される情報ゲインで観測可能なものを選択し、収束するまで続く。
回路ベースの量子ニューラルネットワークには依存していないが、このアルゴリズムはいまだに不毛の高原問題に似た課題に直面している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:05:14 GMT)
Quantum Unitary Matrix Representation of Lattice Boltzmann Model for Low Reynolds Fluid Flow Simulation [0.0] 低レイノルズ数系における流体流動をシミュレートするための格子ボルツマン法(LB法)の量子アルゴリズムを提案する。
我々は,9から12キュービットの試験ケースに対して,2キュービット制御NOT(CNOT)と1キュービットUゲートの計数を行い,グリッドサイズは24から216点である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:54:19 GMT)
Quantum Effects in Ion Transport: A Thermodynamic Resource Theory Approach [0.0] 非マルコビアン性は、イオン輸送過程の収量と効率を高める重要な量子資源として機能することを示す。
対照的に、イオン輸送タンパク質のエネルギー状態の重畳として表される量子コヒーレンスは、これらの指標を減少させるが、イオンチャネルとイオンポンプの区別において重要な役割を果たす。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:24:53 GMT)
Prompting a Weighting Mechanism into LLM-as-a-Judge in Two-Step: A Case Study [0.0] 言語モデル(LLM)は、自然言語生成(NLG)タスクを評価するための有望なツールとして登場した。
本研究は,この制限に対処し,ケーススタディを提供するための効率的なプロンプト設計機構を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:09:55 GMT)
Probability Bracket Notation: Markov Sequence Projector of Visible and Hidden Markov Models in Dynamic Bayesian Networks [0.0] 均一なマルコフ連鎖(HMC)の進化公式を拡張するためにマルコフ系列プロジェクタ(MSP)を導入する。
隠れマルコフモデル(HMM)では、隠れマルコフ状態列の確率基底(P基底)と観測系列のP基底がシーケンシャル事象空間に存在する。
ビタビアルゴリズムは有名な気象-音波HMMの例に適用され、最も可能性の高い気象状態のシーケンスを決定する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:09:18 GMT)
Pre-detection squeezing as a resource for high-dimensional Bell-state measurements [0.0] 本稿では,高次元状態に対するスケーラブルなベル計測手法を提案し,線形光回路に適用して異なるベル状態の識別を行う。
量子状態の次元によって制限されず、実験的にスケーラブルであるため、有効な高次元ベル測定の実現に向けた道を開くことができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:40:16 GMT)
Position: There are no Champions in Long-Term Time Series Forecasting [0.0] 我々は、より複雑なモデルを追求することから、ベンチマークプラクティスの強化へと焦点を移す必要があることに重点を置いています。
クレームをサポートするために、私たちはまず、14のデータセットに3500以上のネットワークをトレーニングすることで、最も人気のあるベンチマークで最高のパフォーマンスのモデルを広く、徹底し、再現可能な評価を行います。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:08:37 GMT)
Polarization tensor in spacetime of three dimensions and quantum field theoretical description of the nonequilibrium Casimir force in graphene systems [0.0] グラフェンの偏極テンソルは数学的に等価だが、実周波数軸に沿って形成されるよりコンパクトで便利な計算で再キャストされる。
提示された形式主義の利点は、非平衡カシミール力の例に示される。
得られた偏極テンソルの形式は、グラフェン系における様々な物理現象の研究に有用である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:18:40 GMT)
Playing Hex and Counter Wargames using Reinforcement Learning and Recurrent Neural Networks [0.0] HexとCounter Wargamesは、複雑な戦略決定を必要とする実際の軍事紛争の敵対的な2人のプレイヤーシミュレーションである。
本稿では,HexとCounter Wargamesの戦略的複雑さに対処する新しいシステムを提案する。
このシステムは、信頼性の高い現代強化学習アルゴリズムであるAlphaZeroを用いて、リカレントニューラルネットワークにおける最先端の進歩を取り入れている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:52:45 GMT)
PLDR-LLMs Learn A Generalizable Tensor Operator That Can Replace Its Own Deep Neural Net At Inference [0.0] 我々は,$mathbfG_LM$ (G-cache) と KV-cache のキャッシュを,推論時間を改善するために簡単な方法で実装可能であることを示す。
我々は,KV-cacheとG-cacheを用いたPLDR-LLMのためのトレーニングおよび推論フレームワークの実装を提供する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:43:36 GMT)
Orbital Wigner functions and quantum transport in multiband systems [0.0] マルチバンドフェルミオン系における量子コヒーレント物理を正確に捉えた「軌道ウィグナー関数」に基づく輸送形式を導入する。
我々は、軌道ウィグナー関数が従来のボルツマン理論を超える電子力学の強い非平衡特性を正確に捉えることを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:00:00 GMT)
On-demand generation of entangled photons pairs in the telecom O-band from nanowire quantum dots [0.0] テレコム波長におけるオンデマンド光子対は、量子通信に不可欠である。
我々は、サイト制御ナノワイヤ量子ドットに基づく通信Oバンドにおいて、高い忠実度を持つ光子対のオンデマンド明るい光源を実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:53:24 GMT)
On the locality of qubit encodings of local fermionic modes [0.0] フェルミオンモードをボゾン量子ビット系に符号化する既知の写像は非局所変換である。
正確な符号化の場合、局所性グラフが木である場合に限り、完全局所写像が可能であることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:29:35 GMT)
OGBoost: A Python Package for Ordinal Gradient Boosting [0.0] OGBoostはScikit-learn互換のPythonパッケージで、勾配ブースティングを用いた順序回帰を行う。
パッケージはPyPIで利用可能で、"pip install ogboost"経由でインストールできる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:06:12 GMT)
No-Signaling in Steepest Entropy Ascent: A Nonlinear Non-local Non-equilibrium Quantum Dynamics of Composite Systems [0.0] リンドブレディアン形式主義は「ボトムアップ」アプローチを用いて開量子系をモデル化し、システム-環境相互作用から線形力学を導出する。
本稿では,システム構造,サブシステム間の相互作用,環境影響に着目した「トップダウン」アプローチを提案する。
第二法則の要件(ギブス状態が唯一の安定均衡である)を組み込むことは、非線形力学を必要とすることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:17:42 GMT)
New Quantum Algorithm For Solving Linear System of Equations [0.0] 勾配降下法に基づく線形系を解くための新しい量子アルゴリズムを提案する。
ベクトル/密度状態形式にインスパイアされた我々は、密度状態のような実体として点またはベクトルを表現する。
中間解に対応する演算子は、証明可能な収束保証とともに反復的に更新される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 11:08:56 GMT)
Neural Green's Operators for Parametric Partial Differential Equations [0.0] この研究は、線形偏微分方程式(PDE)のパラメトリック族に対する解演算子を学習する新しいニューラル演算子ネットワークアーキテクチャであるニューラルグリーン演算子(NGO)を導入する。
NGOはディープ・オペレーター・ネットワーク(DeepONets)や可変ミメティック・オペレーター・ネットワーク(VarMiONs)に類似している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:20:19 GMT)
NaturalTurn: A Method to Segment Transcripts into Naturalistic Conversational Turns [0.0] ナチュラルトゥール(NaturalTurn)は、自然主義交換の力学を正確に捉えるために設計されたターンセグメンテーションアルゴリズムである。
本研究では,NaturalTurnから派生した転写産物が,既存の方法から派生した転写産物と比較して,統計的および推論的特性が良好であることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:21:02 GMT)
NEAR: A Training-Free Pre-Estimator of Machine Learning Model Performance [0.0] 本研究では,アクティベーションランク(NEAR)によるゼロコストプロキシテキストネットワーク表現を提案し,トレーニングなしで最適なネットワークを識別する。
このネットワークスコアとNAS-Bench-101とNATS-Bench-SSS/TSSのモデル精度の最先端相関を実証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:04:20 GMT)
Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention [0.0] マルチモーダル感情認識は、特に同期、特徴抽出、多様なデータソースの融合において重要な課題に直面します。
本稿では,Audio-Video Transformer Fusion with Cross Attention (AVT-CA)という新しいトランスモデルを提案する。
AVT-CAは,実践的応用のための正確で信頼性の高いマルチモーダル感情認識システムの開発において重要であることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:29:24 GMT)
Multi-Objective Bayesian Optimization for Networked Black-Box Systems: A Path to Greener Profits and Smarter Designs [0.0] MOBONSは、一般関数ネットワークを効率的に最適化できるベイズ最適化に着想を得た新しいアルゴリズムである。
持続可能なプロセス設計を含む2つのケーススタディを通じて,MOBONSの有効性を実証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:49:05 GMT)
Monogamy of Nonlocal Games [0.0] また,CHSHゲームにおける非局所性は,元々の2プレイヤーシナリオと,ライン上の4プレイヤーシナリオの2つのケースでのみ生じることを示す。
これは、量子エンタングルメントの単ガマスの性質の影響を受けない非局所ゲームの最初の例である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:37:36 GMT)
Mesh-based Super-Resolution of Fluid Flows with Multiscale Graph Neural Networks [0.0] メッシュベースの流体の3次元超解像を可能にするグラフニューラルネットワーク(GNN)アプローチが本研究で導入された。
このフレームワークでは、GNNは一度に完全なメッシュベースのフィールドでではなく、要素(またはセル)の局所的なメッシュで動くように設計されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:27:58 GMT)
Linear-time classical approximate optimization of cubic-lattice classical spin glasses [0.0] 短距離古典スピングラスは線形時間とテンソル-ネットワーク空間で概ね最適化可能であることを示す。
我々のアルゴリズムは大規模並列化に適しており、フォトニック行列乗算ハードウェアによる低消費電力で高速化された実装も可能である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:35:34 GMT)
Linear Diffusion Networks: Harnessing Diffusion Processes for Global Interactions [0.0] 本稿では、逐次データ処理を統一拡散プロセスとして再解釈する新しいアーキテクチャである線形拡散ネットワーク(LDN)を提案する。
本モデルでは,適応拡散モジュールと局所的な非線形更新と拡散に着想を得た注意機構を統合した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 22:13:55 GMT)
Learning the P2D Model for Lithium-Ion Batteries with SOH Detection [0.0] 畳み込みニューラルネットワーク(CNN)サロゲートモデルは、ランダムな運転サイクルのクラスからのデータを正確にシミュレートするのに適していることを示す。
我々はCNNがリチウムイオン濃度プロファイルを正確に捉えるのに理想的な選択であることを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 23:17:30 GMT)
Learning Is a Kan Extension [0.0] 従来の研究は、Kan拡張の計算に効率的なアルゴリズムが存在することを示した。
本稿では,全ての誤り最小化アルゴリズムをKan拡張として提示できることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:25:44 GMT)
Large-scale free-space photonic circuits in two dimensions [0.0] フォトニック回路は、特定の地図に従って光モードを2つに分けて設計され、古典的および量子的な光のプロセッサとして機能する。
本稿では,大規模ユニタリマップを自由空間に実装し,単一入力を数百の出力モードに2次元のコンパクトレイアウトで結合する技術を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:59:11 GMT)
LLM should think and action as a human [0.0] マルチターン会話では、ユーザプロンプト毎に、チャット履歴、思考コンテキスト、アクションコール、メモリ、知識といった要素に基づいて、大きな言語モデルを考える。
実験結果から,大規模言語モデルの推論能力と計画能力が向上し,マルチターン会話における課題が解決された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:58:34 GMT)
Inference of Abstraction for Grounded Predicate Logic [0.0] AIにおける重要なオープンな疑問は、シンプルで自然な原理によって、機械が基底記号で意味のある抽象化を論理的に論理的に行うことができるかである。
本稿では,確率論的推論とデータ上の述語的推論を組み合わせ,概念的に新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:07:34 GMT)
Improving Collision-Free Success Rate For Object Goal Visual Navigation Via Two-Stage Training With Collision Prediction [0.0] 衝突のない成功は、航法モデルが対象物に向かって衝突のない経路を見つける能力を評価するために導入された。
既存の航法モデルの衝突のない成功率を改善するために,衝突予測を伴う2段階の訓練手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:33:10 GMT)
Identifying Dealbreakers and Robust Policies for the Energy Transition Amid Unexpected Events [0.0] エネルギー輸入の混乱、社会的受容の反発、開発に失敗した新しい技術は、エネルギー計画においてしばしば見過ごされる予期せぬ出来事である。
本研究では,予期せぬ事象を探索し,大規模な全エネルギーシステムの遷移経路に与える影響を評価する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:25:29 GMT)
Human-Artificial Interaction in the Age of Agentic AI: A System-Theoretical Approach [0.0] 本稿では,ヒューマン・コンピュータ・インタラクション(HCI, Human-Computer Interaction)の新たな視点について述べる。
マルチエージェントシステム(MAS)とセンタウリアンシステム(Centaurian system)は、人間とAIのコラボレーションの2つのパラダイムを表す。
我々の研究は、自律ロボット工学、ヒューマン・イン・ザ・ループの意思決定、AI駆動の認知アーキテクチャに実践的な応用がある。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:55:34 GMT)
High-dimensional manifold of solutions in neural networks: insights from statistical physics [0.0] ニューラルネットワークに対する統計力学のアプローチを概観し、連立的な重み付きパーセプトロンアーキテクチャのパラダイム的な例に注目した。
ゼロトレーニングエラー構成が幾何学的にどのように配置されているかを明らかにする最近の研究について論じる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:39:39 GMT)
Hierarchy of degenerate stationary states in a boundary-driven dipole-conserving spin chain [0.0] 動的に制約されたスピン鎖は、孤立量子系における構造化エルゴディディディティの破れのプロトタイプとして機能する。
このような系は、非コヒーレントポンプと境界における損失によって駆動されるとき、退化定常状態の階層を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:02:33 GMT)
Hands-on STEM Learning Experiences using Digital Technologies [0.0] 本研究の目的は,イタリア学校で実施した経験と活動について,この新たなアプローチで概説することである。
学生がコラボレーション、創造性、批判的思考、実験、プロトタイピング、コミュニケーション、問題解決など、様々なコア能力を開発するプロジェクトや経験の選択が議論された。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:28:22 GMT)
Geometric Principles for Machine Learning of Dynamical Systems [0.0] 本稿では,構造的一般化を実現するために,構造に富む幾何学的空間を機械学習に活用することを提案する。
本稿では,線形時間不変力学系の機械学習を通して,この考え方を説明する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:28:40 GMT)
Generalized Wigner-Smith analysis of resonance perturbations in arbitrary $Q$ non-Hermitian systems [0.0] 摂動共振系は、複素平面における関連する散乱極の変化を引き起こす。
我々は、Wigner-Smith形式と標準電磁摂動理論の結果を結びつけることによってこのアプローチを拡張した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:38:47 GMT)
Finding Optimal Trading History in Reinforcement Learning for Stock Market Trading [0.0] 本稿では,2次元畳み込みニューラルネットワーク(CNN)を用いた金融深層学習(DRL)モデルにおける時間窓の最適化について検討する。
本稿では,時間領域をハイパーパラメータとして扱う新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:24:59 GMT)
FedCC: Robust Federated Learning against Model Poisoning Attacks [0.0] フェデレートラーニング(Federated Learning)は、プライバシの問題に対処するために設計された分散フレームワークである。
新たなアタックサーフェスを導入しており、データは独立に、そしてIdentically Distributedである場合、特に困難である。
我々は,モデル中毒に対する簡易かつ効果的な新しい防御アルゴリズムであるFedCCを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:48:59 GMT)
Exponential Improvement on Asian Option Pricing Through Quantum Preconditioning Methods [0.0] アジアオプションの価格設定に使用される微分方程式を解くために設計された量子アルゴリズムを提案する。
提案手法は,アジアのオプション価格の問題に対して,既存の量子プレコンディショニング手法を改良したものである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:25:10 GMT)
Event Segmentation Applications in Large Language Model Enabled Automated Recall Assessments [0.0] イベントセグメンテーションは、経験を知覚し、エンコードし、リコールする方法の中心です。
現在の研究手法は、セグメンテーションパターンとリコール能力を評価するために人間に大きく依存している。
大規模言語モデル(LLM)を利用してイベントセグメンテーションの自動化とリコールの評価を行う。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 00:48:51 GMT)
Evaluation of EAS directions based on TAIGA HiSCORE data using fully connected neural networks [0.0] 我々は,モンテカルロシミュレーションによるTAIGA HiSCOREデータをガンマ量子としてトレーニングした人工ニューラルネットワークを用いて,シャワー方向推定を行う。
最終推定値の平均誤差は0.25度未満である。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:12:37 GMT)
Enhancing Machine Learning Potentials through Transfer Learning across Chemical Elements [0.0] 機械学習ポテンシャル(MLP)は、計算コストの桁違いでアブ初期精度のシミュレーションを可能にする。
ここでは化学的に類似した元素間のポテンシャルエネルギー表面の移動学習を紹介する。
我々は,伝達学習が力予測のスクラッチから従来の訓練を超越し,より安定なシミュレーションと温度伝達性の向上をもたらすことを実証した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:20:54 GMT)
Engineering Quantum Reservoirs through Krylov Complexity, Expressivity and Observability [0.0] この研究は、量子貯水池計算におけるタスク性能を理解するために、Krylovに基づく情報測度を用いている。
我々は,量子系の短時間進化におけるタスク性能を,忠実度と拡散複雑性によって説明できることを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:48:30 GMT)
Emergent spinon-holon Feshbach resonance in a doped Majumdar-Ghosh model [0.0] ドープMGモデルの単一ホール角分解光電子スペクトル(ARPES)について検討した。
本研究では, ARPESスペクトルにおけるスピン-ホロン基底状態とスピン-ホロン分子状態とポラロンの明確なシグネチャを異なる磁化で報告する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:41:21 GMT)
Emergence of realism through quantum discord suppression in photonic weak measurements [0.0] 我々は、量子相関がリアリズムの出現にどのように影響するかを調べるために、弱い測定を受けるヴェルナー状態の実験を実施する。
弱い量子不協和と呼ばれる弱い測定によって引き起こされる量子不協和の抑制は、リアリズムの出現を誘導することを示した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:10:06 GMT)
Efficient Hamiltonian encoding algorithms for extracting quantum control mechanism as interfering pathway amplitudes in the Dyson series [0.0] ハミルトニアン符号化は、制御量子系を管理する力学の背後にあるメカニズムを明らかにするための方法論である。
本稿では,経路クラスの振幅を計算する2つの新しい符号化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 03:26:55 GMT)
Early-Stage Anomaly Detection: A Study of Model Performance on Complete vs. Partial Flows [0.0] 本研究では,部分フロー情報と完全フロー情報の臨界レンズによるネットワーク異常検出における機械学習モデルの有効性について検討した。
完全フローでトレーニングされたモデルが部分フローに対してテストされた場合,性能差が顕著であることを示す。
本研究は,信頼性の高い検出率を維持するためには,テストセット内の最低7個のパケットが必要であることを明らかにした。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 15:25:31 GMT)
Dissipative mean-field theory of IBM utility experiment [0.0] IBMは超伝導量子コンピュータを使用して、多数の量子ビットと時間ステップで蹴られた量子イジングモデルをシミュレートした。
簡単な平均場近似の視点で実験を解析する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:12:38 GMT)
Digital-Analog Quantum Computation with Arbitrary Two-Body Hamiltonians [0.0] デジタルアナログ量子コンピューティング(Digital-analog quantum computing)は、アナログハミルトン資源と単一量子ゲートを併用した計算パラダイムである。
我々は、任意の2体源ハミルトニアンを用いた新しいスキームを設計し、この計算パラダイムの実験的適用性をほとんどの量子プラットフォームに拡張する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:39:47 GMT)
Diffusion Model Agnostic Social Influence Maximization in Hyperbolic Space [0.0] インフルエンス・最大化(IM)問題は、ソーシャルネットワークに広がる影響力を最大化するために、少数の影響力のあるユーザーを見つけることを目的としている。
従来の手法は、既知のパラメータを持つ固定拡散モデルに依存しており、それらの一般化を現実のシナリオに限定している。
本稿では,ハイパーボリック表現学習を利用してユーザへの影響を推定する,新しい拡散モデル非依存手法であるHIMを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 09:24:28 GMT)
Detecting high-dimensional entanglement and characterization of quantum channels using moments of the generalized positive maps [0.0] 量子状態のシュミット数を決定することに焦点をあて、高次元の絡みを検知するための基準を提案する。
提案手法は実実験で効率的にシミュレートできる一般化された正の写像のモーメントを評価することに依存する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:23:15 GMT)
Description of ultrastrong light-matter interaction through coupled harmonic oscillator models and their connection with cavity-QED Hamiltonians [0.0] 共振器フォトンが双極子物質励起に結合するナノフォトニクス系の光および赤外応答について検討した。
結合調和振動子モデルの適切な選択は、量子モデルにおける反磁性項の有無に依存することを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 12:20:34 GMT)
Deep Learning for VWAP Execution in Crypto Markets: Beyond the Volume Curve [0.0] Volume-Weighted Average Price (VWAP) は、おそらく取引実行の最も一般的なベンチマークである。
VWAPの達成は、ボリュームと価格の2つの動的要因に依存しているため、本質的に困難である。
本稿では,ボリューム曲線予測の中間段階をバイパスすることで,VWAP実行目標を直接最適化するディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 13:49:51 GMT)
Decoherence of surface phonons in a quantum acoustic system [0.0] 超伝導トランスモン量子ビットに強く結合した表面音響波(SAW)共振器に閉じ込められたフォノンのデコヒーレンスについて検討した。
表面の音速エネルギー減衰速度は$kappa_1/2pi=480$kHz、純粋に$kappa_phi/2pi=180$kHzである。
本稿では,SAW系量子音響デバイスにおけるデコヒーレンスの発生源と今後の量子音響散逸技術実験への応用について論じる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:25:45 GMT)
Correcting and extending Trotterized quantum many-body dynamics [0.0] 量子的手法と古典的手法の強みを組み合わせたハイブリッドアンサッツを開発した。
このハイブリッドアンサッツは量子回路のSWAPゲートを回避できることを示す。
また、量子デバイス上の量子ビットの数を一定に保ちながら、システムサイズをいかに拡張できるかを示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:50:12 GMT)
Compact quantum algorithms for time-dependent differential equations [0.0] 我々は、ユニタリの線形結合に基づくアイデアに基づいて、非ユニタリで非エルミート量子系をシミュレートする。
我々は,行列ベクトル乗算と行列逆演算を効率的に行うハイブリッド量子古典アルゴリズムを生成する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:35:41 GMT)
Comment on "Optimal conversion of Kochen-Specker sets into bipartite perfect quantum strategies" [0.0] Trandafir and Cabello (Phys. Rev. A, 111, 022408 (2025) の最近の論文には、多くの誤り、矛盾、非効率性が含まれている。
リストに載るには多すぎるので、コメントの本体でそれらを識別し、議論する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 14:54:41 GMT)
Coherence analysis of phase-controlled HOM effects [0.0] ボーソニックとフェルミオンのHOM効果に対して、経路に絡み合った2光子状態が実験的に実証されている。
これらの相制御HOM効果に対する一般解を導出するために純粋コヒーレンス法を適用した。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:03:39 GMT)
Bridging Entanglement and Magic Resources through Operator Space [0.0] LOEは常に、$T$-count, Unitary nullity, 演算子安定化器R'enyエントロピーの3つの異なるマジックモノトンによって上界にあることを示す。
私たちの境界の直接的な系は、量子カオス力学は古典的にシミュレートできないということである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:00:33 GMT)
Bound states of quasiparticles with quartic dispersion in an external potential: WKB approach [0.0] Wentzel-Kramers-Brillouin法は, 準粒子に対して, モーメンタム分散で定式化されている。
禁止領域と許容領域の一致する波動関数には高次エアリー型関数の考慮が必要であることが示されている。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:50:49 GMT)
Bell correlations between momentum-entangled pairs of $^4\text{He}^*$ atoms [0.0] 対相関粒子間の非局所絡み合いは、量子力学の非常に反直観的な側面である。
ベルの不等式フレームワークは、光子や原子内部状態におけるそのような絡み合いのデモンストレーションを可能にした。
運動量に絡み合った超低温ヘリウム原子の運動状態におけるベル相関の実験的観察を報告する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 04:10:09 GMT)
Beam splitters as controlled-Z gate for hybrid state [0.0] 非局所光子を加え、いくつかの光子を減らして最初の単モード圧縮真空を絡ませるスキーム。
実効的な量子効率で検出する光子数解法の下で発生した絡み合いの十分な堅牢性を示す。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 06:28:40 GMT)
Batayan: A Filipino NLP benchmark for evaluating Large Language Models [0.0] Batayanは3つの主要な自然言語処理能力(NLP)にまたがる大規模言語モデル(LLM)を評価するために設計された総合的なベンチマークである。
我々の厳密でネイティブな話者主導のアノテーションプロセスは、フィリピンの複雑な形態的・統語的構造への流布と信頼を保証する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:03:15 GMT)
Asymptotic Freedom of Two Heavy Impurities in a Bose-Einstein Condensate [0.0] ボース・アインシュタイン凝縮体(BEC)における2つの重い不純物の自己エネルギーを計算する
様々な有効ポテンシャルは、対応する条件下でのポーラロンエネルギーから現れる。
我々は,不純物が十分に近接している限り,反発支配性ポーラロンが存在することを明らかにした。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 02:04:02 GMT)
Analyzing Logs of Large-Scale Software Systems using Time Curves Visualization [0.0] 従来の知識を使わずに,異なるアプリケーションから収集したログのメインイベントを,我々のアプローチで説明できることが示される。
その結果、パフォーマンスボトルネックとセキュリティリスクを特定するのに必要な時間の大幅な削減が期待できる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 08:36:35 GMT)
An Open-Source Web-Based Tool for Evaluating Open-Source Large Language Models Leveraging Information Retrieval from Custom Documents [0.0] 本稿では,対話エージェントとの会話中にユーザの発話行為が与える影響を実演できる,オープンソースのWebベースツールについて紹介する。
研究者や専門家は、様々な対話のパフォーマンスを評価し、ユーザのコミュニケーション意図を視覚化し、チャットエージェントにアップロードされた特定の文書を利用して情報検索を行うことができる。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 19:36:25 GMT)
An Enhancement of Cuckoo Search Algorithm for Optimal Earthquake Evacuation Space Allocation in Intramuros, Manila City [0.0] Cuckoo Search Algorithm (ECSA) は複雑な最適化問題を解くために提案されている。
アルゴリズムの性能を13のベンチマーク関数で評価した。
ECSAはその後、マニラのイントラミューロスで地震避難スペース割り当てを最適化するために適用される。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 07:01:23 GMT)
All you need is Trotter [0.0] ここでの作業は、$rm polylog (1/epsilon)$を維持しながら、進化時間$t$で線形コストスケーリングを可能にし、追加のブロックエンコーディングスケーリングキュービットは、$epsilon$がアルゴリズムエラーである。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:34:52 GMT)
Abstraction requires breadth: a renormalisation group approach [0.0] 抽象化のレベルは、トレーニングセットがどの程度広いかに大きく依存する、と私たちは主張する。
我々は、抽象表現の候補として、この変換のユニークな固定点、階層的特徴モデル(hierarchical Feature Model)を取り上げます。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 10:27:03 GMT)
AI-Driven Discovery of High Performance Polymer Electrodes for Next-Generation Batteries [0.0] 電池における遷移基金属の使用は、リチウム、コバルト、ニッケルといった重要な元素を広範囲に使用する必要がある。
これらの金属を酸化還元活性有機材料に置き換えることで、電池の炭素フットプリントを1桁減らすことができる。
低い電圧と特定の容量の制限を克服するために、機械学習駆動の電池情報処理フレームワークを開発し、実装する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 17:32:17 GMT)
AI Thinking as a Meaning-Centered Framework: Reimagining Language Technologies Through Community Agency [0.0] AI Thinkingは、技術開発を変革する意味中心のフレームワークを提案する。
文化的理解、コミュニティエージェンシー、技術革新の相互作用を通じて有意義な解決策が生まれることを認識している。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 18:09:24 GMT)
A generalized dual potential for inelastic Constitutive Artificial Neural Networks: A JAX implementation at finite strains [0.0] 非弾性構成型ニューラルネットワーク(iCANN)のための一般化二重ポテンシャル(擬似ポテンシャル)の設計手法を提案する。
このポテンシャルは、大きな変形に対する熱力学的一貫性を本質的に満足する。
その結果,新しいアーキテクチャは解釈可能なモデルやパラメータを頑健に発見し,非弾性の度合いを自律的に明らかにした。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 20:16:45 GMT)
A Supervised Machine-Learning Approach For Turboshaft Engine Dynamic Modeling Under Real Flight Conditions [0.0] 本研究では、レオナルドのAW189P4プロトタイプのターボシャフトエンジンをモデル化するための異なるニューラルネットワークアーキテクチャについて検討する。
これらのモデルは、様々な操作を含む実飛行テストの広範なデータベースで訓練されている。
ニューラルネットワークのアプローチを補完するために,SINDy(Sparse Identification of Dynamics)を用いて低次元力学モデルを導出する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 21:45:53 GMT)
A Frontier AI Risk Management Framework: Bridging the Gap Between Current AI Practices and Established Risk Management [0.0] 最近の強力なAIシステムの開発は、堅牢なリスク管理フレームワークの必要性を強調している。
本稿では,フロンティアAI開発のための包括的リスク管理フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Feb 2025 16:05:47 GMT)