Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model [133.0] 我々は、30Bationalパラメータと最大204フレームの動画を生成する機能を備えた、テキストからビデオまでの事前トレーニングモデルであるStep-Video-T2Vを提案する。
Vari Autoencoder (Vari Autoencoder, Video-VAE) はビデオ生成タスク用に設計されており、16x16空間圧縮比と8x時間圧縮比を達成している。
Step-Video-T2Vのパフォーマンスは、新しいビデオ生成ベンチマークであるStep-Video-T2V-Evalで評価され、最先端のテキスト・ビデオの品質を示している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:12:11 GMT)
DBudgetKV: Dynamic Budget in KV Cache Compression for Ensuring Optimal Performance [125.8] 我々はDBudgetKVと呼ばれる新しいKVキャッシュ圧縮手法を提案する。
これは、残りのKVキャッシュがフルキャッシュのパフォーマンスにマッチしそうにない場合に、注意に基づくメトリクスを信号として、プルーニングプロセスを停止させる。
提案手法は,メモリ空間を最適化するだけでなく,既存の手法に比べて推論時間を短縮する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:33:39 GMT)
Contrastive Visual Data Augmentation [119.5] 大規模なマルチモーダルモデル(LMM)は、訓練済みの知識に依存し、微妙な視覚的詳細を捉える能力に制限があるため、しばしば新しい概念を認識するのに苦労する。
本稿では,LMMの視覚的特徴と言語との整合性を改善するために,Contrastive visual Data Augmentation(CoDA)戦略を提案する。
CoDAは、認識されていない既知の概念に対して、ターゲット概念の重要な対照的なテキスト的特徴と視覚的特徴を抽出し、ターゲットとなる合成データを生成するために、マルチモーダル生成モデルを使用する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:05:31 GMT)
Scaling Diffusion Language Models via Adaptation from Autoregressive Models [105.7] 拡散言語モデル(DLM)は、テキスト生成モデルのための将来性のある新しいパラダイムとして登場した。
170Mから7BまでのARモデルをDiffuGPTとDiffuLLaMAの拡散モデルに変換し、200B未満のトークンでトレーニングできることを示す。
実験の結果,これらのモデルは初期のDLMよりも優れており,ARと競合していることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:36:30 GMT)
Deep Learning for Camera Calibration and Beyond: A Survey [100.8] カメラキャリブレーションでは、キャプチャされたシーケンスから幾何学的特徴を推測するために、カメラパラメータを推定する。
近年の取り組みでは,手動キャリブレーションの繰り返し作業に代えて,学習ベースのソリューションが活用される可能性が示唆されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:40:11 GMT)
METAL: A Multi-Agent Framework for Chart Generation with Test-Time Scaling [100.3] 視覚言語モデル(VLM)をベースとした,効率的な自動チャート生成のためのマルチエージェントフレームワークを構築した。
グラフ生成のタスクを特殊エージェント間の反復的協調に分解するマルチエージェントフレームワークMETALを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:01:39 GMT)
PICASO: Permutation-Invariant Context Composition with State Space Models [98.9] State Space Models (SSM) は、コンテキストのデータベースを固定次元の状態にマッピング可能にすることで、有望なソリューションを提供する。
本稿では,テキストコンテキストの連結による影響を効率的に近似する,複数の状態を構成するためのSSM力学から導出した単純な数学的関係を提案する。
我々は,WikiText と MSMARCO をゼロショットと微調整の両方で評価し,平均5.4倍のスピードアップを楽しみながら最強の演奏ベースラインと一致できることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:48:00 GMT)
ESPnet-SpeechLM: An Open Speech Language Model Toolkit [98.5] 音声言語モデル(SpeechLMs)の開発を民主化するオープンツールキットであるESPnet-SpeechLMを提案する。
このツールキットは、音声処理タスクを普遍的な逐次モデリング問題としてフレーミングすることで標準化する。
ESPnet-SpeechLMを使用すると、ユーザーはタスクテンプレートを簡単に定義し、キー設定を設定することができ、シームレスで合理化されたSpeechLM開発が可能になる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:31:58 GMT)
Data-free Weight Compress and Denoise for Large Language Models [96.7] パラメータ行列を圧縮する手法として,データフリーなジョイントランクk近似を提案する。
キャリブレーションデータなしで、元の性能の93.43%を維持しながら80%のパラメータのモデルプルーニングを実現する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:41:18 GMT)
Towards Certification of Uncertainty Calibration under Adversarial Attacks [96.5] 攻撃はキャリブレーションを著しく損なう可能性を示し, 対向的摂動下でのキャリブレーションにおける最悪のキャリブレーション境界として認定キャリブレーションを提案する。
我々は,新しいキャリブレーション攻撃を提案し,テクスタディバーショナルキャリブレーショントレーニングによりモデルキャリブレーションを改善する方法を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:29:29 GMT)
LongSafety: Evaluating Long-Context Safety of Large Language Models [95.2] LongSafetyは、オープンエンドのロングコンテキストタスクの安全性を評価するために設計された最初のベンチマークである。
評価の結果,安全性の重大な脆弱性が明らかとなり,ほとんどのモデルが55%未満の安全性を達成できた。
本研究は,長期間の安全性向上の難しさと緊急性を強調した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:54:39 GMT)
Neuro-Symbolic Integration Brings Causal and Reliable Reasoning Proofs [95.1] LLMの複雑な推論には2行のアプローチが採用されている。
1行の作業は様々な推論構造を持つLLMを誘導し、構造出力は自然に中間推論ステップと見なすことができる。
他方の行では、LCMのない宣言的解法を用いて推論処理を行い、推論精度は向上するが、解法のブラックボックスの性質により解釈性に欠ける。
具体的には,Prologインタプリタが生成した中間検索ログにアクセスし,人間可読推論に解釈可能であることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:33:46 GMT)
Stable-SPAM: How to Train in 4-Bit More Stably than 16-Bit Adam [94.0] 低ビット精度は感度学習率を増幅し、しばしば不安定な勾配ノルムを引き起こす。
本研究では, 勾配正規化とクリッピングを併用したスタブルSPAMを提案する。
実験により,Stable-SPAMは4ビットトレーニングの勾配ノルムを効果的に安定化し,AdamやSPAMよりも優れた性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:09:15 GMT)
HarmAug: Effective Data Augmentation for Knowledge Distillation of Safety Guard Models [92.9] 本研究では,大規模な教師の安全ガードモデルを,バイナリ有害度ラベル付き命令応答ペアのラベル付きデータセットを用いて,より小さなモデルに蒸留する。
本稿では,LLMをジェイルブレイクして有害な命令を発生させる単純なデータ拡張手法であるHarmAugを提案する。
私たちのHarmAugは、70億以上のパラメータを持つ大規模モデルに匹敵するF1スコアを達成し、計算コストの25%未満で運用しながら、AUPRCでそれを上回るパフォーマンスを実現しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:14:13 GMT)
Quriosity: Analyzing Human Questioning Behavior and Causal Inquiry through Curiosity-Driven Queries [91.7] 本稿では,3つの情報源から自然発生の13.5Kの質問を集めたQuriosityを紹介する。
分析の結果,データセットに因果的疑問(最大42%)が存在することが明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:42:25 GMT)
SPA-Bench: A Comprehensive Benchmark for SmartPhone Agent Evaluation [89.2] 我々は、(M)LLMベースのエージェントを評価するために設計された総合的なSmartPhone Agent BenchmarkであるSPA-B ENCHを提案する。
SPA-B ENCH は,(1) 日常のルーチンで一般的に使用される機能に着目した,英語と中国語の両方のサードパーティアプリを対象とした多様なタスクセット,(2) Android デバイスとのリアルタイムエージェントインタラクションを可能にするプラグイン・アンド・プレイフレームワーク,(3) 複数の次元でエージェントパフォーマンスを自動的に評価する新たな評価パイプライン,の3つの重要な貢献を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:11:40 GMT)
Can Large Language Models Analyze Graphs like Professionals? A Benchmark, Datasets and Models [88.4] グラフを処理するために,大規模言語モデル(LLM)のベンチマークであるProGraphを導入する。
その結果,現在のLCMの性能は不満足であり,最高のモデルでは36%の精度しか達成できないことがわかった。
本研究では,6つの広く使用されているグラフライブラリに基づいて,クローリングされたドキュメントと自動生成コードを含むLLM4Graphデータセットを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:39:36 GMT)
Toward Agentic AI: Generative Information Retrieval Inspired Intelligent Communications and Networking [87.8] Agentic AIは、インテリジェントなコミュニケーションとネットワークのための重要なパラダイムとして登場した。
本稿では,通信システムにおけるエージェントAIにおける知識獲得,処理,検索の役割を強調する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:02:25 GMT)
Findings of the 2023 ML-SUPERB Challenge: Pre-Training and Evaluation over More Languages and Beyond [87.4] 2023年のMultilingual Speech Universal Performance Benchmark (ML-SUPERB) Challengeは、宣言されたSUPERBフレームワークに拡張される。
この挑戦は12のモデル提出と54の言語コーパスを集め、154の言語を含む包括的なベンチマークをもたらした。
この結果は、単にスケーリングモデルが多言語音声タスクにおける決定的な解決策ではないことを示唆している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:13:03 GMT)
Human Decision-making is Susceptible to AI-driven Manipulation [87.2] AIシステムは、ユーザの認知バイアスと感情的な脆弱性を利用して、有害な結果に向けてそれらを操縦する。
本研究では、経済的・感情的な意思決定の文脈におけるこのような操作に対する人間の感受性について検討した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:00:18 GMT)
Training a Generally Curious Agent [86.8] PAPRIKAは,言語モデルによる一般的な意思決定機能の開発を可能にする微調整手法である。
PAPRIKAで微調整されたモデルは、学習した意思決定能力を全く見えないタスクに効果的に移行できることを示す実験結果が得られた。
これらの結果は、新しいシーケンシャルな意思決定問題を自律的に解決できるAIシステムへの有望な道のりを示唆している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:56:58 GMT)
AutoLogi: Automated Generation of Logic Puzzles for Evaluating Reasoning Abilities of Large Language Models [86.8] 本稿では,オープンエンド論理パズルを自動合成する手法を提案し,それをバイリンガルベンチマークであるAutoLogiの開発に利用する。
提案手法は,プログラムベースの検証と制御可能な難易度を特徴とし,モデルの推論能力をよりよく区別する信頼性の高い評価を可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:02:31 GMT)
EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation [84.7] モデル圧縮問題をカスタマイズした補償問題に再構成する。
トレーニング不要な固有空間低ランク近似(EoRA)を提案する。
EoRAは、勾配ベースのトレーニングを必要とせずに、圧縮誘起エラーを直接最小化する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:44:53 GMT)
Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence [83.2] 本稿では、コーシー=シュワルツの発散と相互情報を統合することで、分布型視覚言語アライメントを実現する新しいフレームワークを提案する。
提案フレームワークでは,CSの分散と相互情報は多モーダルアライメントにおいて相補的な役割を担い,各モーダルのグローバル分布情報とペアのセマンティック関係の両方をキャプチャする。
テキスト・画像生成およびモダリティ横断検索タスクの実験により,本手法が視覚言語アライメントに与える影響を実証した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:29:15 GMT)
Scaling Optimal LR Across Token Horizons [81.3] LLMトレーニングにおいて,最適な学習速度がトークン水平線に依存することを示す。
また,LLama-1が高LRを多用した証拠も提示し,その性能を推定した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:55:34 GMT)
Unveiling Deep Shadows: A Survey and Benchmark on Image and Video Shadow Detection, Removal, and Generation in the Deep Learning Era [81.2] 光が障害物に遭遇すると影が生まれ、照度が低下する。
本稿では、画像とビデオの両方における影の検出、削除、生成に関するベンチマークを提供する。
これは過去10年間のディープラーニングアプローチに焦点を当てています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:23:43 GMT)
COSMOS: A Hybrid Adaptive Optimizer for Memory-Efficient Training of LLMs [81.0] 大規模言語モデル(LLM)は、様々な領域で顕著な成功を収めている。
それらの最適化は、彼らが居住している複雑で高次元のロスランドスケープのために重要な課題である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:42:19 GMT)
BabyLM Turns 3: Call for papers for the 2025 BabyLM workshop [77.6] BabyLMは認知モデリングと言語モデリングの境界を解消することを目的としている。
第3回BabyLMコンペティションに参加するためには,ワークショップ論文と研究者の両方が必要だ。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:49:28 GMT)
From System 1 to System 2: A Survey of Reasoning Large Language Models [76.5] 基礎的な大規模言語モデルは、迅速な意思決定では優れているが、複雑な推論には深みがない。
OpenAIのo1/o3とDeepSeekのR1は、数学やコーディングといった分野のエキスパートレベルのパフォーマンスを実証している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:50:52 GMT)
All-in-one: Understanding and Generation in Multimodal Reasoning with the MAIA Benchmark [74.5] MAIAはビデオにおける視覚言語モデルの推論能力の詳細な調査のために設計されたベンチマークである。
視覚言語モデル(VLM)を2つのタスクで評価する。
言語と視覚の関係を混乱させようとする12の推論カテゴリを考察する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:25:51 GMT)
SPARC: Score Prompting and Adaptive Fusion for Zero-Shot Multi-Label Recognition in Vision-Language Models [74.4] Zero-shot Multi-label Recognition (MLR) with Vision-Language Models (VLMs) は、トレーニングデータ、モデルチューニング、アーキテクチャの変更なしに重要な課題に直面している。
我々の研究は、VLMをブラックボックスとして扱い、トレーニングデータや地上の真実を使わずにスコアを活用する新しいソリューションを提案する。
これらのプロンプトスコアの分析により、VLMバイアスとAND'/OR信号の曖昧さが明らかになり、特に、最高スコアは2番目に高いスコアに比べて驚くほど低い。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:15:05 GMT)
Joint Localization and Activation Editing for Low-Resource Fine-Tuning [73.6] 本稿では,JoLA(Joal Localization and activation editing)法を提案する。
JoLAは(1)Transformerのどのヘッダーを編集するか、(2)介入が加法的、乗法的、または両方であるべきか、(3)介入パラメータ自体を学習する。
常識推論,自然言語理解,自然言語生成を対象とする3つのベンチマークの評価を通じて,JoLAが既存の手法を一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:52:08 GMT)
Q-VLM: Post-training Quantization for Large Vision-Language Models [73.2] 本稿では,大規模視覚言語モデル(LVLM)の学習後量子化フレームワークを提案する。
視覚言語モデル全体の離散化誤差に大きな影響を及ぼす層間依存関係を抽出し、この依存関係を最適な量子化戦略に組み込む。
実験の結果,提案手法はメモリを2.78倍圧縮し,出力速度を約13B LLaVAモデルで1.44倍向上させることができた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:36:56 GMT)
AISafetyLab: A Comprehensive Framework for AI Safety Evaluation and Improvement [73.1] 我々は、AI安全のための代表的攻撃、防衛、評価方法論を統合する統合されたフレームワークとツールキットであるAISafetyLabを紹介する。
AISafetyLabには直感的なインターフェースがあり、開発者はシームレスにさまざまなテクニックを適用できる。
我々はヴィクナに関する実証的研究を行い、異なる攻撃戦略と防衛戦略を分析し、それらの比較効果に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:11:52 GMT)
Random Latent Exploration for Deep Reinforcement Learning [71.9] RLE(Random Latent Exploration)は、強化学習における単純かつ効果的な探索戦略である。
RLEは、エージェントの行動を混乱させるノイズベースの手法と、新しい行動を試みるエージェントに報酬を与えるボーナスベースの探索を平均的に上回る。
RLEはノイズベースの手法と同じくらい単純であり、複雑なボーナス計算は避けるが、ボーナスベースの手法の深い探索の利点を保っている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:35:03 GMT)
A Survey of Geometric Graph Neural Networks: Data Structures, Models and Applications [71.8] 本稿では、幾何学的メッセージパッシングの観点から、既存のモデルの統一的なビューを提供するデータ構造として幾何学的グラフを定式化する。
また、方法論開発と実験評価の後の研究を促進するために、アプリケーションと関連するデータセットを要約する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:15:38 GMT)
FACTR: Force-Attending Curriculum Training for Contact-Rich Policy Learning [70.7] フォースフィードバックは、ほとんどのロボットアームで簡単に利用できるが、遠隔操作や政策学習では一般的には使われない。
本稿では,低コストで直感的で双方向な遠隔操作システムを提案し,従者アームの外部力を教師アームに伝える。
次に、FACTRというカリキュラムを利用した政策学習手法を導入し、学習を通して視覚入力を劣化させ、強度を低下させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:59:07 GMT)
FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research [70.7] 検索増強世代(RAG)は、かなりの研究関心を集めている。
既存のRAGツールキットは、しばしば重くて柔軟であり、研究者のカスタマイズのニーズを満たすことができない。
我々のツールキットは16の高度なRAGメソッドを実装し、38のベンチマークデータセットを収集し、整理した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:46:52 GMT)
Thus Spake Long-Context Large Language Model [70.5] ロングコンテキストは自然言語処理(NLP)において重要なトピックである
LLM(Large Language Models)は、LLMに人間に似た生涯学習の可能性を付与する大きな機会を提供する。
過去2年間で、LLMのコンテキスト長は数百万のトークンに対するブレークスルー拡張を達成した。
長文LLMの研究は、長さの外挿からアーキテクチャ、インフラ、トレーニング、評価技術への包括的焦点へと拡大した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:19:33 GMT)
PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [69.7] 本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:22:17 GMT)
Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.6] 大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。
しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。
本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:24:46 GMT)
Adding Conditional Control to Diffusion Models with Reinforcement Learning [68.1] 拡散モデルは、生成されたサンプルの特性を正確に制御できる強力な生成モデルである。
大規模なデータセットでトレーニングされたこれらの拡散モデルは成功したが、下流の微調整プロセスに新たな制御を導入する必要があることが多い。
本研究では、オフラインデータセットを用いた強化学習(RL)に基づく新しい制御手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:16:23 GMT)
Mind the Gesture: Evaluating AI Sensitivity to Culturally Offensive Non-Verbal Gestures [67.9] ジェスチャーは非言語コミュニケーションの不可欠な部分であり、文化によって異なる意味を持つ。
AIシステムがよりグローバルなアプリケーションに統合されるにつれて、文化的な犯罪が必然的に持続しないことが重要になります。
攻撃性,文化的意義,文脈的要因を付加した288のジェスチャー・カントリーペアのデータセットであるMC-SIGNS(Multi-Cultural Set of In appropriate Gestures and Nonverbal Signs)を紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:10:08 GMT)
CLIMB-3D: Continual Learning for Imbalanced 3D Instance Segmentation [67.4] 現在の手法は、自然階級の不均衡を伴う時間とともに新しいカテゴリが出現する現実的なシナリオに対処するのに苦労している。
我々はtextbfContinual textbfLearning と textbf3D インスタンスセグメンテーションのためのクラス textbfIm Balance の両方に取り組むためのフレームワークを提案する。
提案手法は,Exemplar Replay (ER), Knowledge Distillation (KD), and a novel Im Balance Correction (IC) moduleである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:58:58 GMT)
Finding the Sweet Spot: Preference Data Construction for Scaling Preference Optimization [66.7] 本研究の目的は、繰り返しランダムサンプリングにより、オンラインサンプルの数を増大させ、アライメント性能を向上させることである。
実験の結果,サンプルサイズが大きくなるにつれて,この戦略がエフェデクリンの性能向上につながることが明らかとなった。
サンプルの規模が大きくなるにつれてモデル性能を継続的に向上するスケーラブルな嗜好データ構築戦略を導入する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:22:57 GMT)
Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance [66.5] バリューガイド型ポリシーステアリング(V-GPS)は、ポリシーの重みを微調整したり、アクセスしたりすることなく、幅広い種類のジェネラリストポリシーと互換性がある。
同じ値関数は、異なるアーキテクチャで5つの最先端ポリシーの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:05:58 GMT)
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator [65.6] 大規模言語モデル(LLM)は、自然言語処理タスクの範囲で例外的な性能を示した。
特定の意味のないセパレータトークン(句読点)は意味的に意味のあるトークンと比較して注意点に不均等に寄与する。
SepLLMは,これらのセグメントを圧縮し,冗長なトークンを除去することによって推論を高速化する,プラグアンドプレイフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:42:59 GMT)
Improved Diffusion-based Generative Model with Better Adversarial Robustness [65.4] 拡散確率モデル(DPM)は、生成タスクにおいて大きな成功を収めた。
デノナイジングプロセスでは、入力データ分布はトレーニングと推論の段階によって異なる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:29:16 GMT)
Turning Conversations into Workflows: A Framework to Extract and Evaluate Dialog Workflows for Service AI Agents [65.4] 本稿では,過去の対話から対話を抽出し,評価するための新しい枠組みを提案する。
抽出プロセスは,(1)重要な手続き的要素に基づいて関連する会話を選択するための検索ステップ,(2)質問応答に基づくチェーン・オブ・シークレット(QA-CoT)プロンプトを用いた構造化ワークフロー生成プロセスの2つの主要な段階から構成される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:55:15 GMT)
On the Role of Attention Heads in Large Language Model Safety [64.5] 大規模言語モデル(LLM)は、複数の言語タスクにおいて最先端のパフォーマンスを達成するが、それらの安全ガードレールを回避できる。
モデル安全への個人的貢献を評価するため,マルチヘッド対応のための新しい指標として,安全ヘッドImPortant Score(Ships)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:31:08 GMT)
Capability Instruction Tuning: A New Paradigm for Dynamic LLM Routing [64.4] LLM(Large Language Models)は、人間のような命令追従能力を示す。
本研究では,各命令に対して最高の性能のLCMをルーティングして,全体的な性能を向上させる方法について検討する。
提案手法は,モデル能力表現,ユーザ命令,性能調査プロンプトを用いて,性能評価を行う機能命令を新たに構築する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:10:53 GMT)
Generative Models in Decision Making: A Survey [63.7] 生成モデルは、高逆状態反応領域や中間部分ゴールへエージェントを誘導する軌道を生成することによって意思決定システムに組み込むことができる。
本稿では,意思決定タスクにおける生成モデルの適用について概説する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:31:28 GMT)
WaterSeeker: Pioneering Efficient Detection of Watermarked Segments in Large Documents [63.6] WaterSeekerは、広範囲な自然テキストの中で、ウォーターマークされたセグメントを効率的に検出し、発見するための新しいアプローチである。
検出精度と計算効率のバランスが良くなる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:10:03 GMT)
Hierarchical Semantic Compression for Consistent Image Semantic Restoration [63.0] 生成モデルから固有意味空間内で純粋に機能する新しい階層意味圧縮(HSC)フレームワークを提案する。
実験の結果,提案したHSCフレームワークは人間の視力に対する主観的品質と一貫性に関する最先端の性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:20:44 GMT)
VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing [62.2] VideoGrainは、ビデオコンテンツの細かい制御を実現するために、時空を変調するゼロショット方式である。
我々は、各局所的なプロンプトの注意を対応する空間距離領域に増幅することにより、テキスト・ツー・リージョン制御を強化する。
我々は、地域内意識を高め、自己注意における地域間干渉を減らすことで特徴分離を改善する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:39:14 GMT)
Conformal Distributed Remote Inference in Sensor Networks Under Reliability and Communication Constraints [61.6] 通信制約付き分散共形リスク制御(CD-CRC)
CD-CRCは通信制約下でのセンサネットワークのための新しい意思決定フレームワークである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:23:32 GMT)
Epsilon-VAE: Denoising as Visual Decoding [61.3] 生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:54:41 GMT)
Dysca: A Dynamic and Scalable Benchmark for Evaluating Perception Ability of LVLMs [61.0] Dyscaは、合成画像を利用してLVLMを評価するための動的でスケーラブルなベンチマークである。
51種類のイメージスタイルを考慮し,20のサブタスクにおいて知覚能力を評価する。
Dyscaは、新しいサブタスクやシナリオを簡単に追加するためのスケーラブルなベンチマークとして機能する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:56:43 GMT)
Instance-Dependent Regret Bounds for Learning Two-Player Zero-Sum Games with Bandit Feedback [60.6] 純粋な戦略 ナッシュ均衡が存在するとき、$c$ は 0 となり、最適のインスタンス依存後悔境界となることを示す。
また,本アルゴリズムは最終段階の収束性も享受し,ほぼ最適サンプルを用いて純粋な戦略ナッシュ均衡を同定することができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:20:06 GMT)
MegaSynth: Scaling Up 3D Scene Reconstruction with Synthesized Data [59.9] 合成データを用いたトレーニングにより3次元シーン再構成のスケールアップを提案する。
私たちの研究の中心は、700Kシーンからなる手続き的に生成された3DデータセットであるMega Synthです。
実験の結果,Mega Synthとの共同トレーニングや事前トレーニングにより,画像領域間で1.2~1.8dBPSNRの再現性が改善された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:06:52 GMT)
The Role of Sparsity for Length Generalization in Transformers [58.7] そこで本研究では,次の予測課題に対する長さの一般化を研究するための理論的枠組みを提案する。
予測された各トークンが前のトークンの小さな(固定された)数に依存する限り、長さの一般化が生じることを示す。
本稿では,位置結合手法で使用する位置IDを予測するために,変圧器を訓練する予測位置結合を導入する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:01:03 GMT)
Improving LLM General Preference Alignment via Optimistic Online Mirror Descent [57.6] 人間からのフィードバックからの強化学習(RLHF)は、大きな言語モデル(LLM)と人間の嗜好の整合において顕著な効果を示した。
本稿では,Bradley-Terry (BT) モデル仮定を廃止し,汎用ゲームとして定式化された LLM のアライメントについて検討する。
提案手法は双対性ギャップ上の$O(T-1)$バウンドを達成し、以前の$O(T-1/2)$の結果を改善することを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:24:52 GMT)
The Geometry of Refusal in Large Language Models: Concept Cones and Representational Independence [57.6] 以前の研究は、モデルのアクティベーション空間における1つの拒絶方向が、LCMが要求を拒否するかどうかを決定することを示唆している。
本稿では,表現工学における勾配に基づく新しい手法を提案し,それを用いて拒絶方向を同定する。
LLMの拒絶機構は複雑な空間構造によって制御され、機能的に独立な方向を識別する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:52:59 GMT)
REINFORCE Adversarial Attacks on Large Language Models: An Adaptive, Distributional, and Semantic Objective [57.6] 応答の個体群に対する適応的・意味的最適化問題を提案する。
我々の目標は、Llama3の攻撃成功率(ASR)を2倍にし、サーキットブレーカー防御でASRを2%から50%に向上させることである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:34:48 GMT)
TLDR: Token-Level Detective Reward Model for Large Vision Language Models [57.4] 既存の報酬モデルは、任意のテキストに1つのバイナリフィードバックを割り当てることによって、人間のアノテーションを模倣するだけである。
我々は、各テキストトークンにきめ細かいアノテーションを提供するために、$textbfT$oken-$textbfL$evel $textbfD$etective $textbfR$eward Modelを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:15:33 GMT)
Continuous Patch Stitching for Block-wise Image Compression [57.0] ブロックワイド画像圧縮のための新しい連続パッチステッチ(CPS)フレームワークを提案する。
我々のCPSフレームワークは、既存のモデルのコンピューティングリソースの半分以下を必要としながら、既存のベースラインに対して最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:11:59 GMT)
Benchmarking Retrieval-Augmented Generation in Multi-Modal Contexts [56.3] 本稿では,M2RAG(Multi-Modal Retrieval-Augmented Generation)を紹介する。
M2RAGはマルチモーダル大言語モデル(MLLM)の有効性を評価するためのベンチマークである。
MLLMのコンテキスト利用能力を高めるため,マルチモーダル検索型インストラクションチューニング(MM-RAIT)も導入する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:25:25 GMT)
Grounded Persuasive Language Generation for Automated Marketing [55.6] 本稿では,大規模言語モデル(LLM)を用いて,説得力のあるマーケティングコンテンツを自動生成するエージェントフレームワークを開発する。
提案手法は,生成したコンテンツとユーザの好みを一致させると同時に,有用な事実属性を強調表示するように設計されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:36:57 GMT)
Understanding the Relationship between Prompts and Response Uncertainty in Large Language Models [55.3] 大規模言語モデル(LLM)は意思決定に広く使用されているが、特に医療などの重要なタスクにおける信頼性は十分に確立されていない。
本稿では,LSMが生成する応答の不確実性が,入力プロンプトで提供される情報とどのように関連しているかを検討する。
本稿では,LLMが応答を生成する方法を説明し,プロンプトと応答の不確実性の関係を理解するためのプロンプト応答の概念モデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:06:21 GMT)
Modeling Multi-modal Cross-interaction for Multi-label Few-shot Image Classification Based on Local Feature Selection [55.1] マルチラベル設定の重要な特徴は、イメージがしばしば複数のラベルを持つことである。
本稿では,ラベルのプロトタイプを段階的に改良する戦略を提案する。
COCO, PASCAL VOC, NUS-WIDE, iMaterialist による実験により, このモデルにより最先端のモデルが大幅に改善されることが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:34:07 GMT)
Multi-Dimensional Quality Assessment for Text-to-3D Assets: Dataset and Model [54.7] テキスト・ツー・3Dアセット・ジェネレーションの人気が高まっているにもかかわらず、その評価は十分に検討され研究されていない。
各種テキスト・ツー・3Dアセットに有意な品質差があることから、人間の主観的判断に沿った品質評価モデルの必要性が高まっている。
我々はまず,AIGC-T23DAQAデータベースと呼ばれる,これまでで最大のテキストから3Dのアセット品質評価データベースを構築した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:20:13 GMT)
Game-Theoretic Regularized Self-Play Alignment of Large Language Models [54.6] 正規化手法は、正規化されていない自己演奏を大幅に改善できることを示す。
正規化手法は、正規化されていない自己演奏を大幅に改善できることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:43:21 GMT)
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces [54.4] 我々は完全なフィードバックの下でオンライン学習のためのトンプソンサンプリングの分析法を開発した。
我々は、後悔の分解を、学習者が先入観を期待したことを後悔させ、また、過度な後悔と呼ぶ先延ばし的な用語を示します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:26:45 GMT)
Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.3] 動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:53:45 GMT)
AnyTop: Character Animation Diffusion with Any Topology [54.1] 我々は,異なる動きダイナミクスを持つ多種多様な文字に対する動きを生成する拡散モデルであるAnyTopを紹介する。
我々の研究は、任意の骨格学習に適したトランスフォーマーベースの認知ネットワークを特徴としている。
我々の評価では、AnyTopsはトポロジー当たりのトレーニング例が3つも少なく、見えない骨格の運動も生成できる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:00:36 GMT)
Adversarial Training for Defense Against Label Poisoning Attacks [53.9] ラベル中毒攻撃は機械学習モデルに重大なリスクをもたらす。
本稿では,これらの脅威に対処するために,サポートベクトルマシン(SVM)に基づく新たな対角的防御戦略を提案する。
提案手法は, 様々なモデルアーキテクチャに対応し, カーネルSVMを用いた予測勾配降下アルゴリズムを用いて, 対向学習を行う。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:03:19 GMT)
Introducing Visual Perception Token into Multimodal Large Language Model [53.8] MLLM(Multimodal Large Language Model)はその視覚エンコーダの知覚過程に依存している。
MLLMには、独自の視覚知覚プロセスを制御する自律的な能力がない。
本稿では,視覚知覚のプロセスを制御する機構をMLLMに組み込むことを目的として,視覚知覚トークンの概念を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:56:12 GMT)
Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration [53.5] Mobile-Agent-Vは、ビデオガイダンスを活用して、モバイル自動化のためのリッチで費用対効果の高い運用知識を提供するフレームワークである。
Mobile-Agent-Vは、特別なサンプリングや前処理を必要とせず、ビデオ入力を活用することでタスク実行能力を向上させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:51:23 GMT)
SafeSplit: A Novel Defense Against Client-Side Backdoor Attacks in Split Learning (Full Version) [53.2] Split Learning(SL)は、複数のクライアントとサーバが共同で学習し、共有ディープラーニング(DNN)上で推論できる分散ディープラーニングアプローチである。
本稿では,split Learning(SL)におけるクライアント側のバックドア攻撃に対する最初の防御であるSafeSplitについて述べる。
クライアントが引き起こした変更を特定し、有毒なモデルを検出するために、2倍の分析を使用する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:31:25 GMT)
S4S: Solving for a Diffusion Model Solver [53.0] 拡散モデル(DM)は、ランダムノイズから始まり、逆時間常微分方程式(ODE)を解くことによって、データ分布からサンプルを作成する。
我々は、Solving for the Solver(S4S)と呼ばれるDMのための優れた解法を学ぶ新しい方法を提案する。
すべての設定において、S4Sは従来のODEソルバと比較してサンプル品質を均一に改善する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:55:54 GMT)
Natural Language Decompositions of Implicit Content Enable Better Text Representations [53.0] 本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:49:51 GMT)
Reasoning with Latent Thoughts: On the Power of Looped Transformers [52.8] 多くの合成推論問題に対して、$k$層変換器が$L$倍ループしたことが、$kL$層非ループモデルの性能にほぼ一致することを示す。
ループ型および非ループ型モデルは、その有効深さに依存するスケーリングの挙動を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:49:05 GMT)
Lean and Mean: Decoupled Value Policy Optimization with Global Value Guidance [52.7] 政策に基づく人間からのフィードバックからの強化学習は、大きな言語モデルと人間の嗜好の整合に不可欠である。
俳優と批評家の合同トレーニングと、事前訓練された一定の報酬モデルによる指導が必要である。
従来の報酬モデリングを事前訓練されたEmphglobal Value Model(GVM)に置き換えるリーンフレームワークである textbfDecoupled Value Policy Optimization (DVPO) を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:11:33 GMT)
Identifying and Analyzing Performance-Critical Tokens in Large Language Models [52.4] 我々は大規模な言語モデルがいかに実演からタスクを実行するかを研究する。
私たちの仕事は、大規模な言語モデルがデモからタスクを実行するための学習方法に光を当て、さまざまな種類のトークンが大きな言語モデルで果たす役割についての理解を深めます。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:35:56 GMT)
Diffusion Language Models Can Perform Many Tasks with Scaling and Instruction-Finetuning [52.2] 拡散言語モデルを拡張することで、強力な言語学習者が効果的に学習できることが示される。
大規模データから知識を最初に取得することで,大規模に有能な拡散言語モデルを構築する。
実験により、拡散言語モデルのスケーリングは、下流言語タスクにおけるパフォーマンスを一貫して改善することが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:09:09 GMT)
AniGaussian: Animatable Gaussian Avatar with Pose-guided Deformation [51.6] SMPLポーズガイダンスを用いて動的ガウスアバターを拘束する革新的ポーズ誘導変形戦略を導入する。
我々は、ガウスモデルの動的変換能力を高めるために、以前の研究から厳密な事前を取り入れた。
既存の手法との比較により、AniGaussianは定性的結果と定量的指標の両方において優れた性能を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:53:37 GMT)
DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks [51.4] 我々は、計算資源や訓練データに制限のある複数のタスクに対処できる優れた一般認識モデルを作成する。
DICEPTIONは、複数の知覚タスクに効果的に取り組み、最先端のモデルと同等のパフォーマンスを達成する。
異なるインスタンスにランダムな色を割り当てる戦略は、エンティティセグメンテーションとセマンティックセグメンテーションの両方において非常に効果的であることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:51:06 GMT)
A Closer Look at TabPFN v2: Strength, Limitation, and Extension [51.1] Tabular Prior-data Fitted Network v2 (TabPFN v2)は、複数のデータセットにまたがる前例のないコンテキスト内学習の精度を達成する。
本稿では,300以上のデータセット上でTabPFN v2を評価し,中小規模タスクにおける例外的な一般化機能を確認する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:38:42 GMT)
Streaming Looking Ahead with Token-level Self-reward [50.7] 本稿では,トークンレベルの自己回帰モデリング(TRM)機能を備えたポリシーモデルを提案する。
さらに,検索効率を向上し,並列化を向上するストリーミング・ルック・アヘッド (SLA) アルゴリズムを提案する。
SLAとDPOなどの強化微調整技術を組み合わせると、全体の勝利率は89.4%となる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:35:53 GMT)
Muon is Scalable for LLM Training [50.7] MoE(Mixture-of-Expert)モデルであるMoonlightを紹介する。
我々のモデルは現在のフロンティアを改善し、以前のモデルに比べてトレーニングのFLOPをはるかに少なくして、より良いパフォーマンスを実現しています。
メモリ最適化と通信効率のよい分散 Muon 実装をオープンソースとして公開しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:12:29 GMT)
ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context [50.6] ContextualStoryは、コヒーレントなストーリーフレームを生成し、ビジュアルなストーリーテリングのためにフレームを拡張するように設計されたフレームワークである。
ストーリーライン埋め込みにおけるコンテキストを豊かにするストーリーラインコンテクストアライザと、フレーム間のシーン変化を測定するストーリーフローアダプタを導入する。
PororoSVとFlintstonesSVデータセットの実験では、ContextualStoryはストーリーの可視化と継続の両方で既存のSOTAメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:02:08 GMT)
Empowering LLMs with Logical Reasoning: A Comprehensive Survey [49.9] 大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な成功を収めた。
近年の研究では、LLMの論理的推論能力にはまだ大きな課題があることがわかった。
本稿では,主な課題を2つの側面にまとめ,分類する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:01:38 GMT)
Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras [49.8] ハイパーコンプレックス画像処理は、代数的および幾何学的原理を含む統一パラダイムで従来の手法を拡張している。
このワークル平均は、自然・生体画像解析のための四元数と2次元平面(四元数 - ピクセルを表す - を2次元平面に分割する)を分割する。
提案手法は、画像の自動処理パイプラインの一部として、カラー外観(例えば、代替リフレクションやグレースケール変換)と画像コントラストを規制することができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:29:14 GMT)
Making LLMs Reason? The Intermediate Language Problem in Neurosymbolic Approaches [49.6] 本稿では、ニューロシンボリックアプローチに適した形式言語表現を選択する問題である中間言語問題を紹介する。
全体の精度は53.20%、実行精度は49.26%である。
GPT4o-mini LLMを使用すると、ProofWriterデータセットの全体的な精度が21.20%、50.50%向上する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:49:52 GMT)
Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric [49.1] サンプルレベルの「ノーベルティ」に基づく新しい多様性指標を提案する。
我々は,NovellSumが精度よく多様性の変動を捉え,命令調整モデルの性能と0.97の相関性が得られることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:20:22 GMT)
Erwin: A Tree-based Hierarchical Transformer for Large-scale Physical Systems [49.0] 計算多体物理学の手法にインスパイアされた階層型トランスフォーマーであるErwinを紹介する。
宇宙論、分子動力学、粒子流体力学など、複数の領域にわたるエルウィンの有効性を実証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:16:55 GMT)
HIPPO: Enhancing the Table Understanding Capability of Large Language Models through Hybrid-Modal Preference Optimization [48.2] 本稿では,HybrId-modal Preference oPtimizatiOn(HIPPO)モデルについて述べる。
HIPPOの有効性を示す表質問応答と表事実検証に関する実験結果を得た。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:50:55 GMT)
Language Model Re-rankers are Steered by Lexical Similarities [48.1] NQ, LitQA2, DRUIDデータセット上で, 6種類のLM再ランカを評価した。
以上の結果から,LMリランカーはDRUID上で単純なBM25リランカーよりも優れていることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:37:13 GMT)
Cheems: A Practical Guidance for Building and Evaluating Chinese Reward Models from Scratch [48.0] リワードモデル(RM)は、大きな言語モデルと人間の嗜好の整合に不可欠である。
CheemsBenchは、中国の文脈における完全な人間によるRM評価ベンチマークである。
CheemsPreferenceは、人間と機械のコラボレーションを通じて注釈付けされた大規模で多様な好みデータセットである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:09:45 GMT)
Correlating and Predicting Human Evaluations of Language Models from Natural Language Processing Benchmarks [47.4] 4つのChat Llama 2モデルと1k以上のシングルターンと2k以上の人間のアノテータからの2k以上のマルチターンダイアログの広範な人間の嗜好を比較した。
ほとんどのNLPベンチマークは、人間の評価と強く相関しており、安価で自動化されたメトリクスが、驚くほど信頼性の高い人間の嗜好予測として役立つことを示唆している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:01:02 GMT)
On Relation-Specific Neurons in Large Language Models [47.3] 統計的手法を用いてLlama-2ファミリーを選定した関係性について検討する。
我々の実験は関係特異的ニューロンの存在を実証した。
関係特異的ニューロンの以下の3つの性質を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:33:18 GMT)
Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration [46.7] 大規模言語モデル(LLM)は、ターンバイターンの人間とAIのコラボレーションにおいて優れているが、リアルタイムの対話を必要とする同時タスクに苦労している。
本稿では,システム1とシステム2を統合した新しい言語エージェントフレームワークであるDPT-Agentを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:15:02 GMT)
Improving Sequential Recommendations via Bidirectional Temporal Data Augmentation with Pre-training [46.5] プレトレーニングによる双方向時間データ拡張(BARec)について紹介する。
提案手法は, 双方向の時間的拡張と知識強化による微調整を活用して, 真正な擬似優先順位項目を合成する。
5つのベンチマークデータセットに関する包括的実験分析により、短いシーケンスと長いシーケンスコンテキストの両方において、BARecの優位性が確認された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:44:15 GMT)
Optimistic Games for Combinatorial Bayesian Optimization with Application to Protein Design [46.5] ベイズ最適化は、シーケンシャルな相互作用を通じてブラックボックスから高価な関数を評価するための強力なフレームワークである。
既存のBOアルゴリズムは、大きな空間上の非構造的獲得関数のために実現不可能である。
我々はBOに対する新しいゲームベースのアプローチである$textbfGameOpt$を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:35:14 GMT)
Reasoning Does Not Necessarily Improve Role-Playing Ability [46.4] ロールプレイング大型言語モデル(LLM)の適用は、学術分野と商業分野の両方で急速に拡大している。
我々は、直接ゼロショットロールプレイングの有効性、Chain-of-Thought(CoT)によるロールプレイング、推論最適化LDMを用いたロールプレイングを比較した。
以上の結果から,CoTはロールプレイング性能を低下させ,推論最適化LDMはロールプレイングに不適であり,中国のロールプレイング性能は英語ロールプレイング性能を上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:08:41 GMT)
Automatically Evaluating the Paper Reviewing Capability of Large Language Models [46.0] 大きな言語モデル(LLM)は補助を提供する可能性を示しているが、研究はそれらが生成するレビューに重大な制限を報告している。
本研究では, LLMの論文レビュー機能と専門家によるレビュー機能を比較することで, 自動評価パイプラインを構築した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:05:27 GMT)
Craw4LLM: Efficient Web Crawling for LLM Pretraining [45.9] Craw4LLMは、LLM事前学習の好みに基づいてWebグラフを探索する効率的なWebクローリング手法である。
商用検索エンジンのインデックスから9億のWebページを含むWebグラフを用いた実験により,高品質な事前学習データを得る上でのCraw4LLMの有効性が示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:12:15 GMT)
Optimized circuits for windowed modular arithmetic with applications to quantum attacks against RSA [45.8] ウィンドウ演算は、空間時間トレードオフを伴う量子回路のコストを削減する手法である。
この作業では、ウィンドウ化されたモジュラー指数に4つの最適化を導入する。
これにより、暗号化アプリケーションに関連するモジュール型指数回路において、Toffoli数とToffoli深度が3%向上する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:59:16 GMT)
MobileSteward: Integrating Multiple App-Oriented Agents with Self-Evolution to Automate Cross-App Instructions [45.8] 携帯電話のエージェントは、携帯電話で日々のタスクを自動化するのを助けることができる。
既存のプロシージャ指向エージェントは、クロスアプリ命令で苦労する。
我々はMobileStewardという自己進化型マルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:12:45 GMT)
Entailment-Preserving First-order Logic Representations in Natural Language Entailment [45.6] 一階述語論理(FOL)は、自然言語(NL)文の論理的含意意味を表現できる。
本稿では,FOL 表現の細部を格納するタスクを提案する。
本稿では,EPF(Entailment-Preserving Rate family)の基準フリー評価指標について紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:18:17 GMT)
CoT2Align: Cross-Chain of Thought Distillation via Optimal Transport Alignment for Language Models with Different Tokenizers [45.6] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる最先端のパフォーマンスを実現するが、高い計算コストとメモリ制約のためにデプロイメントの課題に直面している。
知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を伝達する、有望なソリューションである。
CoT2Alignは,Chain-of-Thought(CoT)拡張を統合した普遍的なKDフレームワークであり,Cross-CoTアライメントを導入して推論伝達を強化する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:30:29 GMT)
Reinforcement Learning Enhanced LLMs: A Survey [45.6] 我々はRL強化大言語モデル(LLM)に関する最新の知識の体系的なレビューを行う。
具体的には、RLの基礎を詳述し、(2)人気のRL強化LLMを導入し、(3)広く使われている報酬モデルに基づくRL技術であるReinforcement Learning from Human Feedback(RLHF)とReinforcement Learning from AI Feedback(RLAIF)についてレビューする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:57:10 GMT)
Imprinto: Enhancing Infrared Inkjet Watermarking for Human and Machine Perception [45.5] ハイブリッド紙インタフェースは、紙文書の望まれる具体性とインタラクティブなデジタルメディアの可能性を組み合わせるために、拡張現実を活用する。
赤外線インクジェット透かし技術であるImprintoは、市販の赤外線インクとカメラを使用することで、目に見えないコンテンツの埋め込みを可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:11:33 GMT)
Semantics drives analogical change in Germanic strong verb paradigms: a phylogenetic study [45.1] いくつかのゲルマン語では、前駆体形と過去のパルティップルによって共有される茎の同型性に対するより親和性が高い。
本研究では,過去時制が過去分詞にまで拡張された状況において,この変化パターンの長期的嗜好がより大きいことを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:36:15 GMT)
Refactoring Detection in C++ Programs with RefactoringMiner++ [45.0] RefactoringMiner++は、現在の技術状況に基づいた検出ツールである。
後者はJavaに特化していますが、私たちのツールには、私たちの知る限り、C++プロジェクトで最初に公開された検出ツールがシードされています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:17:35 GMT)
Text2World: Benchmarking Large Language Models for Symbolic World Model Generation [45.0] ドメイン定義言語(PDDL)に基づいた新しいベンチマークであるText2Worldを導入する。
大規模強化学習で訓練された推論モデルは、他よりも優れていることがわかった。
これらの知見に基づいて,LLMの世界モデリング能力を高めるためのいくつかの有望な戦略について検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:59:04 GMT)
Spectral chaos bounds from scaling theory of maximally efficient quantum-dynamical scrambling [45.0] 複雑な量子系のエルゴード定常状態への進化に関する重要な予想は、スクランブルとして知られるこの過程が最も効率的であるときに普遍的な特徴を取得することである。
このシナリオでは、完全なスクランブルダイナミクスに沿ったスペクトル相関の正確な自己相似性を具現化して、スペクトル統計量に対する単一パラメータスケーリング理論を開発する。
スケーリング予測は特権プロセスと一致し、他の動的スクランブルシナリオのバウンダリとして機能し、すべての時間スケールで非効率または不完全なスクランブルを定量化できるようにする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:21:31 GMT)
PrivaCI-Bench: Evaluating Privacy with Contextual Integrity and Legal Compliance [44.3] 生成型大規模言語モデル(LLM)のコンテキストプライバシ評価ベンチマークであるPrivaCI-Benchを提案する。
本稿では,最近の推論モデルQwQ-32BとDeepseek R1を含む最新のLCMを評価した。
実験の結果、LLMは特定のコンテキスト内で重要なCIパラメータを効果的にキャプチャできるが、プライバシコンプライアンスのさらなる進歩が必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:49:34 GMT)
Learning Evolving Tools for Large Language Models [44.3] ツール学習により、大きな言語モデル(LLM)が外部ツールやAPIと対話できるようになる。
既存の研究は主に静的環境に焦点を当てており、この問題を見落としている。
ツール変数に対するLLMの適応性と反射性を向上する新しいフレームワークであるToolEVOを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:09:45 GMT)
Vikhr: Constructing a State-of-the-art Bilingual Open-Source Instruction-Following Large Language Model for Russian [44.1] Vikhrは、ロシアの言語に特化して設計された、最先端のバイリンガルなオープンソース命令フォローリング LLM である。
VikhrはMistral LLMシリーズの名称で、「強風」を意味する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:24:20 GMT)
GraphTeam: Facilitating Large Language Model-based Graph Analysis via Multi-Agent Collaboration [44.0] GraphTeamは3つのモジュールから5つのLLMベースのエージェントで構成されており、異なる特殊性を持つエージェントは複雑な問題に対処するために協力することができる。
6つのグラフ分析ベンチマークの実験は、GraphTeamが最先端のパフォーマンスを達成し、精度の点で最高のベースラインよりも平均25.85%改善していることを示している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:16:00 GMT)
AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data Generation [43.6] リモートセンシング画像オブジェクト検出(RSIOD)は、衛星や空中画像内の特定の物体を特定し、特定することを目的としている。
現在のRSIODデータセットにはラベル付きデータが不足しており、現在の検出アルゴリズムのパフォーマンスを著しく制限している。
本稿では,RSIODに適したレイアウト制御可能な拡散生成モデル(AeroGen)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:22:40 GMT)
AlphaAgent: LLM-Driven Alpha Mining with Regularized Exploration to Counteract Alpha Decay [43.5] 我々は,大規模言語モデルとアドホック正規化を統合し,崩壊耐性アルファ因子をマイニングする自律的フレームワークであるAlphaAgentを提案する。
AlphaAgentは、中国CSI 500と米国S&P 500市場で、過去4年間で引き続き重要なアルファ版を提供している。
特にAlphaAgentは、アルファ崩壊に対する顕著な抵抗を示し、強力な要因をもたらす可能性を高めている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:56:46 GMT)
CKnowEdit: A New Chinese Knowledge Editing Dataset for Linguistics, Facts, and Logic Error Correction in LLMs [43.1] 大規模言語モデル(LLM)における言語的・事実的・論理的誤りの訂正を目的とした,中国初の知識編集データセットであるCKnowEditを紹介する。
我々は、古典的なテキスト、イディオム、Baidu Tieba Ruozhibaのコンテンツを含む、幅広い情報源から7種類の知識を収集します。
このデータセットを解析することにより、中国語を習得する上で、現在のLLMが直面する課題を強調します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:02:47 GMT)
LED-Merging: Mitigating Safety-Utility Conflicts in Model Merging with Location-Election-Disjoint [43.0] LED-Mergingは安全性とユーティリティの対立を解消し、信頼性の高いマルチタスク LLM を構築するための軽量でトレーニング不要なパラダイムを提供する。
Llama-3-8B、Mistral-7B、Llama2-13Bの実験では、LEDMergingは有害反応率(例えば、HarmBench上のLlama-3-8Bインストラクションの31.4%減少)を減少させ、95%の実用性能(例えば、GSM8K上の52.39%の精度)を維持する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:19:43 GMT)
HiFi-KPI: A Dataset for Hierarchical KPI Extraction from Earnings Filings [42.6] 階層型金融鍵性能指標(HiFi-KPI)データセットを紹介する。
本手法は分類に基づくグループ化手法を用いて218,126のラベル階層を編成する。
また、4つの専門家マップ付きラベルを持つ手作業でキュレートされたサブセットであるHiFi-KPI Liteをリリースする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:45:27 GMT)
Task-Oriented 6-DoF Grasp Pose Detection in Clutters [42.6] 大規模6-DoFタスク指向把握データセットである6-DoFタスクグラフ(6DTG)を構築した。
各グリップには6つのタスクと198のオブジェクトを含む特定のタスクがアノテートされる。
我々のOne-Stage TaskGrasp(OSTG)は、タスク指向のポイント選択戦略を採用し、タスク指向のグリップ生成モジュールを用いて特定のタスクの把握方法を決定する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:05:22 GMT)
LongSpec: Long-Context Speculative Decoding with Efficient Drafting and Verification [42.5] 投機的復号化は、大規模言語モデルにおける自己回帰復号化の高推論遅延を軽減するための有望な手法となっている。
その約束にもかかわらず、LLMにおける投機的復号化の効果的な適用は、まだ3つの重要な課題に直面している。
これらの課題に対処することで、長期コンテキスト設定における投機的復号化の性能を向上させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:53:31 GMT)
Quadrature squeezing in a nanophotonic microresonator [42.3] フォトニック結晶マイクロ共振器において, 2重励起自発4波混合による1モード4次スクイージングを示す。
その結果、量子増幅干渉計、ガウスボソンサンプリング、コヒーレントイジングマシン、および普遍量子コンピューティングのための統合された励起光源への有望な経路が開かれた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:09:10 GMT)
In-context learning of evolving data streams with tabular foundational models [42.1] この研究は両領域の進歩を橋渡しし、トランスフォーマーの暗黙のメタ学習能力、ドリフトする自然データへの事前トレーニング、動的環境における適応学習のコア課題へのコンテキスト最適化への依存などを強調した。
本研究は,TabPFNが単純なスライディングメモリ戦略と組み合わさって,非定常ベンチマークにおけるHoeffdingツリーのアンサンブルを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:52:35 GMT)
A Meta-Evaluation of Style and Attribute Transfer Metrics [41.1] LLMは、どんなスタイルでもテキストを書き直しやすく、より丁寧で説得力があり、よりポジティブです。
本稿では,コンテンツ保存に着目したスタイルと属性伝達の評価指標を大規模に検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:28:32 GMT)
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference [41.0] KVキャッシュの量子化は、長いコンテキストにおける大規模言語モデル推論のスループットとレイテンシを改善することができる。
現在の方法では、KVキャッシュの量子化に対する階層的感度を見極めること、オンラインのきめ細かい決定のオーバーヘッドが高いこと、異なるLLMや制約に対する柔軟性の低いこと、の3つの未解決問題がある。
粗粒度のKVキャッシュに対して最適なハードウェアフレンドリなKV量子化ペアを適応的に探索する,シンプルで効果的なフレームワークKVTunerを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:36:32 GMT)
KVCrush: Key value cache size-reduction using similarity in head-behaviour [40.8] 大規模言語モデル(LLM)における推論を高速化する重要な最適化手法としてキーバリューキャッシュ(KV)が登場している。
しかしながら、KVのメモリフットプリントは、モデルのバッチサイズに直接影響を与えるモデルデプロイメントにおいて、大きなボトルネックとなります。
我々は,KVCrushと多くのKV圧縮技術を組み合わせることで,より小さなメモリでモデル精度を向上させることを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:57:51 GMT)
Proactive Privacy Amnesia for Large Language Models: Safeguarding PII with Negligible Impact on Model Utility [39.5] 我々は,大規模言語モデル(LLM)におけるPIIを保護するために,プロアクティブプライバシ・アムネシア(Proactive Privacy Amnesia)を提案する。
このメカニズムは、シークエンスでPIIと最も密接な関係にあるキーメモリを積極的に識別し、忘れ、LLMの機能を維持するためにメモリを埋め込むことによって機能する。
その結果, PPA法は, 電話番号暴露のリスクを100%削減し, 9.8%~87.6%の物理アドレス暴露のリスクを著しく低減することがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:16:39 GMT)
TV-based Deep 3D Self Super-Resolution for fMRI [39.5] 本稿では,DLネットワークと解析的アプローチとTotal Variation (TV)正規化を組み合わせた,新たな自己教師型DL SRモデルを提案する。
本手法は,外部GT画像の必要性を排除し,管理型DL技術と機能地図の保存による競合性能を実現する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:54:50 GMT)
Robust Confinement State Classification with Uncertainty Quantification through Ensembled Data-Driven Methods [39.3] 本研究では,不確実性定量化とモデルロバスト性を考慮した閉じ込め状態分類法を開発した。
我々は,TV放電のオフライン解析に焦点をあて,Lモード,Hモード,および中間ディザリング位相(D)を区別する。
302TCV放電のデータセットは完全にラベル付けされ、一般公開される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:25:22 GMT)
LLM-Enhanced Dialogue Management for Full-Duplex Spoken Dialogue Systems [39.1] 音声活動検出(VAD)モジュールは、完全なSDSにおける対話マネージャ(DM)のターンテイクを効率的に管理する。
音声を短時間に処理することにより、VADはリアルタイムな意思決定を可能にし、コア対話エンジン(CDE)は応答生成のためにのみ活性化される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:08:11 GMT)
Order Matters: Investigate the Position Bias in Multi-constraint Instruction Following [39.1] 複数の制約を持つ実世界の命令は、既存の大規模言語モデル(LLM)に重大な課題をもたらす。
我々は,CDDI(Difficulty Distribution Index)による制約の難易度分布を定量的に測定する。
難解な順序で制約を提示した場合, LLM はより高性能であることが判明した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:39:28 GMT)
DUNIA: Pixel-Sized Embeddings via Cross-Modal Alignment for Earth Observation Applications [39.1] 画像とフルウェーブフォームLiDARデータの相互アライメントにより画素サイズの埋め込みを学習するDUNIAを提案する。
モデルが対照的に訓練されているため、埋め込みはゼロショット環境で環境監視タスクの文脈で直接活用することができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:28:00 GMT)
Benchmarking Temporal Reasoning and Alignment Across Chinese Dynasties [38.9] 時間的推論に基づく大規模言語モデル評価のためのベンチマークである中国語時間推論(CTM)を紹介する。
CTMは、相互関係、ペアワイズ時間的アライメント、文脈化と文化的な推論を強調している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:27:54 GMT)
What is a Good Question? Utility Estimation with LLM-based Simulations [37.9] QUESTは、質問の有用性の定量化を可能にする学習環境をシミュレートする。
質問効用度に基づくリジェクションサンプリングによって訓練されたモデルにより生成された質問は、少なくとも20%以上の試験結果をもたらす。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:08:41 GMT)
PWM: Policy Learning with Multi-Task World Models [37.7] 世界モデル手法は、環境のシミュレーションを学習することでスケーラビリティを提供する。
勾配に基づく手法は低い分散を示すが、不連続性を扱うことができない。
連続制御のための新しいモデルベースRLアルゴリズムであるマルチタスク世界モデル(PWM)を用いたポリシー学習を紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:56:00 GMT)
Unsupervised Mutual Learning of Discourse Parsing and Topic Segmentation in Dialogue [37.6] 対話システムでは、会話の焦点の管理と対話のコーディネートにおいて、会話が重要な役割を果たす。
修辞的構造と主題的構造という2つの重要な構造から構成される。
我々は、修辞構造とトピック構造を統合する統一表現を導入し、それら間のセマンティック一貫性を確保する。
本稿では,レトリック構造とトピック構造を協調的にモデル化し,追加アノテーションを必要とせずに相互に強化できる教師なし相互学習フレームワーク(UMLF)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:50:00 GMT)
Learning production functions for supply chains with graph neural networks [37.6] 目に見えない生産機能によって管理されるサプライチェーントランザクション。
我々は、時間的GNNと新しい在庫モジュールを組み合わせることで、この設定のための新しいモデルのクラスを導入する。
我々は、我々の新しいオープンソースシミュレータであるサプライシムから生成された実際のサプライチェーンデータとデータに基づいて、我々のモデルを広範囲に評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:32:49 GMT)
Software Engineering as a Domain to Formalize [37.5] "Research ideas" という記事では,ソフトウェアエンジニアリングの理論がどのようなもので,どのように見えるべきかを論じている。
この記事では、オブジェクト指向モデルという形でソフトウェア工学の可能な理論の構造について概説する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:07:01 GMT)
SwimVG: Step-wise Multimodal Fusion and Adaption for Visual Grounding [37.3] 視覚的なグラウンドニングは、画像領域を自然言語でグラウンドすることを目的としており、それはクロスモーダルアライメントに大きく依存している。
SwimVGは、視覚的な接地のためのステップワイズマルチモーダルプロンプト(Swip)とクロスモーダルインタラクティブアダプタ(CIA)を提案する。
SwipとCIAはどちらもパラメータ効率のパラダイムであり、徐々に浅い層から深い層へとクロスモーダルな特徴を融合させていく。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:41:34 GMT)
Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path? [37.1] 未確認のAI機関は、公共の安全とセキュリティに重大なリスクをもたらす。
これらのリスクが現在のAIトレーニング方法からどのように生じるかについて議論する。
我々は,非エージェント型AIシステムの開発をさらに進めるために,コアビルディングブロックを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:14:15 GMT)
Multi-Agent Autonomous Driving Systems with Large Language Models: A Survey of Recent Advances [36.8] 大規模言語モデル (LLM) が自律運転システム (ADS) に統合された。
LLMは、限られた認識、不十分な協調、高い計算要求の3つの大きな課題に直面している。
LLMに基づくマルチエージェントADSの最近の進歩は、エージェント間のコミュニケーションと協調の改善に焦点が当てられている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:26:13 GMT)
Reinforcement Learning for Generative AI: A Survey [36.8] この調査は、さまざまなアプリケーション領域にまたがるハイレベルなレビューに光を当てることを目的としています。
この領域では厳格な分類法を提供し、様々なモデルや応用について十分なカバレッジを提供している。
この調査は、現在のモデルの限界に対処し、生成AIのフロンティアを拡大する可能性のある潜在的方向を示すことで締めくくられる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:26:55 GMT)
Mitigating Hallucinations in Diffusion Models through Adaptive Attention Modulation [36.3] 本稿では,拡散モデルにおける自己注意機構の解析と調節により幻覚を緩和する新しいアプローチである適応注意変調(AAM)を提案する。
AAMは幻覚のアーティファクトを効果的に低減し、生成した画像の忠実さと信頼性を両立させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:19:54 GMT)
Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models [36.2] 微調整された大規模言語モデル(LLM)のデータ選択は、既存のデータセットから高品質なサブセットを選択することを目的としている。
既存の調査では、微調整フェーズの詳細な調査を見落としている。
特徴抽出, 基準設計, セレクタ評価を含む新しい3段階の手法を導入し, これらの手法を体系的に分類し, 評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:59:00 GMT)
A Compositional Atlas for Algebraic Circuits [36.0] クエリの大規模なクラスは、半環上の基本演算子(アグリゲーション、製品、および要素ワイドマッピング)の組み合わせに対応することを示す。
分析を応用して、このような多くの合成クエリに対して、新しいトラクタビリティ条件を導出する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:15:11 GMT)
The Lottery LLM Hypothesis, Rethinking What Abilities Should LLM Compression Preserve? [35.7] 本稿では,LLMの最近の進歩として,検索強化生成,多段階推論,外部ツール,計算表現性について概説する。
本稿では,与えられたLLMとタスクに対して,元のLLMと同じ性能を生み出すことのできる,より小さなLLMが存在することを示唆する抽選LLM仮説を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:39:35 GMT)
BeamDojo: Learning Agile Humanoid Locomotion on Sparse Footholds [35.6] 疎い足場におけるヒューマノイド移動のための強化学習フレームワーク、BeamDojoを紹介した。
BeamDojoは、密集した移動報酬と疎い足場報酬の学習プロセスのバランスをとる。
実世界の展開を実現するために,LiDARを用いた標高マップを実装した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:31:37 GMT)
Implicit Word Reordering with Knowledge Distillation for Cross-Lingual Dependency Parsing [35.4] 知識蒸留(IWR-KD)を用いた暗黙の単語並べ替えフレームワークを提案する。
このフレームワークは、深いネットワークが意味のあるデータ変換に対応する特徴線形化を学習するのに長けている。
本稿では,31言語にまたがるUniversal Dependency Treebankの手法を検証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:43:05 GMT)
Designing Large Foundation Models for Efficient Training and Inference: A Survey [35.4] 本稿では,基礎モデルに基づく現代的効率的なトレーニングと推論技術に焦点を当てる。
モデルとシステムデザイン 計算資源を節約するために、異なる側面からのLLMトレーニングと推論を最適化する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:57:40 GMT)
Enhancing Cognition and Explainability of Multimodal Foundation Models with Self-Synthesized Data [35.2] LMMの認識と説明性を改善するための新しい視覚的拒絶サンプリングフレームワークを提案する。
私たちのアプローチは、人間の検証可能な視覚的特徴を含む解釈可能な答えを合成することから始まります。
各ラウンドの微調整の後、最高品質の解答を選択するために報酬モデルのないフィルタリング機構を適用する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:46:48 GMT)
TEncDM: Understanding the Properties of the Diffusion Model in the Space of Language Model Encodings [35.2] TEncDMは、事前訓練された言語モデルエンコーディングの空間で動作する拡散モデリングの新しいアプローチである。
このアプローチでは,トークン予測プロセスにコンテキストを組み込むように設計されたトランスフォーマーベースのデコーダも採用しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:06:32 GMT)
VLM$^2$-Bench: A Closer Look at How Well VLMs Implicitly Link Explicit Matching Visual Cues [35.0] VLM$2$-Benchは、視覚言語モデルがマッチングキューを視覚的にリンクできるかどうかを評価するために設計されたベンチマークである。
我々は、モデルが視覚的手がかりをリンクする能力において重要な課題を特定し、GPT-4oでさえ人間より34.80%遅れている重要なパフォーマンスギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:56:36 GMT)
AAAR-1.0: Assessing AI's Potential to Assist Research [34.9] AAAR-1.0は,大規模言語モデル(LLM)の性能を評価するためのベンチマークデータセットである。
AAAR-1.0は、以前のベンチマークと大きく異なる2つの主要な方法である: 第一に、明らかに研究指向で、深いドメインの専門知識を必要とするタスク、第二に、研究者が日々従事する主要なアクティビティを反映する研究者指向である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:44:17 GMT)
RELICT: A Replica Detection Framework for Medical Image Generation [34.8] 生成モデルにおける記憶化は、意図しない機密情報漏洩とリミットモデルユーティリティを引き起こす可能性がある。
合成医用画像データセットにおいて、複製、すなわち、ほぼ同一のトレーニングデータのコピーを識別するためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:37:19 GMT)
On the Dichotomy Between Privacy and Traceability in $\ell_p$ Stochastic Convex Optimization [34.2] 我々は,$ell_p$測地の下での凸最適化(SCO)における暗記の必要性について検討する。
我々の主な成果は、SCOにおけるトレーサビリティと過剰リスクの根本的なトレードオフを明らかにすることである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:10:06 GMT)
Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set [34.1] 本稿では,線形$Q$-ラーニングイテレート(有界集合への)の最初の$L2$収束率をさらに確立する。
必要なのは、適応温度の$epsilon$-softmaxの行動ポリシーだけです。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:39:27 GMT)
Detecting Benchmark Contamination Through Watermarking [34.0] ベンチマーク汚染は、大規模言語モデルの評価の信頼性に重大な課題をもたらす。
リリース前にベンチマークを透かし、ソリューションを導入します。
ベンチマーク汚染を制御した10Bトークン上で,スクラッチから1Bモデルを事前学習することにより,本手法を検証した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:39:31 GMT)
PAPILLON: Efficient and Stealthy Fuzz Testing-Powered Jailbreaks for LLMs [33.9] 大規模言語モデル(LLM)は様々なタスクに優れていますが、それでも脱獄攻撃に対して脆弱です。
本稿では,PAPILLONと呼ばれる新しいジェイルブレイク攻撃フレームワークを紹介する。
自動化されたブラックボックスのジェイルブレイク攻撃フレームワークで、一連のカスタマイズされた設計でブラックボックスのファズテストアプローチを適用する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:18:26 GMT)
FedBM: Stealing Knowledge from Pre-trained Language Models for Heterogeneous Federated Learning [33.8] We propose a novel framework called Federated Bias eliMinating (FedBM) to get away of local learning bias in heterogeneous learning (FL)。
FedBMはLKCC(Linguistic Knowledge-based Construction)とCGDE(Concept-guided Global Distribution Estimation)の2つのモジュールから構成される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:35:48 GMT)
Finite-Sample Analysis of Policy Evaluation for Robust Average Reward Reinforcement Learning [33.7] 本稿では、ロバストな平均回帰における政策評価のための第1次有限サンプル解析について述べる。
提案手法はマルチレベルモンテカルロ法(MLMC)を用いてベルマン作用素を効率的に推定する。
本手法は,ロバストな政策評価とロバストな平均報酬推定のために,$tildemathcalO(epsilon-2)$のオーダー最適サンプル複雑性を実現する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:55:09 GMT)
Anywhere: A Multi-Agent Framework for User-Guided, Reliable, and Diverse Foreground-Conditioned Image Generation [33.5] Anywhereは、従来のエンドツーエンドのアプローチから離れるマルチエージェントフレームワークです。
このフレームワークでは、各エージェントは、前景の理解、多様性の強化、オブジェクトの完全性保護、テキストの即時一貫性など、異なる側面に特化している。
我々のフレームワークは、オプションのユーザテキスト入力を取り入れ、自動品質評価を行い、必要に応じて再生成を開始する機能により、さらに強化されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:59:18 GMT)
Programming Really Is Simple Mathematics [33.4] 本稿では,基本集合論に基づく小数理理論(PRISM)としてのプログラミングの基礎を再構築する。
プログラムとプログラミングの重要な性質を特徴づける数十の定理を導出する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:40:42 GMT)
Experimentally Informed Decoding of Stabilizer Codes Based on Syndrome Correlations [33.2] 独立誤差の確率を特徴付けるための新しい解析式によって導かれる実験手法を提案する。
提案手法は,理論誤差モデルに頼らずに,最小ウェイト完全整合デコーダの最適重みを求める。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:27:42 GMT)
On the Relationship Between Monotone and Squared Probabilistic Circuits [32.4] 確率回路は加重和と積のグラフとしての関数の統一表現である。
近年,回路関数(正方形回路)の正方形として密度を表現する手法が提案されている。
これにより、和解できるかどうかという疑問が持ち上がり、2つのモデリングアプローチが実際に改善される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:53:15 GMT)
UniGenCoder: Merging Seq2Seq and Seq2Tree Paradigms for Unified Code Generation [32.3] 既存のコード生成アプローチでは、トークンのシーケンスとしてターゲットコードを生成するSequence-to-Sequenceパラダイムや、アクションのシーケンスとしてコードを出力するSequence-to-Treeパラダイムが重視されている。
コード関連生成タスクに対してUniGenCoderを提案する。これは共有エンコーダと、最小限の追加パラメータを持つ共有デコーダと、各インスタンスに対して最適なパラダイムを動的に選択するセレクタから構成される。
テキスト・ツー・コード生成タスクとコード・ツー・コード生成タスクの実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:05:30 GMT)
Hyperspherical Energy Transformer with Recurrent Depth [32.0] トランスフォーマーベースの基礎モデルは、膨大なパラメータと計算資源で前例のない成功を収めた。
次世代アーキテクチャを進化させるためには、高い解釈可能性と実用的な能力を持つモデルが必要である。
本報告では,バニラ変圧器のリカレント深さの代替として,textitHyper-Spherical Energy Transformer (Hyper-SET)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:00:00 GMT)
FACT or Fiction: Can Truthful Mechanisms Eliminate Federated Free Riding? [31.9] 標準フェデレーション学習アプローチはフリーライダージレンマに対して脆弱である。
実際には、敵エージェントはサーバに誤った情報を提供して、貢献から遠ざかることができる。
本稿では,FACTによるフリーライディング・アバース・フェデレーション機構の真偽化を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:33:31 GMT)
Adam-mini: Use Fewer Learning Rates To Gain More [29.2] Adam-miniはAdamの学習率リソースを削減します。
Adam-miniは、メモリフットプリントが50%少ないAdamWよりも同等かそれ以上のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:29:08 GMT)
High quality superconducting tantalum resonators with beta phase defects [29.0] 超伝導トランスモン量子ビットのコヒーレンスは、$alpha$-tantalumからクビットコンデンサパッドを形成することで改善されている。
内部品質因子を持つ金属-基板界面近傍の介在物に、$Beta$-phase tantalumを含む共振器を単一光子系で最大106$(5.0 pm 2.5)まで含む。
以上の結果から, タンタル系超伝導回路のコヒーレンス向上のため, 臨界磁場の増大, 潜在的に有益であることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:25:23 GMT)
Mutual Reinforcement of LLM Dialogue Synthesis and Summarization Capabilities for Few-Shot Dialogue Summarization [29.0] LLMにおけるMultual Reinforcecing Data Synthesis (MRDS) による対話要約作業の改善
提案したMRDS機構を利用して,合成データの形式にLCMの内部知識を取り入れる。
提案手法は,人体評価における平均スコアを最大化する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:01:48 GMT)
Evaluating the Effect of Retrieval Augmentation on Social Biases [28.4] 本稿では,RAGシステムの異なる構成要素と3つの言語にまたがるテキストに表される社会的偏見の関係について検討する。
生成したLCMが低レベルのバイアスを示す場合であっても,文書コレクションのバイアスは生成した応答で増幅されることが多い。
本研究は,NAGシステムに新たな事実を注入する手法としてRAGを使用することを懸念し,実世界の展開に先立って,RAGアプリケーションの潜在的な社会的偏見を慎重に評価することを求めるものである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:58:23 GMT)
AgentRefine: Enhancing Agent Generalization through Refinement Tuning [28.2] LLM(Large Language Model)ベースのエージェントは、人間のような複雑なタスクを実行する能力を示した。
オープンソースLLMとGPTシリーズのような商用モデルの間にはまだ大きなギャップがある。
本稿では,命令チューニングによるLLMのエージェント一般化機能の改善に焦点をあてる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:42:14 GMT)
Initializing Services in Interactive ML Systems for Diverse Users [28.2] 本稿では,複数のモデル/サービスを持つユーザグループを対象としたMLシステムについて検討する。
一連のサービスをデプロイする際、ユーザは個人的損失を最小限に抑えるものを選び、学習者は多様なユーザと対話して反復的に学習する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:18:31 GMT)
Moderation Matters:Measuring Conversational Moderation Impact in English as a Second Language Group Discussion [28.2] 第二言語話者としての英語は、しばしば言語障壁のためにグループディスカッションに参加するのに苦労する。
オンラインESL会話クラブから17セッションからなるデータセットを作成した。
以上の結果から,モデレーターはトピックの流れを改善し,会話の開始/終了を支援することが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:14:31 GMT)
Staircase Cascaded Fusion of Lightweight Local Pattern Recognition and Long-Range Dependencies for Structural Crack Segmentation [28.2] 既存の手法では、クラックの局所的なテクスチャとピクセル依存を統合するのに苦労している。
本稿では,すべての畳み込み処理を代用する軽量な畳み込みブロックを提案する。
我々は,局所パターンと長距離依存性をシームレスに統合した階段列融合モジュールを開発した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:54:15 GMT)
Joint Value Estimation and Bidding in Repeated First-Price Auctions [28.1] 競売者は、各競売の後に実現された結果(勝敗)のみを観察する。
本稿では,私的価値を共同で推定し,入札戦略を最適化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:21:50 GMT)
Exploiting Student Parallelism for Efficient GPU Inference of BERT-like Models in Online Services [28.0] 我々は,オンラインワークロード上でのGPU推論の現実的な設定について,sysを提示する。
サイスは、積み重ね蒸留とアンサンブルの強化を採用し、オリジナルの深層モデルを浅いが事実上積み重ねられた学生モデルのグループに蒸留する。
その結果、sysのベースラインは4.1timessim 1.6times$で精度を保ち、ワークロードバーストに対して最大22.27times$でパフォーマンスが向上した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:08:13 GMT)
Synthetic Text Generation for Training Large Language Models via Gradient Matching [27.7] 合成可読テキストを生成するための理論的に厳密な最初のアプローチを提案する。
生成した合成テキストは、実際のデータを微調整して得られた解の近傍にモデルを収束させることを保証できる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:49:15 GMT)
Predicting the Energy Landscape of Stochastic Dynamical System via Physics-informed Self-supervised Learning [27.5] エネルギー景観は多くの実世界の複雑なシステムの力学を形成する上で重要な役割を担っている。
進化軌道からエネルギー景観を学習するための物理インフォームド自己教師学習法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:26:26 GMT)
Watch Out E-scooter Coming Through: Multimodal Sensing of Mixed Traffic Use and Conflicts Through Riders Ego-centric Views [27.4] 本研究は,自転車用コンピュータを搭載した23人の参加者を対象に,自然科学的な研究を通してライダーの挙動を検討した。
歩行者が共有する道路、自転車レーン、道路の3種類の交通インフラで、視線の動き、速度、ビデオのフィードを分析した。
この結果から,自転車や自動車に追従することの難しさなど,電動スクーターの乗り手が直面する独特な課題が明らかになった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:16:18 GMT)
SpecDM: Hyperspectral Dataset Synthesis with Pixel-level Semantic Annotations [27.4] 本稿では,画素レベルのアノテーションを用いたハイパースペクトル画像の合成における生成拡散モデルの可能性について検討する。
私たちの知る限りでは、アノテーションで高次元のHSIを生成するのはこれが初めてです。
我々は、セマンティックセグメンテーションと変化検出の2つの最も広く使われている密集予測タスクを選択し、これらのタスクに適したデータセットを生成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:13:37 GMT)
HybridLinker: Topology-Guided Posterior Sampling for Enhanced Diversity and Validity in 3D Molecular Linker Generation [27.4] リンカー生成は鉛最適化やPROTAC設計といった薬物発見の応用において重要である。
既存の手法は3Dポイントクラウド(PC)を利用したPCフリーとPCアウェアのカテゴリに分類される
事前学習したPC-フリーモデルから多様な結合トポロジをガイダンスとして提供することにより,PC-Aware推論を強化するフレームワークであるHybridLinkerを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:23:40 GMT)
All You Need for Counterfactual Explainability Is Principled and Reliable Estimate of Aleatoric and Epistemic Uncertainty [27.3] 我々は透明性研究が人工知能の基本的な概念の多くを見落としていると主張している。
本質的に透明なモデルは、人間中心の説明的洞察の恩恵を受けることができる。
高度なレベルでは、人工知能の基礎を透明性研究に統合することは、より信頼性が高く、堅牢で、理解可能な予測モデルを生み出すことを約束する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:38:31 GMT)
Unlocking the Power of LSTM for Long Term Time Series Forecasting [27.2] 本稿では, sLSTM 上に実装したP-sLSTM という単純なアルゴリズムを提案する。
これらの改良により、TSFにおけるsLSTMの性能が大幅に向上し、最先端の結果が得られた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:01:55 GMT)
ATEB: Evaluating and Improving Advanced NLP Tasks for Text Embedding Models [27.2] より高度なNLPタスクは、安全性や事実性などのテキストをより深く理解する必要がある。
既存の情報検索データから学習した埋め込みモデルの限界を評価・強調する新しいベンチマークを導入する。
本稿では,これらのタスクを検索タスクとして再構成する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:08:15 GMT)
GraphCLIP: Enhancing Transferability in Graph Foundation Models for Text-Attributed Graphs [27.2] GraphCLIPは、強力なクロスドメインゼロ/フェーショット転送可能性を持つグラフ基盤モデルを学習するためのフレームワークである。
LLMの助けを借りて、大規模グラフ-土木ペアデータを生成し、キュレートする。
数ショットの学習では,事前学習目標に沿った新しいグラフプロンプトチューニング手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:34:38 GMT)
Reconsidering the Performance of GAE in Link Prediction [27.0] グラフオートエンコーダ(GAE)の可能性について検討する。
この結果から,より複雑なモデルの性能によく最適化されたGAEが一致し,計算効率が向上することがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:04:27 GMT)
Multimodal Search in Chemical Documents and Reactions [26.9] 本稿では, 化学反応, 分子構造, 関連テキストの検索を容易にするマルチモーダル検索ツールを提案する。
クエリは、分子図、テキスト記述、反応データを組み合わせることで、ユーザーは異なる化学情報の表現を接続することができる。
本稿では,システムのアーキテクチャ,重要な機能,検索プロセス,およびシステムの専門家による評価について述べる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:00:17 GMT)
TDMPBC: Self-Imitative Reinforcement Learning for Humanoid Robot Control [26.9] 一般に、複素高次元空間におけるタスクを達成するための実現可能な領域は極端に狭くなっている。
本稿では,タスク関連トラジェクトリをRLアルゴリズムで模倣した$textbfS$elf-$textbfI$mitative $textbfR$einforcementを提案する。
提案アルゴリズムは,HumanoidBenchを5%余分な計算オーバヘッドで120%の性能向上を実現している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:55:27 GMT)
Towards Auto-Regressive Next-Token Prediction: In-Context Learning Emerges from Generalization [26.9] 大規模言語モデル(LLM)は、文脈内学習能力を顕著に示している。
本稿では,ICLの出現と事前学習がICLに与える影響について検討する。
我々の理論は、数値線形力学系、合成GINC、実世界の言語データセットの実験によって支持されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:26:29 GMT)
From External to Swap Regret 2.0: An Efficient Reduction and Oblivious Adversary for Large Action Spaces [26.8] 我々は、ある仮説クラスに対して外部回帰アルゴリズムが存在しない場合、同じクラスに対して非スワップ回帰アルゴリズムが存在することも示している。
我々の減少は、あるゲームで非回帰学習が可能であるならば、このゲームは近似された平衡を持つ必要があることを意味する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:58:57 GMT)
Mitigating Bias in RAG: Controlling the Embedder [26.8] 本稿では,各成分の偏りとRAGシステム全体の偏りとの関係について検討する。
偏りの衝突は, 複雑であるにもかかわらず, 成分間の線形関係によって特徴づけられることを示す。
その結果, 公正性を高めるのではなく, 組込み機のバイアスを慎重に制御することで, 公平なRAGシステムの実現が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:16:10 GMT)
Robust Federated Learning in Unreliable Wireless Networks: A Client Selection Approach [26.7] 深層ニューラルネットワーク(DNN)を無線エッジでトレーニングするための、有望な分散学習パラダイムとして、フェデレートラーニング(FL)が登場した。
既存のソリューションは主に、無線リソース最適化戦略を取り入れることでこれらの課題に対処する。
本稿では、信頼できないネットワークにおける送信障害が、ローカルサンプルの効果的なラベル分布を歪める方法に関する、新しい理論的解析を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:44:02 GMT)
NormAd: A Framework for Measuring the Cultural Adaptability of Large Language Models [26.6] 大規模言語モデル(LLM)は、ユーザ価値や文化にアウトプットを適応させる必要があります。
LLMの文化的適応性を評価するための評価フレームワークであるNormAdを紹介する。
我々はNormAd-Etiを作成した。これは、75か国における、社会的な倫理的関連文化規範を表す2.6kの状況記述のベンチマークである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:50:39 GMT)
X-Dancer: Expressive Music to Human Dance Video Generation [26.5] X-Dancerはゼロショット音楽駆動の画像アニメーションパイプラインである。
単一の静止画像から、多種多様で長い範囲の人間のダンスビデオを生成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:47:54 GMT)
Is Efficient PAC Learning Possible with an Oracle That Responds 'Yes' or 'No'? [26.3] 本研究では,与えられたデータセットに対する経験的リスクを最小化する仮説を計算したERMの実行能力が,効率的な学習に必要かどうかを検討する。
バイナリ分類のためのPACの実際の設定において、概念クラスは1ビットしか返さないオラクルを用いて学習可能であることを示す。
また,本研究の結果は,オラクルを少し強化した学習環境や,部分的な概念,マルチクラス,実価値の学習環境にまで及んでいる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:38:04 GMT)
A Macro- and Micro-Hierarchical Transfer Learning Framework for Cross-Domain Fake News Detection [26.1] クロスドメイン偽ニュース検出は、ドメインシフトを緩和し、ドメイン間で知識を伝達することで検出性能を向上させることを目的としている。
既存のアプローチは、ニュースコンテンツとユーザエンゲージメントに基づいた知識をソースドメインからターゲットドメインに転送する。
クロスドメイン偽ニュース検出のための新しいマクロおよびマイクロ階層変換学習フレームワーク(MMHT)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:25:17 GMT)
Snoopy: Effective and Efficient Semantic Join Discovery via Proxy Columns [26.1] 本稿では,コラムレベルのセマンティック結合発見フレームワークであるSnoopyを提案する。
4つの実世界のデータセットの実験では、SnoopyがSOTAカラムレベルのメソッドをRecall@25で16%、NDCG@25で10%上回っている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:48:00 GMT)
Critical Dynamics of the Anderson Transition on Small-World Graphs [26.0] 本研究では,Small-Worldグラフ上に一元的アンダーソンモデルを構築し,長い時間と大きなウェーブ・パケット・ダイナミクスを特徴付ける。
臨界状態における対数的に遅い非エルゴード力学を明らかにし、最近のランダム行列予測を確認した。
この結果は,MBLの力学特性を明らかにするために利用することができ,将来の量子シミュレータによる実験を導くことができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:32:05 GMT)
Fine-tuning Aligned Classifiers for Merging Outputs: Towards a Superior Evaluation Protocol in Model Merging [26.0] そこで本研究では,数発の未ラベルサンプルで整列型分類器を微調整するプロトコルFT-Classifierを提案する。
これらの観測結果に基づいて,数発の未ラベルサンプルで整列型分類器を微調整する新しいプロトコルFT-Classifierを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:35:22 GMT)
JUREX-4E: Juridical Expert-Annotated Four-Element Knowledge Base for Legal Reasoning [25.9] 4要素理論は犯罪法の基本的な枠組みであり、4次元で犯罪の構成を定義する。
多くの大規模言語モデル(LLM)は、法的タスクを扱う際にこの理論を取り入れようとしている。
JUREX-4Eは155件の刑事訴追を専門とする知識ベースである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:02:00 GMT)
Balancing Speciality and Versatility: A Coarse to Fine Framework for Mitigating Catastrophic Forgetting in Large Language Models [25.5] Aligned Large Language Models (LLMs) は、様々な現実世界のタスクを処理できる優れた汎用性を示す。
専門性を得るための一般的な慣行である余分なデータによる微調整は、しばしば、以前に獲得した多目的性を破滅的な忘れてしまう。
専門性と汎用性のバランスを崩そうとする,粗いフレームワークであるCoFiTuneを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:59:10 GMT)
INDIC QA BENCHMARK: A Multilingual Benchmark to Evaluate Question Answering capability of LLMs for Indic Languages [25.4] インデックスQAベンチマーク(Indic QA Benchmark)は、インドの主要言語11言語を対象にした、文脈に基づく質問応答のためのデータセットである。
評価の結果,学習データに強い英語バイアスがあるため,低資源言語では弱い性能を示した。
また、入力を英語に翻訳して処理し、その結果をソース言語に変換して出力するTranslate Testパラダイムについても検討した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:37:48 GMT)
URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics [25.3] CoT推論は大規模言語モデル(LLM)の数学的推論能力を高めるために広く用いられている。
本研究では,マルチモーダルな数学的推論にシステム2スタイルの思考を導入する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:32:58 GMT)
HYBRIDMIND: Meta Selection of Natural Language and Symbolic Language for Enhanced LLM Reasoning [25.2] 本稿では,各推論問題に対して最適な推論手法を選択する適応戦略であるHYBRIDMINDを紹介する。
メタセレクタとしての微調整 LLaMA-3.1-8B-Instruct は GPT-4o の自然言語推論より優れている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:28:47 GMT)
Age Optimal Sampling for Unreliable Channels under Unknown Channel Statistics [25.0] 本研究では,センサが受信機にステータスを転送するシステムについて検討し,受信機は信頼性の高いチャネルを介して送信結果をセンサに送信する。
受信機におけるステータス情報のタイムラインを評価するために、Age of Informationのメトリクスを用いる。
この問題を解決するためにRobins-Monroアルゴリズムを提案し、最適しきい値をほぼ確実に近似できることを実証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:42:09 GMT)
GLCF: A Global-Local Multimodal Coherence Analysis Framework for Talking Face Generation Detection [24.9] トーキング・フェイスジェネレーション(TFG)は、顔画像と付随するテキストのみを使用して、あらゆるキャラクターのライフライクなトーキングビデオを作成することができる。
音声とビデオの偽造技術を含むMSTF(Multi-Scenario talking face dataset)を構築した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:29:16 GMT)
Heuristic Search for Path Finding with Refuelling [24.3] ガスステーション問題(GSP)は,限られたガスタンクと限られた燃料補給装置を備えたロボットの開始から目標まで,最小限のコストの経路を求める。
本稿では,Refuel A$*$ (RF-A$*$) という検索アルゴリズムを開発し,まず最初に部分解を反復的に構築する。
RF-A$*$は最適解経路を見つけることが保証され、しばしば既存のアプローチの2倍から8倍の速度で走る。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:31:38 GMT)
Exploring Causes and Mitigation of Hallucinations in Large Vision Language Models [24.2] Large Vision-Language Models (LVLM)は、画像エンコーダとLarge Language Models (LLM)を統合し、マルチモーダル入力を処理し、複雑な視覚タスクを実行する。
それらはしばしば、既存のオブジェクトや属性を記述することによって幻覚を生じさせ、その信頼性を損なう。
本研究では、画像キャプションにおける幻覚パターンを分析し、生成過程における全てのトークンが画像入力の影響を受けないことを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:00:52 GMT)
DIS-CO: Discovering Copyrighted Content in VLMs Training Data [24.2] モデルの開発において,著作権付きコンテンツの含意を推測する新しいアプローチであるdis-COを提案する。
対象とする著作権物質から特定のフレームでVLMを何度もクエリすることで、dis-COは自由形式のテキスト補完を通じてコンテンツのアイデンティティを抽出する。
以上の結果から,dis-COは検出性能を著しく向上し,最良先行法の平均AUCをほぼ倍増させることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:36:49 GMT)
Policy Learning with a Natural Language Action Space: A Causal Approach [24.1] 本稿では,自然言語行動空間における多段階意思決定のための新たな因果的枠組みを提案する。
本手法では,1つのモデルを用いて動的処理規則(DTR)を推定するためにQラーニングを用いる。
このアプローチの重要な技術的貢献は、最適化された埋め込みをコヒーレントな自然言語に変換するデコード戦略です。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:26:07 GMT)
Programming with Pixels: Computer-Use Meets Software Engineering [24.0] 汎用コンピュータ利用エージェントは、ハンドエンジニアリングツールを必要とせずに、様々なSWEタスクで特殊なツールベースのエージェントに近づいたり、超えたりすることができる。
ソフトウェアエンジニアリングエージェントの次の波を構築し評価するためのスケーラブルなテストベッドとしてPwPを確立した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:41:33 GMT)
Scalable Graph Condensation with Evolving Capabilities [24.0] 大規模かつ進化的なグラフデータを扱うために設計されたスケーラブルなグラフ凝縮法であるGECC(Graph Evolving Clustering Condensation)を紹介する。
GECCは、最先端のグラフ凝縮法よりも優れたパフォーマンスを実現し、大規模なデータセットで約1000倍のスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:01:57 GMT)
NUTSHELL: A Dataset for Abstract Generation from Scientific Talks [23.8] 音声から抽象的生成(SAG)は、記録された科学的プレゼンテーションから抽象化を自動的に生成することを目的としている。
我々は,NUTSHELLを紹介した。これは*ACLカンファレンスの講演を,対応する要約と組み合わせた新しいデータセットである。
SAGの課題を取り上げ,NUTSHELLでのトレーニングのメリットを実証した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:11:17 GMT)
Differentially Private Adaptation of Diffusion Models via Noisy Aggregated Embeddings [23.7] 本稿では,差分プライバシー制約の下で拡散モデルを適用する新しい手法を提案する。
モデル重みを微調整することなく、プライバシ保存スタイルとコンテンツ転送を可能にする。
実験結果から, タイベース適応は, 強いプライバシー保証の下でも, スタイル伝達において優れた忠実性が得られることが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:31:01 GMT)
When to Forget? Complexity Trade-offs in Machine Unlearning [23.5] Machine Unlearning(MU)は、トレーニングされたモデルから特定のデータポイントの影響を取り除くことを目的としている。
本研究では,非学習手法の効率を解析し,この問題に対するミニマックス時間における第1の上限値と第2の上限値の設定を行う。
未学習度比の位相図 – 最高の未学習手法の計算コストと完全なモデル再学習を比較する新しいメトリクスを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:56:27 GMT)
Unexploited Information Value in Human-AI Collaboration [23.4] ヒューマンAIチームのパフォーマンスを改善する方法は、各エージェントがどのような情報や戦略を採用しているかを知らなければ、しばしば明確ではない。
本稿では,人間とAIの協調関係を分析するための統計的決定理論に基づくモデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:06:26 GMT)
Zero-shot Large Language Models for Long Clinical Text Summarization with Temporal Reasoning [23.3] 大規模言語モデル(LLM)は、医療におけるデータ処理の変革の可能性を示している。
本研究は、時間的推論を必要とする長期臨床テキストの要約におけるゼロショットLDMの有効性を評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:28:20 GMT)
Method of Equal Shares with Bounded Overspending [23.2] 境界超過(BOS等分)による等分法の導入
BOS Equal Sharesは、厳密な比例公理によって示唆される非効率性に対処するが、このルールは、元の等式共有の方法と同様の公平性を保証する。
分析の過程では、プロジェクトの部分的な資金提供を可能にする「等分法」の分数変種も提示し、検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:24:04 GMT)
FoMo: Multi-Modal, Multi-Scale and Multi-Task Remote Sensing Foundation Models for Forest Monitoring [23.2] 第1回森林モニタリングベンチマーク(FoMo-Bench)について紹介する。
FoMo-Benchは、衛星、航空、在庫データを含む15の多様なデータセットで構成されている。
FoMo-Benchにおけるタスクと地理的多様性を高めるために,衛星画像と地上アノテーションを組み合わせた木種分類のためのグローバルデータセットであるTalloSを紹介した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:49:53 GMT)
SFLD: Reducing the content bias for AI-generated Image Detection [23.2] 新たなアプローチであるSFLDでは、高レベルの意味情報と低レベルのテクスチャ情報を統合するためにPatchShuffleが組み込まれている。
現在のベンチマークでは、画像品質の低下、コンテンツ保存の不十分、クラス多様性の制限といった課題に直面している。
そこで本研究では,実画像と合成画像のほぼ同一のペアを視覚的に構築するベンチマーク生成手法であるTwin Synthsを紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:38:34 GMT)
Revisiting LocalSGD and SCAFFOLD: Improved Rates and Missing Analysis [22.9] LocalSGD と SCAFFOLD は分散最適化において広く使われている手法である。
そこで我々は,LocalSGD と SCAFFOLD の収束特性を,既存あるいはより弱い条件下で再検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:50:58 GMT)
PointSea: Point Cloud Completion via Self-structure Augmentation [22.8] ポイントクラウドの完成は、3Dビジョンにおける根本的な問題だが、十分に解決されていない。
グローバル・ローカル・ポイント・クラウド・コンプリートのためのPointSeaを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:07:00 GMT)
ELFS: Label-Free Coreset Selection with Proxy Training Dynamics [22.8] 高性能なSOTA(State-of-the-art)コアセット選択法では,データセット全体に対して基底真理ラベルが必要となる。
新たなラベルフリーコアセット選択法であるELFS(Effective Label-Free Coreset Selection)を導入する。
4つのビジョンベンチマークでELFSを評価し,同じビジョンエンコーダが与えられた場合,ELFSはSOTAラベルのないベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:56:11 GMT)
Polynomial-Augmented Neural Networks (PANNs) with Weak Orthogonality Constraints for Enhanced Function and PDE Approximation [22.7] 現在拡張されたニューラルネットワーク(PANN)
本稿では、ディープニューラルネットワーク(DNN)と近似を組み合わせた新しい機械学習アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:20:04 GMT)
HyResPINNs: Hybrid Residual Networks for Adaptive Neural and RBF Integration in Solving PDEs [22.7] 本稿では,標準ニューラルネットワークと放射基底関数ネットワークを統合した適応型ハイブリッド残差ブロックを特徴とする新しいPINNであるHyResPINNを紹介する。
HyResPINNsの特徴は、各残差ブロック内で適応的な組み合わせパラメータを使用することで、ニューラルネットワークとRBFネットワークの動的重み付けを可能にすることである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:15:11 GMT)
E2ETune: End-to-End Knob Tuning via Fine-tuned Generative Language Model [22.7] E2ETuneは、細調整された生成言語モデルを利用した、エンドツーエンドのノブチューナーである。
本稿では,大量のトレーニングデータを効率的に自動生成する新しいデータ生成フレームワークを提案する。
これらの合成データは、生成言語モデルを微調整するために使用され、E2ETuneというエンドツーエンドのノブチューナーが生成される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:16:13 GMT)
Do Emotions Really Affect Argument Convincingness? A Dynamic Approach with LLM-based Manipulation Checks [22.5] 心理学や社会科学でよく用いられる操作チェックに着想を得た動的枠組みを導入する。
この枠組みは、感情の強さが知覚の説得力にどのような影響を及ぼすかを調べる。
我々は11個のLDMが同じシナリオでどのように振る舞うかを分析し、LLMは一般的に人間のパターンを反映するが、個々の判断において無意味な感情的効果を捉えるのに苦労していることを発見した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:04:44 GMT)
High-Temperature Gibbs States are Unentangled and Efficiently Preparable [22.4] 局所ハミルトンの熱状態は一定温度以上で分離可能であることを示す。
この熱絡みの突然死の証明は、多体系が高温で絡み合うことができるかどうかという根本的な疑問を解決している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:45:45 GMT)
EgoSocialArena: Benchmarking the Social Intelligence of Large Language Models from a First-person Perspective [22.3] 社会知能は認知知能、状況知能、行動知能の3つの柱の上に構築されている。
EgoSocialArenaは、個人の視点から、大規模言語モデルの社会的インテリジェンスを体系的に評価することを目的としている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:22:39 GMT)
Delta Decompression for MoE-based LLMs Compression [22.1] D2$-MoEは、MoE LLMのパラメータを減らすための新しいデルタ圧縮圧縮機である。
我々はそれらの重みを共有基底重みとユニークなデルタ重みに分解する。
実験では、私たちのアプローチの優位性を強調し、13%以上のパフォーマンス向上を実現しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:32:22 GMT)
When Can We Solve the Weighted Low Rank Approximation Problem in Truly Subquadratic Time? [22.0] 目標は、2つの低ランク行列 (U, V in mathbbRn times k$) を見つけることで、$| W circ (U Vtop - A) |_F2$ のコストを最小化することである。
この研究では、もし$A$ と $W$ が高密度であっても、ほぼ線形な$n1+o(1) の時間で重み付けされた低ランク近似問題を解くことを望んでおり、ある体制が存在することを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:18:24 GMT)
Offline Safe Reinforcement Learning Using Trajectory Classification [22.0] 我々は、望ましい軌跡を生成し、望ましくない軌跡を避ける政策を学ぶ。
オフライン安全なRLのためのDSRLベンチマークを用いて,本手法を広範囲に評価した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:22:17 GMT)
A Systematic Survey of Automatic Prompt Optimization Techniques [22.0] 本研究は,本分野における現状と今後の課題をまとめた総合的な調査である。
APOは5つの部分を統一するフレームワークであり、それに基づいて関連する作業をすべて厳格に分類する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:29:13 GMT)
A Survey of fMRI to Image Reconstruction [21.9] 機能的磁気共鳴イメージング(fMRI)に基づく画像再構成は、人間の知覚を復号する上で重要な役割を担っている。
ディープラーニングの最近の進歩は進歩を促しているが、データ不足、オブジェクト間のばらつき、セマンティック一貫性の低下といった課題が続いている。
本稿では,fMRI2画像(fMRI2画像)の概念を紹介し,この分野における最初の体系的レビューを紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:53:04 GMT)
Supervised contrastive learning from weakly-labeled audio segments for musical version matching [21.9] 本稿では,弱い注釈付きセグメントから学習する手法を提案する。
これら2つの要素により、標準トラックレベル評価において最先端の結果を得るだけでなく、セグメントレベル評価においてブレークスルー性能を得る。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:01:40 GMT)
LLM-QE: Improving Query Expansion by Aligning Large Language Models with Ranking Preferences [21.8] 本稿では,Lumge Language Models (LLM) を利用して文書ベースのクエリ拡張を生成する新しいアプローチ LLM-QE を紹介する。
ゼロショット高密度検索モデルであるContrieverの実験は、LLM-QEの有効性を実証し、8%以上の改善を実現した。
LLM-QEは、高密度レトリバーのトレーニングプロセスも改善し、微調整後の5%以上の改善を実現している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:15:41 GMT)
SLVC-DIDA: Signature-less Verifiable Credential-based Issuer-hiding and Multi-party Authentication for Decentralized Identity [21.5] 検証可能な認証技術は、複数のエンティティにまたがる分散DIDベースのアクセス制御を容易にするために使用される。
既存のDIDスキームは一般に分散公開鍵基盤に依存しており、これも課題を引き起こしている。
本稿では,PIH(Permanent-Hiding)に基づくDIDベースの多人数認証フレームワークを提案し,SLVC-DIDAという署名レスVCモデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:10:07 GMT)
FilterLLM: Text-To-Distribution LLM for Billion-Scale Cold-Start Recommendation [21.4] FilterLLMは、LLMの次のワード予測機能を数十億規模のフィルタリングタスクに拡張するフレームワークである。
コールドスタートレコメンデーションタスクでは最先端の手法を著しく上回り、効率は30倍以上に向上する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:31:14 GMT)
An Equivariant Pretrained Transformer for Unified 3D Molecular Representation Learning [21.3] Equivariant Pretrained Transformer (EPT)は、複数のドメイン3D分子から事前学習できる全原子基盤モデルである。
小分子、タンパク質、タンパク質-タンパク質複合体、タンパク質-分子複合体からなる5.89Mの大規模データセットを構築した。
我々は,SARS-CoV-2の複製において重要な標的である3CLプロテアーゼを標的とした小分子薬物候補の同定におけるEPTの可能性を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:33:06 GMT)
Improving Retrieval-Augmented Deep Assertion Generation via Joint Training [21.2] 検索強化された自動アサーション生成手法 AG-RAG を提案する。
AG-RAGは、関連するテスト-アサートペア(TAP)をセマンティックマッチングで検索するために、密集したレトリバーを構築する。
我々はAG-RAGを2つのベンチマークと3つのメトリクスに関する6つの最先端のAGアプローチに対して広範囲に評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:00:10 GMT)
Residual Stream Analysis with Multi-Layer SAEs [21.1] 各トランス層からの残ストリーム活性化ベクトルをトレーニングした単一SAEであるMLSAE(Multi-layer SAE)を導入する。
個々のラテントが与えられたトークンやプロンプトの単一層でアクティブになることが多いが、個々のラテントがアクティブである層は異なるトークンやプロンプトで異なる場合がある。
この結果は,トランスを流れるとき,表現がどのように変化するかを理解するための新しいアプローチを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:18:36 GMT)
DynamicNER: A Dynamic, Multilingual, and Fine-Grained Dataset for LLM-based Named Entity Recognition [21.1] 大規模言語モデル(LLM)に特化して設計された最初のNERデータセットであるDynamicNERを提案する。
8つの言語と155のエンティティタイプをカバーし、コーパスは複数の専門ドメインにまたがっている。
2段階戦略と軽量LLMに基づく新しいNER法であるCascadeNERを開発した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:46:07 GMT)
Laplace-Beltrami Operator for Gaussian Splatting [21.1] 幾何学処理において広く使われているツールであるLaplace-Beltrami演算子をガウススプラッティング上で直接計算するための定式化を提案する。
概念的にはラプラシアンの点雲と似ているが、ガウススティングセンターで符号化された点雲の精度は優れている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:29:33 GMT)
GraphIC: A Graph-Based In-Context Example Retrieval Model for Multi-Step Reasoning [20.9] 推論プロセスのグラフベースの表現をICEの選択に活用する新しいアプローチであるGraphICを提案する。
また,GraphICはICLの性能と相互運用性を向上し,多段階推論タスクにおけるICE選択を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:35:18 GMT)
REGENT: A Retrieval-Augmented Generalist Agent That Can Act In-Context in New Environments [20.8] 新しい環境に迅速に適応できるジェネラリストエージェントを構築することは、デジタルおよび現実世界にAIをデプロイする上で重要な課題である。
そこで本研究では,比較的小規模なデータセットを事前訓練した上で,コンテキスト内学習による未知の環境に適応する手法を提案する。
私たちのキーとなるアイデアは、検索が高速適応に強力なバイアスを与える、ということです。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:06:51 GMT)
Forecasting Rare Language Model Behaviors [20.7] 提案手法は,評価中のテストよりも,桁違いに多くのクエリに対して潜在的なリスクを予測できる手法である。
我々の予測は、最大3桁のクエリボリュームで、様々な望ましくない振る舞いの出現を予測することができる。
私たちの作業により、モデル開発者は大規模なデプロイメント中に現れる前に、稀な障害を積極的に予測し、パッチを当てることができます。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:16:15 GMT)
Quantifying Logical Consistency in Transformers via Query-Key Alignment [20.6] 本稿では,論理的推論のための新しい軽量評価手法を提案する。
提案手法は,1つのフォワードパスを計算し,慎重に選択されたヘッドから「QKスコア」を抽出することにより,無効な推論から確実に分離した潜在表現を明らかにする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:02:50 GMT)
TB-HSU: Hierarchical 3D Scene Understanding with Contextual Affordances [20.4] 本研究では,3次元階層的なシーングラフを用いて,機能的可利用性の変化と構造を学習するモデルを構築した。
様々な機能的余裕は、グラフの様々な空間的コンテキストと統合するように設計されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:27:39 GMT)
Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment [20.4] Low-Rank Adaptation (LoRA)は、Large Language Models (LLM) のためのパラメータ効率の良い微調整を可能にする
現在の手法は静的特異値分解サブセットを初期化することでLoRAを最適化し、事前学習された知識を最適に活用する。
我々はLunderlineoRunderlineA Mixture-of-Experunderlinet (GOAT)を提案する。
GOATはSVD構造化MoEを用いて関連する事前情報を統合し、理論スケーリング係数を導出して最適化を完全微調整MoEと整合させる
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:48:13 GMT)
How Do Large Language Monkeys Get Their Power (Laws)? [20.2] 単純な数学的計算は、各問題に対して、失敗率は試行回数とともに指数関数的に減少する、と予測する。
次に、プロブレムごとの指数関数スケーリングを集約スケーリングと整合できることを示すことで、この問題に答える。
私たちの研究は、推論計算のスケーリングによって、ニューラルネットワークモデルのパフォーマンスがどのように改善されるか、より深く理解するのに役立ちます。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:01:47 GMT)
Fast and Effective GNN Training through Sequences of Random Path Graphs [20.2] 本稿では,ノード分類タスクにおいて,GNNをトレーニングするためのスケーラブルなフレームワークであるGERNを紹介する。
提案手法は,経路グラフに好適に変換された無作為な散在木列のGNN重みを漸進的に洗練する。
これらの経路グラフのスパース性は、GNN訓練の計算負担を大幅に軽減する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:54:14 GMT)
Multilingual LLMs Inherently Reward In-Language Time-Sensitive Semantic Alignment for Low-Resource Languages [19.9] 資源豊富な言語と低リソースと見なされる言語とのラベル付きリソースの格差は、大規模言語モデル(LLM)にとって重要な障害である。
言語間インコンテキスト学習(X-ICL)における最近の進歩は、主に多言語事前学習型トランスフォーマーから得られる意味的に整合した例を通して、この問題を緩和する上で有望であることが示されている。
本研究では,低リソース言語における時間的推論能力の向上により,このギャップを埋めることを目的とする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:44:37 GMT)
Bootstrapping Heterogeneous Graph Representation Learning via Large Language Models: A Generalized Approach [19.8] グラフ表現学習法は,グラフ構造内の複雑な関係や特徴を捉えることで,複雑な非ユークリッドデータを扱うのに極めて効果的である。
既存のヘテロジニアスグラフニューラルネットワーク(HGNN)は有望な結果を示しているが、ノードタイプとエッジタイプの事前知識と統一ノード特徴形式が必要である。
大規模言語モデル(LLM)を用いたグラフ表現学習の最近の進歩は、新しいソリューションを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:31:48 GMT)
DynaMath: A Dynamic Visual Benchmark for Evaluating Mathematical Reasoning Robustness of Vision Language Models [19.8] In-deepth Assessment of Vision-Language Models (VLMs) のための動的視覚数学ベンチマークであるDynaMathを紹介する。
DynaMathには501の高品質でマルチトピックなシード質問が含まれており、それぞれがPythonプログラムとして表現されている。
その結果,10変種すべてにおいて正解された種子質問の割合として定義される最悪のモデル精度は,平均値よりも有意に低いことがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:55:22 GMT)
PosterSum: A Multimodal Benchmark for Scientific Poster Summarization [19.4] PosterSumは視覚言語モデルの開発を進めるための新しいベンチマークである。
我々はPosterSum上で最先端のマルチモーダル大言語モデル(MLLM)をベンチマークする。
自動メトリクス上での現在のMLLMよりも優れた階層的手法であるSegment & Summarizeを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:35:39 GMT)
MMUnlearner: Reformulating Multimodal Machine Unlearning in the Era of Multimodal Large Language Models [19.4] MLLM(Multimodal Large Language Models)の時代におけるMultimodal Machine Unlearning(MU)の課題を再考する。
我々は,新しい幾何制約付き降下勾配法MMUnlearnerを開発した。
MLLMの重みを、未学習時の残りの概念とテキスト知識に制約された重み値マップで更新する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:32:25 GMT)
MTVHunter: Smart Contracts Vulnerability Detection Based on Multi-Teacher Knowledge Translation [19.1] マルチTeacher ベースのバイトコード脆弱性検出手法である textbfMulti-textbfTeacher textbfVulnerability textbfHunter を提案する。
具体的には,まず,抽象的脆弱性パターンによるノイズ干渉を除去する指導法を提案する。
第2に,ソースコードから必要な意味を効果的に抽出してバイトコードを補充する,ニューロン蒸留を用いた新しいセマンティック補完教師を設計する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:30:53 GMT)
Pleno-Generation: A Scalable Generative Face Video Compression Framework with Bandwidth Intelligence [19.1] Pleno-Generation(PGen)フレームワークは、コンパクトなビットストリームを追求するよりも、高忠実度再構築を優先する。
提案したフレームワークは、アプリケーションのコーディングにより大きな柔軟性を提供できることを示す。
最新のVersatile Video Coding (VVC) と比較して,提案手法は競合するBjontegaard-delta-rateの削減を実現する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:03:30 GMT)
Towards Hierarchical Rectified Flow [19.0] 階層的な整流流を定式化し、データ分布をモデル化する。
我々は、既知のソース分布からデータ分布を生成する時間差分プロセスを経験的に定義する。
我々は,MNIST,CIFAR-10,ImageNet-32データとともに,合成1Dおよび2Dデータ上でこれを検証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:59:55 GMT)
A Refined Analysis of UCBVI [18.7] 我々は, UCBVIアルゴリズム(Azar et al., 2017)の精巧な解析を行い,ボーナス項と後悔解析の両方を改善した。
UCBVIのオリジナルバージョンと最先端MVPアルゴリズムを比較した。
実験による検証により, 境界における乗法定数の改善は, アルゴリズムの経験的性能に有意な正の影響を及ぼすことが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:50:29 GMT)
Autoregressive Image Generation Guided by Chains of Thought [18.6] CoT(Chain-of-Thought)は、人間の推論と同様、コンテキストコヒーレンスと論理的一貫性をモデルが維持するのに役立つ。
本稿では,自己回帰画像生成を改善するために,思慮的推論を用いた自己回帰画像生成(IGTR)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:44:01 GMT)
KV-Edit: Training-Free Image Editing for Precise Background Preservation [18.1] KV-Editはトレーニング不要のアプローチで、バックグラウンドの一貫性を維持するためにDiTのKVキャッシュを使用する。
我々のアプローチは、追加のトレーニングなしでDiTベースの生成モデルと互換性がある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:40:09 GMT)
Three-in-One: Fast and Accurate Transducer for Hybrid-Autoregressive ASR [18.0] 本稿では,音声認識のためのハイブリッド・オートレグレッシブ推論Transducers(HAINAN)を提案する。
HAINANは、すべてのネットワークコンポーネントによる自己回帰推論と、予測子を使わずに非自己回帰推論の両方をサポートする。
HAINANは非自己回帰モードではCTC, 自己回帰モードではTDTと効率が同等であることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:15:09 GMT)
Posterior Inference with Diffusion Models for High-dimensional Black-box Optimization [17.9] 生成モデルはブラックボックス最適化の問題を解決するために登場した。
我々は、高次元のブラックボックス最適化問題を解決するための新しいフレームワーク、textbfDiBOを紹介する。
提案手法は,様々な合成および実世界のブラックボックス最適化タスクにおいて,最先端のベースラインよりも優れる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:19:15 GMT)
Privacy-Preserving Epidemiological Modeling on Mobile Graphs [17.9] RIPPLEはプライバシー保護の疫学モデリングフレームワークである。
Pir-SUMは、データベースから要素和を安全にダウンロードするための、プライベート情報検索の新しい拡張である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:25:04 GMT)
Transformers Can Learn Temporal Difference Methods for In-Context Reinforcement Learning [17.7] 強化学習(RL)エージェントは、タスク環境とのインタラクションを通じてニューラルネットワークパラメータを更新することで、新しいタスクの解決を学ぶ。
最近の研究は、一部のRLエージェントが、特定の事前訓練手順の後に、パラメーター更新なしで見知らぬ新しいタスクを解くことができることを示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:47:35 GMT)
CodeSwift: Accelerating LLM Inference for Efficient Code Generation [17.7] コード生成に特化して設計された,高効率な推論高速化手法であるCodeSwiftを提案する。
CodeSwiftはマルチソースのデータストアを構築し、一般的な知識とプロジェクト固有の知識の両方へのアクセスを提供する。
実験の結果、CodeSwiftはリポジトリレベルのコード生成タスクとスタンドアロンコード生成タスクの自己回帰デコーディングと比較して、最大2.53倍と2.54倍のスピードアップに達することが示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:30:30 GMT)
Improving Interactive Diagnostic Ability of a Large Language Model Agent Through Clinical Experience Learning [17.6] 本研究では,性能劣化現象の根底にあるメカニズムについて検討する。
我々は,中国とアメリカの医療施設から350万件以上の電子医療記録を活用する,PPME ( Plug-and-play) LLM エージェントを開発した。
本研究は, 初期疾患の診断・調査のための専門モデルを統合し, 指導的, 強化的学習技術を用いて訓練した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:24:20 GMT)
Estimating Neural Representation Alignment from Sparsely Sampled Inputs and Features [17.4] 入力と特徴サンプリングの両方を補正する新しい推定器を導入する。
脳から脳へのアライメントとモデルから脳へのアライメントの評価に本手法を用いた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:35:46 GMT)
Parameter Efficient Merging for Multimodal Large Language Models with Complementary Parameter Adaptation [17.4] 相補的パラメータ適応を用いたトレーニング不要なパラメータ効率的なマージ手法であるCoPA-Mergingを提案する。
多様なマルチモーダルタスクからなるベンチマークを構築し,本手法の卓越した性能と一般化性を証明する実験を行った。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:52:05 GMT)
LCV2I: Communication-Efficient and High-Performance Collaborative Perception Framework with Low-Resolution LiDAR [17.2] V2I(Van-to-Infrastructure)は、インフラのセンサーによって収集されたデータを活用して、車両の知覚能力を高める。
ライダーは協調的な知覚においてよく使われるセンサーであり、インテリジェントな車両やインフラに広く備わっている。
低コストなV2Iを実現するためには、LiDARのコスト削減が不可欠である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:46:28 GMT)
IBURD: Image Blending for Underwater Robotic Detection [17.2] IBURDは水中の破片の画像とピクセルレベルのアノテーションの両方を生成する。
IBURDは透明なオブジェクトを任意の背景にしっかりとブレンドすることができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:56:49 GMT)
MultiOCR-QA: Dataset for Evaluating Robustness of LLMs in Question Answering on Multilingual OCR Texts [17.2] 我々は,多言語QAデータセットであるMultiOCR-QAを導入し,OCRノイズがQAシステムの性能に与える影響を分析する。
MultiOCR-QAデータセットは、英語、フランス語、ドイツ語の3言語をカバーする60万の質問応答ペアで構成されている。
以上の結果から,QA システムは OCR による誤りの頻度が高く,ノイズの多い OCR テキストでの性能劣化を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:16:37 GMT)
Understanding the Uncertainty of LLM Explanations: A Perspective Based on Reasoning Topology [17.1] 大規模言語モデル(LLM)の説明の不確かさは、その忠実さと推論整合性を評価する上で重要である。
本稿では,LLM説明の不確かさを推論トポロジーの観点から定量化する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:28:21 GMT)
Leveraging Procedural Knowledge and Task Hierarchies for Efficient Instructional Video Pre-training [16.8] インストラクショナルビデオモデルは、入力ビデオで発生するタスクとステップの両方を推測することができるべきである。
我々は、タスク階層と、指導ビデオに関連する手続きステップを明確に掘り下げる。
タスク認識、ステップ認識、ステップ予測タスクにおいて、この事前学習モデルをテストする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:29:10 GMT)
VGFL-SA: Vertical Graph Federated Learning Structure Attack Based on Contrastive Learning [16.7] グラフニューラルネットワーク(GNN)は,グラフデータから表現を学習する能力に注目されている。
近年の研究では、垂直グラフフェデレーション学習フレームワークは、性能を低下させる敵攻撃に弱いことが示されている。
ラベルを使わずにローカルクライアント構造を変更してVGFLの性能を低下させるために,VGFL-SAと呼ばれる新しいグラフ対逆攻撃を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:04:48 GMT)
PairBench: A Systematic Framework for Selecting Reliable Judge VLMs [16.5] PairBenchは、大規模視覚言語モデル(VLM)をカスタマイズ可能な類似性ツールとして体系的に評価するフレームワークである。
PairBenchを通じて、類似度スコアのキーデシラタを表す4つのメトリクスを紹介します。
我々の分析では、クローズドあるいはオープンソースを問わず、どのモデルもすべての指標より優れていることが示されています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:01:43 GMT)
Bridging Information Gaps with Comprehensive Answers: Improving the Diversity and Informativeness of Follow-Up Questions [16.5] 本稿では,未回答情報を対象とした多種多様な質問を生成する手法を提案する。
提案手法は,既存のフォローアップ質問データセットの強化に応用される。
実験の結果,拡張データセットを微調整した言語モデルでは,品質と多様性が著しく向上した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:14:59 GMT)
HVIS: A Human-like Vision and Inference System for Human Motion Prediction [16.3] 本研究では,人間の動作予測のためのHuman-like Vision and Inference System (HVIS)を提案する。
HVISは、HVE(Human-like Vision Encodetemporal)モジュールとHMI(Human-like Motion Inference)モジュールの2つのコンポーネントから構成される。
提案手法は,Human3.6Mで19.8%,CMU Mocapで15.7%,G3Dで11.1%,従来手法で19.8%,最先端性能で著しく向上した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:18:37 GMT)
LongAttn: Selecting Long-context Training Data via Token-level Attention [16.3] LongAttnはトークンレベルのフレームワークで、データの長距離依存関係を測定する。
オープンソース長文データセット(ArXiv, Book, Code)からLongABC-32Kをフィルタリングする
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:51:53 GMT)
MEDA: Dynamic KV Cache Allocation for Efficient Multimodal Long-Context Inference [15.9] MEDAはマルチモーダル長文推論のための動的層ワイドKVキャッシュ割り当て手法である。
MEDAは最大72%のKVキャッシュメモリと2.82倍のデコード速度を実現している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:34:52 GMT)
Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model [15.9] Plane-DUSt3R は3次元基礎モデル DUSt3R を利用したマルチビュールームレイアウト推定手法である。
均一かつ同相な結果を生成することにより、Plane-DUSt3Rは、単一の後処理ステップと2D検出結果のみを用いて、部屋レイアウトの推定を可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:14:19 GMT)
Distributionally Robust Active Learning for Gaussian Process Regression [15.8] 本稿では,GPRの最悪の予測誤差を効果的に低減する2つのAL手法を提案する。
最短ケースの予測二乗誤差の上限が上界であることを示し、この誤差は穏やかな条件下で有限個のデータラベルによって任意に小さくなることを示唆する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:14:27 GMT)
MAD-AD: Masked Diffusion for Unsupervised Brain Anomaly Detection [15.6] 脳画像における教師なし異常検出は、ラベルにアクセスせずに損傷や病理を識別するために重要である。
本研究では,拡散モデルにマスキングを組み込んだ新しい手法を提案し,その生成能力を活用して正常脳解剖学の堅牢な表現を学習する。
提案手法は,既存の教師なし異常検出手法を超越し,高精度な正常な異常発生と局所的異常発生に優れた性能を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:11:29 GMT)
The Blessing of Reasoning: LLM-Based Contrastive Explanations in Black-Box Recommender Systems [15.5] ディープニューラルネットワーク(DNN)を備えた大規模言語モデル(LLM)は、説明可能性と精度を向上させることができる。
LR-Recsysは、人間の読みやすい肯定的な説明と否定的な説明を生成するコントラッシブ・エクスラレーション・ジェネレータを導入している。
LR-Recsysは、高次元統計学習理論によって支持されるように、学習効率と予測精度も改善する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:19:46 GMT)
Model-Based Exploration in Monitored Markov Decision Processes [15.4] モニターされたマルコフ決定プロセス(Mon-MDP)は、最近そのような設定のモデルとして提案されている。
これまで開発された Mon-MDP アルゴリズムは問題構造を完全に活用していない。
我々は,これらすべての欠点に対処するMon-MDPのモデルベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:35:32 GMT)
Improving the Transferability of Adversarial Examples by Inverse Knowledge Distillation [15.4] 逆知識蒸留(Inverse Knowledge Distillation, IKD)は, 対向移動性を効果的に向上するように設計されている。
IKDは勾配に基づく攻撃手法を統合し、攻撃勾配の多様性を促進し、特定のモデルアーキテクチャへの過度な適合を緩和する。
ImageNetデータセットの実験は、我々のアプローチの有効性を検証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:35:30 GMT)
A stochastic smoothing framework for nonconvex-nonconcave min-sum-max problems with applications to Wasserstein distributionally robust optimization [15.2] 本研究は,mboxlog-sumexp関数に基づく新しいトレーニング平滑化フレームワークを提案する。
我々は,計算困難に対処し,クラーク/方向性定常点への収束を保証する反復的平滑化アルゴリズムを開発した。
我々の手法は、ニュース問題、ディープラーニング回帰、対向的に堅牢なディープラーニングの解決において、最先端の手法よりも優れているか、競争的である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:36:47 GMT)
Knowledge Distillation with Training Wheels [15.2] 授業中に教師から学習する知識蒸留のための,より一般的な枠組みを定式化する。
制約付き強化学習を用いてこれを、テストタイム参照として教師モデルを使用するフレームワークに拡張する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:17:52 GMT)
Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement [15.0] 本稿では,モンテカルロ木探索フレームワーク(TSMCTS)について述べる。
TSMCTSは、RGB-Dカメラのみを使用してテーブルトップのタイピング問題を解決するように設計されている。
コーヒーテーブル、ダイニングテーブル、オフィスデスク、トイレなど、さまざまな環境において、その能力の実証に成功している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:12:29 GMT)
Learning Dual Transformers for All-In-One Image Restoration from a Frequency Perspective [14.8] この作業は、1つのモデルで複数のタイプの劣化を処理しようとするオールインワンのイメージ復元タスクに取り組むことを目的としている。
主な課題は、入力された劣化画像から分解表現を抽出し、モデルを特定の劣化タイプに適応させることである。
周波数認識型劣化推定変換器(Dformer)と劣化適応型復元変換器(Rformer)の2成分からなる新しい二重変換器手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:27:49 GMT)
Low-distortion and GPU-compatible Tree Embeddings in Hyperbolic Space [14.8] 双曲幾何学は、ユークリッド埋め込みよりもはるかに優れた性能を持つ木を埋め込む自然な解を提供する。
近年の文献では、ニューラルネットワーク上にハイパーボリックツリーの埋め込みを配置することで、ディープラーニング環境における階層的な知識統合が可能になることが示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:19:59 GMT)
Diffusion Models for Tabular Data: Challenges, Current Progress, and Future Directions [14.7] 拡散モデルは、GAN(Generative Adversarial Networks)やVAE(Varial Autoencoders)の優れた代替品として登場した。
拡散モデルはGANやVAEに対して同様の利点を示し始めており、大幅な性能のブレークスルーを達成している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:01:33 GMT)
Ensembling Diffusion Models via Adaptive Feature Aggregation [14.7] より強力な生成能力を生み出すために複数の高品質モデルを活用することは価値があるが、広く研究されていない。
既存のメソッドは主にパラメータマージ戦略を採用して、新しい静的モデルを生成する。
本稿では,様々な状態に応じて複数のモデルのコントリビューションを動的に調整するアダプティブ・フィーチャー・アグリゲーション(AFA)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:35:14 GMT)
Dependency Parsing with the Structuralized Prompt Template [14.5] 依存解析は自然言語処理(NLP)の基本課題である
本稿では,テキスト・テキスト・トレーニング・アプローチを用いたエンコーダ・モデルのみに依存する新しい依存性解析手法を提案する。
実験の結果,提案手法は従来のモデルと比較して優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:25:10 GMT)
EDA-Q: Electronic Design Automation for Superconducting Quantum Chip [14.3] EDA-Qと呼ばれる量子チップ設計に特化したフルスタックEDAツールを開発した。
EDA-Qは、デバイスマッピングや製造プロセスマッピングといった重要な設計段階を補完しながら、既存の量子EDAツールに存在する機能を組み込んでいる。
統合デザインモードは、異なるチップコンポーネントとのアルゴリズム互換性を保証し、ユーザーに対して単純で適応可能なコマンドインターフェースを提供するために、特別にインタラクティブな処理モードを使用する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:51:09 GMT)
WildFrame: Comparing Framing in Humans and LLMs on Naturally Occurring Texts [14.2] 自然発生文における正および負のフレーミングに対する応答を評価するデータセットであるWildFrameを紹介する。
WildFrameは1000のテキストで構成され、まず感情を明確にした現実世界のステートメントを選択した後、肯定的あるいは否定的な光でそれらを解釈し、最後に人間の感情アノテーションを収集する。
すべてのモデルが人間に類似したフレーミング効果を示しており、人間とモデルの両方がネガティブリフレーミングよりもポジティブな影響を受けていることがわかりました。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:14:05 GMT)
Confidence-aware 3D Gaze Estimation and Evaluation Metric [14.2] 本稿では,視線角度推定とともに不確実性を予測する信頼度認識モデルを提案する。
また,眼の特徴劣化と推論の不確実性の増大の因果関係に基づく新しい有効性評価手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:56:08 GMT)
Conditional [MASK] Discrete Diffusion Language Model [14.2] Diffusion-EAGSは、条件付きマスキング言語モデルと拡散言語モデルを統合するフレームワークである。
本研究では,Diffusion-EAGSが最高の品質・多様性のトレードオフを実現し,非自己回帰テキスト生成の有効性を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:11:03 GMT)
Intention Recognition in Real-Time Interactive Navigation Maps [14.1] 本研究では,リアルタイムナビゲーションのための対話型地図におけるユーザの意図を認識するシステムを開発した。
IntentRec4MapsはGoogle Maps Platformを現実世界のインタラクティブマップとして使っている。
本稿では,2つのパスプランナと大規模言語モデルを用いて,IntentRec4Mapの認識過程を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:04:18 GMT)
Aligning Compound AI Systems via System-level DPO [14.0] 本稿では,これらのDAGの操作にDPOを適用することで,複合系を協調的に整合させるシステムレベルDPOを提案する。
私たちの調査は、複合AIシステムの整合性に関する洞察を与え、将来の進歩の基盤を築き上げます。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:25:13 GMT)
FADE: Why Bad Descriptions Happen to Good Features [14.0] FADE: 特徴アライメントを記述評価に導入する。
FADEは機能記述アライメントを評価するためのスケーラブルなフレームワークである。
既存のオープンソース機能記述を分析し、自動解釈可能性パイプラインの重要なコンポーネントを評価するためにFADEを適用した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:28:35 GMT)
On the Vulnerability of Concept Erasure in Diffusion Models [13.9] マシン・アンラーニングの研究は、ホック後のトレーニングを通じて不要なデータの影響を除去することを目的とした、様々な概念消去手法を開発した。
これらの消去技術は脆弱であり、敵に製作されたプロンプトを用いて、消去されたとされる概念のイメージを生成可能であることを示す。
本稿では, 削除コンテンツの生成を誘導できるプロンプトを検出するアルゴリズムであるRECORDを紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:26:01 GMT)
LiNo: Advancing Recursive Residual Decomposition of Linear and Nonlinear Patterns for Robust Time Series Forecasting [13.9] 近年の深層時系列予測モデルでは, 季節分解とトレンド分解を利用して, 絡み合った成分を分離することが困難である。
線形パターンと非線形パターンの両方を明示的に抽出することにより再帰的残留分解を革新する。
我々は、一般的な学習可能な自己回帰モデルに対する現在の単純な線形パターン抽出器を開発し、すべての重要な非線形パターンを扱える新しいNoブロックを設計する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:43:48 GMT)
Projection Optimization: A General Framework for Multi-Objective and Multi-Group RLHF [13.6] 強化学習とヒューマンフィードバック(Reinforcement Learning with Human Feedback, RLHF)は、機械学習モデルと人間の好みを一致させる、広く使われている微調整アプローチである。
本研究では,非線形アグリゲーション問題を一連のサブプロブレムに変換し,フレームワークを多群シナリオに拡張する。
我々は,アルゴリズムフレームワークがサブ線形後悔を実現し,報酬のないアルゴリズムに容易に適応できることを実証した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:06:04 GMT)
Improving reliability of uncertainty-aware gaze estimation with probability calibration [13.6] 現在のディープラーニングによる外見に基づく不確実性認識による視線推定モデルは、一貫性のない信頼できない不確実性推定を生成する。
本稿では,いくつかのポストホックサンプルを用いた確率校正による不確実性推定の精度向上のためのワークフローを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:07:44 GMT)
MEMERAG: A Multilingual End-to-End Meta-Evaluation Benchmark for Retrieval Augmented Generation [13.4] マルチリンガル・エンド・エンド・エンド・メタ評価RAGベンチマーク(MEMERAG)を開発した。
我々のベンチマークは,MIRACLデータセット上に構築されており,母国語質問を用いて多種多様な大言語モデル(LLM)による応答を生成する。
提案するベンチマークでは,高度なプロンプト技術とLCMによる改善を確実に識別できることが示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:58:42 GMT)
Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study [13.4] GemmaX2-28は、28言語で最上位の多言語翻訳性能を達成する9Bモデルである。
GemmaX2-28 は TowerInstruct や XALMA などの最先端 (SOTA) モデルより一貫して優れている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:24:04 GMT)
Distributional Scaling Laws for Emergent Capabilities [13.4] 測定値の急激なブレークスルーは,種子間の分布の連続的な変化によって生じることを示す。
逆スケーリングのケーススタディとして、成功したランの確率が低下しても、成功したランの平均性能が単調に増加し続けることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:34:45 GMT)
Pitfalls of Evidence-Based AI Policy [13.4] 目的がエビデンスベースのAIポリシーであるなら、第一の規制目標は、AIリスクを特定し、研究し、検討するプロセスを積極的に促進することである、と我々は主張する。
これを促進するために、ブラジル、カナダ、中国、EU、韓国、英国、米国がそれぞれ、さらなる証拠調査政策を採用する実質的な機会を持っていることを示すための15の規制目標について論じる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:46:57 GMT)
Self-Confirming Transformer for Belief-Conditioned Adaptation in Offline Multi-Agent Reinforcement Learning [13.3] オフライン強化学習(RL)は、オフラインデータセットとオンライン環境の間の分散シフトに悩まされる。
本稿では,自己拡張プレコンディショニングの考え方に基づいて,トランスフォーマーエージェントにオンライン適応性を持たせるための新しい自己回帰トレーニングを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:49:47 GMT)
Deep Learning-Powered Electrical Brain Signals Analysis: Advancing Neurological Diagnostics [13.2] 脳波/iEEGに基づく神経学的診断における深層学習手法の進歩を体系的に検討する。
46個のデータセットを用いた7つの神経学的条件の応用に焦点を当てた。
多様なデータセットをまたいだモデル評価のための標準化されたベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:45:05 GMT)
Machine learning and high dimensional vector search [13.2] 機械学習とベクトル探索は、並列に開発された2つの研究トピックである。
ビッグデータに関連する他の多くの分野とは異なり、機械学習はベクトル探索に大きな影響を与えていない。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:49:49 GMT)
GSQ-Tuning: Group-Shared Exponents Integer in Fully Quantized Training for LLMs On-Device Fine-tuning [13.0] オンデバイス大規模言語モデル(LLM)ファインチューニングアダプタのための新しい推論フレームワークを提案する。
コアとなるGroup-Shared Exponentsフォーマットは、パラメータ群間の指数を用いて、整数形式のモデルパラメータを効率的に表現する。
提案手法は,BF16による微調整に匹敵する精度を実現し,メモリ使用量の1.85倍を大幅に削減することを示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:46:54 GMT)
SS-MPC: A Sequence-Structured Multi-Party Conversation System [12.9] 我々は,多人数会話(MPC)モデルに対する応答生成モデルである textbfSS-MPC を提案する。
会話構造を分析するためにグラフに依存する既存のモデルとは異なり、SS-MPCは内部的に対話構造を逐次入力としてエンコードする。
人間による評価では、SS-MPCは既存のMPCモデルと比較して、より流動的で正確な応答を生成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:25:19 GMT)
Salience-Invariant Consistent Policy Learning for Generalization in Visual Reinforcement Learning [12.9] 見えないシナリオにポリシーを一般化することは、視覚的強化学習において重要な課題である。
目に見えない環境では、不注意なピクセルがエージェントにタスク関連情報を含む表現を抽出させる可能性がある。
ゼロショット一般化のための効率的なフレームワークであるSalience-Invariant Consistent Policy Learningアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:02:47 GMT)
CipherPrune: Efficient and Scalable Private Transformer Inference [12.9] 暗号化プロトコルを使用したプライベートトランスフォーマー推論は、プライバシ保護機械学習のための有望なソリューションを提供する。
しかしながら、実行時のオーバーヘッド(効率上の問題)と、長時間の入力を処理する上での課題に依然として直面している。
我々は、効率的でスケーラブルなプライベート推論フレームワークであるcipheritCipherPruneを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:27:54 GMT)
Zero-shot Load Forecasting for Integrated Energy Systems: A Large Language Model-based Framework with Multi-task Learning [12.6] 本稿では,大規模言語モデル(LLM)に基づく新しいゼロショット負荷予測フレームワークを提案する。
このフレームワークの有効性は、オーストラリアの20世帯の負荷プロファイルを含む実世界のデータセットで検証された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:50:26 GMT)
ReFocus: Reinforcing Mid-Frequency and Key-Frequency Modeling for Multivariate Time Series Forecasting [12.6] この研究は、畳み込みと残留学習に基づく新しい適応中周波数エネルギーを導入し、中周波数帯域の重要性を強調した。
各チャネルに他のチャネルからのスペクトル情報をランダムに導入するキー周波数モデリングをさらに強化するために、新しいキー周波数拡張訓練戦略が採用されている。
提案手法は,従来のSOTA iTransformerと比較してMSEを4%, 6%, 5%削減し, トラヒック, ECL, ソーラーベンチマークの多変量時系列予測を推し進めた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:40:33 GMT)
Low-rank bias, weight decay, and model merging in neural networks [12.4] 我々は、L2$正規化でトレーニングされたディープニューラルネットワークのいくつかの特性を示す。
また、L2$正規化と低ランクバイアスによって実現されるマルチタスク学習現象についても検討した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:17:00 GMT)
Round Attention: A Novel Round-Level Attention Mechanism to Accelerate LLM Inference [12.3] 会話ラウンドが続くにつれて、大量のKVキャッシュをGPUメモリに格納する必要がある。
我々は,最も関連性の高いラウンドのKVキャッシュをリコールし,計算するラウンドアテンション機構であるラウンドアテンションを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:35:18 GMT)
Tree-Wasserstein Distance for High Dimensional Data with a Latent Feature Hierarchy [12.3] 2つの重要な側面を持つ高次元データに対する新しいツリー・ワッサースタイン距離(TWD)を提案する。
まず、我々のTWDは、潜在的な特徴階層を持つデータのために特別に設計されています。
データ観測に基づいて計算したTWDが、潜在特徴階層で定義されたTWDを確実に回復することを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:28:20 GMT)
Low-Rank and Sparse Model Merging for Multi-Lingual Speech Recognition and Translation [12.1] 異なる言語やタスクでトレーニングされたモデルを効率的に統合するテクニックであるLoRS-Mergingを紹介する。
LoRS-Mergingは低ランクとスパースプルーニングを組み合わせることで、冗長なパラメータを排除しながら本質的な構造を維持する。
この結果から,モデルマージ,特にLoRS-Mergingは,従来のS2Tアプリケーションの多言語学習戦略をスケーラブルかつ効果的に補完するものであることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:06:57 GMT)
Dormant: Defending against Pose-driven Human Image Animation [12.1] ポーズ駆動の人間の画像アニメーションは、非常に進歩し、1枚の写真から鮮明でリアルな人間のビデオを生成することができる。
逆に、攻撃者が利用可能な1つの画像を使って、政治、暴力、その他の違法コンテンツを含むビデオを作成することで、画像誤使用のリスクが悪化する。
本研究では,ポーズ駆動型人体画像アニメーション技術に対する防御を目的とした,新しい保護手法であるDormantを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:35:58 GMT)
DiffKAN-Inpainting: KAN-based Diffusion model for brain tumor inpainting [11.9] 脳の塗布は、腫瘍組織処理に有効なソリューションを提供するが、難しい。
本研究では,拡散モデルとKolmogorov-Arnold Networksアーキテクチャを融合したDiffKAN-Inpaintingを提案する。
定性的かつ定量的な結果は、最先端の手法と比較して、我々の提案したDiffKAN-InpaintingインペイントがBraTSデータセットをより詳細に、リアルに再構築していることを示している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:34:28 GMT)
Unraveling the geometry of visual relational reasoning [11.8] 人間や他の動物は、形や色の定数を認識するなど抽象的な関係を容易に一般化するが、ニューラルネットワークは苦戦する。
ニューラル表現の幾何学的理論に基づいて、一般化を予測する表現的ジオメトリを示す。
我々の発見は、ニューラルネットワークが抽象的な関係を一般化する方法に関する幾何学的な洞察を与え、AIにおける人間のような視覚的推論の道を開く。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:07:54 GMT)
Untold Stories: Unveiling the Scarce Contributions of UX Professionals to Usability Issue Discussions of Open Source Software Projects [11.8] 本研究はUX専門家のユーザビリティ問題への取り組みとフォローアップに対するアプローチを明らかにする。
他のコントリビュータと比較して、UX専門家は幅広いユーザビリティの問題に対処し、彼らのスタンスを支持し、感情よりも現実的だった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:45:13 GMT)
Adversaries With Incentives: A Strategic Alternative to Adversarial Robustness [11.7] 敵の訓練は悪意のある相手を守ることを目的としている。
我々のアプローチは、学習の帰納的バイアスとして、相手のインセンティブの可能性に関する知識または信念を使用する。
我々は、敵のインセンティブに関する穏やかな知識がいかに有用であるかを示す一連の実験を行う。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:14:27 GMT)
PersonalLLM: Tailoring LLMs to Individual Preferences [11.7] 我々は、特定のユーザに対して最大限のメリットを提供するためにLLMを適用することに焦点を当てた、PersonalLLMという公開ベンチマークを提示する。
我々は、ユーザーが不均一な潜伏傾向を示すことを期待する高品質な回答と組み合わせたオープンエンドプロンプトをキュレートする。
私たちのデータセットと生成された個人性は、パーソナライズアルゴリズムを開発するための革新的なテストベッドを提供します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:00:16 GMT)
Big-Math: A Large-Scale, High-Quality Math Dataset for Reinforcement Learning in Language Models [11.7] Big-Mathは、25万以上の高品質な数学の質問と、検証可能な回答のデータセットです。
強化学習(RL)のためのBig-Math
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:14:01 GMT)
MLLMs Know Where to Look: Training-free Perception of Small Visual Details with Multimodal LLMs [11.5] 我々はMLLMが画像に関する質問に答える際に、小さな視覚的詳細を大きなものと同じくらい効果的に知覚できるかどうかを検討する。
本研究では,MLLM自体の内部知識を活用する学習自由な視覚介入手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:54:40 GMT)
Dimitra: Audio-driven Diffusion model for Expressive Talking Head Generation [11.3] Dimitraは音声駆動音声ヘッド生成のためのフレームワークである。
我々は,3次元表現による顔の動き系列をモデル化し,条件付き動き拡散変換器(cMDT)を訓練する。
オーディオから直接追加機能を抽出することで、Dimitraは生成されたビデオの品質とリアリズムを高めることができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:31:20 GMT)
The Power of Graph Signal Processing for Chip Placement Acceleration [11.3] 本稿では,グラフ信号処理に根ざした配置を高速化するパラメータフリー手法であるGiFtを提案する。
GiFtは、回路グラフの多重解像度な滑らかな信号の取得に優れ、時間を要するモデルのトレーニングを必要とせずに最適化された配置ソリューションを生成する。
実験結果から, GiFt の配置効率は, 最先端のプレーヤと比較して, 競争力や性能に優れることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:28:26 GMT)
Learning Decentralized Swarms Using Rotation Equivariant Graph Neural Networks [11.2] 分散型コントローラは、群れの凝集を維持するのに苦労する。
グラフニューラルネットワーク(GNN)アーキテクチャは、分散コントローラを開発するのに欠かせない機械学習ツールとして登場した。
我々の対称性認識コントローラは既存のGNNコントローラよりも一般化されていることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:59:37 GMT)
Quantum Circuit Reconstruction from Power Side-Channel Attacks on Quantum Computer Controllers [11.1] 専用攻撃機が発射できる量子回路に対する新しいタイプの脅威は、パワートレース攻撃である。
本稿では,量子回路の秘密を解錠し,盗むためにパワートレースを用いた最初の形式化と実証を行う。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:09:42 GMT)
AgentFL: Scaling LLM-based Fault Localization to Project-Level Context [11.1] 本稿では,ChatGPTに基づくマルチエージェントシステムであるAgentFLについて述べる。
人間の開発者の振る舞いをシミュレートすることで、AgentFLはFLタスクを3段階のプロセスとしてモデル化する。
広く使用されているDefects4J-V1.2.0ベンチマークの評価は、AgentFLがTop-1内の395のバグのうち157をローカライズできることを示している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:23:06 GMT)
Superconducting qubit readout enhanced by path signature [11.1] 量子非破壊測定は量子技術において重要な役割を果たす。
本稿では,この測定記録の「パスシグネチャ」を考慮した読み出し精度の向上手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:54:44 GMT)
DeltaLLM: Compress LLMs with Low-Rank Deltas between Shared Weights [11.0] 我々は,LLMのメモリフットプリントを低減するために,新しい訓練後圧縮技術であるDeltaLLMを紹介する。
トレーニングでは、進行するモジュール置換法を採用し、低ランクモジュールの軽量なトレーニングは、スクラッチからトレーニングしたLLMと同等の大きさのLLMの性能を達成するのに十分であることを示す。
また,同数のパラメータを除去したJointDrop,LaCo,ShortGPT,SliceGPTの圧縮技術よりも優れていた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:35:47 GMT)
A comparative analysis of rank aggregation methods for the partial label ranking problem [11.0] テキストラベルランキング問題は、学習者が与えられた入力インスタンスのクラスラベルのテキスト順を予測する教師付き学習シナリオである。
本稿では、スコアベースや確率に基づくランクアグリゲーションアプローチを含む、この重要なステップに対する代替的なアグリゲーション手法について検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:44:43 GMT)
Nonreciprocal Microwave-Optical Entanglement in Kerr-Modified Cavity Optomagnomechanics [10.7] キャビティオポマグノメカニクスにおける非相互絡み合いの生成と制御に、Magnon Kerr効果をどのように活用できるかを示す。
この研究は、マイクロ波や光学系を越えて非相互量子デバイスを設計するための道を開いた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:13:36 GMT)
Adaptive Experiments Under High-Dimensional and Data Sparse Settings: Applications for Educational Platforms [10.6] トンプソンサンプリングのような従来の適応型ポリシは、高次元およびスパースな設定でのスケーラビリティに苦労する。
そこで,本研究では,サンプルサイズを実測可能な処理数を決定するためのフレームワークを提案する。
各種試料サイズおよび処理条件におけるWAPTSの比較評価を行った。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:29:00 GMT)
Positive and Unlabeled Data: Model, Estimation, Inference, and Classification [10.4] 本研究では、二重指数傾斜モデル(DETM)による正・ラベルなし(PU)データへの新たなアプローチを提案する。
従来の手法は、完全にランダム(SCAR)PUデータでのみ適用されるため、しばしば不足する。
我々のDEMの二重構造は、ランダムPUデータで選択されたより複雑で未探索な構造を効果的に許容する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:02:52 GMT)
GCC: Generative Color Constancy via Diffusing a Color Checker [10.3] 本稿では,カラーチェッカーをカラーチェッカーに塗布した拡散モデルを用いて照明推定を行うGCCを提案する。
主なイノベーションは,(1)シーン照明を反映したカラーチェッカーを描画する単一ステップ決定論的推論手法,(2)照明に依存したカラー適応を許容しつつ構造を保存するラプラシアン分解手法,(3)カラーチェッカーアノテーションを扱うためのマスクベースのデータ拡張戦略である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:59:54 GMT)
Aligned at the Start: Conceptual Groupings in LLM Embeddings [10.3] 本稿では、しばしば見落とされがちな入力埋め込み(初期表現をトランスフォーマーブロックに入力する)に焦点を移す。
ファジィグラフ,k-nearest neighbor(k-NN),およびコミュニティ検出を用いて,多様なLDMの埋め込みを解析した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:53:06 GMT)
Your Data Is Not Perfect: Towards Cross-Domain Out-of-Distribution Detection in Class-Imbalanced Data [10.2] クラス不均衡なクロスドメインOOD検出という現実的かつ困難な設定を導入します。
本稿では,プロトタイプベースのアライメント戦略に基づく新しい不確実性対応型セマンティックアライメント(UASA)ネットワークを提案する。
提案するUASAは最先端の手法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:52:13 GMT)
Peer-to-Peer Learning Dynamics of Wide Neural Networks [10.2] 本稿では,分散勾配降下法(DGD)アルゴリズムを用いて学習した広範ニューラルネットワークの学習力学を明示的に評価する。
この結果は,最近のニューラルネットワークカーネル(NTK)理論と,分散学習とコンセンサスタスクに関する広範な研究の両面を生かしている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:59:46 GMT)
CoT-UQ: Improving Response-wise Uncertainty Quantification in LLMs with Chain-of-Thought [10.2] 大規模言語モデル(LLM)は多くのタスクで優れるが、生成された応答の不確かさを正確に定量化するのに苦労する。
LLMの既存の不確実性定量化(UQ)法は、主に応答性よりも即時的であり、高い計算コストを発生させる。
応答型UQフレームワークであるCoT-UQを提案する。このフレームワークは,Chain-of-Thought (CoT) を通じて LLM 固有の推論機能を UQ プロセスに統合する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:48:06 GMT)
RhythmMamba: Fast, Lightweight, and Accurate Remote Physiological Measurement [10.1] 光プリズムグラフィー(英: Photoplethhysmography)は、生理学的ビデオからの信号の非測定方法である。
我々は、長距離遷移をキャプチャする状態空間モデルに基づくRhythmMambaを紹介する。
実験の結果、RhythmMambaは319%と23%のピークGPUメモリでステートフォワードのパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:52:32 GMT)
The Illusion of Empathy: How AI Chatbots Shape Conversation Perception [10.1] GPTベースのチャットボットは人間の会話相手よりも共感的でないと認識された。
以上の結果から,会話の質形成における共感の重要性が示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:54:22 GMT)
Unveiling Institution-Specific Bias in Pathology Foundation Models: Detriments, Causes, and Potential Solutions [10.0] 病理基盤モデル(PFM)によって抽出された特徴は,診断関連情報によってしばしば汚染される。
この汚染は、実際の臨床環境に適用する際のモデルの一般化能力を損なう、急激な相関をもたらす可能性がある。
我々は,無関係な情報の影響を軽減するための,シンプルで効果的なソリューションを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:40:18 GMT)
Multi-Agent Causal Discovery Using Large Language Models [10.0] 因果発見は機械学習における重要な研究領域である。
我々はMulti-Agent Causal Discovery Framework(MAC)を紹介する。
Debate-Coding Module (DCM) と Meta-Debate Module (MDM) の2つの主要なモジュールで構成されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:47:56 GMT)
CRTrack: Low-Light Semi-Supervised Multi-object Tracking Based on Consistency Regularization [9.9] CRTrack という一貫性正規化に基づく半教師付き多目的追跡手法を提案する。
まず、静的IoUベースの戦略を置き換えるために、一貫した適応型サンプリング割り当てを校正する。
そこで, 適応型半教師付きネットワーク更新手法を設計し, 非注釈データを効果的に活用し, モデル性能を向上させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:35:38 GMT)
FetDTIAlign: A Deep Learning Framework for Affine and Deformable Registration of Fetal Brain dMRI [9.8] 胎児脳dMRI登録のための深層学習手法であるFetDTIAlignを導入し,正確なアフィンと変形可能なアライメントを実現する。
妊娠23週から36週のデータからFetDTIAlignの有効性を検討した。
以上の結果から,胎児脳のdMRI登録における深層学習の可能性が示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:55:45 GMT)
VINP: Variational Bayesian Inference with Neural Speech Prior for Joint ASR-Effective Speech Dereverberation and Blind RIR Identification [9.7] 本研究は, ニューラルスピーチ先行(VINP)を用いた変分ベイズ推論フレームワークを提案する。
単チャンネル音声の発声実験では、人間の知覚に関連するほとんどの指標において、VINPが高度なレベルに達することが示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:11:36 GMT)
CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter [9.6] 投機的復号化は,軽量な投機的ドラフトモデルを活用することで,Large Language Model (LLM)推論を高速化する強力な手法である。
近年の手法では、多段階のトレーニング戦略を採用することでこの問題の解決が試みられているが、異なるトレーニングステップの複雑な入力によって、ドラフトモデルを収束させるのが難しくなっている。
投機的起草における精度と効率を両立させる新しいフレームワークであるCORALを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:28:26 GMT)
Provable Model-Parallel Distributed Principal Component Analysis with Parallel Deflation [9.6] 各作業者が個別の固有ベクトルをターゲットにした分散PCAフレームワークについて検討し、「上位」と見なされるピアによって提供される中間解から更新することでその解を洗練する。
提案するフレームワークは,最先端のモデル並列PCAソルバであるEigenGame-$mu$に匹敵する性能を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:02:27 GMT)
Can Large Language Models be Good Path Planners? A Benchmark and Investigation on Spatial-temporal Reasoning [9.5] 大規模言語モデル(LLM)は幅広いタスクで顕著な成功を収めた。
我々は、$textbfP$ath $textbfP$lanning from $textbfN$atural $textbfL$anguageという新しいベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:58:13 GMT)
Towards Typologically Aware Rescoring to Mitigate Unfaithfulness in Lower-Resource Languages [9.4] 多言語大言語モデルは、資源制約言語で非忠実な出力を生成する。
このような設定における不誠実さを軽減するため、我々は計算学的に軽量な補助モデルを用いて、より大きなアーキテクチャの出力を再評価する。
我々は,700MB未満のデータに対して,スクラッチから事前訓練した単言語4層BERTモデルにより,忠実な要約を88.33%の平均精度で識別可能であることを示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:22:19 GMT)
On the Benefits of Attribute-Driven Graph Domain Adaptation [9.2] Graph Domain Adaptation (GDA)は、特に実世界のグラフデータセットにラベル付きデータが存在しないため、クロスネットワーク学習における押し付けの課題に対処する。
最近の研究では、グラフ間の構造的シフトを排除して、領域不変表現を学習しようと試みている。
既存の手法はグラフ領域のアライメントに重要な要素であるグラフノード属性の重要性を見落としていることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:57:07 GMT)
DebugAgent: Efficient and Interpretable Error Slice Discovery for Comprehensive Model Debugging [9.2] DebugAgentは、エラースライス発見とモデル修復のための自動フレームワークです。
DebugAgentは最初にタスク固有の視覚属性を生成し、エラーを起こしやすいインスタンスをハイライトする。
次に、効率的なスライス列挙アルゴリズムを用いて、エラースライスを体系的に識別する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:52:43 GMT)
Beyond Accuracy: On the Effects of Fine-tuning Towards Vision-Language Model's Prediction Rationality [9.2] 視覚言語モデル(VLM)の予測合理性に及ぼす微調整の影響について検討する。
予測信頼性と推論信頼性という2つの新しい指標を提案する。
精巧な微調整法は, 不正な証拠に基づいて, より正確な予測を導いた。
対象物の有効な証拠を特定できたため、微調整されたVLMは正しい予測を行う可能性が高かった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:07:58 GMT)
Baichuan-Audio: A Unified Framework for End-to-End Speech Interaction [9.1] Baichuan-Audioは、音声理解と生成をシームレスに統合するエンドツーエンドのオーディオ大言語モデルである。
テキスト誘導されたアライメントされた音声生成機構を備え、理解能力と生成能力の両方でリアルタイムな音声対話を可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:16:34 GMT)
Hallucination Detection in LLMs Using Spectral Features of Attention Maps [8.8] 大規模言語モデル(LLM)は様々なタスクで顕著な性能を示してきたが、幻覚の傾向は残っていない。
最近の手法はこの目的に注意マップの特性を利用するが、その効果は限られている。
本稿では,注意マップから導出したラプラシア行列の上位k$固有値を幻覚検出プローブの入力として用いるtextLapEigvals$法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:30:24 GMT)
Conditioning of Banach Space Valued Gaussian Random Variables: An Approximation Approach Based on Martingales [8.8] ガウス確率変数として有意な2つのバナッハ空間の条件分布について検討する。
それらの手段と共分散は、一般的な有限次元近似スキームによって決定できることを示す。
重要なバナッハ空間のいくつかのクラスにおいて、我々の近似スキームをどのように実装できるかについて議論する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:14:47 GMT)
Differential privacy guarantees of Markov chain Monte Carlo algorithms [8.8] 本稿では,連鎖型モンテカルロ(MCMC)アルゴリズムに対して,差分プライバシー保証を提供することを目的とする。
特に,本研究の結果は,目標が個別にプライベートであることを保証する重要な条件を強調した。
これらの知見は、プライバシー保護軌道に関する具体的なガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:40:46 GMT)
Quantum Communication Advantage in TFNP [8.8] 量子SMPモデルにおける通信複雑性は、古典的な双方向ランダム化モデルよりも指数関数的に小さいことを示す。
通信プロトコルを解析するために,構造-vs-ランダム性パラダイムを用いて古典的な下界を証明した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:17:24 GMT)
Semantics-Adaptive Activation Intervention for LLMs via Dynamic Steering Vectors [8.8] 大規模言語モデル(LLM)の行動を修正するための効果的かつ経済的手法として活性化介入が出現した。
本稿では,モデルアクティベーションを推論時に介入するための動的ステアリングベクトルを構成する新しい手法であるSemantics-Adaptive Dynamic Intervention (SADI)を提案する。
実験結果から,SADIが確立したベースラインをかなりのマージンで上回り,トレーニングなしでのタスク性能が向上した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:01:53 GMT)
Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning [8.7] 本稿では,55言語における競合レベルの問題を特徴とする多言語数学ベンチマークMCLMを紹介する。
テスト時間スケーリングの3つのメソッドをテストします - Outcome Reward Modeling(ORM)、Process Reward Modeling(ORM)、Budget Forcing(BF)です。
実験の結果,Qwen2.5-1.5B Math with ORMはMCLMでは35.8,MR1-1.5BではBFは35.2であった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:36:15 GMT)
Robust Federated Learning with Global Sensitivity Estimation for Financial Risk Management [8.6] 分散型金融システムでは、堅牢で効率的なフェデレートラーニング(FL)が、多様なクライアント環境を扱い、システム的リスクに対するレジリエンスを確保することを約束しています。
本稿では,Fral-CSE(Federated Risk-Aware Learning with Central Sensitivity Estimation)を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:34:05 GMT)
Perceptual Noise-Masking with Music through Deep Spectral Envelope Shaping [8.6] 人々はしばしば騒々しい環境で音楽を聴き、周囲の音から自分自身を隔離しようとします。
本研究では,音楽の周囲雑音をマスキングする能力を高めるために,心理音響マスキングモデルに基づくニューラルネットワークを提案する。
ノイズの多い環境下で、ユーザがヘッドフォンで音楽を聴いた経験を再現するシミュレーションデータに対するアプローチを評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:58:10 GMT)
UASTHN: Uncertainty-Aware Deep Homography Estimation for UAV Satellite-Thermal Geo-localization [8.5] 本稿では,Deep Homography Estimation (DHE)タスクにおける不確実性推定(UE)の新しいアプローチであるUASTHNを提案する。
データ不確実性を効果的に測定するために,クロップベースのテスト時間拡張(CropTTA)戦略を導入する。
我々の研究は、局所化と不確実性推定の幅広い交点に関する深い洞察を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:40:55 GMT)
Just KIDDIN: Knowledge Infusion and Distillation for Detection of INdecent Memes [8.4] 本稿では,LVLM(Large Visual Language Models)の知識蒸留(KD)と知識注入を統合し,有害度検出性能を向上させる新しいフレームワークを提案する。
提案手法は,コンパクトなVLMフレームワーク内で注入可能な大規模コモンセンス知識グラフ(KG)であるConceptNetから,サブ知識グラフを抽出する。
2つのヘイトスピーチベンチマークデータセットによる実験結果から,最先端のベースラインよりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:19:39 GMT)
Practical Performative Policy Learning with Strategic Agents [8.4] 本研究では,政策学習の課題について検討し,エージェントが提案した方針に応えて特徴を調整し,その潜在的な結果を改善する。
本稿では,高次元分布マップの代用として,微分可能な分類器を用いた勾配型ポリシー最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:37:55 GMT)
A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems [8.3] 安全性とパフォーマンスは競合する目標になり得るため、共同最適化が難しくなる。
本稿では,性能目標をコスト関数で符号化し,安全性要件を状態制約として課す,状態制約付き最適制御問題を提案する。
結果値関数はハミルトン・ヤコビ・ベルマン方程式を満たすことを示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:56:55 GMT)
BIGbench: A Unified Benchmark for Evaluating Multi-dimensional Social Biases in Text-to-Image Models [8.2] 画像生成のバイアスの統一ベンチマークであるBIGbenchを紹介する。
既存のベンチマークとは異なり、BIGbenchは4次元にわたるバイアスを分類し評価する。
BIGbenchを用いて8つの代表的T2Iモデルと3つのデバイアス法を評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:52:19 GMT)
Quantum Next-Generation Reservoir Computing and Its Quantum Optical Implementation [8.2] 量子貯水池コンピューティング(QRC)は、時系列予測タスクに取り組むために、量子システムの情報処理能力を利用する。
本稿では,実験的な実現に親しみやすいQRC方式を提案する。
提案手法は,他のQRC方式と比較して,信頼性予測に必要なトレーニングデータを効果的に削減し,進歩を達成している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:05:46 GMT)
Fine-Grained Uncertainty Quantification via Collisions [8.2] クラス衝突率を用いて衝突行列を定義する。
K$ クラスを含む分類問題に対して、$Ktimes K$ 衝突行列 $S$ は各クラスを区別する固有の困難さを測る。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:31:27 GMT)
Predictive Response Optimization: Using Reinforcement Learning to Fight Online Social Network Abuse [8.2] 我々は、以前の研究で述べられた検出はOSNの乱用と戦っている人々の目標ではないと論じている。
むしろ、虐待による害と良質なユーザーへの影響のトレードオフを最適化する行動を選択することが目的だと信じています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:30:14 GMT)
Forgetting Any Data at Any Time: A Theoretically Certified Unlearning Framework for Vertical Federated Learning [8.1] 理論的に保証された未学習機能を備えた最初のVFLフレームワークを紹介する。
従来のアプローチとは異なり、私たちのソリューションはモデルとデータに依存しず、普遍的な互換性を提供します。
私たちのフレームワークは非同期のアンラーニングをサポートします。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:52:35 GMT)
Survey on Strategic Mining in Blockchain: A Reinforcement Learning Approach [8.1] 利己的なマイニングのような戦略的マイニング攻撃は、報酬を最大化するために正直な行動から逸脱することでブロックチェーンコンセンサスプロトコルを活用する。
強化学習(RL)は、複雑な動的環境において適応的な戦略最適化を可能にするスケーラブルな代替手段を提供する。
この調査は、プロトコル設計、脅威検出、セキュリティ分析など、利己的なマイニングの課題に対処するRLの可能性を強調している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:42:51 GMT)
Strength Estimation and Human-Like Strength Adjustment in Games [8.1] 本稿では, 強度推定器 (SE) とモンテカルロ木探索法 (SE-based Monte Carlo tree search) を含む新しい強度システムを提案する。
強度推定器は、人間の直接の相互作用を伴わないゲームから、強度スコアを算出し、ランクを予測する。
SE-MCTSはモンテカルロ木探索の強度スコアを利用して演奏強度とスタイルを調整する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:47:47 GMT)
Stronger Neyman Regret Guarantees for Adaptive Experimental Design [8.0] 本研究では,不偏平均処理効果推定のための適応的逐次実験の設計について検討する。
私たちのゴールは、準線形のNeyman後悔を提供する適応デザインを開発することです。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:57:54 GMT)
ARCON: Advancing Auto-Regressive Continuation for Video Frames [8.0] 本稿では,ビデオ継続におけるLVM(Large Vision Models)の利用について検討する。
セマンティックトークンとRGBトークンを交互に生成するスキームであるARCONを導入し,LVMが高レベルな構造化映像情報を明示的に学習できるようにする。
自律走行シナリオの実験は、我々のモデルが一貫して長いビデオを生成できることを示しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:27:10 GMT)
Effective Field Neural Network [7.9] 実効フィールドニューラルネットワーク(EFNN)と呼ばれる新しい機械学習モデルを提案する。
EFNNは、複数の自己精製プロセスを通じて、重要な多体インタラクションを自動的に、効率的にキャプチャすることができる。
畳み込み操作の助けを借りて、小さなシステムで学んだEFNNは、追加のトレーニングなしで大きなシステムでシームレスに使用できる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:27:23 GMT)
Which Transformer to Favor: A Comparative Analysis of Efficiency in Vision Transformers [7.9] トランスフォーマーの自己注意は、2次計算の複雑さのために高い計算コストが伴う。
我々のベンチマークは、高解像度画像よりも、一般により大きなモデルを使用することの方が効率的であることを示している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:51:07 GMT)
From Passive Watching to Active Learning: Empowering Proactive Participation in Digital Classrooms with AI Video Assistant [7.9] SAM(Study with AI Mentor)は、教育ビデオと、大規模言語モデルを利用したコンテキスト対応チャットインターフェースを統合する高度なプラットフォームである。
本研究は,25人の大学生と80人のクラウドソーシング参加者を対象に,SAMとコントロールグループを用いたグループを比較した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:05:02 GMT)
The feasibility of multi-graph alignment: a Bayesian approach [7.8] ガウスモデルでは、臨界しきい値以上の正確なアライメントは高い確率で達成でき、その下にある部分アライメントでさえ統計的に不可能である。
スパース ErdHos-R'enyi モデルでは、意味のある部分的アライメントが不可能な閾値を厳格に特定し、このしきい値の上に部分的アライメントが達成できると推測する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:34:21 GMT)
Provable Benefits of Unsupervised Pre-training and Transfer Learning via Single-Index Models [7.7] 教師なし事前学習と転送学習は、ニューラルネットワークのトレーニングアルゴリズムを初期化するために一般的に使用される。
教師なし事前学習と移動学習が高次元教師あり学習の複雑さに及ぼす影響について検討した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:13:11 GMT)
Measurement Uncertainty in Infrared Spectroscopy with Entangled Photon Pairs [7.7] 交叉光子対を用いた赤外分光多パラメータ測定の精度を制約する不確実な関係を見出した。
本研究は、絡み合い支援分光法における将来の実験設計と応用に向けたガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:25:15 GMT)
An Efficient Sign Language Translation Using Spatial Configuration and Motion Dynamics with LLMs [7.6] グロスフリー手話翻訳(英: Gloss-free Sign Language Translation, SLT)は、手話の動画を直接言語文に変換する言語である。
本稿では手話に固有の空間的構成や動きのダイナミクスを捉えることの重要性を強調する。
本稿では,空間と運動に基づく手話翻訳(SpaMo)について紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:04:45 GMT)
Deep Learning and LLM-based Methods Applied to Stellar Lightcurve Classification [7.6] 本稿では,変光度曲線の自動分類のための深層学習・大規模言語モデル(LLM)の総合評価を行う。
特にCepheids, RR Lyrae, and eclipsing binariesに重点を置いて, 観測周期と位相分布が分類精度に及ぼす影響について検討した。
LLM, マルチモーダル大言語モデル(MLLM), 大規模音声言語モデル(LALM)の3モデルからなる革新的なシリーズであるStarWhisper LightCurve (LC)を発表した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:25:01 GMT)
FAIntbench: A Holistic and Precise Benchmark for Bias Evaluation in Text-to-Image Models [7.3] FAIntbenchは、テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスの総合的かつ正確なベンチマークである。
我々はFAIntbenchを7種類の大規模T2Iモデルの評価に適用し,人間による評価を行った。
その結果, FAIntbenchが種々のバイアスの同定に有効であった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:49:32 GMT)
Rank-O-ToM: Unlocking Emotional Nuance Ranking to Enhance Affective Theory-of-Mind [7.1] 心の理論のための感情的ニュアンス(Rank-O-ToM)のランク付け(Rank-O-ToM)は、信頼度レベルを感情スペクトルと整合させるための順序的ランク付けを利用するフレームワークである。
Rank-O-ToMは感情のニュアンスな理解を強化し、感情的状態を推論するAIの能力を向上させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:04:40 GMT)
Image Translation-Based Unsupervised Cross-Modality Domain Adaptation for Medical Image Segmentation [7.1] 監視されたディープラーニングは、通常、自然画像よりも医療画像において多くの課題に直面します。
本稿では,画像翻訳に基づく教師なしクロスモーダリティ領域適応手法を提案する。
翻訳された擬似画像と実画像との微妙な差異は、自己学習法によって克服される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:36:07 GMT)
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes [7.0] 平均回帰マルコフ決定プロセス(MDPs)は、不確実性の下でのシーケンシャルな意思決定の基盤となる枠組みを提供する。
本稿では,Reward-Extended Differential(RED)強化学習について紹介する。Reward-Extended Differential(RED)強化学習は,様々な学習目的,すなわちサブタスクを,平均リワード設定で同時に効果的かつ効率的に解ける新しいRLフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:53:06 GMT)
Generalization of the Gibbs algorithm with high probability at low temperatures [6.8] 本稿では、Gibsアルゴリズムの一般化誤差にバウンダリを与え、高温領域における既知のデータ非依存境界を復元する。
高い確率で、ギブスの後部から引き出された1つの仮説の一般化誤差は、同様のまたはより小さな経験的誤りを伴う全ての仮説の総容積とともに減少する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:32:42 GMT)
Adaptive Optimization for Prediction with Missing Data [6.8] 適応線形回帰モデルの中には,命令規則と下流線形回帰モデルを同時に学習するのと等価なものもある。
ランダムにデータの欠落が強くない環境では,本手法はサンプル外精度を2~10%向上させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:13:55 GMT)
Unsupervised Topic Models are Data Mixers for Pre-training Language Models [6.8] 大規模言語モデル(LLM)のためのトピックベースのデータ混合戦略を提案する。
DataWeaveは、セマンティックに類似したドキュメントをグループ化するために、マルチステージクラスタリングプロセスを採用している。
我々は、サイエンスとリレーションシップのトピックが特に効果的であることを確認し、最も実質的なパフォーマンス改善をもたらす。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:25:56 GMT)
Gaussian Difference: Find Any Change Instance in 3D Scenes [6.7] 3Dシーンにおけるインスタンスレベルの変更検出は、大きな課題を示す。
本稿では,現実シナリオの変化を検出する新しい手法を提案する。
提案手法は、検出精度の向上、照明変更に対する堅牢性、効率的な処理時間を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:09:49 GMT)
IGDA: Interactive Graph Discovery through Large Language Model Agents [6.7] 大規模な言語モデル(textbfLLMs$)が発見の強力な方法として登場した。
我々は既存の数値駆動型手法を補完するグラフ発見のための強力な手法として$textbfIGDA$を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:24:27 GMT)
Representation Engineering for Large-Language Models: Survey and Research Challenges [6.7] 我々は、この発展途上の分野における研究の結束図を示すために、表現工学の目標と方法を定式化する。
パフォーマンス低下、計算時間の増加、ステアビリティの問題などのリスクを概説する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:36:26 GMT)
Decoupling Layout from Glyph in Online Chinese Handwriting Generation [6.6] テキスト行レイアウト生成器とスタイル化フォント合成器を開発した。
レイアウトジェネレータは、テキスト内容と提供されたスタイル参照に基づいて、コンテキスト内学習を行い、各グリフに対する位置を自己回帰的に生成する。
文字埋め込み辞書、マルチスケールの書体スタイルエンコーダ、及び1DのU-Netベースの拡散デノイザからなるフォントシンセサイザは、所定のスタイル参照から抽出された書体スタイルを模倣しつつ、その位置に各フォントを生成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:12:05 GMT)
Unveiling ECC Vulnerabilities: LSTM Networks for Operation Recognition in Side-Channel Attacks [6.4] 楕円曲線暗号に対するサイドチャネル攻撃を行うための新しい手法を提案する。
我々は、電力トレースを分析し、動作パターンを特定するために、LSTM(long-short-term memory)ニューラルネットワークを採用する。
本研究では、現在の対策、特に座標ランダム化手法は、側流路を保護するには不十分であることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:02:40 GMT)
Evaluating the Effectiveness and Efficiency of Demonstration Retrievers in RAG for Coding Tasks [6.3] 本稿では,3つの符号化タスクにおけるレトリバーの効率効率性トレードオフを系統的に評価する。
BM25は有効性は優れているが,知識ベースが1000を超えると効率が低下する。
大規模な検索では、効率の差がより顕著になり、ほぼ密集した検索者が最大利得を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:57:51 GMT)
CLEP-GAN: An Innovative Approach to Subject-Independent ECG Reconstruction from PPG Signals [6.3] 本研究は、PSG信号から見えないECG信号を再構成することの課題に対処する。
データ収集プロセスは、しばしばノイズを導入し、高度な機械学習モデルでさえPSGからのECG再構成を複雑にする。
コントラスト学習, 対角学習, 注意ゲーティングを統合した, 対象非依存の PPG-to-ECG 再構成モデルを開発した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:53:47 GMT)
Unpacking Political Bias in Large Language Models: A Cross-Model Comparison on U.S. Politics [6.3] 人間社会における普遍的な現象としての政治的偏見は、大規模言語モデルに移される可能性がある。
政治バイアスは、モデルスケールとリリース日とともに進化し、LLMの地域要因にも影響される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:53:13 GMT)
Socratic: Enhancing Human Teamwork via AI-enabled Coaching [6.2] Socraticは、タスク実行中にリアルタイムガイダンスを提供することで、人間のコーチを補完する新しいAIシステムである。
我々は,2つの人体実験を通じてソクラテスを検証した。
その結果、システムは最小限の介入でチームパフォーマンスを著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:45:43 GMT)
BaKlaVa -- Budgeted Allocation of KV cache for Long-context Inference [6.2] BaKlaVaは、モデル全体で個々のKVキャッシュに対して最適なメモリを割り当てる手法である。
LLaMA-3-8BモデルとQwen2.5-7Bモデルについて検討した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:28:27 GMT)
Adaptive LPD Radar Waveform Design with Generative Deep Learning [6.2] 本稿では,レーダ波形検出の低確率を適応的に生成する学習手法を提案する。
提案手法では,検出可能性の最大90%を低減できるLPD波形を生成できると同時に,アンビグニティ関数(センシング)特性も向上する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:58:36 GMT)
Quantum dissipative dynamics of driven Duffing oscillator near attractors [6.2] 駆動ダッフィング発振器の安定状態(トラクター)近傍の量子散逸ダイナミクスについて検討する。
量子特性を計算するために、2つの摂動パラメータを異なる順序で扱うことができる洗練された理論を開発した。
本研究では, 再正規化レベル間隔に対する摂動解析結果と, 誘電体近傍の高エネルギーレベルの量子ゆらぎ誘起分布を求める。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:26:07 GMT)
No-Reference Image Quality Assessment with Global-Local Progressive Integration and Semantic-Aligned Quality Transfer [6.1] 視覚変換器(ViT)を用いたグローバル特徴抽出器と畳み込みニューラルネットワーク(CNN)を用いた局所特徴抽出器を組み合わせた二重測定フレームワークを開発した。
多様な画像コンテンツの品質スコアを主観的な意見スコアで自動的にラベル付けすることで、トレーニングデータを拡張するセマンティック・アライン・クオリティ・トランスファー手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:19:26 GMT)
Atten-Transformer: A Deep Learning Framework for User App Usage Prediction [6.1] 本研究では,時間的注意をTransformerネットワークに統合し,キーアプリの利用パターンを動的に識別し活用する新しいモデルであるAtten-Transformerを紹介する。
提案手法では,特徴符号化と時間符号化を併用した多次元特徴表現を用いて予測精度を向上する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:31:51 GMT)
LogitLens4LLMs: Extending Logit Lens Analysis to Modern Large Language Models [6.0] LogitLens4LLMsは、Logit Lensテクニックを現代の大規模言語モデルに拡張するツールキットである。
我々の研究は既存の実装の限界を克服し、最先端のアーキテクチャに適用できるようにしています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:37:44 GMT)
Are Large Language Models Good Data Preprocessors? [6.0] 高品質なテキストトレーニングデータは、マルチモーダルデータ処理タスクの成功に不可欠である。
BLIPやGITのような画像キャプションモデルからの出力は、しばしばルールベースの手法で修正が難しいエラーや異常を含む。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:57:21 GMT)
Graph-Guided Scene Reconstruction from Images with 3D Gaussian Splatting [5.8] 既存の手法には、精密なカメラポーズを入力に必要としたり、監督のために密集した視点を必要とするなど、様々な制限がある。
グラフ誘導型3Dシーン再構築フレームワークGraphGSを提案する。
画像から高忠実度な3D再構成を実現し,複数のデータセットにわたる定量的,定性的な評価により,最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:59:08 GMT)
Semi-Supervised Weed Detection in Vegetable Fields: In-domain and Cross-domain Experiments [5.8] 本研究では,未ラベルデータを利用した半教師付きオブジェクト検出(SSOD)手法を提案する。
既存の3つのフレームワークを含む4つのSSOD法の比較実験を行った。
YOLOv8をベースとしたWeedTeacherは4つの手法の中で最も精度が高く、2.6%のmAP@50と3.1%のmAP@50:95を教師付きベースラインで改善した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:39:47 GMT)
Strong tunable spin-spin coupling with cavity-magnon criticality [5.8] 我々は,コプラナー導波管(CPW)共振器とダイヤモンド中の1つの窒素空隙スピンと,カーマグノンを保持するイットリウム-鉄-ガーネットナノスフィアからなるハイブリッド量子システムを提案する。
マグノンの強い駆動場により、カー効果はマグノンを絞ることができ、したがってCPW共振器と圧縮マグノンとの結合は指数関数的に増強される。
強化キャビティ-マグノンカップリングが臨界値に近づくと、スピンはHPから完全に切り離され、スピンとLPとのカップリングはLPである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:08:26 GMT)
BigMac: A Communication-Efficient Mixture-of-Experts Model Structure for Fast Training and Inference [5.8] そこで我々はBigMacという新しいMoE構造を提案する。
BigMacは、同じ数のエキスパートと同じ数の合計パラメータを持つ細粒度のMoEよりも、同等またはそれ以上のモデル品質を達成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:37:29 GMT)
Scheherazade: Evaluating Chain-of-Thought Math Reasoning in LLMs with Chain-of-Problems [5.8] Scheherazadeは、大量の挑戦的な数学的推論ベンチマークを自動生成する手法である。
本稿では,前鎖法と後鎖法という,ランダムな分岐手法を含む2つの異なる連鎖法を提案する。
我々は,他のフロンティアモデルの性能低下がわずか数問の連鎖で急激に進行するのに対し,評価の結果,o1-previewのパフォーマンスは持続することを示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:30:33 GMT)
Spontaneous Giving and Calculated Greed in Language Models [5.8] 社会的ジレンマにおける推論がモデル結果に与える影響について検討する。
推論モデルが協調と規範の強制を減らし、個人の合理性を優先することを発見した。
我々の結果は、推論機能とソーシャルインテリジェンスを組み込んだAIアーキテクチャの必要性を示唆している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:23:27 GMT)
Graphy'our Data: Towards End-to-End Modeling, Exploring and Generating Report from Raw Data [5.8] Graphyは、データモデリング、探索、高品質なレポート生成を自動化するエンドツーエンドプラットフォームである。
文献調査のシナリオをどのように促進するかを示す,5万を越える論文(参考資料を含む)の事前スクラップグラフを紹介します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:10:49 GMT)
Linear Bandits on Ellipsoids: Minimax Optimal Algorithms [5.7] 作用の集合が楕円体であるような計算線形帯域を考える。
この問題に対して、最初の既知のミニマックス最適アルゴリズムを提供する。
実行には、時間$O(dT + d2 log(T/d) + d3)$とメモリ$O(d2)$のみが必要である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:12:31 GMT)
Convergence of Shallow ReLU Networks on Weakly Interacting Data [5.6] 我々は,n$のデータ点上の勾配流によって訓練された一層ReLUネットワークの収束解析を行う。
次数$log(n)$ニューロンの幅を持つネットワークは、高い確率で大域収束するのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:07:14 GMT)
TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6] 本研究は,推定時間における相対的推定から距離深度を求めるための実用的スケール回復手法であるTanDepthを提示する。
提案手法は,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスフィルタシミュレーションへの適応を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:56:08 GMT)
AnomalyAID: Reliable Interpretation for Semi-supervised Network Anomaly Detection [5.6] 半教師付き学習は,ネットワーク異常検出アプリケーションにおいて重要な役割を担っている。
解釈可能性の欠如は、実際に半教師付きフレームワークを採用する上で重要な障壁となる。
本稿では,異常検出過程を解釈可能とし,解釈結果の信頼性を向上させるための異常AIDを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:27:28 GMT)
The GigaMIDI Dataset with Features for Expressive Music Performance Detection [5.6] GigaMIDIデータセットには、140万以上のユニークなMIDIファイルが含まれており、180億のMIDIノートイベントと530万のMIDIトラックが含まれている。
このGigaMIDIのキュレートされたイテレーションは、NOMMLによって検出された、GigaMIDIデータセットの31%を構成する、明示的なパフォーマンスの楽器トラックを含んでいる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:39:40 GMT)
Comparing Large Language Model AI and Human-Generated Coaching Messages for Behavioral Weight Loss [5.5] 大規模言語モデル(LLM)ベースの人工知能(AI)チャットボットは、よりパーソナライズされた新しいメッセージを提供することができる。
重量挙げ試験では87人の成人が、5ポイントのQuatスケールを使用して10のコーチングメッセージの役に立つと評価した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:38:02 GMT)
An ocean front detection and tracking algorithm [5.5] 本稿では,距離空間解析を用いたベイズフロント検出・追跡フレームワークを提案する。
BFDTMSAはヒストグラム法と比較して過検出を73%削減する。
オープンソースリリースは、再現可能な海洋研究において重要なギャップを埋めるものだ。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:22:17 GMT)
A Neural Material Point Method for Particle-based Emulation [5.4] 本稿では,粒子シミュレーションのためのニューラルネットワークエミュレーションフレームワークNeuralMPMを提案する。
NeuralMPMは、ラグランジュ粒子を固定サイズグリッドに補間し、イメージ・ツー・イメージニューラルネットワークを使用してグリッドノードの更新を計算し、粒子に補間する。
流体力学や流体-固体相互作用など,いくつかのデータセット上でのNeuralMPMの利点を実証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:41:06 GMT)
Continuous Wrist Control on the Hannes Prosthesis: a Vision-based Shared Autonomy Framework [5.4] 義肢をつかむためのほとんどの制御技術は、器用な指の制御に焦点をあてるが、手首の動きを見渡す。
これにより、肘、肩、腰で補償運動を行い、手首をつかむように適応させる。
本稿では,共有自律フレームワークにおけるユーザと自動システムの協調を利用したコンピュータビジョンベースシステムを提案する。
当社のパイプラインでは,人工手首をシームレスに制御して対象物を追尾し,最終的にユーザの意図に応じて把握するように調整しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:48:25 GMT)
Sampling reduced density matrix to extract fine levels of entanglement spectrum and restore entanglement Hamiltonian [5.4] 還元密度行列(RDM)の正確な抽出を可能にする,低い技術的障壁を持つ量子モンテカルロスキームを提案する。
RDMの対数固有値である絡み合いスペクトル(ES)の微細なレベルを示す。
シミュレーションの結果、前例のない大規模なシステムサイズを生かし、RDMに基づいて絡み合い量を決定するための実用的な計算枠組みを確立した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:41:17 GMT)
"Actionable Help" in Crises: A Novel Dataset and Resource-Efficient Models for Identifying Request and Offer Social Media Posts [5.4] CrisisHelpOfferは101kのツイートを生成LDMでラベル付けし、人間によって検証された新しいデータセットである。
第2に,資源制約のある環境での展開に最適化された最初の危機特化ミニモデルを紹介する。
全てのモデルは既存の蒸留された変種を上回り、新しいベンチマークを設定した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:50:06 GMT)
Exact Learning of Permutations for Nonzero Binary Inputs with Logarithmic Training Size and Quadratic Ensemble Complexity [5.4] 本稿では,2層に完全接続されたフィードフォワードニューラルネットワークと,非ゼロ二項入力における順列学習の課題に焦点を当てる。
無限幅のニューラル・タンジェント・カーネル(NTK)では、$k$の標準基底ベクトルのみに勾配降下で訓練されたネットワークのアンサンブルが、任意に高い確率で$k$の固定置換をうまく学習できることが示される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:50:02 GMT)
MambaFlow: A Novel and Flow-guided State Space Model for Scene Flow Estimation [5.4] 本稿では,マンバに基づくデコーダを用いたシーンフロー推定ネットワークであるマンバを提案する。
MambaFlowは、既存の作業間でリアルタイム推論速度で最先端のパフォーマンスを実現する。
Argoverse 2ベンチマークの実験は、MambaFlowがリアルタイムの推論速度で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:05:49 GMT)
Overconfident Oracles: Limitations of In Silico Sequence Design Benchmarking [5.4] 文献に共通するMLオーラクルを利用した12のシーケンス設計手法について検討する。
一貫性と堅牢性には大きな課題があります。
本稿では, 生成配列の生存可能性を評価するために, バイオ物理指標を用いて評価を補足することを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:25:21 GMT)
Repository-Level Compositional Code Translation and Validation [5.3] リポジトリレベルのコード翻訳を自動化するニューロシンボリックアプローチであるAlphaTransを提案する。
AlphaTransを利用して,836,8575,2719>クラス,メソッド,テストからなる10の実世界のオープンソースプロジェクトを翻訳しました。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:17:25 GMT)
Deep Minimax Classifiers for Imbalanced Datasets with a Small Number of Minority Samples [5.2] 本稿では,最低性能クラスのリスクを最小限に抑えるために,新しいミニマックス学習アルゴリズムを提案する。
提案アルゴリズムは証明可能な収束特性を有しており,提案アルゴリズムは既存手法に匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:20:02 GMT)
Class-Dependent Perturbation Effects in Evaluating Time Series Attributions [5.1] 機械学習モデルの摂動に基づく評価のクラス依存効果について検討する。
解析の結果,摂動に基づく評価は,本質的な属性品質よりも,特定のモデル行動を反映する可能性が示唆された。
特徴属性評価におけるこれらの効果の評価と評価を支援するために,クラス認識型ペナルティ項を用いた評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:22:03 GMT)
Adversarial Sample-Based Approach for Tighter Privacy Auditing in Final Model-Only Scenarios [5.1] 追加の仮定を伴わずにより厳密な経験的下限を実現する新しい監査手法を提案する。
我々のアプローチは従来のカナリアベースの逆数を超え、最終的なモデルのみのシナリオで有効である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:27:11 GMT)
Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective [5.1] モデルトレーニングに先立って、ダウンストリームタスクのパフォーマンスを正確に予測することは、効率的なリソース割り当てに不可欠である。
既存の性能予測手法は精度と信頼性に限界がある。
本稿では,クラスタリングオンディフルティ(COD)の下流性能予測フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:44:57 GMT)
Unconditional foundations for supersingular isogeny-based cryptography [5.0] 我々は、超特異等質問題(等質性)が最悪の環問題(EndRing)と最大順序問題(MaxOrder)に等しいことを証明した。
暗号アプリケーションの場合、ランダムなインスタンスでは平均的に計算上の問題が難しい。
この結果を拡張して、上記の古典的問題のどれかが難しい場合、それらすべてが平均的に難しいことを証明する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:46:03 GMT)
The supersingular endomorphism ring problem given one endomorphism [5.0] 我々は、E の自己準同型環が古典的時間で計算できることを証明した。
また、楕円曲線上の滑らかなイデアルの作用が時間内に計算できることも証明する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:00:36 GMT)
Learning with Selectively Labeled Data from Multiple Decision-makers [5.0] 本研究は, 歴史的意思決定による全人口の分布が異なる可能性のある, 選択的ラベル付きデータを用いた分類問題について考察する。
多くのアプリケーションにおいて、歴史的決定は複数の意思決定者によって行われ、それぞれが異なる決定ルールを持つという事実を利用しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:33:06 GMT)
Deviations from Random Matrix Theory in quantum chaotic systems: A Perspective from Observable Properties [5.0] 量子カオス系におけるランダム行列理論からの偏差を可観測性の観点から検討する。
本研究の目的は,実システムにおける包絡関数の非自明な構造の起源を理解することである。
この結果から,小天体のエンベロープ関数の構造は,システムのランダム性と密接に関係していることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:33:22 GMT)
Krutrim LLM: Multilingual Foundational Model for over a Billion People [5.0] クルトリム(Krutrim)は、インドの言語景観のために設計された2兆トークン多言語モデルである。
最大のIndicデータセットが組み込まれており、データの不足を軽減し、方言間でのバランスの取れたパフォーマンスを確保する。
16タスク中10タスクでLAMA-2のようなモデルと一致またはオーバーし、平均スコアは0.57対0.55である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:38:13 GMT)
Resonant Energy Transfer and Collectively Driven Emitters in Waveguide QED [4.9] 導波管量子電磁力学(QED)は量子光学の新しいフロンティアを開いた。
我々は,2つの距離量子エミッタ間の共鳴エネルギー移動を,強度相関の反ジップ記録により観測する。
本研究は,マルチエミッタ導波路QEDシステムのための新しい発光機構と励起方式を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:20:16 GMT)
Weaving the Cosmos: WASM-Powered Interchain Communication for AI Enabled Smart Contracts [4.8] 本稿では,ブロックチェーン技術,特にCosmos SDKを統合した,オンチェーンAI推論を容易にする革新的なフレームワークを紹介する。
WebAssembly(WASM)上に構築されたこのシステムは、複数のブロックチェーンノード間でAI推論を実行するWASMモジュールのチェーン間通信とデプロイを可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:44:28 GMT)
A Large-Scale Study of Model Integration in ML-Enabled Software Systems [4.8] 機械学習(ML)とそのソフトウェアシステムへの統合は、開発プラクティスを大きく変えました。
本稿では2,928のオープンソースML対応ソフトウェアシステムについて大規模に検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:02:27 GMT)
A Concise Lyapunov Analysis of Nesterov's Accelerated Gradient Method [4.8] 一般凸関数と強凸関数の両方に対するネステロフの加速勾配法の収束率を簡潔に解析する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:55:35 GMT)
Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models [4.7] HRV(Head Relevance Vectors)の構築による拡散モデルに対する機械論的解釈可能性のアプローチを提案する。
所与の視覚概念に対するHRVは、所与の視覚概念に対する対応する頭部の重要性を表す各要素の総数に等しい長さを有する。
以上の結果から,HRVは画像生成における多文単語の誤解釈を減らし,画像編集における5つの難解な属性を修正し,多概念生成における破滅的無視を軽減できることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:59:37 GMT)
Steering nonlocality in high-speed telecommunication system without detection loophole [4.7] 本報告では,完全チップファイバ通信システムにおける非局所性実証実験を初めて実施した。
我々のセットアップは、非局所性、特に量子通信を操るアプリケーションを探究するための即時プラットフォームを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:44:32 GMT)
TabulaTime: A Novel Multimodal Deep Learning Framework for Advancing Acute Coronary Syndrome Prediction through Environmental and Clinical Data Integration [4.7] 急性冠症候群 (ACS) は世界中で死亡率の高い疾患である。
臨床リスク要因と大気汚染データを組み合わせた多モード深層学習フレームワークであるTabulaTimeを紹介した。
実験の結果,TabulaTimeでは従来のモデルに比べて予測精度が20%以上向上していることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:01:07 GMT)
Functional Bayesian Additive Regression Trees with Shape Constraints [4.6] 機能的BART(FBART)と呼ばれる関数-オン-スカラー回帰問題に対する非パラメトリックベイズアプローチを提案する。
本研究では,FBARTモデルのパラメータを推定するためのベイズバックフィッティングアルゴリズムを提案する。
提案するFBARTモデルとその形状制約バージョンは,関数データに対するBARTモデルの新たな進歩である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:38:53 GMT)
Bringing NeRFs to the Latent Space: Inverse Graphics Autoencoder [4.6] Inverse Graphics Autoencoder (IG-AE) を提案する。
画像オートエンコーダを3次元幾何で正規化するためには、その潜在空間と、共同で訓練された潜在3次元シーンを整列する。
IG-AEでトレーニングしたLatent NeRFは,標準のオートエンコーダに比べて品質が向上していることを確認した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:16:53 GMT)
Fast, Accurate Manifold Denoising by Tunneling Riemannian Optimization [4.6] 未知の$d$-dimensional manifold $M からサンプリングされたノイズの多い新しいデータポイントを mathbbRD$ において、ノイズの多いサンプルのみを用いて効率よく分解する問題を考える。
本研究は「学習から学習へ」という概念を「学習から最適化へ」とフレーミングすることで、テスト時効率のよい多様体復調のための枠組みを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:02:16 GMT)
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning [4.6] 完全に分散化された階層型マルチエージェントシステムを構築するためのフレームワークであるTAME Agent Framework (TAG)を紹介する。
TAGは疎結合を維持しながらレベル間の情報フローを標準化し、多様なエージェントタイプをシームレスに統合する。
この結果から,分散階層型組織は学習速度と最終性能を両立させ,TAGをスケーラブルなマルチエージェントシステムにとって有望な方向と位置づけた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:22:12 GMT)
Large Language Models are Powerful EHR Encoders [4.5] ドメイン固有のEHR基盤モデルは予測精度と一般化の有望な改善を実証している。
汎用大規模言語モデル(LLM)に基づく埋め込み手法をEHRエンコーダとして用いる可能性について検討する。
GTE-Qwen2-7B-Instruct と LLM2Vec-Llama3.1-8B-Instruct の2つの最新式 LLM-embedding モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:30:36 GMT)
Data Voids and Warning Banners on Google Search [4.5] ソーシャルメディア上で共有された14万のユニークな検索クエリを収集し、Googleの警告バナーをサーフェした。
Googleは検索クエリの約1%に警告バナーを返した。
品質の低いバナーの29倍から58倍のデータを無効にしています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:56:04 GMT)
Leveraging Large Language Models for Effective and Explainable Multi-Agent Credit Assignment [4.4] シーケンス改善と帰属の2つのパターン認識問題に対する信用割当の修正方法を示す。
提案手法では,各エージェントの個々の貢献に基づいて,環境報酬を数値的に分解する集中型報酬批判を利用する。
どちらの手法も、Level-Based ForagingやRobotic Warehouse、衝突に関連する安全性の制約を取り入れたSpaceworldベンチマークなど、さまざまなベンチマークにおいて、最先端の手法よりもはるかに優れています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:56:47 GMT)
M3DA: Benchmark for Unsupervised Domain Adaptation in 3D Medical Image Segmentation [4.3] ドメインシフトは、MRIやCTなどのソースからの3D医療画像のセグメンテーションにディープラーニングを適用する上で、大きな課題となる。
提案するベンチマークでは,10以上の既存ドメイン適応手法を評価した。
結果から、ドメイン間のパフォーマンスギャップを一貫して埋めることはできません。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:29:32 GMT)
Empowering recommender systems using automatically generated Knowledge Graphs and Reinforcement Learning [4.3] 本研究では、多国籍金融サービス企業におけるパーソナライズされた記事レコメンデーションのための2つのアプローチを提案する。
第一のアプローチは強化学習(RL)を利用して、構造化された(タブラル)データと構造化されていない(テキスト)データの両方から構築されたKGをトラバースする。
第2のアプローチはXGBoostアルゴリズムを採用し、透明性を高めるためにSHAPやELI5といったポストホックな説明可能性技術を採用している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:03:54 GMT)
MegaLoc: One Retrieval to Place Them All [4.3] 与えられたクエリと同じ位置から画像を取得することは、複数のコンピュータビジョンタスクの重要なコンポーネントである。
既存のソリューションは、これらのタスクの1つに特化して構築されており、要件がわずかに変更された場合や、アウト・オブ・ディストリビューション(out-of-distriion)データを満たす場合に失敗することが知られている。
本稿では,既存の手法,トレーニング手法,データセットを組み合わせて,複数のタスクで実行されるMegaLocと呼ばれる検索モデルをトレーニングする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:14:55 GMT)
Your Assumed DAG is Wrong and Here's How To Deal With It [4.3] 本稿では,因果グラフの集合上の因果クエリのバウンダリを提供する,効率的な勾配に基づく最適化手法を提案する。
当社のアプローチは,DAGが間違っていると仮定した場合の有効な批判に対して,使いやすく,広く適用可能な反論を提供することを目的としています。」
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:31:12 GMT)
Continuous variable quantum teleportation, $U(2)$ invariant squeezing and non-Gaussian resource states [4.2] 非ガウス的資源状態を用いて、コヒーレントな状態に対する量子テレポーテーションプロトコルにおける二次的スキューズの役割について検討する。
非ガウス的資源状態におけるそのような非古典性の存在は、量子テレポーテーションの成功には必要ないことを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:14:42 GMT)
Semantic Neural Radiance Fields for Multi-Date Satellite Data [4.2] 本稿では,そのシーンの3次元意味表現を得ることのできる,衛星固有のニューラルレージアンスフィールド(NeRF)モデルを提案する。
このモデルは、対応する画素単位のセマンティックラベルを持つマルチ日付衛星画像の集合から出力を導出する。
時間的画像の不整合に対処するために意味情報を活用することで色予測を強化する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:26:48 GMT)
Non-Halting Queries: Exploiting Fixed Points in LLMs [4.1] 我々は、自動回帰モデルの固定点を利用して、決して停止しないクエリを作成する新しい脆弱性を導入します。
非半減期異常が出現する条件を厳密に分析する。
ベースアンアライメントモデルで実施された多くの実験において,非ハーフティングクエリを実演する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:35:16 GMT)
Ambient Denoising Diffusion Generative Adversarial Networks for Establishing Stochastic Object Models from Noisy Image Data [4.1] 本稿では,ノイズの多い画像データから現実的なSOMを学習するための拡張DDGANアーキテクチャであるADDGANを提案する。
雑音の多い画像データから現実的なSOMを学習する能力を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:26:21 GMT)
From Perceptions to Decisions: Wildfire Evacuation Decision Prediction with Behavioral Theory-informed LLMs [4.1] FLAREは、山火事避難決定予測の高度な推論のためのフレームワークである。
行動理論とモデルを統合して、CoT(Chain-of-Thought)推論を合理化している。
実験では、従来の理論にインフォームドされた行動モデルよりも平均20.47%の性能改善が示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:47:33 GMT)
Language Model Fine-Tuning on Scaled Survey Data for Predicting Distributions of Public Opinions [4.0] 大規模言語モデル(LLM)は、調査設計の初期段階において、事前に調査応答を予測する。
本研究では, 調査データの特異な構造特性を利用して, 応答分布を推定するために, 直接微調整LLMを提案する。
本研究では,SubPOPの微調整により,様々なサブポピュレーションにおけるLLM予測と人間の反応の一致が大幅に改善されることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:31:33 GMT)
Enhancing Image Matting in Real-World Scenes with Mask-Guided Iterative Refinement [4.0] Mask2Alphaは、画像マッチングにおけるセマンティック理解、インスタンス認識、詳細回復を強化するために設計された反復的な改善フレームワークである。
本フレームワークでは,自己教師型視覚変換機能をセマンティックプリエントとして活用し,複雑なシナリオにおけるコンテキスト理解を強化する。
Mask2Alphaは、常に最先端の結果を達成し、正確かつ効率的な画像マッチングにおけるその有効性を示している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:16:28 GMT)
$t$-Testing the Waters: Empirically Validating Assumptions for Reliable A/B-Testing [4.0] A/BテストはWeb上での実験的な設計の基礎であり、広範囲のアプリケーションとユースケースがある。
本稿では,$t$-testの仮定が満たされ,A/B-testが有効かどうかを検証するための実用的な手法を提案する。
これにより、$t$-testの仮定が満たされ、A/B-testが有効かどうかを経験的に評価する、効率的で効果的な方法が提供される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:31:14 GMT)
Vision Language Models in Medicine [4.0] Medical Vision-Language Models (Med-VLMs) は、医療結果を改善するために、視覚データとテキストデータを統合している。
Med-VLMs が臨床, 教育, 患者医療に与える影響を強調した。
データ不足、タスクの一般化、解釈可能性の問題、公平性、説明責任、プライバシといった倫理的懸念といった課題が強調されます。
今後の方向性には、大規模で多様なデータセットの活用、クロスモーダルな一般化の改善、解釈可能性の向上などが含まれる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:53:22 GMT)
Wild Berry image dataset collected in Finnish forests and peatlands using drones [3.9] われわれは、フィンランドの森林の天蓋の下、泥炭地帯で捕獲された野生のベリーをドローンで撮影した最初の画像データセットであるWildBeを提案する。
WildBeには3,516枚の画像があり、合計18,468個の注釈付きバウンディングボックスが含まれている。
6つの人気オブジェクト検出器を用いてWildBeの総合的な解析を行い、異なる森林地域とカメラタイプにわたるベリー検出の有効性を評価した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:24:35 GMT)
Large Language Model as a Teacher for Zero-shot Tagging at Extreme Scales [3.9] Extreme Zero-shot XMC (EZ-XMC) はアノテートされたデータなしで動作し、テキストインスタンスと事前に定義されたラベルセットにのみ依存する。
ICXMLのようなLCMベースのアプローチは、より優れたラベルインスタンスアライメントを実現するが、現実のEZ-XMCアプリケーションでは計算コストが高く、実用的ではない。
この2つのアプローチのギャップを埋める新しいフレームワークであるLMTXを紹介します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:10:05 GMT)
Implicit Repair with Reinforcement Learning in Emergent Communication [3.9] 我々は、通信チャネルにノイズを加え、エージェントが受信した入力を追加することで、Lewis Gameと呼ばれるシグナリングゲームを拡張することに重点を置いている。
分析の結果,エージェントが送信メッセージに冗長性を加えることで,タスク成功に対するノイズの負の影響を防止できることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:23:04 GMT)
Reinforcement Learning-based Approach for Vehicle-to-Building Charging with Heterogeneous Agents and Long Term Rewards [3.9] 本稿では,行動マスキングとMILPによる効率的な政策ガイダンスを併用した新しいRLフレームワークを提案する。
当社のアプローチは、ユーザの充電要求を満たすために、継続的なアクションスペースの探索のバランスを取る。
提案手法は,V2Bエネルギー管理の課題を解決するための,最初のスケーラブルで汎用的なアプローチの1つである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:24:41 GMT)
Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs [3.8] 実験では、モデルを微調整して安全でないコードを出力し、それをユーザに開示する。
結果として得られるモデルは、コーディングとは無関係な幅広いプロンプトに対して不一致に作用する。
この効果は様々なモデルで観測されるが、GPT-4oやQwen2.5-Coder-32B-Instructでは最も強い。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:56:03 GMT)
Towards Reinforcement Learning for Exploration of Speculative Execution Vulnerabilities [3.8] 投機的実行脆弱性は、それらを悪用するためには、集中的な手作業とハードウェアの深い知識が必要です。
本稿では,強化学習を利用して,ポストシリコン(ブラックボックス)マイクロプロセッサの投機的実行リークを検出するフレームワークSpecRLを紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:17:57 GMT)
Genetics-Driven Personalized Disease Progression Model [3.8] 既存のアプローチはしばしば、疾患の進行を集団レベルでの均一な軌跡パターンとしてモデル化する。
異種進行パターンと遺伝子プロファイル群を共同で学習するパーソナライズされた疾患進行モデルを提案する。
提案モデルは実世界の臨床データと合成臨床データの改善を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:45:14 GMT)
Achieving Fair PCA Using Joint Eigenvalue Decomposition [3.7] 主成分分析は次元還元法として広く用いられている。
特に人口統計の特徴を含むデータを扱う場合には、公平さを無視することが多い。
本稿では,複数行列の同時対角化を可能にする手法であるJEVD(Joint Eigen Value Decomposition)を取り入れた手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:51:02 GMT)
Bridging Social Media and Search Engines: Dredge Words and the Detection of Unreliable Domains [3.7] 我々はWebグラフとソーシャルメディアのコンテキストを統合したWebサイト信頼性分類・発見システムを開発した。
本稿では,信頼できないドメインが検索エンジン上で高いランクを付けるような単語,用語,フレーズの概念を紹介する。
私たちは、ソーシャルメディアとオンラインコマースプラットフォームとの強いつながりを強調した、ドレッジワードの新たなデータセットをリリースしました。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:40:20 GMT)
Solid-state platform for cooperative quantum dynamics driven by correlated emission [3.6] 我々は,ハイブリッド固体プラットフォームにおける類似の協調現象の探索のステージを設定した。
我々は、固体スピン欠陥のアンサンブルの量子多体力学の包括的定式化を開発する。
我々の研究は、固体系の量子センシングに対するマルチキュービットアプローチの基礎を築いた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:14:56 GMT)
MixGCN: Scalable GCN Training by Mixture of Parallelism and Mixture of Accelerators [3.6] フルグラフ上でのグラフ畳み込みネットワーク(GCN)のトレーニングは難しい。
機能テンソルは簡単にメモリを爆発させ、現代のアクセラレーターの通信帯域をブロックすることができる。
トレーニングのワークフロー GCNはスパース演算と密度行列演算を交互に行う。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:02:47 GMT)
Accurate estimation of feature importance faithfulness for tree models [3.5] 我々は、PGI二乗と呼ぶ特徴ランク(または属性)の予測忠実度を摂動に基づく計量として考える。
PGI2乗に基づく木モデルの予測において重要となる特徴のランク付け手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:58:35 GMT)
UNB StepUP: A footStep database for gait analysis and recognition using Underfoot Pressure [3.5] UNB StepUPデータベースは、高解像度の圧力感知タイルで収集された歩行圧力データを備えている。
最初のリリースには、150人の個人から20万以上の足跡が含まれている。
UNB StepUP-P150データセットは、圧力に基づく歩行分析と認識のための新しいベンチマークを設定する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:21:02 GMT)
Characterizing Structured versus Unstructured Environments based on Pedestrians' and Vehicles' Motion Trajectories [3.5] 歩行者と車両が互いに近接して走行する軌道行動は、構造的環境と比較して非構造的に異なる可能性がある。
本稿では,抽出された2つの軌道特徴に基づいて,既存のデータセットを比較した。
その結果,2つの環境タイプによって,軌道変動,停止率,歩行者の密度などの特徴が異なることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:09:21 GMT)
Zero-shot Musical Stem Retrieval with Joint-Embedding Predictive Architectures [3.5] 本稿では,コンテキストの潜在表現を生成するために,エンコーダと予測器を協調訓練する,結合埋め込み予測アーキテクチャに基づく新しい手法を提案する。
特に,任意の楽器に条件付けした予測器を設計し,ゼロショットステム検索を行えるようにした。
MUSDB18とMoisesDBデータセットを用いて,本モデルの検索性能を検証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:10:01 GMT)
Equality Saturation for Optimizing High-Level Julia IR [3.4] ドメインエキスパートがJuliaプログラミング言語のコードを最適化するための書き直しルールを表現できるシステムを開発した。
コード再利用における優位性を考慮に入れた最適な電子グラフ抽出のためのILP定式化と,純粋な関数への呼び出しの書き直しにemphCFGスケルトン緩和を導入する。
ユースケースは、ユリアのブロードキャスティング機構のような低レベルコードだけでなく、高レベルなドメイン固有コードでもリライト可能であることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:40:49 GMT)
A Novel Spike Transformer Network for Depth Estimation from Event Cameras via Cross-modality Knowledge Distillation [3.4] イベントカメラは、非同期バイナリスパイクとして光強度の時間変化を符号化する。
従来の画像に基づく深度推定手法には、従来のスパイク出力とラベル付きデータセットの不足が大きな課題となっている。
本研究では, スパイキングデータのユニークな特性を利用して, 深度推定のための新しいエネルギー効率の高いスパイク駆動型トランスフォーマーネットワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:47:58 GMT)
Traveling Waves Integrate Spatial Information Through Time [3.3] 視覚刺激に応答して隠れた状態で進行波を発生させる畳み込みリカレントニューラルネットワークを導入する。
移動波は局所的に接続されたニューロンの受容野を効果的に拡張し、長距離符号化と情報通信を支援する。
人工ネットワークにおける移動波に基づくコミュニケーションと視覚表現への第一歩として,波動力学が効率性とトレーニング安定性の恩恵をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:47:01 GMT)
Universal approximation results for neural networks with non-polynomial activation function over non-compact domains [3.3] 単一隠れ層フィードフォワードニューラルネットワークの普遍近似特性をコンパクト領域を超えて拡張する。
活性化関数が非多項式であると仮定することにより、ユークリッド空間の非コンパクト部分集合上で定義される函数空間内での普遍近似結果を確立する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:12:26 GMT)
Persistent Homology for Structural Characterization in Disordered Systems [3.3] 障害のあるシステムにおける局所的構造と大域的構造の両方を特徴付けるために,永続的ホモロジー(PH)に基づく統一的なフレームワークを提案する。
同じアルゴリズムとデータ構造を使って、ローカルとグローバルのディスクリプタを同時に生成できる。
粒子の再配置を予測し、大域的な位相を分類するのに非常に効果的で解釈可能であることが示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:22:11 GMT)
PulseBat: A field-accessible dataset for second-life battery diagnostics from realistic histories using multidimensional rapid pulse test [3.3] 著者らは464個のリチウムイオン電池をテストし、3種類の陰極材料、6つの歴史的使用法、3つの物理的フォーマット、6つの容量設計をカバーした。
パルス実験は, パルス幅10回, パルス径10回, 充電状態複数回, 健康状態2回毎に繰り返し行った。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:10:04 GMT)
Learning Backbones: Sparsifying Graphs through Zero Forcing for Effective Graph-Based Learning [3.3] 本稿では,従来のグラフの基本学習属性を保存したグラフスペーシフィケーションのための新しいフレームワークを提案する。
これらのスパースグラフを「学習バックボーン」と呼ぶ。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:12:29 GMT)
Towards Human Cognition: Visual Context Guides Syntactic Priming in Fusion-Encoded Models [3.2] PRISMATICは、最初のマルチモーダル構造プライミングデータセットである。
この研究は、構文情報のマルチモーダル言語モデルでの処理方法の評価と理解に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:33:27 GMT)
SUSTeR: Sparse Unstructured Spatio Temporal Reconstruction on Traffic Prediction [3.2] 道路網における交通センサの分布は, 概して希少である。
空間的に不規則で非決定論的な交通観測における交通予測の問題に取り組む。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:01:03 GMT)
GOD model: Privacy Preserved AI School for Personal Assistant [3.2] 私たちは、デバイス上でAIアシスタントをトレーニングし評価するためのセキュアでプライバシー保護のフレームワークであるGuardian of Data(GOD)を紹介します。
GODは、ユーザデータと自律性を保護しながら贈り物を推奨するなど、アシスタントがユーザニーズをいかに予測できるかを測定します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:30:17 GMT)
Detecting Code Vulnerabilities with Heterogeneous GNN Training [3.1] グラフニューラルネットワーク(GNN)機械学習は、ソースコードをグラフとしてモデル化することで、有望なアプローチである。
本稿では、ソースコードの効率的かつ言語に依存しない表現として、IPAG(Inter-Procedural Abstract Graphs)を提案する。
また、ソースコードの異なる特徴を抽出する複数のサブグラフを組み込んだ異種注意GNN(HAGNN)モデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:39:16 GMT)
Reverb: Open-Source ASR and Diarization from Rev [3.1] Revは、これらのリリースが音声技術の研究とイノベーションを加速させることを期待している。
今日リリースされた音声認識モデルは、様々な長文の音声認識領域で、既存のすべてのオープンソースの音声認識モデルを上回っている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:37:06 GMT)
Dynamics of Supervised and Reinforcement Learning in the Non-Linear Perceptron [3.1] 学習を記述するフロー方程式を導出するために,データセット処理アプローチを用いる。
学習ルール(教師付きまたは強化学習,SL/RL)と入力データ分布が知覚者の学習曲線に及ぼす影響を特徴付ける。
このアプローチは、より複雑な回路アーキテクチャの学習力学を解析する方法を示している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:04:33 GMT)
Uncovering simultaneous breakthroughs with a robust measure of disruptiveness [3.0] 本稿では,ニューラル埋め込みフレームワークに基づく破壊性の新しい連続的尺度を提案する。
破壊的なイノベーションと同時発見を識別するための、より堅牢で正確なレンズを提供することにより、我々の研究は、変革的貢献を評価するためのより公平な基盤を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:03:46 GMT)
Hotter and Colder: A New Approach to Annotating Sentiment, Emotions, and Bias in Icelandic Blog Comments [2.9] Hotter and Colderはアイスランドのブログコメントで、さまざまなタイプのオンライン行動を分析するために設計されたデータセットである。
GPT-4o miniを用いて感情分析、感情検出、ヘイトスピーチ、グループ一般化を含む25のタスクに約80,000のコメントをアノテートした。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:23:39 GMT)
Gabor-Enhanced Physics-Informed Neural Networks for Fast Simulations of Acoustic Wavefields [2.9] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式の解法として注目されている。
本稿ではGabor関数を組み込んだ簡易なPINNフレームワークを提案する。
従来の PINN とガボルベース PINN と比較して, 精度, 収束性, 堅牢性を向上した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:25:40 GMT)
Towards Enterprise-Ready Computer Using Generalist Agent [2.8] 本稿では,企業用汎用エージェントシステム(CUGA)の開発に向けて,現在進行中の取り組みについて述べる。
最先端のエージェントAI技術と、反復的評価、分析、改善のための体系的なアプローチを統合することで、我々は、迅速かつ費用対効果の高いパフォーマンス向上を実現した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:31:56 GMT)
Active Learning for Conditional Inverse Design with Crystal Generation and Foundation Atomic Models [2.8] 本稿では, 結晶生成モデルと基本原子モデルを組み合わせて, 逆設計の精度と効率を高めるための能動的学習フレームワークを提案する。
我々のフレームワークは、様々な結晶生成と基盤原子モデルに対応し、AI駆動材料発見のためのスケーラブルなアプローチを確立している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:15:38 GMT)
Compactly-supported nonstationary kernels for computing exact Gaussian processes on big data [2.8] ガウス過程(英: Gaussian process, GP)は、暗黙的な不確実性特徴を持つ機械学習手法である。
従来のGPの実装には、その柔軟性を制限する固定化されたカーネルが含まれる。
スパーシリティと非定常性の両方を発見およびエンコードできる代替カーネルを導出する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:43:05 GMT)
Continuous Diffusion for Mixed-Type Tabular Data [2.8] 混合型タブラリデータのための連続拡散モデルCDTDを提案する。
連続的特徴とカテゴリー的特徴の両方に統一された連続的雑音分布を付与するスコアマッチングとスコアの新たな組み合わせに基づいている。
実験の結果,CDTDは最先端のベンチマークモデルより一貫して優れていた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:34:49 GMT)
Extracting domain-specific terms using contextual word embeddings [2.8] 本稿では,用語抽出のための新しい機械学習手法を提案する。
従来の用語抽出システムの特徴と、文脈単語の埋め込みから派生した新しい文脈特徴を組み合わせる。
われわれのアプローチは、これまでの最先端よりもF1スコアの点で大幅に改善されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:06:35 GMT)
Error-mitigated Geometric Quantum Control over an Oscillator [2.7] 量子情報は、環境および運用上の不完全性に対して脆弱である。
本稿では,関数理論による量子最適制御に基づくロバストなスキームを提案する。
この方式は、フォールトトレラント量子計算の代替として有望なものである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:09:36 GMT)
Tensor Product Neural Networks for Functional ANOVA Model [2.7] 機械学習モデルの複雑化に伴い、機械学習モデルの解釈可能性の重要性が増している。
本稿では,ANOVAのユニークな分解を保証し,各コンポーネントを安定して推定できる新しい解釈可能なモデルを提案する。
実験により、ANOVA-NODEは各コンポーネントのより安定した評価を提供し、トレーニングデータとモデルパラメータの初期値が変化するとき、より安定した解釈を提供することを示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:53:24 GMT)
To Patch or Not to Patch: Motivations, Challenges, and Implications for Cybersecurity [2.7] パッチ適用に関する質問を新たに検討し、なぜ組織がパッチ適用を選択したのか、それに反対したのかを批判的に調査する。
主な動機は、組織的なニーズ、IT/セキュリティチームとベンダーとの関係、法的および規制的な要求である。
また、この決定がパッチが適用されない理由として、多くの重要な理由が発見されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:52:35 GMT)
Motion-Robust T2* Quantification from Gradient Echo MRI with Physics-Informed Deep Learning [2.6] 運動補正は高品質なT2*写像を得るのに不可欠である。
これまでに導入した物理インフォームド動作補正法であるPHIMOを拡張した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:41:53 GMT)
CIC: A Framework for Culturally-Aware Image Captioning [2.6] 本稿では,文化を表すイメージの視覚的要素から抽出された文化要素をキャプションとして表現し,表現する新しい枠組みであるCICを提案する。
視覚的モダリティとLarge Language Models(LLM)を組み合わせた手法に着想を得て,画像から文化カテゴリーに基づく質問を生成する。
4つの異なる文化集団から45人の被験者を対象に行った人的評価から,提案する枠組みがより文化的に記述的なキャプションを生成することが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:56:33 GMT)
Fair Foundation Models for Medical Image Analysis: Challenges and Perspectives [2.6] 自己教師付き学習を通じて膨大なデータセットに基づいてトレーニングされたファンデーションモデル(FM)は、医療画像タスクにまたがる効率的な適応を可能にする。
これらのモデルは公正性を高める可能性を示しているが、人口統計学的グループ間で一貫したパフォーマンスを達成する上で大きな課題は残る。
この包括的な枠組みは、体系的なバイアス緩和と政策関与を組み合わせることで、医療におけるAIの同等性に対する技術的障壁と制度的障壁の両方に効果的に対処できることを示すことで、現在の知識を前進させる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:54:49 GMT)
StatLLM: A Dataset for Evaluating the Performance of Large Language Models in Statistical Analysis [2.6] StatLLMは、統計解析において大規模言語モデルの性能を評価するためのオープンソースのデータセットである。
最初のコンポーネントは、さまざまな分析とデータセットにまたがる統計分析タスクを含む。
第2のコンポーネントは、ChatGPT 3.5、ChatGPT 4.0、Llama 3.1によって生成されたSASコードである。
第3のコンポーネントは、LLM生成コードの正確性、有効性、可読性、実行可能性、出力精度を評価するための、人間の専門家による評価スコアを含んでいる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:11:20 GMT)
Predicting Critical Heat Flux with Uncertainty Quantification and Domain Generalization Using Conditional Variational Autoencoders and Deep Neural Networks [2.5] 我々は,2006年のGroeneveldルックアップテーブルで用いられる臨界熱流束データを拡張する条件付き変分オートエンコーダ(CVAE)を開発した。
従来の手法と比較するため、同じデータセット上で微調整深層ニューラルネットワーク(DNN)回帰モデルを評価した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:01:29 GMT)
Gender Bias in Perception of Human Managers Extends to AI Managers [2.5] 我々は、AIマネージャが人間マネージャと比較してどのように認識されるかを検討する。
以上の結果から,リーダーシップにおけるジェンダーバイアスは,人的マネージャを超えて,AIによる意思決定にも及んでいることが示唆された。
AIはより管理的な役割を担っているため、公平で効果的なAI管理システムの設計には、これらのバイアスを理解し、対処することが不可欠である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:52:05 GMT)
LettuceDetect: A Hallucination Detection Framework for RAG Applications [2.5] Retrieval Augmented Generation (RAG) システムは、外部知識源を取り入れたとしても、幻覚応答に弱いままである。
本稿では,既存の幻覚検出法における2つの限界に対処するフレームワークであるLettuceDetectを提案する。
ModernBERTの拡張コンテキスト機能(最大8kトークン)に基づいて構築し、RAGTruthベンチマークデータセットでトレーニングします。
提案手法は,従来のエンコーダベースモデルや最もプロンプトベースモデルよりも優れており,最良モデルよりも約30倍小さい。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:11:47 GMT)
An Explainable AI Model for Binary LJ Fluids [2.5] 本稿では,二成分系LJ流体に対する人工知能(AI)モデルの構築と有用性について報告する。
このモデルは、多くの未知の混合物に対する放射分布関数(RDF)を非常に正確に予測できることが示されている。
我々は、基礎となる物理の異なる新しいレジームに遭遇する際に、AIモデルの忠実度が低い領域を強調します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:35:01 GMT)
Joint multi-band deconvolution for $Euclid$ and $Vera$ $C.$ $Rubin$ images [2.4] 本稿では,地上の天体画像の分解能向上を目的とした,新しいマルチバンドデコンボリューション手法を提案する。
このアルゴリズムは、$Vera$$C.$Rubin$$r$-, $i$-, $z$-bandsが$Euclid$$VIS$バンド内にあるという幸運な事実を生かしている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:13:38 GMT)
GenAI vs. Human Fact-Checkers: Accurate Ratings, Flawed Rationales [2.3] GPT-4oは、消費者向けアプリケーションでもっとも使われているAIモデルの一つで、他のモデルよりも優れているが、すべてのモデルは、人間のコーダーとの適度な合意しか示さない。
また,要約コンテンツと完全コンテンツ入力の有効性を評価し,要約コンテンツが精度を犠牲にすることなく効率を向上させることを約束していることを確認した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:31:36 GMT)
Evolving Skeletons: Motion Dynamics in Action Recognition [2.3] 我々は骨格グラフとハイパーグラフの表現を比較し、動き注入されたポーズに対する静的ポーズを解析する。
本研究は, テイラー変態骨格の強度と限界を強調し, 運動力学の強化の可能性を示した。
本研究は,運動量の多いデータを処理し,行動認識の分野を前進させる,革新的な骨格モデリング技術の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:02:55 GMT)
Do Language Models Understand Time? [2.3] 大規模言語モデル(LLM)は、アクション認識、異常検出、要約を含む、ビデオベースのコンピュータビジョンアプリケーションに革命をもたらした。
本研究は,ビデオ処理におけるLLMの役割を,時間的推論能力に着目して批判的に考察する。
LLMの時間的理解を制限するため、バイアス、時間的アノテーションの欠如、ドメイン固有の制限など、既存のビデオデータセットによる課題を分析します。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:37:59 GMT)
Uncertainty Quantification of Large Language Models through Multi-Dimensional Responses [2.2] セマンティック・ナレッジ・アウェア・類似性分析を統合した多次元UQフレームワークを提案する。
このアプローチは、意味と知識の両方の次元から重なり合う情報を分離し、意味のバリエーションと事実の一貫性の両方をキャプチャする。
実験により,本手法は不確かさを識別する既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:05:08 GMT)
Unbiased and Sign Compression in Distributed Learning: Comparing Noise Resilience via SDEs [2.2] 大規模モデルとデータセットで構成される機械学習パイプラインを扱うには、分散メソッドが不可欠だ。
言語モデルでしばしば見られる大きな重み付き勾配雑音に対する頑健さは、いまだに理解されていない。
本研究は,分散圧縮SGD (DCSGD) と分散符号SGD (DSignSGD) を微分方程式を用いて解析することにより,このギャップに対処する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:39:17 GMT)
Detection and Tracking of MAVs Using a Rosette Scanning Pattern LiDAR [2.2] セキュリティリスクの増大により、ドローンの検出と追跡が最優先事項となっている。
本研究では,非反復ロゼットスキャンパターンLiDARを用いて,この問題に対処する。
また、Pan-Tiltプラットフォームを用いて、ロゼット走査パターンLiDARの特性を利用する。
提案手法は,最先端の室内法と同等の精度で,最先端の屋外法を超える最大検出範囲を約80%増加させた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:37:57 GMT)
Identifying treatment response subgroups in observational time-to-event data [2.2] ランダム化制御試験(RCT)に基づく治療効果推定のための既存のアプローチ
RCTは、より均質な患者グループを特徴とする傾向があり、実際の臨床実践で遭遇した集団のサブグループを明らかにすることには関連性が低い。
本研究は、RTTと観察研究の両方において、治療応答のサブグループを特定するための、新しい、結果誘導サブグループ分析戦略を導入する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:33:14 GMT)
Culture-TRIP: Culturally-Aware Text-to-Image Generation with Iterative Prompt Refinment [2.1] 反復的プロンプトリファインメント(Culture-TRIP)を用いた文化的テキスト・画像生成手法を提案する。
提案手法は, カルチャー名詞に関連する文化的文脈と視覚的詳細を抽出する。
一連の文化的基準と大きな言語モデルに基づいて、反復的にプロンプトを洗練・評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:56:56 GMT)
Hierarchical Imitation Learning of Team Behavior from Heterogeneous Demonstrations [2.1] 複雑なシーケンシャルなタスクにおいて,マルチモーダルなチームの振る舞いを学習するために設計された階層的MAILアルゴリズムであるDTILを紹介する。
分散マッチングアプローチを用いることで、DTILimitationsはエラーとスケールを複雑化し、長い水平線と連続状態表現を効果的に緩和する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:05:59 GMT)
Academic case reports lack diversity: Assessing the presence and diversity of sociodemographic and behavioral factors related to Post COVID-19 Condition [2.1] 本研究は,健康の社会的決定因子をPCC研究に統合するための包括的枠組みを開発することを目的とする。
NER、自然言語推論(NLI)、トリグラム、周波数分析を統合したNLPパイプラインを開発し、これらのエンティティを抽出し分析した。
探索的な分析により、状態、年齢、ケアへのアクセスといった一般的なエンティティと、人種や住居の状態といったセンシティブなカテゴリーの不足が明らかになった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:29:35 GMT)
Towards Conditioning Clinical Text Generation for User Control [2.0] 本稿では,Large Language Models (LLMs) を人間のプロキシとして用いて,認知作業量の増加を伴わずに,クリニカルコントロールのためのLLMを条件とした自動データセット拡張について検討する。
我々は、より効率的なトレーニングにより、従来の提案よりもシンプルな方法で新しい最先端の成果を達成し、強化トレーニングなしで9%の相対的な改善を実現し、データセット拡張で最大34%を達成した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:13 GMT)
REGen: A Reliable Evaluation Framework for Generative Event Argument Extraction [2.0] イベント引数抽出は、テキストで事前に定義されたイベントロールの引数を識別する。
従来の評価は正確な一致(EM)に依存しており、予測された引数を正確に一致させる必要がある。
生成イベント引数抽出のための信頼性評価フレームワーク(Reliable Evaluation framework for Generative Event argument extract, REGen)を紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:49:49 GMT)
Leveraging recurrence in neural network wavefunctions for large-scale simulations of Heisenberg antiferromagnets: the square lattice [2.0] 機械学習に基づく変分モンテカルロシミュレーションは、量子多体基底状態をターゲットにするための有望なアプローチである。
我々は、リカレントニューラルネットワーク(RNN)を変分アンセットとして使用し、そのリカレント特性を活用して、徐々に大きなシステムの基底状態をシミュレートする。
トレーニング時間を増やすことで,シミュレーションの結果の精度を体系的に向上できることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:35:23 GMT)
VR-Pipe: Streamlining Hardware Graphics Pipeline for Volume Rendering [1.9] 我々は,3次元ガウススプラッティング法である最先端の放射界法を実装し,グラフィックAPIを用いて,今日のグラフィックハードウェアにおける合成および実世界のシーンで評価する。
このVR-Pipeはグラフィクスハードウェアに2つのイノベーションをシームレスに統合し、ボリュームレンダリングのためのハードウェアパイプラインを合理化します。
我々の評価によると、VR-Pipeはレンダリング性能を大幅に改善し、従来のグラフィックスパイプラインよりも2.78倍のスピードアップを実現し、ハードウェアのオーバーヘッドを無視できる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:46:36 GMT)
Black-Box Detection of Language Model Watermarks [1.9] 我々は,3つの人気のある透かしスキームファミリーのパラメータを検出し,推定するための厳密な統計試験を開発した。
提案手法の有効性を,多種多様なオープンソースモデルを用いて実験的に検証した。
以上の結果から,現在の透かし方式は従来考えられていたよりも検出可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:06:41 GMT)
Enhancing Ground-to-Aerial Image Matching for Visual Misinformation Detection Using Semantic Segmentation [1.9] 近年のジェネレーティブAI技術の進歩は、インターネット上で利用可能なデジタルメディアの信頼性に関する深刻な懸念を引き起こしている。
これらの懸念に対処するため、GPS座標などの外部情報のない非ジオタグ付き地上画像の位置情報化がますます重要になっている。
本研究は、GPSデータを使わずに、さまざまな視野(FoV)と対応する衛星画像とを関連付けるという課題に取り組む。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:04:41 GMT)
A Fokker-Planck-Based Loss Function that Bridges Dynamics with Density Estimation [1.8] 力学系モデルと確率密度関数を結びつけるフォッカー・プランク方程式から新しい損失関数を導出する。
密度推定のために,正規化フローモデルとガウス混合モデルを統合する密度推定器を提案する。
これは、最大可能性とスコアマッチングを含む、さまざまなデータベースのトレーニング手法と互換性がある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:27:25 GMT)
FedSV: Byzantine-Robust Federated Learning via Shapley Value [1.7] 我々は、Shapley Value(SV)を用いたFederated Learning(FL)における悪意あるクライアントに対する強力な防御効果を示す。
学習段階では,対象とするクライアントが属する異なるグループに応じて,各クライアントの貢献度を推定するので,悪意のあるクライアントの識別がより堅牢になる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:51:54 GMT)
Applications of Large Models in Medicine [1.7] 医療大モデル(MedLMs)は、疾病予測、診断支援、パーソナライズされた治療計画、薬物発見を強化することで、医療に革命をもたらしている。
本稿では,医療における大規模モデルの現状と今後の方向性を概観し,その意義を概観する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:21:30 GMT)
Enhancing Conversational Agents with Theory of Mind: Aligning Beliefs, Desires, and Intentions for Human-Like Interaction [1.7] オープンソースの言語モデル(LLaMA)は、ToM関連の情報をキャプチャして保存することができる。
ToM関連成分(信念、欲求、意図など)の明示的な操作が、応答アライメントを高めることができるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:42:55 GMT)
X Modality Assisting RGBT Object Tracking [1.7] X Modality Assisting Network (X-Net)を導入し、視覚オブジェクト追跡を3つの異なるレベルに分離することで、融合パラダイムの影響を探る。
X-Netは、正確なレートと成功率の平均で0.47%/1.2%のパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:06:13 GMT)
Learning to Reason at the Frontier of Learnability [1.7] 現在、強化学習は大規模言語モデルトレーニングの最終段階として広く採用されている。
私たちは、多くの質問が、すべての試み(つまり、既に学習されている)によって解決されるか、まったく解決されないかを示す。
そこで本研究では,LLM学習の強化学習段階において,強化学習文献(学習可能性のためのサンプリング)から手法を適用した。
我々のカリキュラムは、高い成功のばらつき、すなわちエージェントが成功することもあるが、必ずしも成功しない質問を優先している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:15:02 GMT)
Enhancing Answer Reliability Through Inter-Model Consensus of Large Language Models [1.7] 本稿では,複数の大規模言語モデルが複雑なPhDレベルの統計的質問を生成・回答する協調フレームワークを提案する。
本研究は,モデル間のコンセンサスにより応答信頼性が向上し,生成した質問の質が向上することを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:26:55 GMT)
Mesterséges Intelligencia Kutatások Magyarországon [1.6] 本稿では,ハンガリーのAI研究におけるいくつかの重要な成果を紹介する。
これは、深層学習(2010年代前半)が台頭する前の期間の成果を強調し、2010年以降のハンガリーにおける理論上の大きな進歩について論じている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:28:11 GMT)
A Two-step Linear Mixing Model for Unmixing under Hyperspectral Variability [1.6] スペクトルアンミキシングは、ハイパースペクトル画像処理の研究分野において重要な課題である。
線形混合モデルは、その単純さと使いやすさから注目を集めている。
モデルが競争力があり、場合によっては既存の未混合手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:44:40 GMT)
SparseTransX: Efficient Training of Translation-Based Knowledge Graph Embeddings Using Sparse Matrix Operations [1.6] 知識グラフ(KG)学習は、新しい知識を生成し、推論を行うための強力なフレームワークを提供する。
KG埋め込みのトレーニングには、特に大規模なデータセットでは、非常に長い時間がかかる可能性がある。
コア埋め込みをSpMMカーネルに置き換えることでこの問題に対処する。
これにより、複数のスキャッタ操作を単一の操作として統一し、トレーニング時間とメモリ使用量を削減できます。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:21:48 GMT)
Evaluation of Deep Audio Representations for Hearables [1.6] このデータセットは、30秒ごとに1,158曲のオーディオトラックを含み、空間的にプロプライエタリなモノローグと、日々の音響シーンの高品質な録音を混合して作成されている。
本ベンチマークでは,音声シーンの一般的な文脈,音声ソース,技術的音響特性を評価する8つのタスクを網羅する。
この優位性は、様々なオーディオコレクションで訓練されたモデルの利点を強調し、聴取可能なステアリングに必要な環境特性の符号化を含む幅広い聴覚タスクに適用可能であることを確認する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:07:54 GMT)
Systematic Weight Evaluation for Pruning Large Language Models: Enhancing Performance and Sustainability [1.5] 本研究は,トレーニング過程を通じて,個人の体重重大度を体系的に評価することに焦点を当てる。
性能を損なうことなくモデルサイズを効果的に削減する手法を提案する。
これらの発見は、持続可能な開発を保証するために最適化されたAIモデルの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:34:49 GMT)
Sparse Hyperparametric Itakura-Saito NMF via Bi-Level Optimization [1.5] そこで我々は,行依存のペナルティハイパーパラメータを自動的に適応的に調整する二段階最適化フレームワーク「ShinBO」を提案する。
実験の結果,ShinBOは正確なスペクトル分解を保証し,合成および実世界の双方で優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:05:01 GMT)
A Latent Causal Inference Framework for Ordinal Variables [1.5] Likertスケールのような正規変数は応用研究において一般的である。
因果推論の既存の方法は、名目または連続的なデータをターゲットにする傾向がある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:45:28 GMT)
Parallelized telecom quantum networking with a ytterbium-171 atom array [1.5] 量子コンピュータとセンサーを量子ネットワークに統合することで、量子情報科学の新たなフロンティアが開かれる。
我々はイッテルビウム131原子と光原子時計の高忠実な絡み合いを示す。
私たちの研究は、原子プロセッサと光時計を高速または長距離量子ネットワークに統合するための大きな一歩です。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:35:20 GMT)
Wearable Meets LLM for Stress Management: A Duoethnographic Study Integrating Wearable-Triggered Stressors and LLM Chatbots for Personalized Interventions [1.5] 2人の研究者が22日間にわたってカスタムチャットボットと対話し、ウェアラブルが検出した生理的プロンプトやストレスを記録できるフレーズに反応した。
彼らはオートエスノグラフィーの日記での経験を記録し、毎週の議論の中で分析した。
その結果、ウェアラブルによって引き起こされたほとんどのイベントは意味のあるものだったが、5人に1人が介入を保証したことがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:56:23 GMT)
Continuous Integration Practices in Machine Learning Projects: The Practitioners` Perspective [1.4] 本研究では、47の機械学習(ML)プロジェクトから155人の実践者を調査した。
実践者は、テストの複雑さ、インフラストラクチャ要件、ビルド期間と安定性など、8つの重要な違いを強調した。
実践者が言及する一般的な課題には、プロジェクトの複雑さの向上、モデルのトレーニング要求、広範なデータハンドリング、計算リソースの増大、依存性管理などがある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:01:50 GMT)
LLM Inference Acceleration via Efficient Operation Fusion [1.4] Transformer-based Large Language Models (LLM) は数十億のパラメータを含み、トレーニングと推論に専用のハードウェアリソースを必要とする。
Transformerアーキテクチャに固有の重要な課題の1つは、多くの非線形変換をサポートする必要性である。
このような集団的操作によるオーバーヘッドを完全に隠蔽できる極めて効率的な手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:42:37 GMT)
Flexible Counterfactual Explanations with Generative Models [1.3] 本稿では, 対物テンプレートを組み込んだフレームワークであるFlexible Counterfactual Explanationsを紹介する。
FCEGANは、モデルの再トレーニングや追加の最適化を必要とせずに、ユーザー定義の制約と説明を一致させる。
経済的および医療的データセットにわたる実験により、FCEGANは対実的説明の有効性を著しく改善することが示された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:01:04 GMT)
Gentle Local Robustness implies Generalization [1.3] モデルに依存し、既存のロバスト性に基づくものよりも確実に厳密な、新しい境界のクラスを提示する。
以前のものとは異なり、我々の境界はサンプルの数が増えるにつれて最良の分類器の真の誤差に収束することが保証される。
我々はさらに広範な実験を行い、ImageNetから事前訓練された大規模なディープニューラルネットワークでは、2つの境界がしばしば空白でないことを発見した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:32:29 GMT)
A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis [1.2] Fr'echet Inception Distance (FID)はImageNet Pretrained Inception-v3ネットワークで計算され、生成モデルの最先端評価指標として広く利用されている。
本稿では,FIDとその関連指標がタスク固有の評価目標と不一致であるカラーベース撮影や光コヒーレンストモグラフィなどの網膜画像モダリティの症例について検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:54:57 GMT)
Char-mander Use mBackdoor! A Study of Cross-lingual Backdoor Attacks in Multilingual LLMs [1.2] 多言語大言語モデル(mLLM)における言語間バックドア・アタック(X-BAT)について検討する。
ある言語に挿入されたバックドアが、共有埋め込み空間を介して自動的に他の言語に転送されることを示す。
以上の結果から,これらのモデルにおける言語間移動を可能にする基本的アーキテクチャの重大な脆弱性が明らかになった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:54:50 GMT)
Expressive equivalence of classical and quantum restricted Boltzmann machines [1.2] 古典データに対する半量子制限ボルツマンマシン(sqRBM)を提案する。
sqRBM は可視部分空間で通信し、非可視部分空間で通信を継続する。
我々の理論的分析は、与えられた確率分布を学習するために、RBMはsqRBMの3倍の隠れ単位を必要とすることを予測している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:02 GMT)
Comparative Analysis of Black Hole Mass Estimation in Type-2 AGNs: Classical vs. Quantum Machine Learning and Deep Learning Approaches [1.1] この研究は、ブラックホール質量推定のための古典的および量子機械学習(QML)のアルゴリズムを比較した。
その結果、古典的アルゴリズムは量子モデルよりもR2, MAE, MSE, RMSEの結果が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:30:05 GMT)
Electrical Load Forecasting over Multihop Smart Metering Networks with Federated Learning [1.1] 本稿では,計測ネットワークにおける高次負荷予測のためのPFL手法を提案する。
PFLモデルにおける負荷予測遅延を最小限に抑えるため,SMの最適資源割り当てに基づく新しいレイテンシ最適化問題を提案する。
本手法は,負荷予測の高速化と運用遅延コストの低減の観点から,既存手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:04:29 GMT)
Explaining Quantum Circuits with Shapley Values: Towards Explainable Quantum Machine Learning [1.1] 人工知能(AI)や機械学習(ML)の手法はますます複雑化しており、同時に人々の生活にも影響を及ぼしている。
並行して、量子機械学習(QML)が登場し、量子コンピューティングハードウェアの改善とクラウドサービスによる可用性の向上が進行中である。
QMLは、量子力学を利用してMLタスク(典型的には量子と古典のリソースを組み合わせた量子古典的ハイブリッドアルゴリズム)を促進する量子強化MLを可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:02:59 GMT)
Dataset Featurization: Uncovering Natural Language Features through Unsupervised Data Reconstruction [1.1] 大規模言語モデル(LLM)は、そのような自然言語によるデータの解釈を提供することを約束している。
本稿では,抽出した特徴量を正確に制御する,データセットのデファクトライズのためのドメインに依存しない手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:42:33 GMT)
Towards a Unified Theory for Semiparametric Data Fusion with Individual-Level Data [1.1] 本研究では,様々な独立した情報源からの個人レベルのデータを活用することで,滑らかな有限次元パラメータに関する推論を行うという目的に対処する。
近年の進歩により、異なるデータソースが結合対象分布の単一因数分解の条件分布の、おそらくは別個のサブセットと整合するシナリオを扱うことができる包括的理論が発展してきた。
我々は、上記の包括的理論を拡張し、対象分布の単一因数分解に対応しない条件分布に整合したソースからの個々のレベルデータの融合を可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:13:30 GMT)
APINT: A Full-Stack Framework for Acceleration of Privacy-Preserving Inference of Transformers based on Garbled Circuits [1.0] APINTは、PiT全体のレイテンシを低減するために設計されたフルスタックフレームワークである。
APINTは、可能なGCワークロードを代替メソッドに再配置する、新しいプロトコルを備えている。
また、最大でANDゲート数を減らすGCフレンドリーな回路生成も提案している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:26:42 GMT)
On the usability of generative AI: Human generative AI [1.0] 生成可能なAIシステムはコンテンツ生成を変革していますが、ユーザビリティは依然として重要な課題です。
本稿では,ユーザエクスペリエンスや透明性,コントロール,認知的負荷などのユーザビリティ要因について検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:13:59 GMT)
MIML: Multiplex Image Machine Learning for High Precision Cell Classification via Mechanical Traits within Microfluidic Systems [0.9] 我々は、新しい機械学習フレームワーク、Multiformx Image Machine Learning (MIML)を開発した。
MIMLは、ラベルのない細胞画像と生体力学的特性データを組み合わせて、各細胞に固有の、しばしば使われにくい形態情報を利用する。
このアプローチにより、細胞分類における98.3%の精度が著しく向上し、単一のデータ型のみを考慮するモデルよりも大幅に改善された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:38:26 GMT)
CAR-LOAM: Color-Assisted Robust LiDAR Odometry and Mapping [0.9] 正確なLiDARオードメトリーとマッピングのためのカラーアシストフレームワークを提案する。
システムは正確な局所化を達成し、環境の密度、精度、色、三次元の3次元マップを再構築する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:28:55 GMT)
Multi-Year-to-Decadal Temperature Prediction using a Machine Learning Model-Analog Framework [0.9] 複数年ごとの気候予測は、潜在的な地域や地球規模の気候の将来を理解する上で重要なツールである。
本稿では,機械学習とアナログ予測を組み合わせて,これらの時間スケールの予測を行うフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:07:39 GMT)
Comparative Analysis of Multi-Agent Reinforcement Learning Policies for Crop Planning Decision Support [0.9] インドでは、農夫の大多数が小規模または極端に分類されており、市場飽和や気候のリスクによる経済的な損失に特に影響を受けやすい。
既存の意思決定支援システム(DSS)は、しばしば、リアルタイム市場ダイナミクスと複数の農家間の相互作用を考慮していない一般的なレコメンデーションを提供する。
本稿では,3つのマルチエージェント強化学習(MARL)アプローチの有効性を評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:57:07 GMT)
DeepSeek-V3, GPT-4, Phi-4, and LLaMA-3.3 generate correct code for LoRaWAN-related engineering tasks [0.8] 本稿では,LoRaWAN関連エンジニアリングタスクの自動化における大規模言語モデル(LLM)の性能について検討する。
これを評価するため、GPT-4やDeepSeek-V3といった最先端のモデルと比較した。
結果、DeepSeek-V3 と GPT-4 は一貫して正確な解を提供していたが、Phi-4 と LLaMA-3.3 は高い性能を示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:02:05 GMT)
A Transformer-in-Transformer Network Utilizing Knowledge Distillation for Image Recognition [0.8] 画像のグローバルな側面とローカルな側面に注意を向けるインナー・インナー・トランスフォーマー・ベースのアーキテクチャを提案する。
我々のアプローチは学習効率と効果を高める。
注目すべきは、提案されているTransformer-in-Transformer Network(TITN)モデルが、さまざまなデータセット間で印象的なマイルストーンを達成していることだ。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 00:41:46 GMT)
A Priori Generalizability Estimate for a CNN [0.8] 計算された左特異ベクトルと右特異ベクトルは、畳み込みニューラルネットワークがどの画像に悪影響を及ぼすかを特定するのに有用であることを示す。
正しい投影率(Right Projection Ratio)は、モデルがサンプル上でうまく機能する確率を推定するのに有用な指標である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:15:21 GMT)
Improving the Inclusivity of Dutch Speech Recognition by Fine-tuning Whisper on the JASMIN-CGN Corpus [0.8] オランダ語音声におけるWhisperモデルの微調整による音声認識のばらつきについて検討した。
Whisperは、特定の年齢と言語的背景のサブポピュレーションを微調整して、様々な単語誤り率(WER)を達成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:11:13 GMT)
UrduLLaMA 1.0: Dataset Curation, Preprocessing, and Evaluation in Low-Resource Settings [0.8] 本稿では,オープンソースのLlama-3.1-8B-Instructアーキテクチャから派生したUrduLLaMA 1.0を紹介する。
ローランド適応(LoRA)を利用して、41,000Urdu命令と約50,000Urdu翻訳ペアのモデルを微調整する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:38:21 GMT)
From Exponential to Quadratic: Optimal Control for a Frustrated Ising Ring Model [0.8] 指数的に小さなスペクトルギャップは、従来の量子アニーリングにとって重要なボトルネックであることが知られている。
モデルがデジタル制御可能であり,資源のスケーリングがシステムサイズに比例して2次的に増加することを示す。
極めて高い精度で最適解が得られる円滑なディジタルスケジュールを構築する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:59:05 GMT)
An experimental platform for levitated mechanics in space [0.7] 本稿では,宇宙空間における光磁気トラップ実験のための技術実証装置の開発について述べる。
私たちのペイロードは、基本的な物理的質問を探索する目的で、将来のミッションに向けた最初の具体的なステップを表しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:45:46 GMT)
Time series forecasting based on optimized LLM for fault prediction in distribution power grid insulators [0.7] 本稿では,高電圧絶縁体における漏れ電流の増加を予測するためのハイブリッドディープラーニング(DL)モデルを提案する。
提案した最適化LDMは,2.24$times10-4$,1.21$times10-3$と2.24$times10-4$のルート平均二乗誤差で,最先端のDLモデルより優れている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:17:15 GMT)
Bridging Gaps in Natural Language Processing for Yorùbá: A Systematic Review of a Decade of Progress and Prospects [0.7] このレビューでは、注釈付きコーパスの不足、事前訓練された言語モデルの可用性の制限、音節複雑性やダイアクリティカル依存といった言語的課題を重要な障害として取り上げている。
この結果から,多言語・モノリンガル資源の増大が明らかとなった。ただし,この分野は,コードスイッチングやデジタル利用のための言語放棄といった社会文化的要因に制約されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:41:48 GMT)
On the Addressability Problem on CSS Codes [0.6] 非ゼロレートのCSS符号は論理的H, HP, PH, CNOTを論理的量子ビットの任意の空でない厳密な部分集合に対応できないことを示す。
CNOTとCZの2つの高速コード間で同様のノーゴー結果を示すことができる。
この研究は、主に符号の自己同型を考えることによって、量子符号における距離保存アドレス可能性の研究の先駆者となった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:04:15 GMT)
PQDAST: Depth-Aware Arbitrary Style Transfer for Games via Perceptual Quality-Guided Distillation [0.6] アートスタイルの転送は、画像の内容とアートワークのスタイルを組み合わせた画像の生成に関するものである。
PQDASTは、任意のスタイル転送をゲームパイプラインに統合する最初のソリューションである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:29:25 GMT)
Optimizing Continuous-Wave Pumped Entanglement-based QKD in Noisy Environment [0.6] 量子鍵分布(QKD)は、量子コンピュータの脅威から暗号システムを保護するための有望なソリューションとして登場した。
本稿では,検出タイミングの不確実性(ジッタ)を含むQKDシステムパラメータに対する極端雑音の影響について検討する。
これらのパラメータの変化は、ノイズの多い環境でのシステム性能を決定する上で重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:40:52 GMT)
GaussianFlowOcc: Sparse and Weakly Supervised Occupancy Estimation using Gaussian Splatting and Temporal Flow [0.6] 職業推定は3次元コンピュータビジョンにおいて顕著な課題となっている。
本稿では,GaussianFlowOccと呼ばれる,新規な占有率推定手法を提案する。
ガウススプラッティングにインスパイアされ、伝統的な密度の強いボクセル格子をスパース3Dガウス表現に置き換える。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:16:01 GMT)
Requirements for Quality Assurance of AI Models for Early Detection of Lung Cancer [0.6] 肺がんは世界で2番目に多いがんであり、がん関連死亡の原因となっている。
EU AI法の下では、AIベースの結節の検出、測定、キャラクタリゼーションには、一貫した品質保証が必要である。
本稿では,評価基準データセットに基づくシステム品質保証を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:38:29 GMT)
Architecting Digital Twins for Intelligent Transportation Systems [0.6] 本稿では,インテリジェントトランスポーテーションシステム(ITS)のためのDigital Twin(DT)プラットフォームであるDigITのアーキテクチャを提案する。
アーキテクチャは、キーとなるITSコンポーネントを体系的にモデル化し、予測モデリングとシミュレーションのシームレスな統合を可能にする。
進化するトラフィックパターンに適応するために、アーキテクチャには適応機械学習操作(MLOps)が組み込まれている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:51:09 GMT)
An Enhanced Large Language Model For Cross Modal Query Understanding System Using DL-KeyBERT Based CAZSSCL-MPGPT [0.5] LLM(Large Language Models)は、人間の言語を理解し、生成するために設計された高度なディープラーニングモデルである。
既存のアプローチはしばしばエコーチャンバー効果に悩まされ、冗長な視覚パターンはモデルの一般化と精度を低下させる。
本稿では,DL-KeyBERT ベースの CAZSSCL-MPGPT を用いたクロスモーダルクエリ理解のための拡張 LLM ベースのフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:31:18 GMT)
CalibRefine: Deep Learning-Based Online Automatic Targetless LiDAR-Camera Calibration with Iterative and Attention-Driven Post-Refinement [0.5] CalibRefineは完全に自動化され、ターゲットレス、オンラインキャリブレーションフレームワークである。
我々は,CalibRefineが人間の関与を最小限に抑えた高精度キャリブレーション結果を提供することを示した。
本研究は、オブジェクトレベルの特徴マッチングが、反復的かつ自己監督的な注意に基づく調整と相まって、複雑で現実的な条件下でのセンサの融合を可能にすることを明らかにする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:53:42 GMT)
Ground state energy and magnetization curve of a frustrated magnetic system from real-time evolution on a digital quantum processor [0.4] 本論文では,ハイゼンベルクモデルの時間発展を実現するために,効率的な量子回路を構築する方法を示す。
また、ハイブリッドアルゴリズムが基底状態エネルギーと磁化曲線を効率的に見つけることができるような、小さなシステムに関する実証実験を行った。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:19:02 GMT)
BenchQC: A Benchmarking Toolkit for Quantum Computation [0.4] 変分量子固有解法 (VQE) は化学および材料科学における量子コンピューティング応用のための有望なアルゴリズムである。
本研究は、アルミニウムクラスターの基底状態エネルギーを計算するためのVQEの性能をベンチマークする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:57:05 GMT)
Observability Investigation for Rotational Calibration of (Global-pose aided) VIO under Straight Line Motion [0.4] オンラインキャリブレーションは、ロボットやARデバイスのような“パワーオン・アンド・ゴー”な移動プラットフォームを構築する上で不可欠である。
観察不可能なパラメータの オンライン校正は予測不可能な結果につながる
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:55:48 GMT)
Data Analysis Prediction over Multiple Unseen Datasets: A Vector Embedding Approach [0.4] 本稿では,クエリされたデータと類似したデータセットからモデルを作成することにより,解析演算子の結果を推定する新しい手法を提案する。
我々のモデルは、より低いベクトル埋め込み表現に異なる実世界のシナリオを投影し、それらを区別することができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:21:08 GMT)
VisCon-100K: Leveraging Contextual Web Data for Fine-tuning Vision Language Models [0.4] 我々は、インターリーブされた画像テキストWebドキュメントから派生した新しいデータセットVisCon-100Kを紹介する。
提案手法では,45KのWebドキュメントをOBELICSデータセットから100Kの画像会話サンプルに変換する。
GPT-4V を用いて画像・コンテキストキャプションと OpenChat 3.5 モデルを生成し,これらのキャプションを多種多様な自由形式の質問応答対に変換する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:58:12 GMT)
Phase transitions and remnants of fractionalization at finite temperature in the triangular lattice quantum loop model [0.3] 三角格子上の量子ループモデルの有限温度位相図について検討する。
量子シミュレーションプラットフォームにおける現在の実験結果との関連について論じる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:12:48 GMT)
Holonomic quantum computation: a scalable adiabatic architecture [0.3] ホロノミック量子計算は、退化ハミルトン空間の固有空間の幾何学的進化を利用して、計算状態のユニタリ進化を実装する。
完全ホロノミックな断熱ゲートの普遍的な集合を通して原子実験でスケーラブルな量子計算を行うためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:24:04 GMT)
ARACNE: An LLM-Based Autonomous Shell Pentesting Agent [0.3] SSH サービスに適した完全自律型 LLM 型ペンテスティングエージェント ARACNE について紹介する。
ARACNEは、自律的なディフェンダーShelLMに対して60%の成功率、Over The Wire Bandit CTFに対する57.58%の成功率に達することができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:16:31 GMT)
A Generic Modelling Framework for Last-Mile Delivery Systems [0.3] 大規模ソーシャルデジタルツインニングプロジェクトは、複数の目的を持つ複雑なプロジェクトである。
本稿では,高レベルのアーキテクチャを提案し,汎用モデリングフレームワークの青写真を示す。
これには、データ適合性と互換性リスクに対処しながら、モジュール、入出力データ、相互接続を定義することが含まれる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:28:53 GMT)
MonoTODia: Translating Monologue Requests to Task-Oriented Dialogues [0.3] 本研究では,既存のドイツのモノローグ資料から注釈付き対話を抽出するための新しいアプローチについて検討する。
我々は、電子メールを対話として書き直し、注釈付けするタスクのために、最先端の大規模言語モデルを微調整する。
評価の結果,対話やアノテーションは高品質であり,TODシステムの学習の出発点となる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:51:42 GMT)
Can Score-Based Generative Modeling Effectively Handle Medical Image Classification? [0.3] 本研究では,医療画像の分類器としてのスコアベース生成モデルについて検討する。
提案手法により, CBIS-DDSM, Inbreast, Vin-Dr Mammoデータセットの分類精度が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:41:33 GMT)
Pump-efficient Josephson parametric amplifiers with high saturation power [0.2] ジョセフソンパラメトリック増幅器の電力付加効率(PAE)の上限を数値的に検討する。
高い利得の増幅器は低いPAEを持つが、芸術機器の状態を比較すれば改善の余地は十分にある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:58:31 GMT)
Conversation Routines: A Prompt Engineering Framework for Task-Oriented Dialog Systems [0.2] 本研究では,Large Language Models (LLMs) を用いたタスク指向対話システムの開発のための,構造化されたプロンプトエンジニアリングフレームワークである Conversation Routines (CR) を紹介する。
提案したCRフレームワークは,自然言語仕様による会話エージェントシステム(CAS)の開発を可能にする。
このフレームワークの有効性を,Train Booking SystemとInteractive Ticket Copilotという2つの概念実証実装を通じて実証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:40:38 GMT)
Random Projections and Natural Sparsity in Time-Series Classification: A Theoretical Analysis [0.2] 時系列分類は、医療診断、産業モニタリング、財務予測、人的活動認識など、様々な分野において不可欠である。
Rocketアルゴリズムは単純だが強力な手法として登場し、時系列データに適用されたランダムな畳み込みカーネルを通じて最先端の性能を達成し、非線形変換を行う。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:21:42 GMT)
Formally-verified Security against Forgery of Remote Attestation using SSProve [0.2] 本稿では,RAの基本セキュリティ特性の機械的形式化について述べる。
まずデジタルシグネチャを定義し、強力な存在攻撃モデルにおいて、偽造に対するセキュリティを正式に検証する。
我々の開発は、RAプロトコルが偽造に対して安全であることを示す証拠を提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:02:56 GMT)
Visualizing Uncertainty in Translation Tasks: An Evaluation of LLM Performance and Confidence Metrics [0.2] 大規模言語モデル(LLM)は機械翻訳にますます利用されているが、その予測は解釈可能性やユーザ信頼を妨げる不確実性を示すことが多い。
本稿では,(1)モデルの信頼性に関するトークンレベルの洞察をユーザに提供すること,(2)翻訳の不確かさを定量化し表現するためのWebベースの可視化ツールを開発すること,の2つの目的に対処する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:20:34 GMT)
THOR: A Non-Speculative Value Dependent Timing Side Channel Attack Exploiting Intel AMX [0.2] 我々はIntel AMXに新しい値依存型タイミング側チャネル脆弱性を導入する。
我々は、ニューラルネットワークの重みの空間性を推定できるソフトウェアベースの、価値に依存したタイミングサイドチャネル攻撃を実証する。
攻撃方法は,64個の入力要素に割り当てられた重みの空間を50分以内で完全に回復することができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:12:57 GMT)
Institutional Platform for Secure Self-Service Large Language Model Exploration [0.2] 論文では、データセットキュレーション、モデルトレーニング、セキュア推論、テキストベースの特徴抽出を含む、システムのアーキテクチャと重要な特徴について概説する。
プラットフォームはセキュアなLLMサービスの提供、プロセスとデータ分離の強調、エンドツーエンドの暗号化、ロールベースのリソース認証を目指している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:50:08 GMT)
Teleology-Driven Affective Computing: A Causal Framework for Sustained Well-Being [0.2] 本稿では,主要な感情理論を統一するテレロジー駆動型感情コンピューティングフレームワークを提案する。
我々は、個人的な情緒的な出来事の「データバース」を作ることを提唱する。
シミュレーション環境でエージェントを訓練するためのメタ強化学習パラダイムを導入する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:07:53 GMT)
`Generalization is hallucination' through the lens of tensor completions [0.0] 本稿では,テンソル完備化とアーティファクトを導入し,それらが言語モデルにおけるある種の幻覚や一般化を理解する上で有用な理論的枠組みであることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:41:38 GMT)
YOLO Evolution: A Comprehensive Benchmark and Architectural Review of YOLOv12, YOLO11, and Their Previous Versions [0.0] 本研究では,YOLOv3から最新のYOLO11まで,YOLO(You Only Look Once)アルゴリズムのベンチマーク解析を行った。
トラフィックシグネチャ(さまざまなオブジェクトサイズを持つ)、アフリカ野生生物(多彩なアスペクト比と画像当たりのオブジェクトの少なくとも1つのインスタンス)、および船と船舶(単一のクラスの小さなオブジェクトを持つ)の3つの多様なデータセットでパフォーマンスを評価する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:54:09 GMT)
What does AI consider praiseworthy? [0.0] 大規模言語モデルの暗黙的・明示的な道徳観を考察する。
信頼感はイデオロギーよりも賞賛と批判の強い原動力であることが分かっています。
我々は、AIシステムが社会に統合されるにつれて、その賞賛、批判、中立性のパターンを注意深く監視する必要があると結論付けている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:35:22 GMT)
Utilizing Social Media Analytics to Detect Trends in Saudi Arabias Evolving Market [0.0] 本稿では, 建設, 食品, 飲料, 観光, 技術, エンターテイメントといった分野におけるAIとソーシャルメディアの分析によるトレンドの把握と追跡について検討する。
カスタマイズされたAI駆動の方法論を活用することで、毎月何百万ものソーシャルメディア投稿を分析し、議論を分類し、トレンドを追跡するスコアを計算しました。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:15:39 GMT)
Utilizing Machine Learning to Predict Host Stars and the Key Elemental Abundances of Small Planets [0.0] Mg、Si、Feは小さな惑星を形成する上で重要である。
我々は、小さな惑星をホストする恒星が、形成中の恒星と惑星の化学相互作用を示す多くの傾向を見出した。
我々は、将来のNASAミッションのターゲット選択において、太陽系外惑星形成における要素の重要性と機械学習が果たす役割について、その重要性を裏付けることを期待している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:02 GMT)
Using Machine Learning to Detect Fraudulent SMSs in Chichewa [0.0] 本稿では,アフリカの主要言語であるチチェワにおけるSMS不正検出のための最初のデータセットについて紹介する。
我々は,ChichewaにおけるSMSを不正あるいは不正として分類するための機械学習アルゴリズムを用いた実験について報告する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:17:54 GMT)
Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics [0.0] フィデューシャルマーカーは、ナビゲーション、オブジェクト認識、シーン理解を促進する様々なロボティクスタスクで広く使われている。
本稿では,特殊センサーを搭載したロボットでのみ検出可能な「iMarkers」のイノベーティブで邪魔にならないフィデューシャルマーカーを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:27:04 GMT)
Unraveling particle dark matter with Physics-Informed Neural Networks [0.0] 我々は、物理インフォームドニューラルネットワーク(PINN)を用いた代替宇宙論において、フリーズインダークマター(DM)を規定するボルツマン方程式を解く。
我々は、ブレーンワールドのシナリオに触発されたこの理論の物理的特性、すなわち、パワー・ロー宇宙論、および粒子相互作用断面積を決定する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:27:33 GMT)
Uncovering RL Integration in SSL Loss: Objective-Specific Implications for Data-Efficient RL [0.0] SPRフレームワークにおけるSSLの客観的な修正の効果について検討する。
これには、端末状態マスキングと優先順位付けされたリプレイ重み付けが含まれる。
Atari 100kベンチマークのSPR版を6種類評価した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:03:02 GMT)
Ultrafast Plasmonic Rotors for Electron Beams [0.0] プラズモン場の循環方向が電子動力学の調節において重要な役割を担っていることを示す。
これらの知見は、超高速顕微鏡、分光法、量子情報処理における有望な応用を提供する電子波束を形成するためのプラズモンローターの可能性を強調している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:15:58 GMT)
Towards Robust Legal Reasoning: Harnessing Logical LLMs in Law [0.0] 大規模言語モデル(LLM)は将来性を示すが、法的文脈におけるそれらの応用には高い精度、再現性、透明性が必要である。
本稿では,LLMの自然言語理解と論理に基づく推論を統合したニューロシンボリックアプローチを提案する。
法律文書ケーススタディとして,保険契約のカバレッジ関連クエリにニューロシンボリックAIを適用した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:38:17 GMT)
Topological edge states in all-dielectric square-lattice arrays of bianisotropic microwave resonators [0.0] 誘電体共振器のミラー対称性の破れに付随する双異方性応答は、そのような共振器の単純な正方格子配列にバンドギャップを開くことができる。
両異方性共振器の反対方向を持つ2つの領域間の界面における位相的エッジ状態の存在を数値的および実験的に示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:26:51 GMT)
Three-dimensional Meta-atoms for High Confinement of Mid-IR Radiation [0.0] 中赤外域で動作する3次元回路状共振器の最初の実験的特性を示す。
この設計は高い柔軟性を提供し、共振器によって支えられる様々なモードの共振周波数を正確に制御できる。
これらのメタ原子は検出器への応用に非常に有望である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:03:32 GMT)
Theory-guided Pseudo-spectral Full Waveform Inversion via Deep Neural Networks [0.0] フルウェーブフォーム・インバージョンは、地下の高分解能モデルの実現を目指している。
優れた最適化フレームワークとしてディープラーニング技術が登場した。
この研究は、ディープラーニングに擬似スペクトルアプローチを組み込む際に存在するラグナに対処する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:18:55 GMT)
The Robustness of Structural Features in Species Interaction Networks [0.0] 種間相互作用ネットワークは生態群集を記述する強力なツールである。
我々は,4種類の種間相互作用を表す実世界の2部ネットワーク148種を分析した。
欠落したデータに対して,ロバストなプロパティがいかに堅牢であったかには,かなりのバリエーションがあることが分かりました。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:14:17 GMT)
The Moving Born-Oppenheimer Approximation [0.0] 我々は、高速な自由度(DOF)と結合する自由度(DOF)の力学を記述するための混合量子古典的枠組みを開発する。
このフレームワークは古典系と量子系の両方を記述するのに使うことができる。
分子動力学、状態準備、量子センシングに応用できる可能性がある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:01 GMT)
The Empirical Impact of Reducing Symmetries on the Performance of Deep Ensembles and MoE [0.0] 深層アンサンブルとMixture of Experts(MoE)の性能に及ぼす対称性の低減の影響について検討する。
その結果、非対称ニューラルネットワーク上に構築されたディープアンサンブルは、アンサンブルサイズが大きくなるにつれて大幅に性能が向上することがわかった。
この実験では, 対称性の低下がMoEアーキテクチャとMoIEアーキテクチャの両方に影響を及ぼすかどうか, 決定的な証拠は得られない。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:16:23 GMT)
The EU Digital Services Act: what does it mean for online advertising and adtech? [0.0] デジタルサービス法(DSA)は、いくつかの種類の広告テック企業に適用される。
広告主をアプリやウェブサイトに結びつける広告ネットワークは、プラットフォームであるべきだ。
一部の広告ネットワークは、アプリやウェブサイトのパブリッシャーとして資格を持つこともある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:50:19 GMT)
The Cyber Immune System: Harnessing Adversarial Forces for Security Resilience [0.0] 寄生虫とサイバー攻撃者は システム上の弱点を明らかにし 適応を推進し レジリエンスを強化するのに 重要な役割を果たす
本稿では、環境疫学とサイバーセキュリティから、複雑なシステムのストレステストとして寄生虫とサイバーエクスプローラーを再編成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:44:39 GMT)
SynthRAD2025 Grand Challenge dataset: generating synthetic CTs for radiotherapy [0.0] SynthRAD2025データセットとグランドチャレンジは、合成CT生成の進歩を促進する。
対象は, 頭頸部癌, 胸部癌, 腹部癌患者の890例 (CBCTCT) と1472例 (CBCTCT) の2362例である。
データはMetaImage(mha)フォーマットで提供され、医療画像処理ツールとの互換性を確保する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:53:09 GMT)
Synergizing Deep Learning and Full-Waveform Inversion: Bridging Data-Driven and Theory-Guided Approaches for Enhanced Seismic Imaging [0.0] 本稿では, 深層学習(DL)とフルウェーブフォーム・インバージョン(FWI)の統合について検討する。
DLとFWIの相乗効果は、地球地下の新たな洞察を与え、地球物理学を変革する可能性がある。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:09:56 GMT)
Sustainable Greenhouse Management: A Comparative Analysis of Recurrent and Graph Neural Networks [0.0] 本研究では,時空間グラフニューラルネットワーク(STGNN)の温室マイクロ気候モデリングへの応用について紹介する。
従来のリカレントニューラルネットワーク(RNN)と比較する。
我々のSTGNNアプローチは、これらの関係を有向グラフとして表現することで、この制限に対処する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:52:01 GMT)
Stable bi-frequency spinor modes as Dark Matter candidates [0.0] ユカワ結合を有するディラック・クライン・ゴルドン系のようなスカラー自己相互作用を持つスピノル系は、一般に二周波孤立波解を持つことを示す。
両周波数モードのみが動的に安定であることを示し、安定な両周波数モードがダークマターのストレージとして機能することを示唆する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:56:26 GMT)
Spin flip locking by the tunneling and relaxation in a driven double quantum dot with spin-orbit coupling [0.0] 周期電界によって駆動される半導体ナノワイヤに形成される二重量子ドットについて検討する。
特定の状態において、座標チャネルの高速な緩和とスピンチャネルの緩やかな緩和の組み合わせは、高速なスピン操作と緩やかなスピン緩和の有望な組み合わせをもたらすことが判明した。
予測された効果は、座標とスピンチャネルの両方に対して幅広い緩和時間と駆動振幅で維持され、より高い低調波周波数で観測される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:29:06 GMT)
Solving the Traveling Salesman Problem via Different Quantum Computing Architectures [0.0] 我々は、トラベルセールスマン問題(TSP)への新興フォトニックおよび量子コンピューティングアーキテクチャの適用について研究する。
ゲートベースの量子コンピュータはシミュレーションで小さなTSPインスタンスの正確な結果を示した。
Isingベースのアーキテクチャでは、より大きな問題サイズのスケーラビリティが向上している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 23:37:19 GMT)
Single-qubit probes for temperature estimation in the presence of collective baths [0.0] 2つのキュービットの系を考えると、それぞれが共用浴に結合しながら、それぞれの浴に局所的に散布される。
一方のクビットは局所浴の温度を測定するプローブとして機能し、他方のクビットは共用浴によって媒介される相互作用を利用する。
このアプローチは、プローブをターゲット量子ビットまたはその局所環境に直接結合することなく、リモート温度センサを可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:30:58 GMT)
Simple magic state calculations using `Improved Simulation of Stabilizer Circuits' [0.0] ゲート/マグニチュード$|トライアングルを1つ含む2組の量子回路を解析的に検討した。
これには、ゲートテレポーテーションによる$T$状態と、回転した表面コードへのマジックステートインジェクションが含まれる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:06:37 GMT)
Simple Quantum Gradient Descent Without Coherent Oracle Access [0.0] 本研究では、量子特異値変換フレームワークに基づく勾配降下問題に対する代替量子フレームワークを開発する。
興味のある関数の古典的な情報のみを考慮すれば、変数数に時間対数的な実行時間を持つ量子勾配降下アルゴリズムを構築することができることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:40:17 GMT)
Shakti-VLMs: Scalable Vision-Language Models for Enterprise AI [0.0] 1B と 4B のパラメータを持つ視覚言語モデルである Shakti VLM を紹介する。
主な進歩としては、注意安定のためのQK-Normalization、ハイブリッド正規化技術、位置符号化の強化などがある。
評価の結果,Shakti-Shakti-VLM-1BとShakti-VLM-4Bは文書理解,ビジュアル推論,OCR抽出,一般マルチモーダル推論に優れていた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:15:07 GMT)
Sentiment analysis of texts from social networks based on machine learning methods for monitoring public sentiment [0.0] 本研究では,リアルタイムソーシャルネットワークの世論モニタリングを改善するために,機械学習を利用した感情分析システムを開発した。
このシステムは、現実世界のシナリオでトランスフォーマーモデルを使用して最大80-85%の精度を達成した。
システムの性能は素晴らしいが、計算オーバーヘッド、データ品質、ドメイン固有の用語に関する問題がまだ残っている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:34:35 GMT)
Semi-analytical Engineering of Strongly Driven Nonlinear Systems Beyond Floquet and Perturbation Theory [0.0] 強駆動非線形システムを調整するための,非摂動的,半解析的枠組みを提案する。
我々は、Floquet理論をハーモニックバランス法を用いて非線形微分方程式に拡張する。
また、ラグランジュ乗算法にインスパイアされた新しい制約付き最適化手法を確立する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:34:04 GMT)
Scalable quantum circuit simulation of a chaotic Ising chain [0.0] 我々は、拡張性のある量子回路とインターフェロメトリプロトコルを組み合わせることで、OTOC測定のためのより効率的なフレームワークを提供する。
この方法を用いて,9ビットイジング鎖の可積分およびカオス状態における可換性成長をシミュレートする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:13:20 GMT)
Sarang at DEFACTIFY 4.0: Detecting AI-Generated Text Using Noised Data and an Ensemble of DeBERTa Models [0.0] 本稿では,AI生成テキストの検出に有効な手法を提案する。
Defactify 4.0共有タスクのために、マルチモーダルな事実チェックとヘイトスピーチ検出に関する第4ワークショップで開発された。
私たちのチーム(Sarang)は、それぞれ1.0点と0.9531点のF1スコアで、両方のタスクで1位を獲得しました。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:32:00 GMT)
SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering? [0.0] SWE-LancerはUpworkの1,400以上のフリーランスソフトウェアエンジニアリングタスクのベンチマークである。
独立したタスクは、経験豊富なソフトウェアエンジニアによって三度検証されたエンドツーエンドのテストによって評価される。
モデル性能を評価し、フロンティアモデルが依然としてほとんどのタスクを解決できないことを発見した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:58:05 GMT)
Robust Microwave-Optical Photon Conversion Using Cavity Modes Strongly Hybridized with a Color Center Ensemble [0.0] スピン持ち色中心のアンサンブルを用いた双方向マイクロ波光変換器を提案する。
より強力な非線形性を見出すことができ、必要な協調性を得ることができる。
その結果,マイクロ波光コンバータを用いた量子ネットワークへの新たな経路が開かれた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:11:36 GMT)
Relationship between Uncertainty in DNNs and Adversarial Attacks [0.0] ディープニューラルネットワーク(DNN)は、アート結果の状態を達成し、多くの課題において人間の精度よりも優れています。
DNNは結果の不確実性を伴い、あるレベルの信頼の域外にある結果を予測する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 21:31:47 GMT)
Real-time simulation of jet energy loss and entropy production in high-energy scattering with matter [0.0] 拡散状態と高密度ターゲットのリアルタイム散乱過程を1+1ドルの大規模QEDで検討した。
量子デバイスにおける高エネルギー核実験を1日で複製することを目的として、現在のテンソルネットワークに基づくシミュレーションが量子シミュレータにどのように変換できるかを簡単に議論する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:01 GMT)
Real-time Monitoring of Economic Shocks using Company Websites [0.0] Web-Based Affectedness Indicator (WAI)は、経済破壊のリアルタイムモニタリングのための汎用ツールである。
我々は、WAIがパンデミックの封じ込め対策と高い相関性を示し、堅実な業績を確実に予測する。
この方法論は、技術的、政治的、財政的、健康的、環境的危機の影響をモニタリングし緩和する大きな可能性を秘めている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:56:27 GMT)
Quantum-Safe integration of TLS in SDN networks [0.0] 量子セーフ暗号への移行は、今後10年で重要になる。
我々は、古典的、量子的、ポスト量子暗号をハイブリッド化する基盤としてTransport Layer Securityを選択しました。
このアプローチのパフォーマンスは、デプロイされた運用インフラストラクチャを使用して実証されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:35:56 GMT)
Quantum speedups in solving near-symmetric optimization problems by low-depth QAOA [0.0] 我々は、対称性を示し、植込み解を含む最適化問題の族に焦点をあてる。
1ステップの量子近似最適化アルゴリズム (QAOA) が$Omega (1/sqrtn)$の成功確率を実現することを厳密に証明する。
最後に、準対称なMax-SAT問題の様々なファミリーを構築し、最先端の古典的解法をベンチマークする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:25:45 GMT)
Quantum simulations of macrorealism violation via the QNDM protocol [0.0] 非退化アプローチとLeggett-Garg不等式を比較する。
非破壊的アプローチは極めて堅牢であり、その効率はノイズによって変化しない。
これらの結果は、マクロ現実主義の違反を特定するために、非退化アプローチを実行可能な代替手段にしている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:47:52 GMT)
Quantum Monte Carlo simulations in the restricted Hilbert space of Rydberg atom arrays [0.0] ライドバーグ原子配列は、多くのエキゾチックな量子基底状態と相転移をシミュレートする強力なプラットフォームとして登場した。
我々は、リードベルク封鎖の制約を強制することによって生成されるヒルベルト空間を縮小する多用途量子モンテカルロサンプリング手法を開発した。
カゴムの結合格子上で、Rydberg原子配列の位相図を、関連するすべてのエネルギースケールよりもはるかに小さい温度に効率的に生成できることが示される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:59:32 GMT)
Quantum Frequency Conversion of $μs$-long Photons from the Visible to the Telecom-C-Band [0.0] 量子周波数変換(Quantum Frequency Conversion、QFC)は、光ファイバーの長距離伝播を容易にするために、原子系と通信帯域を結合する技術である。
単一光子レベルで606nmから1552nmのマイクロ秒長の弱コヒーレントパルスの差周波変換を実証した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:06:39 GMT)
Quantifying protocol efficiency: a thermodynamic figure of merit for classical and quantum state-transfer protocols [0.0] ダブルウェルポテンシャルで状態を転送する古典的および量子的プロトコルに焦点を当てる。
古典的なプロトコルはポテンシャルを変形させることで達成され、量子は反断熱駆動によって支援される。
量子プロトコルがより迅速かつ正確に動作することを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:37:56 GMT)
Qoala: an Application Execution Environment for Quantum Internet Nodes [0.0] Qoalaは、プログラマブル量子ネットワークノードのための第一種オペレーティングシステムであるQNodeOSの拡張である。
我々はQoalaを,実世界の量子ネットワークハードウェアに対して検証可能なモジュール型拡張可能なシミュレータとして実装する。
広範にシミュレーションを行った結果,Qoalaの有効性とレイテンシやネットワークスケジュールに対する性能感受性を評価した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:25:20 GMT)
Properties of Krylov state complexity in qubit dynamics [0.0] 量子ビット力学におけるKrylov状態の複雑性の性質を,1つの量子ビットと1つの量子ビット対を考慮して解析する。
リードベルク二層原子と相互作用する特定の場合を考えると、実効ハミルトニアンを用いて得られるクリロフ基底は時間平均拡散複雑性を最小化する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:59:30 GMT)
Probing quantum chaos through singular-value correlations in sparse non-Hermitian SYK model [0.0] スパース非エルミート的Sachdev-Ye-Kitaev(SYK)モデルにおける特異値のスペクトルについて検討する。
以上の結果から,特異値の統計値と類似のエルミート・ガウスアンサンブルの統計値との一致が明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:58:07 GMT)
Predicting Liquidity-Aware Bond Yields using Causal GANs and Deep Reinforcement Learning with LLM Evaluation [0.0] 我々は4つの主要結合カテゴリ(AAA、BAA、US10Y)の高忠実な合成結合収率データを生成する。
我々は、取引信号、リスク評価、ボラティリティ予測を生成する微調整されたLarge Language Model (LLM) Qwen2.5-7Bを採用している。
強化学習による合成データ生成は、平均絶対誤差が0.103に達し、実世界の債券市場のダイナミクスを複製する効果を実証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:46:37 GMT)
Percolation thresholds and connectivity in quantum networks [0.0] 量子ビット型平面量子ネットワークモデルにおけるエンタングルメントパーコレーションについて検討する。
そこで我々は, 絡み合いのスワッピングと蒸留操作のシーケンスを求めるアルゴリズムを開発した。
我々は、採用戦略のパーコレーションしきい値によって明確に分離された、異なる量子パーコレーションの規則を見いだす。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:26:09 GMT)
Parametric Hypersensitivity and Transport in the Steady-State Open-System Holstein Model [0.0] NESS過敏症に対する環境パラメータの影響を解析するための速度論的モデルを構築した。
ホルシュタインモデルの本質的な空間的特性は、輸送に自然な接続を与える。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:42:57 GMT)
Order Fairness Evaluation of DAG-based ledgers [0.0] 分散台帳の順序公正性(英: Order fairness)とは、トランザクションが送信されたり、受信されたりした順序を、最終的な順序に関連付ける性質を指す。
本稿では,DAGをベースとした台帳の整合性を定量化することを目的とする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:54:02 GMT)
Optimization of the Qubit Coupled Cluster Ansatz on classical computers [0.0] 繰り返し量子ビット結合クラスタ(iQCC)法において,振幅最適化を改善するための2つの手法について報告する。
第一のスキームは、QCCユニタリを与えられた順序に結合されたジェネレータの和として近似する。
第2のスキームは、QCCユニタリが生成される拡張空間のサイズを制限する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:11:40 GMT)
Onset of Quantum Chaos and Ergoditicy in Spin Systems with Highly Degenerate Hilbert Spaces [0.0] 強磁場限界における2次元逆場イジングモデル (2DTFIM) のような高縮退エネルギースペクトルを持つ系では、量子カオスは任意の小摂動の有限系に現れる。
2DTFIMを含むモデル群において,続くエルゴディディティへの遷移について検討した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:24:45 GMT)
On the uniqueness of compiling graphs under the parity transformation [0.0] 解析可能なすべてのハイパーグラフを包含するマッピングとしてパリティ変換を導入する。
すると、グラフのすべての同値類の任意の部分集合上の変換の射影性に対する等価条件を導出する。
本稿では,従来の計算機科学に基づいて,理論的にコンパイルされた物理レイアウトを計算するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:20:26 GMT)
On the thermodynamic limit of interacting fermions in the continuum [0.0] 我々は、ペアポテンシャルを介して相互作用する$mathbb Rd$における非相対論的フェルミオンのダイナミクスを研究する。
CAR代数の拡張は、力学が*-自己同型(英語版)の群として作用し、固定粒子数に対するすべてのセクターで時間的に連続である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:28:13 GMT)
On the quantum mechanics of entropic forces [0.0] 30年前、重力はエントロピックな情報の配置から生じる可能性があると推測された。
我々は、このアイデアを詳細に実現する微視的な量子モデルのセットを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:51 GMT)
On Quantile Regression Forests for Modelling Mixed-Frequency and Longitudinal Data [0.0] この論文の目的は、混合周波数と長手データを扱うために、QRF(Quantile Regression Forest)アルゴリズムの適用を拡張することである。
標準統計手法を用いて、MIDAS-QRF(Mixed- Frequency Quantile Regression Forest)とFM-QRF(Finite Mixture Quantile Regression Forest)という2つの新しいアルゴリズムを構築している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:27:55 GMT)
Noise2Score3D:Unsupervised Tweedie's Approach for Point Cloud Denoising [0.0] Noise2Score3Dはノイズデータから直接基礎となる点雲分布の勾配を学習する。
提案手法は,既存の教師なし手法における反復処理を回避するため,単一のステップで推論を行う。
本稿では,未知の雑音パラメータを推定できる基準であるTtal Variation for Point Cloudを紹介する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:23:21 GMT)
Neural Attention: A Novel Mechanism for Enhanced Expressive Power in Transformer Models [0.0] 本稿では,ドット積をフィードフォワードネットワークに置き換えることで,トークン間の関係を表現しやすくする手法を提案する。
この研究は、様々なアプリケーションにわたるトランスフォーマーモデルの予測能力を高める効果的な手段として、ニューラルアテンションを確立する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:39:40 GMT)
Moving Past Single Metrics: Exploring Short-Text Clustering Across Multiple Resolutions [0.0] この研究は、3万の政治Twitterの伝記を含む、短いテキストのクラスタリングに焦点を当てている。
クラスタ解像度間の特定のクラスタの安定性を明らかにするために、比例安定性の指標が導入された。
結果は、データセットの性質を理解するための質問ツールを提供するために、Sankeyダイアグラムを使用して視覚化される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:17:09 GMT)
Maximal Magic for Two-qubit States [0.0] 古典的シミュラビリティとは最も異なる最大マジックを持つ2量子状態について検討する。
我々は、魔術と絡み合いの間の顕著な相互作用を明らかにし、最大魔術状態の絡み合いは2つの可能な値に制限される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:00 GMT)
MaxGlaViT: A novel lightweight vision transformer-based approach for early diagnosis of glaucoma stages from fundus images [0.0] 本研究は、早期緑内障検出のための再構成多軸視覚変換器(MaxViT)に基づく軽量モデルであるMaxGlaViTを紹介する。
このモデルは、異なる緑内障の眼底画像を含むHDV1データセットを用いて評価した。
MaxGlaViTは92.03%の精度、92.33%の精度、92.03%のリコール、92.13%のf1スコア、87.12%のコーエンのカッパスコアを達成した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:48:04 GMT)
Leveraging Continuously Differentiable Activation Functions for Learning in Quantized Noisy Environments [0.0] 実世界のアナログシステムは本質的に、モデル収束と精度を妨げるノイズに悩まされる。
GELUやSiLUのような異なるアクティベーションは勾配の堅牢な伝播を可能にし、アナログ量子化誤差を緩和する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 09:50:27 GMT)
Invariance under quantum permutations rules out parastatistics [0.0] 量子系は、置換の下で局所状態を保持するだけでなく、他の系に持つ量子情報も保存すべきである、と我々は主張する。
どちらも、粒子がボソンあるいはフェルミオンである場合に限って、それぞれの原理が満たされることを示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:01:11 GMT)
Hyperfine and Zeeman Optical Pumping and Transverse Laser Cooling of a Thermal Atomic Beam of Dysprosium Using a Single 421 nm Laser [0.0] ダイズプロシウム(Dy)原子ビームの超微細光ポンピングと横レーザー冷却の効果を実証した。
結果として生じる偏光と冷却された原子ビームは、ダイの励起状態の偶然の縮退を生かした基礎物理学実験で使用される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:46:12 GMT)
How Scientists Use Large Language Models to Program [0.0] コード生成モデルの初期アドプタである科学者の特性について検討する。
科学者たちは、よく知らないプログラミング言語やライブラリをナビゲートするための情報検索ツールとして、コード生成モデルを使っている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:23:12 GMT)
Hot wormholes and chaos dynamics in a two-coupled SYK model [0.0] 2カップリングされたSachdev-Ye-Kitaev(SYK)モデルにおいて,相転移におけるカオスのダイナミクスについて検討した。
不安定な「ホットワームホール」相へのアクセスを可能にする2つの非平衡プロトコルを用いる。
以上の結果から, 熱および非熱的溶液を含む, この相の豊富な構造が明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:44:59 GMT)
Graph Masked Language Models [0.0] ノード分類タスクに対して, TextbfGraph Masked Language Models (GMLM) を提案する。
提案手法は,その構造的重要性に基づいてノードを選択的にマスキングするテキストセマンティックマスキング戦略と,補間ノード表現を生成するテキストソフトマスキング機構という,2つの重要なイノベーションを導入する。
我々のデュアルブランチモデルアーキテクチャは、構造グラフ情報を多層融合ネットワークを介してコンテキスト埋め込みで融合する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:44:01 GMT)
Geometric Properties and Graph-Based Optimization of Neural Networks: Addressing Non-Linearity, Dimensionality, and Scalability [0.0] この研究は、幾何学的メトリクスとグラフ構造を通してニューラルネットワークを探索する。
これは、ニューラルネットワークを管理する幾何学構造についての限られた理解に対処する。
我々は,(1)線形分離可能性の限界を克服し,(2)次元・複雑さのトレードオフを管理すること,(3)グラフ表現によるスケーラビリティ向上という3つの主要な課題を特定する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:36:34 GMT)
Generation of classical non-Gaussian distributions by squeezing a thermal state into non-linear motion of levitated optomechanics [0.0] 本稿では,レビテーションされた光学系の非ガウス状態の運動の動的生成を実現する実験について述べる。
我々は、実験的な非ガウス状態とシミュレーションの期待を特徴付け、真の非古典的特徴の出現の見通しを与える。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:51:38 GMT)
From Euler to AI: Unifying Formulas for Mathematical Constants [0.0] 本稿では,式等価性を発見し,証明するための体系的手法を提案する。
検証された$pi$の3分の1は、単一の数学的対象から導出可能であることが証明された。
この研究は、AIによる科学領域間の接続の発見の基礎を築いた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:42:48 GMT)
Fast Summation of Radial Kernels via QMC Slicing [0.0] 一次元部分空間へのランダム射影と高速フーリエ和に依存するスライシングによりこの問題にアプローチする。
我々はスライシング誤差の有界性を証明し、プロジェクションを選択するための準モンテカルロ(QMC)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:46:31 GMT)
Exploring Frustration Effects of Strongly Interacting Bosons via the Hall Response [0.0] ホール偏極の挙動は,その飽和値と短時間のダイナミクスの両方において,基礎となる位相図の特徴と相関することを示す。
これはホール反応を強い相関物質中の多体キラル量子相の感度プローブとして用いる方法である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:27:02 GMT)
Experimental validation of UAV search and detection system in real wilderness environment [0.0] 地中海カルスト環境下での無人無人UAV探索の設計と実験を行った。
UAVは、既知の確率密度と検出関数に従って、Heath equation-driven Area Cover (HEDAC) ergodic control法を用いて誘導される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:53:54 GMT)
Existence and Characterisation of Coprime Bivariate Bicycle Codes [0.0] 量子誤り訂正(QEC)符号の聖杯の1つは、最低限良いパラメータを持つ符号を構築することである。
BBコードはそのようなコンパクトメモリの候補として浮上している。
本稿では,コリメBB符号のサブクラスに着目し,これらのパラメータについて検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:04:15 GMT)
Evolving Form and Function: Dual-Objective Optimization in Neural Symbolic Regression Networks [0.0] 本研究では、勾配降下と進化計算を組み合わせて、データから発生する方程式の記号的および行動的誤りを最小限に抑えるニューラルネットワークを生成する手法を提案する。
これらの進化したネットワークは、最先端勾配に基づくニューラルシンボル回帰法によって訓練されたネットワークによって生成されたものよりも、より象徴的で行動的に正確な方程式を生成することが示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:20:41 GMT)
Evaluating the Effectiveness of Large Language Models in Automated News Article Summarization [0.0] 大規模言語モデル(LLM)は、大量のテキストデータを簡潔な要約に変換する能力を示した。
本稿では,LLMを用いたサプライチェーンリスク分析のためのニュース自動要約システムを開発した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:27:46 GMT)
Evaluating Large Language Models on the Spanish Medical Intern Resident (MIR) Examination 2024/2025:A Comparative Analysis of Clinical Reasoning and Knowledge Application [0.0] 本研究は,2024年と2025年のスペイン医療インターンMIR試験における22大言語モデルLLMの比較評価を行った。
MIR試験は、画像解釈を必要とする210の複数の選択質問からなる。
この結果は、医療AI応用の進展において、ドメイン固有の微調整とマルチモーダル統合の変革の可能性を強調している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:08:26 GMT)
Evaluating Expert Contributions in a MoE LLM for Quiz-Based Tasks [0.0] クイズに基づくMMLUベンチマークのエキスパートコントリビューションを評価する。
このベンチマークでは,ほとんどの専門家が推論中にアクティベートされることはありませんでした。
また、同じレイヤ内の一部の専門家の平均的なパフォーマンスが著しく異なることも示しています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:23:52 GMT)
Estimation of Quantum Fisher Information via Stein's Identity in Variational Quantum Algorithms [0.0] 本稿では,計算複雑性を一定に抑える,スタインの同一性に基づく新しい推定フレームワークを提案する。
Ising と Schwinger のモデルに関する数値シミュレーションは、我々のアプローチの効率性とスケーラビリティを実証する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:10:36 GMT)
Entanglement fidelity of Petz decoder for one-shot entanglement transmission [0.0] ワンショット・エンタングルメント・トランスミッション(One-shot entanglement Transmission)は、量子状態がノイズのあるチャネル上の第2のパーティに送られる量子情報処理タスクである。
タスクの目標は、ノイズチャネルの出力にデコーダを適用することで、元の状態をほぼ回復することである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:44:52 GMT)
Ensemble-Based Quantum-Token Protocol Benchmarked on IBM Quantum Processors [0.0] 量子トークンは、銀行が発行する物理デバイスで個人認証に使用可能な、制限不能なキーを量子状態に格納することを想定している。
我々は,これらのアプリケーションを技術的に低需要にすることができるような,アンサンブルベースの量子トークンプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:15:52 GMT)
Enhancing RWKV-based Language Models for Long-Sequence Text Generation [0.0] 本稿では、長文言語モデリングを改善するための適応時間ゲーティング機構を備えた拡張RWKVアーキテクチャを提案する。
本研究では,(1)グローバルコヒーレンスを保ちながら局所的な統語パターンを捉える位置認識畳み込みシフト演算子,(2)知識間の情報の流れを動的に制御する神経伝達情報ルーティング機構を提案する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:30:32 GMT)
Engineering of Anyons on M5-Probes via Flux Quantization [0.0] 単磁化M5-ブレーン上の異方性トポロジカル秩序の新規な導出法を開発した。
厳密な構成は非ラグランジュ的で非摂動的である。
この結果から、アーベル・チャーン・サイモンズ理論の量子可観測性とモジュラー関手が示唆される。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:49:45 GMT)
Engineering high Pockels coefficients in thin-film strontium titanate for cryogenic quantum electro-optic applications [0.0] チタン酸ストロンチウムは極低温で345 pm/Vのmathrmr_eff$を生産できることを示す。
速度論を調整することでキュリー温度を上昇させ、ポッケルス係数の高い強誘電相を実現することができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:16:36 GMT)
End-to-End Chart Summarization via Visual Chain-of-Thought in Vision-Language Models [0.0] 本稿では,チャート要約のためのEnd-to-End Visual Chain-of-Thought (V-CoT)を提案する。
本手法では,LVLMを直接トレーニングして,チャート画像の処理とテキスト要約をエンドツーエンドで生成する。
我々は、視覚的推論ステップを実行するためにLVLMを暗黙的に誘導する、微調整による視覚的連鎖機構を組み込んだ。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:13:45 GMT)
Emoti-Attack: Zero-Perturbation Adversarial Attacks on NLP Systems via Emoji Sequences [0.0] 本稿では,絵文字の操作を利用して,微妙で効果的な摂動を生成する新しい敵攻撃手法である絵文字・アタックを紹介する。
エモジ・アタックは、大型モデルと小型モデルの両方で強力な攻撃性能を達成し、NLPシステムの対向ロバスト性を高めるための有望な技術である。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:20:18 GMT)
Emergent Hydrodynamic Mode on SU(2) Plaquette Chains and Quantum Simulation [0.0] 準1次元プラケット鎖上の2+1$D SU(2)格子ゲージ理論のハミルトン力学における創発的流体力学モードを探索する。
我々は、量子コンピュータ上の対称相関子を計算するために量子アルゴリズムを使用し、その結果が正確な対角化と一致することを発見した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:00:00 GMT)
ENACT-Heart -- ENsemble-based Assessment Using CNN and Transformer on Heart Sounds [0.0] 本研究では、視覚変換器(ViT)の原理を音声解析に適用し、特に心臓の音に着目した。
ENACT-Heartは、CNNとViTの相補的な長所をMixture of Experts (MoE)フレームワークを通じて活用し、97.52%の顕著な分類精度を達成する、新しいアンサンブルアプローチである。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 07:19:28 GMT)
Driving Education Advancements of Novice Drivers: A Systematic Literature Review [0.0] 未成年のドライバーの事故は青少年の間でも主要な死因である。
RAPT、V-RAPT、シミュレータなどの技術強化プログラムは、ハザード予測やアテンション管理といった重要なスキルを強化した。
鍵とチェックポイントを共有することを含む親の関与プログラムは、持続的な行動改善を示しました。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 03:56:10 GMT)
Detecting quasi-degenerate ground states in topological models via variational quantum eigensolver [0.0] 変分量子固有解法 (VQE) アルゴリズムを用いて, Su-Schrieffer-Heeger 開鎖と Kitaev 開鎖の正確な基底状態について検討した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:29:19 GMT)
Data-Driven Pseudo-spectral Full Waveform Inversion via Deep Neural Networks [0.0] 擬似スペクトルFWI問題をデータ駆動型擬似スペクトルアプローチのためのディープラーニングアルゴリズムとして再定式化する。
データ駆動型擬似スペクトルの逆転は、深部および過スラスト領域において古典的FWIよりも優れていた。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 19:50:36 GMT)
Controlling the dynamics of atomic correlations via the coupling to a dissipative cavity [0.0] 接点相互作用と大域相互作用の両方を介して相互作用する格子内のボソンの量子ガスからなる開系における緩和ダイナミクスを解析する。
量子クエンチ後に同期を示す原子コヒーレンスの周期振動の開始を報告する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 11:53:10 GMT)
Conditional Diffusion-Flow models for generating 3D cosmic density fields: applications to f(R) cosmologies [0.0] 次世代の銀河探査は、宇宙スケールでの重力のテストにおいて前例のない精度を約束する。
本研究では,3次元暗黒物質密度場を生成するための条件生成モデルについて,スコアベース(拡散)およびフローベース手法を用いて検討する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 12:06:23 GMT)
Compact Pulse Schedules for High-Fidelity Single-Flux Quantum Qubit Control [0.0] 単一流束量子(SFQ)パルスは超伝導量子ビットを制御するためのマイクロ波パルスの代替である。
提案されたSFQパルスシーケンスの実装は22ビット以下で保存でき、ゲート密度は99.99%を超える。
この控えめなメモリ要件は、SFQコプロセッサのフットプリントと電力の消耗を減らすのに役立つ。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 05:18:10 GMT)
Coexistence of continuous-variable quantum key distribution and classical data over 120-km fiber [0.0] 本稿では,120 km (20 dB の損失) を超える長距離連続可変QKDを, 広帯域の粗波長分割多重化システムと共存することを示す。
CV-QKDは,既存のネットワークインフラにおいて,コスト効率の高い大規模展開の可能性を示した。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:14:09 GMT)
Child vs. machine language learning: Can the logical structure of human language unleash LLMs? [0.0] 人間の言語学習は、LLMを訓練するための現在のアプローチと本質的に異なる方法で進行すると主張する。
非常に強力な実装でさえ、人間が問題にしない言語に固有の論理の側面を見逃す結果をもたらすという我々の仮説を裏付けるLSMによるドイツ語の複数形による証拠を提示する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:40:46 GMT)
ChatDBG: An AI-Powered Debugging Assistant [0.0] ChatDBGはプログラマがデバッガとの共同対話を行うことを可能にする。
根本原因を分析し、バグを説明し、広範囲の現実世界のエラーに対する正確な修正を生成することができる。
ChatDBGは急速に普及しており、すでに65,000回以上ダウンロードされている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 22:18:54 GMT)
Beyond NISQ: The Megaquop Machine [0.0] 幅広い実用価値を持つ量子コンピュータは、ノイズに対して保護されなければならない。
実際のハードウェアにおける量子誤り訂正の最近の研究は、量子情報処理の新しい時代を開きつつある。
このメガクオップマシンの潜在的な用途は何か?
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:48:41 GMT)
Bangla Fake News Detection Based On Multichannel Combined CNN-LSTM [0.0] 我々は、ニュースリーダーに自然ニュースや本当のニュースを提供するために、未検討のニュースソースから偽ニュースを識別する。
この論文は畳み込みニューラルネットワーク(CNN)と長期記憶(LSTM)の組み合わせに基づいている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 20:19:09 GMT)
At the Mahakumbh, Faith Met Tragedy: Computational Analysis of Stampede Patterns Using Machine Learning and NLP [0.0] 本研究は,インドにおける集団宗教集会において,繰り返し発生する致死的切手について,機械学習,歴史的分析,自然言語処理(NLP)を用いて検討した。
プラヤグラーの2025年の悲劇(48人以上の死者)と1954年の前身(700人以上の犠牲者)に焦点を当てている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 02:36:53 GMT)
Applying the FAIR Principles to computational workflows [0.0] デジタルオブジェクトは共有され、発見され、再利用されるため、計算的利益はFAIRの原則から得られる。
コミュニティイニシアティブのFAIRs Working Group(WCI-FW)は、FAIRデータとソフトウェア原則の両方の適用を体系的に解決している。
我々は、私たちの議論を反映し、私たちの選択と適応を正当化するコメンタリーでレコメンデーションを提示する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 17:13:02 GMT)
Applying LLMs to Active Learning: Towards Cost-Efficient Cross-Task Text Classification without Manually Labeled Data [0.0] 大規模言語モデル(LLM)をアクティブな学習フレームワークに統合する手法を提案する。
提案手法は,手動でラベル付けしたデータを必要としないクロスタスクテキスト分類性能を実現する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:43:19 GMT)
Analytical results for laser models producing a beam with sub-Poissonian photon statistics and coherence scaling as the Heisenberg limit [0.0] それぞれのレーザーシステムの力学を特徴付け、標準レーザー理論からの直観のいくつかをここで適用することができる。
しかし、通常のレーザーとは異なり、ハイゼンベルク制限レーザーのアンサンブルを構成する純粋な状態は実質的に位相圧縮されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:29:40 GMT)
Analysis of Structured Deep Kernel Networks [0.0] 本稿では,従来のカーネル手法と同じ理論的枠組みで構築されたニューラルネットワークを想起させる,特別なタイプのカーネルの利用によってモデルが得られることを示す。
特に、導入されたStructured Deep Kernel Networks (SDKNs) は、表現定理に従う最適なアクティベーション関数を持つ非有界ニューラルネットワーク (NN) と見なすことができる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:21:07 GMT)
An Equivalence Between Compatibility and Deterministic Underlying States in Quantum Mechanics [0.0] 本稿では、シナリオにおけるすべての観測可能量のペア互換性と、そのシナリオに対する決定論的基礎状態モデルを作成する能力との等価性を確立する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:40:43 GMT)
An Efficient Quantum Approximate Optimization Algorithm with Fixed Linear Ramp Schedule for Truss Structure Optimization [0.0] 本研究では,量子変動回路に基づく新しい構造最適化手法を提案する。
設計変数を乗算器として定義することにより、ロッドの断面領域を調整する際の柔軟性が向上する。
その結果、目的関数は単純な形式であり、QAOAを用いた効率的な最適化を可能にする。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:19:41 GMT)
Americans' Support for AI Development -- Measured Daily with Open Data and Methods [0.0] 私はそれを行う最初のオープンソースシステムを提示します。
このシステムは、毎日調査項目に対する新しい人間の反応を収集し、マイクロデータを匿名化し、公開する。
研究設計の透明性を高め、複製を容易にするため、より多くの科学者がオープン・ナウキャスティングの手法を採用するべきだと私は主張する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:20:28 GMT)
Advancing Eurasia Fire Understanding Through Machine Learning Techniques [0.0] 我々はロシアの山火事分析で利用可能な最も広範なデータセットの1つを提示し、13ヶ月連続で観測を行った。
調査データ分析を行い、様々な火災カテゴリや生態系にまたがる主要な火災行動パターンを特定するための予測モデルを開発する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 10:22:17 GMT)
Advances in multiparameter quantum sensing and metrology [0.0] 基本的枠組みを導入し、究極感度、最適測定戦略、および量子不整合性の役割について論じる。
このレビューは、理論と実験の間のギャップを埋め、次世代の量子センサーへの道を開くことを目的としている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 18:24:38 GMT)
A survey of datasets for computer vision in agriculture [0.0] 本稿では,フィールドで撮影された画像の高品質なデータセットを多数提供する。
この論文には45のデータセットがリストされ、プロジェクトウェブサイトのオンラインカタログにも掲載されています。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 08:27:36 GMT)
A novel approach to navigate the taxonomic hierarchy to address the Open-World Scenarios in Medicinal Plant Classification [0.0] 既存の薬草分類法は、しばしば階層的な分類や未知の種を正確に識別することができないことが観察された。
DenseNet121,Multi-Scale Self-Attention (MSSA) と階層分類のためのカスケード分類器を組み合わせた新しい手法を提案する。
提案するモデルサイズは,既存の最先端技術に比べて約4倍小さく,現実のアプリケーションに容易にデプロイできる。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:20:25 GMT)
A novel approach to accounting for correlations in evolution over time of an open quantum system [0.0] 初期相関が進化過程にどのように影響するかを示す。
また、この影響は大規模な時間スケールで消滅することが示されている。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 14:42:36 GMT)
A Survey of Large Language Models for Arabic Language and its Dialects [0.0] 本調査では、アラビア語とその方言用に設計されたLarge Language Models(LLM)の概要について概説する。
Encoder-only、decoder-only、encoder-decoderモデルを含む主要なアーキテクチャと、事前トレーニングに使用されるデータセットをカバーしている。
この研究では、下流タスクのアーキテクチャとパフォーマンスを分析し、モノリンガル、バイリンガル、マルチリンガルのLLMについても検討している。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 13:42:28 GMT)
A Novel Multi-Task Teacher-Student Architecture with Self-Supervised Pretraining for 48-Hour Vasoactive-Inotropic Trend Analysis in Sepsis Mortality Prediction [0.0] Masked Autoencoder (MAE) を用いた自己教師型セシスプレトレーニングによる教師学習型マルチタスクフレームワークを提案する。
教師モデルは死亡率分類と重度スコア回帰を行い、生徒は堅牢な時系列表現を蒸留する。
LSTM法と比較して,MIMIC-IV 3.0(9,476例)のAUROCは0。
我々の新しいマルチタスクと蒸留戦略は、リスクの高い患者の早期発見を可能にし、予測精度と疾患管理を改善し、ICU意思決定支援のための新しいツールを提供する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 04:38:59 GMT)
A Multi-LLM-Agent-Based Framework for Economic and Public Policy Analysis [0.0] 本稿では,多言語モデル(LLM)を異種人工経済エージェントとして活用することにより,経済・公共政策分析の新しいアプローチを開拓する。
まず,2周期消費配分問題の解決において,LLMの5つの経済意思決定能力を評価した。
LLMを特定の教育グループとそれに対応する収入ブラケットにマッピングすることで、MLAB(Multi-LLM-Agent-Based)フレームワークを構築する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 06:27:07 GMT)
A Machine Learning Approach for Design of Frequency Selective Surface based Radar Absorbing Material via Image Prediction [0.0] 本稿では、機械学習(ML)技術を用いて、周波数選択面(FSS)に基づくレーダー吸収材料を設計するための革新的な手法を提案する。
従来の電磁設計では、FSSの単位セル次元を入力とし、所定の設計に対して吸収係数を予測する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 15:05:40 GMT)
A Hybrid Approach to Information Retrieval and Answer Generation for Regulatory Texts [0.0] 本稿では,語彙検索と意味検索を組み合わせたハイブリッド情報検索システムを提案する。
このシステムは、微調整文変換モデルと従来のBM25アルゴリズムを統合し、意味的精度と語彙的カバレッジの両方を達成する。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 01:16:16 GMT)
1 Particle - 1 Qubit: Particle Physics Data Encoding for Quantum Machine Learning [0.0] 高エネルギー物理のための新しい量子データ符号化方式である1P1Qを紹介する。
量子機械学習(QML)における1P1Qの有効性を示す。
論文参考訳(メタデータ) (Mon, 24 Feb 2025 16:37:12 GMT)