Safety at Scale: A Comprehensive Survey of Large Model Safety [309.3] 我々は、敵攻撃、データ中毒、バックドア攻撃、ジェイルブレイクとプロンプトインジェクション攻撃、エネルギー遅延攻撃、データとモデル抽出攻撃、出現するエージェント固有の脅威を含む、大規模なモデルに対する安全脅威の包括的分類を提示する。
我々は、大規模なモデル安全性におけるオープンな課題を特定し、議論し、包括的な安全性評価、スケーラブルで効果的な防御機構、持続可能なデータプラクティスの必要性を強調します。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:14:22 GMT)
ElasticTok: Adaptive Tokenization for Image and Video [109.8] 我々は、フレームを可変数のトークンに適応的にエンコードする、事前のフレームを条件付けするElasticTokを紹介する。
推論中、ElasticTokは必要に応じてトークンを動的に割り当てる。
画像とビデオに対する評価は,トークンの有効利用におけるアプローチの有効性を示すものである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:28:27 GMT)
CollabLLM: From Passive Responders to Active Collaborators [109.4] 大規模な言語モデルは、通常、次のターン報酬で訓練され、長期的な相互作用のために最適化する能力を制限する。
マルチターン・ヒューマン・LLMコラボレーションを強化する新奇で汎用的なトレーニングフレームワークであるCollabLLMを紹介する。
また、201人の審査員による大規模なユーザスタディを実施し、CollabLLMはユーザの満足度を17.6%向上し、ユーザ使用時間を10.4%削減します。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:05:52 GMT)
On the Loss of Context-awareness in General Instruction Fine-tuning [101.0] 教師付き微調整後の文脈認識の喪失について検討した。
性能低下は,会話指導の微調整中に学んだ異なる役割に対する偏見と関連していることがわかった。
一般命令微調整データセットから文脈依存例を識別する指標を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:28:39 GMT)
Disentangling Length Bias In Preference Learning Via Response-Conditioned Modeling [87.2] 本稿では,応答条件付きBradley-Terryモデルを提案する。
また、大規模言語モデルの直接ポリシー最適化(DPO)にRc-BTモデルを利用するRc-DPOアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:50:25 GMT)
AceParse: A Comprehensive Dataset with Diverse Structured Texts for Academic Literature Parsing [82.3] AceParseは構造化テキストのパースをサポートするために設計された最初の包括的なデータセットである。
AceParseに基づいて、さまざまな構造化テキストを正確に解析するマルチモーダルモデルAceを微調整した。
このモデルは、F1スコアで4.1%、ジャカルド類似度で5%、以前の最先端技術よりも優れていた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 01:48:03 GMT)
Deep Learning-Based Point Cloud Registration: A Comprehensive Survey and Taxonomy [79.7] 深層学習に基づくポイントクラウド登録(DL-PCR)に関する総合的な調査と分類について述べる。
DL-PCR法では,登録手続きを含む重要な側面から議論を整理する。
我々はこれらを,ポイント・ツー・ポイント対応の明示的な識別を必要とするかどうかに応じて,対応ベースおよび対応不要なアプローチに分類する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:32:17 GMT)
ProPINN: Demystifying Propagation Failures in Physics-Informed Neural Networks [71.0] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法において高い期待を得た
以前の研究では、PINNの伝播不良現象が観察された。
本論文は,伝播不良とその根本原因について,初めて公式かつ詳細な研究を行ったものである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:56:38 GMT)
LoRTA: Low Rank Tensor Adaptation of Large Language Models [70.3] Low Rank Adaptation (LoRA) は、PEFT (Efficient Fine Tuning) 法として人気がある。
よりコンパクトで柔軟な表現を可能にする高階Candecomp/Parafac(CP)分解を提案する。
本手法は,比較性能を維持しつつパラメータ数を削減できる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:56:53 GMT)
LSceneLLM: Enhancing Large 3D Scene Understanding Using Adaptive Visual Preferences [70.1] LSceneLLMはタスク関連領域を自動的に識別する適応型フレームワークである。
濃密なトークンセレクタは、LDMの注意マップを調べて、命令入力の視覚的嗜好を特定する。
適応自己保持モジュールを利用して、粗い粒度と選択されたきめ細かい視覚情報を融合する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:49:25 GMT)
Incorporating Arbitrary Matrix Group Equivariance into KANs [69.3] 我々は任意の行列群同変をkanに組み込む方法であるEquivariant Kolmogorov-Arnold Networks (EKAN)を提案する。
EKANは、粒子散乱や3体問題といった対称性に関連したタスクにおいて、より小さなデータセットやより少ないパラメータで高い精度を達成する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:52:00 GMT)
Sundial: A Family of Highly Capable Time Series Foundation Models [64.6] Sundialはネイティブでフレキシブルでスケーラブルな時系列基盤モデルのファミリーです。
本モデルでは,事前分布を指定せずに事前学習を行い,複数の予測予測を生成できる。
TimeFlow Loss を通じてモード崩壊を緩和することにより、TimeBench 上で Sundial モデルのファミリーを事前訓練し、前例のないモデルキャパシティと一般化性能を示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:52:50 GMT)
Motif Guided Graph Transformer with Combinatorial Skeleton Prototype Learning for Skeleton-Based Person Re-Identification [60.9] 3Dスケルトンデータによる人物再識別(re-ID)は多くのシナリオにおいて重要な価値を持つ課題である。
既存の骨格に基づく手法は、典型的には全ての関節間の仮想運動関係を仮定し、学習に平均的な関節またはシーケンス表現を採用する。
本稿では,Y Combinatorial skeleton prototype learning (MoCos)を用いた汎用Motifガイドグラフトランスフォーマを提案する。
MoCosは、構造特異的で歩行関連のある身体関係とスケルトングラフの特徴を利用して、人物のre-IDに効果的な骨格表現を学習する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:13:11 GMT)
Mapping the Spiral of Silence: Surveying Unspoken Opinions in Online Communities [60.7] コミュニティに公に投稿された視点と,コミュニティメンバの私的な視点との相違について検討した。
少数派で自覚する参加者の72.6%が沈黙を保ち、自分の見解を投稿する確率はわずか半分である。
これらの結果は、私たちがオンラインで見る意見が、彼らが表現すべき人口にどれほど遠く及ばないかを強調している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:06:05 GMT)
On the Vulnerability of Text Sanitization [60.6] テキストの衛生化を目的とした理論的に最適な再構築攻撃を提案する。
衛生性能を評価するためのベンチマークとして, ASR のバウンダリを導出する。
我々の攻撃の1つは、最先端のベースラインよりもASRが46.4%向上したことである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:12:19 GMT)
Efficient Multi-Agent System Training with Data Influence-Oriented Tree Search [59.8] 木探索とデータ選択の両方をガイドするデータインフルエンス指向木探索(DITS)を提案する。
インフルエンススコアを活用することで、システム改善のための最も影響力のあるデータを効果的に特定する。
非微分不可能な指標に適した影響スコア推定法を導出する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:20:16 GMT)
A Review on Knowledge Graphs for Healthcare: Resources, Applications, and Promises [59.5] この総合的なレビューは、医療知識グラフ(HKG)の現状の概要を提供することを目的としている。
我々は,既存のHKGに関する文献を網羅的に分析し,その構築方法,活用技術,応用について考察した。
このレビューは、HKGsが生物医学研究や臨床実践に大きな影響を与える可能性を強調している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:38:20 GMT)
VideoGLaMM: A Large Multimodal Model for Pixel-Level Visual Grounding in Videos [58.8] VideoGLaMMは、ユーザが提供するテキスト入力に基づいて、ビデオの細かいピクセルレベルのグラウンド化を行うための新しいモデルである。
このアーキテクチャは、ビデオコンテンツの空間的要素と時間的要素の両方をテキスト命令と同期させるよう訓練されている。
実験の結果、我々のモデルは3つのタスクすべてで既存のアプローチより一貫して優れています。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:51:14 GMT)
Quality Assessment for AI Generated Images with Instruction Tuning [58.4] 我々はまず,AIGCIQA2023+と呼ばれるAIGIのための画像品質評価(IQA)データベースを構築した。
本稿では,AIGIに対する人間の嗜好を評価するためのMINT-IQAモデルを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:58:09 GMT)
ATA: Adaptive Task Allocation for Efficient Resource Management in Distributed Machine Learning [54.1] 非同期手法は分散機械学習における計算の並列化の基礎となる。
本稿では,不均一かつランダムな計算時間分布に適応するATA(Adaptive Task Allocation)を提案する。
ATAは最適なタスク割り当てを識別し、計算時間に関する事前の知識を持つメソッドと互換性があることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:22:26 GMT)
Generating Continual Human Motion in Diverse 3D Scenes [51.9] 本研究では,3次元シーンにまたがる人間の動きを誘導するアニメーターを合成する手法を提案する。
本研究では,連続的な動作合成問題を経路に沿って歩行し,キーポイントが指定した動作の内外への遷移に分解する。
我々のモデルは、つかんだり、座ったり、傾いたりといった多様な行動の長いシーケンスを生成することができる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:40:23 GMT)
Enabling Small Models for Zero-Shot Selection and Reuse through Model Label Learning [50.7] モデルと機能の間のギャップを埋める新しいパラダイムであるモデルラベル学習(MLL)を導入する。
7つの実世界のデータセットの実験により、MLLの有効性と効率が検証された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:54:40 GMT)
The exception of humour: Iconicity, Phonemic Surprisal, Memory Recall, and Emotional Associations [50.6] 本研究は, ユーモア, 音韻的ビッグラム, 情緒的原子価, 記憶記憶の関連について検討した。
否定的な関連を持つ単語は、しばしばより仮定的であり、思い出し易い。
肯定的な感情と結びついている一方で、ユーモアのある言葉には、仮定が高められ、記憶力も高められた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:31:46 GMT)
FC-KAN: Function Combinations in Kolmogorov-Arnold Networks [48.4] FC-KANはKAN(Kolmogorov-Arnold Network)の一種で、低次元データ上で一般的な数学的関数を利用する。
FC-KANをマルチ層パーセプトロンネットワーク(MLP)と、BSRBF-KAN、EfficientKAN、FastKAN、FasterKANなどの既存のKANと比較する。
B-スプラインからの出力とガウスの差(DoG)とB-スプラインからの出力と2次関数の形での線形変換を組み合わせたFC-KANの2つの変種は、平均上の他のモデル全体よりも優れていた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:16:50 GMT)
Personalized Image Generation with Large Multimodal Models [47.3] そこで我々はPersonalized Image Generation Framework(PSH)を提案し,ユーザの視覚的嗜好やニーズをノイズの多いユーザ履歴やマルチモーダルな指示から捉える。
パーソナライズされたステッカーとポスター生成にPigeonを応用し,様々な生成ベースラインよりも定量的な結果と人的評価が優れていることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:35:42 GMT)
Nautilus: Locality-aware Autoencoder for Scalable Mesh Generation [46.1] アーティストのようなメッシュ生成のための局所性を考慮したオートエンコーダであるNautilusを提案する。
本手法では,顔の近接関係を保存する新しいトークン化アルゴリズムを提案する。
また,マルチスケールガイダンスを提供するDual-stream Point Conditionerを開発した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:56:55 GMT)
Activation Approximations Can Incur Safety Vulnerabilities Even in Aligned LLMs: Comprehensive Analysis and Defense [44.0] 大規模言語モデル(LLM)は、様々な領域にまたがって顕著な機能を示した。
アクティベーション近似は 推論効率を追求する 有望な道として現れました
実用性への影響を最小限に抑えながら、アクティベーション近似の安全性は依然として不明である。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:25:48 GMT)
Reformulation is All You Need: Addressing Malicious Text Features in DNNs [44.0] 本稿では,敵攻撃とバックドア攻撃の両方に対して有効な,統一的かつ適応的な防御フレームワークを提案する。
我々のフレームワークは、様々な悪意あるテキスト機能において、既存のサンプル指向の防御基準よりも優れています。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:39:43 GMT)
Large Language Model-Brained GUI Agents: A Survey [42.8] マルチモーダルモデルはGUI自動化の新しい時代を支えてきた。
彼らは自然言語理解、コード生成、視覚処理において例外的な能力を示した。
これらのエージェントはパラダイムシフトを表しており、ユーザーは単純な会話コマンドで複雑なマルチステップタスクを実行できる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:08:44 GMT)
On-device Content-based Recommendation with Single-shot Embedding Pruning: A Cooperative Game Perspective [42.7] コンテンツベースのレコメンダシステム(CRS)は、eコマース、オンライン広告、パーソナライズされたレコメンデーションにおいて、ユーザーエクスペリエンスを形成する上で重要な役割を果たす。
膨大な数のカテゴリ的特徴のため、CRSモデルで使用される埋め込みテーブルは、現実のデプロイメントにおいて重要なストレージボトルネックを生じさせる。
この問題に対する回答として,共有価値誘導型埋め込み還元(Shaver)を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:25:18 GMT)
CILP-FGDI: Exploiting Vision-Language Model for Generalizable Person Re-Identification [42.4] CLIP(Contrastive Language- Image Pretraining)は,大規模画像テキストペア上で事前訓練された視覚言語モデルである。
CLIPのタスクへの適応は、識別能力を高めるためによりきめ細かい機能を学ぶことと、モデルの一般化能力を改善するためによりドメイン不変の機能を学ぶ、という2つの大きな課題を示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:15:23 GMT)
Weak convexity of Fisher information matrix and superresolved localization of blinking sources of light [41.9] 単一分子ローカライゼーション顕微鏡(英語版)の一般的な名前で知られる技術群は、ナノメートルスケールの空間分解能に達する。
放射体を点滅させることによって得られる分解能の利点は、その凸性であるフィッシャー情報の基本的な性質の結果であることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:23:42 GMT)
Metastable Dynamics of Chain-of-Thought Reasoning: Provable Benefits of Search, RL and Distillation [40.9] メタスタブルマルコフプロセスとしてチェーン・オブ・シント(CoT)生成による推論時間計算について検討する。
スパースエッジに報酬を与える検索プロトコルの実装は、異なるクラスタに到達するための期待するステップ数を減らし、CoTを改善することを実証する。
また,検索によって得られる情報を利用して,より優れた推論モデルが得られることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:19:14 GMT)
Error-quantified Conformal Inference for Time Series [40.4] 時系列予測の不確かさの定量化は、時系列データの時間的依存と分布シフトのために困難である。
量子化損失関数をスムースにすることで,iError-quantified Conformal Inference (ECI)を提案する。
ECIは有効な誤発見制御と、他のベースラインよりも厳密な予測セットを出力することができる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:02:36 GMT)
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers [40.4] より重要でない層をスキップすることで計算深度を動的に調整するために,MoD(Mixture of Depths)を導入した。
約束にもかかわらず、現在のMoDアプローチは未探索のままであり、2つの大きな課題に直面している。
本稿では,小さなデータセット上でのみルータを微調整し,フルモデルトレーニングに伴う計算オーバーヘッドを大幅に削減するルータチューニングを提案する。
第2の課題として,動的深度でtextitAttention をデプロイする MindSkip を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:05:10 GMT)
SecPE: Secure Prompt Ensembling for Private and Robust Large Language Models [40.1] 我々は,2つの非連結フィールド(プライベート推論と即時アンサンブル)を密に統合し,堅牢かつプライベートなLLM推論に向けた最初の試みである。
本稿では,プロンプトアンサンブルのアルゴリズム構築ブロックに対して,効率的な完全同型暗号(FHE)を設計するSecPEを提案する。
その結果、SecPEは高いクリーンな精度を維持し、わずか2.5%の効率上のオーバーヘッドを犠牲にして、より堅牢性を提供することがわかった。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:40:21 GMT)
Scale-Aware Recognition in Satellite Images under Resource Constraints [39.5] 二つの課題: ある概念を認識するのに最適な解像度と、より高価な高解像度画像(HR)をいつ取得すべきか?
1)低分解能画像(LR)の認識モデルに訓練されたモデルから知識を抽出する手法,(2)モデル不一致に基づくHR画像のサンプリング戦略,(3)概念"スケール"を推論するためのLLMベースのアプローチ,の3つの要素を導入することで,これらの課題に対処する新しい手法を提案する。
これらのコンポーネントを用いて,衛星画像の大規模認識を効率よく行うシステムを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:15:42 GMT)
Spatio-Temporal Progressive Attention Model for EEG Classification in Rapid Serial Visual Presentation Task [38.9] 本稿では,脳波の分類を改善するための新しいプログレッシブ・アテンション・モデル(STPAM)を提案する。
その結果,我々のAMは比較したすべての手法よりも優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:28:38 GMT)
High-Order Matching for One-Step Shortcut Diffusion Models [38.4] 一段階のショートカット拡散モデルでは、視覚発生の可能性を示している。
ショートカットモデルの単純速度のみのアプローチは、固有の多様体の幾何学を捉えるのに失敗する。
我々は、高次監督を利用して流通輸送に革命をもたらすフレームワークHOMOを紹介する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:19:59 GMT)
RichSpace: Enriching Text-to-Video Prompt Space via Text Embedding Interpolation [37.6] 本研究では,埋め込み空間に埋め込む最適なテキストを選択することで,この課題を克服する新しい手法を提案する。
本研究では,この手法により,ビデオ生成モデルが所望の映像を生成できることを実証する。
本研究は,テキスト埋め込みの重要性を強調し,テキスト・ビデオ・ジェネレーションの性能向上のための経路を提供する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:53:56 GMT)
The Crucial Role of Samplers in Online Direct Preference Optimization [36.7] 我々はDPOの収束率を厳密に解析し、正確な勾配設定の下で異なるサンプリング戦略で解析する。
提案するオンラインサンプリングは$textbflinear$ convergenceを達成する一方、均一サンプリングは$textbflinear$ convergenceを達成する。
例えば、Safe-RLHFデータセットでバニラDPOを74ドル以上上回っている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:18:06 GMT)
Using Causality for Enhanced Prediction of Web Traffic Time Series [36.4] 本稿では,サービス間の因果関係を抽出する効果的なニューラルネットワークモジュールCCMPlusを提案する。
本手法は,MSE(Mean Squared Error)とMAE(Mean Absolute Error)の最先端手法を超越して,サービストラフィック時系列の予測を行う。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:36:40 GMT)
MQM-Chat: Multidimensional Quality Metrics for Chat Translation [35.7] 本研究は, チャット翻訳のための多次元品質指標(MQM-Chat)を提案する。
各モデルが何らかの根本的な誤りを発生させるのに対し,各モデルには欠落,曖昧なソース内容の過度な修正,バズワード問題といった欠点がある。
本研究は,チャット翻訳評価におけるMQM-Chatの有効性を実証し,今後の研究における文体化コンテンツの重要性と対話の整合性を強調した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:43:00 GMT)
FMDLlama: Financial Misinformation Detection based on Large Language Models [35.5] 大規模言語モデル (LLM) は様々な分野で優れた性能を示している。
本研究では,FMDLlamaを提案する。FMDLlamaは,FMDタスクのための,命令データを含む微調整Llama3.1に基づく最初のオープンソース命令追従LLMである。
当社のモデルとFMD-B上のさまざまなLLMを比較して,OpenAIの製品だけでなく,他のオープンソースLLMよりも優れています。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:20:48 GMT)
OmniBal: Towards Fast Instruct-tuning for Vision-Language Models via Omniverse Computation Balance [35.4] 視覚言語インストラクションチューニングモデルにおける大規模3D並列トレーニングは、異なるデバイス間で不均衡な計算負荷をもたらす。
私たちはこの問題に対処するために、データ、モデル、メモリの観点から計算負荷を再バランスさせました。
提案手法の有効性と一般化性は,様々なモデルやデータセットでさらに実証された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:23:14 GMT)
A Survey of Quantized Graph Representation Learning: Connecting Graph Structures with Large Language Models [35.1] 量子グラフ表現(Quantized Graph Representation, QGR)の学習は、最近関心が高まっている。
自然言語に類似した表現形式を与えられたQGRは、グラフ構造を大きな言語モデル(LLM)とシームレスに統合する能力も持っている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:57:34 GMT)
UniGraph2: Learning a Unified Embedding Space to Bind Multimodal Graphs [34.5] マルチモーダルグラフ上での汎用的な表現学習を可能にする新しいクロスドメイングラフ基盤モデルを提案する。
UniGraph2は、グラフニューラルネットワーク(GNN)と共にモダリティ固有のエンコーダを使用して、統一された低次元埋め込み空間を学習する。
我々は,UniGraph2が表現学習,伝達学習,マルチモーダル生成タスクなどのタスクにおいて,最先端モデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:04:53 GMT)
Rethinking Mixture-of-Agents: Is Mixing Different Large Language Models Beneficial? [34.1] Mixture-of-Agents (MoA) は複数の異なる言語モデル (LLM) から出力を集約するアンサンブル法である。
本稿では,トップパフォーマンスLLMのみの出力を集約する自己組織化手法であるSelf-MoAを提案する。
AlpacaEval 2.0の上位モデルの1つにSelf-MoAを適用することは、リーダボード上の新しい最先端のパフォーマンスを直接達成する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:23:29 GMT)
Synthetic Artifact Auditing: Tracing LLM-Generated Synthetic Data Usage in Downstream Applications [34.0] 大規模言語モデル(LLM)は高品質で費用対効果の高い合成データの生成を促進する。
LLMが生成する合成データは、社会的バイアスやステレオタイプを永続し、増幅する。
本稿では,メトリクスベースの監査,チューニングベースの監査,分類ベースの監査を含む3つの手法による監査フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:18:28 GMT)
Information Bottleneck Approach to Spatial Attention Learning [33.0] 人間の視覚システム(HVS)における選択的な視覚的注意機構は、自然のシーンを認識するための視覚的認識に到達するための情報の量を制限する。
このような選択性は、情報圧縮と予測精度のトレードオフを求める「情報ボトルネック(IB)」として機能する。
視覚認識のために構築されたディープニューラルネットワーク(DNN)のためのIBインスパイアされた空間アテンションモジュールを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:37:06 GMT)
ReFoRCE: A Text-to-SQL Agent with Self-Refinement, Format Restriction, and Column Exploration [32.8] スパイダー2.0データセットの現在の最先端のパフォーマンスは、まだ20%に制限されている。
長文制約を緩和するテーブル圧縮を導入したReFoRCEを提案する。
ReFoRCEはスパイダー2.0-Snowで26.69点、スパイダー2.0-Liteで24.50点を得た。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:25:03 GMT)
Optimising Event-Driven Spiking Neural Network with Regularisation and Cutoff [31.6] スパイキングニューラルネットワーク(SNN)は、ニューラルネットワークのより近い模倣を提供する。
現在のSNNは一定期間にわたって推測するように訓練されている。
本稿では,効率的な推論を実現するため,推論中にいつでもSNNを停止できるSNNのカットオフを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:21:54 GMT)
Time-Reversal Provides Unsupervised Feedback to LLMs [31.6] Time Reversed Language Models (TRLM) は、応答に条件付きでクエリをスコアし、生成することができる。
TRLMのスコアリングは,従来のクエリのフォワードスコアよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:13:29 GMT)
Evaluating Small Language Models for News Summarization: Implications and Factors Influencing Performance [31.4] 小型言語モデル (SLM) は、大型言語モデル (LLM) の代替として、よりアクセスしやすいものを提供する。
本稿では,2000件のニュースサンプルを対象に,19件のSLMを包括的に評価した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:07:45 GMT)
Learning Autonomous Code Integration for Math Language Models [30.1] 現在のツール統合数学 LLM は、CoT とコードを使用するかどうかを決定するために外部から指示された命令に依存している。
本稿では,その能力の探索を通じてモデルの意思決定を洗練させる,革新的期待最大化(EM)の定式化を提案する。
このフレームワークは、(a)自己探索を通じてモデルの能力に対する信念を改善する参照戦略を計算し、(b)洗練された信念に基づいてモデルを更新する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:32:23 GMT)
How to set AdamW's weight decay as you scale model and dataset size [30.0] 我々はAdamWが学んだ重みを最近の更新の指数移動平均(EMA)と解釈できることを示した。
これは、AdamWにおける重量減衰の設定方法と、重量減衰をモデルとデータセットサイズでスケールする方法に関する重要な洞察を与える。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:46:50 GMT)
SimulPL: Aligning Human Preferences in Simultaneous Machine Translation [29.4] 同時機械翻訳(SiMT)は、ストリーミングソース入力を受信しながら翻訳を生成する。
SiMTシナリオのオーディエンスは、正確な翻訳、より単純な構文、不要なレイテンシなど、明確な好みを持っている。
そこで我々は,SiMTタスクに適した選好学習フレームワークSimulPLを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:47:09 GMT)
Decision-informed Neural Networks with Large Language Model Integration for Portfolio Optimization [29.3] 本稿では,ポートフォリオ最適化における予測と意思決定品質の重大な相違について論じる。
我々は,大規模言語モデル(LLM)の表現力を投資決定に活用する。
S&P100とDOW30データセットの実験から、私たちのモデルは最先端のディープラーニングモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:45:21 GMT)
Learning to Plan with Personalized Preferences [28.0] PbP(Preference-based Planning)ベンチマークは、原子のアクションから複雑なシーケンスにまたがる数百のさまざまな好みを具現化したベンチマークである。
我々のSOTA手法の評価では, シンボルベースのアプローチはスケーラビリティを約束するが, パーソナライズされた好みを満たす計画の生成と実行には大きな課題が残っている。
これらの知見は、適応計画のための貴重な抽象化レイヤとして、優先誘導計画の生成と実行に関する新たな研究の方向性を定めている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:16:25 GMT)
Fast Direct: Query-Efficient Online Black-box Guidance for Diffusion-model Target Generation [27.8] 既存の誘導拡散モデルは、事前コンパイルされたデータセットによるガイダンスモデルのトレーニングに依存するか、客観的関数を微分可能であるように要求する。
クエリ効率の良いオンラインブラックボックスターゲット生成のための,新しい,シンプルなアルゴリズムである textbfFast Direct を提案する。
我々のFast Directはデータ多様体上に擬似ターゲットを構築し、拡散モデルのノイズシーケンスを普遍的な方向で更新する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:21:10 GMT)
Fundamental limits of learning in sequence multi-index models and deep attention networks: High-dimensional asymptotics and sharp thresholds [27.6] 重み付きおよび低ランクの重み付き多層自己注意層の構成として定義されるディープアテンションニューラルネットワークの学習について検討する。
私たちの分析では、特に異なるレイヤが逐次的に学習される方法が明らかになりました。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:27:11 GMT)
Strengthening Generative Robot Policies through Predictive World Modeling [27.3] 生成予測制御(英: Generative predictive Control、GPC)は、専門家による実証から生成拡散ベースのポリシーをクローンする学習制御フレームワークである。
我々は、GPCが状態ベース、視覚ベース、シミュレート、実世界の実験で支配的な行動クローンを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 01:21:19 GMT)
Adversarial Semantic Augmentation for Training Generative Adversarial Networks under Limited Data [27.3] 本稿では,画像レベルではなくセマンティックレベルでトレーニングデータを拡大するために,敵対的セマンティック拡張(ASA)手法を提案する。
本手法は, 各種データ構造下での合成品質を継続的に改善する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:50:38 GMT)
S2CFormer: Reorienting Learned Image Compression from Spatial Interaction to Channel Aggregation [26.9] 我々はS2CFormerの2つのインスタンス(S2C-ConvとS2C-Attention)を提示する。
どちらのモデルも最先端(SOTA)のR-D性能を示し、デコード速度は大幅に高速である。
本稿では,異なるS2CFormerインスタンスの強度を組み合わせた拡張licモデルであるS2C-Hybridを紹介する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:15:51 GMT)
VLM-Assisted Continual learning for Visual Question Answering in Self-Driving [26.4] 本稿では,自律運転における視覚質問応答(VQA)課題を解決するための新しい手法を提案する。
自動運転において、VQAはシステムが周囲について理解し、推論できるようにする上で重要な役割を担っている。
本稿では,視覚言語モデルと選択的記憶再生と知識蒸留を組み合わせた新しい連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:27:44 GMT)
Scalable Sobolev IPM for Probability Measures on a Graph [26.3] グラフ距離空間上での確率測度に対するソボレフIPM問題について検討する。
グラフ構造を利用して、正規化されたソボレフIPMが高速な計算のためにエンフローズドフォーム表現を提供することを示した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:14:53 GMT)
Orlicz-Sobolev Transport for Unbalanced Measures on a Graph [26.3] グラフ上の非負測度に対するエントロピー部分輸送(EPT)を考える。
グラフ上の不均衡測度に対してOrlicz-EPTという幾何構造を持つ新しいEPTを開発する。
特に、グラフベースのOrlicz-Sobolev空間のデュアルEPT定式化と幾何構造を利用して、Orlicz-Sobolevトランスポート(OST)を提案する新しい正規化を導出する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:16:09 GMT)
Dissecting Submission Limit in Desk-Rejections: A Mathematical Analysis of Fairness in AI Conference Policies [24.6] 本稿では,最適化に基づく公平性を考慮したデスク-リジェクション機構を提案する。
グループフェアネスは線形プログラミングによって効率よく最適化できるのに対し、個人フェアネスの最適化はNPハードであることを証明する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:29:23 GMT)
Towards Robust Multimodal Large Language Models Against Jailbreak Attacks [24.5] 本稿では,敵対的雑音を発生させる攻撃ステップとモデル更新ステップとを交互に行うSafeMLLMを紹介する。
攻撃ステップでは、SafeMLLMは新たに提案されたコントラスト埋め込み攻撃(CoE-Attack)を通じて敵の摂動を発生させる。
我々は,SafeMLLMを6つのMLLMと6つのジェイルブレイク法で比較した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:45:49 GMT)
EvoRL: A GPU-accelerated Framework for Evolutionary Reinforcement Learning [24.4] 我々はGPUアクセラレーションに最適化された最初のエンドツーエンドEvoRLフレームワークである$texttt$textbfEvoRL$$を紹介した。
このフレームワークは、環境シミュレーションやECプロセスを含む、アクセラレーター上のトレーニングパイプライン全体を実行する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:28:32 GMT)
Meta-Prompt Optimization for LLM-Based Sequential Decision Making [24.1] 大規模言語モデル(LLM)は、シーケンシャルな意思決定タスクを解決するエージェントとして採用されている。
メタプロンプトにおけるタスク記述とメタインストラクションを自動的に最適化する,プロンプト最適化(EXPO)のためのEXPonential-weightアルゴリズムを提案する。
また、EXPOを拡張して、メタプロンプトの例を最適化し、パフォーマンスをさらに向上する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:22:39 GMT)
AI Scaling: From Up to Down and Out [23.7] 本稿では、Scaling Up、Scaling Down、Scaling Outを含む、AIスケーリングのための総合的なフレームワークを提案する。
モデルのスケールアップは固有のボトルネックに直面しているが、AIスケーリングの今後の軌道はスケールダウンとスケーリングアウトにある、と氏は主張する。
我々は、医療、スマートマニュファクチャリング、コンテンツ作成における変革的なアプリケーションについて検討し、AI Scalingがいかに効率、パーソナライゼーション、グローバル接続のブレークスルーを可能にするかを実証する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:14:00 GMT)
Mirror Descent Under Generalized Smoothness [23.5] 一般ノルムと双対のヘッセン項のノルムを測定する新しい$ell*$-smoothnessの概念を導入する。
我々は、古典的な滑らかさの下でのレートに一致するミラー・ディフレッシュ型アルゴリズムの収束性を確立する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:23:10 GMT)
The Great Contradiction Showdown: How Jailbreak and Stealth Wrestle in Vision-Language Models? [23.3] VLM(Vision-Language Models)は、様々なタスクにおいて顕著なパフォーマンスを達成したが、Jailbreak攻撃には弱いままである。
これらの攻撃の有効性とステルスネスの基本的なトレードオフを理解するための情報理論の枠組みを提供する。
本研究では,非スティルシージェイルブレイク攻撃を効果的に検出し,モデルロバスト性を大幅に向上させるアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:59:41 GMT)
Safety Alignment Depth in Large Language Models: A Markov Chain Perspective [23.3] 大規模言語モデル(LLM)は、ハイステークなシナリオでますます採用されているが、その安全性メカニズムは脆弱であることが多い。
本論文は,安全アライメントのための理想的な深度を同定する方法について,最初の理論的結果を提供する。
より広いアンサンブルがより浅いアライメントを補うことができることを示すために,アライメント深さとアンサンブル幅の基本的な相互作用を明らかにする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:43:35 GMT)
Task-Specific Adaptation with Restricted Model Access [23.1] モデルアーキテクチャと重みがまだ隠されている"Gray-box"微調整アプローチは、勾配伝播のみを可能にする。
モデル入力と出力の2つの軽量な学習可能なモジュールを用いて、新しいタスクに適応する、シンプルで効果的なフレームワークを新たに導入する。
我々は,テキスト画像アライメント,テキスト映像アライメント,スケッチ画像アライメントなどのベンチマークで,複数のバックボーンにまたがるアプローチを評価した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:29:44 GMT)
How Contaminated Is Your Benchmark? Quantifying Dataset Leakage in Large Language Models with Kernel Divergence [23.0] データセットはトレーニング前のコーパスと重複し、パフォーマンスメトリクスを膨らませ、モデル評価の信頼性を損なう。
我々は,サンプル埋め込みのカーネル類似度行列間のばらつきを計算し,データセット汚染を定量化する新しい手法であるKernel Divergence Score (KDS)を提案する。
KDSは汚染レベルとほぼ完璧な相関を示し、既存のベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:50:39 GMT)
What can large language models do for sustainable food? [22.7] 食品システムは、人為的な温室効果ガス排出量の3分の1を担っている。
本研究では,Large Language Models (LLMs) が食品生産の環境への影響を減らしうるかを検討した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:12:16 GMT)
On Computational Limits and Provably Efficient Criteria of Visual Autoregressive Models: A Fine-Grained Complexity Analysis [22.6] 我々は,Visual Autoregressive(mathsf/$)モデルの計算限界と効率基準を分析する。
より詳細な複雑性理論からStrong Exponential Time hypothesis(mathsfSETH$)を仮定すると、$mathsf/$モデルに対する準量子時間アルゴリズムは不可能である。
私たちの技術は、$mathsf/$フレームワークでスケーラブルで効率的な画像生成を推し進めることに重点を置いています。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:48:36 GMT)
Neural Algorithmic Reasoning for Hypergraphs with Looped Transformers [22.6] ループ変換器は、従来のグラフアルゴリズムでは例外的なアルゴリズム推論能力を示している。
ハイパーグラフアルゴリズムをシミュレートするために,Loop Transformerアーキテクチャのニューラルネットワーク推論機能を拡張する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:41:36 GMT)
Neurosymbolic AI for Travel Demand Prediction: Integrating Decision Tree Rules into Neural Networks [21.4] 本研究では、決定木(DT)に基づくシンボルルールとニューラルネットワーク(NN)を統合し、旅行需要を予測するニューロシンボリック人工知能(Neurosymbolic AI)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:10:31 GMT)
NeuroLM: A Universal Multi-task Foundation Model for Bridging the Gap between Language and EEG Signals [21.4] 我々は,脳波を外国語として扱うことで,Large Language Models (LLMs) の機能を活用する,最初のマルチタスク基盤モデルであるNeuroLMを提案する。
我々のアプローチは、脳波信号を離散的な神経トークンにエンコードするベクトル量子化された時間周波数予測を通じて、テキスト整列型ニューラルトークンを学習することから始まります。
我々は、LLMを具体化することによって、NeuroLMは命令チューニングによって単一のモデル内で多様な脳波タスクを統合できることを初めて実証した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:36:36 GMT)
A Comprehensive Analysis on LLM-based Node Classification Algorithms [21.1] 我々はLarge Language Models (LLMs) を用いたノード分類のための包括的でテストベッドを開発する。
10のデータセット、8つのLLMベースのアルゴリズム、3つの学習パラダイムを含み、新しいメソッドとデータセットで簡単に拡張できるように設計されている。
パフォーマンスに影響を与える重要な設定を決定するために、広範な実験、トレーニング、および2200以上のモデルの評価を行います。
その結果, LLM法は半教師付き環境で従来の手法を著しく上回り, その利点は教師付き環境ではごくわずかである,という8つの知見が得られた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:56:05 GMT)
Algorithmic Stability of Stochastic Gradient Descent with Momentum under Heavy-Tailed Noise [20.9] 重み付き雑音下での運動量(SGDm)を持つSGDの一般化境界を確立する。
二次損失関数に対して、SGDm は運動量や重みのあるテールの存在においてより悪い一般化を持つことを示す。
我々の知る限り、縮退した雑音を持つSDEにおいて、その種類の最初の結果となる一様時間離散化誤差境界を開発する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:25:48 GMT)
MedConv: Convolutions Beat Transformers on Long-Tailed Bone Density Prediction [20.9] 骨密度予測のための畳み込みモデルであるMedConvを導入する。
提案手法は従来の最先端手法に比べて精度が最大21%向上し,ROC AUCは20%向上した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:43:40 GMT)
Circuit Transformer: A Transformer That Preserves Logical Equivalence [20.8] 生成型ニューラルモデル "Circuit Transformer" を導入し,論理回路を与えられたブール関数と厳密に等価に生成する。
回路の特定の目的を最適化するためにマルコフ決定過程の定式化も提案されている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:55:55 GMT)
Avoiding $\mathbf{exp(R_{max})}$ scaling in RLHF through Preference-based Exploration [20.8] RLHF(Reinforcement Learning from Human Feedback)は,大規模言語モデル(LLM)アライメントのための重要な手法として登場した。
本稿では、オンラインRLHFの設定と、サンプル効率の向上に焦点をあてる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:40:04 GMT)
Diffusion-BBO: Diffusion-Based Inverse Modeling for Online Black-Box Optimization [20.5] オンラインブラックボックス最適化(BBO)は、ブラックボックスのオラクルをサンプル効率よく反復的にクエリすることで、目的関数を最適化することを目的としている。
Inverse surrogate modelとして条件付き拡散モデルを利用するサンプル効率の高いオンラインBBOフレームワークであるDiffusion-BBOを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:31:53 GMT)
EUGENE: Explainable Unsupervised Approximation of Graph Edit Distance with Generalized Edit Costs [20.4] グラフ編集距離(GED)は、グラフ間距離を測定するために好ましい。
GED計算はNPハードネスによって妨げられる。
教師なしの手法は、しばしば正確な近似を提供する際の課題に直面する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:10:11 GMT)
Biogeochemistry-Informed Neural Network (BINN) for Improving Accuracy of Model Prediction and Scientific Understanding of Soil Organic Carbon [20.2] バイオゲオケミカルインフォームドニューラルネットワーク(BINN)を開発し,ビッグデータから機械的知識を抽出する。
BINNは、米国全体で観測されたSOCプロファイル25,925から、土壌炭素循環を調節する6つの主要なプロセスを予測する。
BINNにおけるニューラルネットワークとプロセスベースモデルの統合により、計算効率は ProDA の50倍以上向上する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:02:42 GMT)
Your Image is Secretly the Last Frame of a Pseudo Video [20.2] 擬似ビデオを用いた他の生成モデルの改善の可能性を検討する。
具体的には、まず所定の画像生成モデルをビデオ生成モデルに拡張し、次に元の画像にデータ拡張を適用して構築した擬似ビデオ上でビデオ生成モデルを訓練する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:20:15 GMT)
FusionMamba: Dynamic Feature Enhancement for Multimodal Image Fusion with Mamba [19.8] FusionMamba はコンピュータビジョンタスクにおいて CNN や Vision Transformers (ViT) が直面する課題を克服することを目的としている。
このフレームワークは動的畳み込みとチャネルアテンション機構を統合することで、視覚的状態空間モデルMambaを改善している。
実験により、FusionMambaは様々なマルチモーダル画像融合タスクや下流実験で最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:57:05 GMT)
LLM-Powered Benchmark Factory: Reliable, Generic, and Efficient [19.7] 我々は,4次元と10の基準で構成された,自動的かつ偏りのない評価フレームワークを提案する。
本フレームワークでは,大規模言語モデル(LLM)を汎用ベンチマークジェネレータとして直接プロンプトする利点と弱点を解析する。
次に、識別された弱点に対処し、それらをBenchMakerとして統合する一連の方法を紹介します。
実験により、BenchMakerは、すべてのメトリクスにおいて、人による注釈付きベンチマークよりも優れた、あるいは同等のパフォーマンスを達成することが確認された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:36:01 GMT)
Huff-LLM: End-to-End Lossless Compression for Efficient LLM Inference [19.6] 大規模言語モデル(LLM)は、急速にサイズを拡大し続けている。
これにより、小さなエッジデバイス上でのLLMの動作の困難さが増した。
本稿では,LLM重みを圧縮形式で格納するHuff-LLMを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:23:42 GMT)
Understanding and Mitigating the High Computational Cost in Path Data Diffusion [19.6] 都市移動パターンを理解するためには,経路生成の問題が不可欠である。
最近の研究は、グラフ空間において拡散過程を明示的に考案し、最先端の性能を達成する。
グラフ空間の代わりに潜在空間で動作する潜在空間パス拡散モデルを考案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:02:36 GMT)
Benchmarking Large Language Models on Answering and Explaining Challenging Medical Questions [19.4] JAMAクリニカルチャレンジとメドブルレットという2つの新しいデータセットを構築した。
JAMAクリニカルチャレンジは、挑戦的な臨床ケースに基づく質問から成り、メドブルレットはシミュレートされた臨床質問から成り立っている。
各種のプロンプトを用いて2つのデータセット上で7つのLSMを評価する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:31:14 GMT)
Lipschitz Lifelong Monte Carlo Tree Search for Mastering Non-Stationary Tasks [19.4] モンテカルロ木探索(MCTS)を用いたLipschitz生涯計画のためのLiZeroについて述べる。
本稿では,ソースタスクから新しいタスクの探索・探索へ知識を伝達するための適応UCT(aUCT)の概念を提案する。
実験の結果,LiZeroは既存のMCTSや生涯学習ベースラインよりはるかに優れており,最適報酬への収束がはるかに速いことがわかった。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:45:20 GMT)
Towards Efficient Large Multimodal Model Serving [19.4] 大規模マルチモーダルモデル(LMM)は、テキスト、画像、ビデオ、オーディオなどの様々なモダリティの入力を同時に処理することができる。
これらのモデルは、複雑なアーキテクチャと異質なリソース要求のために大きな課題を生じさせる。
本稿では,各ステージ毎に独立したリソース割り当てと適応スケーリングを可能にする分離されたサービスアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:10:40 GMT)
Advanced Weakly-Supervised Formula Exploration for Neuro-Symbolic Mathematical Reasoning [18.9] 本稿では,ニューロシンボリック推論システムにおいて,問題入力や最終出力から弱い監督下で中間ラベルを探索する手法を提案する。
数学データセットに関する実験では,複数の側面から提案した提案の有効性を実証した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:34:36 GMT)
LLM Safety Alignment is Divergence Estimation in Disguise [18.3] その結果、アライメント法は、アライメント(優先または安全)とアンアライメント(非優先または有害)の間の分散推定器として機能することを示した。
理論的結果から着想を得た結果,いくつかのアライメント法は分離の点で他の方法よりも優れていることがわかった。
我々は、安全アライメントを高めるために、優先データセットよりもコンプライアンス拒否データセットを提唱する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:09:42 GMT)
Boosting Adversarial Robustness and Generalization with Structural Prior [18.0] 既存の辞書学習にインスパイアされた畳み込みニューラルネットワーク(CNN)は、敵の攻撃に対するセキュリティの誤った感覚を提供する。
本稿では,敵対的ロバスト性と一般化を著しく向上させる新しいResNetアーキテクチャであるElastic Dictionary Learning Networks (EDLNets)を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:15:10 GMT)
CAIMAN: Causal Action Influence Detection for Sample Efficient Loco-manipulation [17.9] 本稿では、疎タスク報酬のみに依存するロコ操作学習のための新しいフレームワークであるCAIMANを紹介する。
我々は,低レベルのロコモーションポリシとタスク関連速度コマンドを優先する高レベルのポリシーを組み合わせることによって,階層的な制御戦略を採用する。
フレームワークの優れたサンプル効率、多様な環境への適応性、そして微調整なしでハードウェアへの移行に成功したことを実証する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:16:53 GMT)
AACessTalk: Fostering Communication between Minimally Verbal Autistic Children and Parents with Contextual Guidance and Card Recommendation [17.3] タブレットベースのAI通信システムであるAACessTalkについて述べる。
MVAの子供と親との有意義な交換を促進する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:59:13 GMT)
Amuro and Char: Analyzing the Relationship between Pre-Training and Fine-Tuning of Large Language Models [17.3] 本研究では,複数の中間学習モデルチェックポイントの微調整による事前学習と微調整の関係について検討する。
18のデータセットで得られた結果は、事前学習が微調整後に発表される潜在的な方法でモデルを改善することを示唆している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:07:55 GMT)
DPBloomfilter: Securing Bloom Filters with Differential Privacy [17.0] DPBloomfilterは、古典的な微分プライバシーメカニズム、特にランダム応答技術をブルームフィルタに統合する。
標準のBloomフィルタと同じ複雑な動作で、堅牢なプライバシー保証を提供する。
これは、メンバーシップクエリ問題に対するBloomフィルタに対して、差分プライバシー保証を提供する最初の作業である。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:47:50 GMT)
OmniSR: Shadow Removal under Direct and Indirect Lighting [16.9] 間接照明からのシャドウ除去における重要な課題は、シャドウ除去ネットワークを訓練するためのシャドウフリー画像を取得することである。
直接的および間接的な照明下で影のない画像を生成するための新しいレンダリングパイプラインを提案する。
また,結合と注意機構を通じて意味的および幾何学的先行を明示的に統合する,革新的なシャドウ除去ネットワークを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:06:01 GMT)
Transferable Adversarial Face Attack with Text Controlled Attribute [16.7] 本稿では,自然言語で誘導される対人顔を生成するための新しいテキスト制御属性攻撃(TCA$2$)を提案する。
具体的には、カテゴリーレベルのパーソナル・ソフトマックス・ベクターを用いて、偽造攻撃を正確に誘導する。
2つの高解像度顔認証データセットの実験により、我々のTCA$2$メソッドは、高い転送性で自然なテキスト誘導対向顔を生成することができることを確認した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:47:16 GMT)
Distribution-aware Fairness Learning in Medical Image Segmentation From A Control-Theoretic Perspective [16.6] 分布認識型エキスパート混合法(dMoE)は最適制御理論に着想を得たものである。
医用画像のセグメンテーションにおけるdMoEの役割を明らかにする。
dMoEは2つの2Dベンチマークデータセットと1つの社内データセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 01:10:31 GMT)
Universal Abstraction: Harnessing Frontier Models to Structure Real-World Data at Scale [16.5] LLM(Large Language Models)を利用したゼロショット医療抽象化フレームワークUniMedAbstractor(UMA)を提案する。
UMAは、属性固有のトレーニングラベルやルールをキュレーションすることなく、その普遍的なプロンプトテンプレートを通じて、新しい属性にすばやくスケールすることができる。
UMAを腫瘍学の応用として評価し,がん患者の経過を示す15のキー属性に焦点をあてた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:31:54 GMT)
HintEval: A Comprehensive Framework for Hint Generation and Evaluation for Questions [16.4] HintEvalはPythonライブラリで、多様なデータセットにアクセスしやすくし、ヒントを生成して評価するための複数のアプローチを提供する。
参入障壁を減らすことで、HintEvalは、NLP/IRコミュニティ内のヒント生成と分析研究を促進するための大きな一歩を提供する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:07:18 GMT)
Predictable Reinforcement Learning Dynamics through Entropy Rate Minimization [16.3] 強化学習(RL)では、エージェントは予測可能な行動を示すインセンティブを持たない。
予測可能性を考慮したRL(predictability-Aware RL)と呼ばれるRLエージェントの予測可能な振る舞いを誘導する新しい手法を提案する。
提案手法は,標準割引報酬と負のエントロピー率の線形結合を最大化することにより,最適性を予測可能性と引き換えに行う。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:19:53 GMT)
Implicit Shape and Appearance Priors for Few-Shot Full Head Reconstruction [16.1] 本稿では,数発のフル3次元頭部再構成の問題点に対処する。
我々は、座標に基づく表現に先立って確率的形状と外観を組み込むことにより、これを達成した。
我々はH3DSデータセットを拡張し、60個の高解像度3Dフルヘッドスキャンと対応する画像とマスクを含む。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:38:15 GMT)
SAM-guided Pseudo Label Enhancement for Multi-modal 3D Semantic Segmentation [16.0] 自律運転や仮想現実(VR)などの応用には多モード3Dセマンティックセマンティックセマンティックセマンティクスが不可欠である
これらのモデルを現実のシナリオに効果的にデプロイするには、クロスドメイン適応技術を採用することが不可欠である。
擬似ラベルを用いた自己学習が3次元セマンティックセグメンテーションにおけるクロスドメイン適応の主要な手法として浮上している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:52:37 GMT)
General Coded Computing in a Probabilistic Straggler Regime [16.0] 近年,正確な計算を近似計算に置き換える一般計算関数のための新しい符号化計算方式が出現している。
本稿では、一般的な符号化コンピューティングの文脈において、各サーバが他のサーバとは独立して確率$p$のストラグラーになるという、現実的に重要なシナリオについて論じる。
既存の2つの一般符号計算スキームの平均近似誤差は、少なくとも$mathcalO(log3_frac1p(N)cdotN-3)$の速度で0に収束することを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:24:05 GMT)
Doped resonating valence bond states: How robust are the spin ice phases in 3D Rydberg arrays [15.7] Rydbergブロック効果は、局所的に制約された多体システムをシミュレートするための便利なプラットフォームを提供する。
ここでは、異なるQSIを含む可能な位相図を3次元リドベルクアレイで議論するため、同じ重み付け基底状態を持つ拡張ロクサー・キベルソン(RK)ハミルトニアンを構築した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:18:35 GMT)
HASSLE-free: A unified Framework for Sparse plus Low-Rank Matrix Decomposition for LLMs [15.6] 有望な圧縮スキームは、基礎モデルの密度重みをスパースと低ランク行列の和に分解することである。
本稿では,半構造化)スパースと低ランク行列分解のためのHASSLEフリーの統一フレームワークを設計する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:23:32 GMT)
WikiHint: A Human-Annotated Dataset for Hint Ranking and Generation [15.1] 最初に手動で構築したヒントデータセットWikiHintを紹介した。
次に,LLaMA-3.1 などのオープンソース LLM を微調整し,応答認識や応答に依存しない文脈でのヒント生成を行う。
我々は,ヒントの助けを借りずに質問に答える人間の被験者に対して,ヒントの有効性を評価する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:34:25 GMT)
Gaussian Approximation and Multiplier Bootstrap for Polyak-Ruppert Averaged Linear Stochastic Approximation with Applications to TD Learning [15.0] マルチプライアブートストラップに基づくパラメータ推定において,信頼区間の非漸近的妥当性を証明した。
本稿では,線形関数近似を用いた時間差学習の設定について述べる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:01:52 GMT)
Model Provenance Testing for Large Language Models [14.9] あるモデルが別のモデルから派生しているかどうかをテストするためのフレームワークを開発します。
我々のアプローチは、実世界のモデル導出がモデル出力のかなりの類似性を保っているというキーとなる観察に基づいている。
モデルに対するブラックボックスアクセスのみを用いて、関係のないモデルによって確立されたベースラインとモデル類似性を比較するために、複数の仮説テストを用いる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:39:37 GMT)
Self-Prompt SAM: Medical Image Segmentation via Automatic Prompt SAM Adaptation [14.8] Segment Anything Model (SAM)は印象的なゼロショット性能を示した。
本稿では,医療画像セグメンテーションのための新しいセルフプロンプトSAM適応フレームワーク,Self-Prompt-SAMを提案する。
本手法は,AMOS2022ではnUNetが2.3%,ACDCでは1.6%,Synapseデータセットでは0.5%に向上する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:42:24 GMT)
From Uncertainty to Trust: Kernel Dropout for AI-Powered Medical Predictions [14.7] 信頼に値する信頼を持ったAI駆動型医療予測は、医療アプリケーションにおけるAIの責任ある使用を保証するために不可欠である。
本稿では,これらの課題に対処する新しいアプローチを提案し,カーネルモデルを用いたベイジアンモンテカルロ・ドロップアウトモデルを提案する。
限られたデータであっても、信頼性が大幅に向上し、AI駆動型医療予測の信頼構築に向けた有望なステップを提供します。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:54:42 GMT)
TabTreeFormer: Tabular Data Generation Using Hybrid Tree-Transformer [14.3] TabTreeFormerは、ツリーベースのモデルを組み込んだハイブリッドトランスフォーマーアーキテクチャである。
マルチモーダル連続分布を捉えるための二重量子化トークン化器を提案する。
実験の結果,TabTreeFormerは優れた忠実度,実用性,プライバシ,効率性を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:05:51 GMT)
AGNNCert: Defending Graph Neural Networks against Arbitrary Perturbations with Deterministic Certification [14.3] グラフニューラルネットワーク(GNN)は敵の摂動に弱い。
AGNNCertは、任意の(エッジ、ノード、ノードの特徴)摂動に対するGNNの最初の認証された防御である。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:56:42 GMT)
Efficient Fine-Grained Guidance for Diffusion-Based Symbolic Music Generation [14.2] 拡散モデルにFGG(Fined Guidance)アプローチを導入する。
FGGは拡散モデルをガイドし、専門家作曲家の制御と意図とより密に整合した音楽を生成する。
このアプローチは拡散モデルにより、即興性やインタラクティブな音楽生成といった高度な応用に優れる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:01:07 GMT)
Psychometric-Based Evaluation for Theorem Proving with Large Language Models [14.1] 本研究では,大規模言語モデル(LLM)を用いた定理証明のための心理測定に基づく評価手法を提案する。
難易度と差別度でデータセットにアノテートする計量計算法を提案し,特に,各定理をミニF2Fデータセットにアノテートし,LLMの性能に応じて様々な難易度に分類する。
我々は,注釈付きメトリクスとLLMのリアルタイム性能に基づいて,テストに最適な定理を動的に選択する適応評価法を設計する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:00:22 GMT)
Make a Donut: Hierarchical EMD-Space Planning for Zero-Shot Deformable Manipulation with Tools [14.1] 本研究では,複雑な長期タスクに対処可能な実証自由階層型計画手法を提案する。
我々は,大規模言語モデル (LLMs) を用いて,特定のタスクに対応する高レベルステージ・バイ・ステージ・プランを記述している。
我々は、実世界のロボットプラットフォームの実験的な試行で、我々のアプローチをさらに裏付ける。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:40:51 GMT)
Learned Bayesian Cramér-Rao Bound for Unknown Measurement Models Using Score Neural Networks [13.9] 本稿では,事前分布と測定分布の両方を学習する完全学習型ベイズクラム・ラオ境界(LBCRB)を提案する。
そこで本研究では,そのような知識をニューラルネットワークに簡単に組み込むことのできる物理符号化スコアニューラルネットワークを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:00:40 GMT)
DesCLIP: Robust Continual Adaptation via General Attribute Descriptions for Pretrained Vision-Language Models [13.9] 視覚言語モデル(VLM)の継続的な適応は、下流タスクやデータセットの拡張に漸進的に適応するために、モーダルな事前訓練された知識を活用することに焦点を当てている。
既存の研究はしばしば、一般的な知識と専門知識の潜伏した関係を見越して、下流のタスクで特定のクラステキストと視覚的特徴を結びつけることに焦点を当てている。
汎用属性(GA)記述を利用して,特定のクラスオブジェクトの理解を導くDesCLIPを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 01:06:02 GMT)
Guidance Source Matters: How Guidance from AI, Expert, or a Group of Analysts Impacts Visual Data Preparation and Analysis [13.8] ユーザがすべてのガイダンスソースを,(i)AI,(ii)人間専門家,(iii)人間アナリストのグループという3つのソースに特に関心を持って,同等に捉えているかどうかを問う。
ベンチマークとして,第4の情報源である (iv) 未配布のガイダンスを考える。
ガイダンスの源泉はユーザにとって重要だが,その見識にマッチするものではない。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:59:02 GMT)
Do LLMs Dream of Ontologies? [13.8] 大規模モデル言語(LLM)は、様々な自然言語処理タスクにまたがる顕著な記憶を実証している。
本稿では,LLMが公開リソースから概念識別子(ID)-ラベル関連を正しく再現する範囲について検討する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:51:02 GMT)
GraphSOS: Graph Sampling and Order Selection to Help LLMs Understand Graphs Better [13.7] GraphSOSは、グラフデータを自然言語テキストに変換する新しいフレームワークである。
Order Selector Moduleはグラフの適切なシリアライズ順序を保証するもので、Subgraph Smpling Moduleはより良い推論のためにより良い構造を持つサブグラフをサンプリングする。
ノード分類とグラフ問合せのための複数のデータセットの実験は、GraphSOSがグラフタスクにおけるLLMのパフォーマンスと能力を改善することを示した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:55:25 GMT)
HuViDPO:Enhancing Video Generation through Direct Preference Optimization for Human-Centric Alignment [13.3] 本稿では,テキスト・ツー・ビデオ(T2V)タスクにDPO(Direct Preference Optimization)の戦略を導入する。
既存のT2V生成手法では、人間の好みで生成されたビデオのアライメントをガイドする、正確な損失関数を備えた十分に整形されたパイプラインが欠如している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:55:42 GMT)
FIRE: Flexible Integration of Data Quality Ratings for Effective Pre-Training [13.2] FIREは、複数のデータ品質レーダを統合するフレキシブルなフレームワークである。
高品質のデータポイントの選択を反復的に洗練する。
SlimPajamaデータセットの実験では、FIREは他の選択方法よりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:52:26 GMT)
Automated Extraction of Spatio-Semantic Graphs for Identifying Cognitive Impairment [13.0] 画像記述中の視覚的意味経路を自動推定する手法を提案する。
実験により、視覚的意味経路の自動的特徴付けは、障害のある話者と障害のない話者を効果的に区別できることが示されている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:25:19 GMT)
Representations Shape Weak-to-Strong Generalization: Theoretical Insights and Empirical Predictions [13.0] W2SG(Wak-to-Strong Generalization)は、人間が将来超人的な知性をどう導くかを理解するための重要なアナロジーである。
We show that W2SG can be characterized using kernels from the principal component of weak and strong model' internal representations。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 01:11:51 GMT)
Language Models Encode Numbers Using Digit Representations in Base 10 [12.9] 本稿では,大規模言語モデル (LLM) が単純な数値問題を扱う際に誤りを犯すことを示す。
LLMは内部的に、基数10の個々の円の表現を持つ数を表す。
この数値表現は、数値推論を含むタスクにおけるモデルの誤りパターンに光を当てる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:27:54 GMT)
Continuity-Preserving Convolutional Autoencoders for Learning Continuous Latent Dynamical Models from Images [12.8] 連続力学系は多くの科学と工学の分野の基礎となっている。
本稿では,連続潜時状態とそれに対応する連続潜時動的モデルを離散画像フレームから学習するための連続保存畳み込みオートエンコーダ(CpAE)を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:31:58 GMT)
DeepGate4: Efficient and Effective Representation Learning for Circuit Design at Scale [12.7] 本稿では,大規模回路のためのスケーラブルで効率的なグラフトランスであるDeepGate4を紹介する。
DeepGate4は最先端の手法をはるかに上回り、次世代モデルよりも15.5%の性能向上を実現している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:25:34 GMT)
Gradient Alignment in Physics-informed Neural Networks: A Second-Order Optimization Perspective [12.7] 損失項間の方向性衝突に対処するための理論的および実践的なアプローチを提案する。
これらの矛盾が一階法にどのように制限されているかを示し、二階最適化が自然にそれらを解決することを示す。
我々は,最近提案された準ニュートン法であるSOAPが,ヘッセンのプレコンディショナーを効率的に近似していることを証明する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:21:45 GMT)
Tight relations and equivalences between smooth relative entropies [12.7] 相対エントロピーは情報スペクトルの発散に基づく滑らかな最大相対エントロピーの変種と等価であることを示す。
また,行列幾何学的手法に基づく改良された証明手法と,緩やかな測定補題も導入する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:54:36 GMT)
Federated Generalised Variational Inference: A Robust Probabilistic Federated Learning Framework [12.5] FedGVIは確率的フェデレートラーニング(FL)フレームワークで、事前およびおそらく誤特定に対して確実に堅牢である。
固定点収束、空洞分布の最適性、証明可能なロバスト性の観点から理論的解析を行う。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:39:37 GMT)
VL-ICL Bench: The Devil in the Details of Multimodal In-Context Learning [12.5] 大規模言語モデル(LLM)は、創発的な文脈内学習(ICL)を示すことで有名である。
本研究では,マルチモーダルインコンテキスト学習のためのベンチマークVL-ICL Benchを提案する。
我々は,このベンチマークスイートに対して最先端のVLLMの能力を評価する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:18:38 GMT)
Tailoring Generative AI Chatbots for Multiethnic Communities in Disaster Preparedness Communication: Extending the CASA Paradigm [12.4] 本研究は, GPT-4を利用した生成人工知能(GenAI)チャットボットのプロトタイプを開発した最初のものである。
フロリダ州の黒人,ヒスパニック系およびコーカサス系住民411名を対象に実験を行った。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:43:34 GMT)
Task-agnostic Pre-training and Task-guided Fine-tuning for Versatile Diffusion Planner [12.4] 拡散モデルはマルチタスクの軌跡をモデル化する能力を示した。
既存のマルチタスクプランナやポリシーは、通常、マルチタスクの模倣によるタスク固有のデモンストレーションや、タスク固有の報酬ラベルを必要とする。
本稿では,タスク非依存の準最適軌道を含む大規模劣等データを活用する多目的拡散プランナを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:33:28 GMT)
An Event-Based Perception Pipeline for a Table Tennis Robot [12.1] 本稿では,イベントベースカメラのみを用いた卓球ロボットのための,初めてのリアルタイム認識パイプラインを提案する。
フレームベースのパイプラインと比較して、イベントベースの知覚パイプラインは更新率が高く、桁違いに高いことを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:56:37 GMT)
Evaluating Sample Utility for Data Selection by Mimicking Model Weights [12.1] ファンデーションモデルは、しばしばノイズ、バイアス、無関係な情報を含む大規模なWebcrawledデータセットに基づいてトレーニングされている。
我々は,新しいデータ品質指標であるMimic Scoreを用いて,効率的なモデルベースアプローチを提案する。
学習のためのサンプルを優先し,効率的なフィルタを作成し,データ選択を自動化するフレームワークであるGrad-Mimicを開発した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:34:01 GMT)
Small Languages, Big Models: A Study of Continual Training on Languages of Norway [11.5] 大きな言語モデルのトレーニングには大量のデータが必要です。
本稿では,下流の性能を大幅に向上させる新しい3段階連続訓練手法を提案する。
ノルウェーのBokmral、Nynorsk、Northern S'amiに14億のパラメータを持つ新しい生成言語モデル(NorMistral-11B)をリリースする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:58:48 GMT)
RTBAgent: A LLM-based Agent System for Real-Time Bidding [11.5] リアルタイム入札(Real-Time Bidding, RTB)は、広告主がインプレッション機会に即座に競争入札を行うことを可能にする。
これらの課題に対処するため、RTBAgentは大規模言語モデル(LLM)に基づく最初のRTBエージェントシステムとして提案されている。
本稿では,RTBAgentが過去の決定やトランザクション記録をレビューできる2段階の意思決定プロセスとマルチメモリ検索機構を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:10:15 GMT)
CULTURE3D: Cultural Landmarks and Terrain Dataset for 3D Applications [11.5] 世界中から撮影された高解像度画像を用いた大規模きめ細粒度データセットを提案する。
われわれのデータセットはドローンで撮影した空中画像を使って構築されており、現実世界のサイトレイアウトや建築構造をより正確に把握することができる。
このデータセットは、アーキテクチャ再構築から仮想観光まで、さまざまな3Dアプリケーションをサポートするマルチモーダルデータとのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:08:46 GMT)
TrojanTime: Backdoor Attacks on Time Series Classification [11.2] 時系列分類(TSC)は、バックドア攻撃に対して非常に脆弱である。
本稿では,新しい2段階学習アルゴリズムであるTrojanTimeを提案する。
クリーンな精度を維持しながら、TrojanTimeがバックドアアタックを実行することを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:24:24 GMT)
VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning [11.1] 低消費電力ロボットのための視覚言語ナビゲーション(VL-Nav)システムを提案する。
ロボットを誘導する単一画像レベルの特徴類似性に依存する従来の手法とは異なり、視覚ビジョン言語(HVL)を導入する。
ピクセル単位の視覚言語機能と探索を組み合わせることで、人間に指示されたインスタンスへの効率的なナビゲーションを堅牢に実現する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:44:15 GMT)
RSNet: A Light Framework for The Detection of Multi-scale Remote Sensing Targets [10.7] RSNetは、SAR画像における船舶検出を強化する軽量フレームワークである。
Waveletpool-ContextGuided (WCG)は、グローバルなコンテキスト理解を導くバックボーンである。
ウェーブレットプール・スターフュージョン (WSF) は、残っているウェーブレット要素の乗算構造を用いてネックとして導入された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:05:48 GMT)
Dual Alignment Maximin Optimization for Offline Model-based RL [10.0] オフラインの強化剤は、合成から現実の分布ミスマッチのため、重要な展開課題に直面します。
本稿では、まずモデル信頼性から、期待したリターンを最適化しながらポリシーの相違に焦点を移し、その後、自己整合的に合成データを組み込む。
これは、モデル環境ポリシーの一貫性と、合成およびデータのオフラインを保証する統一されたフレームワークである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:47:35 GMT)
Down with the Hierarchy: The 'H' in HNSW Stands for "Hubs" [9.9] 平坦なナビゲート可能な小世界グラフは、高次元データセットにおけるHNSWの利点をすべて保持していることを示す。
我々はさらに一歩進んで、HNSWの階層構造が高次元において何の利益も与えない理由について研究する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:25:13 GMT)
FedHPD: Heterogeneous Federated Reinforcement Learning via Policy Distillation [9.7] 異種エージェントを用いたブラックボックス設定におけるフェデレーション強化学習(FedRL)について検討する。
FedHPDは、様々な強化学習ベンチマークタスクで大幅に改善されている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:44:08 GMT)
LIBRA: Measuring Bias of Large Language Model from a Local Context [9.6] 大規模言語モデル(LLM)は、かなり高度な自然言語処理アプリケーションを持っている。
しかし、彼らの普及した利用は、特定の社会集団の実用性や害を減少させる固有のバイアスに関する懸念を提起する。
本研究は,これらの制約を,バイアス測定のためのローカル統合バイアス認識評価フレームワーク(LIBRA)を用いて解決する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:24:57 GMT)
Statistical and Computational Guarantees of Kernel Max-Sliced Wasserstein Distances [9.6] カーネル最大スライシング (KMS) ワッサーシュタイン距離は、この目的のために開発された。
KMS の 2$-Wasserstein 距離の計算は NP-hard であることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:27:13 GMT)
VBIM-Net: Variational Born Iterative Network for Inverse Scattering Problems [9.4] フルウェーブ逆散乱問題の解法として,新しい変分ボルン反復ネットワーク,すなわちV BIM-Netを提案する。
提案したV BIM-Netは変動ボルン反復法における全電界とコントラストの交互更新をエミュレートする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:24:06 GMT)
CycleGuardian: A Framework for Automatic RespiratorySound classification Based on Improved Deep clustering and Contrastive Learning [9.2] 早期の呼吸器および肺疾患の診断において,聴診は重要な役割を担っている。
既存の最先端モデルは過剰なパラメータサイズに悩まされており、リソース制約のあるモバイルプラットフォームへのデプロイを妨げている。
改良されたディープクラスタリングとコントラスト学習に基づくフレームワークを提案する。
われわれはこのネットワークをAndroidデバイスに展開し、総合的なインテリジェントな呼吸音聴取システムを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:56:47 GMT)
Zeroth-order Informed Fine-Tuning for Diffusion Model: A Recursive Likelihood Ratio Optimizer [9.2] 確率拡散モデル(DM)は視覚生成のための強力なフレームワークである。
DMを効率的に調整する方法は重要な課題である。
本稿では,DMのための第0次情報調整パラダイムであるRecursive Likelihood Ratio (RLR)を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:00:26 GMT)
The Meta-Representation Hypothesis [9.0] 本研究では,高次元観察によるメタ表現の学習がエージェントの一般化能力を高めることを示す。
さらに、エージェント間の深層相互学習(DML)は、タスクの根底にある本質を捉えるメタ表現を学習するのに役立つと仮定する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:13:38 GMT)
ALMANACS: A Simulatability Benchmark for Language Model Explainability [9.0] 言語モデル説明可能性ベンチマークであるALMANACSを提案する。
AlMANACSは、シミュラビリティに関する説明可能性の手法、すなわち、説明が新しい入力の振る舞い予測をいかに改善するかをスコアする。
ALMANACSは、他の言語モデルを使用して説明に基づいて振る舞いを予測することで、完全に自動化されたベンチマークである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:16:25 GMT)
Learning-Based TSP-Solvers Tend to Be Overly Greedy [8.8] 本研究では, ランダムに生成した学習型解法の性質を検証するため, 最近傍密度と呼ばれる統計的尺度を構築した。
学習に基づく解法の性能が、そのような拡張データに大きく依存していることを検証する。
要するに、学習ベースのTSPソルバの限界は、過度に欲求的になりがちであり、AIを活用した最適化ソルバに深く影響する可能性がある。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:06:13 GMT)
Detecting and Understanding the Promotion of Illicit Goods and Services on Twitter [8.8] この研究は、ポスト・オブ・イリシット・プロモーション(PIP)を検知・解析する複数の機械学習ツールによって実現されている。
PIPがTwitter上で普及しているのを観察し、YouTube、Facebook、TikTokを含む他の3つの人気のあるOSNを広範囲に可視化した。
例えば、当社のPIPハンターをTwitterプラットフォームに6ヶ月間適用することで、1200万の異なるPIPが発見されました。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:44:39 GMT)
Fruit Fly Classification (Diptera: Tephritidae) in Images, Applying Transfer Learning [8.7] 本研究では,2種の果実ハエの自動分類のための移動学習モデルを開発した。
Inception-v3は、Anastrepha fraterculusとCeratitis capitataを分類するための効果的で複製可能なアプローチである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:16:04 GMT)
Efficient Language Modeling for Low-Resource Settings with Hybrid RNN-Transformer Architectures [8.4] トランスフォーマーベースの言語モデルは、最近テキスト生成における活発な研究の最前線にある。
これらのモデルの進歩は、数十億のパラメータ数とペタフロップ/秒単位の計算要求によって、禁止的なトレーニングコストの価格で実現されている。
注目層をフィードフォワードと準リカレントニューラルネットワーク層に選択的に置き換えることで,低データ方式におけるモデル性能向上のためのトランスフォーマーアーキテクチャについて検討する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 01:05:09 GMT)
Pairwise Judgment Formulation for Semantic Embedding Model in Web Search [8.3] 本研究は,SEMの相互判定を行うための幅広い戦略について,より詳細な調査を行う。
興味深い(おそらく驚くべき)発見は、従来のペアワイド・ラーニング・トゥ・ランドの分野において、従来のペアワイド・判断戦略がSEMのトレーニングに必ずしも有効ではないことを示している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:54:20 GMT)
Blink of an eye: a simple theory for feature localization in generative models [8.3] 大型言語モデル(LLM)は、目の瞬きにおいて望ましくない、予期しない振る舞いを示す。
この現象は自己回帰モデルに特有のものではなく、拡散モデルでは、最終的な出力の重要な特徴は生成過程の狭いクリティカルウィンドウ'で決定される。
生成プロセスがモデル化した分布のサブポピュレーションにローカライズされると、一般化して現れることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:19:53 GMT)
The Query/Hit Model for Sequential Hypothesis Testing [8.2] この作業では、Query/Hit(Q/H)学習モデルを紹介します。
1つのエージェントであるAliceはストリーミングソースにアクセスでき、もう1つのエージェントであるBobはソースに直接アクセスできない。
Bob氏はソースシンボルのシーケンス(クエリ)を送信し、Alice氏はソースストリーム(hits)に各クエリが現れるまで待ち時間で応答する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:23:28 GMT)
Optimization for Neural Operators can Benefit from Width [8.2] 本稿では、勾配降下(GD)に基づく最適化のための統一的なフレームワークを提案し、それをDONとFNOの収束保証を確立するために適用する。
これらのニューラル演算子の損失は、GDによる損失値の減少を保証する2つの条件 – 強い凸性(RSC)と滑らか性 – を満たすことを示す。
この理論から生じる1つの利点は、より広いネットワークがDONとFNOの両方に対してより良い最適化収束をもたらすことである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:33:00 GMT)
Emotion Recognition and Generation: A Comprehensive Review of Face, Speech, and Text Modalities [8.1] 我々は、顔、声、テキストのモダリティにまたがる感情認識と生成の基礎となる原則を紹介する。
本稿では,評価指標,比較分析,現状の限界について論じ,この分野の研究者が直面している課題に光を当てる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:11:19 GMT)
"Would You Want an AI Tutor?" Understanding Stakeholder Perceptions of LLM-based Chatbots in the Classroom [7.9] LLM(Large Language Models)は、教育を含む社会のあらゆる部分で急速に普及した。
教室でLLMSに直接影響を受ける人々の認識を理解することは、AIの責任ある使用を確実にするために不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:50:08 GMT)
An MDP Model for Censoring in Harvesting Sensors: Optimal and Approximated Solutions [7.8] 省エネセンサにおける省エネ伝送のための新しい検閲ポリシーを提案する。
メッセージは、その重要性がバッテリレベルに依存する閾値を超える場合にのみ送信される。
バッテリーモデル上の一定の条件下では、最適な検閲ポリシーが重要性のしきい値のしきい値であることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:22:21 GMT)
FedRIR: Rethinking Information Representation in Federated Learning [7.8] ネットワークエッジのモバイルおよびWeb-of-Things(WoT)デバイスは、機械学習アプリケーションのために膨大な量のデータを生成する。
ネットワークエッジのモバイルおよびWeb-of-Things(WoT)デバイスは、機械学習アプリケーションのために膨大な量のデータを生成する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:17:29 GMT)
Homomorphism Counts as Structural Encodings for Graph Learning [7.7] Graph Transformerは、よく知られたTransformerアーキテクチャをグラフドメインに拡張する、人気のあるニューラルネットワークである。
グラフ準同型をカウントした柔軟で強力な構造的符号化フレームワークとして、$textitmotif Structure encoding$ (MoSE)を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:10:33 GMT)
STAF: Sinusoidal Trainable Activation Functions for Implicit Neural Representation [7.3] Inlicit Neural Representations (INR) は、連続的な信号をモデリングするための強力なフレームワークとして登場した。
ReLUベースのネットワークのスペクトルバイアスは、十分に確立された制限であり、ターゲット信号の微細な詳細を捕捉する能力を制限する。
Sinusoidal Trainable Function Activation (STAF)について紹介する。
STAFは本質的に周波数成分を変調し、自己適応型スペクトル学習を可能にする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:29:33 GMT)
Large Language Models as Markov Chains [7.1] 有限状態空間上で定義された自己回帰変換言語モデルとマルコフ連鎖の同値性を描く。
以上の結果とLLMで観察された病理行動との関連性を検討した。
最新のLlamaとGemmaのモデル群による実験は、我々の理論が実際にそれらの振る舞いを正しく捉えていることを示している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:57:01 GMT)
EffoVPR: Effective Foundation Model Utilization for Visual Place Recognition [7.0] 本稿では,視覚的位置認識のための基礎モデルの可能性を活用するための効果的なアプローチを提案する。
ゼロショット設定であっても,自己注意層から抽出した特徴がVPRの強力な再ランカとして機能することを示す。
また,本手法は高いロバスト性および一般化を実証し,新しい最先端性能の設定を行う。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:46:41 GMT)
Artificial Human Intelligence: The role of Humans in the Development of Next Generation AI [6.9] 我々は、人間と機械の知能の相互作用を探求し、人間が知能システムを開発する上で果たす重要な役割に焦点を当てる。
我々は, 次世代開発に向けた人間中心の方向性を提案するために, 共生設計の利点を活かして, 今後の展望を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:33:49 GMT)
Zero-Shot Warning Generation for Misinformative Multimodal Content [6.8] 真正な画像と偽のテキストをペアリングするアウト・オブ・コンテクストの誤報は、特に詐欺的であり、容易に聴衆を誤解させる。
本稿では,マルチモーダルな誤情報を検出するモデルを提案する。
また、コンテキスト化された警告を生成するための2目的ゼロショット学習タスクを導入し、ユーザ理解の自動化と強化を実現した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:18:05 GMT)
$SpikePack$: Enhanced Information Flow in Spiking Neural Networks with High Hardware Compatibility [6.6] スパイキングニューラルネットワーク(SNN)は、エネルギー効率が高く生物学的にインスパイアされたコンピューティングを約束する。
我々は,膜電位リセットや漏洩結合といった重要な機能を保ちながら,透過損失を低減するために設計されたニューロンモデルである$SpikePack$を紹介した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:05:02 GMT)
Language Models Use Trigonometry to Do Addition [6.6] 3つの大きな言語モデル (LLM) がどのように加算されるかを示す。
LLMはヘリックス上の数値を表し、このヘリックスを演算して加算を行う。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:55:26 GMT)
Selective Response Strategies for GenAI [6.3] Generative AI(GenAI)の台頭は、Stack Overflowのような人間ベースのフォーラムに大きな影響を与えている。
これにより負のフィードバックループが発生し、GenAIシステムの開発を妨げる。
選択応答がデータ生成プロセスに複合的影響を与える可能性があることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:27:02 GMT)
Reliable Pseudo-labeling via Optimal Transport with Attention for Short Text Clustering [6.2] 本稿では,textbfOptimal textbfTransportを経由したReliable textbfPseudo-labelingという,新しいテキストクラスタリングフレームワークを提案する。
textbfPOTAはクラスタリングのための識別表現学習を支援するために、信頼できる擬似ラベルを生成する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:21:32 GMT)
From Compliance to Exploitation: Jailbreak Prompt Attacks on Multimodal LLMs [6.2] マルチモーダル大言語モデル(LLM)に対する最初の音声ベースのジェイルブレイク攻撃を導入する。
本稿では,不許可なプロンプトを,良心的かつ物語駆動的なプロンプトによって側面に配置する,新たな戦略を提案する。
我々は、Flank Attackが最先端のLLMを操作でき、不整合および禁止出力を生成することを実証した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:05:08 GMT)
Cybersecurity Threats to Power Grid Operations from the Demand-Side Response Ecosystem [6.1] この記事では、IoT対応のエナジースマートアプライアンス(ESA)から電力グリッド操作へのサイバーセキュリティの脅威に焦点を当てる。
本報告では, 需要側の脅威について, (i) ESAの脆弱性の概要と, 需要側の対応エコシステムからの幅広いリスク, (ii) 電力グリッド運用に対する攻撃影響に影響を及ぼす重要な要因, (iii) 電力グリッドのサイバー物理的レジリエンスを改善するための対策など, 詳細な分析を行う。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:53:36 GMT)
On Creating A Brain-To-Text Decoder [6.1] 本稿では,ヒト脳活動のデコードに生脳波信号(EEG)を適用した。
この調査は、音声生成に関連する神経信号の解読における脳-コンピュータインタフェース(BCI)の有効性を特に精査している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:32:41 GMT)
Customizable LLM-Powered Chatbot for Behavioral Science Research [6.1] LLM(Large Language Models)は、人間のコミュニケーションによく似たテキストを生成する。
チャットボットの潜在的な実用性は、特に研究の文脈において、従来のアプリケーションを超越している。
本研究では,行動科学研究を支援するためのCLPC(Customizable LLM-Powered)システムを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:04:51 GMT)
Fidelity Strange Correlators for Average Symmetry-Protected Topological Phases [6.0] 平均対称性-検出された位相位相は、障害やデコヒーレンスによって影響を受ける量子系に拡張される。
境界のない単一バルク密度行列上で直接動作する奇妙な相関器(FSC)を導入する。
我々の研究は、オープン量子系におけるこれらの興味深いトポロジカルな物質相を特定するための基礎となる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:25:43 GMT)
Economy Watchers Survey Provides Datasets and Tasks for Japanese Financial Domain [5.9] 英語と一般ドメインでの自然言語処理タスクは広く利用可能である。
しかし、英語以外の言語や金融分野でのタスクは少ない。
本研究では,日本中央庁が公表したデータを用いて,大規模データセットを2つ作成する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:25:35 GMT)
LVLM-COUNT: Enhancing the Counting Ability of Large Vision-Language Models [5.9] 大規模視覚言語モデル(LVLM)は、訓練中に遭遇する物体の数を超えるタスクを数えるのに苦労する。
分割・対数手法を用いてLVLMのカウント能力を向上し、カウント問題をサブカウントタスクに分割する。
提案手法は,様々なデータセットやベンチマークにおけるLVLMのカウント能力を向上させる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:49:25 GMT)
scGSDR: Harnessing Gene Semantics for Single-Cell Pharmacological Profiling [5.8] scGSDRは、細胞状態と遺伝子シグナル伝達経路の知識に基づく2つの計算パイプラインを統合するモデルである。
scGSDRは、遺伝子セマンティクスを組み込んで予測性能を高め、解釈可能性モジュールを使用する。
モデルはシングルドラッグの予測からドラッグの組み合わせを含むシナリオまで拡張された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:43:20 GMT)
PhiP-G: Physics-Guided Text-to-3D Compositional Scene Generation [5.6] 合成シーン生成のための新しいフレームワークPhiP-Gを提案する。
PhiP-Gは、世界モデルに基づくレイアウトガイダンスと生成技術をシームレスに統合する。
実験により、PhiP-Gは合成シーンの生成品質と物理的合理性を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:47:03 GMT)
Aligning Brain Activity with Advanced Transformer Models: Exploring the Role of Punctuation in Semantic Processing [5.4] 神経活動データに対して,RoBERTa,DistiliBERT,ALBERT,ELECTRAの4種類の先進トランスモデルを評価した。
以上の結果より,RoBERTaは神経活動と最もよく一致し,正確性はBERTを上回った。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:45:03 GMT)
BEEM: Boosting Performance of Early Exit DNNs using Multi-Exit Classifiers as Experts [5.4] ディープニューラルネットワーク(DNN)における推論遅延を低減する手段として、初期のExitテクニックが登場した。
本稿では,出口分類器を専門家のBEEMとして扱い,信頼性スコアを集計する新たな意思決定基準を提案する。
提案手法は最先端のEE手法の性能を向上し,1.5倍から2.1倍の高速化を実現している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:35:19 GMT)
Minimax Optimality of Classical Scaling Under General Noise Conditions [5.1] 我々は、幅広い種類のノイズモデルの下で古典的なスケーリングの一貫性を確立する。
古典的スケーリングの収束率を導出し、一致するミニマックス下界を確立する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:35:52 GMT)
MM-IQ: Benchmarking Human-Like Abstraction and Reasoning in Multimodal Models [5.0] MM-IQは、8つの異なる推論パラダイムにまたがる2,710個の精巧にキュレートされたテスト項目からなる総合的な評価フレームワークである。
最先端のアーキテクチャでさえ、ランダムなチャンスに対してわずかに優れたパフォーマンスしか達成できません。
この性能は、基本的な人間の推論能力の近似において、現在のマルチモーダルシステムの不十分さを浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:12:03 GMT)
Cooperative Cruising: Reinforcement Learning-Based Time-Headway Control for Increased Traffic Efficiency [5.0] 本稿では,高速道路の交通効率を人的交通と比較して初めて向上させる新しいAIシステムを提案する。
私たちのアプローチの核心は、自動車両にタイムヘッドを通信する強化学習ベースのコントローラです。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:49:21 GMT)
Gaussian quantum data hiding [5.0] 量子データ隠蔽は、量子状態のペアに隠された古典的ビットをエンコードするが、これは特定の測定セットを用いて区別することが難しい。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:46:00 GMT)
LEAD: Large Foundation Model for EEG-Based Alzheimer's Disease Detection [4.9] 脳波を用いたアルツハイマー病検出のための基礎モデルLEADを提案する。
私たちは11のEEGデータセットでモデルを事前トレーニングし、5つのADデータセットで微調整します。
サンプルレベルではF1スコアが9.86%増加し,被験者レベルでは9.31%向上したAD検出性能を示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:19:35 GMT)
EmoTalkingGaussian: Continuous Emotion-conditioned Talking Head Synthesis [4.9] 3Dガウススプラッティングに基づく音声ヘッドは,高忠実度画像をリアルタイムの推論速度でレンダリングする能力に注目されている。
そこで我々は, 唇型感情顔生成装置を提案し, エモガウスモデルの訓練に利用した。
我々はEmoGaussianを公開ビデオで実験し、画像品質の点で最先端技術よりも優れた結果を得た。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:01:54 GMT)
Characterizing Model Collapse in Large Language Models Using Semantic Networks and Next-Token Probability [4.8] 合成コンテンツがWebに浸透するにつれて、生成的AIモデルはオートファジーなプロセスを経験し、独自の出力を使って微調整される。
これはモデル崩壊と呼ばれる現象につながり、世代を重ねて生成するAIモデルの性能と多様性を低下させる。
近年の研究では、様々な生成AIモデルとデータタイプにまたがるモデル崩壊の出現について検討されている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:40:09 GMT)
RotateKV: Accurate and Robust 2-Bit KV Cache Quantization for LLMs via Outlier-Aware Adaptive Rotations [4.8] キーバリュー(KV)キャッシュは、過去のKVの再計算を避けることにより、効率的な大言語モデル(LLM)推論を容易にする。
既存のKV量子化は、微細な量子化や高ビット幅キャッシュのかなりの部分の保持に依存している。
本稿では,以下の技術革新を通じて正確で堅牢な性能を実現するRotateKVを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:04:54 GMT)
Cross-Modal Synergies: Unveiling the Potential of Motion-Aware Fusion Networks in Handling Dynamic and Static ReID Scenarios [4.6] 本稿では,静的画像から得られる動きキューを利用してReID機能を大幅に向上させる,新しいMotion-Aware Fusion (MOTAR-FUSE) ネットワークを提案する。
我々のアプローチのユニークな側面は、モーション・アウェア・トランスフォーマーが人間の動きのダイナミクスを正確に捉えることができるような、動きの整合性タスクの統合である。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:37:25 GMT)
Attention Sinks and Outlier Features: A 'Catch, Tag, and Release' Mechanism for Embeddings [4.3] 大きな言語モデル(LLM)の2つの顕著な特徴は、大きなノーム(外部)機能の存在と、いくつかのトークンに非常に強く参加する傾向である。
注意シンクは、例えば、トークンのシーケンスをキャッチし、共通の摂動を適用してキャプチャされたトークンをタグ付けし、トークンを残留ストリームに解放する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:15:07 GMT)
Towards Automation of Cognitive Modeling using Large Language Models [4.3] 計算認知モデルにより、研究者は認知過程を定量化し、モデルと行動データを組み合わせることによって理論間を仲裁することができる。
これまでの研究で、Large Language Models (LLM) はパターン認識のコンテキスト、複雑な問題の解決、実行可能コードの生成に長けていることが証明されてきた。
我々はこれらの能力を活用し、行動データに基づく認知モデルの自動生成におけるLLMの可能性を探究する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:07:13 GMT)
Training Image Derivatives: Increased Accuracy and Universal Robustness [3.9] 派生的トレーニングは、ある低次元タスクにおけるニューラルネットワークの精度を大幅に向上させる確立された方法である。
本稿では,この改良を,画像から立方体の頂点を再構成する図形的画像解析問題に拡張する。
立方体の6自由度に関する導関数をトレーニングすることにより、ノイズなし入力の精度を25倍に向上させる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:50:11 GMT)
A hierarchical semantic segmentation framework for computer vision-based bridge damage detection [3.9] 遠隔カメラと無人航空機(UAV)を用いたコンピュータビジョンによる損傷検出は、効率的で低コストなブリッジの健康モニタリングを可能にする。
本稿では,コンポーネントカテゴリと損傷タイプ間の階層的意味関係を強制するセグメンテーションフレームワークを提案する。
このようにして、損傷検出モデルは、潜在的な損傷領域からのみ学習特徴に焦点をあてることができ、他の無関係領域の影響を避けることができる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:37:48 GMT)
Universal Post-Processing Networks for Joint Optimization of Modules in Task-Oriented Dialogue Systems [3.8] ユニバーサル後処理ネットワーク(UniPPN)を用いた全モジュールの出力を後処理する共同最適化手法を提案する。
モジュールレベルのマルコフ決定プロセスを利用する我々のRLアルゴリズムは,各モジュールの細粒度値と利点推定を可能にし,全モジュールの出力を後処理するための共同学習を安定化する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:46:37 GMT)
AgentBreeder: Mitigating the AI Safety Impact of Multi-Agent Scaffolds [3.8] AgentBREEDERは足場上の多目的進化探索のためのフレームワークである。
私たちの研究は、マルチエージェントの足場による安全性のリスクを強調し、軽減します。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:40:07 GMT)
Understanding Abandonment and Slowdown Dynamics in the Maven Ecosystem [3.8] 4つに1つの図書館は創設年を超えて生き残れない。
放棄された図書館の中には、ライフサイクルの後半に頻繁なリリース活動のバーストを示すものもある。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:47:55 GMT)
QuanEstimation.jl: An open-source Julia framework for quantum parameter estimation [3.8] QuanEstimation.jlは、量子パラメータ推定におけるスキーム評価と設計のためのオープンソースのJuliaフレームワークである。
独立パッケージとしても、最近開発されたハイブリッド言語(Python-Julia)パッケージQuanEstimationの計算コアとしても使用できる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:01:53 GMT)
Neural Quantum State Study of Fracton Models [3.8] フラクトン模型は3次元以上の非伝統的な位相秩序を包含する。
これらのモデルにおける相転移を研究するための新しいツールとして、ニューラル量子状態(NQS)を確立する。
本研究は,複雑な3次元問題の研究におけるNQSの顕著な可能性を示すものである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:16:21 GMT)
Topology-Aware 3D Gaussian Splatting: Leveraging Persistent Homology for Optimized Structural Integrity [3.8] 本研究はトポロジーを意識した3次元ガウス散乱(トポロジー-GS)を紹介する。
トポロジー-GSは、不完全な初期幾何学的カバレッジのためにピクセルレベルの構造的整合性を損なう。
3つの新しいビューベンチマーク実験により、PSNR、SSIM、LPIPSの指標で、Topology-GSが既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:00:10 GMT)
Role of Mixup in Topological Persistence Based Knowledge Distillation for Wearable Sensor Data [3.7] 我々は,KDと時系列,およびトポロジカルな持続性とが混在するKDの役割を,複数の教師を用いて分析した。
ウェアラブルセンサデータにおけるKDおよびミックスアップの様々な手法の包括的解析について述べる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:33:52 GMT)
Paper Copilot: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process [3.5] トップ層人工知能(AI)と機械学習(ML)カンファレンスへの応募の急速な増加により、多くの会場がクローズドからオープンなレビュープラットフォームに移行した。
一部はオープンなピアレビューを完全に受け入れており、プロセス全体を通してパブリックな可視性を実現している。
その他には、最終決定後のみレビューをリリースしたり、オープンなピアレビューシステムを使用してもレビューを非公開にしておくようなハイブリッドアプローチも採用されている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:58:08 GMT)
TMI-CLNet: Triple-Modal Interaction Network for Chronic Liver Disease Prognosis From Imaging, Clinical, and Radiomic Data Fusion [3.3] 慢性肝疾患は世界中で大きな健康上の課題となっている。
最近の証拠は、マルチモーダルデータを統合することで、より包括的な予後情報が得られることを示唆している。
本稿ではTMI-CLNet(Triple-Modal Interaction chronic Liver Network)について紹介する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:05:28 GMT)
neuro2voc: Decoding Vocalizations from Neural Activity [3.2] 本研究は,ゼブラフィンチモータ出力の復号化実験手法について検討する。
XGBoostとSHAP分析により,音節分類に不可欠な神経相互作用パターンが明らかにされた。
組み合わせた対照的な学習-VAEフレームワークは、双対神経データからスペクトログラムを生成することに成功した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:09:31 GMT)
Multi-frequency wavefield solutions for variable velocity models using meta-learning enhanced low-rank physics-informed neural network [3.1] 物理インフォームドニューラルネットワーク(PINN)は、複雑な速度モデルにおける多周波波場をモデル化する上で大きな課題に直面している。
本稿では,低ランクパラメータ化とメタラーニング,周波数埋め込みを組み合わせた新しいフレームワークMeta-LRPINNを提案する。
数値実験により,Meta-LRPINNはベースライン法に比べて高速に収束し,精度が高いことがわかった。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:12:39 GMT)
Privacy Preserving Properties of Vision Classifiers [3.0] 視覚分類器のプライバシ保護特性を多種多様なアーキテクチャで評価する。
本分析では,入力表現や特徴抽出機構,重み構造といったアーキテクチャの違いが,プライバシのリスクにどのように影響するかを強調した。
我々の発見は、セキュアでプライバシーに配慮した機械学習システムの設計に関する実用的な洞察を提供する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:50:00 GMT)
Moonshine: Distilling Game Content Generators into Steerable Generative Models [3.0] PCGML(Procedural Content Generation via Machine Learning)は、ゲームコンテンツ生成の強化を図っているが、制御性や限られたトレーニングデータの持続性には課題がある。
本研究は, 構成型PCGアルゴリズムを可制御PCGMLモデルに蒸留することにより, これらの問題に対処する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:40:22 GMT)
Compositional Concept-Based Neuron-Level Interpretability for Deep Reinforcement Learning [3.0] 深部強化学習(DRL)は多くの複雑な制御問題に対処することに成功している。
現在のDRL解釈法は主にニューラルネットワークをブラックボックスとして扱う。
本稿では,ニューロンレベルでのDRLモデルの詳細な説明を提供する,新しい概念に基づく解釈可能性手法を提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:05:49 GMT)
Gandalf the Red: Adaptive Security for LLMs [2.9] 大規模言語モデル(LLM)アプリケーションにおける即時攻撃に対する防衛の現在の評価は、敵の行動の動的性質と、制限された防御によって正統なユーザに対して課されるユーザビリティの罰の2つの重要な要素を見落としている。
攻撃者を正当なユーザから明確に分離し、マルチステップインタラクションをモデル化し、最適化可能な形式でセキュリティユーティリティを表現するD-SECを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:30:27 GMT)
B3C: A Minimalist Approach to Offline Multi-Agent Reinforcement Learning [2.9] オフライン強化学習(RL)において,政策評価中の未確認行動の選択による過大評価が大きな課題である
本稿では,批判クリッピング(B3C)を用いた行動クローン規則化を提案する。
B3Cは、様々なオフラインマルチエージェントベンチマークで最先端のアルゴリズムより優れている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:26:42 GMT)
Clustering Head: A Visual Case Study of the Training Dynamics in Transformers [2.9] 本稿では,スパースモジュールの追加タスクを導入し,トランスフォーマーがそれをどのように学習するかを検討する。
トレーニングプロセスを通じて各レイヤを包括的に視覚化するビジュアルサンドボックスを導入しています。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:18:15 GMT)
"Cause" is Mechanistic Narrative within Scientific Domains: An Ordinary Language Philosophical Critique of "Causal Machine Learning" [2.6] 因果学習は統計学と機械学習の研究の主要なテーマとして登場した。
本稿では,真の原因と影響現象の認識について考察する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:56:42 GMT)
Worth Their Weight: Randomized and Regularized Block Kaczmarz Algorithms without Preprocessing [2.5] ランダム化ブロックKaczmarz法(RBK)のデータの一様サンプリング時の収束を解析し,その繰り返しがモンテカルロの感覚で$textit$ least-squaresの解に収束することを示す。
RBKに正規化を組み込むことで、これらの問題を解決する。
自然勾配最適化から生じる例を含む数値実験により、正規化アルゴリズムReBlocKは、高速特異値減衰を示す現実的な問題に対して、最小バッチ勾配勾配よりも優れていることが示唆された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:23:46 GMT)
Fisher-Guided Selective Forgetting: Mitigating The Primacy Bias in Deep Reinforcement Learning [2.5] 深層強化学習(Dep Reinforcement Learning, DRL)システムはしばしば、プライマリシーバイアス(PB)として知られる初期経験に過度に適合する傾向にある。
本稿では,Fisher Information Matrix (FIM) のレンズによるPBの包括的調査について述べる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:54:47 GMT)
Registration-Enhanced Segmentation Method for Prostate Cancer in Ultrasound Images [2.5] 手動アノテーションを必要とせず, TRUS画像中の前立腺腫瘍を直接同定する完全自動MRI-TRUS融合法を提案する。
以上より, 平均Dice係数0.212, TRUS-only (0.117), MRI-TRUS fusion (0.132。
この枠組みは前立腺癌診断の複雑さを軽減する可能性を示し、他のマルチモーダル医療画像タスクに適用可能な柔軟なアーキテクチャを提供する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:58:40 GMT)
Explainability in Practice: A Survey of Explainable NLP Across Various Domains [2.5] レビューでは、実用的デプロイメントと実世界のアプリケーションに焦点を当てた説明可能なNLP(XNLP)について検討している。
本稿は,XNLPの理解を深め,より広範に応用できる今後の研究方向を提案することで締めくくっている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:18:44 GMT)
Learning with Hidden Factorial Structure [2.5] 近年の進歩は、テキストと画像データがそのような隠された構造を含んでいることを示唆しており、次元の呪いを和らげるのに役立つ。
ニューラルネットワークが実際にそのような「隠れた因子構造」を活用できるかどうかをテストするための制御された実験フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:25:57 GMT)
On Overlap Ratio in Defocused Electron Ptychography [2.2] 本稿では,重なり比がデータ冗長性とEP再構成の品質に与える影響を実証する。
シミュレーションした4次元STEMデータセットを用いて,重なり比の異なるEPアルゴリズムの評価を行った。
特に40%以上の重なり比は安定で高品質な再構築をもたらす。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:53:55 GMT)
HaSPeR: An Image Repository for Hand Shadow Puppet Recognition [2.0] シャドウグラフィー(Shadowgraphy)またはボンボマニー(ombromanie)は、演劇芸術とストーリーテリングの一形態である。
プロとアマチュアの両方の手影人形クリップから抽出した15のクラスに15,000枚の手影人形画像からなる新しいデータセットを提案する。
本研究は,注目型トランスアーキテクチャよりも,スキップ接続型畳み込みモデルの大幅な性能上の優位性を示すものである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:34:33 GMT)
Expected Diverse Utility (EDU): Diverse Bayesian Optimization of Expensive Computer Simulators [2.0] 様々な$epsilon$-Optimal'のソリューションを探索するEDU法が期待されている。
EDUはガウス過程シュロゲートモデルの下で閉形式獲得関数を生成することを示す。
数値実験の組において,既存手法よりもEDUの改良を実証する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:06:18 GMT)
Vision and Language Reference Prompt into SAM for Few-shot Segmentation [1.9] Segment Anything Model (SAM)は、柔軟なプロンプトで強力なゼロショット機能を実現する大規模なセグメンテーションモデルである。
注記された参照イメージをSAMへのプロンプトとして入力し、ユーザが提供するプロンプトなしでターゲットイメージ内の特定のオブジェクトをセグメント化することで、これらの問題に対処する。
本稿では,参照画像の視覚情報とテキストラベルのセマンティック情報を利用する,新しい数ショットセグメンテーションモデルであるVision and Language Reference Prompt to SAMを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:40:14 GMT)
MS-IMAP -- A Multi-Scale Graph Embedding Approach for Interpretable Manifold Learning [1.8] 本稿では,スペクトルグラフウェーブレットに基づくマルチスケールグラフネットワークの埋め込みフレームワークを提案する。
グラフ上のパリー・ウィーナー空間において、スペクトルグラフウェーブレット作用素は滑らかさよりも柔軟性と制御性が高いことを示す。
提案した埋め込みのさらなる利点は、埋め込みと入力特徴空間の対応性を確立する能力である。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:45:09 GMT)
Agent-Based Uncertainty Awareness Improves Automated Radiology Report Labeling with an Open-Source Large Language Model [1.7] クローン病患者のヘブライ語9,683例について検討した。
我々は不確実性を認識したプロンプトアンサンブルとエージェントに基づく決定モデルを導入した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:57:03 GMT)
Analysis of static and dynamic batching algorithms for graph neural networks [1.7] グラフニューラルネットワーク(GNN)は、材料科学、化学、社会科学などいくつかの分野において有望な結果を示している。
GNNモデルは、しばしば数百万のパラメータを含み、他のニューラルネットワーク(NN)モデルと同様に、モデルのパラメータを更新するためにバッチ内のトレーニングデータセットを構成するグラフのごく一部しか供給されない。
グラフベースモデル、すなわち静的と動的の2つの異なるアルゴリズムを解析する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:34:17 GMT)
LLM-based event log analysis techniques: A survey [1.6] イベントログは、コンピューティングデバイスで発生するアクティビティに関する重要な情報を記録する。
研究者は、イベントログ分析プロセスを改善するために、自動テクニックを開発した。
本稿では,LLMを用いたイベントログ解析手法について検討する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:28:17 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.6] LOLAは160以上の言語で訓練された多言語大言語モデルである。
私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。
学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:59:51 GMT)
Expedited Noise Spectroscopy of Transmon Qubits [1.5] 現在の量子プロセッサのスケールアップに関して、ノイズは依然として重要な課題である。
機械学習に基づく手法を用いて、複数の量子ビットの雑音スペクトルを迅速に抽出する。
我々は,IBM Quantumプラットフォーム上で利用可能な超伝導量子ビットを用いて,我々のプロトコルを検証する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:52:45 GMT)
Beyond Known Reality: Exploiting Counterfactual Explanations for Medical Research [1.5] 本研究は, 医療研究における「もし」シナリオの適用可能性を探るために, 反事実的説明を用いている。
本研究の目的は, 小児後頭葉腫瘍の診断に使用されるMRI像の理解を深めることである。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:33:18 GMT)
LLM-Net: Democratizing LLMs-as-a-Service through Blockchain-based Expert Networks [1.4] 本稿では,LLM(Large Language Models)をサービスとして民主化するブロックチェーンベースのフレームワークであるLLM-Netを紹介する。
LLM-Netは、集合計算資源と分散ドメインの専門知識を活用することで、様々な特定のドメインに対して微調整されたエキスパートモデルを導入している。
我々のシミュレーションはClaude 3.5 Sonnet, Llama 3.1, Grok-2, GPT-4oといった最先端のLCM上に構築され, サービス品質維持における評価に基づくメカニズムの有効性を検証した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:43:45 GMT)
PAC Learning is just Bipartite Matching (Sort of) [1.2] この記事の主目的は、読者であるあなた、Probably Aquatrect (PAC)モデルにおける教師付き学習が、すべて -- バイパーティイトマッチング – と密接に関連していることを、読者に納得させることです。
学習の特定の帰納的モデルと関連する一包含グラフについて概説し、レクリエーション数学でよく見られるいくつかの帽子パズルの一般化と見なすことができる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:28:22 GMT)
Agency in the Age of AI [1.1] 生成AIツールは、最小限のプロンプトから、より現実的なテキスト、画像、ビデオ、機能コードを生成することができる。
これらのツールの悪用や、結果として生じる個人や社会に対する意図的かつ意図しない害に対する警告が増えている。
摂食はこれらの害と利益を研究するのに適切なレンズであるが、それを行うにはエージェンシー理論の進歩が必要であると我々は主張する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:27:19 GMT)
Unmasking Conversational Bias in AI Multiagent Systems [1.1] 生成モデルを含むマルチエージェントシステムで生じる可能性のあるバイアスは、未研究のままである。
本稿では,対話型大規模言語モデルのマルチエージェントシステムにおけるバイアスの定量化を目的としたフレームワークを提案する。
エコーチャンバー実験で観測されたバイアスは、現在最先端のバイアス検出法で検出されていない。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:32:41 GMT)
Position: More Rigorous Software Engineering Would Improve Reproducibility in Machine Learning Research [1.0] 学術作品の実験的検証と偽造は、科学的手法のコアの一部となっている。
機械学習(ML)コミュニティの事前作業の結果を検証する能力を改善するため、より堅牢なソフトウェアエンジニアリングを議論する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:29:09 GMT)
"I am bad": Interpreting Stealthy, Universal and Robust Audio Jailbreaks in Audio-Language Models [0.9] 本稿では,Audio-Language Models(ALMs)を対象とする音声ジェイルブレイクについて検討する。
我々は、プロンプト、タスク、さらにはベースオーディオサンプルをまたいで一般化する対向的摂動を構築する。
我々は、ALMがこれらの音声相手の例をどう解釈するかを分析し、知覚不能な一対一の有毒な音声を符号化する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 08:36:23 GMT)
MorphBPE: A Morpho-Aware Tokenizer Bridging Linguistic Complexity for Efficient LLM Training Across Morphologies [0.8] トークン化は自然言語処理(NLP)の基本である
MorphBPEはByte Pairのモルフォロジーを意識した拡張である。
統計的効率を保ちながら、言語構造をサブワードトークン化に統合する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:06:39 GMT)
Leveraging LLMs for Dynamic IoT Systems Generation through Mixed-Initiative Interaction [0.8] IoTシステムは、ユーザニーズに適応する上で、課題に直面します。
IoT-Togetherパラダイムは、Mixed-Initiative Interaction(MII)パラダイムを通じて、この要求を満たすことを目指している。
この作業は、大規模言語モデル(LLM)をアーキテクチャに統合することで、IoT-Togetherを前進させる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:21:49 GMT)
Retracted Citations and Self-citations in Retracted Publications: A Comparative Study of Plagiarism and Fake Peer Review [0.8] 我々は、盗作と偽のピアレビューという2つのリトラクションカテゴリーに焦点を当てた。
この傾向は、盗作事件の平均成長率は1.2倍、偽のピアレビューでは平均成長率5.5倍の変動パターンを示している。
校正論文の抽出引用総数は偽査定論文の1.8倍である。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:05:09 GMT)
REMOTE: Real-time Ego-motion Tracking for Various Endoscopes via Multimodal Visual Feature Learning [0.7] 内視鏡のためのリアルタイムエゴモーショントラッキングを実現するための新しいフレームワークを提案する。
相対的なポーズ予測を行うために,マルチモーダル視覚特徴学習ネットワークを提案する。
内視鏡の絶対的なポーズは相対的なポーズに基づいて計算される。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:32:01 GMT)
The Accuracy, Robustness, and Readability of LLM-Generated Sustainability-Related Word Definitions [0.7] 標準化された定義を持つ共通言語は、効果的な気候に関する議論に不可欠である。
我々は, GPT-4o-mini, Llama3.1 8B, Mistral 7Bが生成した300の公式IPCC用語集を比較検討し, SBERT文の埋め込みによる付着性, 堅牢性, 可読性の解析を行った。
LLMは0.57-0.59 pm 0.15$の平均順守率を記録し、その定義はオリジナルのものよりも読みにくくなった。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:05:21 GMT)
High-Dimensional Bayesian Optimization Using Both Random and Supervised Embeddings [0.6] 本稿では,小さな次元の線形埋め込み部分空間を組み込んだ高次元最適化手法を提案する。
結果のBO法は、ランダムおよび教師付き線形埋め込みの両方を適応的に組み合わせる。
その結果,高次元ブラックボックス最適化問題に対するEGORSEの有効性が示された。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:57:05 GMT)
Probing Large Language Models in Reasoning and Translating Complex Linguistic Puzzles [0.6] 本稿では,複雑な言語パズルの解法としてLarge Language Models (LLMs) を用いる。
パズリングマシンコンペティションと各種言語オリンピアードのデータセットを用いて、GPT-4 0603の性能を評価する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:53:14 GMT)
A New Logic For Pediatric Brain Tumor Segmentation [0.6] 深層学習アーキテクチャを用いた小児脳腫瘍の分節化のための新しいアプローチを提案する。
PED BraTS 2024テストセットに4つの異なる腫瘍ラベルを基準としてベンチマークを行った。
我々は、最先端(SOTA)モデルに対して、我々のモデルの性能を評価する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 01:11:45 GMT)
A Quantum Description of Wave Dark Matter [0.5] ボソニックダークマター(DM)の基本量子記述について概説する。
種々の物理スケール上の密度変動が2つの限界の間でどのように進化するかを考察する。
波動境界付近でのDMの特異な挙動と粒子記述を明らかにする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:28:24 GMT)
More resourceful states improve quantum channel discrimination [0.5] 凸でない状態の任意の資源理論において、最大平均成功確率が向上する程度は、ロバストネス測度によって正確に定量化できることを示す。
また, 補助システムを用いたチャネル識別問題の改善を, 頑健性測定によって定量化できることを実証した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:38:41 GMT)
Perspectives for Direct Interpretability in Multi-Agent Deep Reinforcement Learning [0.4] マルチエージェントディープ強化学習(MADRL)は、ロボット工学やゲームにおいて複雑な問題を解くのに効果的であることが証明された。
本稿では, 学習モデルから直接, ポストホックな説明を生成することによって, 直接解釈可能であることを提唱する。
我々は、関連バックプロパゲーション、知識エディション、モデルステアリング、アクティベーションパッチ、スパースオートエンコーダ、サーキットディスカバリなど、現代的な手法を探求する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:15:27 GMT)
Enhanced Convolutional Neural Networks for Improved Image Classification [0.4] CIFAR-10は、小規模のマルチクラスデータセットの分類モデルの性能を評価するために広く使用されているベンチマークである。
本稿では,より深い畳み込みブロック,バッチ正規化,ドロップアウト正規化を統合したCNNアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 04:32:25 GMT)
Quantum complexity phase transitions in monitored random circuits [0.3] 監視されたランダム回路における量子状態複雑性のダイナミクスについて検討する。
正確な量子状態の複雑性の進化は、測定率を変更する際に相転移を起こす。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:14:43 GMT)
Patterns and Purposes: A Cross-Journal Analysis of AI Tool Usage in Academic Writing [0.3] 本研究では,27カテゴリの8,859項目から168件のAI宣言を分析した。
ChatGPTは学術的な筆記補助(77%の使用)を支配しており、ネイティブと非ネイティブの英語話者のツール使用率に大きな違いがある。
調査によると、可読性(51%)と文法チェック(22%)の改善が、AIツールの使用の主要な目的である。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 02:44:33 GMT)
Leveraging Large Language Models to Predict Antibody Biological Activity Against Influenza A Hemagglutinin [0.2] インフルエンザA型ヘマグルチニン(HA)抗原に対する抗体の結合および受容体遮断活性を予測するためのAIモデルを開発した。
AUROC $geq$0.91, AUROC $geq$0.91, AUROC for unseen HAs。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 06:48:45 GMT)
Online Learning of Pure States is as Hard as Mixed States [0.1] 量子状態トモグラフィー(quantum state tomography)は、未知の量子状態を学ぶタスクであり、量子情報の基本的な問題である。
我々はオンライン学習の枠組みを考察し、この環境で純粋な状態を学ぶことは混合状態を学ぶのと同じくらい難しいという驚くべき結果を証明する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:27:14 GMT)
Weak Supervision Dynamic KL-Weighted Diffusion Models Guided by Large Language Models [0.0] 本稿では,大言語モデルと拡散モデルを組み合わせることで,テキスト・画像生成を改善する新しい手法を提案する。
提案手法は, 学習済みLLMから意味的理解を取り入れ, 生成過程の導出を行う。
本手法は,テキスト記述による画像の視覚的品質とアライメントを大幅に改善する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:43:13 GMT)
Unraveling-induced entanglement phase transition in diffusive trajectories of continuously monitored noninteracting fermionic systems [0.0] 領域法的な絡み合いを持つ位相から、絡み合いがシステムサイズと対数的にスケールする位相への遷移を示す。
我々の発見は、ノイズの多い量子デバイスにおける量子相関の調整に関係しているかもしれない。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:04:32 GMT)
Two-dimensional topological paramagnets protected by $\mathbb{Z}_3$ symmetry: Properties of the boundary Hamiltonian [0.0] 三角格子上の2次元Pottsパラマグネットの対称性保護位相に対応するギャップレスエッジモードについて検討した。
数値的に、エッジモデルの連続極限における低エネルギー状態は共形場理論によって記述できることを示す。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:26:50 GMT)
Transfer Learning in Physics-Informed Neural Networks: Full Fine-Tuning, Lightweight Fine-Tuning, and Low-Rank Adaptation [0.0] 物理情報ニューラルネットワーク(PINN)の強大・エネルギー形式における伝達学習の一般化能力について検討する。
私たちが採用している転写学習手法には、フル微調整、軽量微調整、ローランド適応(LoRA)がある。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:40:22 GMT)
The foot, the fan, and the cuprate phase diagram: Fermi-volume-changing quantum phase transitions [0.0] 大きなフェルミ面(FL)を持つフェルミ液体は、スピン密度波状態(SDW)への量子相転移を持つことができる。
FL と SDW の相は、フェルミ面で囲まれた体積に対するルッティンガーの制約に従う。
SDW-FL量子相転移における空間障害の影響の研究は、フェルミ面側の低温における拡張量子臨界グリフィス型位相を予測する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:59:00 GMT)
The Potential of Convolutional Neural Networks for Cancer Detection [0.0] CNN(Convolutional Neural Networks)は、医療画像の分析と分類のための強力なツールである。
分類にCNN技術を用いるこれらの進歩のほとんどで10の異なるがんが同定されている。
本研究は, 最高の作業を行い, 比較分析を行うCNNアーキテクチャを同定する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:54:28 GMT)
The Open Source Advantage in Large Language Models (LLMs) [0.0] 大規模言語モデル(LLM)は急速に進歩した自然言語処理を持ち、テキスト生成、機械翻訳、ドメイン固有の推論といったタスクにおいて大きなブレークスルーを引き起こしている。
GPT-4のようなクローズドソースモデルは、最先端のパフォーマンスを提供するが、アクセシビリティを制限し、外部の監視を行う。
LLaMAやMixtralといったオープンソースフレームワークはアクセスを民主化し、コラボレーションを促進し、多様なアプリケーションをサポートする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:27:06 GMT)
Structural Latency Perturbation in Large Language Models Through Recursive State Induction [0.0] 本研究では、再帰的状態誘導により計算経路を変調する構造的遅延摂動機構を提案する。
再帰状態調整を適用すると、様々なシーケンスの長さにわたる推論遅延が減少することを示した。
計算オーバーヘッドの解析は、活性化を選択的に抑制することが、電力効率の向上に寄与することを示唆している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:45:35 GMT)
SU(N) magnetism with ultracold molecules [0.0] SU($N$)対称性を持つ量子系は、量子多体物理学のパラダイム的な設定である。
静電場やマイクロ波との破壊衝突から守られた超低温分子は、SU($N$)対称性を示す。
彼らはそのドアを、ボソンに32ドル、フェルミオンに36ドル(約3万2000円)まで開けた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:33:50 GMT)
SU($N$) symmetry with ultracold alkali dimers: weak dependence of scattering properties on hyperfine state [0.0] 実験的にアクセス可能な分子は、ボゾン系とフェルミオン系の両方に対して大きな$N$を提供する。
研究された全ての分子がSU($N$)対称性に必要な性質を持つことを示す。
我々は、スピン依存の半古典モデルを開発し、テストし、それがうまく機能することを確かめる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:45:02 GMT)
Quantum-Inspired Solver for Simulating Material Deformations [0.0] 本稿では, 線形弾性の枠組みにおける材料変形シミュレーションへのテンソルネットワーク (TN) の適用について検討する。
もともと量子力学で開発されたTNは、最近偏微分方程式(PDE)の解法において有望であることが示されている。
本研究では, 線形弾性方程式を数十自由度で解くためにTNを用いて, メモリ使用量と計算時間の両方で指数関数的削減を実現した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 19:32:07 GMT)
Predicting potentially unfair clauses in Chilean terms of services with natural language processing [0.0] 本研究は, 消費者契約における情報非対称性の増大に対する懸念に対処するものである。
我々はこのギャップに対処する新しい方法論と実質的なデータセットを導入する。
4つのカテゴリと合計20のクラスを持つ新しいアノテーションスキームを提案し、チリで使用される50のオンラインサービス用語に適用する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:01:39 GMT)
Pauli webs spun by transversal $|Y\rangle$ state initialisation [0.0] 元々は、[arXiv:02286, arR:2302.07395, arXiv:2302.12]のYrangle状態が、[arXiv:2411391]の[arXiv:2411391]のフォールド-トランスバースゲートの実装に明示的に組み込まれていた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 23:29:32 GMT)
Packaged Quantum States in Field Theory: No Partial Factorization, Multi-Particle Packaging, and Hybrid Gauge-Invariant Entanglement [0.0] 局所ゲージ不変性と超選択規則は、量子場励起に対するパッケージングの原理を強制する。
単一粒子レベルでは、この包装原理はIQNの部分分解を禁ずる。
スーパーセレクションは、ネットゲージ電荷を1セクターに制限し、クロスセクターベル型スーパーポジションを排除している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:05:27 GMT)
On the applicability of Kolmogorov's theory of probability to the description of quantum phenomena. Part I: Foundations [0.0] これはコルモゴロフによる「古典的確率論」の一般化と見なされている。
この著作は後者の立場を支持している。
これは非相対論的$N$ボディ量子系に対して数学的に厳密な理論を構築する方法を示している。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:53:05 GMT)
On Noncommutative Quantum Mechanics and the Black-Scholes Model [0.0] Black-Scholesモデルの2つの新しい直接量子力学的表現が構築されている。
我々は、(弱回転)量子化がメルトン=ガーマン族に関連するモデルにつながる2つの自由度からなるシステムを考える。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 22:10:45 GMT)
Non-Markovian Quantum Jump Method for Driven-Dissipative Two-Level Systems [0.0] 指数関数的に増加する軌道数の障害を克服するために, 改良された非マルコフ量子ジャンプ法を提案する。
本手法では, トラジェクトリは, 量子ジャンプの数によって特徴付けられるトラジェクトリクラスに分類される。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:56:03 GMT)
Modified Adaptive Tree-Structured Parzen Estimator for Hyperparameter Optimization [0.0] 本稿では,アダプティブツリー構造型パーゼンエミュレータ (ATPE) アルゴリズムのいくつかの改良を提案する。
実験の結果,提案手法はATPEハイパーパラメータ最適化の有効性を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 18:45:28 GMT)
Metric Field as Emergence of Hilbert Space [0.0] 時空と距離場の曖昧さを基本的な概念として説明する。
量子加速演算子(QAO)と呼ばれる加速の量子として演算子を構築する。
このアプローチでは、これらの概念は構築されたQAOを通してヒルベルト空間から現れる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 15:48:05 GMT)
Long-distance Bell nonlocality and teleportation with hybrid entangled states [0.0] また,光ハイブリッド状態は,大都市圏でClaus-Horne-Shimoni-Holt(CHSH)ベルの不等式に反する偏光絡み状態を効率的に生成できることを示した。
さらに、未知偏光量子ビットの量子テレポーテーションにおける情報処理タスクにおける共有絡み状態の品質を評価する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:46:02 GMT)
Leveraging Joint Predictive Embedding and Bayesian Inference in Graph Self Supervised Learning [0.0] グラフ表現学習は、ノード分類やリンク予測といったタスクの基盤として登場した。
現在の自己教師付き学習(SSL)手法は、計算の非効率性、対照的な目的への依存、表現の崩壊といった課題に直面している。
本稿では,意味情報と構造情報を保存しながら,対照的な目的と負のサンプリングを排除したグラフSSLのための新しい結合埋め込み予測フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 07:42:45 GMT)
Integrating Cybersecurity Frameworks into IT Security: A Comprehensive Analysis of Threat Mitigation Strategies and Adaptive Technologies [0.0] サイバーセキュリティの脅威の状況は、IT構造を保護するための健全なフレームワークの開発を、積極的に推進している。
本稿では,サイバーセキュリティの脅威の性質の変化に対処する上での,このようなフレームワークの役割に焦点をあてて,ITセキュリティへのサイバーセキュリティフレームワークの適用について論じる。
この議論は、リアルタイム脅威検出と応答メカニズムのコアとして、人工知能(AI)や機械学習(ML)といった技術も挙げている。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:38:48 GMT)
Haldane model on the Sierpiński gasket [0.0] Sierpi'nskiガスケット上のHaldaneモデルの位相位相について検討した。
フラクタル幾何学の結果、複数のフラクタルギャップが生じる。
平らなバンドが出現し、複雑な隣のアレストホッピングのため、このバンドは分裂し、複数のトポロジカルフラックスによって引き起こされるギャップが出現する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:54:35 GMT)
Graph Neural Networks for Identifying Steady-State Behavior in Complex Networks [0.0] 線形力学系の定常挙動を同定するグラフニューラルネットワークフレームワークを開発した。
我々は,モデルが異なる状態を高精度に学習していることを明らかにする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 17:29:10 GMT)
Goal-Oriented Bayesian Optimal Experimental Design for Nonlinear Models using Markov Chain Monte Carlo [0.0] 本稿では,非線形観測および予測モデルに適した予測目標指向OED(GO-OED)の計算フレームワークを提案する。
GO-OEDはQoIで最大のEIGを提供する実験的な設計を求めている。
非線形GO-OED法の有効性を実証し,従来の非GO-OED法と比較した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:33:42 GMT)
Generative AI for Analyzing Participatory Rural Appraisal Data: An Exploratory Case Study in Gender Research [0.0] 本研究では、参加型農村評価(PRA)による非構造的視覚データの解析におけるジェネレーティブ・人工知能(GenAI)の新たな応用について検討する。
本研究は,「イデアル・ビレッジ」PRAの活動を事例として,インド諸州の多言語的内容を含む手描き人工品を解釈する能力として,最先端の3つの大規模言語モデル(LLM)を評価した。
我々の発見は、このような構造化されていないデータを処理するAIの現在の能力、特に多言語コンテンツを扱うこと、文脈的正確性を維持すること、幻覚を避けることにおける重要な課題を明らかにした。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 11:55:52 GMT)
Generalization of Medical Large Language Models through Cross-Domain Weak Supervision [0.0] 医療用大規模言語モデル(MLLM)の生成能力を高めるためのICFTフレームワークを提案する。
ICFTはカリキュラムベースの学習、二段階記憶調整、パラメータ効率の微調整を組み合わせて、一般的な言語知識から強力なドメイン固有の専門知識への移行を可能にする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:05:23 GMT)
FLRONet: Deep Operator Learning for High-Fidelity Fluid Flow Field Reconstruction from Sparse Sensor Measurements [0.0] 本研究では,スパースセンサによる流体流れ場再構築のための深層演算子学習フレームワークであるFLRONetを紹介する。
FLRONetは、センサ測定が不正確な場合や欠落の場合であっても、高いレベルの再現精度と堅牢性を達成する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 14:46:42 GMT)
Estimating forest carbon stocks from high-resolution remote sensing imagery by reducing domain shift with style transfer [0.0] 森林は土地の重要な炭素貯水池として機能し、その炭素シンクは大気中の二酸化炭素濃度を効率的に削減し、気候変動を緩和することができる。
現在、森林炭素在庫のモニタリングと評価の全体的な傾向は、地上モニタリングサンプルデータと衛星リモートセンシング画像を統合することである。
我々は,中国雲南省清市Huize郡においてGF-1 WFVとLandsat TM画像を用いて解析を行った。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:45:46 GMT)
Enhancing Code Consistency in AI Research with Large Language Models and Retrieval-Augmented Generation [0.0] 本稿では,対応する研究論文に概説されたアルゴリズムと方法論に対するコード実装の検証を目的とした,新しいシステムを提案する。
本システムではRetrieval-Augmented Generationを用いて研究論文とコードベースの両方から関連する詳細を抽出し,続いてLarge Language Modelを用いた構造化比較を行った。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 00:35:42 GMT)
Deep Neural Network for Phonon-Assisted Optical Spectra in Semiconductors [0.0] 本稿では,半導体中のフォノンアシスト光吸収を$ab$$initio$精度で効率的に計算する手法を提案する。
温度依存性の光学吸収スペクトルとSi,GaAsのバンドギャップ再正規化を計算し,その有効性を示す。
その結果, 直接吸収法と間接吸収法の両方を解析し, 実験データと良好な一致を示した。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:37:56 GMT)
Cylindrically confined $H$ atom in magnetic field: variational cut-off factor [0.0] 本研究では, 一定磁場の存在下での半径$rho_0$の無誘電性無限円筒空洞内に閉じ込められた水素原子について検討した。
3パラメトリックトライアル関数は、システムの基底状態エネルギー$E$を決定するために使用される。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 03:56:37 GMT)
Cross multiscale vision transformer for deep fake detection [0.0] このプロジェクトは、SPカップの2025年のディープフェイク検出データセットを用いて、ディープフェイク検出を評価する。
我々は,従来のディープラーニング技術と新しいアーキテクチャを併用して,さまざまな深層学習モデルによる偽コンテンツの検出に焦点をあてた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 16:09:55 GMT)
CoNNect: A Swiss-Army-Knife Regularizer for Pruning of Neural Networks [0.0] CoNNectは、スパースNNトレーニングのための新しい差別化可能なレギュレータである。
CoNNectは確立したプルーニング戦略を統合し、構造化プルーニングと非構造化プルーニングの両方をサポートする。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 10:32:55 GMT)
Bridging Simulation and Reality: A 3D Clustering-Based Deep Learning Model for UAV-Based RF Source Localization [0.0] 無人航空機(UAV)は、地上法よりもRFソースの局所化に大きな利点をもたらす。
近年のディープラーニング(DL)の進歩は,特に屋外シナリオにおいて,局所化の精度をさらに高めた。
本稿では、3Dクラスタリングに基づく特徴抽出をロバストなローカライゼーションに活用するDLベースの3DクラスタベースRealAdaptRNetを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 05:48:44 GMT)
Beyond Monte Carlo: Harnessing Diffusion Models to Simulate Financial Market Dynamics [0.0] 本稿では,合成金融市場データを生成するための,効率的かつ正確な手法を提案する。
合成データは、いくつかの重要な側面において観測された市場データと密接に一致している。
モデルトレーニングではモンテカルロシミュレーションではなく数値積分に基づく効率的かつ高速なアルゴリズムを開発する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 20:31:25 GMT)
Axioms for the category of Hilbert spaces and linear contractions [0.0] ヒルベルト空間と線型縮約の圏は、確率、複素数、ノルム、連続性、凸性、次元を言及しない基本的な圏の性質によって特徴づけられる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 09:49:18 GMT)
AuthOr: Lower Cost Authenticity-Oriented Garbling for Arbitrary Boolean Circuits [0.0] 本稿では,汎用回路のための新しい認証指向ガーブリング方式AuthOrについて報告する。
提案手法は,情報理論ギャリング,ハーフゲートギャリング,新しいバンド幅フリー・アンド・ゲートギャリング方式のアイデアをうまく組み合わせる。
提案手法は,多くの回路において通信コストと計算コストの両方でハーフゲートを突破するが,回路に依存するため,正確な効率向上を実証的に見ることができる。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:34:35 GMT)
A posteriori error estimates for the Lindblad master equation [0.0] 我々は、無限次元ヒルベルト空間におけるリンドブラッドマスター方程式によって支配される開量子系のシミュレーションに興味がある。
標準的なアプローチは、有限次元部分空間における微分方程式を導出する2つの逐次近似を含む。
本稿では,数値結果の精度を保証するために明示的に計算できる2つの近似のバウンダリを確立する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 13:02:58 GMT)
A method for estimating forest carbon storage distribution density via artificial intelligence generated content model [0.0] 我々は、GF-1 WFV衛星画像をデータとして、初期特徴を抽出するためにKD-VGGモジュールを導入し、改良された暗黙拡散モデル(IIDM)を提案した。
今回提案したIIDMモデルは, RMSEが28.68であり, 回帰モデルよりも13.16, 約31.45%高かった。
炭素貯蔵量の推定において, 生成モデルはより深い特徴を抽出でき, 性能は他のモデルよりも有意に優れていた。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 12:41:47 GMT)
A Novel Real-Time Full-Color 3D Holographic (Diffractive) Video Capture, Processing, and Transmission Pipeline Using Off-The-Shelf Hardware [0.0] 本論文では、市販のハードウェアを使用した世界初の3Dホログラフィック(微分)ビデオ通話について詳述する。
ホログラム生成のためのVividQのSDKとディスプレイ用ハードウェアを用いて,iPhoneを用いた画像・深度キャプチャによるRGBZデータのキャプチャ,処理,伝送を容易にする新しいパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 02 Feb 2025 21:42:00 GMT)