GenXD: Generating Any 3D and 4D Scenes [137.5] 本稿では,日常的によく見られるカメラと物体の動きを利用して,一般的な3Dと4Dの生成を共同で調査することを提案する。
すべての3Dおよび4Dデータを活用することで、我々は、あらゆる3Dまたは4Dシーンを生成できるフレームワークであるGenXDを開発した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:45:44 GMT)
DeeR-VLA: Dynamic Inference of Multimodal Large Language Models for Efficient Robot Execution [114.6] 実世界のロボットのためのMLLMの開発は、ロボットプラットフォームで利用可能な計算能力とメモリ容量が典型的に限られているため、難しい。
活性化MLLMのサイズを自動的に調整するロボットビジョンランゲージ・アクション・モデル(DeeR)の動的早期実行フレームワークを提案する。
DeeR は LLM の計算コストを 5.2-6.5x に削減し、GPU のメモリを 2-6x に削減した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:26:08 GMT)
DynaSaur: Large Language Agents Beyond Predefined Actions [108.8] 既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作の動的生成と構成をオンラインで実現するLLMエージェントフレームワークを提案する。
GAIAベンチマーク実験により, このフレームワークは柔軟性が向上し, 従来の手法よりも優れていたことが確認された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:08:59 GMT)
Expanding Sparse Tuning for Low Memory Usage [103.4] メモリ使用量が少ないスパースチューニングのためのSNELL(Sparse tuning with kerNelized LoRA)法を提案する。
低メモリ使用量を達成するため、SNELLはスカラー化のための調整可能な行列を2つの学習可能な低ランク行列に分解する。
コンペティションに基づくスペーシフィケーション機構は、チューナブルウェイトインデックスの保存を避けるためにさらに提案される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:58:20 GMT)
How Far is Video Generation from World Model: A Physical Law Perspective [101.2] OpenAIのSoraは、物理法則に準拠した世界モデルを開発するためのビデオ生成の可能性を強調している。
しかし、ビデオ生成モデルが人間の先行しない視覚データから純粋にそのような法則を発見する能力に疑問を投げかけることができる。
本研究は,3つの主要なシナリオ – 分布内,分布外,一般化 – について評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:53:05 GMT)
Self-Retrieval: End-to-End Information Retrieval with One Large Language Model [97.7] 本稿では,新たなLLM駆動情報検索アーキテクチャであるSelf-Retrievalを紹介する。
自己検索は、自己教師付き学習を通じて検索コーパスを内部化し、検索プロセスをシーケンシャルな通過生成に変換し、再ランク付けのための関連性評価を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:07:30 GMT)
Continual LLaVA: Continual Instruction Tuning in Large Vision-Language Models [93.5] 連続LLaVA(Continuous LLaVA)は、LVLMにおける連続的な命令チューニングに適したリハーサルフリーな手法である。
実験により,提案した連続LLaVAは,連続的な命令チューニング過程における忘れを著しく減らし,従来の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:55:32 GMT)
Fast Semi-supervised Learning on Large Graphs: An Improved Green-function Method [93.0] グラフに基づく半教師付き学習において、グリーン関数法はグラフ空間におけるグリーン関数の計算によって機能する古典的な方法である。
そこで本研究では,最適化の観点から詳細な解析を行い,新しい手法を提案する。
従来の手法とは異なり,改良手法ではガウス除去法とアンコレッドグラフ法という2つの高速化手法を適用できる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:27:18 GMT)
Artificial General Intelligence for Medical Imaging Analysis [92.4] 大規模人工知能(AGI)モデルは、様々な汎用ドメインタスクにおいて前例のない成功を収めた。
これらのモデルは、医学分野固有の複雑さとユニークな特徴から生じる顕著な課題に直面している。
このレビューは、医療画像、医療などにおけるAGIの将来的な意味についての洞察を提供することを目的としている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:07:30 GMT)
Clustering Based on Density Propagation and Subcluster Merging [92.2] 本稿では,クラスタ数を自動的に決定し,データ空間とグラフ空間の両方に適用可能な密度に基づくノードクラスタリング手法を提案する。
二つのノード間の距離を計算する従来の密度クラスタリング法とは異なり,提案手法は伝播過程を通じて密度を決定する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:09:36 GMT)
CRMArena: Understanding the Capacity of LLM Agents to Perform Professional CRM Tasks in Realistic Environments [90.3] CRMArenaは、プロフェッショナルな作業環境に根ざした現実的なタスクにおいて、AIエージェントを評価するために設計されたベンチマークである。
現状のLDMエージェントはReActプロンプトのタスクの40%以下で成功し,機能呼び出し能力でも55%以下であった。
この結果から,実環境に展開する関数呼び出しやルールフォローにおいて,エージェント機能の向上の必要性が示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:30:51 GMT)
Shaving Weights with Occam's Razor: Bayesian Sparsification for Neural Networks Using the Marginal Likelihood [86.7] ニューラルネットワークのスパーシフィケーションは、計算時間とメモリコストを削減できる有望な方法である。
Sparsifiability via the Marginal chance (SpaM) a pruning framework。
当社のフレームワークの有効性を,特に高頻度で実証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:36:15 GMT)
Unlocking Temporal Question Answering for Large Language Models with Tailor-Made Reasoning Logic [84.6] 大きな言語モデル(LLM)は、時間的推論に関わる際に課題に直面します。
本研究では,時間的質問応答タスクに特化して設計された新しいフレームワークであるTempLogicを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:00:39 GMT)
Visual Anchors Are Strong Information Aggregators For Multimodal Large Language Model [82.9] 本稿では,MLLMが低コストを維持しつつ高い精度を達成できるビジョン言語コネクタを提案する。
まず、視覚変換器における視覚アンカーの存在を明らかにし、それらを抽出するためのコスト効率の良い探索アルゴリズムを提案する。
Anchor former (AcFormer) は、事前学習中に得られた視覚的アンカーから得られる豊富な事前知識を活用するために設計された、新しい視覚言語コネクタである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:03:31 GMT)
Online Adaptation of Language Models with a Memory of Amortized Contexts [82.0] MAC(Memory of Amortized Contexts)は、大規模言語モデルのための効率的かつ効果的なオンライン適応フレームワークである。
MACとMACを組み合わせれば,検索の高速化など,一般的な代替手段の性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:02:33 GMT)
Adaptive Length Image Tokenization via Recurrent Allocation [81.1] 現在の視覚システムは、情報内容に関わらず、画像に一定長の表現を割り当てている。
そこで本研究では,2次元画像に対する可変長トークン表現の学習手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:58:01 GMT)
Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent [80.3] Hunyuan-Largeは、オープンソースのTransformerベースのエキスパートモデルのミックスである。
我々は,Hunyuan-Largeの優れた性能を,様々なベンチマークで徹底的に評価する。
Hunyuan-Largeの主な実践は、以前の文献より大きい大規模合成データである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:56:26 GMT)
Localizing and Mitigating Errors in Long-form Question Answering [79.6] LFQA(Long-form Question answering)は、複雑な質問に対して徹底的で深い回答を提供し、理解を深めることを目的としている。
この研究は、人書きおよびモデル生成LFQA回答の局所的エラーアノテーションを備えた最初の幻覚データセットであるHaluQuestQAを紹介する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 10:30:16 GMT)
Localizing and Mitigating Errors in Long-form Question Answering [79.6] LFQA(Long-form Question answering)は、複雑な質問に対して徹底的で深い回答を提供し、理解を深めることを目的としている。
この研究は、人書きおよびモデル生成LFQA回答の局所的エラーアノテーションを備えた最初の幻覚データセットであるHaluQuestQAを紹介する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 10:30:16 GMT)
Chronos: Learning the Language of Time Series [79.4] Chronosは事前訓練された確率的時系列モデルのためのフレームワークである。
クロノスモデルでは,様々な領域の時系列データを利用して,未知の予測タスクにおけるゼロショット精度を向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:42:45 GMT)
Imagining and building wise machines: The centrality of AI metacognition [78.8] AIシステムは知恵を欠いている。
AI研究はタスクレベルの戦略に焦点を当てているが、メタ認知はAIシステムでは未発達である。
メタ認知機能をAIシステムに統合することは、その堅牢性、説明可能性、協力性、安全性を高めるために不可欠である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:10:10 GMT)
MM-Embed: Universal Multimodal Retrieval with Multimodal LLMs [78.5] 本稿では,マルチモーダル大言語モデル(MLLM)を用いた情報検索手法を提案する。
まず,16個の検索タスクを持つ10個のデータセットに対して,MLLMをバイエンコーダレトリバーとして微調整する。
我々は,MLLMレトリバーが提示するモダリティバイアスを軽減するために,モダリティを考慮したハードネガティブマイニングを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:06:34 GMT)
A Global Depth-Range-Free Multi-View Stereo Transformer Network with Pose Embedding [76.4] 本稿では,事前の深度範囲を排除した新しい多視点ステレオ(MVS)フレームワークを提案する。
長距離コンテキスト情報を集約するMDA(Multi-view Disparity Attention)モジュールを導入する。
ソース画像のエピポーラ線上のサンプリング点に対応する電流画素の品質を明示的に推定する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:50:16 GMT)
Unified Speech Recognition: A Single Model for Auditory, Visual, and Audiovisual Inputs [73.7] 本稿では,音声認識システムのための統合学習戦略を提案する。
3つのタスクの1つのモデルをトレーニングすることで、VSRとAVSRの性能が向上することを示す。
また,非ラベル標本をより効果的に活用するために,強欲な擬似ラベリング手法を導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:46:53 GMT)
Multi-Transmotion: Pre-trained Model for Human Motion Prediction [68.9] マルチトランスモーション(Multi-Transmotion)は、モダリティ事前トレーニング用に設計された革新的なトランスフォーマーベースのモデルである。
提案手法は,下流タスクにおける各種データセット間の競合性能を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:15:21 GMT)
Computational Lower Bounds for Regret Minimization in Normal-Form Games [68.7] 乗算重み更新などの既存の学習アルゴリズムが最適に近いことを示す。
結果はKothari と Mehta が提案したアルゴリズムの枠組みで得られた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:39:52 GMT)
Barriers to Welfare Maximization with No-Regret Learning [68.7] 我々は、ほぼ最適の$T$-sparse CCEの計算限界を低く証明する。
特に,最大傾斜角の不適応性は,時間内に非自明な間隔を達成できないことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:34:56 GMT)
Decoding Diffusion: A Scalable Framework for Unsupervised Analysis of Latent Space Biases and Representations Using Natural Language Prompts [68.5] 本稿では拡散潜在空間の教師なし探索のための新しい枠組みを提案する。
我々は、自然言語のプロンプトと画像キャプションを直接利用して、遅延方向をマップする。
本手法は,拡散モデルに符号化された意味的知識をよりスケーラブルで解釈可能な理解を提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:12:54 GMT)
StreamingDialogue: Prolonged Dialogue Learning via Long Context Compression with Minimal Losses [67.9] StreamingDialogueは長い対話履歴を最小限の損失でconv-attnシンクに圧縮する。
本手法は対話タスクにおいて強いベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:17:45 GMT)
"Give Me BF16 or Give Me Death"? Accuracy-Performance Trade-Offs in LLM Quantization [67.3] 我々は,学術ベンチマークや実世界のタスクにまたがる一般的な量子化形式を評価する。
W4A16は同期デプロイメントと中間層アーキテクチャの非同期デプロイメントに最適なコスト効率を提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:21:59 GMT)
Digital Twin-Assisted Federated Learning with Blockchain in Multi-tier Computing Systems [67.1] 産業用 4.0 システムでは、リソース制約のあるエッジデバイスが頻繁にデータ通信を行う。
本稿では,デジタルツイン (DT) とフェデレーション付きデジタルツイン (FL) 方式を提案する。
提案手法の有効性を数値解析により検証した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:48:02 GMT)
OneBit: Towards Extremely Low-bit Large Language Models [66.3] 本稿では, LLMの重量行列を1ビットに大胆に定量化し, LLMの極低ビット幅展開への道を開く。
実験によると、OneBitは(LLaMAモデルの非量子化性能の少なくとも81%)優れたパフォーマンスを、堅牢なトレーニングプロセスで達成している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:55:44 GMT)
TripletCLIP: Improving Compositional Reasoning of CLIP via Synthetic Vision-Language Negatives [65.8] Contrastive Language-Image Pretraining (CLIP) モデルは、表現を学ぶためにテキストと視覚的モダリティ間の相互情報を最大化する。
そこで本研究では,テキスト・ツー・イメージ・ジェネレータを用いて,文脈内学習による「ハード」の負の字幕生成と,それに対応する負のイメージ生成が解となることを示す。
提案手法はTripletCLIPと呼ばれ,CLIPの構成能力を向上し,SugarCrepeベンチマークでは9%以上向上した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:24:59 GMT)
Learning to Assist Humans without Inferring Rewards [65.3] 我々は、エンパワーメントのレンズを通して支援を研究する先行研究に基づいて構築する。
補助剤は、人間の行動の影響を最大化することを目的としている。
これらの表現は、先行研究と類似したエンパワーメントの概念を推定する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:31:04 GMT)
Biased AI can Influence Political Decision-Making [64.9] 本稿では、AI言語モデルにおけるパルチザンバイアスが政治的意思決定に及ぼす影響について検討する。
政治的に偏見のあるモデルに晒された参加者は、意見を採用し、AIの偏見と一致した決定を下す可能性が著しく高いことがわかった。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 20:12:07 GMT)
Survey on Adversarial Attack and Defense for Medical Image Analysis: Methods and Challenges [64.6] 医療画像解析における敵攻撃・防衛の進歩に関する総合的な調査を報告する。
公正な比較のために、逆向きに堅牢な診断モデルのための新しいベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:59:25 GMT)
Vocal Sandbox: Continual Learning and Adaptation for Situated Human-Robot Collaboration [64.6] Vocal Sandboxは、位置のある環境でシームレスな人間とロボットのコラボレーションを可能にするフレームワークである。
我々は,ロボットの能力に対する理解と協調をリアルタイムで構築できる軽量で解釈可能な学習アルゴリズムを設計する。
我々はVocal Sandboxを,コラボレーションギフトバッグアセンブリとLEGOストップモーションアニメーションの2つの設定で評価した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:44:40 GMT)
MVPaint: Synchronized Multi-View Diffusion for Painting Anything 3D [63.9] テクスチャリングは3Dアセット生産であり、視覚的魅力と視覚的魅力を高める。
近年の進歩にもかかわらず、メソッドは、主に局所的な不連続のために、しばしばサブパー結果をもたらす。
本稿では,高解像度かつシームレスなマルチビュー一貫性を実現するMVPaintという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:59:39 GMT)
Model Pairing Using Embedding Translation for Backdoor Attack Detection on Open-Set Classification Tasks [63.3] バックドア検出のためのオープンセット分類タスクにモデルペアを用いることを提案する。
このスコアは、異なるアーキテクチャのモデルがあるにもかかわらず、バックドアの存在を示す指標であることを示している。
この技術は、オープンセット分類タスク用に設計されたモデル上のバックドアの検出を可能にするが、文献ではほとんど研究されていない。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:40:24 GMT)
DISP-LLM: Dimension-Independent Structural Pruning for Large Language Models [63.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な成功を収めた。
これらのモデルに関連するメモリと計算コストの増加は、リソース制限されたデバイスへの展開に重大な課題をもたらす。
そこで本研究では,構造解析手法によって課される制約を緩和する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:28:13 GMT)
RuAG: Learned-rule-augmented Generation for Large Language Models [62.6] 本稿では,大量のオフラインデータを解釈可能な一階述語論理規則に自動抽出する新しいフレームワーク,RuAGを提案する。
我々は,自然言語処理,時系列,意思決定,産業タスクなど,公共および民間の産業タスクに関する枠組みを評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:01:34 GMT)
Defining and Evaluating Physical Safety for Large Language Models [62.5] 大型言語モデル (LLM) は、ドローンのようなロボットシステムを制御するためにますます使われている。
現実世界のアプリケーションに物理的な脅威や害をもたらすリスクは、まだ解明されていない。
我々は,ドローンの物理的安全性リスクを,(1)目標脅威,(2)目標脅威,(3)インフラ攻撃,(4)規制違反の4つのカテゴリに分類する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:41:25 GMT)
Sparsing Law: Towards Large Language Models with Greater Activation Sparsity [62.1] 活性化空間性は、除去できる活性化出力の中に、かなり弱い分散要素が存在することを表す。
PPL-$p%$ sparsity, a accurate and performance-aware activation sparsity metric。
我々は、SiLUよりも活性化関数としてReLUが効率的であることを示し、より多くのトレーニングデータを利用してアクティベーション空間を改善することができることを示した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:59:04 GMT)
Attacking Vision-Language Computer Agents via Pop-ups [61.7] VLMエージェントは、慎重に設計された対向的なポップアップによって容易に攻撃できることを示す。
この混乱は、エージェントが通常のタスクを実行する代わりにポップアップをクリックさせる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:56:42 GMT)
What Goes Into a LM Acceptability Judgment? Rethinking the Impact of Frequency and Length [61.7] MORCELAはアクセプタビリティのためのリンク理論よりも優れていることを示す。
より大型のモデルでは、一グラムの周波数に対する相対的な調整の度合いが低い。
本分析により,より大きなLMの周波数効果に対する感受性の低下は,文脈において稀な単語をより正確に予測する能力によって説明できることが示された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:05:49 GMT)
Compact Language Models via Pruning and Knowledge Distillation [61.6] ミニトロンモデルでは、スクラッチからのトレーニングに比べてMMLUスコアが最大16%改善している。
すでにトレーニング済みの15Bモデルから8Bと4Bモデルを抽出するには、スクラッチからトレーニングするよりも、モデル毎のトレーニングトークンを最大40倍少なくする必要があります。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 17:36:38 GMT)
Improving Domain Generalization in Self-supervised Monocular Depth Estimation via Stabilized Adversarial Training [61.4] 我々は、SCAT(stabilized Conflict-Optimization Adversarial Training)という、汎用的な敵訓練フレームワークを提案する。
SCATは、安定性と一般化のバランスを達成するために、敵データ拡張を自己教師付きMDE手法に統合する。
5つのベンチマーク実験により、SCATは最先端の性能を達成でき、既存の自己監督型MDE法の一般化能力を大幅に向上できることが示された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:06:57 GMT)
FLEdge: Benchmarking Federated Machine Learning Applications in Edge Computing Systems [61.3] フェデレートラーニング(FL)は,ネットワークエッジ上での分散ディープラーニングのプライバシ強化を実現する上で,有効なテクニックとなっている。
本稿では,既存のFLベンチマークを補完するFLEdgeを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:53:48 GMT)
Tool Learning with Large Language Models: A Survey [60.7] 大規模言語モデル(LLM)を用いたツール学習は,高度に複雑な問題に対処するLLMの能力を強化するための,有望なパラダイムとして登場した。
この分野での注目と急速な進歩にもかかわらず、現存する文献は断片化され、体系的な組織が欠如している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:07:18 GMT)
Can Language Models Learn to Skip Steps? [59.8] 我々は推論においてステップをスキップする能力について研究する。
効率を高めたり認知負荷を減らすためのステップをスキップする人間とは異なり、モデルはそのようなモチベーションを持っていない。
私たちの研究は、人間のようなステップスキッピング能力に関する最初の調査である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:10:24 GMT)
Pseudo-Probability Unlearning: Towards Efficient and Privacy-Preserving Machine Unlearning [59.3] 本稿では,PseudoProbability Unlearning (PPU)を提案する。
提案手法は,最先端の手法に比べて20%以上の誤りを忘れる改善を実現している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:27:06 GMT)
Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.4] OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:59:13 GMT)
Foundations and Recent Trends in Multimodal Mobile Agents: A Survey [57.7] モバイルエージェントは、複雑で動的なモバイル環境におけるタスクの自動化に不可欠である。
近年の進歩により、リアルタイム適応性とマルチモーダルインタラクションが向上している。
これらの進歩は、プロンプトベースの方法とトレーニングベースの方法の2つの主要なアプローチに分類する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:50:58 GMT)
Towards Harmless Rawlsian Fairness Regardless of Demographic Prior [57.3] トレーニングセットに事前の人口統計が提供されない場合に,有効性を損なうことなく公平性を達成する可能性を探る。
本稿では,経験的損失の最適セット内でのトレーニング損失の分散を最小限に抑えるため,VFairという簡単な手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:40:34 GMT)
EMMA: End-to-End Multimodal Model for Autonomous Driving [57.0] 本稿では,自動走行のためのエンドツーエンドマルチモーダルモデルEMMAを紹介する。
EMMAはマルチモーダルな大規模言語モデル基盤に基づいて構築され、生のカメラセンサーデータを様々な駆動特有の出力に直接マッピングする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:44:20 GMT)
Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.9] 現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:16:54 GMT)
A Canonicalization Perspective on Invariant and Equivariant Learning [54.4] フレームの設計について,本質的で完全な視点を提供する正準化の視点を導入する。
フレームと標準形式の間には固有の関係があることが示される。
既存の手法よりも厳密な固有ベクトルのための新しいフレームを設計する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 01:21:32 GMT)
Provably Transformers Harness Multi-Concept Word Semantics for Efficient In-Context Learning [53.7] トランスフォーマーベースの大規模言語モデル(LLM)は、卓越した創造力と出現能力を示している。
この研究は、トランスフォーマーが単語のマルチコンセプトセマンティクスをどのように活用し、強力なICLと優れたアウト・オブ・ディストリビューションICL能力を実現するかを示すための数学的解析を提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:54:32 GMT)
CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark [53.2] 大学レベルの教科知識と意図的推論を必要とするタスクにおいて,LMMを評価するために設計された,中国の大規模多分野マルチモーダル理解ベンチマークを導入する。
CMMMUは、大学試験、クイズ、教科書から12kの質問を手作業で収集し、アート・アンド・デザイン、ビジネス、サイエンス、ヘルス・アンド・メディカル、ヒューマニティ・アンド・ソーシャル・サイエンス、テック・アンド・エンジニアリングの6つの中核分野をカバーしている。
CMMMUは、中国語の文脈における複雑な認識とドメイン固有の知識による推論に焦点を当てている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:28:48 GMT)
Modular Quantization-Aware Training for 6D Object Pose Estimation [52.9] エッジアプリケーションは、リソース制約された組み込みプラットフォーム上で効率的な6Dオブジェクトのポーズ推定を要求する。
本稿では,適応的かつ高精度な量子化学習戦略であるMQAT(Modular Quantization-Aware Training)を紹介する。
MQATは、モジュール固有のビット精度を導出し、モジュール固有の量子化シーケンスを導出し、最先端の均一および混合精度の量子化技術によって生成されたものより優れた量子化モデルをもたらす。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:32:02 GMT)
Learning Multiple Initial Solutions to Optimization Problems [52.9] 厳密なランタイム制約の下で、同様の最適化問題を順次解決することは、多くのアプリケーションにとって不可欠である。
本稿では,問題インスタンスを定義するパラメータが与えられた初期解を多種多様に予測する学習を提案する。
提案手法は,すべての評価設定において有意かつ一貫した改善を実現し,必要な初期解の数に応じて効率よくスケールできることを実証した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:17:19 GMT)
ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization [52.6] 因果関係を考慮したエントロピー(entropy)という用語を導入し,効率的な探索を行うための潜在的影響の高いアクションを効果的に識別し,優先順位付けする。
提案アルゴリズムであるACE:Off-policy Actor-critic with Causality-aware Entropy regularizationは,29種類の連続制御タスクに対して,大幅な性能上の優位性を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:18:20 GMT)
Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.1] 人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:17:06 GMT)
INQUIRE: A Natural World Text-to-Image Retrieval Benchmark [51.8] InQUIREは、専門家レベルのクエリにおけるマルチモーダル視覚言語モデルに挑戦するために設計されたテキスト・ツー・イメージ検索ベンチマークである。
InQUIREには、iNaturalist 2024(iNat24)、500万の自然界の画像の新しいデータセット、250のエキスパートレベルの検索クエリが含まれている。
InQUIRE-Fullrank,完全なデータセットランキングタスク,INQUIRE-Rerank,トップ100検索の精算タスクの2つの中核検索タスクを評価した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:16:53 GMT)
Digitizing Touch with an Artificial Multimodal Fingertip [51.7] 人間とロボットはどちらも、周囲の環境を知覚し、相互作用するためにタッチを使うことの恩恵を受ける。
ここでは、タッチのデジタル化を改善するための概念的および技術革新について述べる。
これらの進歩は、高度なセンシング機能を備えた人工指型センサーに具現化されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:38:50 GMT)
The Foundations of Tokenization: Statistical and Computational Concerns [51.4] トークン化は、NLPパイプラインにおける重要なステップである。
NLPにおける標準表現法としての重要性は認識されているが、トークン化の理論的基盤はまだ完全には理解されていない。
本稿では,トークン化モデルの表現と解析のための統一的な形式的枠組みを提案することによって,この理論的ギャップに対処することに貢献している。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 22:42:38 GMT)
Align-SLM: Textless Spoken Language Models with Reinforcement Learning from AI Feedback [50.8] テキストレス音声言語モデル(SLM)のセマンティック理解を強化するためのAlign-SLMフレームワークを導入する。
提案手法は、与えられたプロンプトから複数の音声継続を生成し、意味的指標を用いて、直接選好最適化(DPO)のための選好データを生成する。
語彙および構文モデリングのためのZeroSpeech 2021ベンチマーク、意味的コヒーレンスのためのStoryClozeデータセットの音声バージョン、GPT4-oスコアや人間評価などの音声生成指標を用いて、フレームワークの評価を行った。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:07:53 GMT)
3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.1] 既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:21:57 GMT)
Adaptive Caching for Faster Video Generation with Diffusion Transformers [49.8] 拡散変換器(DiT)はより大きなモデルと重い注意機構に依存しており、推論速度が遅くなる。
本稿では,Adaptive Caching(AdaCache)と呼ばれる,ビデオDiTの高速化のためのトレーニング不要手法を提案する。
また,AdaCache内で動画情報を利用するMoReg方式を導入し,動作内容に基づいて計算割り当てを制御する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:59:44 GMT)
Recursive Learning of Asymptotic Variational Objectives [49.7] 一般状態空間モデル(英: General State-space Model, SSM)は、統計機械学習において広く用いられ、時系列データに対して最も古典的な生成モデルの一つである。
オンラインシーケンシャルIWAE(OSIWAE)は、潜在状態の推測のためのモデルパラメータとマルコフ認識モデルの両方のオンライン学習を可能にする。
このアプローチは、最近提案されたオンライン変分SMC法よりも理論的によく確立されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:12:37 GMT)
Traffic and Safety Rule Compliance of Humans in Diverse Driving Situations [48.9] 安全な運転プラクティスを再現する自律システムを開発するためには、人間のデータを分析することが不可欠だ。
本稿では,複数の軌道予測データセットにおける交通・安全規則の適合性の比較評価を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:21:00 GMT)
Predicting Ground State Properties: Constant Sample Complexity and Deep Learning Algorithms [48.9] 量子多体物理学における基本的な問題は、局所ハミルトニアンの基底状態を見つけることである。
基底状態特性を学習するためのシステムサイズ$n$とは無関係に,一定のサンプル複雑性を実現する2つのアプローチを導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:58:35 GMT)
Training Compute-Optimal Protein Language Models [48.8] ほとんどのタンパク質言語モデルは、パフォーマンスが高くなるまで広範囲の計算資源で訓練されている。
調査は、9億3900万のタンパク質配列からなる膨大なデータセットに基づいて行われた。
私たちは、350万から107億のパラメータから5から200億のユニークなトークンまで、300以上のモデルをトレーニングしました。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:58:37 GMT)
TI-PREGO: Chain of Thought and In-Context Learning for Online Mistake Detection in PRocedural EGOcentric Videos [48.1] オンラインのオープンセットの手続きミスを効果的に検出する技術はない。
1つのブランチは、入力されたエゴセントリックビデオからステップ認識を連続的に行う。
もう1つは、認識モジュールの出力に基づいて将来のステップを予測します。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:03:06 GMT)
Constrained Human-AI Cooperation: An Inclusive Embodied Social Intelligence Challenge [47.7] CHAICは、インボディードエージェントの社会的知覚と協力をテストするために設計された包括的インボディード・ソーシャル・インテリジェンス・チャレンジである。
CHAICの目標は、身体的制約の下で活動している可能性がある人間を支援するために、自我中心の観察装置を備えたエンボディエージェントである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:41:12 GMT)
Addressing Uncertainty in LLMs to Enhance Reliability in Generative AI [47.6] 中国レストランプロセスに触発された動的セマンティッククラスタリング手法を提案する。
生成したセマンティッククラスタのエントロピーを計算することにより,あるクエリ上でのLarge Language Model(LLM)の不確実性を定量化する。
本稿では,これらのクラスタの(負の)確率を,コンフォーマル予測フレームワーク内の(非)整合性スコアとして活用することを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:49:46 GMT)
Unsupervised detection of semantic correlations in big data [47.2] 本稿では,2進数として表される高次元データにおける意味的相関を検出する手法を提案する。
本研究では,データ記述に必要な独立座標の最小個数を定量化するデータセットの2値固有次元を推定する。
提案アルゴリズムは, いわゆる次元の呪いとは無関係であり, ビッグデータ解析に利用することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:37:07 GMT)
emg2qwerty: A Large Dataset with Baselines for Touch Typing using Surface Electromyography [47.2] emg2qwertyは、QWERTYキーボードでタッチ入力しながら手首に記録された非侵襲的筋電図信号の大規模なデータセットである。
1,135のセッションが108ユーザと346時間の録画にまたがっており、これまでで最大の公開データセットである。
sEMG信号のみを用いたキープレッシャの予測において,高いベースライン性能を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:29:43 GMT)
Enhancing ID-based Recommendation with Large Language Models [47.1] 我々は"LLM for ID-based Recommendation"(LLM4IDRec)と呼ばれる先駆的なアプローチを導入する。
この革新的なアプローチは、IDデータにのみ依存しながらLLMの機能を統合することで、以前のテキストデータへの依存から逸脱する。
LLM4IDRecアプローチの有効性を3つの広く利用されているデータセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:43:12 GMT)
Ask, and it shall be given: Turing completeness of prompting [47.1] 大規模言語モデル(LLM)は機械学習に革命をもたらし、いわゆるLLMプロンプトパラダイムを開始した。
本稿では, LLMプロンプトパラダイムに関する最初の理論的研究を, 我々の知識を最大限活用するために提示する。
有限サイズの変換器が存在し、計算可能な任意の関数に対して、変換器が関数を演算する対応するプロンプトが存在することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:26:38 GMT)
Not Just Object, But State: Compositional Incremental Learning without Forgetting [47.0] コンポジションインクリメンタルラーニング(composition-IL)という新しい課題を提案する。
これにより、段階的な学習方法で状態オブジェクトの合成全体を認識できる。
そこで我々は,不明瞭な構成境界問題を克服するために,プロンプトベースのコンポジションインクリメンタルラーナ (Compiler) を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 01:42:41 GMT)
The Central Role of the Loss Function in Reinforcement Learning [46.7] 回帰損失関数の違いが値に基づく意思決定アルゴリズムのサンプル効率と適応性に与える影響を実証する。
複数の設定にまたがって、バイナリクロスエントロピー損失を用いたアルゴリズムが、最適ポリシーのコストで1次境界スケーリングを実現することを証明した。
本論文は, 種々の損失関数を持つ意思決定アルゴリズムのガイドとして機能し, 読者により良い損失関数を求め, 任意の意思決定アルゴリズムを改善することを期待する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:30:18 GMT)
The Central Role of the Loss Function in Reinforcement Learning [46.7] 回帰損失関数の違いが値に基づく意思決定アルゴリズムのサンプル効率と適応性に与える影響を実証する。
複数の設定にまたがって、バイナリクロスエントロピー損失を用いたアルゴリズムが、最適ポリシーのコストで1次境界スケーリングを実現することを証明した。
本論文は, 種々の損失関数を持つ意思決定アルゴリズムのガイドとして機能し, 読者により良い損失関数を求め, 任意の意思決定アルゴリズムを改善することを期待する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:30:18 GMT)
ReactFace: Online Multiple Appropriate Facial Reaction Generation in Dyadic Interactions [46.7] ダイアドインタラクションでは、聴取者の顔反応を予測することは困難であり、同じ話者の振る舞いに応じて異なる反応が適している可能性がある。
本稿では,外挿や予測問題としてタスクを再構築し,複数の異なる顔反応を生成する新しいフレームワーク(ReactFace)を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:48:12 GMT)
Discrete-state Continuous-time Diffusion for Graph Generation [46.6] 拡散生成モデルはグラフ生成タスクに適用されている。
離散状態連続時間設定でグラフ拡散生成を定式化する。
提案モデルでは,最先端のグラフ生成ソリューションと競合する経験的性能を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:19:26 GMT)
Towards Intelligent Augmented Reality (iAR): A Taxonomy of Context, an Architecture for iAR, and an Empirical Study [46.2] iARにおける文脈認識推論と適応のためのフレームワークを提案する。
ユーザ動作を観察し,ユーザのパフォーマンス,コンテキスト,ユーザ指定のARインターフェースへの適応を記録可能な経験的AR実験を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:52:43 GMT)
Extracting Unlearned Information from LLMs with Activation Steering [46.2] トレーニング後のモデルからセンシティブな知識を取り除くソリューションとして、アンラーニングが登場した。
本研究では,未学習モデルからの正確な情報検索手法として,アクティベーションステアリングを提案する。
その結果,未学習モデルからの正確な情報検索が可能であることが示され,現在の未学習手法の深刻な脆弱性が浮き彫りにされている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:42:56 GMT)
Can Large Language Models generalize analogy solving like people can? [46.0] 人には「体 : 足 : テーブル :」のような類似を解く能力が幼少期に出現する。
近年の研究では、大規模言語モデル(LLM)が様々な種類の類似を解くことができることが示されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:18:38 GMT)
Diffusion-based Generative Multicasting with Intent-aware Semantic Decomposition [45.7] 我々は,事前学習した拡散モデルを用いた意図認識型セマンティック・マルチキャスト・フレームワークを開発した。
提案するフレームワークでは,送信者が複数の意味クラスに対して,複数のユーザ意図に基づいてソース信号を分解する。
シミュレーションの結果,非生成型および意図不明なマルチキャストベンチマークと比較すると,ユーザ毎のレイテンシが有意に低減された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:58:54 GMT)
Spectral Adapter: Fine-Tuning in Spectral Space [45.7] 本研究では, 既訓練重量行列のスペクトル情報を微調整手順に組み込むことにより, 現在のPEFT法の強化について検討した。
提案するファインチューニングモデルにより,パラメータ効率とチューニング性能が向上し,マルチアダプタ融合のメリットが期待できることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:35:19 GMT)
GSCo: Towards Generalizable AI in Medicine via Generalist-Specialist Collaboration [45.4] 汎用基礎モデル(GFM)は、様々なタスクやモダリティを効果的に一般化する際、その例外的な能力と柔軟性で有名である。
本研究では,GFMとスペシャリストモデルの相乗効果について検討し,より広い範囲で正確な医用画像解析を可能にする。
MedDr は医学用に調整された最大のオープンソース GFM であり、例外的な命令追従能力とコンテキスト内学習能力を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:54:21 GMT)
Quantum Implementation of Non-Positive-Operator-Valued Measurements in General Probabilistic Theories by Post-Selected POVMs [45.4] 一般確率論(GPT)の枠組みにおける非正の演算値測定(N-POVM)を扱う。
N-POVM測定は実装可能とはみなされていないが,本論文では,量子論におけるPOVM測定とポストセレクションによるN-POVM測定の実装方法について述べる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:01:27 GMT)
Eurekaverse: Environment Curriculum Generation via Large Language Models [45.1] Eurekaverseは、大規模言語モデルを用いて、スキルトレーニングのために徐々に困難な環境をサンプリングする教師なし環境設計アルゴリズムである。
本研究では,四足歩行学習におけるユーレカバースの有効性を検証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:54:00 GMT)
Multi-task Geometric Estimation of Depth and Surface Normal from Monocular 360° Images [45.1] 360deg画像から深度と表面の正規度を同時に推定する新しいマルチタスク学習(MTL)ネットワークを導入する。
実験結果から, MTLアーキテクチャは, 深さおよび表面の正規分布推定において, 最先端の手法よりも有意に優れていた。
我々のモデルの有効性と一般化性、特に複雑な表面テクスチャを扱う場合、360deg画像幾何推定における新しいベンチマークとして確立する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:20:22 GMT)
Optimizing random local Hamiltonians by dissipation [45.0] 簡単な量子ギブスサンプリングアルゴリズムが最適値の$Omega(frac1k)$-fraction近似を達成することを証明した。
この結果から, 局所スピンおよびフェルミオンモデルに対する低エネルギー状態の発見は量子的に容易であるが, 古典的には非自明であることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:21:16 GMT)
Soft Condorcet Optimization for Ranking of General Agents [44.9] AIモデルとエージェントの進歩を促進する一般的な方法は、標準化されたベンチマークでのパフォーマンスを比較することである。
本稿では,Soft Condorcet Optimization(SCO)と呼ばれる社会的選択フレームワークに着想を得た新しいランキング手法について述べる。
SCOランキングは、PrefLibオープンランキングアーカイブの865の選好プロファイルにまたがる正規化Kendall-Tau距離の最適ランキングから、平均0から0.043まで離れている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:09:42 GMT)
3D Audio-Visual Segmentation [44.6] ロボット工学やAR/VR/MRに様々な応用がある。
本稿では,事前学習した2次元オーディオ視覚基盤モデルから,使用可能な知識を統合することで特徴付ける新しいアプローチであるEchoSegnetを提案する。
実験により、EchoSegnetは、私たちの新しいベンチマークで、3D空間の音声オブジェクトを効果的にセグメント化できることが実証された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:30:14 GMT)
Enhancing Multiple Dimensions of Trustworthiness in LLMs via Sparse Activation Control [44.3] 大規模言語モデル(LLM)は、ヒューマンフィードバック(RLHF)からの強化学習において重要な研究領域となっている。
表現工学は、新しい、トレーニングなしのアプローチを提供する。
この手法は意味的特徴を利用してLLMの中間隠れ状態の表現を制御する。
正直さや安全性などの様々な意味内容を特異な意味的特徴に符号化することは困難である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:36:03 GMT)
DEFT: Efficient Fine-Tuning of Diffusion Models by Learning the Generalised $h$-transform [44.3] DFT(Doob's h-transform Efficient FineTuning)は、非常に小さなネットワークを微調整して条件付き$h$-transformを高速に学習する条件生成手法である。
画像再構成作業では, 自然画像の知覚品質と医用画像の再現性能を最良に保ちながら, 最大1.6$times$の高速化を実現している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:04:49 GMT)
Towards Pedagogical LLMs with Supervised Fine Tuning for Computing Education [44.2] 本稿では,大規模言語モデル(LLM)の教師付き微調整について検討し,コンピュータ教育における教育的アライメントを改善する。
このプロジェクトは、プログラミングコースのフォーラムから2500の高品質な質問/回答のペアのプロプライエタリなデータセットを利用した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:20:00 GMT)
Social Support Detection from Social Media Texts [44.1] ソーシャルメディアのような様々な相互作用やプラットフォームを通じて伝えられる社会支援は、所有意識を育む上で重要な役割を担っている。
本稿では,自然言語処理(NLP)タスクとしてのソーシャルサポート検出(SSD)について紹介する。
我々は1万のYouTubeコメントからなるデータセットで実験を行った。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:23:03 GMT)
PPLLaVA: Varied Video Sequence Understanding With Prompt Guidance [44.1] トークン圧縮と命令対応の視覚的特徴集約を同時に実現する新しいプーリング戦略を提案する。
我々のモデルはPPLLaVA(Prompt-guided Pooling LLaVA)と呼ばれる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:50:36 GMT)
Code-Switching Curriculum Learning for Multilingual Transfer in LLMs [43.9] 大規模言語モデル(LLM)は、様々なタスクにおいて、ほぼ人間レベルのパフォーマンスを示すが、その性能は、少数の高リソース言語の後、劇的に低下する。
第2言語習得の人的プロセスに触発されて,LLMの言語間移動を促進するためのCSCL(Code-Switching Curchical Learning)を提案する。
CSCLは,1)トークンレベルのコードスイッチング,2)文レベルのコードスイッチング,3)単言語コーパスからなるカリキュラムを用いて,段階的にモデルを訓練することで,人間の言語学習の段階を模倣する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:31:26 GMT)
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images [43.6] リモートセンシングコンテキストにセマンティックセグメンテーションを導入しようと試みる。
低解像度の特徴に対するリモートセンシング画像の感度のため、予測マスクには歪んだターゲット形状と不適合境界が示される。
トレーニング不要なスタイルで深部特徴の空間情報を復元する,シンプルで汎用的なアップサンプラーSimFeatUpを提案する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:33:16 GMT)
Near-Minimax-Optimal Distributional Reinforcement Learning with a Generative Model [42.9] モデルベース分散強化学習(RL)のための新しいアルゴリズムを提案する。
生成モデル(対数因子まで)で回帰分布を近似するのがminimax-Optimalであることが証明されている。
また、独立な関心を持つであろう新しい分布ベルマン方程式も導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:14:13 GMT)
N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs [42.4] コンテキスト内学習は、トランスフォーマーのようなモデルが重みを更新することなく、新しいタスクに適応できるようにする。
アルゴリズム蒸留(AD)のような既存のコンテキスト内RL手法では、大きく、慎重にキュレートされたデータセットが要求される。
本研究では,n-gram誘導ヘッドをインコンテキストRLの変換器に統合した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:31:03 GMT)
Probabilistic Forecasting with Coherent Aggregation [42.2] MQForecasterニューラルネットワークアーキテクチャを構築によりコヒーレンスを実現するための新しい深いガウス因子予測モデルで拡張する。
最先端のコヒーレント予測手法と比較して、DeepCoFactorはスケールしたCRPS予測精度を大幅に改善し、平均利得は15%である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:25:41 GMT)
Refining ADHD diagnosis with EEG: The impact of preprocessing and temporal segmentation on classification accuracy [41.9] 本研究は,脳波によるADHD診断の信頼性向上における前処理とセグメンテーションの重要性を強調した。
後の脳波セグメントで訓練されたモデルは、ADHDを識別する際の認知疲労の潜在的な役割を示唆し、かなり高い精度を実現した。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 08:31:03 GMT)
FactTest: Factuality Testing in Large Language Models with Statistical Guarantees [41.8] 幻覚や非現実的コンテンツを生成するための大規模言語モデル(LLM)は、高い領域での信頼性を損なう。
FactTest は LLM が与えられた質問に対する正しい回答を確実に提供できるかどうかを統計的に評価する新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:53:04 GMT)
Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion [41.5] Make-An-Agentは、行動から政治への生成のための新しいポリシーパラメータジェネレータである。
所望の行動の1つの実演をプロンプトとして、エージェントに対して制御ポリシーを生成する方法を示す。
また,Make-An-Agentによって生成されたポリシーを,ロコモーションタスク上で現実世界のロボットに展開する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:44:49 GMT)
Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion [41.5] Make-An-Agentは、行動から政治への生成のための新しいポリシーパラメータジェネレータである。
所望の行動の1つの実演をプロンプトとして、エージェントに対して制御ポリシーを生成する方法を示す。
また,Make-An-Agentによって生成されたポリシーを,ロコモーションタスク上で現実世界のロボットに展開する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:44:49 GMT)
Training-free Regional Prompting for Diffusion Transformers [41.5] 我々は、注意操作に基づくFLUX.1の地域的プロンプトを提案し、実装する。
これにより、微粒な合成テキスト・画像生成機能を持つDiTを、トレーニング不要な方法で実現できる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:59:05 GMT)
Large Language Model Compression with Neural Architecture Search [41.5] ニューラルアーキテクチャ検索を利用して、大きな言語モデルを圧縮する。
デバイス上でのレイテンシの高速化により,NASはMMLUの性能を最大3.4%向上することを示す。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 07:28:02 GMT)
Low-Resource Authorship Style Transfer: Can Non-Famous Authors Be Imitated? [41.4] オーサリングスタイルの転送は、本来の意味を保ちながら、ターゲットの作者のスタイルに合わせてテキストを変更することを含む。
低リソースなオーサリングスタイルの転送タスクを導入し、ターゲットのオーサリングスタイルに限られたテキストしか存在しないようにする。
実験では、Redditのソースとターゲットの作者を選択し、Redditの投稿を転送し、ターゲットの著者のスタイルのたった16の投稿(平均500ワード)に制限します。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:53:29 GMT)
Visual CoT: Advancing Multi-Modal Language Models with a Comprehensive Dataset and Benchmark for Chain-of-Thought Reasoning [41.0] MLLM(Multi-Modal Large Language Models)は様々なVQAタスクにおいて顕著な性能を示す。
解釈可能性に欠け、複雑な視覚的な入力に苦しむことが多い。
438k問合せ対からなる大規模Visual CoTデータセットを提案する。
視覚的な入力を動的に重視し,解釈可能な思考を提供するマルチターン処理パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:50:56 GMT)
Graph Edit Distance with General Costs Using Neural Set Divergence [40.8] グラフ編集距離(GED)は、2つのグラフ間の(dis-)類似性を測定する。
本稿では,編集作業に要する一般的なコストで動作可能なニューラルGED推定器である GraphEDX を提案する。
さまざまな編集コスト設定の下で、いくつかのデータセットの実験では、 GraphEDXが最先端の計算とメソッドを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 11:23:46 GMT)
Physically Based Neural Bidirectional Reflectance Distribution Function [40.7] 我々はPBNBRDFを物理ベースとしたニューラル双方向反射分布関数を導入する。
本モデルは,現実的なBRDFの物理特性を独自に保ちながら,現実世界の物質を正確に再構成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:17:44 GMT)
Nash CoT: Multi-Path Inference with Preference Equilibrium [40.5] CoT(Chain of Think)は、複雑な推論タスクにおいて、LLM(Large Language Models)のパフォーマンスを向上させるための推論フレームワークである。
より良い結果を得るためには、推論パスの数に最適な設定は存在しない。
アラビア推論,コモンセンス質問回答,シンボリック推論など,さまざまな推論タスクにおけるナッシュCoTの評価を行った。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 11:15:28 GMT)
Fast yet Safe: Early-Exiting with Risk Control [40.4] 早期排他ニューラルネットワーク(EENN)は中間層を脱出させ、早期に予測を生成することによって推論を加速する。
しかし、EENNの根本的な問題は、パフォーマンスを著しく低下させることなく、いつ終了するかを決定する方法である。
リスクコントロールは、EENNのエグジットメカニズムをチューニングし、アウトプットが十分な品質の場合にのみ発生する、分散のないポストホックソリューションを提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:48:10 GMT)
Metric Flow Matching for Smooth Interpolations on the Data Manifold [40.2] Metric Flow Matching (MFM) は条件付きフローマッチングのための新しいシミュレーションフリーフレームワークである。
我々は,MFMを条件付き経路のフレームワークとして提案し,ソース分布をターゲット分布に変換する。
我々は、LiDARナビゲーション、未ペア画像翻訳、セルラーダイナミクスのモデリングなど、一連の課題でFMをテストする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:02:49 GMT)
Bethe Ansatz, Quantum Circuits, and the F-basis [40.0] 決定論的量子アルゴリズムは「代数Bethe回路」と呼ばれ、スピン1/2XXZモデルのためにBethe状態を作成するために開発された。
代数Bethe回路は補助空間における基底の変化によって導出可能であることを示す。
我々は、不均質スピン-1/2 XXZモデルのための新しい量子回路を提示することで、我々のアプローチを実証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:01:41 GMT)
ReDel: A Toolkit for LLM-Powered Recursive Multi-Agent Systems [39.9] ReDelはマルチエージェントシステムを構築するためのツールキットである。
カスタムツールの使用、デリゲートスキーム、イベントベースのロギング、インタラクティブなリプレイをサポートする。
私たちのコード、ドキュメンテーション、およびPyPIパッケージはオープンソースで、MITライセンス下で自由に使用できます。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 19:16:19 GMT)
Fixing the Loose Brake: Exponential-Tailed Stopping Time in Best Arm Identification [39.8] 固定された信頼設定では、アルゴリズムはデータ依存的に停止し、推定されたベストアームを正当性保証で返さなければならない。
私たちは、この不可能なイベントが、いくつかの人気のあるアルゴリズムで実際に起こりうることを証明しています。
最初のアルゴリズムはSequential Halvingと呼ばれる固定予算アルゴリズムと2倍のトリックに基づいている。
第2のアルゴリズムは、確度の高い任意の信頼度アルゴリズムを高い確率で阻止し、指数関数的に制限された停止時間を楽しむアルゴリズムに変換するメタアルゴリズムである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:26:05 GMT)
Modelling Realistic Multi-layer devices for superconducting quantum electronic circuits [39.6] 本稿では,3次元多層デバイスに特化して設計された数値モデルを提案する。
物理配置を近似したり、構成材料の数を制限したりしません。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:36:48 GMT)
Gradient Descent on Logistic Regression with Non-Separable Data and Large Step Sizes [38.6] 我々は,大きく,一定のステップサイズを持つロジスティック回帰問題における降下ダイナミクスについて検討した。
局所収束は臨界ステップサイズより小さい全てのステップサイズに対して保証されるが、大域収束は保証されない。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:23:23 GMT)
Agnostic Learning of General ReLU Activation Using Gradient Descent [38.3] ReLU関数のバイアスがゼロでない場合、より困難なシナリオを考える。
適度なバイアスを持つ最良のReLU関数の最適誤差の定数係数内にある誤差を達成するReLU関数を見いだす。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:43:49 GMT)
ManiBox: Enhancing Spatial Grasping Generalization via Scalable Simulation Data Generation [37.7] bfManiBoxは、シミュレーションベースの教師学生フレームワーク上に構築された新しいバウンディングボックス誘導操作手法である。
ManiBoxは、空間的把握の一般化と多様なオブジェクトや背景への適応性を著しく改善した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:05:02 GMT)
Advanced XR-Based 6-DOF Catheter Tracking System for Immersive Cardiac Intervention Training [37.7] 本稿では, 心内心エコー法(ICE)カテーテルのリアルタイム3次元追跡と可視化のための新しいシステムを提案する。
カスタム3Dプリントされたセットアップは、カテーテルのバイプレーンビデオをキャプチャし、特殊なコンピュータビジョンアルゴリズムは、その3D軌跡を再構築する。
システムのデータは、Meta Quest 3 XRヘッドセットを通じてレンダリングされる、インタラクティブなUnityベースの環境に統合される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:05:40 GMT)
Prompting with Phonemes: Enhancing LLM Multilinguality for non-Latin Script Languages [37.5] そこで本研究では,音声の書き起こしを補完信号として活用し,スクリプト不変表現を誘導する手法を提案する。
本研究は,非ラテン系言語とラテン系言語の両方で音声信号の統合により性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:59:51 GMT)
Is A Picture Worth A Thousand Words? Delving Into Spatial Reasoning for Vision Language Models [37.4] 本研究では,空間推論の多様な側面をカバーする新しいベンチマークであるSpatialEvalを提案する。
我々は、競合する言語と視覚言語モデルを総合的に評価する。
文献で見過ごされてきたいくつかの反直感的な洞察が明らかとなった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:51:07 GMT)
On the Utilization of Unique Node Identifiers in Graph Neural Networks [37.1] グラフニューラルネットワークは、メッセージパッシング構造のため、本質的に表現上の制限がある。
最近の研究は、ユニークなノード識別子(UID)を使用することでこれらの制限を克服できることを示唆している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:03:52 GMT)
Predicting the Temperature-Dependent CMC of Surfactant Mixtures with Graph Neural Networks [36.8] 界面活性剤は、様々な産業で発泡および浄化の鍵となる材料である。
実際には、界面活性剤の混合物は通常、性能、環境、コストの理由から使用される。
本研究では,CMCの温度依存性を予測するため,界面活性剤混合物のグラフニューラルネットワークフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:17:57 GMT)
NeRF-Aug: Data Augmentation for Robotics with Neural Radiance Fields [36.5] NeRF-Augは、データセットに存在しないオブジェクトと対話するためのポリシーを教えることができる。
実験データを持たない11個の新しいオブジェクトを用いた4つのタスクに対して,本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:59:36 GMT)
Segment Anything for Dendrites from Electron Microscopy [36.3] EM画像中のデンドライトのインタラクティブかつ自動セグメンテーションのためのセグメンテーションに基づく視覚基盤モデルであるデンドライトSAMを提案する。
このモデルは、健康な海馬ラットの高分解能EMデータに基づいて訓練され、病気のラットとヒトのデータで試験される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:54:26 GMT)
Iterative Qubit Coupled Cluster using only Clifford circuits [36.1] 古典的に容易に生成できる理想的な状態準備プロトコルを特徴付けることができる。
繰り返し量子ビット結合クラスタ(iQCC)の変種を導入して,これらの要件を満たす手法を提案する。
本研究では, チタン系化合物Ti(C5H5)(CH3)3と (20, 20) 活性空間の複雑な系に研究を拡張した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:23:25 GMT)
GestureGPT: Toward Zero-Shot Free-Form Hand Gesture Understanding with Large Language Model Agents [35.5] 本稿では,人間のジェスチャー理解を模倣する自由形式の手ジェスチャー理解フレームワークであるGestureGPTを紹介する。
我々のフレームワークは、複数の大規模言語モデルエージェントを利用してジェスチャーや文脈情報を管理し、合成する。
私たちは、スマートホームコントロールとオンラインビデオストリーミングという2つの現実シナリオの下で、私たちのフレームワークをオフラインで検証しました。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:48:42 GMT)
Word Embedding Dimension Reduction via Weakly-Supervised Feature Selection [34.2] 語彙が大きくなるにつれて、ベクトル空間の次元は増加し、それが膨大なモデルサイズに繋がる。
本稿では,単語埋め込み次元の減少について検討する。
本稿では,WordFS という機能選択手法を提案する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 09:52:25 GMT)
EmoSphere-TTS: Emotional Style and Intensity Modeling via Spherical Emotion Vector for Controllable Emotional Text-to-Speech [34.0] EmoSphere-TTSは球面感情ベクトルを用いて表現的感情音声を合成し、合成音声の感情的スタイルと強度を制御する。
マルチアスペクト特性を反映して生成した音声の品質を向上させるための2つの条件付き対向ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:39:21 GMT)
Low-Rank Tensors for Multi-Dimensional Markov Models [33.4] 多次元状態空間上の遷移確率を表す低ランクテンソルを提案する。
提案したモデルでは,行列ベースのアプローチよりも少ないパラメータで類似表現が得られる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:06:49 GMT)
Federated Graph Learning for Cross-Domain Recommendation [33.3] クロスドメインレコメンデーション(CDR)は、ソースドメインとターゲットドメイン間の知識伝達を可能にすることで、データ空間の問題に対する有望な解決策を提供する。
我々は、複数のソースドメインからの肯定的な知識を安全かつ効果的に活用する新しいグラフ学習フレームワークであるFedGCDRを提案する。
我々は、Amazonデータセットの16のポピュラーなドメインに関する広範な実験を行い、FedGCDRが最先端の手法を大幅に上回っていることを実証した。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:50:41 GMT)
Towards certification: A complete statistical validation pipeline for supervised learning in industry [33.0] 本稿では,ディープラーニング,最適化,統計的手法を統合した完全検証パイプラインについて概説する。
本稿では,このパイプラインの空調設計における現実的な教師付き問題への適用について述べる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:27:32 GMT)
AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents [32.6] 我々は,AndroidLabをシステマティックなAndroidエージェントフレームワークとして提案する。
異なるモダリティ、アクションスペース、再現可能なベンチマークを備えた運用環境を含む。
大規模言語モデル(LLM)とマルチモーダルモデル(LMM)の両方を同一のアクション空間でサポートする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:57:31 GMT)
Bridge-IF: Learning Inverse Protein Folding with Markov Bridges [32.5] 逆タンパク質折り畳みは計算タンパク質設計の基本的な課題である。
逆折り畳みのための生成拡散ブリッジモデルであるBridge-IFを提案する。
以上の結果から,Bridge-IFは配列回復において既存のベースラインを超え,高い折りたたみ性を有する可塑性タンパク質の設計に優れることがわかった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:35:14 GMT)
A Comprehensive Survey of Small Language Models in the Era of Large Language Models: Techniques, Enhancements, Applications, Collaboration with LLMs, and Trustworthiness [31.8] 小言語モデル(SLM)は、低推論のレイテンシ、コスト効率性、効率的な開発、カスタマイズと適応性に対して、ますます好まれています。
これらのモデルは、リソース制限された環境とドメイン知識の獲得に特に適しています。
資源制約のある設定に特化タスクと適合性を持たせる能力によってSLMを定義することを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:43:01 GMT)
KptLLM: Unveiling the Power of Large Language Model for Keypoint Comprehension [31.3] さまざまなタスクシナリオでキーポイントを理解することを目的としたセマンティック・キーポイントを紹介します。
また,KptLLMは,識別・検出戦略を利用する統一型マルチモーダルモデルである。
KptLLMは様々なモダリティ入力を順応的に処理し、意味内容とキーポイント位置の両方の解釈を容易にする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:42:24 GMT)
Context Parallelism for Scalable Million-Token Inference [31.2] 本手法は,Llama3 405Bモデルを77秒間(並列化効率93%,FLOPS利用63%),128Kコンテキストプリフィル3.8秒間)で1Mのコンテキストプリフィルを実現する。
提案手法は,中から低のホスト間帯域を持つ一般的な商用データセンターを用いて,十分にスケール可能であることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:15:36 GMT)
One VLM to Keep it Learning: Generation and Balancing for Data-free Continual Visual Question Answering [31.0] VLM(Vision-Language Models)は、Webスケールのマルチモーダルデータセットを活用することで、VQA(Visual Question Answering)タスクにおいて大きな可能性を秘めている。
これらのモデルは、新しいタスクに適応する際に破滅的な忘れ物のために、継続的な学習に苦しむことが多い。
本稿では,外部モデルに頼るのではなく,VLMの言語生成能力を活用した最初のデータフリー手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:04:59 GMT)
Grammar-Aligned Decoding [31.0] LLM(Large Language Models)は、プログラムコード、数学的公式、整形されたマークアップなどの高度に構造化された出力を確実に生成するのに苦労する。
制約付き復号法は、LLMが出力できるトークンを各ステップで厳格に制限し、出力が与えられた制約と一致することを保証することによってこの問題を軽減する。
本稿では,GCD技術がLLMの分布を歪め,文法的だがLLMに比例しない確率で現れる出力を導出することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:04:00 GMT)
WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning [30.6] 大規模言語モデル(LLM)は、特にWebベースのタスクにおいて、自律エージェントとして顕著な可能性を示している。
本稿では,オープン LLM を用いた高性能 Web エージェントの学習を目的とした,自己進化型オンラインカリキュラム強化学習フレームワーク WebRL を紹介する。
オープンなLlama-3.1およびGLM-4モデルをWebエージェントに変換するためにWebRLを適用した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:59:58 GMT)
FedASTA: Federated adaptive spatial-temporal attention for traffic flow prediction [30.3] モバイルデバイスとIoT(Internet of Things)デバイスは、今日では大量の異種空間時間データを生成している。
プライバシーの懸念の下で空間的時間的ダイナミクスをモデル化することは依然として難しい問題である。
動的空間時間関係をモデル化するための新しいFedASTAフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:10:00 GMT)
ElasTST: Towards Robust Varied-Horizon Forecasting with Elastic Time-Series Transformer [30.2] 本稿では弾性時間列変換器(ElasTST)の設計と評価を通してギャップを埋める。
ElasTSTモデルは、プレースホルダーと構造化された自己注意マスクを備えた非自己回帰設計を取り入れている。
回転位置埋め込みの調整可能なバージョンもElasTSTに統合され、時系列固有の周期をキャプチャする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:28:49 GMT)
IRS-Enhanced Secure Semantic Communication Networks: Cross-Layer and Context-Awared Resource Allocation [30.0] eavesdroppingの課題は、無線通信のオープンな性質のため、セマンティックプライバシに深刻な脅威をもたらす。
本稿では,タスク指向のセマンティック視点から物理層セキュリティを保証するために,インテリジェント反射面(IRS)強化セキュアセマンティック通信(IRS-SSC)を提案する。
本研究では,高次元意味空間と可観測系状態空間を融合させる新しい意味認識状態空間(SCA-SS)を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:40:30 GMT)
Cross-Entropy Is All You Need To Invert the Data Generating Process [29.9] 経験的現象は、教師付きモデルが線形な方法で変化の解釈可能な要因を学習できることを示唆している。
近年の自己教師型学習の進歩により,データ生成過程を反転させることで潜在構造を復元できることが示されている。
標準分類タスクにおいても,モデルが線形変換までの変動の基底構造因子の表現を学習することが証明された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:36:17 GMT)
Formal Theorem Proving by Rewarding LLMs to Decompose Proofs Hierarchically [29.9] 本稿では,自動検証/評価を可能にする形式言語による証明記述能力の向上に焦点をあてる。
我々は、定理に直接関係する補題がテスト時の定理証明者に与えられないより自然な設定で作業する。
我々は、モデルが定理を補題に分解し、補題を証明し、補題を用いて定理を証明することを奨励するRLベースの訓練アルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:57:40 GMT)
Bootstrapping Top-down Information for Self-modulating Slot Attention [29.8] トップダウン経路を組み込んだ新しいOCLフレームワークを提案する。
この経路は個々のオブジェクトのセマンティクスをブートストラップし、モデルを変更してこれらのセマンティクスに関連する特徴を優先順位付けする。
我々のフレームワークは、複数の合成および実世界のオブジェクト発見ベンチマークにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:00:49 GMT)
ChatTracker: Enhancing Visual Tracking Performance via Chatting with Multimodal Large Language Model [29.7] Vision-Language(VL)トラッカーは、様々なアプリケーションにおける汎用性を高めるために、追加の自然言語記述を活用することを提案している。
VLトラッカーは、追跡性能の点で依然としてState-of-The-Art (SoTA)ビジュアルトラッカーより劣っている。
本稿では,MLLM(Multimodal Large Language Model)における多言語知識の豊富な活用を目的としたChatTrackerを提案し,高品質な言語記述を生成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:43:55 GMT)
Collective Model Intelligence Requires Compatible Specialization [29.6] モデルが専門化するにつれて、特徴空間構造における類似性が減少し、集合的使用能力の妨げとなることを示す。
我々は、互換性のある特殊化と呼ばれるものを通して、集合モデルインテリジェンスを達成するための新しい方向を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:59:16 GMT)
Transferable Sequential Recommendation via Vector Quantized Meta Learning [29.5] 転送可能なシーケンシャルレコメンデータ(MetaRec)のためのベクトル量子化メタ学習を提案する。
提案手法では,複数のソースドメインからのユーザ・イテムインタラクションを活用して,対象ドメインの性能を向上させる。
提案手法の有効性を検証するため,ベンチマークデータセット上で広範囲な実験を行った。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:16:11 GMT)
Seq-VCR: Preventing Collapse in Intermediate Transformer Representations for Enhanced Reasoning [29.4] 我々は,モデル中間層における表現の崩壊を,その推論能力を制限する重要な要因として認識する。
本稿では、中間表現のエントロピーを高め、崩壊を防止するシークエンシャル変数共分散正規化(Seq-VCR)を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:14:07 GMT)
Improving Trust Estimation in Human-Robot Collaboration Using Beta Reputation at Fine-grained Timescales [28.8] ベータ評価は、人間の信頼を数学的に推定する一般的な方法である。
これはバイナリパフォーマンスに依存しており、各タスクの終了後にのみ信頼推定を更新する。
本稿では,詳細な時間スケールでのベータ評価を用いた信頼度推定のための新しい枠組みを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:46:24 GMT)
F-OAL: Forward-only Online Analytic Learning with Fast Training and Low Memory Footprint in Class Incremental Learning [28.8] Online Class Incremental Learning (OCIL)は、ミニバッチにデータが到着し、以前のデータがアクセスできないようなモデルを段階的にトレーニングすることを目的としている。
OCILにおける大きな課題は、カタストロフィック・フォージッティング(Caastrophic Forgetting)、すなわち、以前に学んだ知識の喪失である。
本稿では,前向きのみのオンライン分析学習(F-OAL)を提案する。
従来の方法とは異なり、F-OALはバックプロパゲーションに依存しておらず、フォワードのみであり、メモリ使用量と計算時間を著しく削減している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:48:10 GMT)
ChartGemma: Visual Instruction-tuning for Chart Reasoning in the Wild [28.6] 本稿では,PaliGemma上で開発された新しいチャート理解と推論モデルであるChartGemmaを紹介する。
基礎となるデータテーブルに頼るのではなく、ChartGemmaは、チャートイメージから直接生成されたインストラクションチューニングデータに基づいて訓練される。
我々の単純なアプローチは、チャートの要約、質問応答、ファクトチェックにまたがる5ドルのベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 04:59:45 GMT)
ManiWAV: Learning Robot Manipulation from In-the-Wild Audio-Visual Data [28.4] 我々は,同期音声と視覚的フィードバックを伴って人体でのデモを収集する「アー・イン・ハンド」データ収集装置であるManiWAVを紹介する。
また,本システムでは,多種多様な人間の実演から学習することで,未知の環境に一般化できることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:21:30 GMT)
DTGB: A Comprehensive Benchmark for Dynamic Text-Attributed Graphs [28.3] 動的テキスト分散グラフ(DyTAG)は、様々な実世界のシナリオで一般的である。
幅広い適用性にもかかわらず、DyTAGに合わせたベンチマークデータセットは、顕著に不足している。
大規模な時間進化グラフのコレクションである動的テキスト分散グラフベンチマーク(DTGB)を導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:38:35 GMT)
A Multi-Task Role-Playing Agent Capable of Imitating Character Linguistic Styles [28.2] 現在のロールプレイングエージェント(RPAs)は、主に言語のスタイルの複製を無視しながら、キャラクターの基本属性を模倣することに焦点を当てている。
ダイアログ,辞書,コンポジション,ストーリ生成,製品記述,音楽解説,オープン質問回答を含む7つのタスクにおいて,近年のオープンソースLLMとRPAのベースラインを著しく上回るマルチタスクロールプレイングエージェント(MRPA)であるStyleRPAを開発した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:26:27 GMT)
Finding NeMo: Localizing Neurons Responsible For Memorization in Diffusion Models [28.0] DMのクロスアテンション層において,個々のデータサンプルの記憶をニューロンのレベルまでローカライズする最初の方法であるNeMoを導入する。
これらの記憶ニューロンを非活性化することにより、推論時のトレーニングデータの複製を回避し、生成した出力の多様性を高め、プライベートおよび著作権データの漏洩を軽減することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:52:09 GMT)
LuaTaint: A Static Analysis System for Web Configuration Interface Vulnerability of Internet of Things Devices [28.0] 本研究では,IoTデバイスの一般的なWeb設定インターフェースとして,LuaTaintと呼ばれる自動脆弱性検出システムを導入する。
LuaTaintは静的なテイント解析と大きな言語モデル(LLM)を組み合わせることで、広範かつ高精度な検出を実現する。
LuaTaintのプロトタイプを開発し、著名な11ベンダの2,447のIoTファームウェアサンプルを使用して評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:54:04 GMT)
Scalable Efficient Training of Large Language Models with Low-dimensional Projected Attention [27.5] 低ランク事前学習は、通常効率的な方法と考えられているが、削減されたパラメータが的確にターゲットされた場合、非常に効果的であることが判明した。
我々は,この構造を低次元投影注意(LPA)と呼び,説明分析を行う。
以上の結果から,LPAモデルでは最大12.4%の時間節約が可能であり,バニラ変圧器と比較して,テストパープレキシティ(ppl)および下流タスクの約5%の改善が達成されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:06:17 GMT)
Manipulation Facing Threats: Evaluating Physical Vulnerabilities in End-to-End Vision Language Action Models [27.2] 視覚言語行動モデル(VLAM)は、ロボット操作タスクのオープン語彙シナリオにおいて、より良いパフォーマンスを達成するために提案されている。
本稿では,潜在的な物理的脅威に直面したVLAMを包括的に評価する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 14:48:23 GMT)
Manipulation Facing Threats: Evaluating Physical Vulnerabilities in End-to-End Vision Language Action Models [27.2] 視覚言語行動モデル(VLAM)は、ロボット操作タスクのオープン語彙シナリオにおいて、より良いパフォーマンスを達成するために提案されている。
本稿では,潜在的な物理的脅威に直面したVLAMを包括的に評価する。
PVEPの物理的脅威には、特にOut-of-Distribution、タイポグラフィーベースのビジュアルプロンプト、Adversarial Patch Attacksが含まれる。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 14:48:23 GMT)
Learning Where to Edit Vision Transformers [27.0] コンピュータビジョンにおける視覚変換器(ViT)の編集のための位置情報編集手法を提案する。
我々はまず、CutMix拡張データ上でハイパーネットワークをメタラーニングすることで、位置から編集までの課題に対処する。
提案手法を検証するため, サブポピュレーションシフトを導入した編集ベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:17:40 GMT)
PT43D: A Probabilistic Transformer for Generating 3D Shapes from Single Highly-Ambiguous RGB Images [26.9] 本稿では,1枚のRGB画像から3次元形状を生成するトランスフォーマーを用いた自己回帰モデルを提案する。
フィールド・オブ・ビュー・トランケーションのような現実的なシナリオを扱うために、シミュレーション画像と形状のトレーニングペアを作成します。
次に、入力画像から最も関連性の高い領域を効果的に識別し、形状生成を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:48:54 GMT)
Vision-Aware Text Features in Referring Image Segmentation: From Object Understanding to Context Understanding [26.8] 本稿では,人間の認知プロセスに触発された対象と文脈の理解を強調する新しい枠組みを提案する。
提案手法は,3つのベンチマークデータセットにおいて,大幅な性能向上を実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:43:17 GMT)
EmoSphere++: Emotion-Controllable Zero-Shot Text-to-Speech via Emotion-Adaptive Spherical Vector [26.7] EmoSphere++は感情制御可能なゼロショットTSモデルで、感情のスタイルや強度をコントロールでき、自然な人間の音声に似ています。
人間のアノテーションを使わずに感情のスタイルや強度をモデル化する,感情適応型球面ベクトルを新たに導入する。
条件付きフローマッチングに基づくデコーダを用いて,数ステップのサンプリングで高品質で表現力のある感情的TSを実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:33:56 GMT)
Wave Network: An Ultra-Small Language Model [26.7] 本稿では,新しい超小言語モデルであるWave Networkにおいて,革新的なトークン表現と更新手法を提案する。
入力テキストのグローバルなセマンティクスとローカルなセマンティクスの両方を符号化し、各トークンを表現するためにtextbfcomplex ベクトルを使用する。
AG Newsテキスト分類タスクの実験では、ランダムなトークン埋め込みから複雑なベクトルを生成する場合、波動干渉で90.91%、波動変調で91.66%の精度が得られる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:21:12 GMT)
SAFE: Slow and Fast Parameter-Efficient Tuning for Continual Learning with Pre-Trained Models [26.5] 継続的な学習は、過去の知識を忘れることに抵抗しながら、データストリームにおける新しい概念を漸進的に獲得することを目的としている。
強力な事前学習モデル(PTM)の台頭に伴い、インクリメンタル学習システムのトレーニングへの関心が高まっている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:34:30 GMT)
Typicalness-Aware Learning for Failure Detection [26.2] ディープニューラルネットワーク(DNN)は、しばしば自信過剰な問題に悩まされる。
そこで本研究では,本問題に対処し,故障検出性能を向上させるために,S typicalness-Aware Learning (TAL) と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:09:47 GMT)
DeSparsify: Adversarial Attack Against Token Sparsification Mechanisms in Vision Transformers [25.6] DeSparsifyはトークンスペーサー機構を用いた視覚変換器の可用性を狙った攻撃である。
この攻撃は、ステルス性を維持しながら、オペレーティングシステムのリソースを浪費することを目的としている。
攻撃の影響を軽減するため,様々な対策を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:48:19 GMT)
Have You Merged My Model? On The Robustness of Large Language Model IP Protection Methods Against Model Merging [25.3] モデル統合シナリオにおけるIP保護手法の堅牢性に関する最初の研究を行う。
実験結果から,現在のLarge Language Model (LLM) の透かし技術は統合されたモデルでは生き残れないことが示唆された。
本研究の目的は,モデルIP保護手法の堅牢性評価において,モデルマージが不可欠であることを示すことである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:42:01 GMT)
Why Do We Need Weight Decay in Modern Deep Learning? [24.8] 重崩壊は、画像分類から大規模言語モデルまで、最先端の深層ネットワークを訓練するための技術である。
本研究では,現代深層学習における重量減衰の役割が,古典的学習理論で研究される正規化効果と異なる点を強調する。
マルチパスSGDで訓練された視覚タスクのディープネットワークにおいて、重み劣化がSGDの暗黙の正則化を促進する最適化力学をどのように修正するかを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:21:13 GMT)
Detect an Object At Once without Fine-tuning [24.6] 1)シーンイメージと所定のオブジェクトイメージパッチ(es)を連結して、SDM内のハイライト領域が可能な場所を示すようにした類似度密度マップ(SDM)を生成すること、(2)リージョンアライメントネットワーク(RAN)を介してシーン内のオブジェクト占有領域を取得すること、の2つのフェーズで構成されている。
RANはディープ・シームズ・ネットワーク(DSN)のバックボーン上に構築されており、従来のDSNとは違って、SDMのハイライト領域で示される地上の真実と予測領域の場所と地域差を回帰することで、オブジェクトの正確な領域を得る。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:38:32 GMT)
Tabular Data Synthesis with Differential Privacy: A Survey [24.5] データ共有はコラボレーティブなイノベーションの前提条件であり、さまざまなデータセットを活用して深い洞察を得ることを可能にします。
データ合成は、実際のデータの統計特性を保存する人工データセットを生成することで、この問題に対処する。
プライバシーに配慮したデータ共有に対する、有望なアプローチとして、異なるプライベートなデータ合成が登場している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:32:48 GMT)
Exploring Optimal Transport-Based Multi-Grained Alignments for Text-Molecule Retrieval [24.1] 最適TRansportに基づく多粒度アライメントモデル(ORMA)を導入する。
ORMAは、テキスト記述と分子間の多義的なアライメントを促進する新しいアプローチである。
ChEBI-20データセットとPCdesデータセットの実験結果から、ORMAが既存のSOTA(State-of-the-art)モデルを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:30:52 GMT)
Best-Arm Identification in Unimodal Bandits [24.0] 本研究では, 固定信頼度ベストアーム識別問題について検討する。
我々は任意の境界の停止時間で2つ下げる。
腕の数に対する線形依存は、信頼性に依存しないコストでは避けられないことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:05:11 GMT)
Mining and Transferring Feature-Geometry Coherence for Unsupervised Point Cloud Registration [23.9] そこで本研究では,INEGERと呼ばれる新規な教師なし登録手法を提案し,信頼性の高い擬似ラベルマイニングに高レベルのコンテキスト情報を組み込む。
具体的には,教師がトレーニング中のデータの各ミニバッチに対して動的に適応し,信頼性の高い擬似ラベルを発見するための特徴幾何コヒーレンスマイニングモジュールを提案する。
最後に、密度不変の特徴を学習するための混合密度学生を紹介し、屋外シナリオにおける密度変動と低重なりに関する課題に対処する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:57:44 GMT)
See it, Think it, Sorted: Large Multimodal Models are Few-shot Time Series Anomaly Analyzers [23.7] 時系列データの急激な増加に伴い,時系列異常検出(TSAD)はますます重要になりつつある。
本稿では,TMA(Time Series Anomaly Multimodal Analyzer)と呼ばれる先駆的なフレームワークを導入し,異常の検出と解釈を両立させる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:28:41 GMT)
DU-Shapley: A Shapley Value Proxy for Efficient Dataset Valuation [23.6] 我々は、データセットのバリュエーションの問題、すなわち、インクリメンタルゲインを定量化する問題を考える。
Shapleyの値は、その正式な公理的正当化のためにデータセットのバリュエーションを実行する自然なツールである。
本稿では,離散一様分布下での予測として表現される離散一様シャプリーと呼ばれる新しい近似を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:52:19 GMT)
Effective Bilevel Optimization via Minimax Reformulation [23.5] ミニマックス問題としてバイレベル最適化の再構成を提案する。
穏やかな条件下では、これらの2つの問題が等価であることを示す。
提案手法は, 計算コストを大幅に削減しつつ, 最先端の2段階法より優れる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:09:11 GMT)
Targeted Learning for Variable Importance [23.4] 変数の重要性は、機械学習を解釈するための最も広く使われている手段の1つです。
本稿では,変数重要度に対する推論の堅牢性を高めるために,ターゲット学習(TL)フレームワークを用いた新しい手法を提案する。
i) 従来の手法の効率を保ち, (ii) 計算量に匹敵する複雑性を維持し, (iii) 精度を向上し, 特に有限サンプル文脈において有効であることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:14:45 GMT)
CSP-Net: Common Spatial Pattern Empowered Neural Networks for EEG-Based Motor Imagery Classification [23.3] 本稿では,CSPを用いた2つのニューラルネットワーク(CSP-Nets)を提案する。
CSP-Netsは知識駆動型CSPフィルタとデータ駆動型CNNを統合し、MI分類の性能を向上させる。
4つのパブリックMIデータセットの実験は、2つのCSP-NetがCNNのバックボーンよりも一貫して改善されていることを示した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:48:58 GMT)
Modulating State Space Model with SlowFast Framework for Compute-Efficient Ultra Low-Latency Speech Enhancement [23.1] 深層学習に基づく音声強調(SE)手法は、低レイテンシ要求を満たす必要がある場合、しばしば重要な計算課題に直面する。
本稿では,低遅延化が必要な場合の計算コストの削減を目的としたSlowFastフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:14:35 GMT)
SALSA: Soup-based Alignment Learning for Stronger Adaptation in RLHF [22.9] 本稿では、より柔軟でより良い位置参照モデルを作成することにより、制限を克服する新しいアプローチであるSALSAを提案する。
SALSAは、より良い探索を奨励し、より高い報酬を達成し、モデルの堅牢性、アウト・オブ・ディストリビューション、パフォーマンスを向上させる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:53:43 GMT)
So You Think You Can Scale Up Autonomous Robot Data Collection? [22.7] 強化学習(RL)には、自律的なデータ収集を可能にするという約束がある。
環境設計と計測に要する多大な労力のために、現実世界でのスケーリングは依然として困難である。
イミテーション・ラーニング (IL) の手法は環境設計の努力をほとんど必要とせず、人的監督を必要とする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:31:35 GMT)
Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation [22.7] Hunyuan3D-1.0はテキストおよび画像条件生成をサポートする2段階のアプローチである。
最初の段階では、約4秒で効率よくマルチビューRGBを生成するマルチビュー拡散モデルを用いる。
第2段階では、3Dアセットを迅速かつ忠実に再構築するフィードフォワード再構築モデルを導入する。
我々のフレームワークは、テキスト・ツー・イメージモデルであるHunyuan-DiTを伴い、テキスト・コンディショニングとイメージ・コンディショニングの両方の3D生成をサポートする統一的なフレームワークとなる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:21:42 GMT)
Interpreting CLIP with Sparse Linear Concept Embeddings (SpLiCE) [22.4] ここでは,CLIPの潜在空間のセマンティック構造を利用して解釈可能であることを示す。
本稿では,CLIP表現を,人間の解釈可能な概念の疎線形結合に変換するための新しい手法Sparse Linear Concept Embeddingsを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:28:54 GMT)
FedMoE-DA: Federated Mixture of Experts via Domain Aware Fine-grained Aggregation [22.3] Federated Learning(FL)は、複数のクライアントがプライベートデータを共有せずにモデルをトレーニングできる、コラボレーティブな機械学習アプローチである。
我々は、新しいドメイン認識、きめ細かい集約戦略を取り入れた新しいFLモデルトレーニングフレームワークであるFedMoE-DAを提案し、ロバスト性、パーソナライズ性、通信効率を同時に向上する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:29:04 GMT)
Amortized Bayesian Experimental Design for Decision-Making [22.3] 本稿では、下流決定ユーティリティの最大化を優先する、償却決定対応のBEDフレームワークを提案する。
本稿では,新しいアーキテクチャであるTransformer Neural Decision Process (TNDP)を導入する。
提案手法は複数のタスクにまたがって性能を実証し,情報的設計を実現し,正確な意思決定を容易にすることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:06:46 GMT)
PediatricsGPT: Large Language Models as Chinese Medical Assistants for Pediatric Applications [22.2] PedCorpusは、小児科の教科書、ガイドライン、知識グラフリソースから30万以上のマルチタスク・インストラクションを収集し、多様な診断要求を満たすための高品質なデータセットである。
PedCorpusを十分に設計した上で,系統的かつ堅牢なトレーニングパイプライン上に構築された,中国初の小児 LLM アシスタントであるPediatricsGPT を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:49:41 GMT)
Learning Versatile Skills with Curriculum Masking [22.1] 逐次意思決定のためのカリキュラムマスキング事前学習パラダイムであるCurrMaskを提案する。
CurrMaskは、カリキュラムで知識を整理して学習する方法に触発され、多様なスキルを学ぶための事前訓練中にマスクの仕組みを調整する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:40:59 GMT)
Benchmarking XAI Explanations with Human-Aligned Evaluations [22.0] PASTAはコンピュータビジョンにおけるXAI技術の人間中心評価のための新しいフレームワークである。
最初の重要な貢献は、4つの多様なデータセットにおけるXAI説明の人間による評価である。
2つ目の大きな貢献は、説明の解釈可能性を評価するためのデータベースのメトリクスです。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:18:20 GMT)
Sequential Decision Making with Expert Demonstrations under Unobserved Heterogeneity [22.0] 本研究では,未観測の文脈情報に基づいて意思決定を行った専門家による補助的な実演を行い,オンライン上での逐次意思決定の課題について検討する。
この設定は、自動運転車、ヘルスケア、金融など、多くのアプリケーション領域で発生します。
本稿では,学習者の意思決定問題に対する情報的事前分布を確立するために,Expers-as-Priorsアルゴリズム(ExPerior)を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:48:15 GMT)
Bypassing the Noisy Parity Barrier: Learning Higher-Order Markov Random Fields from Dynamics [22.0] 我々は、時間的相関サンプルからマルコフランダムフィールド(MRF)として知られるグラフィカルモデルを学ぶことの問題を考察する。
特に,Glauberのダイナミックスから,$widetildeO_k(n)$サイトの更新を$k$ MRFで行うと,$widetildeO_k(n2)$時間でグラフとパラメータを復元するアルゴリズムが存在することを示す。
私たちの結果は、MDFのより現実的で直感的に少ないモデルが、実際には効率をはるかに上回っていることを、驚くほど示しています。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 18:37:07 GMT)
Theory-inspired Label Shift Adaptation via Aligned Distribution Mixture [21.5] ADM(Aligned Distribution Mixture)という名称の革新的なラベルシフトフレームワークを提案する。
本フレームワークでは,分類器学習プロセスに修正を加えることで,4つの典型的なラベルシフト手法を改良する。
提案手法の特異性を考慮し,効率的な二段階最適化戦略を開発する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:51:57 GMT)
TableGPT2: A Large Multimodal Model with Tabular Data Integration [21.5] TableGPT2は、593.8K以上のテーブルと2.36Mの高品質なクエリテーブル出力を備えた、厳格に事前訓練および微調整されたモデルである。
TableGPT2の重要な革新の1つは、スキーマレベルとセルレベルの情報をキャプチャするために特別に設計されたテーブルエンコーダである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:03:13 GMT)
Generating executable oracles to check conformance of client code to requirements of JDK Javadocs using LLMs [21.1] 本稿では,広く使用されているJavaライブラリ,例えば java.lang や java.util パッケージのクライアントに対するテストオーラクルの自動化に焦点を当てる。
大規模な言語モデルを、テストオラクル自動化のフレームワークに関する洞察を具現化するための技術として使用しています。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:24:25 GMT)
Benchmarking Vision, Language, & Action Models on Robotic Learning Tasks [20.9] 視覚言語アクション(VLA)モデルは汎用ロボットシステムを開発する上で有望な方向を示す。
VLAモデルを評価するための総合的な評価フレームワークとベンチマークスイートを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:01:34 GMT)
PointNCBW: Towards Dataset Ownership Verification for Point Clouds via Negative Clean-label Backdoor Watermark [20.7] 我々は,点雲に対するクリーンラベルバックドアベースのデータセット透かしを提案し,有効性とステルス性の両方を保証する。
我々は、トリガーパターンを挿入する前に、形状的にも点的にも非ターゲットカテゴリの点雲を摂動する。
そのため、ウォーターマークされたデータセットでトレーニングされたモデルには、独特だがステルス的なバックドアの挙動がある。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 14:30:03 GMT)
Improving Scientific Hypothesis Generation with Knowledge Grounded Large Language Models [20.6] 大規模言語モデル(LLM)は、既存の知識を分析することによって、新しい研究の方向性を特定することができる。
LLMは幻覚を発生させる傾向がある。
我々は,知識グラフから外部構造的知識を統合することで,LLM仮説の生成を促進するシステムKG-CoIを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:50:00 GMT)
Scalable and Domain-General Abstractive Proposition Segmentation [20.5] 我々は、抽象命題セグメンテーション(APS)の課題に焦点を合わせ、テキストを単純で自己完結した、よく表現された文に変換する。
まず、タスクの評価基準を導入し、いくつかの品質の次元を計測する。
次に、スケーラブルで正確な命題セグメンテーションモデルを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:28:18 GMT)
Instance-dependent Label Distribution Estimation for Learning with Label Noise [20.5] 雑音遷移行列(NTM)推定はラベル雑音による学習に有望な手法である。
本稿では、画像分類のためのノイズラベルから学習するためのインスタンス依存ラベル分布推定(ILDE)手法を提案する。
提案手法は, 合成ノイズであっても実雑音であっても, 競合する全ての手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:32:22 GMT)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.5] 混合整数非NLPプログラム(MINLP)はエネルギーシステムや輸送など様々な領域で発生するが、解決は困難である。
機械学習の最近の進歩は、最適化のための学習として知られる領域において、顕著な成功をもたらしている。
勾配を保ちながら整数出力を生成する2つの異なる補正層を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:33:52 GMT)
Alignment-Based Adversarial Training (ABAT) for Improving the Robustness and Accuracy of EEG-Based BCIs [20.2] ABATは、敵の訓練の前にEEGデータアライメントを実行する。
データアライメントは、異なるドメインからのEEGトライアルを調整して、分散の相違を減らす。
敵の訓練は 分類境界をさらに強固にする
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:56:54 GMT)
Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis [20.2] Hyper-SDはODEトラジェクトリ保存と改革の利点を活かす新しいフレームワークである。
本稿では, 予め定義された時間ステップセグメント内で一貫した蒸留を行うために, トラジェクティブ・セグメンテッド・コンシスタンス蒸留を導入する。
人間のフィードバック学習を取り入れ、低段階のモデルの性能を高めるとともに、蒸留プロセスによって生じる性能損失を軽減する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:24:18 GMT)
Wasserstein Distributionally Robust Optimization: Theory and Applications in Machine Learning [20.1] 科学、工学、経済学における決定問題は、サンプルを通して間接的にしか観測できない不確実なパラメータによって影響を受ける。
データ駆動意思決定の目標は、見つからないテストサンプルでうまく機能する、有限個のトレーニングサンプルから決定を学習することである。
ワッサーシュタインの分布的ロバストな最適化が統計的学習に興味深い影響をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:44:17 GMT)
ACC-Debate: An Actor-Critic Approach to Multi-Agent Debate [20.0] 本稿では,アクタ・クリティカルをベースとした学習フレームワークACC-Debateを提案する。
ACC-Debate は幅広いベンチマークで SotA の議論手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:20:16 GMT)
From Imitation to Refinement -- Residual RL for Precise Assembly [20.0] 行動クローニング(BC)の最近の進歩は、アクション・チャンキングや拡散のように、目覚ましい進歩をもたらした。
私たちの重要な洞察は、チャンクされたBCポリシーがトラジェクティブプランナーとして機能し、長期のタスクを可能にします。
ResiP(Residual for Precise Manipulation)は、RLで訓練された完全閉ループ残差ポリシで、凍結したチャンクされたBCモデルを拡張することで、これらの課題をサイドステップで進める。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 18:54:23 GMT)
Reduce, Reuse, Recycle: Categories for Compositional Reinforcement Learning [19.8] 我々は圏論のプリズムを通してタスク構成を考察する。
マルコフ決定過程の分類的性質は、複雑なタスクを管理可能なサブタスクに切り離す。
実験結果は強化学習のカテゴリー理論を支持する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 14:06:02 GMT)
Real-Time Polygonal Semantic Mapping for Humanoid Robot Stair Climbing [19.8] 階段などの複雑な地形を探索するヒューマノイドロボットに適した,リアルタイムな平面意味マッピングのための新しいアルゴリズムを提案する。
奥行き画像上での異方性拡散フィルタを用いて,重要なエッジ情報を保持しつつ,勾配ジャンプからの雑音を効果的に最小化する。
提案手法は,30Hz以上のレートで1フレームをリアルタイムに処理し,詳細な平面抽出とマップ管理を迅速かつ効率的に行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:34:55 GMT)
Class-Conditioned Transformation for Enhanced Robust Image Classification [19.7] 本稿では,Adrial-versa-Trained (AT)モデルを強化する新しいテスト時間脅威モデルを提案する。
コンディショナル・イメージ・トランスフォーメーションとディスタンス・ベース・予測(CODIP)を用いて動作する。
提案手法は,様々なモデル,ATメソッド,データセット,アタックタイプに関する広範な実験を通じて,最先端の成果を実証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:05:51 GMT)
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning [19.2] Generative Trajectory Augmentation (GTA) は、トラジェクトリを高次かつ動的に検証可能なように拡張することで、オフラインデータを豊かにするように設計されている。
以上の結果から,GTAは汎用的なデータ拡張戦略として,広く使用されているオフラインRLアルゴリズムの性能向上を図っている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:51:13 GMT)
Gradient Methods with Online Scaling [19.2] オンライン学習による勾配に基づく手法の収束を加速する枠組みを提案する。
広範に使用される過勾配降下は勾配降下の収束により改善されることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:04:18 GMT)
Minder: Faulty Machine Detection for Large-scale Distributed Model Training [19.1] 大規模分散モデルトレーニングには、最大数千台のマシンで同時トレーニングが必要である。
故障検出は、マシン内で予期せぬ故障が発生した場合に重要である。
分散トレーニングタスクのための自動故障検出装置であるMinderを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:26:16 GMT)
Thinking Forward and Backward: Effective Backward Planning with Large Language Models [19.1] 大規模言語モデル(LLM)は、顕著な推論と計画能力を示した。
多くの計画問題は、目標から後方への計画が著しく容易になるような固有の非対称性を示す。
本稿では,LLMの後方計画アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:26:03 GMT)
User-wise Perturbations for User Identity Protection in EEG-Based BCIs [19.0] ユーザによる摂動を追加することで、EEG内のアイデンティティ情報を学習不能にできることを示す。
提案した摂動を脳波トレーニングデータに追加すると、BCIタスク情報が影響を受けないまま、データのユーザ識別情報が学習不能になる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:17:22 GMT)
How Does Gradient Descent Learn Features -- A Local Analysis for Regularized Two-Layer Neural Networks [18.8] 有用な特徴を学習する能力は、ニューラルネットワークの大きな利点の1つだ。
最近の研究は、ニューラルネットワークが機能学習を許さないニューラルネットワークカーネル(NTK)で動作可能であることを示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:02:25 GMT)
Do Advanced Language Models Eliminate the Need for Prompt Engineering in Software Engineering? [18.7] 本稿では,高度大言語モデル (LLM) の文脈における様々な迅速な工学的手法を再評価する。
以上の結果から, 先進モデルに適用した場合, 先進モデルに適用した場合, 早期のLLM開発技術により, メリットが低下したり, 性能が低下する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:56:37 GMT)
DualDn: Dual-domain Denoising via Differentiable ISP [18.6] DualDnは、新しい学習ベースの二重ドメイン記述である。
異なるノイズ分布とISP構成に適応する。
プラグ・アンド・プレイのデノナイジングモジュールとして、実際のカメラで再トレーニングすることなく使用できる。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 11:39:40 GMT)
Grouped Discrete Representation for Object-Centric Learning [18.4] 我々は,オブジェクト指向学習のためのtextitGroup Discrete Representation (GDR) を提案する。
GDRは、組織化されたチャネルグルーピングを通じて特徴を属性に分解し、これらの属性をインデックスを介して個別の表現に構成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:25:10 GMT)
Linear Causal Bandits: Unknown Graph and Soft Interventions [18.4] 因果バンディットのアルゴリズムを 設計するのは 2つの前提に依る
その一般的な形式、すなわち未知グラフと未知の介入モデルにおける問題は、まだ未解決のままである。
本稿は、この問題に対処し、N$ノードを持つグラフにおいて、最大$d$と最大$L$の因果経路長を持つグラフにおいて、$T$相互作用が後悔の上限スケールをラウンド化することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:50:39 GMT)
Optimizing Contextual Speech Recognition Using Vector Quantization for Efficient Retrieval [18.3] バイアス機構は典型的には、オーディオとバイアスのエントリのカタログの間のクロスアテンションモジュールに基づいている。
本研究では,ベクトル量子化に基づくクロスアテンションスコアリングに対する近似を提案する。
検索に基づくショートリスト化により,数千のエントリのバイアス付けカタログを効率よく活用できることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:05:58 GMT)
Culinary Class Wars: Evaluating LLMs using ASH in Cuisine Transfer Task [18.2] 大型言語モデル (LLMs) は、料理を含む様々な創造的領域において有望であることを示している。
本研究は, LLMの料理創造性を評価するために, ある料理を別の料理に伝達する要素に焦点を当てた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:31:18 GMT)
AV2Wav: Diffusion-Based Re-synthesis from Continuous Self-supervised Features for Audio-Visual Speech Enhancement [18.2] AV2Wavは再合成に基づく音声視覚音声強調手法である。
我々は、韻律や話者情報を保持するために、離散表現よりも連続表現を用いる。
提案手法は,自動計測と人間の聴取テストの両方の観点から,マスキングベースのベースラインよりも優れている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:25:12 GMT)
Training on test proteins improves fitness, structure, and function prediction [18.2] 大規模データセット上での自己教師付き事前トレーニングは、一般化を強化するための一般的な方法である。
そこで本研究では,テスト時に自己教師型微調整を行う手法を導入し,モデルがハエの関心を持つテストタンパク質に適応できるようにした。
本手法は,タンパク質の適合度予測のための標準ベンチマークにおいて,新しい最先端結果をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:23:59 GMT)
MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation [18.2] 大規模言語モデル(LLM)は、特に関数レベルでコード生成を大幅に改善した。
そこで本研究では,HumanEvalとMBPPの2つの共通ベンチマークを解析し,LLMのコード生成能力を十分に評価できないことを示した。
これを解決するために、210の独特な人為的問題からなるMostly Hard Python Problemsデータセットを紹介した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:21:52 GMT)
Decay Pruning Method: Smooth Pruning With a Self-Rectifying Procedure [18.0] Decay Pruning Method (DPM) は自己修正機構を備えた新しいスムーズプルーニング手法である。
DPMは2つのキーコンポーネントから構成される: (i) Smooth Pruning: 従来のシングルステッププルーニングをマルチステップスムーズプルーニングに変換する。
自己修正: この手順は、勾配情報に基づく準最適プルーニングの修正により、上記のプロセスをさらに強化する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:16:54 GMT)
Explanations that reveal all through the definition of encoding [18.0] 我々は、条件依存によってこの余分な予測力を識別する符号化の定義を開発する。
既存のスコアは、上述のエンコード説明をランク付けしていないことを証明し、それらを正しくランク付けするSTRIPE-Xを開発する。
理論的知見を実証的に実証した後,映画レビューにおける感情予測のために,LLMによる説明のエンコーディングを明らかにするためにSTRIPE-Xを用いた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:00:24 GMT)
LayerDAG: A Layerwise Autoregressive Diffusion Model for Directed Acyclic Graph Generation [17.9] 本稿では,自己回帰拡散モデルであるLayerDAGを導入し,リアル指向非巡回グラフ(DAG)を生成する。
ノードの部分順序を二部グラフのシーケンスとして解釈することにより、LayerDAGは、強いノード依存を順次処理可能な管理可能なユニットに分離する。
様々なコンピューティングプラットフォームからの合成および実世界のフローグラフに関する実験により、LayerDAGはより優れた統計特性とベンチマーク性能を持つ有効なDAGを生成することが示された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:47:15 GMT)
QCS:Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition [17.8] 入力出力位置感応型アテンション機構であるCSA(Cross similarity Attention)を導入する。
そこで我々は,同じクラスから識別的特徴を抽出するために,四括弧断面類似度 (QCS) と呼ばれる4分岐円形フレームワークを提案する。
提案したQCSモデルは、複数のFERデータセット上で最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:20:17 GMT)
Revisiting Recommendation Loss Functions through Contrastive Learning (Technical Report) [17.7] 本稿では,バランス係数を持つInfoNCEの最適化一般化であるInfoNCE+を紹介する。
特に、新しい分離された対照的な損失であるMINE+に合わせると、パフォーマンス上のアドバンテージを強調します。
また,Debiased InfoNCEを用いて,Debiased CCLとしてポイントワイドレコメンデーション損失(CCL)を除去する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:32:35 GMT)
Optimization on a Finer Scale: Bounded Local Subgradient Variation Perspective [17.6] 局所的な局所次変分の下での非滑らかな最適化問題について検討する。
得られた目的のクラスは、定義されたクラスに基づいて目的のクラスをカプセル化する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:44:26 GMT)
Optimal Design for Human Preference Elicitation [17.5] 学習嗜好モデルのための効率的な人選好評価法について検討する。
鍵となる考え方は、最適な情報収集ポリシーを計算するための方法論である最適設計を一般化することである。
提案アルゴリズムは,既存の問合せ問題に対して評価を行うことにより実用的であることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:41:21 GMT)
UniRGB-IR: A Unified Framework for RGB-Infrared Semantic Tasks via Adapter Tuning [17.4] 我々は、RGB-IRセマンティックタスクを統合するために、UniRGB-IRと呼ばれる汎用的で効率的なフレームワークを提案する。
よりリッチなRGB-IR機能を事前学習基盤モデルに効率的に導入する新しいアダプタを開発した。
様々なRGB-IRダウンストリームタスクに対する実験結果から,本手法が最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:47:12 GMT)
Fair and Welfare-Efficient Constrained Multi-matchings under Uncertainty [17.4] 我々は、市場デザイナーがグループフェアネスを維持しながら全体的な福祉を最適化する制約された資源の公平な配分について研究する。
多くの大規模環境では、ユーティリティは事前には知られていないが、アロケーションを実現した後で観察される。
本稿では、これらのトレードオフを2つのパラダイムで論じる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:42:34 GMT)
Fashion-VDM: Video Diffusion Model for Virtual Try-On [17.3] 仮想トライオンビデオを生成するためのビデオ拡散モデル(VDM)であるFashion-VDMを提案する。
入力された衣料品画像と人物映像から,当該衣料品を装着した人の高品質な試着映像を作成することを目的としている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:46:01 GMT)
Fair In-Context Learning via Latent Concept Variables [17.2] 大規模言語モデル(LLM)は、学習前のデータから社会的偏見と差別を継承することができる。
我々は、予測結果と敏感な変数との相関を低減し、潜在概念学習における公平性の促進を支援するデータ強化戦略を設計する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:10:05 GMT)
Shortcut Learning in In-Context Learning: A Survey [17.2] ショートカット学習(英: Shortcut learning)とは、モデルが実践的なタスクにおいて、単純で非破壊的な決定ルールを採用する現象を指す。
In-Context Learning(ICL)におけるショートカット学習に関する関連研究をレビューするための新しい視点を提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:13:04 GMT)
TorchTitan: One-stop PyTorch native solution for production ready LLM pre-training [17.2] 本稿では,オープンソースのPyTorchネイティブ分散トレーニングシステムであるTorchTitanを紹介する。
最先端のテクニックを統一し、統合を合理化し、オーバーヘッドを減らす。
大型言語モデル (LLM) のLlama 3.1 ファミリー上での TorchTitan の評価を行った。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:52:23 GMT)
Accelerating Goal-Conditioned RL Algorithms and Research [17.2] 自己指導型目標条件強化学習(GCRL)エージェントは、環境との非構造的相互作用において達成された目標から学習することで、新しい行動を発見する。
これらの手法は、低速環境シミュレーションのデータ不足や安定したアルゴリズムの欠如により、同様の成功は得られていない。
我々は、自制的なGCRLのためのベンチマーク(JaxGCRL)をリリースし、研究者は単一のGPU上で数百万の環境ステップでエージェントを訓練することができる。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 09:27:54 GMT)
Systematic Mapping Study on Requirements Engineering for Regulatory Compliance of Software Systems [17.0] SIPS(Software-Intensive Products and Services)に影響を与える規制の多様性と複雑さが増す中、ソフトウェアエンジニアは規制の精査に対処する必要がある。
他の交渉不可能な要件と同様に、SIPSコンプライアンスは要求工学(RE)において早期に対処すべきである。
本研究は、ソフトウェアREにおける技術の現状とSIPSの規制遵守への貢献について、構造化された概要の要求に対処するものである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:04:14 GMT)
Device-Directed Speech Detection for Follow-up Conversations Using Large Language Models [16.9] 仮想アシスタント(VA)とのフォローアップ会話により、ユーザはキーワードを使って繰り返し呼び出すことなく、VAとシームレスに対話できる。
本稿では,従来の音声文脈とASRの不確実性との連成モデルにより,この手法が大きな利益をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:57:55 GMT)
RAGViz: Diagnose and Visualize Retrieval-Augmented Generation [16.9] Retrieval-augmented Generation (RAG)は、ドメイン固有のソースからの知識を大きな言語モデルに結合する。
本稿では,得られた文書中の生成したトークンの注意力を可視化するRAG診断ツールであるRAGVizを提案する。
RAGVizは、(1)トークンと文書レベルの注意の可視化、(2)コンテキスト文書の追加と削除に関する生成比較の2つの主要な機能を提供している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:30:05 GMT)
DeMod: A Holistic Tool with Explainable Detection and Personalized Modification for Toxicity Censorship [16.6] 本研究は、毒性検閲における人々の多様なニーズを調査し、それに応じて、ChatGPTベースの検閲ツールであるDeModを構築した。
DeModは説明可能な検出機能とパーソナライズされた修正機能を備えており、詳細な検出結果、詳細な説明、パーソナライズされた修正提案を提供する。
結果は、機能の豊かさ、検閲の正確さ、使いやすさなど、DeModの複数の強みを示唆している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:38:43 GMT)
Learning predictable and robust neural representations by straightening image sequences [16.5] 我々は、ストレートニングを明確に定量化し、促進する自己教師型学習(SSL)の目標を開発する。
本研究では、この目的が、スムーズにレンダリングされた合成画像シーケンス上で、ディープフィードフォワードニューラルネットワークをトレーニングする際の効果を実証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:58:09 GMT)
Disentangled PET Lesion Segmentation [16.5] PET-Disentanglerは3次元UNetライクなエンコーダデコーダアーキテクチャを用いて病気と正常な健康な解剖学的特徴を分解する。
批判ネットワークは、健康なサンプルの分布に合うように健康な潜伏した特徴を奨励するために使用される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:50:52 GMT)
"It's a conversation, not a quiz": A Risk Taxonomy and Reflection Tool for LLM Adoption in Public Health [16.4] 我々は、健康専門家や健康問題経験者と焦点を合わせ、懸念を解き放つ。
参加者の視点をリスク分類にまとめる。
この分類学は、個人の行動、人間中心のケア、情報エコシステム、技術説明責任の4つの側面を強調している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:35:10 GMT)
The LLM Language Network: A Neuroscientific Approach for Identifying Causally Task-Relevant Units [16.3] 大規模言語モデル(LLM)は、言語タスクだけでなく、言語的でない様々なタスクにも顕著な能力を示す。
人間の脳では、神経科学は言語処理を選択的に因果的にサポートするコア言語システムを特定している。
言語選択単位を18のLLMで同定し、神経科学で用いられるのと同じ局所化手法を用いて同定する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:09:10 GMT)
AutoVFX: Physically Realistic Video Editing from Natural Language Instructions [16.2] AutoVFXは、単一のビデオと自然言語命令から現実的でダイナミックなVFXビデオを自動生成するフレームワークである。
我々はAutoVFXの有効性を多種多様なビデオやインストラクションで検証する広範囲な実験を行った。
その結果, AutoVFX は, 生成品質, 命令アライメント, 編集の汎用性, 物理的妥当性において, 競合するすべての手法より優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:59:05 GMT)
Differentially private and decentralized randomized power method [16.0] 微分プライバシー(DP)を実現するために導入されたノイズの分散を低減するための戦略を提案する。
精度を保ちながら、計算と通信のオーバーヘッドが低い分散化フレームワークに適応する。
本研究では,集中型環境におけるノイズスケールを,集中型環境におけるノイズスケールと類似した分散化環境で使用することができることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:53:03 GMT)
PanicFI: An Infrastructure for Fixing Panic Bugs in Real-World Rust Programs [15.9] PanicFIは、Rustのパニックバグを理解し、自動テクニックを開発するためのサポートを提供することを目的としている。
PanicFIでは、102の実際のパニックバグと、最もダウンロードされたオープンソースクラッドのトップ500からの修正を含むデータセットPanic4Rを構築しています。
我々は、パニックバグを修正し、パッチを生成するための洞察とガイダンスを提供するRust固有のパターンを特定します。
PanicKillerはRustのパニックバグを修正するための最初の自動化ツールであり、すでにオープンソースプロジェクトにおける28のパニックバグの解決に寄与している。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 14:29:49 GMT)
RobotKeyframing: Learning Locomotion with High-Level Objectives via Mixture of Dense and Sparse Rewards [15.8] 本稿では,脚ロボットのための新しい学習ベース制御フレームワークを提案する。
脚のあるロボットの自然な移動における高レベルな目標を取り入れている。
マルチクリティック強化学習アルゴリズムを用いて、密集した報酬とスパース報酬の混合を処理する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 14:32:26 GMT)
Fantastic LLMs for Preference Data Annotation and How to (not) Find Them [15.8] 大規模言語モデル(LLM)の優先度調整は、高品質な人間の嗜好データに依存している。
既存の方法は、訓練された報酬モデルやプロプライエタリモデルを使って、好みのアノテーションの判断を行うことができる。
データアノテーションにオープンソースのLCMを利用するカスタマイズ密度比(CDR)を導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:54:39 GMT)
FewViewGS: Gaussian Splatting with Few View Matching and Multi-stage Training [15.6] スパース入力画像を用いた3次元ガウス型新規ビュー合成法を提案する。
本稿では,新しい視点に課せられる整合性制約を考慮した多段階学習手法を提案する。
これは、利用可能なトレーニング画像のマッチングを使用して、新しいビューの生成を監督することで達成される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:21:00 GMT)
Map++: Towards User-Participatory Visual SLAM Systems with Efficient Map Expansion and Sharing [15.5] 本稿では,地図作成タスクを地図利用者に委譲する参加型センシング手法を提案する。
提案手法は,利用者の集合的努力を生かし,環境が発展するにつれて地図の拡張と更新を促進させる。
我々は、プラグイン・アンド・プレイ拡張として機能する効率的なシステムであるMap++を開発した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:35:46 GMT)
MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection [15.5] 拡散モデルは、トレーニングデータによく似ているが、データ記憶の影響を受ける画像を生成するのに優れている。
微調整時のモデル容量の正規化がこの問題を軽減することを提案する。
当社のフレームワークは大規模データセットにスケーラブルで,関数の報酬に依存せず,既存のアプローチと統合することで,メモリ化の軽減を実現しています。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:43:30 GMT)
DREsS: Dataset for Rubric-based Essay Scoring on EFL Writing [15.4] DREsSは、ルーリックベースの自動エッセイ評価のための大規模で標準的なデータセットである。
DREsS_Newは、学生が執筆し、英語教育の専門家が採点した2.3Kのエッセイを持つ、実際の教室データセットである。
筆者らは, DREsS_CASEの40.1Kの合成サンプルを生成し, 基準値を45.44%改善するエッセイの汚職ベースの強化戦略であるCASEを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:54:34 GMT)
An Exponential Separation Between Quantum and Quantum-Inspired Classical Algorithms for Machine Learning [15.0] 証明可能な指数的量子スピードアップは、線形系を解くためのセミナルHHL量子アルゴリズム以来、中心的な研究目標となっている。
量子と量子に着想を得た古典的アルゴリズム間で、このような証明可能な指数的分離を初めて提示する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:49:26 GMT)
Training on the Test Model: Contamination in Ranking Distillation [14.8] 蒸留における汚染された教師モデルの効果について検討する。
教師のトレーニングサンプルのごく一部を表すテストデータであっても,汚染が生じることが判明した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:11:14 GMT)
Collaborative Cognitive Diagnosis with Disentangled Representation Learning for Learner Modeling [14.6] 類似学習者間の協調的接続を活用することは、人間の学習を理解する上で価値がある。
本研究では,不整合表現学習を用いた協調的認知診断モデルであるCoralを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:13:25 GMT)
Fairness-Utilization Trade-off in Wireless Networks with Explainable Kolmogorov-Arnold Networks [14.5] 本稿では,ネットワーク利用とユーザ株式のバランスをとるために$alpha$-fairnessを最適化することを目的とした,無線ネットワークにおける電力割り当ての課題に焦点を当てる。
推論コストの低い機械学習モデルのクラスであるKAN(Kolmogorov-Arnold Networks)を利用した新しいアプローチを提案する。
データセットの生成と分散化のために2つのアルゴリズムが提案され、様々なフェアネス目標を達成するための柔軟なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:40:47 GMT)
Distributionally Robust Reinforcement Learning with Interactive Data Collection: Fundamental Hardness and Near-Optimal Algorithm [14.5] Sim-to-realのギャップは、トレーニングとテスト環境の相違を表している。
この課題に対処するための有望なアプローチは、分布的に堅牢なRLである。
我々は対話型データ収集によるロバストなRLに取り組み、証明可能なサンプル複雑性を保証するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:25:06 GMT)
Breaking the Reclustering Barrier in Centroid-based Deep Clustering [14.5] 本研究は,Centroid-based Deep Clustering (DC)アルゴリズムにおける重要な現象について考察する。
我々はこの現象を「再クラスタ化障壁」と呼び、再クラスタ化障壁が発生した時に経験的に示す。
このアルゴリズムを広く使われているDCアルゴリズムに適用すると、(1)BRBはクラスタリングベンチマークの幅広い範囲で一貫して性能を向上し、(2)BRBはスクラッチからのトレーニングを可能にし、(3)BRBは対照的な損失と組み合わせることで、最先端のDCアルゴリズムに対して競争力を発揮する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:05:37 GMT)
Provably Learning Diverse Features in Multi-View Data with Midpoint Mixup [14.4] Mixupは、データポイントとラベルのランダムな凸組み合わせを使用したトレーニングに依存する、データ拡張技術である。
各クラスが複数の関連する特徴(あるいはビュー)を持ち、クラスを正しく予測できるような分類問題に焦点をあてる。
実験的リスク最小化を用いた2層畳み込みネットワークの学習は, クラス毎に2つの特徴を持つ非自明なデータ分布のクラスでは, ほぼすべてのクラスで1つの特徴しか学習できない一方で, Mixup の特定のインスタンス化による学習は各クラスで2つの特徴の学習に成功していることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:14:50 GMT)
Emergence of Hidden Capabilities: Exploring Learning Dynamics in Concept Space [14.2] 我々は、概念空間と呼ばれるフレームワークを介してモデルの学習力学を分析します。
概念空間におけるモデルの学習力学の方向を,突然回転する瞬間を観察する。
驚くべきことに、これらの点は隠蔽能力の出現と正確に一致している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:58:02 GMT)
A LLM-Based Ranking Method for the Evaluation of Automatic Counter-Narrative Generation [14.1] 本稿では,Large Language Model (LLM) を用いた対数ナラティブ(CN)生成の評価手法を提案する。
従来の自動指標は, 人間の判断と相関が低く, 生成したCNと人間の知覚との微妙な関係を捉えることができないことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:56:55 GMT)
FedReMa: Improving Personalized Federated Learning via Leveraging the Most Relevant Clients [14.0] Federated Learning (FL) は分散機械学習のパラダイムであり、分散計算と周期モデル合成によってグローバルに堅牢なモデルを実現する。
広く採用されているにもかかわらず、既存のFLとPFLの作業は、クラス不均衡の問題に包括的に対処していない。
本稿では,適応型クライアント間コラーニング手法を用いて,クラス不均衡に対処できる効率的なPFLアルゴリズムであるFedReMaを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:44:28 GMT)
xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology [13.9] マルチ・インスタンス・ラーニング(MIL)は、弱教師付き機械学習において効果的で広く利用されている手法である。
我々は、説明可能なAI(XAI)のレンズを通してMILを再考し、より一般的な仮定を持つ洗練されたフレームワークであるxMILを紹介した。
提案手法は, バイオマーカー予測タスクにおいて, 特に忠実度が向上し, 従来の説明手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:02:45 GMT)
Optimal Classification under Performative Distribution Shift [13.5] 本稿では,動作効果をプッシュフォワード尺度としてモデル化した新しい視点を提案する。
我々は、新しい仮定のセットの下で、パフォーマンスリスクの凸性を証明する。
また, 性能リスクの最小化を min-max 変動問題として再定義することにより, 逆向きの頑健な分類との関係を確立する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:20:13 GMT)
TriG-NER: Triplet-Grid Framework for Discontinuous Named Entity Recognition [13.5] TriG-NERは、不連続なエンティティ抽出のための堅牢なトークンレベル表現を学習するための新しいトリプルトグリッドフレームワークである。
我々のフレームワークはトークンレベルで三重項損失を適用し、類似性は同じエンティティ内に存在するワードペアによって定義される。
3つのベンチマークDNERデータセット上でTriG-NERを評価し、既存のグリッドアーキテクチャよりも大幅に改善したことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:26:09 GMT)
SPEAK: Speech-Driven Pose and Emotion-Adjustable Talking Head Generation [13.5] 本稿では,一般のトーキング・フェイス・ジェネレーションと区別する新しいワンショットトーキング・ヘッド・ジェネレーション・フレームワーク(SPEAK)を提案する。
顔の特徴を3つの潜在空間に分離するIRFD(Inter-Reconstructed Feature Disentanglement)モジュールを導入する。
次に、音声コンテンツと顔の潜時符号を1つの潜時空間に修正する顔編集モジュールを設計する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:42:38 GMT)
Distribution alignment based transfer fusion frameworks on quantum devices for seeking quantum advantages [13.4] 対象ドメインデータのラベルを予測するために,2つの転送融合フレームワークを提案する。
これらのフレームワークは、2つの異なる、しかし関連するドメインから量子情報注入チャネルを介して量子データを抽出する。
量子基本線型代数サブルーチン(QBLAS)ベースの実装である1つのフレームワークは、理論的には2次スピードアップによる転送融合の手続きを達成できる。
ハードウェアスケーリング可能なアーキテクチャである別のフレームワークは、ノイズの多い中間スケール量子(NISQ)デバイス上に実装されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:41:31 GMT)
Combining Induction and Transduction for Abstract Reasoning [13.4] 我々は、誘導(潜伏関数の推論)と伝達(与えられたテスト入力に対するテスト出力を直接予測)のためにニューラルネットワークを訓練する。
我々のモデルは、LLMに推論される関数を指定するPythonコードを生成するように促すことで生成された合成データと、その関数への入力を生成するサブルーチンに基づいて訓練されている。
インダクティブモデルとトランスダクティブモデルは、同じ問題をトレーニングしているにもかかわらず、同じニューラルアーキテクチャを共有しているにもかかわらず、非常に異なる問題を解決する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:03:55 GMT)
MV2Cyl: Reconstructing 3D Extrusion Cylinders from Multi-View Images [13.3] 2次元多視点画像から3次元を再構成する新しい手法であるMV2Cylを提案する。
本研究では,2次元スケッチと抽出パラメータ推定において最適な精度で最適な再構成結果を得る。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:37:51 GMT)
Optimization Algorithm Design via Electric Circuits [13.1] 本稿では,電気RCC回路のアイデアを用いた凸最適化アルゴリズムの設計手法を提案する。
この手法の第一段階は、連続時間ダイナミクスが目の前の最適化問題の解に収束する適切な電気回路を設計することである。
第2段階は、連続時間力学のコンピュータ支援による自動離散化であり、証明可能な収束離散時間アルゴリズムをもたらす。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:10:59 GMT)
Plug, Play, and Fuse: Zero-Shot Joint Decoding via Word-Level Re-ranking Across Diverse Vocabularies [12.8] マルチモーダル翻訳のような現実世界のタスクは、翻訳と画像処理の両方を扱うなど、これらの強みの組み合わせを必要とすることが多い。
新たなゼロショットアンサンブル戦略を提案し,デコードフェーズにおいて,追加のトレーニングを必要とせずに,異なるモデルの統合を可能にする。
提案手法では,単語レベルでのスコアを組み合わせ,単語がいつ完了するかをマルチモーダルで予測することで,復号中にビームを再ランクする。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 12:17:42 GMT)
Gazelle: An Instruction Dataset for Arabic Writing Assistance [12.8] アラビア文字支援のための包括的なデータセットであるGazelleを提示する。
また、アラビア文字支援ツールの強化を目的とした評価フレームワークも提供する。
私たちの調査結果は、継続的モデルトレーニングとデータセットの強化の必要性を浮き彫りにしています。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:29:40 GMT)
Modeling Uncertainty in 3D Gaussian Splatting through Continuous Semantic Splatting [12.7] 3次元ガウススプラッティングにおける意味マップの確率的更新のための新しいアルゴリズム(3D-GS)を提案する。
従来の手法では3D-GSの特徴を学習してシーン理解を強化するアルゴリズムが導入されたが、3D-GSは警告なしで失敗する可能性があるため、安全クリティカルなロボット応用の課題が提示される。
本稿では,3D-GSの正確な構造と確率論的ロボットマップの不確実性の定量化機能を組み合わせた,ボクセルから楕円体への連続的意味マッピングの文献化手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:31:03 GMT)
When is Multicalibration Post-Processing Necessary? [12.6] 多重校正は有意義な不確実性推定を保証する予測器の特性である。
本研究は,マルチキャリブレーション後処理の有用性を評価するための総合的研究である。
我々は,マルチキャリブレーション後処理の実用的,効果的な応用に有用な,多くの独立した観測結果を蒸留する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:17:58 GMT)
Towards Federated Low-Rank Adaptation of Language Models with Rank Heterogeneity [12.5] クライアント間の不均一なランクが不安定なパフォーマンスにつながることを観察する。
この不安定性は従来のゼロ・パディング・アグリゲーション・ストラテジーに起因している。
高品質なデータを持つクライアントからの貴重な情報をよりよく保持するレプリケーションベースのパディング戦略を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:56:01 GMT)
S3PT: Scene Semantics and Structure Guided Clustering to Boost Self-Supervised Pre-Training for Autonomous Driving [12.4] そこで本稿では,S3PTによるシーンセマンティクスと構造案内クラスタリングを提案する。
まず、セマンティックな分布一貫したクラスタリングを取り入れて、オートバイや動物のような稀なクラスをよりよく表現できるようにします。
第2に,広い背景領域から歩行者や交通標識などの小さな物体まで,不均衡で多様な物体の大きさを扱うために,一貫した空間クラスタリングを導入する。
第3に,シーンの幾何学的情報に基づいて学習を規則化するための深度誘導空間クラスタリングを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:01:38 GMT)
A survey and benchmark of high-dimensional Bayesian optimization of discrete sequences [12.2] 個々のブラックボックス機能を最適化することは、タンパク質工学や薬物設計など、いくつかの領域において重要である。
我々は,高次元ベイズ最適化手法と標準化されたブラックボックス関数の集合を幅広くテストするための統一的なフレームワークを開発する。
これらのベンチマークの2つのコンポーネントはそれぞれ、柔軟でスケーラブルで容易に拡張可能なソフトウェアライブラリによってサポートされています。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:02:09 GMT)
ToolPlanner: A Tool Augmented LLM for Multi Granularity Instructions with Path Planning and Feedback [11.9] 命令が与えられた後、ツール拡張LDMは複数のラウンドで様々な外部ツールと対話し、最終的な答えを提供する。
以前のLLMは、API名やパラメータを含む、過剰に詳細な命令でトレーニングされていたが、実際のユーザはこれらのAPIの詳細を明示的に言及しなかった。
これらの問題に対処するため、MGToolBenchというトレーニングデータセットを構築しました。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:29:32 GMT)
ToolPlanner: A Tool Augmented LLM for Multi Granularity Instructions with Path Planning and Feedback [11.9] 命令が与えられた後、ツール拡張LDMは複数のラウンドで様々な外部ツールと対話し、最終的な答えを提供する。
以前のLLMは、API名やパラメータを含む、過剰に詳細な命令でトレーニングされていたが、実際のユーザはこれらのAPIの詳細を明示的に言及しなかった。
これらの問題に対処するため、MGToolBenchというトレーニングデータセットを構築しました。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:29:32 GMT)
ToolPlanner: A Tool Augmented LLM for Multi Granularity Instructions with Path Planning and Feedback [11.9] 命令が与えられた後、ツール拡張LDMは複数のラウンドで様々な外部ツールと対話し、最終的な答えを提供する。
以前のLLMは、API名やパラメータを含む、過剰に詳細な命令でトレーニングされていたが、実際のユーザはこれらのAPIの詳細を明示的に言及しなかった。
これらの問題に対処するため、MGToolBenchというトレーニングデータセットを構築しました。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:29:32 GMT)
Unclonable Cryptography with Unbounded Collusions and Impossibility of Hyperefficient Shadow Tomography [11.8] 我々は、最初の非有界コラシオン耐性(多重コピーセキュア)コピー保護スキームを与える。
i) 公開鍵暗号, (ii) 公開鍵関数暗号, (iii) 署名, (iv) 鍵が非有界共謀に対してコピー保護された擬似ランダム関数スキームを構築する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:56:21 GMT)
TileTracker: Tracking Based Vector HD Mapping using Top-Down Road Images [11.7] タイル画像と呼ばれるトップダウン道路画像の追跡に基づくHDマッピングアルゴリズムを提案する。
提案手法は, タイル画像の有効利用も可能であり,HDマッピングアルゴリズムにおける新しい経路の始まりとなるため, この研究領域に貴重な貢献が期待できることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:29:30 GMT)
Evaluating Large Language Models in Theory of Mind Tasks [11.6] 11つの大規模言語モデル (LLM) は、偽確認タスクのカスタムメイドバッテリを用いて評価された。
バッテリーには640のプロンプトが含まれており、40のタスクにまたがっている。
1つのタスクを解決するには、8つのシナリオすべてに16のプロンプトを正しく答える必要がある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:51:53 GMT)
Neural Pose Representation Learning for Generating and Transferring Non-Rigid Object Poses [11.6] 本稿では,3次元変形可能なオブジェクトに対するポーズの表現を学習するための新しい手法を提案する。
1)オブジェクトの同一性からポーズ情報を遠ざけること、2)ポーズのバリエーションの学習を容易にすること、3)他のオブジェクトの同一性にポーズ情報を転送すること。
これらの特性に基づいて, 同一性およびポーズの多様性を有する3次元変形可能な物体の生成を可能にする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:34:59 GMT)
TME-Box: Scalable In-Process Isolation through Intel TME-MK Memory Encryption [11.5] クラウドコンピューティングは、単一のプロセス内でワークロードを実行することでパフォーマンスを最適化するために、プロセス内分離に依存している。
既存のプロセス内分離メカニズムは、現代的なクラウド要件には適していない。
本稿では,コモディティx86マシン上で細粒度でスケーラブルなサンドボックスを実現する,新しい分離技術であるTME-Boxを提案する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 12:14:07 GMT)
AutoJoin: Efficient Adversarial Training against Gradient-Free Perturbations for Robust Maneuvering via Denoising Autoencoder and Joint Learning [11.5] 本稿では,画像ベース操作のためのロバストなモデルを生成するために,AutoJoinという,勾配のない対向訓練手法を提案する。
5M以上のイメージでテストする他の最先端の方法と比較すると、AutoJoinは摂動に対する40%の範囲での大幅なパフォーマンス向上を実現している。
AutoJoinも非常に効率的で、トレーニングのエポック毎に最大86%の時間を節約し、他の最先端技術よりも90%のトレーニングデータを節約できる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:20:51 GMT)
Enhancing Indoor Mobility with Connected Sensor Nodes: A Real-Time, Delay-Aware Cooperative Perception Approach [11.4] 本稿では,室内環境に対するリアルタイム・遅延認識協調認識システムを提案する。
このシステムは、ノード間でデータを同期して集約する、遅延認識のグローバルな認識を備えている。
本実験は, ベースラインと比較して, 検出精度と遅延に対する堅牢性に大きな改善が認められた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:31:45 GMT)
Sample-Efficient Private Learning of Mixtures of Gaussians [11.4] およそ$kd2 + k1.5 d1.75 + k2 d$サンプルは、$k$任意の$d$次元ガウスの混合を学ぶのに十分である。
我々の作業は、以前の最高の結果 [AAL24b] よりも改善され、$d$が$k2$よりもはるかに大きい場合、確実に最適です。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:23:52 GMT)
Model Integrity when Unlearning with T2I Diffusion Models [11.3] 「忘れ分布からのサンプルを特徴とする特定種類の画像の生成を減らすために、近似機械学習アルゴリズムを提案する。」
次に、既存のベースラインと比較してモデルの整合性を保つ上で優れた効果を示す未学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:15:28 GMT)
SyncTweedies: A General Generative Framework Based on Synchronized Diffusions [11.3] 正準空間を通した多重拡散過程の同期化のシナリオを網羅的に検討する。
我々は、Tweedieの公式の出力を、複数のインスタンス空間で denoising を行いながら平均化するという、未探索のケースを明らかにした。
上述した映像コンテンツを生成する実験では、SyncTweedies による生成の質が他の同期法と比較して優れていることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 01:25:37 GMT)
Fairness Risks for Group-conditionally Missing Demographics [11.3] 既存のモデルでは、プライバシー、法的問題、個人の差別に対する恐怖のために実用的でないような、センシティブな特徴の完全な知識が必要である。
提案手法は,多変量オートエンコーダにおいて,グループ条件の欠落した確率を共同学習しながら,感度特性の確率論的衝動による一般フェアネスリスクを増大させる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:24:33 GMT)
Leveraging Label Semantics and Meta-Label Refinement for Multi-Label Question Classification [11.2] 本稿では,新手法RR2QCを多ラベル質問分類に適用する。
ラベルセマンティクスとメタラベルの改良を使用して、パーソナライズされた学習とリソースレコメンデーションを強化する。
実験の結果,RR2QCはPrecision@kとF1スコアの既存の分類方法よりも優れていた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:27:14 GMT)
GraphVL: Graph-Enhanced Semantic Modeling via Vision-Language Models for Generalized Class Discovery [11.0] 一般化カテゴリー発見(GCD)における視覚言語モデリングの新しいアプローチであるGraphVLを紹介する。
グラフ畳み込みネットワーク(GCN)とCLIPのテキストエンコーダを統合し,クラス近傍構造を保存する。
ベンチマークデータセットの7つの実験は、CLIPバックボーンと統合した場合のGraphVLの優位性を一貫して示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:26:15 GMT)
Generating the Traces You Need: A Conditional Generative Model for Process Mining Data [10.9] 条件付き変分オートエンコーダ(CVAE)に基づくプロセスデータ生成のための条件付きモデルを提案する。
プロセスマイニングのためのCVAEは、データの多面的性質と制御フロールールに従う必要性のために、特定の課題に直面している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:44:20 GMT)
UnSegMedGAT: Unsupervised Medical Image Segmentation using Graph Attention Networks Clustering [10.9] 事前学習したDino-ViTを用いた教師なしセグメンテーションフレームワークを提案する。
医用画像のセグメンテーションにおける顕著な性能向上を実現するために,画像内のグラフ構造を利用する。
提案手法は,MedSAM などの既存の(セミ)手法をはるかに上回ったり,マッチさせたりすることで,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:42:21 GMT)
Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning [10.7] 本稿では,テキストからセマンティックへの解析に注目する。
商用データベースのスキーマのサイズとビジネスインテリジェンスソリューションのデプロイ可能性に関する課題から,入力データベース情報を動的に取得する $textASTReS$ を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:14:13 GMT)
Toward Separating QMA from QCMA with a Classical Oracle [10.7] QMAは効率的な量子検証器によって決定できる言語のクラスであり、QCMAは効率的な量子検証器が古典的な証人しか与えられない言語のクラスである。
量子クエリ複雑性における挑戦的な基本的なゴールは、これらのクラスに対する古典的なオラクル分離を見つけることである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:18:06 GMT)
Large language models for mental health [10.6] デジタル技術は、精神医学研究や実践における標準的な手順の補完として長い間研究されてきた。
最近の大規模言語モデル(LLM)の出現は、その面での大きな新たなチャンスである。
しかし、LLMを開発するコミュニティと、それらから恩恵を受ける可能性のあるコミュニティとの間には、いまだに隔たりがある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:02:00 GMT)
Vehicles, Pedestrians, and E-bikes: a Three-party Game at Right-turn-on-red Crossroads Revealing the Dual and Irrational Role of E-bikes that Risks Traffic Safety [10.6] eバイクの普及により短距離走行が容易になったが、道路交通の混乱と安全上の問題に繋がった。
本研究は, 交通紛争におけるEバイクの二重特性に着目し, 自動車と対話する際に歩行者に似ており, 歩行者との衝突時に自動車のように振る舞う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:38:47 GMT)
Addressing Representation Collapse in Vector Quantized Models with One Linear Layer [10.5] ベクトル量子化(英: Vector Quantization, VQ)は、連続表現を離散符号に変換する方法である。
VQモデルは、潜在空間における表現崩壊の問題によってしばしば妨げられる。
線形変換層を通じてコードベクトルを再パラメータ化する新しい手法である textbfSimVQ を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:40:18 GMT)
Snapshotting Quantum Dynamics at Multiple Time Points [10.2] 本研究では,中間点における量子システムから動的情報を抽出する手法を提案する。
我々は,各時点の確率を正確に回復する多時間準確率分布(QPD)を再構成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:11:12 GMT)
Rotation Perturbation Robustness in Point Cloud Analysis: A Perspective of Manifold Distillation [10.1] 本稿では, 多様体の観点から点雲をモデル化し, 回転摂動のロバスト性を達成するために, 多様体蒸留法を設計する。
4つの異なるデータセットを用いて実験を行い,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:13:41 GMT)
Positive Experience Reflection for Agents in Interactive Text Environments [10.0] Sweet&Sourは、ポジティブな経験と管理された記憶を取り入れた新しいアプローチで、意思決定時にエージェントが利用できるコンテキストを豊かにする。
包括的分析は、クローズドおよびオープンソース両方のLCMにまたがっており、エージェント性能改善におけるSweet&Sourの有効性を実証している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:15:28 GMT)
Illuminating Blind Spots of Language Models with Targeted Agent-in-the-Loop Synthetic Data [10.0] 言語モデル(LM)は、様々なタスクにおいて顕著な精度を達成したが、高信頼の誤分類(UU)に弱いままである。
UUは機能領域の盲点にクラスタ化され、ハイリスクなアプリケーションに重大なリスクをもたらす。
知的エージェントを教師として利用し,UU型エラーを特徴付けることによって,盲点緩和に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:59:19 GMT)
A Novel Deep Learning Tractography Fiber Clustering Framework for Functionally Consistent White Matter Parcellation Using Multimodal Diffusion MRI and Functional MRI [10.0] Deep Multi-view Fiber Clustering (DMVFC) は、機能的に一貫したホワイトマター解析を可能にするために、ジョイントdMRIとfMRIデータを使用する。
DMVFCは、WMファイバの幾何学的特性と、ファイバトラクトに沿ったfMRI BOLD信号とを効果的に統合することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:21:06 GMT)
Attr-Int: A Simple and Effective Entity Alignment Framework for Heterogeneous Knowledge Graphs [9.7] エンティティアライメント(EA)とは、異なる知識グラフ(KG)内のエンティティをリンクすることである。
本稿では, 異種KG間の整合性の問題について検討し, 対処する。
本稿では,Attr-Intと呼ばれるシンプルで効果的なエンティティアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:40:19 GMT)
Privacy-Preserving Federated Learning via Dataset Distillation [9.6] フェデレートラーニング(FL)では、生のデータの代わりに知識を共有することで、モデルのトレーニングを高精度に行うことができる。
トレーニング中、ユーザーは共有されている知識をコントロールできなくなり、データプライバシの深刻な問題を引き起こす。
FLトレーニングに最小特権(PoLP)の原則を導入することを目的としたFLiPを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:42:53 GMT)
Real-time and Downtime-tolerant Fault Diagnosis for Railway Turnout Machines (RTMs) Empowered with Cloud-Edge Pipeline Parallelism [9.5] RTMのリアルタイム・ダウンタイム耐故障診断を可能にするために,エッジクラウド協調早期警戒システムを提案する。
中国江蘇省南京大都市圏が収集した実世界のデータセットでは,アンサンブルに基づく断層診断モデルにより97.4%の精度が得られた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:49:06 GMT)
Topic-Conversation Relevance (TCR) Dataset and Benchmarks [9.5] このデータセットには1500のユニークなミーティング、2200万ワードのテキストと15,000以上のミーティングトピックが含まれている。
各データソースに対して、GPT-4を用いてベンチマークを作成し、転写-位相関係を理解するためのモデル精度を評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:40:54 GMT)
Atlas: Hierarchical Partitioning for Quantum Circuit Simulation on GPUs (Extended Version) [9.5] 本稿では,理論的,実用的,スケーラブルな量子回路シミュレーションのための手法を提案する。
我々のアプローチでは、量子回路をサブ回路の階層に分割し、マルチノードGPU上でサブ回路をシミュレートする。
通信コストを最小限に抑えるため,ニアバイゲートのシミュレーションを「ニアバイ」に報いる線形プログラムを定式化する。
スループットを最大化するために、動的プログラミングアルゴリズムを用いて、各カーネルがGPUでシミュレーションしたサブ回路を計算する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 21:59:24 GMT)
(Debiased) Contrastive Learning Loss for Recommendation (Technical Report) [9.3] 提案手法では,デバイアスドInfoNCEと相互情報ニューラル推定器(MINE)を初めて導入し,検討する。
MSE と CCL の双方に偏りのある点損失を提示し、理論上最も人気のある2つの線形モデルである iALS と EASE が本質的に偏りであることを示す。
実験の結果, 脱バイアス化損失の有効性が示され, 新たに導入された相互情報損失は, 既存の(バイアス化)損失よりも優れていた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:32:47 GMT)
eMoE-Tracker: Environmental MoE-based Transformer for Robust Event-guided Object Tracking [9.3] 本稿では,eMoE-Trackerと呼ばれる,トランスフォーマーに基づくイベント誘導トラッキングフレームワークを提案する。
私たちのキーとなるアイデアは、環境をいくつかの学習可能な属性に分解し、属性固有の特徴を動的に学習することです。
さまざまなイベントベースのベンチマークデータセットの実験は、従来の技術と比較して、eMoE-Trackerの優れたパフォーマンスを示しています。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:08:30 GMT)
Robustness of Watermarking on Text-to-Image Diffusion Models [9.3] 本稿では,透かし埋め込みとテキスト・ツー・イメージ・ジェネレーション処理を統合することで生成する透かしの堅牢性について検討する。
生成型透かし法は, 識別器による攻撃やエッジ予測に基づく攻撃のエッジ情報に基づく操作など, 直接回避攻撃に対して堅牢であるが, 悪意のある微調整には脆弱であることがわかった。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:37:00 GMT)
Consistency Models for Scalable and Fast Simulation-Based Inference [9.3] シミュレーションベース推論(SBI)のための新しい条件付きサンプルであるCMPEの整合性モデルを提案する。
CMPEは基本的に連続した確率フローを蒸留し、制約のないアーキテクチャで高速な数発の推論を可能にする。
実験により,CMPEは高次元のベンチマークで最先端のアルゴリズムより優れるだけでなく,より高速なサンプリング速度で競合性能を達成できることを示した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:03:30 GMT)
Crafting Tomorrow's Headlines: Neural News Generation and Detection in English, Turkish, Hungarian, and Persian [9.3] 我々は、英語、トルコ語、ハンガリー語、ペルシア語という4つの言語でニューラルニュース検出のために設計されたベンチマークデータセットを紹介した。
このデータセットには、BloomZ、LLaMa-2、Mistral、Mixtral、GPT-4など、複数の多言語ジェネレータ(ゼロショットと微調整の両方)からの出力が含まれている。
本研究は,全言語を対象とした機械生成テキスト検出器の解釈性と頑健性を明らかにすることを目的とした検出結果を提案する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 12:42:18 GMT)
Crafting Tomorrow's Headlines: Neural News Generation and Detection in English, Turkish, Hungarian, and Persian [9.3] 我々は、英語、トルコ語、ハンガリー語、ペルシア語という4つの言語でニューラルニュース検出のために設計されたベンチマークデータセットを紹介した。
このデータセットには、BloomZ、LLaMa-2、Mistral、Mixtral、GPT-4など、複数の多言語ジェネレータ(ゼロショットと微調整の両方)からの出力が含まれている。
本研究は,全言語を対象とした機械生成テキスト検出器の解釈性と頑健性を明らかにすることを目的とした検出結果を提案する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 12:42:18 GMT)
Towards Context-Aware Adaptation in Extended Reality: A Design Space for XR Interfaces and an Adaptive Placement Strategy [9.3] 拡張現実感(XR)は、従来のディスプレイの空間制限を緩和し、一度に複数の情報を消費しやすくする。
設計が不適切であれば、XRインターフェースはユーザーを圧倒し、情報アクセスを複雑にすることができる。
本稿では,XRインタフェース内での適切なプレゼンテーションとインタラクションを実現するために適応可能な設計次元について検討する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:01:03 GMT)
Investigating Idiomaticity in Word Representations [9.2] 我々は2つの言語(英語とポルトガル語)における様々な水準の慣用性を持つ名詞に焦点をあてる。
そこで本研究では,各名詞の音韻性判定を含む最小対のデータセットについて,タイプレベルとトークンレベルの両方で示す。
AffinityとScaled similarityの詳細なメトリクスセットを定義し、モデルが慣用性の変化につながる可能性のある摂動に対してどれほど敏感であるかを判断する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:05:01 GMT)
Efficient Active Imitation Learning with Random Network Distillation [8.5] Random Network Distillation DAgger (RND-DAgger) は、新しいアクティブな模倣学習法である。
学習した状態ベースのアウト・オブ・ディストリビューション(out-of-distribution)手段を使用して介入をトリガーすることで、専門家によるクエリを制限します。
RND-DAggerを従来の模倣学習や3Dビデオゲームやロボット作業におけるアクティブなアプローチに対して評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:50:52 GMT)
From Twitter to Reasoner: Understand Mobility Travel Modes and Sentiment Using Large Language Models [8.4] 本稿では,Large Language Models (LLMs) を用いた新たな手法を提案する。
ほとんどのソーシャルメディア投稿は肯定的な感情ではなく否定的な感情を呈している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:04:13 GMT)
Exploiting Interpretable Capabilities with Concept-Enhanced Diffusion and Prototype Networks [8.4] 既存のアーキテクチャに概念情報を組み込んだ、概念に富んだモデルを作成します。
特に,概念の視覚的表現を生成できる概念誘導拡散条件と,概念誘導型プロトタイプネットワークを提案する。
これらの結果は、機械学習をより人間に理解しやすいものにするために、既存の情報を活用することによって、新たな研究の行を開放する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:02:32 GMT)
Local Loss Optimization in the Infinite Width: Stable Parameterization of Predictive Coding Networks and Target Propagation [8.4] 局所目標の2つの代表的設計に対して、無限幅極限における最大更新パラメータ化(mu$P)を導入する。
深層線形ネットワークを解析した結果,PCの勾配は1次勾配とガウス・ニュートン様勾配の間に介在していることが判明した。
我々は、特定の標準設定において、無限幅制限のPCは、一階勾配とよりよく似た振る舞いをすることを示した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:38:27 GMT)
Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure [8.3] 学習したスコア関数の隠れた性質を調べた結果,拡散モデルの一般化可能性について検討した。
拡散モデルが記憶から一般化へと遷移するにつれて、対応する非線形拡散デノイザは線形性を増加させる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:44:08 GMT)
TabSec: A Collaborative Framework for Novel Insider Threat Detection [8.3] IoT(Internet of Things, モノのインターネット)とデータ共有の時代には、ユーザは自分の個人情報をエンタープライズデータベースに頻繁にアップロードして、サービスエクスペリエンスの向上を享受する。
しかし、システム脆弱性、リモートネットワーク侵入、インサイダーの脅威が広まれば、インターネット上のプライベートエンタープライズデータの露出が著しく増加する。
本稿では,これらの課題に対処する新たな脅威検出フレームワークTabITDを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:07:16 GMT)
Behavioral Sequence Modeling with Ensemble Learning [8.2] 隠れマルコフモデルのアンサンブルを用いたシーケンスモデリングのフレームワークを提案する。
アンサンブルに基づくスコアリング手法は,異なる長さの列間のロバストな比較を可能にする。
本手法の有効性を縦断的人間行動データセットに示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:34:28 GMT)
Cooperative and Collaborative Multi-Task Semantic Communication for Distributed Sources [8.2] 我々は、エンコーダを共通単位(CU)と多重特定単位(SU)に分割する[1]で導入された協調マルチタスク処理に基づいて構築する。
本稿では,マルチタスク処理をサポートするSemComシステムを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:07:48 GMT)
Predicting Human Impressions of Robot Performance During Navigation Tasks [8.0] 本研究では,非言語行動手がかりと機械学習技術を用いて,ロボット行動に対する人々の印象を予測する可能性を検討する。
以上の結果から,表情だけでロボット性能の人的印象について有用な情報が得られることが示唆された。
教師付き学習技術は、ほとんどの場合、人間のロボット性能予測よりも優れていたため、有望であった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:49:59 GMT)
Whispers in the Machine: Confidentiality in LLM-integrated Systems [7.9] 大規模言語モデル(LLM)は、外部ツールや商用サービスをLLM統合システムに拡張する傾向にある。
操作された統合はモデルを悪用し、他のインターフェースを通じてアクセスされた機密データを侵害することができる。
LLM統合システムにおける機密性リスクを評価するための体系的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:42:26 GMT)
PMPNet: Pixel Movement Prediction Network for Monocular Depth Estimation in Dynamic Scenes [7.7] 動的シーンにおける単眼深度推定のための新しい手法を提案する。
まず,動的シーンにおける物体の運動軌跡の任意性について理論的に検討する。
エッジ周辺の深度不整合を克服するために,変形可能なサポートウィンドウモジュールを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:42:29 GMT)
Learning Identifiable Factorized Causal Representations of Cellular Responses [7.7] 本稿では, 単一細胞摂動データにおける因果構造を明らかにするFCR学習法を提案する。
FCRは、切り離された複数の細胞表現を学習する。
我々は$mathbfz_tx$と$mathbfz_tx$と$mathbfz_tx$のブロック単位の識別可能性を証明する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:44:42 GMT)
MILU: A Multi-task Indic Language Understanding Benchmark [7.7] 既存のベンチマークは主に英語に焦点を当てており、Indic言語における大規模言語モデルの評価においてかなりのギャップを残している。
このギャップに対処するために設計された総合評価ベンチマークMILUを紹介する。
インド中心のデザインにより、MILUは地域や州レベルの試験の資料を取り入れ、地域の歴史、芸術、祭典、法律などのトピックを科学や数学のような標準的な主題と共にカバーしている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:17:17 GMT)
Heterogeneity-Aware Cooperative Federated Edge Learning with Adaptive Computation and Communication Compression [7.6] クラウドベースのフェデレーション・ラーニング(FL)の欠点により、モバイルエッジネットワーク上でのFLの効率を改善するために、協調フェデレーション・エッジ・ラーニング(CFEL)が提案されている。
CFELは、動的および不均一なデバイス特性から生じる重要な課題に直面し、収束を遅くし、リソース消費を増加させる。
本稿では、トレーニング時間とエネルギー消費を最小化し、モデル精度を最大化することを目的とした、textitHeterogeneity-Aware Cooperative Edge-based Federated Averaging (HCEF)と呼ばれる不均一性を考慮したCFEL方式を提案する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 17:39:20 GMT)
Targeted Manipulation and Deception Emerge when Optimizing LLMs for User Feedback [7.5] 人間のフィードバックを最大限にするためのトレーニングは、AIの逆インセンティブ構造を生み出します。
ユーザフィードバックを模擬した強化学習によるLLMの学習により,この現象を研究する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:31:02 GMT)
MSTA3D: Multi-scale Twin-attention for 3D Instance Segmentation [7.4] MSTA3Dはスーパーポイントベースの3Dインスタンスセグメンテーションのための新しいフレームワークである。
マルチスケールの特徴表現を利用し、それらを効果的にキャプチャするためのツインアテンション機構を導入している。
我々の手法は最先端の3Dインスタンスセグメンテーション手法を超越している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:14:39 GMT)
PitRSDNet: Predicting Intra-operative Remaining Surgery Duration in Endoscopic Pituitary Surgery [7.3] 本稿では,下垂体手術中の残存手術期間(RSD)を予測するためのPitRSDNetを提案する。
PitRSDNet はワークフロー知識を RSD 予測に統合する。1) ステップと RSD を同時に予測するためのマルチタスク学習,2) 時間的学習と推論におけるコンテキストとしての事前ステップ。
PitRSDNetは、88のビデオを備えた新しい内視鏡下垂体手術データセットでトレーニングされ、従来の統計的および機械学習手法よりも競争力のあるパフォーマンス向上を示す。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 11:44:29 GMT)
Palu: Compressing KV-Cache with Low-Rank Projection [7.3] 本稿では,Paluと呼ばれるKVキャッシュ圧縮フレームワークを提案する。
Paluは線形層を低ランクの行列に分解し、圧縮された中間状態をキャッシュし、フライ時に全キーと値を再構築する。
実験の結果、PuluはKVキャッシュを50%圧縮し、高い精度を維持し、RoPEベースのアテンションモジュール上で最大1.89倍の精度を提供することがわかった。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:08:55 GMT)
Rethinking Model Inversion Attacks With Patch-Wise Reconstruction [7.3] モデルインバージョン(MI)攻撃は、ターゲットモデルの重みからリバースエンジニアリングによってトレーニングデータセットを推測または再構成することを目的としている。
我々は,MI攻撃の確率論的解釈を提供するジグソーパズルにインスパイアされたPatch-MI法を提案する。
Patch-MIは従来の手法に比べてTop 1攻撃精度を5%向上することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:08:57 GMT)
CTEFM-VC: Zero-Shot Voice Conversion Based on Content-Aware Timbre Ensemble Modeling and Flow Matching [7.1] CTEFM-VCは、発話を言語内容と音色表現に分解するフレームワークである。
音色モデリング能力と生成音声の自然性を高めるため,文脈を考慮した音色アンサンブルモデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:23:17 GMT)
Alternate Loss Functions for Classification and Robust Regression Can Improve the Accuracy of Artificial Neural Networks [6.9] 本稿では,ニューラルネットワークのトレーニング速度と最終的な精度が,ニューラルネットワークのトレーニングに使用する損失関数に大きく依存することを示す。
様々なベンチマークタスクの性能を著しく向上させる2つの新しい分類損失関数を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:33:02 GMT)
Explainable cognitive decline detection in free dialogues with a Machine Learning approach based on pre-trained Large Language Models [6.8] 我々は,認知の低下を検出するために,自由対話から特徴を抽出するために,Large Language Modelsを提案する。
本ソリューションは, (i) 事前処理, (ii) 自然言語処理技術による特徴工学, (iii) 性能を最適化するための特徴解析と選択, (iv) 自動説明可能性による分類を含む。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:38:08 GMT)
AM Flow: Adapters for Temporal Processing in Action Recognition [6.7] textitAttention Map (AM) Flowは、入力されたビデオフレーム内の動きに関連するピクセルを識別する手法である。
AMフローは空間的および時間的処理の分離を可能にし、時間的処理の組合せよりも改善された結果を提供する。
我々は、Kineetics-400、Something v2、Toyota Smarthomeのデータセットについて実験を行い、最先端または同等の結果を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:07:22 GMT)
ARN-LSTM: A Multi-Stream Attention-Based Model for Action Recognition with Temporal Dynamics [6.7] ARN-LSTMは、アクションシーケンスにおける空間的動きと時間的ダイナミクスを同時にキャプチャする課題に対処するために設計された、新しい行動認識モデルである。
提案モデルでは, 複数ストリーム融合アーキテクチャを用いて, 関節, 動き, 時間情報を統合する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:29:51 GMT)
Counterfactual Explanations via Riemannian Latent Space Traversal [6.7] 反現実的な説明は実践者に実行可能な説明を提供するための強力なツールを形成する。
そこで本研究では,デコーダと分類器を介して引き戻された計量を用いて,実測的な説明を行う。
このメトリクスは、データの複雑な幾何学的構造と学習された表現に関する情報を符号化し、高い忠実度を持つ堅牢な反事実軌道を得ることを可能にする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:49:39 GMT)
Private DNA Sequencing: Hiding Information in Discrete Noise [6.6] そこで本研究では,DNAサンプルを混合した付加雑音で2変数変数$X$を隠蔽する問題について検討する。
この問題の解に対する上界と下界を特徴付けるが、これは経験的に非常に近いことが示される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:05:29 GMT)
TRACE: Temporal Grounding Video LLM via Causal Event Modeling [6.6] ビデオ時間グラウンド(VTG)は、ビデオ理解モデルにとって重要な機能であり、ビデオブラウジングや編集などの下流タスクにおいて重要な役割を果たす。
現在のビデオLLMは自然言語生成のみに依存しており、ビデオに固有の明確な構造をモデル化する能力がない。
本稿では,映像をイベントのシーケンスとして表現する因果イベントモデリングフレームワークを導入し,過去のイベントやビデオ入力,テクスチャインストラクションを用いて現在のイベントを予測する。
本稿では,TRACE と呼ばれるタスクインターリーブビデオ LLM を提案し,実際に因果イベントモデリングフレームワークを効果的に実装する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 08:58:14 GMT)
3-in-1: 2D Rotary Adaptation for Efficient Finetuning, Efficient Batching and Composability [6.5] 大規模言語モデル (LLM) に適応するために, 簡単な2次元回転を用いた新しい手法RoAdを導入する。
RoAdはパラメータ効率が非常に高く、8つの常識推論タスク、4つの算術推論タスクと0.1%のトレーニング可能なパラメータを提供する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 09:07:25 GMT)
FPPL: An Efficient and Non-IID Robust Federated Continual Learning Framework [6.4] フェデレーション型連続学習(FCL)は、分散化されたフェデレーション型学習環境において、シーケンシャルなデータストリームから学習することを目的としている。
既存のFCLメソッドは通常、典型的なリハーサル機構を使用しており、これはプライバシー侵害や追加の面倒なストレージや計算負荷をもたらす可能性がある。
本研究では,FPPL(Federated Prototype-Augmented Prompt Learning)と呼ばれる,効率的で非IIDな連立型連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:15:21 GMT)
Generation of high-fidelity Greenberger-Horne-Zeilinger states in a driven hybrid quantum system [6.3] 本稿では,長距離グリーンバーガー・ホーネ・ザイリンガー状態の駆動型ハイブリッド量子システムにおける実現のための理論的スキームを提案する。
我々の結果は量子ネットワークと量子コンピューティングの領域に可能性をもたらす。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:24:27 GMT)
CleAR: Robust Context-Guided Generative Lighting Estimation for Mobile Augmented Reality [6.3] 我々は,360$circ$画像のフォーマットで高品質な環境マップを作成できるCleARと呼ばれるジェネレーティブ照明推定システムを提案する。
エンドツーエンドの生成推定には3.2秒の速さで、最先端の手法を110倍に向上させる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:37:18 GMT)
Learning to Price Homogeneous Data [6.3] 価格曲線を近似する新たな離散化手法を開発した。
オンラインアルゴリズムは UCB や FTPL のような古典的なアルゴリズムをベースとしています。
改良された離散化スキームを使用することで、設定で$tildeO(msqrtT)$後悔を達成でき、逆設定で$tildeO(m3/2sqrtT)$後悔を達成できます。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 18:51:17 GMT)
Stein Variational Newton Neural Network Ensembles [6.3] 本稿では, 深いアンサンブルを修正し, スタイン変分ニュートン更新を取り入れたベイズ推定法を提案する。
我々のアプローチはスケーラブルな現代ヘッセン近似を一意に統合し、より高速な収束とより正確な後部分布近似を実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:33:24 GMT)
Masked Autoencoders are Parameter-Efficient Federated Continual Learners [6.2] pMAEは、MAEを用いた画像再構成により、クライアント側の再構成プロンプトを学習する。
アップロードされた復元情報を再構築して、以前のタスクと異なるクライアント間でのデータ分散をキャプチャする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:28:18 GMT)
Collective motion using quantum-like entanglement of neighbours in perceptual space [6.2] 我々は、視覚知覚における量子的絡み合いのレンズを通して、自己推進剤の集合運動を探索する。
フラッキング行動のためのよく知られたパラダイムである、よく知られたVicsekモデルが、いかに自然に現れるかを示す。
我々は、GHZ状態、W状態、クラスター状態などの異なる種類の量子状態が集団運動にどのように影響するかを研究するために分析を拡張した。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 09:13:38 GMT)
Collective motion from quantum entanglement in visual perception [6.2] 隣接するエージェントの知覚状態に量子エンタングルメントを導入することで,自己推進剤のアライメントを検討する。
本モデルでは, 絡み合った状態の適切な選択により, フラッキング挙動のよく知られたヴィエクモデルが導出可能であることを示す。
このアプローチは、群知能とマルチエージェント協調に関する新たな洞察を与え、古典的な集団行動のパターンが、絡み合った知覚状態からどのように自然に現れるかを明らかにする。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 09:13:38 GMT)
Data Augmentations Go Beyond Encoding Invariances: A Theoretical Study on Self-Supervised Learning [6.2] 拡張は元のデータと似ていても、多種多様である必要はなく、どちらもあり得ないことを示す。
自己指導型学習において、このような拡張を再構築し、強化選択に関する洞察を与えるアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:25:57 GMT)
Improved bounds for testing low stabilizer complexity states [6.2] 安定化状態の耐久試験における最先端パラメータの改善について検討する。
また、安定度が低い状態をテストする問題についても検討する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:17:33 GMT)
Pipeline Parallelism with Controllable Memory [6.1] 既存のパイプラインスケジュールのほとんどすべてがメモリ非効率であることが示されています。
制御可能なアクティベーションメモリを備えた,メモリ効率の良いビルディングブロック群を紹介する。
1F1Bと同じアクティベーションメモリを維持しながら、ほぼゼロのパイプラインバブルを実現することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:18:13 GMT)
LES-SINDy: Laplace-Enhanced Sparse Identification of Nonlinear Dynamical Systems [6.0] 動的システム(LES-SINDy)のLaplace-Enhanced SparSe識別法を提案する。
LES-SINDy は微分と不連続項のより正確な近似を可能にする。
また、ラプラス領域における成長関数や数値誤差を効果的に処理する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:27:55 GMT)
Differentially Private Integrated Decision Gradients (IDG-DP) for Radar-based Human Activity Recognition [6.0] 近年の研究では、レーダー歩行パターンから被写体や性別を認識する上で高い精度が示され、プライバシーの懸念が高まっている。
本研究では,レーダベースヒューマンアクティビティ認識(HAR)システムにおけるプライバシ脆弱性を調査することによって,これらの問題に対処する。
本稿では,IDGアルゴリズムによって導かれる属性によって駆動される差分プライバシー(DP)を用いた新たなプライバシー保護手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:08:26 GMT)
AVSS: Layer Importance Evaluation in Large Language Models via Activation Variance-Sparsity Analysis [5.9] 本稿では,各層がモデル性能に与える影響を評価するために,正規化活性化分散と疎性を組み合わせた新しい計量法を提案する。
AVSSに基づいて、約25%のレイヤを特定し、取り除くことにより、元のモデル性能の90%以上を達成できる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:29:49 GMT)
Theoretical characterisation of the Gauss-Newton conditioning in Neural Networks [5.9] ニューラルネットワークにおけるガウスニュートン行列(GN)の条件付けを理論的に特徴付けるための第一歩を踏み出す。
我々は、任意の深さと幅の深い線形ネットワークにおいて、GNの条件数に厳密な境界を確立する。
残りの接続や畳み込み層といったアーキテクチャコンポーネントに分析を拡張します。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:56:48 GMT)
Against Multifaceted Graph Heterogeneity via Asymmetric Federated Prompt Learning [5.8] 本稿では,非対称なグラフ知識の伝達を効率的に行うためのフェデレートグラフプロンプト学習(FedGPL)フレームワークを提案する。
我々は,FedGPLの精度と有効性を示すため,理論解析と広範囲な実験を行った。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:42:25 GMT)
DiffuMask-Editor: A Novel Paradigm of Integration Between the Segmentation Diffusion Model and Image Editing to Improve Segmentation Ability [5.8] 本稿では、アノテーション付きデータセットに対する拡散モデルと画像編集を組み合わせたDiffuMask-Editorを提案する。
Text2Imageモデルを用いて複数のオブジェクトを画像に統合することにより、より現実的なデータセットの作成を容易にする。
その結果、DiffuMask-Editorによって生成された合成データにより、セグメント化法は実データよりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:39:01 GMT)
LoQT: Low-Rank Adapters for Quantized Pretraining [5.8] Low-Rank Adapters for Quantized Training (LoQT) は、量子化モデルの効率的なトレーニング方法である。
我々のアプローチは、事前学習モデルと微調整モデルの両方に適しています。
言語モデリングとダウンストリームタスク適応において,LoQTが最大7Bパラメータを24GBのGPU上で効率的にトレーニングできることを実証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:50:00 GMT)
LiDAttack: Robust Black-box Attack on LiDAR-based Object Detection [5.7] LiDAttackは、LiDARセンサーに対する堅牢なブラックボックス敵攻撃である。
実験は、3つの支配的なオブジェクト検出モデルを持つ3つのデータセット(KITTI、nuScenes、自己構築データ)で実施される。
その結果、LiDAttackは広範囲の物体検出モデルをターゲットにしており、攻撃成功率(ASR)は最大90%であることがわかった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:37:12 GMT)
Towards Generative Ray Path Sampling for Faster Point-to-Point Ray Tracing [5.7] 本稿では,潜在的光線経路を効率的にサンプリングするための機械学習支援レイトレーシング手法を提案する。
我々のモデルは、あらゆる可能なパスの中で潜在的に有効なパスを優先順位付けし、シーンの複雑さと線形にスケールすることを学ぶ。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:42:07 GMT)
OneDiff: A Generalist Model for Image Difference Captioning [5.7] 画像差分キャプション(IDC)は、近縁な画像間の変化を正確に記述するために重要である。
OneDiffは、堅牢な視覚言語モデルアーキテクチャを利用する新しいジェネラリストアプローチである。
OneDiffは、既存の最先端モデルを精度と適応性で一貫して上回っている。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 09:14:03 GMT)
xDiT: an Inference Engine for Diffusion Transformers (DiTs) with Massive Parallelism [5.7] 拡散モデルは高品質の画像やビデオを生成する上で重要な要素である。
本稿では,DiTの総合的並列推論エンジンであるxDiTを紹介する。
特に、Ethernetに接続されたGPUクラスタ上でDiTsのスケーラビリティを最初に示すのは、私たちです。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 01:40:38 GMT)
Kernel Density Bayesian Inverse Reinforcement Learning [5.7] 逆強化学習(IRL)法は、エージェントの報酬関数を専門家の行動の実証を用いて推定する。
この研究は、ベイズIRLを様々な領域に適用できる原理的で理論的に基礎付けられた枠組みを導入している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:36:06 GMT)
Conformal-in-the-Loop for Learning with Imbalanced Noisy Data [5.7] 大規模なデータセットでは、クラス不均衡とラベルノイズが広まっています。
機械学習の研究の多くは、よくラベル付けされたバランスの取れたデータを前提としている。
コンフォーマル・イン・ザ・ループ(Conformal-in-the-Loop, CitL)は,コンフォーマルな予測に基づく手法を用いて,両課題に対処する新しいトレーニングフレームワークである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:09:58 GMT)
PipeLLM: Fast and Confidential Large Language Model Services with Speculative Pipelined Encryption [5.7] 暗号化は大幅な性能上のオーバーヘッドを引き起こす。
ユーザ透過型ランタイムシステムであるPipeLLMを紹介する。
我々は、暗号化を必要とするデータを予測するために、投機的パイプライン暗号を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:58:53 GMT)
Tracking Tumors under Deformation from Partial Point Clouds using Occupancy Networks [5.7] 本稿では, 腎臓ファントム内腫瘍の局所化を介し, インタラクティブな速度で変形する手法を提案する。
異所性腎腫瘍と内因性腎腫瘍を混入した3Dハイドロゲル腎ファントムを導入することにより,本法の有効性を検証した。
以上の結果から,6mmから10mmの腎に腫瘍を局在させ,60Hz以上の3D情報を提供することができた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:15:17 GMT)
QCG-Rerank: Chunks Graph Rerank with Query Expansion in Retrieval-Augmented LLMs for Tourism Domain [5.7] 大規模言語モデルにおける幻覚を緩和するQCG-Rerankモデルを提案する。
我々は,Cultour,IIRC,StrategyQA,HotpotQA,SQuAD,MuSiQueデータセットのモデルを評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:15:22 GMT)
A Novel Metric for Measuring the Robustness of Large Language Models in Non-adversarial Scenarios [5.6] 複数のデータセット上で複数の大規模言語モデルのロバスト性を評価する。
ベンチマークデータセットは、自然に保存され、重複しない摂動を導入することで構築される。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:32:40 GMT)
A Novel Metric for Measuring the Robustness of Large Language Models in Non-adversarial Scenarios [5.6] 複数のデータセット上で複数の大規模言語モデルのロバスト性を評価する。
ベンチマークデータセットは、自然に保存され、重複しない摂動を導入することで構築される。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:32:40 GMT)
A Novel Metric for Measuring the Robustness of Large Language Models in Non-adversarial Scenarios [5.6] 複数のデータセット上で複数の大規模言語モデルのロバスト性を評価する。
ベンチマークデータセットは、自然に保存され、重複しない摂動を導入することで構築される。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:32:40 GMT)
Variable Selection in Convex Piecewise Linear Regression [5.4] 本稿では,凸片方向線形回帰における変数選択の解としてスパース勾配を提案する。
亜ガウス雑音下でのSpGDには非漸近局所収束解析が提供される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:19:09 GMT)
Learning to grok: Emergence of in-context learning and skill composition in modular arithmetic tasks [5.4] モジュール型算術タスクの集合における文脈内学習とスキル構成の出現について検討する。
具体的には、線型モジュラ函数の有限集合 $z = a, x + b, y ;mathrmmod; p$ を mathbbZ_p2$ のベクトル $(a, b) でラベル付けする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:04:27 GMT)
Learning from Convolution-based Unlearnable Datastes [5.3] ConlearnベースのUnlearnable DAtaset(CUDA)メソッドは、データセット内のすべてのイメージにクラスワイドなぼかしを適用することによって、データを学習不能にすることを目的としている。
本研究は,画像のシャープ化と周波数フィルタリングにより,データが未学習のままであるか否かを評価する。
学習不能なデータを用いて学習したモデルに対して,逆行訓練によるテスト精度の大幅な向上を観察する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 01:51:50 GMT)
Automatic Structured Pruning for Efficient Architecture in Federated Learning [5.3] フェデレートラーニング(FL)では、訓練はクライアントデバイス上で行われ、典型的には限られた計算資源とストレージ容量を持つ。
FLシステムに適した自動プルーニング方式を提案する。
当社のソリューションは,通信コストを最小化しながら,クライアントデバイスの効率を向上する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:52:02 GMT)
Repository-Level Compositional Code Translation and Validation [5.3] リポジトリレベルのコード翻訳を自動化するニューロシンボリックアプローチであるAlphaTransを提案する。
AlphaTransを利用して,836,8575,2719>クラス,メソッド,テストからなる10の実世界のオープンソースプロジェクトを翻訳しました。
翻訳されたコード断片の99.1%は構文的に正しいものであり、AlphaTransは翻訳の動作と機能的正しさを25.8%で検証している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:00:07 GMT)
Do graph neural network states contain graph properties? [5.2] 診断分類器を用いたグラフニューラルネットワーク(GNN)のモデル説明可能性パイプラインを提案する。
このパイプラインは、さまざまなアーキテクチャやデータセットにわたるGNNの学習した表現を探索し、解釈することを目的としている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:26:07 GMT)
Inferring stochastic low-rank recurrent neural networks from neural data [5.2] 計算神経科学における中心的な目的は、大きなニューロンの活動と基礎となる力学系を関連付けることである。
低ランクリカレントニューラルネットワーク(RNN)は、トラクタブルダイナミクスを持つことによって、そのような解釈可能性を示す。
そこで本研究では,低ランクRNNをモンテカルロ変分法に適合させる手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:42:47 GMT)
On the phase diagram of extensive-rank symmetric matrix denoising beyond rotational invariance [5.1] 隠れ信号が係数行列 $XXintercal$ で回転不変でないとき、行列の分解の理解に向けて前進する。
我々は、因子化(すなわち、$X$自身を推定する)が符号と置換普遍性(英語版)(Sign and permutation universality)に到達できるのは、遷移を超えてのみであると主張する。
我々はまた、因子化(すなわち、$X$自身を推定する)が符号と置換普遍性(英語版)(Sign and permutation universality)に到達できるのは、遷移を超えてのみであると主張する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:50:37 GMT)
Multi-Agent Decision Transformers for Dynamic Dispatching in Material Handling Systems Leveraging Enterprise Big Data [5.1] 本研究では,実際のマルチエージェント材料ハンドリングシステムにおける動的ディスパッチポリシとして,決定変換器の適用について検討する。
実験結果から, 材料処理システムのスループットを相当に向上できることを示す。
しかし、原文がランダムな要素を含んでいる場合や、データセットのパフォーマンスが一定の閾値以下である場合、決定変換器は原文を上回りません。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:26:33 GMT)
Evaluating the Ability of Large Language Models to Generate Verifiable Specifications in VeriFast [5.0] 大規模言語モデル(LLM)は、多くのソフトウェアエンジニアリング活動において有望であることを示している。
本稿では,分離論理に基づく仕様生成におけるOpenAIのGPTモデルの有効性について検討する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:44:11 GMT)
Show, Don't Tell: Learning Reward Machines from Demonstrations for Reinforcement Learning-Based Cardiac Pacemaker Synthesis [5.0] Reinforcement Learning (RL) は、最近、創造的デザイン空間探索のためのパフォーマンスアルゴリズムとして提案されている。
Boston Scientificは2007年にペースメーカー仕様の詳細を公表した。
報奨機の形でラベル付きデモンストレーションから正当性仕様を学習する可能性を探る。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:29:27 GMT)
FedPID: An Aggregation Method for Federated Learning [5.0] FedPIDはFederated tumor Challenge 2024 (FETS24)への提出である。
FedCostWAvgとFedPIDAvgにインスパイアされた我々は、フェデレーションと協調学習のための改善されたアグリゲーション戦略を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:08:36 GMT)
Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models [4.9] 本稿では,合成顔画像のリアリズム向上を目的とした,リアリズム伝達のための新しいフレームワークを提案する。
グラフィクスパイプラインの制御可能な側面とリアリズム強化技術を統合することで、我々は大量のリアルなバリエーションを生成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:42:22 GMT)
Weakly Supervised Veracity Classification with LLM-Predicted Credibility Signals [4.9] Pastelは、Webコンテンツから信頼性信号を取り出すために、大きな言語モデルを活用する弱い教師付きアプローチである。
信頼性信号と信頼性の関係について検討し,各信号がモデル性能に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:33:00 GMT)
Mitigating Spurious Correlations via Disagreement Probability [4.9] 経験的リスク最小化(ERM)で訓練されたモデルは、ターゲットラベルとバイアス属性の急激な相関に偏りがちである。
すべてのデータサンプルのモデル性能を堅牢に向上する訓練目標を導入する。
次に, バイアスラベルを必要としない脱バイアス法DPR(Disagreement Probability based Resampling for Debiasing)を導出する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:44:04 GMT)
Simultaneous Resonant and Broadband Detection of Ultralight Dark Matter and High-Frequency Gravitational Waves via Cavities and Circuits [4.8] シングルモード共振器は広い周波数範囲をカバーするために複数の走査ステップを必要とする。
ビームスプリッタ型および非縮退パラメトリックカップリングによる補助モードを導入する。
ヘテロダインアップコンバージョン検出では、ソース周波数の複数の順序を高感度でプローブすることができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:49:22 GMT)
Evaluating the quality of published medical research with ChatGPT [4.8] 公表された研究の質を評価することは時間を要するが、部門評価、任命、昇進には重要である。
これまでの研究では、ChatGPTが研究品質の項目を採点できることが示されており、その結果は臨床医学以外の分野における品質の指標と正の相関がある。
この記事では、この異常を、これまでで最大のデータセットと、より詳細な分析で調査する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:24:36 GMT)
Dissertation: On the Theoretical Foundation of Model Comparison and Evaluation for Recommender System [4.8] レコメンダシステムは、ユーザの履歴データを利用して顧客の興味を推測し、パーソナライズされたレコメンデーションを提供する。
協調フィルタリング(Collaborative filtering)は、複数のユーザのレーティングを使用して、欠落したレーティングを予測するレコメンデーションアルゴリズムの1つである。
Recommender システムはより複雑になり、コンテンツベースの属性やユーザインタラクション、コンテキスト情報などの補助的なデータを組み込むことができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:31:52 GMT)
LE-PDE++: Mamba for accelerating PDEs Simulations [4.8] PDEの潜在進化法は、古典的および深層学習に基づくPDEソルバの計算強度に対処するように設計されている。
本手法は, LE-PDEと比較して推定速度を2倍にし, パラメータ効率を同じレベルに維持する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:04:11 GMT)
Deep Unfolded Local Quantum Annealing [4.7] 局所量子アニール (LQA) は最適化問題の解法として設計されている。
これは、大域的最小目的関数を決定するために勾配進化を利用するQAからインスピレーションを得ている。
深層展開LQAは元のLQAよりも優れており、実世界のアプリケーションに顕著な洞察と影響を示す。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:33:49 GMT)
FedCCRL: Federated Domain Generalization with Cross-Client Representation Learning [4.7] ドメイン一般化(DG)は、目に見えないドメインに効果的に一般化できるモデルを訓練することを目的としている。
クライアントがデータを直接共有せずに協調的にモデルをトレーニングするフェデレートラーニング(FL)では、既存のDGアルゴリズムはFL設定に直接適用できない。
プライバシを損なうことなくモデルの一般化能力を大幅に向上させる,新しいフェデレーションドメイン一般化手法であるFedCCRLを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:43:05 GMT)
Is This the Same Code? A Comprehensive Study of Decompilation Techniques for WebAssembly Binaries [4.7] 本稿では,C-based decompilerの正確性,可読性,構造的類似性など,様々な側面から実験的に評価する新しいフレームワークを提案する。
これによりWASMとネイティブバイナリに依存するソフトウェアシステムのセキュリティと信頼性が向上する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:08:03 GMT)
Active Gaze Behavior Boosts Self-Supervised Object Learning [4.6] 本研究では, 視覚学習モデルを用いて, 幼児の視線行動を利用した視点不変物体認識の開発が可能であるかを検討した。
幼児の視線戦略が不変物体表現の学習を支援することを示す実験を行った。
本研究は,幼児の視線行動が視覚不変物体認識の自己教師付き学習を支援する方法を明らかにする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:44:46 GMT)
TeleOracle: Fine-Tuned Retrieval-Augmented Generation with Long-Context Support for Network [4.6] 我々はPhi-2小言語モデル(SLM)上に構築された通信通信特化検索拡張生成(RAG)システムであるTeleOracleを紹介する。
コンテキスト検索を改善するために、TeleOracleはセマンティックチャンキングとハイブリッドキーワードとセマンティック検索を組み合わせた2段階のレトリバーを使用している。
モデルの性能を徹底的に分析した結果,我々のRAGフレームワークは,Phi-2モデルよりも30%精度が向上し,ダウンストリーム質問応答(QnA)タスクにおいてPhi-2を通信領域に整列させるのに有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:12:08 GMT)
Grounding Emotional Descriptions to Electrovibration Haptic Signals [4.6] 自由形式のユーザ言語は、触覚設計のためのリッチな感覚情報と感情情報を提供する。
感覚と感情のキーワードを抽出し、それらをセマンティッククラスタにグループ化する計算パイプラインを開発した。
提案するパイプラインは,触覚経験を解析するための計算手法の実現可能性を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:30:57 GMT)
OwMatch: Conditional Self-Labeling with Consistency for Open-World Semi-Supervised Learning [4.5] 半教師付き学習(SSL)は、注釈のないデータの可能性を活用するための堅牢なフレームワークを提供する。
オープンワールドSSL(OwSSL)の出現は、ラベルのないデータが目に見えないクラスのサンプルを包含する、より実践的な課題をもたらす。
我々は,条件付き自己ラベルとオープンワールド階層しきい値を組み合わせたOwMatchという効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:07:43 GMT)
Advanced computer vision for extracting georeferenced vehicle trajectories from drone imagery [4.4] 本稿では,高高度ドローン映像からジオレファレンスされた車両軌跡を抽出する枠組みを提案する。
私たちは最先端のコンピュータビジョンとディープラーニングを使って、エンドツーエンドのパイプラインを作成しています。
結果は、精密で費用対効果の高い都市交通監視のために、ドローン技術と高度なコンピュータビジョンを統合する可能性を示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:49:01 GMT)
TRIAGE: Ethical Benchmarking of AI Models Through Mass Casualty Simulations [4.3] 本稿では,MLMが大量事故時に倫理的判断を下す能力をテストする,新しい機械倫理(ME)ベンチマークであるTRIAGE Benchmarkを提案する。
現実の倫理的ジレンマと医療専門家が設計した明確なソリューションを使用しており、アノテーションベースのベンチマークよりも現実的な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:38:38 GMT)
GVKF: Gaussian Voxel Kernel Functions for Highly Efficient Surface Reconstruction in Open Scenes [4.3] オープンシーンにおける効率的かつ効果的な3次元表面再構成法を提案する。
カーネルレグレッションによる離散3DGSに基づく連続的なシーン表現を提案する。
挑戦的なシーンデータセットの実験は、提案したGVKFの有効性と有効性を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:07:31 GMT)
Decentralized Social Networks and the Future of Free Speech Online [4.2] MastodonやBlueSkyのような分散ソーシャルネットワークは近年注目を集め、議論の的となっている。
本稿では、分散化プロジェクトによるオンラインコミュニケーションの展望を批判的に評価する。
フリースピーチの規範的理論を用いて、分散化設計がユーザの表現の自由をオンラインで促進するかどうかを検証している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:27:44 GMT)
Retrieving Implicit and Explicit Emotional Events Using Large Language Models [4.2] 大規模言語モデル (LLM) は近年,その優れたパフォーマンスから注目されている。
本研究では,LLMのコモンセンスにおける感情検索能力について検討する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:44:42 GMT)
Nash Equilibria via Stochastic Eigendecomposition [4.2] ナッシュ均衡は、パラメータへの純粋呼び出し、値分解とパワーの反復的変動によって近似できることを示す。
一般のゲームにおけるすべての平衡を、容易に利用できる線形代数ツールのみを用いて解くことを証明する擬符号と実験を提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:32:21 GMT)
Random Distillation Protocols in Long Baseline Telescopy [4.2] 量子エンハンスな天体画像では、複数の遠方の開口部が中心サーバから分散された量子資源を利用することで連携する。
その結果,全望遠鏡で受信した恒星光を前処理することで,資源消費を増大させることなく撮像性能を向上させることが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:30:38 GMT)
fMRI predictors based on language models of increasing complexity recover brain left lateralization [4.2] 脳の相関の左右差は、パラメータ数によるスケーリング則に従っていることを示す。
この発見は、大きな言語モデルを用いた脳活動の計算的解析と、言語に対する左半球優位を示す失語患者からの古典的な観察を照合する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:01:50 GMT)
A General Recipe for Contractive Graph Neural Networks -- Technical Report [4.1] グラフニューラルネットワーク(GNN)は、グラフ構造化データの表現を学習することで大きな人気を集めている。
GNNは、しばしば、安定性、一般化、およびノイズや敵の攻撃に対する堅牢性に関連する課題に直面している。
本稿では, SVD正則化により, 任意のGNNの収縮挙動を誘導する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:05:21 GMT)
On the Effects of Data Scale on UI Control Agents [4.1] 我々は,ファインチューニング単独が現実のコンピュータ制御エージェント構築の有効なアプローチであるかどうかを考察する。
新しいデータセットであるAndroidControlをリリースし、Androidアプリによる日々のタスクのデモ15,283件で構成されています。
ドメインを微調整したモデルでテストすると、ゼロと数ショットのベースラインを上回り、ロバストなパフォーマンスを単純により多くのデータを収集して得られるようにスケールすることがわかった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:18:22 GMT)
Robustness of near-thermal dynamics on digital quantum computers [4.1] トロッター化量子回路は、広く想定されるよりも、量子ゲート誤差とトロッター(離散化)誤差の両方に対してより堅牢であることを示す。
我々は、熱状態に近いランダムな生成状態の統計的アンサンブルである新しい理論ツールを使用する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 20:41:19 GMT)
LLM-Ref: Enhancing Reference Handling in Technical Writing with Large Language Models [4.1] LLM-Refは、研究者が複数のソース文書から記事を書くのを補助する記述支援ツールである。
チャンキングとインデックスを使用する従来のRAGシステムとは異なり、私たちのツールはテキスト段落から直接コンテンツを検索し、生成します。
我々の手法は、RAGシステムの正確で関連性があり、文脈的に適切な応答を生成する能力の全体像を提供する総合的な指標である、Ragasスコアの3.25タイムから6.26タイムの上昇を達成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:57:43 GMT)
Camera-Based HRV Prediction for Remote Learning Environments [4.1] 顔ビデオから血流パルス信号を復元することは、波形を復元するための一連の前処理、画像アルゴリズム、後処理を含む難しい作業である。
r を通して HRV の指標を得る上での課題は、アルゴリズムが BVP のピーク位置を正確に予測する必要性である。
本稿では,58名の被験者を対象に,高度に同期されたビデオとラベルを32時間以上使用したRLAP(Remote Learning Affect and Physiology)データセットを収集した。
RLAPデータセットを用いて,1次元畳み込みに基づくモデルであるSeq-rを訓練し,実験結果が明らかになった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:52:56 GMT)
Context-Informed Machine Translation of Manga using Multimodal Large Language Models [4.1] マルチモーダル大言語モデル(LLM)がマンガの翻訳に有効かを検討した。
具体的には,マルチモーダルLLMの視覚成分を利用して翻訳品質を向上させる手法を提案する。
本稿では,日本語とポーランド語を同時翻訳する新たな評価データセットを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:29:35 GMT)
Optimal estimates of trace distance between bosonic Gaussian states and applications to learning [4.0] 第1と第2のモーメントがエラー$varepsilon$まで認識されている場合、状態のトレース距離エラーも$varepsilon$にスケールする。
この証明は、2つのガウス状態の間のトレース距離を、その第1モーメントと第2モーメントのノルム距離の観点から厳密な境界を定めている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:38:21 GMT)
Metric properties of partial and robust Gromov-Wasserstein distances [3.9] グロモフ=ワッサーシュタイン距離(Gromov-Wasserstein distance, GW)は、最適な輸送のアイデアに基づいて、メトリクスの族を定義する。
GW距離は本質的に外れ音に敏感であり、部分的マッチングに対応できない。
我々の新しい距離は真の測度を定義し、それらがGW距離と同じ位相を誘導し、摂動にさらなる堅牢性をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:53:45 GMT)
Towards Autonomous Agents: Adaptive-planning, Reasoning, and Acting in Language Models [3.9] 本稿では,自律型意思決定言語エージェント構築のためのコンテキスト内学習アルゴリズムを提案する。
選択した言語エージェントは,テキストベースのゲーム環境においてタスクを解く能力を示す。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 21:04:31 GMT)
Pricing and Competition for Generative AI [3.9] われわれは、新しい生成AIソフトウェアの開発者がどのようにして技術をリリースし、価格を下げるかという課題を探求する。
まず、ユーザコスト効率に関して、特定のタスクに対する2つの異なるモデルの比較を行う。
次に、生成AIソフトウェアの価格問題を、2つの異なる企業間のゲームとしてモデル化する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:52:45 GMT)
Visual Self-supervised Learning Scheme for Dense Prediction Tasks on X-ray Images [3.8] 自己教師付き学習(SSL)は自然言語処理(NLP)においてかなりの進歩をもたらした
しかし、既存のビジュアルSSLモデルにコントラスト学習を組み込むことは、しばしば監督対象を超越する、かなりの進歩をもたらした。
ここでは、セキュリティ検査X線画像を用いた密集予測タスクに着目し、提案モデルであるセグメントローカライゼーション(SegLoc)を評価する。
インスタンスローカライゼーション(InsLoc)モデルに基づいて、SegLocはコントラスト学習における重要な課題の1つ、すなわち、クエリ埋め込みの偽陰性ペアに対処する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:06:25 GMT)
Coherent Hierarchical Probabilistic Forecasting of Electric Vehicle Charging Demand [3.8] 本稿では,複数の電気自動車充電ステーション(EVCS)の階層的確率的予測問題について検討する。
各充電ステーションに対して、部分入力凸ニューラルネットワーク(PICNN)に基づくディープラーニングモデルを訓練し、日頭充電需要の条件分布を予測する。
微分凸最適化層(DCL)は、分布からサンプリングされたシナリオを再構成し、一貫性のあるシナリオを生成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:25:24 GMT)
Finite-sample performance of the maximum likelihood estimator in logistic regression [3.8] 本稿では,ロジスティック回帰に対する最大極大推定器(MLE)の予測性能について考察する。
我々は,MLEの存在と過剰なロジスティックリスクについて,急激な非漸近的保証を得る。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:50:15 GMT)
Internalizing ASR with Implicit Chain of Thought for Efficient Speech-to-Speech Conversational LLM [3.7] 本稿では,ASR の思考を音声 LLM に暗黙的に内部化する手法を提案する。
このアプローチはレイテンシを低減し、モデルの音声に対するネイティブ理解を改善し、より効率的で自然なリアルタイムオーディオインタラクションを実現する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 08:01:22 GMT)
Can Language Models Enable In-Context Database? [3.7] 大型言語モデル (LLM) は、様々なタスクを処理できる数ショットの学習者として登場している。
軽量で人間が読めるインコンテキストデータベースの特徴は、従来のデータベースの代替となる可能性がある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:25:39 GMT)
Speak so a physicist can understand you! TetrisCNN for detecting phase transitions and order parameters [3.7] TetrisCNNは並列ブランチを持つ畳み込みNNであり、異なるカーネルを使用してスピンシステムの位相を検出する。
テトリスCNNは2次元イジングゲージ理論の例を用いて,より複雑な順序パラメータを検出可能であることを示す。
この研究は、NNと量子シミュレータを統合することで、新しいエキゾチックな物質相の研究につながる可能性がある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:30:58 GMT)
EMGBench: Benchmarking Out-of-Distribution Generalization and Adaptation for Electromyography [3.5] 本稿では,EMG分類アルゴリズムの分布外性能を評価するため,機械学習を用いた最初の一般化と適応ベンチマークを提案する。
ユーザの意図したジェスチャーをEMG信号で予測することにより、補助技術を制御するウェアラブルソリューションを作成することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:27:53 GMT)
Parameter-Efficient Fine-Tuning of Large Language Models for Unit Test Generation: An Empirical Study [3.5] GitHub Copilotのような大規模言語モデル(LLM)は、微調整なしで現実世界のタスクに苦労する。
本稿では,LoRA, (IA)3, およびプロンプトチューニングを含む各種PEFT法について検討する。
その結果,PEFT法は単体テスト生成のための完全微調整に匹敵する性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:03:18 GMT)
AmbigNLG: Addressing Task Ambiguity in Instruction for NLG [3.5] 我々は、自然言語生成(NLG)の指示におけるタスク曖昧性の課題に取り組むために設計された新しいタスクであるAmbigNLGを紹介する。
本稿では,異なる種類の命令の曖昧さを分類し,より明確な仕様で初期命令を洗練するあいまいさ分類法を提案する。
AmbigNLGの研究を促進するために注釈付けされた2500のインスタンスからなるデータセットを提示する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:48:34 GMT)
WER We Stand: Benchmarking Urdu ASR Models [3.5] 本稿では,Urdu Automatic Speech Recognition(ASR)モデルの総合評価を行う。
単語誤り率(WER)を用いた3種類のASRモデル(Whisper, MMS, Seamless-M4T)の性能解析を行った。
読み上げ音声データセットでは、スムーズな広さが他のASRモデルより優れているのに対し、ささやきの広さは会話音声データセットでは最高であることがわかった。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 07:27:37 GMT)
Geometry of Polynomial Neural Networks [3.5] 単項活性化機能を持つニューラルネットワーク(PNN)の表現性と学習過程について検討した。
これらの理論的結果は実験を伴う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:39:35 GMT)
Entropy stable conservative flux form neural networks [3.4] 本稿では,古典的数値保存法則をデータ駆動型フレームワークに統合した,エントロピー安定型保守型フラックス型ニューラルネットワークを提案する。
数値実験により、エントロピー安定CFNは、拡張時間領域の精度を維持しつつ、安定性と保存性を両立することを示した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:01:31 GMT)
Encoding Multi-level Dynamics in Effect Heterogeneity Estimation [3.4] 本稿では,任意の単一スケールCATE推定アルゴリズムをマルチスケールアルゴリズムに変換する,構成可能な手順のファミリーであるマルチスケールコンカニネーションを紹介する。
衛星画像に微調整された視覚変換器(ViT)モデルを組み合わせたCATE推定パイプライン上でのマルチスケール接続の性能をベンチマークする。
次に、Landsat衛星画像を用いてペルーとウガンダで実施された2つのランダム化制御試験(RCT)にマルチスケール手法を適用した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:47:48 GMT)
HACD: Harnessing Attribute Semantics and Mesoscopic Structure for Community Detection [3.4] コミュニティ検出は、密接に結びついた部分グラフを明らかにする上で重要な役割を果たす。
従来,ネットワークトポロジと属性情報を属性付きコミュニティ検出に有効活用してきた。
ヘテロジニアスグラフアテンションネットワークに基づく新しい属性付きコミュニティ検出モデルであるHACDを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:16:59 GMT)
Exploring Feature Importance and Explainability Towards Enhanced ML-Based DoS Detection in AI Systems [3.3] Denial of Service(DoS)攻撃は、AIシステムセキュリティの領域において重大な脅威となる。
統計的および機械学習(ML)に基づくDoS分類と検出アプローチは、幅広い特徴選択メカニズムを使用して、ネットワークトラフィックデータセットから特徴サブセットを選択する。
本稿では,MLによるDoS攻撃検出における特徴選択の重要性について検討する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:51:08 GMT)
Towards Leveraging News Media to Support Impact Assessment of AI Technologies [3.3] インパクトアセスメント(IA)の専門家主導のフレームワークは、AI技術が公衆の社会的行動、政策、そして、AIの認識とその使用に関する影響を形作る文化的、地理的文脈に与える影響を、必然的に見落としてしまう可能性がある。
本研究は、世界30カ国にまたがる266のニュースドメインから報告されたAIのネガティブな影響に対する微調整LDMの可能性を探るものである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:12:27 GMT)
PIAST: A Multimodal Piano Dataset with Audio, Symbolic and Text [3.2] PIAST(PIAST, PIano dataset with Audio, Symbolic, and Text)は、ピアノ音楽のデータセットである。
われわれはYouTubeから9,673曲を収集し、音楽の専門家による2,023曲の人間のアノテーションを追加した。
どちらも、オーディオ、テキスト、タグアノテーション、そして最先端のピアノの書き起こしとビート追跡モデルを利用したMIDIの書き起こしである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:34:13 GMT)
Guided Game Level Repair via Explainable AI [3.2] 機械学習モデルによって生成された手続き的に生成されたレベルは、さらなる編集なしでは解決できない。
本稿では,その解決不可能性に寄与するレベルの特定領域を特定するための説明可能性手法を提案する。
3つのゲームでテストした結果、このアプローチは手続き的に生成されたレベルを高速に修復するのに役立つことが実証された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:26:34 GMT)
Enhancing Risk Assessment in Transformers with Loss-at-Risk Functions [3.2] 本稿では,リスク・アット・リスク(VaR)と条件値アット・リスク(CVaR)をトランスフォーマーモデルに組み込んだ新たなロス・アット・リスク(Los-at-Risk)を導入する。
この統合により、Transformerモデルは潜在的に極端な損失を認識でき、高い財務上の決定を処理できる能力をさらに改善できる。
我々のロス・アット・リスク機能はトランスフォーマーのリスク予測と管理能力を改善することを実証するために、高度に揮発性のある財務データセットを用いて一連の実験を行った。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:44:43 GMT)
Dynamic Weight Adjusting Deep Q-Networks for Real-Time Environmental Adaptation [3.2] 本研究では、動的重み調整をDeep Q-Networks(DQN)に統合し、適応性を高めることを検討する。
これらの調整は、経験リプレイにおけるサンプリング確率を変更して、モデルがより重要な遷移に焦点を合わせるようにすることで実施する。
動的環境をうまくナビゲートする新しいDQNのためのインタラクティブ・ダイナミック・アセスメント・メソッド(IDEM)を設計する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:47:23 GMT)
Fast Fixes and Faulty Drivers: An Empirical Analysis of Regression Bug Fixing Times in the Linux Kernel [3.2] 本稿では、回帰バグの修正に要する時間を考慮して、カーネルの回帰バグ追跡に焦点を当てる。
調査したデータセットは、Linuxカーネルのレグレッションを追跡するregzbot自動化フレームワークに基づいている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:53:29 GMT)
QIS : Interactive Segmentation via Quasi-Conformal Mappings [3.1] ユーザ入力を正と負のクリックという形で組み込んだ準コンフォルマルな対話型セグメンテーション(QIS)モデルを提案する。
本稿では,QISが関心領域を含ませたり排除したりする能力の理論的支援を含む,提案モデルの徹底的な分析を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:20:25 GMT)
Enhancing Trade-offs in Privacy, Utility, and Computational Efficiency through MUltistage Sampling Technique (MUST) [3.1] プライバシ・アンプリフィケーション(PA)のためのサブサンプリング手法のクラスを提案する。
本研究は2段階MUST法におけるPA効果と実用性について包括的に解析する。
MUSTの繰り返し適用に関するプライバシー損失構成分析を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 01:00:29 GMT)
Multi-modal deformable image registration using untrained neural networks [3.1] 本稿では,ニューラルネットワークを用いた画像表現のための登録手法を提案する。
本手法では,登録前の暗黙的な表現能力に制限のある未学習ネットワークを用いる。
特定のデータ型に特化している従来の手法とは異なり、本手法は厳格かつ非厳格であり、シングルモーダルとマルチモーダルの登録を扱う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:13:32 GMT)
R+R:Understanding Hyperparameter Effects in DP-SGD [3.1] DP-SGDはプライバシー保護機械学習の標準的な最適化アルゴリズムである。
プライベートでない学習アプローチに比べて、パフォーマンスの低いアプローチでは、依然として一般的な課題である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:56:35 GMT)
Fuse It or Lose It: Deep Fusion for Multimodal Simulation-Based Inference [3.0] MultiNPEは、シミュレーションベースの推論において、異なるソースからの異種データをニューラルネットワークと統合する手法である。
我々は,MultiNPEの3つの融合手法を検討し,その性能を3つの挑戦実験で評価した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:24:51 GMT)
Private Attribute Inference from Images with Vision-Language Models [2.9] 視覚言語モデル(VLM)は、画像とテキストの両方を理解することができる。
我々は7つの最先端のVLMを評価し、最大77.6%の精度で様々な個人属性を推測できることを発見した。
モデルの一般的な能力で精度がスケールすることが観察され、将来のモデルはより強い推論の敵として誤用される可能性が示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:11:49 GMT)
A Synthetic Dataset for Personal Attribute Inference [2.9] LLMはオンラインのテキストから個人情報を正確に推測する能力だ。
個人属性を手動でラベル付けした7800以上のコメントからなる多様な合成データセットであるSynthPAIを生成する。
我々のデータセットを人間による研究で検証し、人間が実際のコメントを区別するタスクにおいて、ランダムな推測をわずかに上回っていることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:06:40 GMT)
Basis set generation and optimization in the NISQ era with Quiqbox.jl [2.9] よりカスタマイズ可能な基底セット生成と最適化のためのフレームワークを提案する。
We have developed a open-source software package called Quiqbox' in the Julia programming language。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:07:47 GMT)
Building New Clubhouses: Bridging Refugee and Migrant Women into Technology Design and Production by Leveraging Assets [2.8] 本稿では,2つのコミュニティ主導の参加型デザインワークショップの結果を報告する。
本研究は, A. 障害談話と強みに基づく物語, B. STEMスキルを文化的に安全かつ調整された学習環境にブリッジすること, C. 商業的生存性を通じてコミットメントをブリッジすること, D. 組織パートナーによるブリッジスキルや多様なコミュニティへの恩恵について考察した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:48:55 GMT)
Training Zero-Shot Generalizable End-to-End Task-Oriented Dialog System Without Turn-level Dialog Annotations [2.8] この作業はマルチタスク命令の微調整を用いて、より効率的でスケーラブルなタスク指向対話システムを構築する。
提案手法は,アノテートされたデータに基づいて訓練された最先端モデルと,市販のChatGPTモデルから10億のパラメータを比較検討する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 16:56:13 GMT)
Understanding Variational Autoencoders with Intrinsic Dimension and Information Imbalance [2.7] 本研究は,内在次元(ID)と情報不均衡を用いた変分オートエンコーダ(VAE)の隠れ表現の解析(II)
ボトルネックサイズがデータのIDよりも大きくなると,VAEは動作の遷移を行ない,二重ハッシュバックIDプロファイルと情報処理の質的なシフトをIIで捉えた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:58:41 GMT)
Causal Discovery and Classification Using Lempel-Ziv Complexity [2.7] 本稿では,Lempel-Ziv複雑性から導かれる新しい因果度尺度と距離計量を導入する。
因果決定木と距離決定木の有効性を評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:24:56 GMT)
Robust plug-and-play methods for highly accelerated non-Cartesian MRI reconstruction [2.7] マルチコイルデータからクリーンでノイズのないMRI信号を生成するための,教師なし事前処理パイプラインを提案する。
プレコンディショニング技術と組み合わせることで,高品質なデータに対する堅牢なMRI再構成を実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:27:57 GMT)
Optimal Scalarizations for Sublinear Hypervolume Regret [2.7] 均一にランダムな重みを持つ超体積スカラー化は、O(T-1/k)$の最適サブボリューム超体積後悔境界が得られることを示す。
多目的線型包帯の設定のために、不必要な$textpoly(k)$依存を取り除くために$tildeO(d T-1/2 + T-1/k)$の後悔境界を得る新しい非ユークリッド解析を導出する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:09:14 GMT)
24 days-stable CNOT-gate on fluxonium qubits with over 99.9% fidelity [2.6] 誘導結合された2つのフラクソニウム量子ビット上で60ns直接CNOTゲートを実現する。
我々のデータは、ゲート操作中の非デコヒーレンス関連エラーの調査を、2倍の10-4$まで下げる。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 02:42:51 GMT)
Regress, Don't Guess -- A Regression-like Loss on Number Tokens for Language Models [2.5] 本稿では,言語モデルに対するトークン損失の2つのバージョンを示す。
1つ目は、基底真理トークン値と予測クラス確率の重み付け和との間の損失$L_p$である。
第2の損失は、予測出力確率の分布と基底真理分布の間のワッサーシュタイン-1距離を最小化する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:43:24 GMT)
A Survey on LLM-based Code Generation for Low-Resource and Domain-Specific Programming Languages [2.5] LLM(Large Language Models)は、人気のあるプログラミング言語のコード生成機能を示す。
低リソースプログラミング言語(LRPL)とドメイン特化言語(DSL)のパフォーマンスは依然として大きな課題です。
LRPLやDSLは金融や科学といった専門分野の開発効率を高めるため、これらの課題に対処することが不可欠である。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 23:56:43 GMT)
Adaptive Optimization of TLS Overhead for Wireless Communication in Critical Infrastructure [2.5] TLSは、リソースに制約のあるデバイスや、重要なインフラストラクチャで広く使われているネットワークに対して、大きなオーバーヘッドをもたらす。
我々はTLSの設定の自由度を利用してアルゴリズム、パラメータ、その他の設定を動的に適用することを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:48:38 GMT)
Improving Steering Vectors by Targeting Sparse Autoencoder Features [2.4] ステアリングベクトルの効果をSAEを用いて測定し、ステアリングベクトル介入の因果効果を理解する方法を提案する。
SAE-Targeted Steering (SAE-TS) という改良されたステアリング法を開発し、意図しない副作用を最小限に抑えながら、特定のSAE特徴を標的としたステアリングベクトルを求める。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:46:20 GMT)
Non rigid geometric distortions correction -- Application to atmospheric turbulence stabilization [2.4] 大気乱流により劣化した画像を復元するための新しい手法が提示される。
乱流の影響を受けやすいフレーム列を考慮し,静的画像の特徴付けのための変動モデルを構築した。
我々のアルゴリズムは単純で効率的であり、様々なシナリオで容易に一般化できる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:21:41 GMT)
Enhancing Graph Neural Networks in Large-scale Traffic Incident Analysis with Concurrency Hypothesis [2.3] 本稿では,交通インシデント予測タスクにおける一般グラフニューラルネットワーク(GNN)モデルの予測能力を高めるために,CP法を提案する。
提案手法により,GNNは仮説に示すような同時インシデント情報を,無視可能な余分なパラメータによるトークン化によって組み込むことができる。
米国内の州や都市にまたがる実世界のデータを活用する大規模な実験は、CPを12の最先端のGNNアーキテクチャに統合することで、大幅な改善をもたらすことを実証している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:22:33 GMT)
Nonparametric regression on random geometric graphs sampled from submanifolds [2.3] ランダムな基底展開により設計したベイズ以前の分布から生じる後部分布の頻繁な挙動を解析する。
これらの手法の後方収縮速度は任意の正の滑らか度指数に対して最小値(対数係数まで)であることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:30:04 GMT)
Efficient Pruning for Machine Learning Under Homomorphic Encryption [2.3] プライバシ保護機械学習(PPML)ソリューションが広く普及している。
多くの人は、モデルとデータの機密性を提供する同型暗号化(HE)に頼っているが、大きなレイテンシとメモリ要求のコストがかかる。
我々は、PPML推論のレイテンシとメモリを削減するために、タイルテンソルと呼ばれるパッキング技術の上に、新しいプルーニング手法を含むHE-PExというフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:32:54 GMT)
Quantum Linear System Solvers: A Survey of Algorithms and Applications [2.3] 本論文では,量子線形系問題に対するアルゴリズムの背景にある主要な考え方を要約し,解析する。
我々は,誤り耐性と条件数に関して,最適下界への道を開いたHHL後の拡張に焦点を当てた。
本稿では,これらのアルゴリズムの微分方程式,量子機械学習,多体物理学への応用の可能性について論じる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:03:25 GMT)
First observations of the seiche that shook the world [2.2] 2023年9月16日、異常な10.88mHzの地震信号が世界中で観測され、9日間続いた。
1ヶ月後、同じ信号が現れ、もう1週間続いた。
いくつかの研究は、これらの信号は、東グリーンランドのフィヨルドで2つの地すべりが生成したメガナツミの後に形成されたチーチによって生成されたと理論づけている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:05:35 GMT)
SibylSat: Using SAT as an Oracle to Perform a Greedy Search on TOHTN Planning [2.2] 本稿では,全順序付きHTN問題(TOHTN)を効率的に解くためのSATベースの新しい手法であるSibylSatを提案する。
広く普及しているSATベースのHTNプランナとは対照的に,SibylSatでは,拡張のための有望な分解を識別可能な,フレディな検索アプローチを採用している。
実験により、SybylSatは既存のSATベースのTOHTNアプローチよりも、ほとんどのIPCベンチマークで実行時と計画品質の両方において優れていることが示された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:37:59 GMT)
Double Descent Meets Out-of-Distribution Detection: Theoretical Insights and Empirical Analysis on the role of model complexity [2.2] トレーニングとOODサンプルの両方において,分類器の信頼性を評価するためのOODリスク指標を提案する。
パラメータ数がサンプル数に等しい場合,OODリスクは無限のピークを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:39:12 GMT)
Machine learning identification of maternal inflammatory response and histologic choroamnionitis from placental membrane whole slide images [2.2] 胎盤の炎症過程は、子孫の健康に短期的、長期的に影響を及ぼす。
デジタル病理学と機械学習は胎盤炎症を理解する上で重要な役割を果たす。
本研究は,全スライド画像(WSI)に基づいて,機械学習を用いて母性炎症反応(MIR)を理解する可能性を検討することを目的とする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:21:56 GMT)
DISTINQT: A Distributed Privacy Aware Learning Framework for QoS Prediction for Future Mobile and Wireless Networks [2.1] 5Gと6G以上のネットワークは、あるレベルのQuality of Service(QoS)に依存してスムーズな運用を行う、新しくて挑戦的なユースケースとアプリケーションをサポートすることが期待されている。
タイムリーな方法での予測は、特に車両通信の場合のように、安全クリティカルな応用において非常に重要である。
DisTINQTは、予測のための新しいマルチヘッド入力対応分散学習フレームワークである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:26:36 GMT)
Satisfiability of commutative vs. non-commutative CSPs [2.1] NP-ハード CSP は、有限次元および無限次元ヒルベルト空間上の作用素を通して古典的満足度と満足度を分離することを示す。
また,非有界幅のトラクタブル CSP は,いかなる種類の満足感ギャップも持たないことを示した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:10:14 GMT)
Next Best View For Point-Cloud Model Acquisition: Bayesian Approximation and Uncertainty Analysis [2.1] この研究は、Next-Best-View(PC-NBV)にポイントネットベースのニューラルネットワークを適用する。
モデルアーキテクチャにドロップアウト層を組み込むことで、予測に関連する不確実性推定の計算を可能にする。
本研究の目的は,次の視点を正確に予測することで,ネットワークの精度を向上させることである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 01:32:09 GMT)
First-Explore, then Exploit: Meta-Learning to Solve Hard Exploration-Exploitation Trade-Offs [2.1] First-Exploreは、広範囲のドメインで人間のような探索が可能なメタRLアルゴリズムを開発するための重要なステップである。
我々の方法であるFirst-Exploreは、2つのポリシーを学習することで制限を克服する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:33:38 GMT)
Geometry of naturalistic object representations in recurrent neural network models of working memory [2.0] ニューラルネットワークの動作記憶において、自然言語的対象情報がいかに維持されているかを示す。
この結果から, ゴール駆動型RNNでは, 短時間で情報を追跡するために, 時系列メモリサブスペースが使用されていることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:57:46 GMT)
Fuzzing Processing Pipelines for Zero-Knowledge Circuits [2.0] ゼロ知識パイプライン(ZK)のための最初の系統的ファジリング手法を提案する。
このテクニックは、メタモルフィックなテストオラクルを使用して、重要なロジックのバグを検出する。
私たちはCircuzzというオープンソースのツールでこのテクニックを実装しました。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:31:03 GMT)
Leveraging Transformer-Based Models for Predicting Inflection Classes of Words in an Endangered Sami Language [1.8] 本論文では,Skolt Samiの語彙的特徴と形態的特徴を分類するために,トランスフォーマーモデルを用いた学習手法を提案する。
この研究の背後にある動機は、スコルト・サーミのような少数言語のための言語保存と再生活動を支援することである。
本モデルでは,POS分類では平均重み付きF1スコアが1.00であり,屈折分類では0.81である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:41:16 GMT)
BlindexTEE: A Blind Index Approach towards TEE-supported End-to-end Encrypted DBMS [1.8] 我々はBlindexTEEを紹介します。BlindexTEEはアプリケーションビジネス論理とデータベースの間に位置する新しいコンポーネントです。
BlindexTEEは、SEV-SNPシークレットVM内で実行することで、悪意のあるユーザや悪質な環境から保護されている。
データを暗号化して再暗号化することで、ブラインドインデックスを構築し、後でインデックスを効率的にクエリする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:45:28 GMT)
Optimality Condition for the Transpose Channel [1.8] 量子誤差補正において、ペッツ変換チャネルは、クニル・ラフラム条件が満たされたときに完全回復写像として機能する。
この研究は、トランスポーズチャネルの厳密な最適性に必要な、そして十分な条件を初めて導入し、証明する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:03:22 GMT)
Verification methods for international AI agreements [1.7] 潜在的な2種類の違反を検出できる10の検証方法を検討した。
各検証手法について, 記述, 過去の事例, 回避技術について述べる。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 20:46:07 GMT)
Efficient Vectorized Backpropagation Algorithms for Training Feedforward Networks Composed of Quadratic Neurons [1.7] 本稿では,1つの二次ニューロンを用いたXOR問題の解法を提案する。
これは$mathcalC$境界クラスタからなる任意のデータセットが、$mathcalC$二次ニューロンの単一の層でのみ分離可能であることを示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 06:06:02 GMT)
Speed limits and thermodynamic uncertainty relations for quantum systems governed by non-Hermitian Hamiltonian [1.7] 非エルミート的ハミルトニアンは、開量子系と非平衡力学を記述する上で重要な役割を果たす。
我々は、非エルミート・ハミルトニアンが支配するシステムのトレードオフ関係を、マルゴラス・レヴィタン型およびマンデルスタム・タム型境界に焦点をあてて導出した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:28:23 GMT)
SIRA: Scalable Inter-frame Relation and Association for Radar Perception [1.6] 我々は,時間的特徴関係を拡張地平線上で利用し,有効結合のための空間的動きの整合性を適用した。
提案手法は,オブジェクト指向オブジェクト検出のための58.11 mAP@0.5,Radiateデータセット上の複数オブジェクト追跡のための47.79 MOTAを実現する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:14:35 GMT)
Computing critical exponents in 3D Ising model via pattern recognition/deep learning approach [1.6] 我々は、スピン状態の特定のコンフォーメーションに基づいてニューラルネットワークをトレーニングするための教師付きディープラーニングアプローチを実行する。
列車/テストの精度はそれぞれ0.92と0.6875である。
このアプローチから重要な指数を計算することの可能性を定量化するために、さらに多くの研究が続けられている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:57:24 GMT)
Silver medal Solution for Image Matching Challenge 2024 [1.6] Image Matching Challenge 2024は、さまざまな画像集合から3Dマップを構築することに焦点を当てたコンペティションである。
このプロジェクトでは,複数の高度なテクニックを組み合わせたパイプライン手法が開発されている。
この手法は民間のリーダーボードで0.167の優れたスコアを得た。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:05:47 GMT)
DeblurDiNAT: A Generalizable Transformer for Perceptual Image Deblurring [1.5] DeblurDiNATは汎用的で効率的なエンコーダ・デコーダ変換器であり、地上の真実に近いクリーンな画像を復元する。
本稿では,線形フィードフォワードネットワークと非線形デュアルステージ機能融合モジュールを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:45:50 GMT)
Benchmarking Transcriptomics Foundation Models for Perturbation Analysis : one PCA still rules them all [1.5] 転写学的シークエンシングの最近の進歩は、価値ある洞察を明らかにする新しい機会を提供する。
摂動解析におけるこれらの上昇モデルの有効性をしっかり評価するためのベンチマークは行われていない。
本稿では,生物学的に動機づけた新しい評価フレームワークと摂動解析タスクの階層について述べる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:09:06 GMT)
Multidimensional coherent spectroscopy of correlated lattice systems [1.4] 多次元コヒーレント分光(MDCS)は、分子系の非線形応答と非平衡ダイナミクスを研究する強力なツールとして量子化学で確立されている。
ここでは、有効モデルのケルディシュ輪郭表現と非平衡力学平均場理論を用いて、原型相関格子系のMDCS信号を体系的に研究する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:55:07 GMT)
Grid-Based Projection of Spatial Data into Knowledge Graphs [1.4] 実世界の実体の空間的特性を知識グラフにエンコードできることを示す。
本稿では,各街路セグメントを個別に把握する従来の手法から,知識グラフにおける街路ネットワークを表現する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:35:41 GMT)
Federated GNNs for EEG-Based Stroke Assessment [1.3] 本研究では,フェデレートラーニング(FL)とグラフニューラルネットワーク(GNN)を組み合わせて脳卒中重症度を予測する手法を提案する。
本手法により,複数の病院が患者情報を交換することなく,脳波データの共有GNNモデルを共同で訓練することが可能となる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:13:35 GMT)
RobPy: a Python Package for Robust Statistical Methods [1.2] RobPyはPythonで幅広い堅牢なメソッドを提供し、NumPy、SciPy、Scikit-learnといった既存のライブラリ上に構築されている。
本稿では、RobPyパッケージの構造を示し、実例を通してその機能を実証し、その機能を他の統計ソフトウェアにおける既存の実装と比較する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:27:30 GMT)
Discrete the solving model of time-variant standard Sylvester-conjugate matrix equations using Euler-forward formula [1.2] 時変 シルヴェスター共役行列方程式は複素共役行列方程式の初期変分として表される。
現在の解法にはCon-CZND1モデルとCon-CZND2モデルがあり、どちらも連続モデルにode45を使用している。
Euler-forward式の決定に基づいて、Con-DZND1-2iモデルとCon-DZND2-2iモデルを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:58:31 GMT)
ControlSynth Neural ODEs: Modeling Dynamical Systems with Guaranteed Convergence [1.2] ニューラルネットワーク(NODE)は、時間間隔の制限なしにデータを処理できる連続時間ニューラルネットワーク(NN)である。
非常に非線形な性質にもかかわらず、収束はトラクタブル線型不等式によって保証されることを示す。
CSODEの合成において、異なるスケールで動的に同時に捕捉される可能性について学習するための余分な制御項を導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:20:42 GMT)
Transforming Business with Generative AI: Research, Innovation, Market Deployment and Future Shifts in Business Models [1.2] 本稿では,ジェネレーティブAI(GenAI)がビジネス環境に与える影響について考察する。
新シュンペーター経済学の原理を適用して、GenAIがいかにして「創造的破壊」の新しい波を駆動しているかを分析する。
GenAIの展開は、倫理上の懸念、規制上の要求、仕事の移転のリスクなど、重大な課題も提示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:41:05 GMT)
Local Concept Embeddings for Analysis of Concept Distributions in DNN Feature Spaces [1.1] 我々はディープニューラルネットワーク(DNN)のための新しい概念分析フレームワークを提案する。
完全なデータセット上で単一のグローバルな概念ベクトルを最適化する代わりに、個々のサンプルに対してローカルな概念埋め込み(LoCE)ベクトルを生成する。
文脈感度にもかかわらず,提案手法のセグメンテーション性能はグローバルベースラインと競合する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:48:38 GMT)
Scaling Whole-Chip QAOA for Higher-Order Ising Spin Glass Models on Heavy-Hex Graphs [1.1] 量子近似最適化アルゴリズム (QAOA) は高次, ランダム係数, 重ヘックス互換スピングラスに対して, 問題サイズに対して強いパラメータ濃度を有することを示す。
量子プロセッサでは、27量子ビット系では最大$p=3$、127量子ビット系では最大$p=2$となる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:27:20 GMT)
Disrupting Test Development with AI Assistants [1.0] GitHub Copilot、ChatGPT、TabnineなどのジェネレーティブAI支援コーディングツールは、ソフトウェア開発を大きく変えた。
本稿では、これらのイノベーションが生産性とソフトウェア開発のメトリクスにどのように影響するかを分析する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:52:40 GMT)
Can GPT-4 learn to analyse moves in research article abstracts? [1.0] 我々は、自然言語のプロンプトを用いてアノテーションプロセスを自動化するため、GPT-4の余裕を生かしている。
8ショットのプロンプトは2つを用いた場合よりも有効であり、可変性の領域を示す例を含めることで、単一の文で複数の動きを認識できるGPT-4の能力を高めることが確認された。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:25:31 GMT)
CryptoEL: A Novel Experiential Learning Tool for Enhancing K-12 Cryptography Education [0.9] 本稿は,K-12学生を対象とした暗号教育の強化を目的とした教育ツールを提案する。
ツールには、KolbのExperiential Learningモデルの4つの段階が組み込まれ、鍵となる暗号概念を教える。
学習体験には、現実世界のシミュレーション、カスタマイズされたAIベースの会話エージェント、ビデオデモ、インタラクティブなシナリオ、単純化されたPythonコーディングターミナルが組み込まれている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:03:07 GMT)
M-CELS: Counterfactual Explanation for Multivariate Time Series Data Guided by Learned Saliency Maps [0.9] M-CELSは,多次元時系列分類タスクにおける解釈可能性を高めるために設計された,対物的説明モデルである。
その結果, M-CELS の有効性, 近接性, 疎度に優れた性能を示した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:16:24 GMT)
The Relationship Between Smartphone Usage and Sleep Quality Amongst University Students [0.9] 若年者における男女のスマートフォン使用状況と睡眠の質との関連について検討した。
若年者における男女のスマートフォン使用状況と睡眠の質との関連は,データセットと分析では認められなかった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:55:00 GMT)
Identifying Economic Factors Affecting Unemployment Rates in the United States [0.9] GDP(マイナス)、インフレ(プラス)、失業保険(大衆の意見とは対照的、マイナス)、S&P500指数(マイナス)はいずれも重要な要因であった。
健康問題因子については, 失業と心血管疾患, 神経疾患, 対人暴力の発生の相関スコアが得られた。
アジア人は年間を通じて失業率が低かった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:43:29 GMT)
Weakly supervised deep learning model with size constraint for prostate cancer detection in multiparametric MRI and generalization to unseen domains [0.9] 本モデルでは, 完全教師付きベースラインモデルにより, オンパー性能が向上することを示す。
また、未確認データドメインでテストした場合、完全に教師付きモデルと弱い教師付きモデルの両方のパフォーマンス低下も観察する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:24:33 GMT)
GINopic: Topic Modeling with Graph Isomorphism Network [0.9] 本稿では,グラフ同型ネットワークに基づく話題モデリングフレームワークGINopicを紹介し,単語間の相関関係を捉える。
本稿では,既存のトピックモデルと比較してGINopicの有効性を実証し,トピックモデリングの進歩の可能性を明らかにする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:32:30 GMT)
Building a Synthetic Vascular Model: Evaluation in an Intracranial Aneurysms Detection Scenario [0.9] このモデルは、脳動脈瘤を効率的に検出するために、3D畳み込みニューラルネットワークが使用できる脳動脈のデータセットを提供することを目的としている。
本研究では, 人工血管モデルを網羅的に記述し, 動脈瘤の分節と検出のために設計されたニューラルネットワークを構築し, 合成モデルデータの拡張により得られた性能ギャップの詳細な評価を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:08:24 GMT)
Isambard-AI: a leadership class supercomputer optimised specifically for Artificial Intelligence [0.8] Isambard-AIは、AI関連の研究を支援するために設計された新しいリーダーシップクラスのスーパーコンピュータである。
Cray EX4000システムに基づいており、イギリスのブリストルにある新しいエネルギー効率の良いモジュラー・データ・センターに収容されている。
Isambard-AIの第1フェーズは2024年5月と6月にオンライン化され、年内に全システムの生産が予定されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:47:31 GMT)
A Comparative Analysis of Instruction Fine-Tuning LLMs for Financial Text Classification [0.8] 大きな言語モデル(LLM)は、さまざまな自然言語処理(NLP)タスクにまたがる印象的な機能を示している。
本研究は,財務テキスト分類作業における指導用微調整の有効性について検討した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:06:36 GMT)
Evaluating Creative Short Story Generation in Humans and Large Language Models [0.8] 大規模言語モデル(LLM)は、最近、高品質なストーリーを生成する能力を実証した。
LLMと日常の人々の短いストーリー生成において,創造性を体系的に分析する。
LLMはスタイリスティックな複雑なストーリーを生成できるが、平均的な人間作家に比べて創造性は低い傾向にある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:40:39 GMT)
Shot-noise reduction for lattice Hamiltonians [0.8] 格子ハミルトンのエネルギー期待値を量子コンピュータ上で効率的に推定することは深刻な課題である。
拡張性のある代替手段として幾何学的分割を導入する。
サンプリング数の改善が不完全な固有状態の改善にどのように寄与するかを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:01:00 GMT)
SPECTRUM: Semantic Processing and Emotion-informed video-Captioning Through Retrieval and Understanding Modalities [0.8] 本稿では,検索・理解モダリティ(SPECTRUM)フレームワークを用いたセマンティック・プロセッシングと感情インフォームド・ビデオキャプションを提案する。
SPECTRUMは、VTAI(Visual Text Attribute Investigation)を用いてマルチモーダルなセマンティクスと感情的なテーマを特定し、記述的キャプションの向きを決定する。
ビデオ・トゥ・テキスト検索機能とビデオコンテンツの多面的特性を利用して、候補キャプションの感情的確率を推定する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:51:47 GMT)
Single-Atomic-Ensemble Dual-Wavelength Optical Standard [0.7] 我々は、デュアル光遷移変調変換分光法(DOTMTS)に基づくデュアル波長光周波数標準を開発する。
DOTMTSは、780nmと795nmの同時安定化を可能にする。
このアプローチは、単一の原子アンサンブル内で多波長光周波数標準を開発するために拡張することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:20:13 GMT)
The Effectiveness of Curvature-Based Rewiring and the Role of Hyperparameters in GNNs Revisited [0.7] グラフニューラルネットワーク(GNN)におけるメッセージパッシングは支配的なパラダイムである
近年、データと計算グラフから入力グラフを切断し、メッセージパッシングを行うグラフリウィリング技術に力を入れている。
オーバーシャッシングは合成データセットで実証されているが、この研究では、曲率ベースのリワイアリングが現実のデータセットにもたらすパフォーマンス向上を再評価する。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:30:38 GMT)
Deep operator neural network applied to efficient computation of asteroid surface temperature and the Yarkovsky effect [0.7] ディープオペレータニューラルネットワーク(DeepONet)は、小惑星の表面温度をモデル化するための強力なツールを提供する。
DeepONetは平均で1%の精度で温度を予測でき、計算コストは5桁以下である。
予備的な応用として、即時ヤルコフスキー効果を組み込んだ直接N体シミュレーションにより小惑星の軌道進化を解析した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:38:27 GMT)
A Probabilistic Formulation of LiDAR Mapping with Neural Radiance Fields [0.7] シーンの新たなLiDARビューを生成するために、ニューラルレージアンスフィールドをどのように訓練できるかを示す。
損失を確率の積分として定式化することにより、ネットワークは与えられた光線の複数のピークを学習できることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:49:47 GMT)
LLM-based Continuous Intrusion Detection Framework for Next-Gen Networks [0.7] このフレームワークはトランスフォーマーエンコーダアーキテクチャを採用しており、悪意のあるトラフィックと正当なトラフィックを区別するために、双方向に隠されたパターンをキャプチャする。
このシステムは、ガウス混合モデル(GMM)を高次元BERT埋め込みから派生したクラスタ特徴に活用することにより、未知の攻撃タイプを段階的に同定する。
新たな未知の攻撃クラスタの統合後も、このフレームワークは高いレベルで動作し続け、分類精度とリコールの両方で95.6%を達成している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:12:14 GMT)
Streaming Technologies and Serialization Protocols: Empirical Performance Analysis [0.7] リアルタイムデータ分析、可視化、マシンラーニングモデルのトレーニングには、効率的なデータストリーミングが不可欠だ。
様々なストリーミング技術とシリアライズプロトコルが、異なるストリーミング要件を満たすために開発されている。
これらの技術間の大きなパフォーマンス差とトレードオフを明らかにする。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 08:46:59 GMT)
Towards safe Bayesian optimization with Wiener kernel regression [0.7] 本稿では、最近提案されたWienerカーネル回帰に基づいて、新しいエラー境界を提案する。
比較的穏やかな仮定の下では、提案された誤差境界は、文献に記録された境界よりも厳密であることを示す。
提案手法の有効性を示す数値的な例を挙げる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:43:16 GMT)
Exploiting Contextual Uncertainty of Visual Data for Efficient Training of Deep Models [0.7] アクティブラーニングCDALにおける文脈多様性の概念を導入する。
モデルバイアスを低減するために、文脈的に公正なデータをキュレートするデータ修復アルゴリズムを提案する。
我々は、野生生物カメラトラップ画像の画像検索システムと、質の悪い農村道路に対する信頼性の高い警告システムの開発に取り組んでいる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:43:33 GMT)
Quantum-Computable One-Way Functions without One-Way Functions [0.6] 古典的なオラクルを構築し、$mathsfP = MathsfNP$, but quantum-computable quantum-secure trapdoor one-way function が存在する。
この結果から,複数コピーの擬似乱数状態と擬似乱数ユニタリー,古典通信の公開鍵暗号,シグネチャ,暗黙の転送方式が示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:40:01 GMT)
Diverging entanglement of critical magnons in easy-axis antiferromagnets [0.6] 磁場下での易軸異方性を有する反強磁性体の不安定性について検討した。
相境界付近では、反強磁性交換相互作用、異方性、磁場の相互作用により、亜格子マグノン間の絡み合いが分岐する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:00:03 GMT)
An Empirical Study on the Code Refactoring Capability of Large Language Models [0.6] この研究は、30のオープンソースプロジェクトにわたるコードにおいて、コード生成に最適化されたLLMであるStarCoder2を実証的に評価する。
我々は,(1)コード品質の改善,(2)臭いの型と有効性,(3)ワンショットとチェーン・オブ・シークレットのプロンプトによる改善に焦点を当て,StarCoder2のパフォーマンスを人間開発者と比較した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:46:20 GMT)
Enhancing Table Representations with LLM-powered Synthetic Data Generation [0.6] データ駆動型企業におけるデータ変換活動の文脈における表の類似性を明確に定義する。
本稿では,大規模言語モデルのコード生成とデータ操作機能を活用した,新しい合成データ生成パイプラインを提案する。
パイプラインによって生成された合成データは,提案した表類似性の定義と一致し,表表現を大幅に強化することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:54:07 GMT)
Taking AI Welfare Seriously [0.6] 我々は、近い将来、一部のAIシステムが意識的または堅牢に作用する可能性があると論じている。
これは近い将来の問題であり、AI企業や他のアクターはそれを真剣に取り始める責任がある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:57:57 GMT)
A Practical Protocol for Quantum Oblivious Transfer from One-Way Functions [0.5] 平板モデルにおける一方向関数に基づく新しいシミュレーションセキュアな量子オブリバスト転送(QOT)プロトコルを提案する。
実践的な実装に焦点をあてて、我々のプロトコルは、実現可能な実験的実現を約束する、これまでの効率性に勝っている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:25:31 GMT)
Phylo2Vec: a vector representation for binary trees [0.5] 系統樹を模したPhylo2Vecについて紹介する。
系統樹を操作および表現するための統一的なアプローチとして機能する。
概念実証として、Phylo2Vecを用いて5つの実世界のデータセットの最大推定を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:37:52 GMT)
The Role of DevOps in Enhancing Enterprise Software Delivery Success through R&D Efficiency and Source Code Management [0.5] 本研究は、ソフトウェアデリバリの成功のための研究開発効率の向上とソースコード管理(SCM)に焦点を当てる。
定性的な方法論を使用して、データをDevOpsを実装する大企業のケーススタディから収集した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:01:43 GMT)
The Enhancement of Software Delivery Performance through Enterprise DevSecOps and Generative Artificial Intelligence in Chinese Technology Firms [0.5] 本研究では、DevSecOpsとGenerative Artificial Intelligenceの統合が、IT企業におけるソフトウェアデリバリのパフォーマンスに与える影響について検討する。
その結果、研究開発の効率が大幅に向上し、ソースコード管理が改善され、ソフトウェアの品質とセキュリティが向上した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:44:01 GMT)
MARAGS: A Multi-Adapter System for Multi-Task Retrieval Augmented Generation Question Answering [0.4] KDD CUP 2024 のための Meta's Comprehensive RAG (CRAG) コンペティションのためのマルチアダプタ検索拡張システム (MARAGS) を提案する。
タスク1では2位,タスク2では3位となった。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 00:44:32 GMT)
The Intersectionality Problem for Algorithmic Fairness [0.4] 断続性(Intersectionality)は、複数の群の交叉における公平性を達成する問題である。
本稿では,問題の根底にある課題を明らかにするためにデシラタを開発し,潜在的な解の探索を指導する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:02:07 GMT)
Modeling and Simulation of a Multi Robot System Architecture [0.4] マルチロボットシステム(Multi Robot System、MRS)は、ロボットが人間のニーズを理解する知的サイバー物理システムの基盤である。
本稿では,人間が利用可能なロボットによる要求を開始する,汎用的なMSSケーススタディを紹介する。
MRSのモデリングは、提案したアーキテクチャの性能をシミュレートし、測定するために使用できるため、適切なシステムアーキテクチャを設計する上で重要な側面である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:00:43 GMT)
Towards the design of model-based means and methods to characterize and diagnose teachers' digital maturity [0.4] 本稿では、教師のデジタル成熟度モデルを組み合わせて、診断ツールや手法の設計に使用できる統一版を作成する方法について検討する。
モデルとそれらの構成次元が成熟度の決定にどのように貢献するかを解析した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:21:26 GMT)
On additive error approximations to #BQP [0.3] 我々は、#BQPとして知られる数え上げクラスの量子一般化に対する加法近似について研究する。
まず,#BQP問題に対する加算近似を,対応する検証回路における証人量子ビット数の誤差指数に近似する効率的な量子アルゴリズムが存在することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:51:20 GMT)
Visually Analyze SHAP Plots to Diagnose Misclassifications in ML-based Intrusion Detection [0.3] 侵入検知システム(IDS)は、警告を提供することで本質的に脅威を軽減することができる。
これらの脅威を検出するため、さまざまな機械学習(ML)モデルとディープラーニング(DL)モデルが提案されている。
本稿では、重なり合うSHAPプロットを用いた説明可能な人工知能(XAI)に基づく視覚分析手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:08:34 GMT)
Shrinking the Giant : Quasi-Weightless Transformers for Low Energy Inference [0.3] 高速でエネルギー効率のよい推論モデルの構築は、様々なトランスフォーマーベースのアプリケーションを実現するために不可欠である。
拡張有限差分法によりLUTネットワークを直接学習する手法を構築した。
これにより、トランスベースのモデルに対する計算的でエネルギー効率の良い推論ソリューションが実現される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:38:56 GMT)
Small-scale Hamiltonian optimization of interpolating operators for Lagrangian lattice quantum field theory [0.3] 格子量子場理論の計算は、ハミルトンの定式化の利点と従来のラグランジアンフレームワークのスケーラビリティと制御を結びつける可能性がある。
本研究では、従来のラグランジアンフレームワークに対するハミルトン最適化補間作用素構成の適用における両因子の役割について検討する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:39:30 GMT)
Predicting Lemmas in Generalization of IC3 [0.3] 本稿では,CTP(Conpot Example to propagation)を利用して,変数をドロップする前に最小限の補題を予測できる新しい手法を提案する。
総括評価は, レムマ予測における満足な成功率と, 提案手法によって達成された顕著な性能向上を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:11:31 GMT)
Learning State Preparation Circuits for Quantum Phases of Matter [0.3] 本研究では,多体系の基底状態に対する状態準備回路を得るためのフレキシブルで効率的なフレームワークを提案する。
我々は、定数深度回路に対して頑健な量子マルコフ連鎖条件の変種を用いる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:21:39 GMT)
Quantum complexity and generalized area law in fully connected models [0.3] 絡み合いエントロピーの領域法則は、量子多体系の複雑さを反映している。
本研究では,システムサイズにおける多対数因子の一般化された領域法則を確立する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:57:52 GMT)
Entanglement area law in interacting bosons: from Bose-Hubbard, $φ$4, and beyond [0.3] 絡み合い領域法則は、量子多体系の情報構造を特徴づける。
長距離相互作用を含む一次元相互作用ボソン系の領域法則を証明した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:16:44 GMT)
Polynomial-Time Classical Simulation of Noisy Circuits with Naturally Fault-Tolerant Gates [0.2] 現実的にノイズの多いクリフォード回路を持つ大深度での量子的優位性は存在しないことを示す。
このアルゴリズムの背後にある重要な洞察は、分散ノイズが長距離の絡み合いの崩壊を引き起こすことである。
この結果を証明するため、パーコレーション理論の手法とパウリ経路解析のツールを融合する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:11:58 GMT)
A citizen science toolkit to collect human perceptions of urban environments using open street view images [0.2] ストリートビュー画像(SVI)は、研究(環境評価、緑地識別、土地被覆分類など)に有用なデータソースである。
オープンなSVIデータセットは、Mapillaryのような制限の少ないソースから容易に利用できる。
オープンなSVIを自動ダウンロード、処理、収穫、フィルタリングする効率的な方法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:38:49 GMT)
A Systematic Study on Solving Aerospace Problems Using Metaheuristics [0.2] 複雑な工学問題は最適化問題としてモデル化できる。
最適化問題には、エンジン、材料、部品、構造、空力、航法、制御、物流、計画などが含まれる。
メタヒューリスティックスはこれらの最適化問題を解決するために応用される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:13:09 GMT)
QBSD: Quartile-Based Seasonality Decomposition for Cost-Effective RAN KPI Forecasting [0.2] 我々は、精度と計算複雑性のトレードオフを最適化するために、QBSDというライブシングルステップ予測手法を紹介した。
QBSDは数千セル以上の実ネットワークRANデータセットで大きな成功を収めています。
その結果,提案手法は主要なアルゴリズムに比べて実行効率が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:14:34 GMT)
A Trust-Region Algorithm for Noisy Equality Constrained Optimization [0.2] 本稿では,雑音関数と勾配評価によって生じる課題に対処するために,改良されたByrd-Omojokun(BO)信頼領域アルゴリズムを提案する。
元来のBO法は、等式制約付き問題を解くために設計され、大規模な制約付き最適化のための内部点法のバックボーンを形成する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:04:03 GMT)
Where Assessment Validation and Responsible AI Meet [0.1] 本稿では,古典的テスト検証理論と評価固有のドメインに依存しないRAIの原則と実践を考察する統合評価フレームワークを提案する。
このフレームワークは、妥当性議論をサポートする評価のための責任あるAI使用、人間の価値と監視を維持するためのAI倫理との整合性、そしてAI使用に関連するより広範な社会的責任に対処する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:20:29 GMT)
Generative Unfolding with Distribution Mapping [0.1] モデルが正しい条件付き確率を学習できるように、2つのモーフィング手法、Schr"odinger Bridges と Direct Diffusion を拡張する方法を示す。
結果は、Z + 2-jetsの22次元位相空間を記述する新しいデータセットと同様に、単一のジェットサブ構造の標準ベンチマークデータセットで示される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:00:01 GMT)
Risk-sensitive control as inference with Rényi divergence [0.1] 本稿では,CaIを延ばすリスク感受性制御を推論(RCaI)として導入する。
RCaIは、ログ確率正規化リスク感受性制御と等価であることが示されている。
我々は,ソフトベルマン方程式を解くことで,リスクに敏感な最適政策が得られることを証明した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:52:50 GMT)
LDPC stabilizer codes as gapped quantum phases: stability under graph-local perturbations [0.0] 我々は、ブラヴィイ、ハスティングス、ミチャラキスによる位相秩序の安定性の証明を、低密度パリティチェック符号に対応するハミルトン群に一般化する。
LDPC符号は、非ユークリッド設定においても、一般に安定なギャップ付き量子位相を定義する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:52:44 GMT)
Zebra-Llama: A Context-Aware Large Language Model for Democratizing Rare Disease Knowledge [0.0] ゼブラ・ラマ(Zebra-Llama)は、高精度な検索型拡張生成(RAG)機能を備えた文脈認識言語モデルである。
Ehlers-Danlos症候群 (EDS) を症例として, 5,000人中1人に影響を及ぼすEDSは, 稀な疾患の複雑さを実証する。
Zebra-Llamaは、EDS関連のクエリを扱う上で、前例のない機能を示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:45:52 GMT)
You are out of context! [0.0] 新しいデータは、モデルによって学習された幾何学的関係を伸ばしたり、圧縮したり、ねじったりする力として振る舞うことができる。
本稿では,ベクトル空間表現における「変形」の概念に基づく機械学習モデルのための新しいドリフト検出手法を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:17:43 GMT)
V-CAS: A Realtime Vehicle Anti Collision System Using Vision Transformer on Multi-Camera Streams [0.0] 本稿では,リアルタイム衝突回避システム(V-CAS)を提案する。
V-CASは適応ブレーキによるリアルタイム衝突リスク評価と能動的緩和を可能にする。
その結果,従来の単カメラ法と比較して物体検出と追跡の大幅な改善,衝突回避の強化が示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:39:15 GMT)
Using Platt's scaling for calibration after undersampling -- limitations and how to address them [0.0] シミュレーション研究やケーススタディを通じて解析的にPlattのスケーリングはアンダーサンプリング後のキャリブレーションには使用すべきでないことを示した。
我々は、ベースモデルの予測のロジットに、ロジスティックな一般化された加算モデルに適合する、プラットのスケーリングの修正版を推奨する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:37:57 GMT)
Tree level change detection over Ahmedabad city using very high resolution satellite images and Deep Learning [0.0] 0.5mの高分解能衛星データセットを用いて深層学習モデルの適用性を実証した。
YOLOv7インスタンスセグメンテーションモデルは、うまくキュレートされたツリーキャノピーデータセットでトレーニングされた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:54:31 GMT)
Towards more efficient agricultural practices via transformer-based crop type classification [0.0] メキシコのセンチネル1号と2号の衛星画像から、作物を正確に分類することができる。
本稿では,メキシコのジャリスコにおいて,正確なマルチクラス作物分類を目標として,この手法をさらに発展させることを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:38:02 GMT)
Towards a universal gateset for $\mathsf{QMA}_1$ [0.0] 我々は、シクロトミック場 $mathbbQ(zeta_2k),zeta_2k=e2pi i/2k$, $G_2k$ のすべてのゲートセットに対して、$mathbbQ(zeta_2k),zeta_2k=e2pi i/2k$ のすべてのゲートセットが普遍であることを証明する。
また、キングによって定義されたガッペド・クリッドホモロジー問題も証明する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:39:27 GMT)
The evolution of volumetric video: A survey of smart transcoding and compression approaches [0.0] 3D画像のキャプチャーと表示を行うボリュームビデオは、メディアの風景を変えるための革命的技術として登場した。
本稿では、この新興メディアがもたらすユニークな課題に対処するAI駆動型ソリューションの可能性に焦点を当て、ボリュームビデオ圧縮と配信の最先端について検討する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:59:01 GMT)
The Separability Problem in Quantum Mechanics: Insights from Research on Axiomatics and Human Language [0.0] ヒルベルト空間に量子フォーマリズムの構造的制限があることを示し、別の系の記述を妨げている。
問題は、分離性が基本レベルでの可能性であり、形式主義がその数学的構造に統合されるべきかどうかである。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 14:21:53 GMT)
The Diósi-Penrose model of classical gravity predicts gravitationally induced entanglement [0.0] 古典重力のDi'osi-Penrose(DP)モデルの力学は、2つの異なる粒子の機械的自由度を絡み合わせることができることを示す。
重力誘起エンタングルメント(GIE)の標準的な実験では、エンタングルメントは、ある制限値$d_c$よりも小さい距離で分離される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:14:11 GMT)
The Certainty Ratio $C_ρ$: a novel metric for assessing the reliability of classifier predictions [0.0] 本稿では,任意の分類性能指標に対する信頼性(確実性)と不確実性(不確実性)の寄与を定量化する新しい尺度であるCertainty Ratio(C_rho$)を紹介する。
26のデータセットと複数の分類器(Decision Trees、Naive-Bayes、 3-Nearest Neighbors、Random Forestsなど)にまたがる実験の結果、$C_rho$rhoは従来のメトリクスがしばしば見落としているという重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:50:03 GMT)
Taming the Beast of User-Programmed Transactions on Blockchains: A Declarative Transaction Approach [0.0] 「信頼の技術」は、中央権力を必要とせず、非信頼関係の当事者間の取引を仲介するために用いられる。
トランザクションはブロックチェーンプラットフォームやスマートコントラクトと呼ばれるユーザプログラムを通じてユーザ定義される。
スマートコントラクトが提供するトランザクションプログラマビリティの大幅な柔軟性にもかかわらず、ユーザビリティ、堅牢性、パフォーマンス上の課題がいくつか発生している。
本稿では、よりプリミティブをネイティブなトランザクションタイプに組み込んだ代替トランザクションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:44:14 GMT)
Swiper: a new paradigm for efficient weighted distributed protocols [0.0] フォールトトレラントな分散アルゴリズムは、名目上の汚職モデルとして設計されている。
名目モデルのために設計されたプロトコルのクラスを重み付きモデルに変換する方法を示す。
注目すべき例としては、消去符号化された分散ストレージとブロードキャストプロトコル、検証可能な秘密共有、非同期コンセンサスなどがある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:56:35 GMT)
Supervised Transfer Learning Framework for Fault Diagnosis in Wind Turbines [0.0] 本稿では,異常空間で動作する風力タービンの故障診断のための教師ありトランスファー学習フレームワークを提案する。
異常空間内のデータは風力タービンの各コンポーネントの異常スコアと解釈でき、各値は直感的に理解できる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:38:43 GMT)
Superradiant Interactions of the Cosmic Neutrino Background, Axions, Dark Matter, and Reactor Neutrinos [0.0] 我々は、宇宙ニュートリノ背景(C$nu$B)、ダークマター散乱と吸収、および後期一様粒子の超放射能相互作用速度を計算する。
これらの超放射能相互作用は、システム上のノイズの源として表れることを示す。
これは、励起と非励起の総和に敏感な新しい観測可能点を指し、系に拡散と非コヒーレンスを導入すると見なすことができる。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 23:40:43 GMT)
Strategic Data Re-Uploads: A Pathway to Improved Quantum Classification Data Re-Uploading Strategies for Improved Quantum Classifier Performance [0.0] 古典情報を複数回量子状態に再アップロードすると、量子分類器の精度が向上する。
線形分類パターン(LCP)と非線形分類パターン(NLCP)の2つの分類パターンに対するアプローチを実証する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:27:44 GMT)
Statistical analysis of quantum trajectories in dissipative Landau-Zener model [0.0] マルコフ過程を行うランダウ・ツェナー・ハミルトニアンを持つ2レベル系における量子ジャンプの統計について述べる。
また, 浴槽温度, 環境との結合強度, スピンカップリング方向が量子ジャンプの統計に与える影響を示す。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 10:25:23 GMT)
Simulation of Nanorobots with Artificial Intelligence and Reinforcement Learning for Advanced Cancer Cell Detection and Tracking [0.0] 本研究では,複雑な環境下でのナノロボットナビゲーションを最適化するための新しい強化学習フレームワークを提案する。
計算機シミュレーションモデルを用いて,癌細胞と生物学的障壁を有する三次元空間におけるナノロボットの挙動を探索する。
提案手法はQラーニングを用いてリアルタイムバイオマーカー濃度データに基づいて運動戦略を洗練し,ナノロボットが標的とする薬物のデリバリーのために癌組織への自律移動を可能にする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:16:40 GMT)
Schmidt Decomposition of Multipartite States [0.0] 量子状態のシュミット分解は、絡み合いの研究に有用な多くの性質を持つ。
我々は、多粒子状態のシュミット分解の存在に必要な十分条件を得る。
シュミット除算可能な多部状態の分解を効率よく得るアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:01:28 GMT)
Scalable quantum circuits for exponential of Pauli strings and Hamiltonian simulations [0.0] 我々は,1量子ビット回転ゲート,アダマールゲート,CNOTゲートを用いて,スケールした$n$-qubit Pauli弦の指数関数を設計する。
我々が導いた重要な結果は、同一性からなる2つのパウリ弦作用素と$X$ゲートが同様の置換であるということである。
スズキ・トロッター近似を用いて、ハミルトニアンのいくつかのクラスに対して、これらの回路モデルを近似ユニタリ進化に適用する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:22:36 GMT)
Scalable architecture for trapped-ion quantum computing using RF traps and dynamic optical potentials [0.0] 原則として、単一の1Dレジスタに閉じ込められるイオンベースの量子ビットの数に根本的な制限はない。
ここでは、大きなイオン結晶を持つ量子コンピューティングのための総体的かつスケーラブルなアーキテクチャを提案する。
これらの細胞は、ほぼ独立した量子レジスタとして振る舞うことが示され、全ての細胞に平行なエンタングゲートが可能である。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:35:50 GMT)
Scalable Quantum Simulations of Scattering in Scalar Field Theory on 120 Qubits [0.0] 量子コンピュータ上での素粒子衝突のシミュレーションは、古典的手法よりも指数関数的に有利であることが期待されている。
本稿では,IBMの超伝導量子コンピュータibm_fezの120キュービットを用いて,1次元スカラー場理論におけるウェーブパケットの散乱をシミュレーションする。
量子シミュレーションにおいて、最大4924個の2量子ゲートと2量子ゲート深さ103の回路から有意義な結果の抽出を可能にする新しい手法が導入された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:00:00 GMT)
SPACE: 3D Spatial Co-operation and Exploration Framework for Robust Mapping and Coverage with Multi-Robot Systems [0.0] マルチロボット・ヴィジュアル(RGB-D)マッピングと探索は、国内サービスやロジスティクスといった分野への応用にとって大きな可能性を秘めている。
主な課題は,(1)ロボットの視点の重なりによる「ゴースト・トレイル」効果,(2)探索のための最も効果的なフロンティアを選択する際の視覚再建の監督である。
室内環境における空間協調のための半分散型フレームワーク(SPACE)を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:04:09 GMT)
Rényi relative entropy based monogamy of entanglement in tripartite systems [0.0] 三部構造スピン-1/2系における絡み合い特性の包括的検討を行った。
原始三部体状態において、GHZ状態は単ガマスであるが、驚くほどW状態である。
逆場イジングモデルでは、状態は最初多ガムであり、温度と結合で一ガムとなる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:31:13 GMT)
Revisiting K-mer Profile for Effective and Scalable Genome Representation Learning [0.0] 我々は、k-merをベースとしたゲノムの表現の理論解析を行う。
本稿では,ゲノム読取レベルでメダゲノミクスビニングを行うための軽量でスケーラブルなモデルを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:36:51 GMT)
ReverseNER: A Self-Generated Example-Driven Framework for Zero-Shot Named Entity Recognition with Large Language Models [0.0] ゼロショット名前付きエンティティ認識タスクにおいて,大規模言語モデル(LLM)の限界を克服するためのフレームワークであるReverseNERを提案する。
文から始めるのではなく、LLMを使用して定義に基づいてエンティティを生成し、それらを全文に拡張する。
その結果,タスク文と意味的・構造的類似性を保ちながら,明確にラベル付けされたエンティティを持つ注釈付き文が得られた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:15:56 GMT)
Resource-optimized fault-tolerant simulation of the Fermi-Hubbard model and high-temperature superconductor models [0.0] トフォリを持つ古典的な難解な例は、量子化学において一般的に考慮される分子シミュレーションよりもはるかに少ない。
我々は, 早期の耐故障量子コンピュータにおける高温超伝導体の研究への道を開いたと信じている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:18:29 GMT)
Residual Random Neural Networks [0.0] ランダムな重みを持つ単層フィードフォワードニューラルネットワークは、ニューラルネットワークの文献の中で繰り返されるモチーフである。
隠れたニューロンの数がデータサンプルの次元と等しくない場合でも,優れた分類結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:09:54 GMT)
Ramsey Approach to Quantum Mechanics [0.0] ラムゼー理論は量子力学の基本概念の再形成を可能にする。
我々の解釈では、三角形は与えられた量子系において同時に確立できたり、確立できなかったりする観測可能な三元を表す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:39:58 GMT)
Quantum entanglement in a pure state of strongly correlated quantum impurity systems [0.0] 我々は、サブシステムとしてシステムから任意に選択された1つまたは2つの量子不純物からなるシステムを構築した。
エンタングルメントエントロピー、相互情報、相対エントロピーなどの量子情報量について定式化する。
いくつかのサイトと単一の不純物アンダーソンモデルからなる量子不純物系に適用し、それらの状態と量子情報量の挙動の関係を研究する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:17:31 GMT)
Quantum detailed balance via elementary transitions [0.0] 基本遷移は、量子系の2つのコピーの純粋な状態であると見なされる。
この量子詳細バランスの形式は、逆演算に関する標準的な量子詳細バランスと同値であることが示されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:04:30 GMT)
Quantized topological phases beyond square lattices in Floquet synthetic dimensions [0.0] Floquet合成次元を用いて非二乗格子ハミルトニアンを実装できることが示される。
我々の構成は動的に変調されたリング共振器を使用し、格子ハミルトンの直接$k$空間工学の能力を提供する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:50:48 GMT)
Proof of the absence of local conserved quantities in general spin-1/2 chains with symmetric nearest-neighbor interaction [0.0] 既知可積分系を除いて、対称的近傍相互作用を持つすべてのスピン-1/2鎖に非自明な局所保存量がないという厳密な証明を与える。
我々の発見はまた、有限個の非自明な局所保存量を持つ中間系が存在しないことを示唆している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:22:17 GMT)
Programmable Quantum Processors: Equivalence and Learning [0.0] プログラマブル量子プロセッサ(英: Programmable quantum processor)は、入力データ状態を所望の方法で変換できるデバイスである。
3種類の確率同値(強、弱、構造)が定義された。
構造的に等価なプロセッサの演算子の範囲は同一であることが判明した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:18:18 GMT)
Probabilistic Parallels in the Classical Limit of Quantum Mechanical Models [0.0] 大規模な量子数では、量子力学の確率密度を粗くするときに、粒子・イン・ア・ボックスあるいは単純な調和振動子の確率密度は古典的な結果に収束する。
この位置における分解能は、二次全角運動量量子数の分解能と関連付けられる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:54:08 GMT)
Planning-Aware Diffusion Networks for Enhanced Motion Forecasting in Autonomous Driving [0.0] Planning-Integrated Forecasting Model (PIFM)は、脳における意思決定とマルチエージェント協調を管理する神経機構にインスパイアされた新しいフレームワークである。
PIFMはシナリオ内の全てのエージェントの将来の軌跡を予測することができる。
このアーキテクチャは、外部刺激やその他のエージェントの行動に基づいた予測を動的に調整する脳の手法と平行して、モデルの透明性を高める。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:24:15 GMT)
Physics-informed neural networks viewpoint for solving the Dyson-Schwinger equations of quantum electrodynamics [0.0] 量子電磁力学の基本的なダイソン=シュウィンガー積分方程式を解くために、物理インフォームニューラルネットワークを用いる。
提案手法では, フェミオン波動関数の正規化, 動的質量関数, 光子プロパゲータをニューラルネットワークで近似する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:36:17 GMT)
Ozone level forecasting in Mexico City with temporal features and interactions [0.0] 本研究は,メキシコシティにおけるオゾン濃度の予測における複数の回帰モデルの精度を比較した。
その結果,時間的特徴と相互作用を取り入れることで,モデルの精度が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:08:08 GMT)
Optimal recoil-free state preparation in an optical atom tweezer [0.0] 単一光子ラビパルスにより駆動される2レベルの遷移 $|0rangle rightarrow |1rangle$ の最適実装を実証する。
ラビパルスは、内部自由度と運動自由度の間のラム・ディッケ結合により、原子の光子リコイルを生成する。
我々は,ラビプロトコルと力プロトコルからなる最適プロトコルを生成し,ツイーザーを動的に分解する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:53:46 GMT)
Optimal Strategies for Optical Quantum Memories Using Long-Lived Noble-Gas Spins [0.0] 希ガスの核スピンは、非常に長いコヒーレンス時間を示し、量子情報の長期記憶媒体として機能する可能性がある。
我々は、光の量子状態を希ガスの集合スピン状態にマッピングする2つのメカニズムの性能を分析し、比較する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 02:12:07 GMT)
On the Quantum Theory of Molecules: Rigour, Idealization, and Uncertainty [0.0] 哲学者たちは、分子シュル・オーディンガー方程式を解くボルン=オッペンハイマー近似法がハイゼンベルクの不確実性関係に反すると主張している。
本稿では、ボルン・オッペンハイマー法の背後にある理論を分析し、それらが内部的に一貫性があり、完全に量子力学的であることを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:08:49 GMT)
On Complexity and Duality [0.0] 非局所作用素は、局所的作用素の成長を模倣する振る舞いを示す。
我々の結果は、量子系における非局所性、複雑性成長、双対性の間の複雑な関係に光を当てた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:27:21 GMT)
Observation of a Multimode Displaced Squeezed State in High-Harmonic Generation [0.0] 半導体高調波発生は光の多重モード圧縮状態を生成することを示す。
光源は小型レーザーで室温で動作し、将来の量子技術への応用に有用な資源となる可能性がある。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:37:40 GMT)
Noisy Stark probes as quantum-enhanced sensors [0.0] ワニエ・スタークのローカライゼーションは超ハイゼンベルクスケーリングによる量子増強感度の資源であることが証明されている。
進化の過程で生じるデコヒーレンスの問題に対処し、それが感知性能にどのように影響するかを特徴付ける。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:26:21 GMT)
Narrow optical linewidths in stoichiometric layered rare-earth crystals [0.0] 固体中の希土類エミッタは、効率的で長寿命の量子メモリを実装するのに適している。
層状偏光結晶材料に細い光線幅を示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 23:49:41 GMT)
Multipartite entanglement structures in quantum stabilizer states [0.0] 純安定状態における多粒子絡み合いの内部構造を可視化する手法を開発した。
本アルゴリズムは階層構造における多体相関を図式的に整理する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:42:48 GMT)
Multifractality of Many-Body Non-Hermitian Skin Effect [0.0] 非エルミート皮膚効果(非エルミート皮膚効果、非反散散によって誘導される多数の固有状態の異常な局在)は非エルミートトポロジーにおいて重要な役割を担っている。
ここでは,多体ヒルベルト空間において皮膚効果が多フラクタル性を示すことを解明する。
我々の研究は、非エルミート皮膚効果の定義的特徴を確立し、オープン量子多体系における多重フラクタル性とエルゴディダリティの基本的な関係を明らかにする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:41:21 GMT)
Memetic collaborative approaches for finding balanced incomplete block designs [0.0] 平衡不完全ブロック設計(BIBD)問題は、多数の対称性を持つ難しい問題である。
本稿では,古典的二元数定式化の代替として機能する双対(整数)問題表現を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:41:18 GMT)
Magic states are rarely the most important resource to optimize [0.0] 故障量子コンピューティングに必要な量子ビット資源を評価するためのスケーリング手法を提案する。
次に、正常な操作とマジック操作に必要なリソースの研究にそれを使用します。
全ての操作に影響を与える最適化は、マジック操作にのみ影響する最適化よりも自然に効果的であるが、我々の研究の驚くべき結論は、前者が数桁のコストを削減できるのに対して、後者は限界的な削減にしか寄与しないということである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:20:37 GMT)
Intrinsic Dimensionality of Fermi-Pasta-Ulam-Tsingou High-Dimensional Trajectories Through Manifold Learning [0.0] フェルミ・パスタ・ウラム・チンゴ模型の高次元軌跡の内在次元を$mast$で推定するためのデータ駆動手法が提案されている。
我々は、これらのデータポイントが弱い非線形性のために曲線化された低次元多様体の近くまたは上にあることを示す強い証拠を見つける。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 13:01:13 GMT)
Intelligent Video Recording Optimization using Activity Detection for Surveillance Systems [0.0] 本稿では,アクティビティ検出に焦点をあてたビデオ記録ソリューションを提案する。
提案手法は,フレームサブトラクションによる動き検出とYOLOv9を用いた物体検出を組み合わせたハイブリッド手法を用いる。
開発したモデルでは,車検出では0.855,人検出では0.884の精度測定値が得られた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:44:03 GMT)
Information plane and compression-gnostic feedback in quantum machine learning [0.0] ニューラルネットワークの学習力学を研究するための解析ツールとして,情報平面が提案されている。
モデルが入力データをどれだけ圧縮するかについての知見を学習アルゴリズムの改善に利用することができるかを検討する。
本稿では,変分量子回路を用いたいくつかの分類および回帰タスクについて,提案した学習アルゴリズムをベンチマークする。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:38:46 GMT)
How much secure randomness is in a quantum state? [0.0] 量子状態からどれだけの暗号的にセキュアなランダム性を抽出できるか?
本稿では,情報源と測定装置の双方について,量子側情報を持つ相手を対象とする汎用逆数モデルについて考察する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:00:13 GMT)
How Analysis Can Teach Us the Optimal Way to Design Neural Operators [0.0] 我々は,ニューラル演算子の安定性,収束性,一般化,計算効率の向上を目指す。
我々は、高次元の安定性、指数収束、ニューラル作用素の普遍性など、重要な理論的洞察を再考する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 03:08:26 GMT)
High-Pass Graph Convolutional Network for Enhanced Anomaly Detection: A Novel Approach [0.0] 本稿では,グラフ異常検出(GAD)のためのハイパスグラフ畳み込みネットワーク(HP-GCN)を提案する。
提案したHP-GCNは、異常が正常ノードネットワーク内の高周波信号を増加させる傾向があるため、異常を検出するために高周波成分を利用する。
このモデルはYelpChi、Amazon、T-Finance、T-Socialデータセットで評価され、検証される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:38:07 GMT)
Geometry of orofacial neuromuscular signals: speech articulation decoding using surface electromyography [0.0] 何百万人もの個人が、神経筋疾患、脳卒中、外傷、頭頸部がん手術により、知能的に話す能力を失っている。
非侵襲的表面筋電図(sEMG)は、これらの個人における音声出力の回復を約束している。
目標は、音声を静かに生成するときに複数の音場からsEMG信号を収集し、その信号をデコードして、流動的で自然なコミュニケーションを可能にすることである。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 20:31:22 GMT)
Finite temperature fermionic charge and current densities in conical space with a circular edge [0.0] 磁気フラックスでスレッディングされた2次元円錐空間上に局在した巨大なスピノル場の電荷と電流密度に対する有限温度およびエッジ誘起効果について検討した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 08:41:37 GMT)
Fine Grained Insider Risk Detection [0.0] 本稿では,支援者間での業務正当化から逸脱を検出する手法を提案する。
我々は,3千人以上の支援エージェントによる何百万もの行動の監査を支援するために,本手法を適用した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:07:38 GMT)
FilterViT and DropoutViT: Lightweight Vision Transformer Models for Efficient Attention Mechanisms [0.0] FilterViTは、他のモデルと比較して、効率と精度の両方で大幅に向上する。
また、ピクセル選択のアプローチを利用したDropoutViTを導入し、ロバスト性をさらに強化する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:06:19 GMT)
Field theory for monitored Brownian SYK clusters [0.0] ブラウン・サハデフ・イェ・キタエフ系の複数のクラスターの時間的進化を考察する。
我々は、高次対称性群に対するスピンコヒーレント状態の一般化により、ダイナミクスのコヒーレント状態経路積分を構築する。
定常状態においては,2つの監視されたクラスターが線形-in-Nの絡み合いを示し,その比例係数は単位結合の強さに依存することを示した。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:45:05 GMT)
FUSECAPS: Investigating Feature Fusion Based Framework for Capsule Endoscopy Image Classification [0.0] この研究は内視鏡画像の分類に強力な方法論を提供する。
本稿では、畳み込みニューラルネットワーク(CNN)、多層パーセプトロン(MLP)、放射能を組み合わせたハイブリッド特徴抽出法を提案する。
カプセル内視鏡ビデオフレーム分類作業において,76.2%の精度で検証を行った。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:55:52 GMT)
Exploring the Landscape for Generative Sequence Models for Specialized Data Synthesis [0.0] 本稿では,複雑度の異なる3つの生成モデルを利用して,最も要求の多い構造化データセットの1つを合成する手法を提案する。
提案手法は, 数値データをテキストに変換し, 言語モデリングタスクとして記述し, データの正規化を向上し, 合成データの一般化と品質を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:51:10 GMT)
Experimental Narratives: A Comparison of Human Crowdsourced Storytelling and AI Storytelling [0.0] この研究は、2019年6月にクラウドワーカーによって書かれた250のストーリーと、GPT-3.5とGPT-4によって生成された80のストーリーを分析した。
クラウドワーカーと大きな言語モデルの両方が、人工人間を創造し、恋に落ちるという同じプロンプトに反応した。
この分析により、GPT-3.5、特にGPT-4の物語は、人間によって書かれた物語よりも性役割やセクシュアリティの点で進歩的であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 05:11:46 GMT)
Enhancing Density Functional Theory for Static Correlation in Large Molecules [0.0] 密度汎関数理論(DFT)の実際の重要な課題は、静的電子相関を扱う能力が限られていることである。
近年,DFTの1電子還元密度行列理論と2電子還元密度行列理論を組み合わせることで,静的相関に対するDFTの普遍的な$O(N3)$一般化が得られる。
得られた機能理論を線形水素鎖に適用し,一重項-三重項ギャップとアセアの平衡ジオメトリの予測を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 16:43:32 GMT)
Enhanced non-macrorealism: Extreme violations of Leggett-Garg inequalities for a system evolving under superposition of unitaries [0.0] 量子論は、システムが2つ以上の物理的に異なる状態の重ね合わせにあることを許すことで古典的マクロリアリズムを阻止する。
ユニタリ作用素の重畳の下で変換を受けると、非マクロ的特徴が強化されることが示される。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:27:05 GMT)
EfficientNet with Hybrid Attention Mechanisms for Enhanced Breast Histopathology Classification: A Comprehensive Approach [0.0] 本稿では,ハイブリット・エフィシエント・ネットモデルと高度な注意機構を統合し,特徴抽出を強化し,重要な画像領域に焦点を当てた新しいアプローチを提案する。
利用可能な病理組織学データセットを用いて,複数の拡大スケールでモデルの性能を評価する。
その結果, 精度, F1スコア, 精度, リコールなどの指標を用いて評価し, 診断精度を向上させる上での本モデルの有効性を実証した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:56:16 GMT)
Efficacy of EPSS in High Severity CVEs found in KEV [0.0] Exploit Prediction Scoring System (EPSS)は、今後30日間で悪用される脆弱性の確率を評価するように設計されている。
本研究は、EPSSが脆弱性が積極的に侵害される前に、エクスプロイトを予測する能力を評価する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:12:58 GMT)
Effective Layer Pruning Through Similarity Metric Perspective [0.0] ディープニューラルネットワークは、認知タスクを解決する機械学習において、主要なパラダイムとなっている。
これらのモデルから構造を抽出することは、ネットワークの複雑さを減らすための簡単なアプローチである。
層プルーニングは、しばしば高い圧縮速度でネットワーク予測能力(すなわち精度)を損なう。
この研究は、プルーニング手法によって追求されるすべての基礎特性を満たす効果的なレイヤ・プルーニング戦略を導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:39:10 GMT)
EXAGREE: Towards Explanation Agreement in Explainable Machine Learning [0.0] 機械学習における説明は、信頼、透明性、公平性に不可欠である。
本稿では,説明可能な機械学習における多種多様な解釈を橋渡しする新しいフレームワークであるExplanation AGREEmentを紹介する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:28:38 GMT)
Discrete Time Crystal Phase as a Resource for Quantum Enhanced Sensing [0.0] 障害のない多体系において,安定な離散時間結晶相を生成するための効果的な機構を提案し,特徴付ける。
その結果,時間結晶相を通じて強い量子増強感度が得られた。
単純な射影測定のセットは、量子的に増強された感度を捉えることができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 11:49:47 GMT)
Direct observation of dynamical quasi-condensation on a quantum computer [0.0] 我々は回路圧縮を用いて、IBMQ上の無視可能なトロッタエラーと任意に長い時間にダイナミクスをシミュレートする。
コヒーレンス(Coherence)は、全ての時間スケールにおいて、最も低い自然軌道によって示されるように維持される。
量子シミュレーションがHCB物理への観測アクセスを提供することを示す。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:00:10 GMT)
Detecting Student Disengagement in Online Classes Using Deep Learning: A Review [0.0] オンライン学習における学生の離脱は、特にパンデミック後の重要な課題となっている。
本稿では、コンピュータビジョンと感情コンピューティングを効果的なアプローチとして強調する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 07:01:22 GMT)
Deep memetic models for combinatorial optimization problems: application to the tool switching problem [0.0] この研究は、ディープなメタ協調、すなわち、一部のコンポーネントがそれ自身で協調メソッドとなるような協調最適化アルゴリズムの使用に取り組む。
本研究の目的は,このようなモデルが,従来の協調アルゴリズムの代替として有効であることを示すことである。
以上の結果から, 深層モデルでは, メタヒューリスティックスパラメータよりも優れていることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:39:03 GMT)
Deep Learning on 3D Semantic Segmentation: A Detailed Review [0.0] 3Dセマンティック(3DSS)における最近の深層学習手法の総括的レビューと包括的分析を行った。
既存の9つのレビュー論文の分類体系に基づいて,3DSS深層学習手法の新しい分類体系を提案する。
利用可能な3DSSデータセットの概要は、リンクとともに提供されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:15:26 GMT)
Deep Learning for Leopard Individual Identification: An Adaptive Angular Margin Approach [0.0] 本稿では,個々のヒョウを特徴的パターンに基づいて識別する深層学習フレームワークを提案する。
本稿では,RGBチャネルとエッジ検出チャネルを組み合わせた前処理パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 10:38:33 GMT)
Deep Learning Applications in Medical Image Analysis: Advancements, Challenges, and Future Directions [0.0] 人工知能のサブセットであるディープラーニングの最近の進歩は、医療画像の分析に大きな革命をもたらした。
CNNは多次元医用画像から自律的に学習する能力に顕著な能力を示した。
これらのモデルは、病理学、放射線学、眼科、心臓学など、様々な医学分野に利用されてきた。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:47:36 GMT)
Data-Driven Hierarchical Open Set Recognition [0.0] 本稿では、ロボット工学とコンピュータビジョンの堅牢な認識のために、オープンセット認識(OSR)に対するデータ駆動階層的アプローチを提案する。
この方法は、AUC ROCスコア0.82、ユーティリティスコア0.85で、AwA2データセットで実証された。
このアプローチは、自動的に生成された階層を通して未知のクラスに関する貴重な追加情報を提供し、典型的な教師付きモデル要件以上の補足的な情報を必要としないとともに、未知のクラス配置一貫性を評価するためのクラス集中集中度(CCC)メトリクスを導入している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:54:11 GMT)
Conversations with Data: How Data Journalism Affects Online Comments in the New York Times [0.0] 本研究では、データジャーナリズム(DJ)がオンラインコメントにどのように影響するかを、データとのユーザインタラクションのケーススタディとして検討する。
コーパスは2014年から2022年までの6,400のストーリーと、DJや他のニューヨーク・タイムズのコメントセクションで構成されている。
その結果,DJはユーザ間の対話性が高いことが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:49:26 GMT)
Continuous Analysis: Evolution of Software Engineering and Reproducibility for Science [0.0] 本稿では,科学研究における課題を解決するために,連続分析の概念を紹介する。
CAを採用することで、科学コミュニティは研究成果の妥当性と一般化性を確保することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:11:08 GMT)
Complete Classification of Integrability and Non-integrability for Spin-1/2 Chain with Symmetric Nearest-Neighbor Interaction [0.0] 対称に近接する隣り合う相互作用を持つ一般的なスピン-1/2鎖について研究した。
我々は、既知の可積分系を除いて、このクラスのすべてのスピンモデルが可積分でないことを厳密に証明する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 15:22:14 GMT)
Co-training partial domain adaptation networks for industrial Fault Diagnosis [0.0] 部分的ドメイン適応(PDA)課題は,産業的欠陥診断において最も多い課題である。
対話型残留領域適応ネットワーク(IRDAN)と呼ばれる新しいPDAフレームワークを提案する。
IRDANは、PDAチャレンジの新しい視点を提供するために、各ドメインのドメインワイドモデルを導入します。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:58:31 GMT)
Classifier Chain Networks for Multi-Label Classification [0.0] 分類器チェーンは、多ラベルデータセットを解析するのに広く用いられる手法である。
連鎖の一般化として,分類器チェーンネットワークを導入する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:56:13 GMT)
Casimir-Polder interaction between an atom and a Chern insulator: topological signature and long-range repulsion [0.0] 2レベル原子系とチャーン絶縁体の間のカシミール・ポルダー相互作用を考察する。
負のチャーン数$C$のチャーン絶縁体の近くの右円偏極励起原子状態の場合、共振カシミール・ポルダー力は単調に反発することができる。
同じチャーン絶縁体の存在下では、右円偏極準安定原子状態は反発非共鳴カシミール・ポルダー力を受けることが期待されている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 09:57:17 GMT)
Can Personalized Medicine Coexist with Health Equity? Examining the Cost Barrier and Ethical Implications [0.0] パーソナライズドメディカルは、個々の遺伝、環境、ライフスタイルに合わせた治療を提供することで、医療を変革することを約束する。
高コストとインフラ要求は、特に高所得国(HIC)と低所得国(LMIC)の間の健康格差の悪化を懸念する。
本稿では,PM実装の経済的・倫理的課題について考察し,公平なアクセスを確保することに焦点を当てる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 17:31:10 GMT)
Boulder2Vec: Modeling Climber Performances in Professional Bouldering Competitions [0.0] 確率行列因子分解(PMF)を用いて登山者の特異な特徴と潜伏多次元ベクトルの問題を表現する。
以上の結果から,PMF表現は,登山者の総合的強度と専門的スキルセットの両方を捉えることにより,プロのボルダリング競技の予測性能を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:12:59 GMT)
BodySLAM: A Generalized Monocular Visual SLAM Framework for Surgical Applications [0.0] 本研究では、3つの重要なコンポーネントを通じてこれらの課題に対処する、堅牢なディープラーニングベースのMVSLAMアプローチであるBodySLAMを提案する。
CycleVOは、新しい教師なし単眼ポーズ推定モジュールであり、モノクロ深度推定のための最先端のZoeアーキテクチャの統合、コヒーレントな手術地図を作成する3D再構成モジュールである。
その結果、CycleVOは、ポーズ推定法の中で最も低い推定時間で競合性能を示し、頑健な一般化能力を維持した。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 12:19:57 GMT)
Benchmarking Accuracy in an Emulated Memory Experiment [0.0] 本稿では,エミュレートされた表面コードメモリ実験から論理誤差率を抽出する手法を提案する。
この方法は論理誤差率抽出と呼ばれる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:00:05 GMT)
Analysing the cultural dimensions of cybercriminal groups -- A case study on the Conti ransomware group [0.0] 本研究では,人間の行動や相互作用の文化的側面を分析することによって,脅威俳優グループをプロファイリングするための新たな要素を提案する。
本研究では,ハフステデ文化分類の6次元と,ランサムウェアグループContiの漏洩内部通信におけるMeyer分類の8次元をテーマ分析した。
このようなアプリケーションからの洞察は、第一に、サイバー犯罪と戦うのを補助し、第二に、ニュアンスによるサイバー攻撃の帰属プロセスに対する信頼のレベルを提供することができる。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:31:15 GMT)
Advancements and limitations of LLMs in replicating human color-word associations [0.0] 大規模言語モデル(LLM)が広く普及し、自然な会話スキルを持つ様々なベンチマークでインテリジェントな振る舞いを実証している。
日本人1万人以上の参加者から収集したデータを用いて,複数世代にわたるLLMと人間の色覚関連性を比較検討した。
GPT-4oは,各色とカテゴリに最適な投票語を推定する上で,最も高い精度を達成している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 14:29:28 GMT)
Advanced Vision Transformers and Open-Set Learning for Robust Mosquito Classification: A Novel Approach to Entomological Studies [0.0] この研究は、視覚変換器とオープンセット学習技術を活用することにより、蚊の分類に革新的なアプローチを示す。
トランスフォーマーベースのディープラーニングモデルと包括的データ拡張と事前処理メソッドを統合する新しいフレームワークが導入された。
このフレームワークは、蚊や人間に類似した昆虫のような目に見えないクラスを、オープンセットの学習によって扱えるようにすることで、実用性をさらに高めている。
論文参考訳(メタデータ) (Mon, 4 Nov 2024 13:43:15 GMT)
Active Prompt Tuning Enables Gpt-40 To Do Efficient Classification Of Microscopy Images [0.0] 顕微鏡画像中の細胞の特徴を分類する従来のディープラーニングベースの手法は、トレーニングモデルに時間と労働集約的なプロセスを必要とする。
我々は以前、パイロットデータセット上でOpenAIのGPT-4(V)モデルを使用してこれらの課題を克服するソリューションを提案した。
パイロットデータセットの結果は精度が同等で、ベースラインに比べてスループットが大幅に向上した。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 21:56:48 GMT)
AIWR: Aerial Image Water Resource Dataset for Segmentation Analysis [0.0] データセットはBing Mapsを使って作成され、ベーシックジオグラフィックデータセット(FGDS)の標準に従っている。
リモートセンシングの専門家が検証した根拠となる真実のアノテーションが含まれている。
AIWRデータセットは、サイズ、色、形状、水域の類似性の違いによるセグメンテーションなど、かなりの課題を提示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 04:45:45 GMT)
A simple test of local realistic hidden-variable theories without inequalities [0.0] 量子力学に関する局所現実的な隠れ変数理論の妥当性のほとんどのテストはベルの不等式のような不等式に基づいている。
不等式は含まないが、量子力学と局所現実的隠れ変数理論による相関関数の直接比較を行う。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 12:48:16 GMT)
A Study of Data Augmentation Techniques to Overcome Data Scarcity in Wound Classification using Deep Learning [0.0] データ拡張により、最先端モデル上での分類性能、F1スコアが最大11%向上することを示す。
GANをベースとした拡張実験により, DE-GANを用いて創傷像をよりリッチに生成できることが証明された。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 00:24:50 GMT)
A Directional Rockafellar-Uryasev Regression [0.0] ほとんどのビッグデータデータセットは、選択バイアスに悩まされている。
信頼できる見積もりの大きな障害のひとつは、トレーニングとテストデータの違いです。
本稿では,研究者が与える2種類のメタデータ情報を考慮した損失関数を提案する。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 19:42:05 GMT)
A Criterion for Quantum Advantage [0.0] 非ユニバーサルゲート集合上の均一かつ大きさの量子回路が効率よくシミュレートできないことを証明した。
我々の結果は、(Udagger otimes Udagger) MathrmU(2)$以上の回路は量子的に有利であることを示している。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 18:38:43 GMT)
A Comparative Analysis of Counterfactual Explanation Methods for Text Classifiers [0.0] BERTテキスト分類器の逆実説明を生成する5つの方法を評価する。
確立されたホワイトボックス置換ベースのメソッドは、分類器の出力を変更する有効な偽物を生成するのに効果的である。
大規模言語モデル(LLM)に基づく新しい手法は、自然言語および言語学的に妥当なテキスト偽造物を生成するのに優れている。
論文参考訳(メタデータ) (Mon, 04 Nov 2024 22:01:52 GMT)