CONDA: Condensed Deep Association Learning for Co-Salient Object Detection [136.3] 本稿では,深層ネットワークを生のアソシエーションに展開し,それらを深層アソシエーションに変換するディープアソシエーション学習戦略を提案する。
3つのベンチマークデータセットによる実験結果から,提案手法の各種トレーニング設定による顕著な効果が示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:07:20 GMT)
Less is More: High-value Data Selection for Visual Instruction Tuning [127.4] 本稿では,視覚的命令データの冗長性を排除し,トレーニングコストを削減するために,高価値なデータ選択手法TIVEを提案する。
約15%のデータしか使用していない我々のアプローチは、8つのベンチマークで全データ微調整モデルに匹敵する平均性能を実現することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:16:13 GMT)
Language and Task Arithmetic with Parameter-Efficient Layers for Zero-Shot Summarization [127.0] 本稿では,言語やタスク特化パラメータを構成することで,ゼロショットの言語間移動を改善することを提案する。
本手法は,言語とタスクPEFTモジュールを要素演算により構成し,ラベルなしデータと英語ラベル付きデータを活用する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:17:09 GMT)
Image Super-Resolution with Text Prompt Diffusion [118.0] 画像SRにテキストプロンプトを導入し、劣化前の情報を提供する。
PromptSRは、事前訓練された言語モデル(例えば、T5やCLIP)を使用して復元を強化する。
実験により、テキストプロンプトをSRに導入すると、合成画像と実世界の画像の両方で優れた結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:47:46 GMT)
SeMv-3D: Towards Semantic and Mutil-view Consistency simultaneously for General Text-to-3D Generation with Triplane Priors [115.7] 汎用テキストから3d生成のための新しいフレームワークであるSeMv-3Dを提案する。
3次元の空間的特徴を持つ3次元平面先行学習を学習し、3次元の異なる視点間の整合性を維持する三次元平面先行学習器を提案する。
また,3次元空間特徴とテキスト・セマンティクスとの整合性を保持するセマンティック・アラインメント・ビュー・シンセサイザーを設計する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:02:06 GMT)
MRAG-Bench: Vision-Centric Evaluation for Retrieval-Augmented Multimodal Models [115.2] MRAG-Benchというマルチモーダル検索拡張生成ベンチマークを導入する。
MRAG-Benchは16,130枚の画像と1,353個の人間による複数の質問からなる。
その結果,すべての大規模視覚言語モデル (LVLM) は,テキスト知識と比較して画像で拡張すると改善が見られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:55:02 GMT)
PaliGemma: A versatile 3B VLM for transfer [112.4] PaliGemmaはオープンビジョン言語モデル(VLM)であり、SigLIP-So400mビジョンエンコーダとGemma-2B言語モデルに基づいている。
我々は、標準的なVLMベンチマークを含む約40のタスクに対して、PaliGemmaを評価するとともに、リモートセンシングやセグメンテーションといった専門的なタスクも評価する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:28:23 GMT)
ElasticTok: Adaptive Tokenization for Image and Video [109.8] 我々は、フレームを可変数のトークンに適応的にエンコードする、事前のフレームを条件付けするElasticTokを紹介する。
推論中、ElasticTokは必要に応じてトークンを動的に割り当てる。
画像とビデオに対する評価は,トークンの有効利用におけるアプローチの有効性を示すものである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:54:15 GMT)
Extracting and Transferring Abilities For Building Multi-lingual Ability-enhanced Large Language Models [105.0] 我々は,MAETと命名された多言語能力抽出と伝達手法を提案する。
我々のキーとなる考え方は、大きな言語モデルから言語に依存しない能力に関する重みを分解し抽出することである。
実験結果から,MAETは高度能力の抽出と伝達を効果的に行うことができ,トレーニングベースライン法よりも優れることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:23:18 GMT)
DelTA: An Online Document-Level Translation Agent Based on Multi-Level Memory [96.4] 大規模言語モデル(LLM)のための文書レバレッジ翻訳エージェントであるDelTAを紹介する。
DelTAは、様々な粒度とスパンにまたがる情報を格納するマルチレベルメモリ構造を備えている。
実験結果から,DelTAは翻訳の一貫性や品質において,強いベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:30:09 GMT)
Poison-splat: Computation Cost Attack on 3D Gaussian Splatting [90.9] 3DGSで見過ごされてきた重大なセキュリティ脆弱性を明らかにします。
相手は入力画像に毒を加えることで、3DGSトレーニングに必要な計算メモリと時間を大幅に増加させることができる。
このような計算コスト攻撃は、二段階最適化問題に対処することで達成される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:57:29 GMT)
Rewarding Progress: Scaling Automated Process Verifiers for LLM Reasoning [90.2] 大規模言語モデルにおける推論を改善するための有望なアプローチは、プロセス報酬モデル(PRM)を使用することである。
PRMは多段階の推論トレースの各ステップでフィードバックを提供し、結果報酬モデル(ORM)よりも信用割当を改善する可能性がある。
PRMに対して探索を行ったり、強化学習(RL)の報酬として使ったりすることで、基本方針を改善するために、「プロセス報酬をどう設計すべきか?」と質問する。
理論的には,良質なプロデューサの集合を特徴付けるとともに,このようなプロデューサからのプロセス報酬の最適化が,テスト時間探索やオンラインRLの探索を改善することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:31:23 GMT)
Neural Semantic Map-Learning for Autonomous Vehicles [85.8] 本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:10:03 GMT)
MACPO: Weak-to-Strong Alignment via Multi-Agent Contrastive Preference Optimization [85.6] 大規模言語モデルと人的価値を一致させるために,マルチエージェント・コントラスト優先最適化(MACPO)フレームワークを提案する。
MACPOは、強い生徒と弱い教師のアライメント性能を同時に向上することを示す。
弱い教師の数が増加するにつれて、MACPOはより多くのイテレーション最適化ラウンドにより、より弱い教師同士のアライメントのパフォーマンスが向上する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:29:35 GMT)
Understanding the Interplay between Parametric and Contextual Knowledge for Large Language Models [85.1] 大規模言語モデル(LLM)は、事前訓練中に大量の知識を符号化する。
LLMは文脈知識(CK)を取り入れることで拡張できる
LLMは複雑な問題を解決するために、内部PKと外部CKを効果的に統合できるのか?
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:09:08 GMT)
PromptFix: You Prompt and We Fix the Photo [84.7] 言語モデルを備えた拡散モデルは、画像生成タスクにおいて優れた制御性を示す。
多様な命令追跡データの欠如は、モデルの開発を妨げている。
本稿では,人間の指示に従う拡散モデルを実現するフレームワークであるPromptFixを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:09:22 GMT)
Unlearning via Sparse Representations [84.1] 本稿では,離散的な表現ボトルネックに基づく,ほぼ計算自由なゼロショットアンラーニング手法を提案する。
提案手法は,提案手法を効率的に学習し,他のデータセットにおけるモデルの性能に負のダメージを与えることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:27:50 GMT)
SG-Nav: Online 3D Scene Graph Prompting for LLM-based Zero-shot Object Navigation [83.5] 既存のゼロショットオブジェクトナビゲーション手法は、空間的に閉じたオブジェクトのテキストでLCMをプロンプトする。
本稿では,3次元シーングラフを用いて観察されたシーンを表現することを提案する。
我々は,MP3D,HM3D,RoboTHOR環境において,SG-Navが従来のゼロショット法を10%以上のSRで上回る大規模な実験を行った。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:57:19 GMT)
VibeCheck: Discover and Quantify Qualitative Differences in Large Language Models [82.9] 大規模言語モデル(LLM)は、ユーザが直感的に認識するが定量化に苦慮する出力に微妙に特徴を呈することが多い。
モデル(ビブ)の特性を適切に定義し,識別し,ユーザ整合性を持たせることで,一対のLLMを自動比較するシステムであるVibeCheckを紹介する。
要約や数学,キャプションなど,さまざまなモデルやタスク上でVibeCheckを実行して,モデル動作の違いに関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:17 GMT)
ARB-LLM: Alternating Refined Binarizations for Large Language Models [82.2] ARB-LLMは、大規模言語モデル(LLM)に適した新しい1ビット後トレーニング量子化(PTQ)技術である。
ARB-LLM$_textRC$は同じサイズのFP16モデルを超えるのは初めてです。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:38:46 GMT)
ARB-LLM: Alternating Refined Binarizations for Large Language Models [82.2] ARB-LLMは、大規模言語モデル(LLM)に適した新しい1ビット後トレーニング量子化(PTQ)技術である。
ARB-LLM$_textRC$は同じサイズのFP16モデルを超えるのは初めてです。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:38:46 GMT)
Distillation-Free One-Step Diffusion for Real-World Image Super-Resolution [81.8] 蒸留不要1ステップ拡散モデルを提案する。
具体的には、敵対的訓練に参加するためのノイズ認識識別器(NAD)を提案する。
我々は、エッジ対応disTS(EA-DISTS)による知覚損失を改善し、詳細な情報を生成するモデルの能力を向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:00:35 GMT)
Distillation-Free One-Step Diffusion for Real-World Image Super-Resolution [81.8] 蒸留不要1ステップ拡散モデルを提案する。
具体的には、敵対的訓練に参加するためのノイズ認識識別器(NAD)を提案する。
我々は、エッジ対応disTS(EA-DISTS)による知覚損失を改善し、詳細な情報を生成するモデルの能力を向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:00:35 GMT)
FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Model [80.7] 本稿では,非制限解像度とアスペクト比で画像を生成するためのトランスフォーマーアーキテクチャを提案する。
総合的な実験は、FiTv2の幅広い解像度での異常な性能を実証している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:43:20 GMT)
AKEW: Assessing Knowledge Editing in the Wild [80.0] AKEW(Assessing Knowledge Editing in the Wild)は知識編集のための新しい実用的なベンチマークである。
知識更新の編集設定は、構造化された事実、構造化されていない事実としてのテキスト、抽出された三つ組の3つを網羅している。
大規模な実験を通じて、最先端の知識編集手法と実践シナリオの間にかなりのギャップがあることを実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:30:03 GMT)
Deepfake detection in videos with multiple faces using geometric-fakeness features [79.2] 被害者や人物のディープフェイクは、脅迫、ゆがみ、金融詐欺の詐欺師によって使用される。
本研究では,映像中の顔の存在の動的度を特徴付ける幾何学的フェイクネス機能(GFF)を提案する。
我々は、ビデオに同時に存在する複数の顔でビデオを分析するために、我々のアプローチを採用している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:10:34 GMT)
InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.1] 3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:50:07 GMT)
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models [79.0] DICE(Discrete Inversion for Controllable Editing)を導入し,離散拡散モデルの正確なインバージョンを実現する。
逆拡散過程におけるノイズシーケンスとマスキングパターンを記録することにより、DICEは離散データの正確な再構成とフレキシブルな編集を可能にする。
以上の結果から,DICEは高いデータ忠実性を保ちながら編集能力を向上し,離散空間における微細なコンテンツ操作の新たな機会を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:48 GMT)
Sharing Matters: Analysing Neurons Across Languages and Tasks in LLMs [70.3] 我々は,タスクや言語間でニューロンの活性化がどのように共有されるかを調べることで,研究ギャップを埋めることを目指している。
我々は、異なる言語にまたがる特定の入力に対する応答に基づいて、ニューロンを4つの異なるカテゴリに分類する。
分析の結果, (i) ニューロン共有のパターンはタスクや例の特徴に大きく影響され, (ii) ニューロン共有は言語類似性に完全には対応しない, (iii) 共有ニューロンは応答の生成において重要な役割を担っている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:17:20 GMT)
Can Looped Transformers Learn to Implement Multi-step Gradient Descent for In-context Learning? [69.4] 収束ランドスケープの勾配非性アルゴリズムにもかかわらず、回帰損失に高速な流れを示す。
この設定における多層トランスの理論的解析はこれが初めてである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:29:05 GMT)
Simple ReFlow: Improved Techniques for Fast Flow Models [68.3] 拡散および流れマッチングモデルは、優れた生成性能を実現するが、多くのサンプリングステップを犠牲にしている。
我々は、力学、学習、推論のトレーニングに7つの改善点を提案する。
我々は、ニューラルネットワークによる高速な生成のために、最先端のFIDスコア(ガイダンスなし/参照なし)を達成している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:00:55 GMT)
MMHead: Towards Fine-grained Multi-modal 3D Facial Animation [68.0] 大規模なマルチモーダル3次元顔アニメーションデータセットMMHeadを構築した。
MMHeadは、49時間の3D顔の動きシーケンス、音声、リッチな階層的なテキストアノテーションで構成されている。
MMHeadデータセットに基づいて,テキストによる3次元対話ヘッドアニメーションとテキストから3次元の顔の動き生成という,2つの新しいタスクのベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:37:01 GMT)
CBGBench: Fill in the Blank of Protein-Molecule Complex Binding Graph [66.1] CBGBenchは構造ベースドラッグデザイン(SBDD)のベンチマークである
既存のメソッドを属性に基づいて分類することで、CBGBenchは様々な最先端メソッドを実装している。
我々は,これらのモデルを薬物設計に不可欠なタスクに適応させてきた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:22:58 GMT)
Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles [66.0] 特徴不確実性の下での文脈線形帯域問題について検討する。
本分析により, 最適仮説は, 雑音特性に応じて, 基礎となる実現可能性関数から著しく逸脱しうることが明らかとなった。
これは、古典的アプローチが非自明な後悔境界を保証できないことを意味する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:00:53 GMT)
Silent Guardian: Protecting Text from Malicious Exploitation by Large Language Models [63.9] 大規模言語モデル(LLM)に対するテキスト保護機構であるSilent Guardianを紹介する。
保護されるテキストを慎重に修正することで、TPEはLDMを誘導して最初にエンドトークンをサンプリングし、直接相互作用を終了させることができる。
本研究では,SGがターゲットテキストを種々の構成で効果的に保護し,保護成功率の約100%を達成できることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:57:23 GMT)
DAPE V2: Process Attention Score as Feature Map for Length Extrapolation [63.9] 我々は特徴写像としての注意を概念化し、コンピュータビジョンにおける処理方法を模倣するために畳み込み演算子を適用した。
様々な注意関係のモデルに適応できる新しい洞察は、現在のTransformerアーキテクチャがさらなる進化の可能性があることを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:31:26 GMT)
DAPE V2: Process Attention Score as Feature Map for Length Extrapolation [63.9] 我々は特徴写像としての注意を概念化し、コンピュータビジョンにおける処理方法を模倣するために畳み込み演算子を適用した。
様々な注意関係のモデルに適応できる新しい洞察は、現在のTransformerアーキテクチャがさらなる進化の可能性があることを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:31:26 GMT)
DAPE V2: Process Attention Score as Feature Map for Length Extrapolation [63.9] 我々は特徴写像としての注意を概念化し、コンピュータビジョンにおける処理方法を模倣するために畳み込み演算子を適用した。
様々な注意関係のモデルに適応できる新しい洞察は、現在のTransformerアーキテクチャがさらなる進化の可能性があることを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:31:26 GMT)
A Simple LLM Framework for Long-Range Video Question-Answering [63.5] 長距離ビデオ質問応答(LVQA)のための言語ベースのフレームワークであるLLoViを提案する。
我々のアプローチでは、フレーム/クリップレベルの視覚キャプタと大言語モデル(GPT-3.5, GPT-4)を併用する。
提案手法は50.3%の精度を達成し,従来のベストパフォーマンスアプローチを18.1%(絶対ゲイン)で上回った。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:17:00 GMT)
Reward-Augmented Data Enhances Direct Preference Alignment of LLMs [63.3] 報奨条件付き大言語モデル(LLM)を導入し、データセット内の応答品質のスペクトル全体から学習する。
そこで本稿では,品質スコアに優先ペアを条件付け,報酬を加算したデータセットを構築する,効果的なデータレバーベリング手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:01:51 GMT)
UW-SDF: Exploiting Hybrid Geometric Priors for Neural SDF Reconstruction from Underwater Multi-view Monocular Images [63.3] ニューラルSDFに基づく多視点水中画像から対象物を再構成するフレームワークを提案する。
再建過程を最適化するためのハイブリッドな幾何学的先行手法を導入し、神経SDF再建の質と効率を著しく向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:33:56 GMT)
Visual Haystacks: A Vision-Centric Needle-In-A-Haystack Benchmark [63.3] 大規模マルチモーダルモデル(LMM)は、単一画像に対する視覚的質問応答において大きな進歩を遂げている。
多数の視覚トークンを処理する能力は、複数画像の質問応答に対する効果的な検索と推論を保証するものではない。
オープンソースで軽量なビジュアルRAGフレームワークであるMIRAGEを導入し、単一の40G A100 GPU上で最大10Kイメージを処理する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:03:15 GMT)
Detecting Training Data of Large Language Models via Expectation Maximization [62.3] メンバーシップ推論攻撃(MIA)は、特定のインスタンスがターゲットモデルのトレーニングデータの一部であるかどうかを判断することを目的としている。
大規模言語モデル(LLM)にMIAを適用することは、事前学習データの大規模化と、会員シップのあいまいさによって、ユニークな課題をもたらす。
EM-MIAは,予測最大化アルゴリズムを用いて,メンバーシップスコアとプレフィックススコアを反復的に洗練するLLMの新しいMIA手法である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:31:16 GMT)
Factor Graph Optimization of Error-Correcting Codes for Belief Propagation Decoding [62.3] 低密度パリティ・チェック (LDPC) コードは、他の種類のコードに対していくつかの利点がある。
提案手法は,既存の人気符号の復号性能を桁違いに向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:36:25 GMT)
From Exploration to Mastery: Enabling LLMs to Master Tools via Self-Driven Interactions [60.7] 本稿では,大規模言語モデルと外部ツールとの包括的ギャップを埋めることに焦点を当てる。
ツール文書の動的精錬を目的とした新しいフレームワーク DRAFT を提案する。
複数のデータセットに対する大規模な実験は、DRAFTの反復的なフィードバックベースの改善がドキュメントの品質を大幅に改善することを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:44 GMT)
Automatic Curriculum Expert Iteration for Reliable LLM Reasoning [60.6] 幻覚(すなわち、可塑性だが不正確な内容を生成する)と怠慢(すなわち過剰な拒絶や「私は知らない」のデフォルト)は、LLM推論における主要な課題として残る。
幻覚を減らそうとする現在の取り組みは、主に知識に基づくタスクにおける事実的誤りに焦点を当てており、しばしば欠陥推論に関連する幻覚を無視している。
本稿では,LLM推論を強化し,モデルの能力に応答する自動カリキュラムエキスパートイテレーション(Auto-CEI)を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:43:07 GMT)
Generalizing Stochastic Smoothing for Differentiation and Gradient Estimation [59.9] アルゴリズム,演算子,シミュレータ,その他の微分不可能関数の微分可能緩和に対する勾配推定の問題に対処する。
我々は、微分可能なソートとランキングのための分散化戦略、グラフ上の微分可能なショートパス、ポーズ推定のための微分可能なレンダリング、および微分可能なCryo-ETシミュレーションを開発する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:10:00 GMT)
Generalized Consistency Trajectory Models for Image Manipulation [59.6] 拡散モデル(DM)は、画像編集や復元などの応用と同様に、無条件生成において優れている。
本研究の目的は、一般化されたCTM(GCTM)を提案することによって、整合性軌道モデル(CTM)の完全なポテンシャルを解放することである。
本稿では,GCTMの設計空間について論じ,画像から画像への変換,復元,編集など,様々な画像操作タスクにおいて有効性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:04:44 GMT)
Learning to Generate Diverse Pedestrian Movements from Web Videos with Noisy Labels [59.3] PedGenは、Webビデオから多様な歩行者の動きを学ぶための生成モデルである。
PedGenはノイズの多いラベルから学び、コンテキストファクターを組み込む。
実世界とシミュレーション環境の両方においてゼロショットの一般化を実現する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:25:17 GMT)
SONAR: A Synthetic AI-Audio Detection Framework~and Benchmark [59.1] SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供することを目的としている。
従来のモデルとファンデーションベースのディープフェイク検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:34:21 GMT)
SONAR: A Synthetic AI-Audio Detection Framework and Benchmark [59.1] SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供することを目的としている。
従来のモデルとファンデーションベースのディープフェイク検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:34:21 GMT)
SONAR: A Synthetic AI-Audio Detection Framework and Benchmark [59.1] SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供することを目的としている。
従来のモデルとファンデーションベースのディープフェイク検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:34:21 GMT)
Networked Communication for Decentralised Agents in Mean-Field Games [59.0] 平均フィールドゲームフレームワークにネットワーク通信を導入する。
当社のアーキテクチャは、中央集権型と独立した学習ケースの双方で保証されていることを証明しています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:09:43 GMT)
Randomized Asymmetric Chain of LoRA: The First Meaningful Theoretical Framework for Low-Rank Adaptation [58.3] Low-Rank Adaptation (LoRA) は、ファインチューニングモデルの一般的なテクニックである。
LoRAは、フルパラメータの微調整と比較すると、しばしば実行されます。
本稿では,LoRA手法の適応率を厳密に分析するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:51:53 GMT)
MinorityPrompt: Text to Minority Image Generation via Prompt Optimization [57.3] 本稿では,事前訓練されたテキスト・ツー・イメージ(T2I)潜時拡散モデルを用いて,少数サンプルの生成について検討する。
所望のプロパティの出現を促進するオンラインプロンプト最適化フレームワークを開発した。
次に、このジェネリックプロンプトを、マイノリティーな特徴の生成を促進する特殊な解決器に仕立てる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:56:09 GMT)
Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers [57.1] 我々はこれらの課題に対処するため,ポーカー・フェイス・ビジョン・トランスフォーマー (PF-ViT) と呼ばれる新しいFERモデルを提案する。
PF-ViTは、対応するポーカーフェースを生成して、乱れを認識できない感情を静的な顔画像から分離し、認識することを目的としている。
PF-ViTはバニラビジョントランスフォーマーを使用し、そのコンポーネントは大規模な表情データセット上でMasked Autoencodeerとして事前トレーニングされている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:47:17 GMT)
Dog-IQA: Standard-guided Zero-shot MLLM for Mix-grained Image Quality Assessment [57.1] 我々は,マルチモーダル大規模言語モデル(MLLM)の例外的事前知識を利用する,標準誘導型ゼロショット混合IQA法であるDog-IQAを提案する。
Dog-IQAは、MLLMの行動パターンを利用し、主観的要因の影響を最小限に抑える特定の基準で客観的に得点する。
提案したDog-IQAは,トレーニングフリー手法と比較して最先端(SOTA)性能を実現し,クロスデータセットシナリオにおけるトレーニングベース手法と比較して競合性能が向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:36:30 GMT)
Dog-IQA: Standard-guided Zero-shot MLLM for Mix-grained Image Quality Assessment [57.1] 我々は,マルチモーダル大規模言語モデル(MLLM)の例外的事前知識を利用する,標準誘導型ゼロショット混合IQA法であるDog-IQAを提案する。
Dog-IQAは、MLLMの行動パターンを利用し、主観的要因の影響を最小限に抑える特定の基準で客観的に得点する。
提案したDog-IQAは,トレーニングフリー手法と比較して最先端(SOTA)性能を実現し,クロスデータセットシナリオにおけるトレーニングベース手法と比較して競合性能が向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:36:30 GMT)
High-Quality Visually-Guided Sound Separation from Diverse Categories [56.9] DAVISは拡散に基づくオーディオ視覚分離フレームワークである。
分離された音をガウス雑音から直接合成し、オーディオミックスと視覚情報の両方に条件付けする。
AVEおよびMUSICデータセット上で,DAVISを既存の最先端の識別的音声視覚分離法と比較した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:32:28 GMT)
MotionGS: Exploring Explicit Motion Guidance for Deformable 3D Gaussian Splatting [56.8] 我々はMotionGSと呼ばれる新しい変形可能な3次元ガウススプレイティングフレームワークを提案する。
MotionGSは3Dガウスの変形を導くために、前もって明示的な動きを探索する。
モノラルなダイナミックシーンの実験では、MotionGSが最先端の手法を超越していることが確認された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:19:47 GMT)
On the Convergence of (Stochastic) Gradient Descent for Kolmogorov--Arnold Networks [56.8] Kolmogorov--Arnold Networks (KAN) はディープラーニングコミュニティで注目されている。
実験により、勾配降下(SGD)により最適化されたカンが、ほぼゼロに近い訓練損失を達成できることが示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:34:10 GMT)
Teaching Human Behavior Improves Content Understanding Abilities Of LLMs [56.6] 受信者の振る舞いに関するLLMのトレーニングは、コンテンツ理解能力の向上に役立つ。
この性能は、26のベンチマークデータセット上で46以上のビデオおよび画像理解タスクで向上する。
我々は、複数のプラットフォームから収集された750kの画像やビデオのレシーバ動作のクリーン化コメントやお気に入りを、インストラクションチューニングデータとともにリリースする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:59:09 GMT)
Almost Minimax Optimal Best Arm Identification in Piecewise Stationary Linear Bandits [56.0] そこで本研究では,各文脈の平均値によって腕の質を計測するPSLBモデルを提案する。
PS$varepsilon$BAI$+$は、$varepsilon$-optimal armを、確率$ge 1-delta$と最小限のサンプルで識別することが保証される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:15:42 GMT)
Insight Over Sight? Exploring the Vision-Knowledge Conflicts in Multimodal LLMs [55.7] 本稿では,マルチモーダル大言語モデル(MLLM)におけるコモンセンスレベルの視覚知識衝突の問題について考察する。
MLLMのコンフリクトのシミュレーションと評価を目的としたベンチマークを確立するため,人間のループ品質制御を付加した自動パイプラインを導入する。
各種モデルファミリーにおける9つの代表MLLMのコンフリクト分解能を評価し,テキストクエリに顕著なオーバー信頼度を求める。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:31:17 GMT)
TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.3] テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:06:53 GMT)
Using AI Alignment Theory to understand the potential pitfalls of regulatory frameworks [55.2] 本稿では、欧州連合の人工知能法(EU AI法)を批判的に検討する。
人工知能における技術的アライメントの潜在的な落とし穴に焦点を当てたアライメント理論(AT)研究からの洞察を利用する。
これらの概念をEU AI Actに適用すると、潜在的な脆弱性と規制を改善するための領域が明らかになる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:38:38 GMT)
OpenDAS: Open-Vocabulary Domain Adaptation for Segmentation [55.0] 視覚言語モデル(VLM)にドメイン固有の知識を注入するオープン語彙ドメイン適応の課題を提案する。
既存のVLM適応手法では、ベース(トレーニング)クエリのパフォーマンスが向上するが、新しいクエリ上でのVLMのオープンセット能力を維持できない。
我々のアプローチは、新しいクラスにおける元のVLMを一貫して上回るパラメータ効率の手法である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:32:12 GMT)
Identifying latent disease factors differently expressed in patient subgroups using group factor analysis [54.7] 本稿では,サブグループ特異的およびサブグループ共通潜在因子を明らかにするための新しいアプローチを提案する。
提案手法は,正規化されたホースシュー先行群を用いたスパース群因子解析 (GFA) であり,確率計画法を用いて実装した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:12:14 GMT)
Happy: A Debiased Learning Framework for Continual Generalized Category Discovery [54.5] 本稿では,C-GCD(Continuous Generalized Category Discovery)の未探索課題について考察する。
C-GCDは、学習済みのクラスを認識する能力を維持しながら、ラベルのないデータから新しいクラスを漸進的に発見することを目的としている。
本稿では,ハードネスを意識したプロトタイプサンプリングとソフトエントロピー正規化を特徴とする,偏りのある学習フレームワークであるHappyを紹介する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:10:47 GMT)
Happy: A Debiased Learning Framework for Continual Generalized Category Discovery [54.5] 本稿では,C-GCD(Continuous Generalized Category Discovery)の未探索課題について考察する。
C-GCDは、学習済みのクラスを認識する能力を維持しながら、ラベルのないデータから新しいクラスを漸進的に発見することを目的としている。
予測バイアスと硬度バイアスに対処するために,偏りのある学習フレームワーク,すなわちHappyを導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:10:47 GMT)
Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.6] VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:47:21 GMT)
RelitLRM: Generative Relightable Radiance for Large Reconstruction Models [52.7] 本稿では,新しい照明下での3Dオブジェクトの高品質なガウススプレイティング表現を生成するためのRelitLRMを提案する。
複雑なキャプチャと遅い最適化を必要とする従来の逆レンダリングとは異なり、RelitLRMはフィードフォワードトランスフォーマーベースのモデルを採用している。
スパースビューフィードフォワードRelitLRMは、最先端の密集ビュー最適化ベースラインに対して、競争力のあるリライティング結果を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:41:49 GMT)
RelitLRM: Generative Relightable Radiance for Large Reconstruction Models [52.7] RelitLRMは、新しい照明下での3Dオブジェクトの高品質なガウススプラッティング表現を生成するための大規模な再構成モデルである。
スパースビューフィードフォワードRelitLRMは、最先端の密集ビュー最適化ベースラインに対して、競争力のあるリライティング結果を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:41:49 GMT)
Language model developers should report train-test overlap [52.5] 30人のモデル開発者のプラクティスを文書化して、トレイン-テストの重複を報告しているのは9人だけです。
私たちの仕事は、モデル評価に対するコミュニティ全体の信頼を高めるために、電車とテストの重複に対する透明性を高めることを願っています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:44:56 GMT)
LoRA-Ensemble: Efficient Uncertainty Modelling for Self-attention Networks [52.5] 本稿では,自己注意ネットワークのためのパラメータ効率の高いディープアンサンブル手法であるLoRA-Ensembleを紹介する。
全メンバー間で重みを共有できる1つの事前学習型自己注意ネットワークを利用することで、注意投影のために、メンバー固有の低ランク行列を訓練する。
提案手法は明示的なアンサンブルよりも優れたキャリブレーションを示し,様々な予測タスクやデータセットに対して類似あるいは良好な精度を実現する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:55:10 GMT)
Learning Equivariant Non-Local Electron Density Functionals [51.7] Equivariant Graph Exchange correlation (EG-XC) は、同変グラフニューラルネットワークに基づく新しい非局所XC関数である。
EG-XCは、半局所関数と同変核中心点雲表現によってパラメータ化された非局所特徴密度を結合する。
MD17では,金標準のCCSD(T)エネルギーを正確に再構成するEG-XCが発見された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:31:45 GMT)
Geometric structure and transversal logic of quantum Reed-Muller codes [51.1] 本稿では,量子リード・ミュラー符号(RM)のゲートを,古典的特性を利用して特徴付けることを目的とする。
RM符号のための安定化器生成器のセットは、特定の次元のサブキューブに作用する$X$と$Z$演算子によって記述することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:07:24 GMT)
Music Genre Classification using Large Language Models [50.8] 本稿では,音楽ジャンル分類のための事前学習された大規模言語モデル(LLM)のゼロショット機能を利用する。
提案手法は、音声信号を20ミリ秒のチャンクに分割し、畳み込み特徴エンコーダで処理する。
推論中、個々のチャンクの予測は最終ジャンル分類のために集約される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:17:56 GMT)
UV-free Texture Generation with Denoising and Geodesic Heat Diffusions [50.6] メッシュの標準的なUVベースの処理機構の最も顕著な課題は、シーム、無駄なUV空間、および表面上の様々な解像度である。
本稿では,3次元メッシュの表面上での操作に制約された拡散モデルを用いて,テクスチャを色分けした点雲色として表現することを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:48:57 GMT)
HiNet: Novel Multi-Scenario & Multi-Task Learning with Hierarchical Information Extraction [50.4] マルチシナリオとマルチタスク学習は、産業アプリケーションにおける多くのレコメンデーションシステムに広く応用されている。
階層型情報抽出ネットワーク(HiNet)を提案する。
HiNetは、新しい最先端のパフォーマンスを実現し、既存のソリューションを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:11:49 GMT)
Flow matching achieves almost minimax optimal convergence [50.4] フローマッチング (FM) は, シミュレーションのない生成モデルとして注目されている。
本稿では,大試料径のFMの収束特性を$p$-Wasserstein 距離で論じる。
我々は、FMが1leq p leq 2$でほぼ最小の収束率を達成できることを確立し、FMが拡散モデルに匹敵する収束率に達するという最初の理論的証拠を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:43:10 GMT)
3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes [50.4] 本研究は, 粒子のトレーシング, 境界体積階層の構築, 高性能なレイトレーシングハードウェアを用いた各画素のレイキャストについて考察する。
半透明粒子の多量処理を効率的に行うために,有界メッシュで粒子をカプセル化するアルゴリズムについて述べる。
実験は、我々のアプローチの速度と精度、およびコンピュータグラフィックスとビジョンにおけるいくつかの応用を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:44:52 GMT)
Generalizable and Animatable Gaussian Head Avatar [50.3] 本稿では,GAGAvatar(Generalizable and Animatable Gaussian Head Avatar)を提案する。
我々は、1つの前方通過で1つの画像から3次元ガウスのパラメータを生成する。
提案手法は, 従来の手法と比較して, 再現性や表現精度の点で優れた性能を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:29:00 GMT)
Towards Global Optimal Visual In-Context Learning Prompt Selection [50.2] そこで本研究では,グローバルな最適プロンプトを特定するための,コンテキスト内サンプル選択フレームワークを提案する。
Partial2Globalと呼ばれるこの手法では、より包括的な比較を行うために、トランスフォーマーベースのリストワイズローダを採用している。
partial2Globalの有効性は、前景のセグメンテーション、単一物体の検出、画像の着色に関する実験を通じて検証される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:54:06 GMT)
Act Like a Radiologist: Radiology Report Generation across Anatomical Regions [50.1] X-RGenは6つの解剖学的領域にわたる放射線学者によるレポート生成フレームワークである。
X-RGenでは、ヒトの放射線学者の行動を模倣し、これらを4つの主要な段階に分解する。
画像エンコーダの認識能力は,各領域にまたがる画像やレポートを分析して向上する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:53:41 GMT)
Parameter-Efficient Fine-Tuning in Spectral Domain for Point Cloud Learning [49.9] 私たちは小説を提案します。
ポイントGST (Point GST) と呼ばれる点雲の効率的な微細調整法。
ポイントGSTは事前トレーニングされたモデルを凍結し、スペクトル領域のパラメータを微調整するためのトレーニング可能なポイントクラウドスペクトルアダプタ(PCSA)を導入する。
挑戦的なポイントクラウドデータセットに関する大規模な実験は、ポイントGSTが完全に微調整されたデータセットを上回るだけでなく、トレーニング可能なパラメータを大幅に削減することを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:00:04 GMT)
OneNet: A Fine-Tuning Free Framework for Few-Shot Entity Linking via Large Language Model Prompting [49.7] OneNetは、大規模言語モデル(LLM)の少数ショット学習機能を利用する革新的なフレームワークで、微調整は不要である。
1)無関係なエンティティを要約してフィルタリングすることで入力を単純化するエンティティリダクションプロセッサ,(2)コンテキスト的キューと事前知識を組み合わせて正確なエンティティリンクを行うデュアルパースペクティブエンティティリンカ,(3)エンティティリンク推論における幻覚を緩和するユニークな一貫性アルゴリズムを利用するエンティティコンセンサス判定器,である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:45:23 GMT)
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.6] 本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:20:55 GMT)
Mono-InternVL: Pushing the Boundaries of Monolithic Multimodal Large Language Models with Endogenous Visual Pre-training [49.4] マルチモーダル・ミックス・オブ・エキスパート構造を用いて視覚専門家の集合をシームレスに統合するモノリシックMLLMであるMono-InternVLを提案する。
また,Mono-InternVLの視覚能力,すなわち内因性視覚前訓練(EViP)を最大化するための革新的な事前学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:22 GMT)
Thread: A Logic-Based Data Organization Paradigm for How-To Question Answering with Retrieval Augmented Generation [49.4] ハウツー質問は意思決定プロセスに不可欠なものであり、動的でステップバイステップの回答を必要とする。
我々は,現在のシステムがハウツー質問をより効果的に扱えるようにするための新しいデータ組織パラダイムThreadを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:04:20 GMT)
Towards Universality: Studying Mechanistic Similarity Across Language Model Architectures [49.2] 本稿では,言語モデリングの主流となる2つのアーキテクチャ,すなわち Transformers と Mambas について検討する。
我々はこれらのモデルから解釈可能な特徴を分離するためにスパースオートエンコーダ(SAE)を用いることを提案し、これらの2つのモデルでほとんどの特徴が似ていることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:51:42 GMT)
Towards Universality: Studying Mechanistic Similarity Across Language Model Architectures [49.2] 本稿では,言語モデリングの主流となる2つのアーキテクチャ,すなわち Transformers と Mambas について検討する。
我々はこれらのモデルから解釈可能な特徴を分離するためにスパースオートエンコーダ(SAE)を用いることを提案し、これらの2つのモデルでほとんどの特徴が似ていることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:51:42 GMT)
Consistency Models Made Easy [49.2] ECT(Easy Consistency Tuning)は、従来の方法を改善しながら、トレーニング時間を大幅に短縮する。
ECTは1つのA100 GPU上で1時間以内にCIFAR10上の2ステップFIDの2.73を達成し、数百GPU時間トレーニングされた一貫性蒸留と一致する。
私たちのコードは公開されており、CMはより広いコミュニティでよりアクセスしやすくしています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:59:49 GMT)
Neural Material Adaptor for Visual Grounding of Intrinsic Dynamics [49.0] 本稿では,既存の物理法則を学習的補正と統合するニューラルネットワーク (NeuMA) を提案する。
また,粒子駆動型3次元ガウス平滑化モデルであるParticle-GSを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:43:36 GMT)
Critic-CoT: Boosting the reasoning abilities of large language model via Chain-of-thoughts Critic [48.9] Critic-CoTは、LLMをSystem-2のような批判能力にプッシュするフレームワークである。
人間のアノテーションを使わずにCoT推論パラダイムと遠隔スーパービジョンデータの自動構築
GSM8KとMATHの実験は、我々の強化されたモデルがタスク解決性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:42:16 GMT)
Multi-Facet Counterfactual Learning for Content Quality Evaluation [48.7] コンテンツ品質評価の複数の側面を知覚する評価器を効率的に構築する枠組みを提案する。
我々は,コントラスト学習と教師付き学習に基づく共同学習戦略を活用し,評価者が異なる品質面を区別できるようにする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:04:10 GMT)
KnowledgeSG: Privacy-Preserving Synthetic Text Generation with Knowledge Distillation from Server [48.0] 大規模言語モデル (LLM) は、多くの当事者が自身のプライベートデータでLPMを微調整できるようにする。
置換のために合成データを利用するような既存のソリューションは、同時にパフォーマンスを改善し、プライバシを保存するのに苦労している。
我々は、合成データ品質を高め、プライバシを確保しつつモデル性能を向上させる新しいクライアントサーバフレームワークであるKnowledgeSGを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:58:35 GMT)
KnowledgeSG: Privacy-Preserving Synthetic Text Generation with Knowledge Distillation from Server [48.0] 大規模言語モデル (LLM) は、多くの当事者が自身のプライベートデータでLPMを微調整できるようにする。
置換のために合成データを利用するような既存のソリューションは、同時にパフォーマンスを改善し、プライバシを保存するのに苦労している。
textitKnowledgeSGは、合成データの品質を高め、プライバシを確保しつつモデル性能を向上させる新しいクライアントサーバフレームワークである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:58:35 GMT)
MKGL: Mastery of a Three-Word Language [48.0] 専門的なKG言語(KGL)を導入し、ある文は、エンティティ名詞、関係動詞、そして他のエンティティ名詞で終わる。
KGLのLLMに対する不慣れな語彙にもかかわらず、我々はその学習を調整された辞書とイラストレーション文を通して促進する。
以上の結果から,従来のKG埋め込み法と比較して,LLMはKGLの流速を著しく低減できることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:39:26 GMT)
Learning to Balance Altruism and Self-interest Based on Empathy in Mixed-Motive Games [47.9] マルチエージェントのシナリオは、しばしば混合モチベーションを伴い、潜在的な搾取に対する自己保護が可能な利他的エージェントを要求する。
共感に基づくアルトリズムと自己利益のバランスをとるためのLASE学習を提案する。
LASEはその報酬の一部を共同プレイヤにギフトとして割り当て、このアロケーションは社会的関係に基づいて動的に適応する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:30:56 GMT)
Knowledge-Aware Parsimony Learning: A Perspective from Relational Graphs [47.7] 我々は、より単純なモデルでより大きなポテンシャルを達成するために、擬似的に次世代モデルを開発する。
鍵となるのは、スケーリングの法則に頼るのではなく、記号やロジック、公式といったドメイン固有の知識を使ってモデルを駆動することだ。
このアプローチによって、モデル設計、トレーニング、解釈のパーシモニーを達成するために、この知識を"ビルディングブロック"として使用するフレームワークを構築することができます。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:41:11 GMT)
Gridded Transformer Neural Processes for Large Unstructured Spatio-Temporal Data [47.1] 本稿では,非構造化観測を行うための格子状擬似トークンPと,効率的な注意機構を利用する格子状擬似トークンを含むプロセッサを紹介する。
提案手法は,大規模データを含む様々な合成および実世界の回帰タスクにおいて,強いベースラインを一貫して上回る。
実生活実験は気象データに基づいて行われ、気象モデルパイプラインで大規模に適用した場合の性能と計算上の利点をもたらすアプローチの可能性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:36:40 GMT)
Gridded Transformer Neural Processes for Large Unstructured Spatio-Temporal Data [47.1] 本稿では,非構造化観測を行うための格子状擬似トークンPと,効率的な注意機構を利用する格子状擬似トークンを含むプロセッサを紹介する。
提案手法は,大規模データを含む様々な合成および実世界の回帰タスクにおいて,強いベースラインを一貫して上回る。
実生活実験は気象データに基づいて行われ、気象モデルパイプラインで大規模に適用した場合の性能と計算上の利点をもたらすアプローチの可能性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:36:40 GMT)
Full-Rank No More: Low-Rank Weight Training for Modern Speech Recognition Models [46.9] 本稿では,大規模コンフォーマーに基づく音声認識モデルにおける低ランクウェイトトレーニングの未探索領域をスクラッチから検討する。
注目モジュールのみに低ランク構造を適用すると、予期せぬパフォーマンスが向上する。
フィードフォワード層は、適度な50%のランク低下でパフォーマンス劣化を示すようになり、大きな課題を呈する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:58:35 GMT)
AppAgent v2: Advanced Agent for Flexible Mobile Interactions [46.8] 本研究は,モバイル機器向けの新しいLLMベースのマルチモーダルエージェントフレームワークを提案する。
我々のエージェントは、様々なアプリケーションにまたがる適応性を高めるフレキシブルなアクション空間を構築する。
本研究は,実世界のシナリオにおいて,フレームワークの優れた性能を実証し,その有効性を確認した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:33:20 GMT)
The Last Iterate Advantage: Empirical Auditing and Principled Heuristic Analysis of Differentially Private SGD [46.7] ノイズカットされた勾配勾配(DP-SGD)の簡易なプライバシー解析法を提案する。
各種トレーニング手順に適用したプライバシー監査の結果を予測できることを実験的に示す。
既存のプライバシー監査攻撃は、視覚と言語の両方のタスクにおける分析によって制限されていることを実証的に示しています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:06:10 GMT)
The Last Iterate Advantage: Empirical Auditing and Principled Heuristic Analysis of Differentially Private SGD [46.7] ノイズカットされた勾配勾配(DP-SGD)の簡易なプライバシー解析法を提案する。
各種トレーニング手順に適用したプライバシー監査の結果を予測できることを実験的に示す。
既存のプライバシー監査攻撃は、視覚と言語の両方のタスクにおける分析によって制限されていることを実証的に示しています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:06:10 GMT)
Sample then Identify: A General Framework for Risk Control and Assessment in Multimodal Large Language Models [46.6] リスク管理とアセスメントのための2段階のフレームワークであるTRONを紹介する。
TRONは、2つのユーザ特定リスクレベルに制限された所望のエラー率を達成する。
重複予測セットは適応性を維持しつつ、異なるリスクレベルのリスク評価に対してより効率的で安定である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:50:42 GMT)
DART: Denoising Autoregressive Transformer for Scalable Text-to-Image Generation [46.5] 拡散モデルは、徐々に入力にノイズを加えるマルコフ過程を認知することによって訓練される。
自動回帰(AR)と拡散を非マルコフフレームワーク内で統一するトランスフォーマーモデルであるDARTを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:41:54 GMT)
FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering [46.4] 本稿では,知識グラフ質問応答を強化する検索拡張推論手法FiDeLiSを提案する。
FiDeLiSはキーワード付き検索機構を使用し、KGのベクトルベースインデックスから関連エンティティと関係をフェッチする。
我々のアプローチの特徴は、推論経路の選択を最適化するために、自然言語とビームサーチをブレンドすることである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:27:41 GMT)
A Closer Look at Machine Unlearning for Large Language Models [46.2] 大型言語モデル(LLM)は機密または著作権のあるコンテンツを記憶し、プライバシーと法的懸念を高める。
LLMの機械学習におけるいくつかの問題について議論し、可能なアプローチについての洞察を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:56:05 GMT)
Gravitationally dominated instantons and instability of dS, AdS and Minkowski spaces [45.7] 量子場理論解析が有効でない状態における偽真空の崩壊について検討する。
これは、偽と真真空を分ける障壁の高さが大きいときに起こる。
デ・シッター、ミンコフスキー、反デ・シッターの不安定性に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:54:06 GMT)
An Investigation of Conformal Isometry Hypothesis for Grid Cells [45.7] コンフォーマルアイソメトリー仮説はグリッドセル応答マップにおける六角形の周期パターンの潜在的な説明である。
我々は,この仮説が格子細胞の六角形周期パターンにつながることを示す数値実験を行った。
エージェントの入力速度の共形変調を提案し、グリッドセルの繰り返しニューラルネットワークが共形等尺性仮説を自動で満たすことを可能にする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:27:11 GMT)
HARIVO: Harnessing Text-to-Image Models for Video Generation [45.6] 本稿では,事前学習されたテキスト・ツー・イメージ(T2I)モデルから拡散に基づく映像モデルを作成する手法を提案する。
鍵となる革新は、時間的滑らか性のための新しい損失関数と緩和勾配サンプリング技術である。
凍結したStableDiffusionモデルに基づいて構築され、トレーニングプロセスを単純化し、ControlNetやDreamBoothといった市販モデルとのシームレスな統合を可能にします。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:47:39 GMT)
Weighted Point Cloud Embedding for Multimodal Contrastive Learning Toward Optimal Similarity Metric [45.0] 提案手法の利点は,CLIPの相対的損失に対する新たな理解を通じて示される。
重み付き点雲に基づく提案した類似性は、常に最適類似性を達成することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:01:50 GMT)
StepTool: A Step-grained Reinforcement Learning Framework for Tool Learning in LLMs [44.9] 我々は,大規模言語モデルにおけるツール学習を改善するための,段階的な強化学習フレームワークであるStepToolを紹介する。
StepToolは、既存のメソッドを多段階のツールベースのタスクで大幅に上回っている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:23:26 GMT)
AgentBank: Towards Generalized LLM Agents via Fine-Tuning on 50000+ Interaction Trajectories [44.7] エージェント-環境相互作用トラジェクトリデータの微調整は、表向きの汎用エージェント機能にとって重要な約束である。
我々はAgentBankを紹介した。これは、50万以上の多様な高品質なインタラクショントラジェクトリを備えた、これまでで最大のトラジェクトリチューニングデータ収集である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:19:12 GMT)
Regularized Conditional Diffusion Model for Multi-Task Preference Alignment [43.9] 連続的な意思決定は、人間の意図と一致し、様々なタスクにまたがる多角性を示すことが望まれる。
従来は条件付き拡散モデルを用いて軌道分布を直接モデル化し,条件生成プロセスとして定式化していた。
本研究では,シングルタスクとマルチタスクの両意思決定の統一条件として,マルチタスクの選好を採用する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:05:43 GMT)
On the role of surrogates in the efficient estimation of treatment effects with limited outcome data [43.2] 一次利害関係にない結果のみを代理する単位にデータを組み込むことは、ATE推定の精度を高めることができる。
我々は,これらの効率向上を実現するために,ロバストなATE推定と推論手法を開発した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:55:55 GMT)
Investigating Multilingual Instruction-Tuning: Do Polyglot Models Demand for Multilingual Instructions? [42.4] 単言語コーパスの代わりに並列で命令チューニングを行うことで、最大9.9%の言語間命令に従うことができることを示す。
また,多言語チャットシナリオにおけるヒューマンベースとGPT-4に基づく評価の整合性を理解するために,人間のアノテーション研究を行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:25:52 GMT)
Investigating Multilingual Instruction-Tuning: Do Polyglot Models Demand for Multilingual Instructions? [42.4] 単言語コーパスの代わりに並列で命令チューニングを行うことで、最大9.9%の言語間命令に従うことができることを示す。
また,多言語チャットシナリオにおけるヒューマンベースとGPT-4に基づく評価の整合性を理解するために,人間のアノテーション研究を行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:25:52 GMT)
Are We Ready for Real-Time LiDAR Semantic Segmentation in Autonomous Driving? [42.3] シーンセマンティックセグメンテーションは、3次元空間データを専門のディープニューラルネットワークと直接統合することで実現できる。
本研究では, NVIDIA Jetson プラットフォーム上でのリソース制約推論の性能と性能を解析し, 様々な3次元セマンティックセマンティックセマンティクス手法について検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:47:33 GMT)
Audio Explanation Synthesis with Generative Foundation Models [42.3] 既存の手法は主に、最終的な決定に対する影響に基づいて、入力空間内の要素に重要性をもたらすことによって、音声基礎モデルの説明に重点を置いている。
本稿では,音声基礎モデルの生成能力を生かした新しい音声説明手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:55:58 GMT)
Assessing Episodic Memory in LLMs with Sequence Order Recall Tasks [42.2] 本稿では,認知心理学におけるエピソード記憶研究の課題から順応する逐次リコールタスク(SORT)を紹介する。
SORTはLLMにテキストセグメントの正しい順序を思い出させる必要があり、拡張が容易で追加のアノテーションを必要としない一般的なフレームワークを提供する。
155人の被験者による人間実験から,本書の長期記憶に基づくシーケンス順序を再現できることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:17:38 GMT)
Causal Image Modeling for Efficient Visual Understanding [41.9] 本稿では,イメージをパッチトークンのシーケンスとして扱うアドベンチャーシリーズモデルを紹介し,一方向言語モデルを用いて視覚表現を学習する。
このモデリングパラダイムにより、列長に対して線形な複雑度を持つ繰り返し定式化による画像の処理が可能となる。
本稿では,画像入力を因果推論フレームワークにシームレスに統合する2つの簡単な設計を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:14:52 GMT)
Mini-batch Coresets for Memory-efficient Training of Large Language Models [41.6] 大規模言語モデル(LLM)における大規模ミニバッチの訓練の禁止化
我々は、コアセットによるLLM訓練(CoLM)を提案する。
CoLMは、微調整のメモリ要求を2倍に減らし、4倍大きなミニバッチでトレーニングを上回ります。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:25:10 GMT)
CoPESD: A Multi-Level Surgical Motion Dataset for Training Large Vision-Language Models to Co-Pilot Endoscopic Submucosal Dissection [41.5] 我々は,多段階の手術用運動データセット(CoPESD)を導入し,LVLM(Large Visual-Language Models)をtextbfEndoscopic textbfSubmucosal textbfDissectionのロボットtextbfCo-textbfPilotとして導入した。
CoPESDには17,679枚の画像と32,699個のバウンディングボックスと88,395個のマルチレベルモーションが含まれており、35時間以上のESDビデオがロボット支援と従来の手術の両方に使われている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:22:09 GMT)
Understanding the AI-powered Binary Code Similarity Detection [41.4] AIによるバイナリコード類似度検出(BinSD)は、プログラム分析に広く応用されている。
BinSD問題がどの程度解決されたか、特に現実世界のアプリケーションで定量的に理解することは困難である。
本稿では,最先端AIを用いたBinSD手法の体系的評価を行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:13:01 GMT)
ToMiE: Towards Modular Growth in Enhanced SMPL Skeleton for 3D Human with Animatable Garments [41.2] 本稿では,骨格の接合木を適応的に拡張するモジュール成長戦略を提案する。
具体的には、ToMiEと呼ばれる手法は、親関節の局在化と外部関節の最適化からなる。
ToMiEは、レンダリング品質だけでなく、成長したジョイントのフリーアニメーションを提供することで、さまざまなケースで他の方法よりも優れています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:25:52 GMT)
Towards Next-Generation LLM-based Recommender Systems: A Survey and Beyond [41.1] 本論では,本質的なレコメンデーションに端を発する新しい分類法を紹介する。
本稿では,レコメンデーションシステムの発達過程をより正確に反映した3層構造を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:22:04 GMT)
TANet: Triplet Attention Network for All-In-One Adverse Weather Image Restoration [40.9] 逆気象画像の復元は、悪天候によるヘイズ、雨、雪などの不要な劣化物を除去することを目的としている。
本稿では,オールインワンの悪天候画像復元を効果的かつ効果的に行うために,トリプルト注意ネットワーク(TANet)を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:52:24 GMT)
Comprehensive Online Training and Deployment for Spiking Neural Networks [40.3] スパイキングニューラルネットワーク(SNN)は、人工知能(AI)の今後の発展において大きな可能性を秘めていると考えられている
現在提案されているオンライントレーニング手法は,時間依存勾配の不分離問題に対処できない。
浮動小数点スパイクと二乗シナプス重みに基づく先進的なスパイクモデル群であるEM-PFモデルを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:39:22 GMT)
COMPL-AI Framework: A Technical Interpretation and LLM Benchmarking Suite for the EU Artificial Intelligence Act [40.2] EUの人工知能法(AI Act)は、AI開発の責任を負うための重要なステップである。
明確な技術的解釈がなく、モデルのコンプライアンスを評価するのが難しい。
この研究は、この法律の最初の技術的解釈からなる包括的枠組みであるComple-AIを提示する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:23:51 GMT)
Partial Differential Equations is All You Need for Generating Neural Architectures -- A Theory for Physical Artificial Intelligence Systems [40.2] 我々は、統計物理学における反応拡散方程式、量子力学におけるシュル・オーディンガー方程式、同軸光学におけるヘルムホルツ方程式を一般化する。
数値解を求めるためにNPDEを離散化するために有限差分法を用いる。
多層パーセプトロン、畳み込みニューラルネットワーク、リカレントニューラルネットワークなど、ディープニューラルネットワークアーキテクチャの基本構築ブロックが生成される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:34:59 GMT)
Steering Language Models With Activation Engineering [40.0] アクティベーションエンジニアリングを導入し、モデル出力を制御(またはステア)するためにアクティベーションの推論時間を変更する。
LLaMA-3 や OPT などのモデルを用いて, 負対正の感情変化と解毒を行う。
ActAddは、ターゲット外のタスクのパフォーマンスを維持しながら、高レベルの出力特性(トピックや感情など)を推論時間で制御する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:20:13 GMT)
Are Images Indistinguishable to Humans Also Indistinguishable to Classifiers? [39.3] ニューラルネットワークベースの分類器の観点からは、高度な拡散モデルでさえもこの目標には程遠いことが示される。
本手法は,生成したデータの特定の特徴を解析することにより,拡散モデルの診断ツールとして自然に機能する。
モデルオートファジー障害に光を当て、生成されたデータの使用に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:05:04 GMT)
Advocating for the Silent: Enhancing Federated Generalization for Non-Participating Clients [38.8] 本稿では,フェデレートラーニングのための情報理論の一般化フレームワークについて紹介する。
局所分布の情報エントロピーを評価することで一般化誤差を定量化する。
導出一般化境界に着想を得て、重み付け集約アプローチとクライアント選択戦略の二重化を導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:58:08 GMT)
Pretraining Graph Transformers with Atom-in-a-Molecule Quantum Properties for Improved ADMET Modeling [38.5] 我々は,グラフトランスフォーマーの事前学習が原子レベルの量子力学特性に与える影響を評価する。
原子量子力学的性質に基づいて事前訓練されたモデルは、より低周波ラプラシアン固有モードを捕捉する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:20:30 GMT)
Spike No More: Stabilizing the Pre-training of Large Language Models [38.3] ロススパイクは、大きな言語モデルの事前訓練中に発生することが多い。
サブ層に対するヤコビ行列のスペクトルノルムの解析を通して勾配ノルムを小さくする因子を探索する。
予備訓練プロセスの安定化には, 小さいサブレイヤと大きなショートカットの2つの条件が必要であることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:24:44 GMT)
Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology [38.2] UAV視覚言語ナビゲーションにおける最近の取り組みは、主に地上ベースのVLN設定を採用する。
プラットフォーム,ベンチマーク,方法論という3つの観点からのソリューションを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:02:04 GMT)
Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology [38.2] UAV視覚言語ナビゲーションにおける最近の取り組みは、主に地上ベースのVLN設定を採用する。
プラットフォーム,ベンチマーク,方法論という3つの観点からのソリューションを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:02:04 GMT)
MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code [38.1] 本稿では, 継続事前学習のための推論ステップを伴って, 数学的コードを生成する新しい手法を提案する。
私たちのアプローチは、高品質な数学的継続事前学習データセットの構築から始まります。
生成されたコードを推論ステップ毎に適用すると、ペアの自然言語推論ステップとその対応するコードからなるデータが得られる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:40 GMT)
ReLU to the Rescue: Improve Your On-Policy Actor-Critic with Positive Advantages [37.1] 本稿では, アクター批判的深層強化学習におけるベイズ推定の近似に向けてのステップを提案する。
Asynchronous Advantage Actor-Critic (A3C)アルゴリズムの3つの変更によって実装されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:16:28 GMT)
Visual Scratchpads: Enabling Global Reasoning in Vision [37.1] 経路発見と迷路を含む4つの世界的視覚的ベンチマークを紹介する。
我々は、今日の大きなビジョンモデルは初期のモデルの表現力の限界を大きく超えているが、学習効率に苦戦していることを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:44:13 GMT)
Rank Aggregation in Crowdsourcing for Listwise Annotations [37.0] クラウドソーシングにおけるリストワイド・アグリゲーション手法を提案する。
本設計では,特にアノテーションの品質指標を用いて,注釈付きランクと真のランクとの差を計測する。
また,アノテータの性能に直接影響を与えるため,ランキング問題自体の難しさも考慮に入れている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:13:21 GMT)
Efficiently Learning at Test-Time: Active Fine-Tuning of LLMs [37.0] 本稿では,モデル応答の不確実性を低減するために設計されたデータ選択アルゴリズムSIFTを紹介する。
SIFTは計算オーバーヘッドを最小限に抑えながら、常に最近傍の検索より優れていることを示す。
我々は、Nearest Neighbor検索のドロップイン代替として使用できる$textttactiveft$ライブラリを提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:17:49 GMT)
HybridBooth: Hybrid Prompt Inversion for Efficient Subject-Driven Generation [36.6] HybridBoothは、パーソナライズされたテキストから画像への拡散モデルのためのフレームワークである。
微調整エンコーダを用いた堅牢な初期単語埋め込みを生成する。
さらに、鍵パラメータを最適化することで、特定の被写体画像にエンコーダを適応させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:19 GMT)
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models [36.6] 我々はEvolveDirectorを導入し、公開リソースを使用した高度なモデルに匹敵するテキスト・画像生成モデルをトレーニングする。
このフレームワークは、公開APIを通じて高度なモデルと対話して、ベースモデルをトレーニングするためのテキストイメージデータペアを取得する。
我々は,事前学習された大規模視覚言語モデル(VLM)を活用し,基礎モデルの進化を導く。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:03:06 GMT)
EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models [36.6] 我々はEvolveDirectorを導入し、公開リソースを使用した高度なモデルに匹敵するテキスト・画像生成モデルをトレーニングする。
このフレームワークは、公開APIを通じて高度なモデルと対話して、ベースモデルをトレーニングするためのテキストイメージデータペアを取得する。
我々は,事前学習された大規模視覚言語モデル(VLM)を活用し,基礎モデルの進化を導く。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:03:06 GMT)
GenARM: Reward Guided Generation with Autoregressive Reward Model for Test-time Alignment [36.5] GenARMはAutoregressive Reward Modelを活用したテスト時のアライメントアプローチである。
GenARMはテスト時のアライメントベースラインよりも大幅に優れています。
好みのディメンション間のリアルタイムのトレードオフと、さまざまなユーザの好みに対応することをサポートします。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:24 GMT)
Evolutionary Contrastive Distillation for Language Model Alignment [35.9] 進化的コントラスト蒸留(ECD)は高品質な合成嗜好データを生成する新しい方法である。
提案手法は,現在のSOTA 7Bモデルの複雑な命令追従性能を超える7Bモデルを生成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:04:03 GMT)
Localized Adaptive Risk Control [35.9] ローカライズド・アダプティブ・リスク・コントロール(Localized Adaptive Risk Control, L-ARC)は、統計的ローカライズされたリスク保証をターゲットとするオンラインキャリブレーション方式である。
L-ARCは、異なるデータサブポピュレーションにまたがるリスク保証を備えた予測セットを生成する実験によって実証される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:17:42 GMT)
On the Evaluation of Generative Robotic Simulations [35.8] 生成シミュレーションに適した総合評価フレームワークを提案する。
単一タスクの品質では、生成されたタスクのリアリズムと生成されたトラジェクトリの完全性を評価する。
タスクレベルの一般化のために、複数の生成されたタスクで訓練されたポリシーの目に見えないタスクに対してゼロショットの一般化能力を評価する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:49:25 GMT)
Multimodal Clickbait Detection by De-confounding Biases Using Causal Representation Inference [35.8] 本稿では,ウェブ上でのクリックベイト投稿の検出に焦点をあてる。
これらの投稿は、ユーザーが利益のためにクリックすることを誤解させるために、様々なモダリティで目を引く偽情報を使うことが多い。
悪質なクリエーターは、無関係なノンベイトコンテンツを餌のポストに追加するためにトリックを使っており、検知器を騙すために合法的な服装を施している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:29:56 GMT)
Medical Image Registration via Neural Fields [35.8] NIR(Neural Image Registration)と呼ばれる新しいニューラルネットベースの画像登録フレームワークを提案する。
2つの3D MR脳スキャンデータセットの実験により、NIRは登録精度と正規性の両方の観点から最先端のパフォーマンスを得る一方で、従来の最適化ベースの手法よりもはるかに高速に動作していることが示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:11:45 GMT)
Statistically Valid Information Bottleneck via Multiple Hypothesis Testing [35.6] 複数仮説テスト(IB-MHT)による情報ボトルネック(IB)問題に対する統計的に有効な解を提案する。
IB-MHTは、利用可能なデータセットのサイズに関係なく、学習した機能が高い確率でIB制約を満たすことを保証します。
IB-MHTは, 統計的堅牢性と信頼性の観点から, 従来の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:09:17 GMT)
Uncovering Overfitting in Large Language Model Editing [35.6] 編集対象に不均等に高い確率を割り当てる編集オーバーフィット現象を同定し,検討する。
本稿では,新たな知識を振り返って編集されたモデルをガイドするマルチステージ推論制約モジュールを導入する,Learning to Inference (LTI) と呼ばれる新しいプラグイン・アンド・プレイ戦略を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:09:00 GMT)
Universally Optimal Watermarking Schemes for LLMs: from Theory to Practice [35.3] 大きな言語モデル(LLM)は人間の効率を高めるが、誤用リスクを引き起こす。
本稿では,LLMの透かしのための新しい理論的枠組みを提案する。
我々は,検出性能を最大化するために,透かし方式と検出器の両方を共同で最適化する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:46:16 GMT)
Universally Optimal Watermarking Schemes for LLMs: from Theory to Practice [35.3] 大きな言語モデル(LLM)は人間の効率を高めるが、誤用リスクを引き起こす。
本稿では,LLMの透かしのための新しい理論的枠組みを提案する。
我々は,検出性能を最大化するために,透かし方式と検出器の両方を共同で最適化する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:46:16 GMT)
Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study over Open-ended Question Answering [35.2] 我々は、知識グラフ(KG)で強化された大規模言語モデル(LLM)を評価するために特別に設計された新しいベンチマークであるOKGQAを紹介する。
OKGQAは、様々なタイプの質問を使って実践的なアプリケーションの複雑さを深く反映するように設計されており、幻覚の減少と推論能力の強化の両方を測定するために特定のメトリクスを取り入れている。
また,KGのセマンティクスと構造が意図的に乱れ,汚染された場合のモデル性能を評価するためのOKGQA-Pを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:29:21 GMT)
RegionGrasp: A Novel Task for Contact Region Controllable Hand Grasp Generation [35.1] RegionGrasp-CVAEは3Dオブジェクトの可塑性ハンドグリップを生成するために提案されている。
コンディションエンコーダO-Encとプレトレーニング戦略O-Encを用いる。
Hoinetは手動オブジェクトのインタラクション機能をエンコードするために導入された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:52:30 GMT)
Koala-36M: A Large-scale Video Dataset Improving Consistency between Fine-grained Conditions and Video Content [35.0] 時間分割、詳細なキャプション、ビデオ品質フィルタリングは、データセットの品質を決定する3つの重要な要素である。
我々は,正確な時間分割,詳細なキャプション,優れた映像品質を備えた大規模高品質ビデオデータセットであるKoala-36Mを紹介した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:57:49 GMT)
Scalable and Resource-Efficient Second-Order Federated Learning via Over-the-Air Aggregation [34.8] スパースヘッセン推定を用いたスケーラブルな第2次フェデレーション学習アルゴリズムを提案する。
シミュレーションの結果,他の1次および2次ベースラインと比較して67%以上の通信資源と省エネ効果が示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:12:32 GMT)
KV Prediction for Improved Time to First Token [34.7] トランスフォーマーベースの言語モデルによる推論は、プロンプト処理ステップから始まる。
KV予測と呼ばれる新しい手法を導入し、最初の出力に費やした時間を短縮する。
TTFT FLOPs予算の範囲で, 比較的精度が向上したことを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:55:11 GMT)
Dynamic compensation for pump-induced frequency shift in Kerr-cat qubit initialization [34.5] ノイズバイアスのKerr-cat量子ビットは、フォールトトレラント量子計算の魅力的な候補である。
本稿では,PIFSの効果を緩和する動的補償法を提案し,実証する。
安定化Kerr-cat量子ビットを実現し,動的補償法の利点を検証した。
この研究は、Kerr-cat量子ビットのバイアス保存特性を利用するスケーラブル量子プロセッサの道を開いた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:00:53 GMT)
Firzen: Firing Strict Cold-Start Items with Frozen Heterogeneous and Homogeneous Graphs for Recommendation [34.4] 厳密なコールドスタートとウォームスタートのレコメンデーションを解決するために,項目と知識グラフのマルチモーダルコンテンツ(KG)を統合した統合フレームワークを提案する。
我々のモデルでは,厳密なコールドスタート勧告と,ウォームスタートシナリオにおける最先端性能に適合する性能の向上が期待できる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:48:27 GMT)
MAMA: Meta-optimized Angular Margin Contrastive Framework for Video-Language Representation Learning [34.3] MAMAはビデオ言語表現の学習における新たなアプローチである。
MAMAは、ビデオ言語表現を改善し、一般的なビデオ質問応答やテキストビデオ検索データセットにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:10:16 GMT)
HELMET: How to Evaluate Long-Context Language Models Effectively and Thoroughly [34.2] HELMETは7つの多様なアプリケーション中心のカテゴリを包含する総合ベンチマークである。
NIAHのような合成タスクは、下流のパフォーマンスの予測に適していないことが分かりました。
ほとんどのLCLMは完全なNIAHスコアを達成しているが、タスクがフルコンテキスト推論を必要とする場合、オープンソースモデルはクローズドなスコアよりも大幅に遅れている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:31:01 GMT)
Dynamic Mixture of Experts: An Auto-Tuning Approach for Efficient Transformer Models [33.8] 本稿では,トランスフォーマーに基づく基礎モデルのトレーニングと推論の効率を高めるために,DynMoE(Dynamic Mixture of Experts)技術を導入する。
DynMoEには、各トークンがアクティベートする専門家の数を自動的に決定できる新しいゲーティングメソッドが組み込まれている。
本研究は,視覚・言語タスクにおけるGMoEと視覚言語タスクにおけるMoE-LLaVAとの競合性能を比較検討した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:47:04 GMT)
Federated Graph Learning for Cross-Domain Recommendation [33.3] クロスドメインレコメンデーション(CDR)は、ソースドメインとターゲットドメイン間の知識伝達を可能にすることで、データ空間の問題に対する有望な解決策を提供する。
我々は、複数のソースドメインからの肯定的な知識を安全かつ効果的に活用する新しいグラフ学習フレームワークであるFedGCDRを提案する。
我々は、Amazonデータセットの16のポピュラーなドメインに関する広範な実験を行い、FedGCDRが最先端の手法を大幅に上回っていることを実証した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:19:51 GMT)
AI-Press: A Multi-Agent News Generating and Feedback Simulation System Powered by Large Language Models [33.0] 本稿では,マルチエージェントコラボレーションとRetrieval-Augmented Generationに基づく自動ニュース起草・研磨システムであるAI-Pressを紹介する。
人口分布を考慮した公共フィードバックを生成するフィードバックシミュレーションシステムを開発した。
本システムは,ニュース生成能力の大幅な向上を示し,公開フィードバックシミュレーションの有効性を検証した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:58:52 GMT)
Diffusion Actor-Critic with Entropy Regulator [32.8] エントロピーレギュレータ(DACER)を用いたオンラインRLアルゴリズムについて提案する。
このアルゴリズムは拡散モデルの逆過程を新しい政策関数として概念化する。
MuJoCoベンチマークとマルチモーダルタスクの実験は、DACERアルゴリズムが最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:38:46 GMT)
TV-TREES: Multimodal Entailment Trees for Neuro-Symbolic Video Reasoning [32.5] TV-TREESは、最初のマルチモーダル・エンターメント・ツリー・ジェネレータである。
単純なテキストとビデオの証拠と、質問と回答のペアを証明する高レベルな結論の間の関係関係のツリーを検索する。
本手法は,TVQAベンチマークにおいて,全クリップ上での解釈可能な,最先端のゼロショット性能を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:25:14 GMT)
InstructBioMol: Advancing Biomolecule Understanding and Design Following Human Instructions [32.4] InstructBioMolは自然言語と生体分子を橋渡しするように設計されている。
マルチモーダルな生体分子を入力として統合し、研究者が自然言語で設計目標を明確にすることができる。
結合親和性は10%向上し、ESPスコア70.4に達する酵素を設計することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:45:56 GMT)
Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress [32.0] 本稿では,障害検出を補完する2つのカテゴリに分割するランタイム監視フレームワークを提案する。
視覚言語モデル(VLM)を用いて、ポリシーがタスクを解決しないアクションを確実かつ一貫して行うことを検知する。
時間的一貫性検出とVLMランタイム監視を統一することにより、Sentinelは2つの検出器のみを使用する場合よりも18%の障害を検出する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:09:24 GMT)
Benchmarking VLMs' Reasoning About Persuasive Atypical Images [31.9] 視覚言語モデル(VLM)は、様々なタスクにおいて強力なゼロショット一般化を示している。
広告のような修辞的で説得力のあるビジュアルメディアを理解する能力は、まだ検討されていない。
本稿では,VLMによる説得的イメージの非定型性理解のベンチマークを行うための3つの新しいタスクを紹介する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:47:58 GMT)
How Likely Do LLMs with CoT Mimic Human Reasoning? [31.9] CoT(Chain-of-Thought)は,Large Language Models(LLMs)から推論能力を引き出すための,有望なテクニックとして登場した。
本稿では,LLMの推論過程を人間と比較することにより,その基盤となるメカニズムを診断する。
実験により, LLMは因果連鎖から逸脱することが多く, 相関関係や潜在的な整合性誤差が生じることが判明した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:37:10 GMT)
Policy Improvement using Language Feedback Models [31.7] 本稿では, 言語フィードバックモデル (LFM) を導入し, 模擬学習に望ましい行動を特定する。
LFMを訓練するために,言語記述に適応した視覚的軌跡について,Large Language Models (LLMs) からフィードバックを得た。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:23:41 GMT)
Upsample or Upweight? Balanced Training on Heavily Imbalanced Datasets [31.6] ドメイン間のデータの可用性は、しばしば長いテール分布に従う。
この不均衡は、すべてのドメインで一様に言語モデルをトレーニングする際の課題を生じさせる。
トレーニング中の温度サンプリングを減らし,低リソース言語に過度に適合することなく収束を加速する手法であるCooldownを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:16:43 GMT)
Flex-MoE: Modeling Arbitrary Modality Combination via the Flexible Mixture-of-Experts [31.4] 我々は任意のモダリティの組み合わせを柔軟に組み込むように設計された新しいフレームワークFlex-MoEを提案する。
アルツハイマー病領域の4つのモードを含むADNIデータセットとMIMIC-IVデータセットを用いてFlex-MoEを評価する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:37:21 GMT)
Upsample or Upweight? Balanced Training on Heavily Imbalanced Datasets [31.3] 高速言語と低リソース言語の間でデータサイズが著しく異なるマルチリンガル設定に着目する。
トレーニング中のサンプリング温度を低減し,低リソース言語に過度に適合することなく収束を加速する手法であるCooldownを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:16:43 GMT)
Optimizing Vital Sign Monitoring in Resource-Constrained Maternal Care: An RL-Based Restless Bandit Approach [31.2] ワイヤレスのバイタルサインモニタリングデバイスは、継続的監視のための労働効率の高いソリューションを提供する。
本稿では,Restless Multi-Armed Bandit パラダイムの変種としてモデル化することで,この問題に対するアロケーションアルゴリズムを考案する。
シミュレーションでは、我々の手法が最高のベースラインを最大4ドルまで上回ります。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:20:07 GMT)
Exploring and Lifting the Robustness of LLM-powered Automated Program Repair with Metamorphic Testing [31.2] 大規模言語モデルを用いた自動プログラム修復(LAPR)技術は、最先端のバグ修正性能を達成した。
実際に展開する前に、LAPR技術で堅牢性テストを実施することが不可欠である。
LAPR技術専用のメタモルフィックテスティングフレームワークであるMT-LAPRを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:14:58 GMT)
Agent S: An Open Agentic Framework that Uses Computers Like a Human [31.2] 我々は、GUI(Graphical User Interface)を通じてコンピュータとの自律的なインタラクションを可能にするオープンエージェントフレームワークであるAgent Sを提案する。
Agent Sは、ドメイン固有の知識の取得、長いタスクの水平線の計画、動的で一様でないインターフェイスの処理という、コンピュータタスクの自動化における3つの重要な課題に対処することを目指している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:43:51 GMT)
HELMET: How to Evaluate Long-Context Language Models Effectively and Thoroughly [31.0] HELMETは7つの多様なアプリケーション中心のカテゴリを包含する総合ベンチマークである。
NIAHのような合成タスクは、下流のパフォーマンスの予測に適していないことが分かりました。
ほとんどのLCLMは完全なNIAHスコアを達成しているが、タスクがフルコンテキスト推論を必要とする場合、オープンソースモデルはクローズドなスコアよりも大幅に遅れている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:31:01 GMT)
Open-Source Periorbital Segmentation Dataset for Ophthalmic Applications [30.6] 深層学習を用いた眼窩周囲のセグメンテーションと距離予測は、疾患状態の客観的定量化を可能にする。
現在、深層学習モデルのトレーニングを目的としたセグメンテーションデータセットの報告は、目の周りの領域でサブミリの精度で行われていない。
本稿では,このデータセットをイントラグレータ内信頼性試験およびイントラグレータ間信頼性試験により検証し,軌道周辺セグメンテーションネットワークのトレーニングにおけるデータの有用性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:47:24 GMT)
Exploring the Compositional Deficiency of Large Language Models in Mathematical Reasoning [30.4] 数学的推論における大規模言語モデル(LLM)の構成性について検討する。
論理的欠陥の問題は実世界では非常に稀であるため、これらはLLMの「見えない」ケースを表している。
実験の結果, LLM には必要知識の双方の構成要素があるが, これらの新規事例を扱うために, テキストbfspontanely に組み合わせることはできないことがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:38:37 GMT)
RGM: Reconstructing High-fidelity 3D Car Assets with Relightable 3D-GS Generative Model from a Single Image [30.0] 高品質な3Dカーアセットは、ビデオゲーム、自動運転、バーチャルリアリティーなど、さまざまなアプリケーションに欠かせない。
3Dオブジェクトの表現としてNeRFや3D-GSを利用する現在の3D生成法は、固定照明下でランベルティアンオブジェクトを生成する。
単一入力画像から3Dカー資産を自動生成する新しい3Dオブジェクト生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:54:03 GMT)
AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning [30.0] 本稿では,農業領域における視覚のみのデータを活用した指導調整データの構築手法を提案する。
我々は、複数のドメインにまたがる多様な農業データセットを利用し、クラス固有の情報をキュレートし、大規模言語モデル(LLM)を用いてエキスパートチューニングセットを構築する。
AgroGPTは、複雑な農業関連の会話を処理し、有用な洞察を提供する効率的なLMMである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:38:26 GMT)
MUSES: 3D-Controllable Image Generation via Multi-Modal Agent Collaboration [29.7] ユーザクエリから3次元制御可能な画像生成のための汎用AIシステムであるMUSESを導入する。
このマルチモーダルエージェントパイプラインは、人間のプロのコラボレーションを模倣することにより、3D制御可能なオブジェクトによる画像の効果的かつ自動生成を容易にする。
我々はT2I-3DisBench(3D画像シーン)の新しいベンチマークを構築し、50の詳細なプロンプトを持つ多様な3D画像シーンを記述した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:02:10 GMT)
MUSES: 3D-Controllable Image Generation via Multi-Modal Agent Collaboration [29.7] ユーザクエリから3次元制御可能な画像生成のための汎用AIシステムであるMUSESを導入する。
このマルチモーダルエージェントパイプラインは、人間のプロのコラボレーションを模倣することにより、3D制御可能なオブジェクトによる画像の効果的かつ自動生成を容易にする。
コードとモデルも間もなくリリースされる予定です。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:02:10 GMT)
Large Language Models as Code Executors: An Exploratory Study [29.5] 本稿では,Large Language Models (LLM) をコードエグゼキュータとして探索する。
OpenAIのo1、GPT-4o、GPT-3.5、DeepSeek、Qwen-Coderなど、さまざまなLLMでこの実現可能性を調べています。
我々は,コードスニペットを行単位で処理し,弱いモデルの精度を平均7.22%向上させるIIP(Iterative Instruction Prompting)技術を導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:12:44 GMT)
Large Language Models as Code Executors: An Exploratory Study [29.5] 本稿では,Large Language Models (LLM) をコードエグゼキュータとして探索する。
OpenAIのo1、GPT-4o、GPT-3.5、DeepSeek、Qwen-Coderなど、さまざまなLLMでこの実現可能性を調べています。
我々は,コードスニペットを行単位で処理し,弱いモデルの精度を平均7.22%向上させるIIP(Iterative Instruction Prompting)技術を導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:12:44 GMT)
BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching [29.5] ボルツマン分布からサンプリングしたデータの代わりにエネルギー関数を与えられたニューラルサンプリングを学習する。
本稿では, 拡散型サンプリング装置であるノイズエネルギーマッチングを提案し, 理論的には分散度を低くし, 複雑さを増す。
実験の結果,BNEMはより堅牢でありながら最先端の性能を達成できることが示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:09:44 GMT)
Accurate and Regret-aware Numerical Problem Solver for Tabular Question Answering [29.4] 本研究では,大規模言語モデルを用いたTabLaPというモデルを提案する。
TabLaPは最先端のモデルよりもかなり正確であることを示し、2つのデータセットで解の精度を5.7%と5.8%改善した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:34:00 GMT)
SqueezeAttention: 2D Management of KV-Cache in LLM Inference via Layer-wise Optimal Budget [29.2] LLM(Large Language Model)のキーバリューキャッシュを最適化することは、推論コストの削減に不可欠であると考えられている。
既存のKV-cache圧縮アルゴリズムのほとんどは全ての層を等しく扱い、各層に同じKV予算を割り当てている。
注意層の重要性を同定することにより、KV-cacheを2次元から共同で最適化できることが判明した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:11:52 GMT)
Sparse Repellency for Shielded Generation in Text-to-image Diffusion Models [29.1] 本稿では,事前学習した拡散モデルのサンプル軌跡を,参照集合外に落下する画像上に着陸させる手法を提案する。
生成軌道全体にわたって拡散SDEに反発項を追加することでこれを実現できる。
一般的な拡散モデルにSPELLを追加することで、FIDにわずかに影響を与えながら多様性が向上し、最近のトレーニングフリーの多様性手法よりも比較的優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:16 GMT)
Sparse Repellency for Shielded Generation in Text-to-image Diffusion Models [29.1] 本稿では,事前学習した拡散モデルのサンプル軌跡を,参照集合外に落下する画像上に着陸させる手法を提案する。
生成軌道全体にわたって拡散SDEに反発項を追加することでこれを実現できる。
一般的な拡散モデルにSPELLを追加することで、FIDにわずかに影響を与えながら多様性が向上し、最近のトレーニングフリーの多様性手法よりも比較的優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:16 GMT)
3D Vision-Language Gaussian Splatting [29.0] マルチモーダルな3Dシーン理解は、ロボット工学、自律運転、バーチャル/拡張現実において重要な応用である。
本稿では,視覚的・意味的な相違点を適切に扱えるソリューションを提案する。
また、既存のビュー間のセマンティック一貫性を改善するために、カメラビューブレンディング技術を採用している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:28:29 GMT)
Emerging Pixel Grounding in Large Multimodal Models Without Grounding Supervision [29.0] 現在の大規模マルチモーダルモデル(LMM)は、言語コンポーネントと視覚的エンティティを関連付ける必要があるため、基盤化の課題に直面している。
グラウンド化能力は、明示的なグラウンド化の監督なしに訓練されたLMMに現われることが判明した。
拡散型ビジュアルエンコーダを用いたLMMであるDIFFLMMを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:55 GMT)
$\textbf{PLUM}$: Improving Code LMs with Execution-Guided On-Policy Preference Learning Driven By Synthetic Test Cases [28.8] 刑法上の$textbfP$reference $textbfL$earning framework A$textbfu$gmented with test case for code L$textbfM$ s。
PLUMは報酬モデルをトレーニングする必要性を緩和し、大規模なオンラインとオンラインの嗜好データ照合を可能にする。
PLUMの利点は、SFTで十分に訓練されていなくても、様々な広く使われているコードLM間で一貫性があることを示します。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:52:15 GMT)
How to Teach Programming in the AI Era? Using LLMs as a Teachable Agent for Debugging [28.3] 大規模言語モデル(LLM)は、生成スキルに優れ、実行不可能な速度でコンテンツを作成することができる。
人間の初心者は、教師アシスタントの役割を担い、LLMで教えられるエージェントのコードを支援する。
そこで我々は,人間の初心者が指導アシスタントの役割を担い,LLMを利用した学習エージェントのコード作成を支援する,デバッグの意図的な実践を促進する新しいシステムであるPhyを紹介した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:29:59 GMT)
TDDSR: Single-Step Diffusion with Two Discriminators for Super Resolution [28.2] 本稿では,効率的な単一ステップ拡散に基づく超解像法であるTDDSRを提案する。
本手法は,教師の事前学習モデルから抽出し,拡散ネットワークに基づいて,単一ステップで超解像を行う。
実世界および顔固有のSRタスク間で有効性を示す実験結果が得られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:12:46 GMT)
Divide and Translate: Compositional First-Order Logic Translation and Verification for Complex Logical Reasoning [28.1] 複雑な論理的推論タスクは、長い推論を必要とするが、それは、チェーン・オブ・シークレットのプロンプトを持つ大きな言語モデル(LLM)が依然として不足している。
本稿では,翻訳中に自然言語に隠された論理的意味を抽出する合成一階論理翻訳を提案する。
提案手法は,CLOVERと呼ばれる7つの論理的推論ベンチマークを用いて評価し,従来のニューロシンボリックアプローチよりも優れていたことを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:42:39 GMT)
Negative Preference Optimization: From Catastrophic Collapse to Effective Unlearning [28.1] LLM(Large Language Models)は、事前トレーニング中に機密性のある、プライベートな、あるいは著作権のあるデータを持つことが多い。
LLMは、事前学習されたモデルから望ましくないデータの影響を取り除くことを目的としている。
我々は、ターゲットデータセットを効率的に解放できる単純なアライメントにインスパイアされた方法として、NPO(Negative Preference Optimization)を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:00:41 GMT)
Prompt-Agnostic Adversarial Perturbation for Customized Diffusion Models [27.8] 本稿では,カスタマイズした拡散モデルのためのPAP(Prompt-Agnostic Adversarial Perturbation)手法を提案する。
PAPはまず、ラプラス近似を用いてプロンプト分布をモデル化し、その後、外乱期待を最大化することで、急激な摂動を発生させる。
このアプローチは、即時無敵攻撃に効果的に取り組み、防御安定性を向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:33:12 GMT)
Prompt-Agnostic Adversarial Perturbation for Customized Diffusion Models [27.8] 本稿では,カスタマイズした拡散モデルのためのPAP(Prompt-Agnostic Adversarial Perturbation)手法を提案する。
PAPはまず、ラプラス近似を用いてプロンプト分布をモデル化し、その後、外乱期待を最大化することで、急激な摂動を発生させる。
このアプローチは、即時無敵攻撃に効果的に取り組み、防御安定性を向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:33:12 GMT)
Two Effects, One Trigger: On the Modality Gap, Object Bias, and Information Imbalance in Contrastive Vision-Language Models [27.6] コントラスト視覚言語モデル(VLM)は、様々な下流タスクに適用可能であることで人気を集めている。
ゼロショットオブジェクト認識のようないくつかのタスクで成功しているにもかかわらず、属性認識のような他のタスクでは驚くほど貧弱である。
これまでの研究では、これらの課題は、モダリティギャップ、共有表現空間における画像とテキストの分離、属性などの他の要因に対するオブジェクトに対するバイアスなどによるものだった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:49 GMT)
Upcycling Large Language Models into Mixture of Experts [27.5] 厳密な言語モデルをスパース・ミックス・オブ・エキスパート(MoE)モデルにリサイクルすることは、既に訓練されたモデルのモデル容量を増やすための効率的なアプローチである。
より高密度モデルトレーニングを継続して実施した。
また、ソフトマックス-then-topKエキスパートルーティングは、トップK-then-softmaxアプローチよりも改善されていることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:36:03 GMT)
How Does Vision-Language Adaptation Impact the Safety of Vision Language Models? [27.5] 大規模言語モデル(LLM)を大規模視覚言語モデル(LVLM)に変換する視覚言語適応(VL適応)
安全性対策の弱さによる潜在的有害性にもかかわらず、VL適応の安全性への影響に関する詳細な分析は未調査のままである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:12:03 GMT)
Benign Overfitting in Single-Head Attention [27.3] 本研究では,トランスフォーマーの基本構造である単一頭部ソフトマックスアテンションモデルにおける良性オーバーフィッティングについて検討する。
適切な条件下では、勾配降下の2段階の後に既に分類された設定において、モデルが良性過剰適合を示すことが証明される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:23:33 GMT)
RISE-SDF: a Relightable Information-Shared Signed Distance Field for Glossy Object Inverse Rendering [27.0] 本稿では,新しいエンド・ツー・エンド・エンド・リライトブル・ニューラル・リバース・レンダリングシステムを提案する。
本アルゴリズムは,逆レンダリングとリライトにおける最先端性能を実現する。
実験により, 逆レンダリングおよびリライティングにおける最先端性能が得られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:05:42 GMT)
RISE-SDF: a Relightable Information-Shared Signed Distance Field for Glossy Object Inverse Rendering [27.0] そこで我々は,幾何学と材料特性の高品質な再構成を実現する,新しいエンドツーエンドのリライタブル・ニューラル・リバースレンダリングシステムを提案する。
提案アルゴリズムは, 逆レンダリングおよびリライティングにおける最先端性能を実現し, 特に高反射率物体の再構成に強い結果が得られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:05:42 GMT)
Hammer: Robust Function-Calling for On-Device Language Models via Function Masking [26.5] Hammerはデバイス上での関数呼び出し用に特別に設計されたファンデーションモデルの新しいファミリーである。
我々の経験的評価は、ハマーがより大きなモデルを上回るだけでなく、様々なベンチマークで堅牢な一般化を示すことを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:29:52 GMT)
Hammer: Robust Function-Calling for On-Device Language Models via Function Masking [26.5] Hammerはデバイス上での関数呼び出し用に特別に設計されたファンデーションモデルの新しいファミリーである。
我々の経験的評価は、ハマーがより大きなモデルを上回るだけでなく、様々なベンチマークで堅牢な一般化を示すことを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:29:52 GMT)
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning [26.4] 複合・効率的なプロンプトチューニングのための適応型コードブック(ACCEPT)を提案する。
本手法では,すべてのソフトプロンプトが,学習可能なコードブックベクトルの集合を各部分空間で共有できる,製品量子化(PQ)の概念について述べる。
言語モデルのパラメータのわずか0.3%をチューニングすることで、17の多様な自然言語タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:48:53 GMT)
Leveraging a Cognitive Model to Measure Subjective Similarity of Human and GPT-4 Written Content [26.4] GPT-4のような大規模言語モデル(LLM)によって形成されたトークン埋め込みを用いて、2つの文書間のコサイン類似性を計算することができる。
この類似度尺度は、個人のバイアスと制約を、意思決定の認知メカニズムに根ざした方法で考慮するという点で有益である。
このデータセットは、認知モデルを利用して、教育環境での人間の被験者の主観的類似度を測定する利点を示すために使用される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:51:43 GMT)
DiaHalu: A Dialogue-level Hallucination Evaluation Benchmark for Large Language Models [26.3] 本稿では,対話レベルの幻覚評価ベンチマークDiaHaluを提案する。
収集したトピックをシステムプロンプトに統合し、2つのChatGPT3.5間の対話を促進する。
人間の言語規則に従わない内容を手動で修正し、LLMを再生させ、人間と機械の相互作用のシナリオをシミュレートする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:27:54 GMT)
AutoRD: An Automatic and End-to-End System for Rare Disease Knowledge Graph Construction Based on Ontologies-enhanced Large Language Models [26.0] 希少な病気は世界中で数百万人に影響を与えるが、その頻度が低いため研究の焦点が限られていることが多い。
近年のLarge Language Models (LLMs) の進歩は, 医療情報の抽出を自動化することを約束している。
本稿では,まれな疾患に関する医療用テキストから情報を自動的に抽出するAutoRDというエンドツーエンドシステムを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:24:01 GMT)
Diffusion Model Compression for Image-to-Image Translation [25.5] 拡散型I2Iモデルに適した新しい圧縮手法を提案する。
I2Iモデルの画像条件が既に画像構造に関する豊富な情報を提供するという観測に基づいて、モデルサイズと遅延を低減するための驚くほど単純で効果的なアプローチを開発する。
提案手法は, モデルフットプリントの39.2%, 56.4%, 39.2%, 81.4%, 68.7%, および31.1%の遅延をそれぞれInstructPix2Pix, StableSR, ControlNetに減少させることで, 良好な出力品質を実現する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:45:05 GMT)
Copiloting Diagnosis of Autism in Real Clinical Scenarios via LLMs [25.4] 我々はADOS-Copilotというフレームワークを提案し、スコアと説明のバランスをとる。
以上の結果から,本フレームワークは臨床医の診断と競合する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:24:14 GMT)
Copiloting Diagnosis of Autism in Real Clinical Scenarios via LLMs [25.4] 我々はADOS-Copilotというフレームワークを提案し、スコアと説明のバランスをとる。
以上の結果から,本フレームワークは臨床医の診断と競合する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:24:14 GMT)
Smart Audit System Empowered by LLM [25.3] 大規模言語モデル(LLM)を利用したスマート監査システムを提案する。
提案手法では,監査手順を効率化する動的リスクアセスメントモデル,データ処理,検索,評価を強化する製造コンプライアンスコミッション,リアルタイムにカスタマイズされた分析を提供するRe-actフレームワークの共通性分析エージェントの3つの革新を紹介した。
これらの改善により、監査効率と効率が向上し、テストシナリオでは24%以上の改善が示されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:36:15 GMT)
An Efficient Recipe for Long Context Extension via Middle-Focused Positional Encoding [25.2] 本稿では,事前学習された大規模言語モデル(LLM)の文脈長を拡張する手法を提案する。
$textttCREAM$ 位置インデックスを操作することで位置エンコーディングを補間する。
実験によると、$textttCREAM$ は "Never Miss A Beat" 付き $texttLlama2-7B$ の Base 版と Chat 版の両方で LLM をターゲット長まで拡張することができた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:46:14 GMT)
Careful About What App Promotion Ads Recommend! Detecting and Explaining Malware Promotion via App Promotion Graph [25.2] Androidアプリでは、開発者はアプリプロモーション広告、すなわち他のアプリを宣伝する広告を頻繁に配置する。
広告コンテンツの検証が不十分なため、悪意のある開発者は、マルウェアの配布チャネルとしてアプリのプロモーション広告を利用することができる。
本稿では,アプリユーザインタフェース探索とグラフ学習を統合して,アプリプロモーション広告を自動的に収集し,これらの広告によって宣伝されたマルウェアを検出し,検出されたマルウェアが採用するプロモーションメカニズムを説明する,ADGPEという新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:39:13 GMT)
Interpreting Low-level Vision Models with Causal Effect Maps [25.1] 低レベル視覚モデルを理解するために因果理論を導入する。
因果効果マップ(CEM)と呼ばれるモデル/タスク非依存の手法を提案する。
CEMは、正か負かのいずれかの効果で入力と出力の関係を可視化し、定量化する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:56:53 GMT)
Physics and Deep Learning in Computational Wave Imaging [25.0] 計算波イメージング(CWI)は、物質体積の隠れ構造と物理的性質を抽出する。
CWI問題を解くための現在のアプローチは、伝統的な物理学に根ざしたものと、ディープラーニングに基づくものに分けられる。
機械学習ベースの計算手法が登場し、これらの課題に対処するための異なる視点を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:32:17 GMT)
Progressive Autoregressive Video Diffusion Models [25.0] アーキテクチャを変更することなく、既存のモデルを自動回帰ビデオ拡散モデルに自然に拡張できることを示す。
1分間(24FPSで1440フレーム)の長ビデオ生成の最先端結果を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:36:15 GMT)
AppBench: Planning of Multiple APIs from Various APPs for Complex User Instruction [24.7] 大きな言語モデル(LLM)は、多用途外部APIと接続することで、現実世界と対話することができる。
textttAppBench は LLM が様々なソースから複数の API を計画・実行できる能力を評価する最初のベンチマークである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:03:13 GMT)
AdaShadow: Responsive Test-time Model Adaptation in Non-stationary Mobile Environments [24.6] 本稿では,非定常移動データ配信と資源動態のための応答性テスト時間適応フレームワークであるAdaShadowを提案する。
AdaShadowは、レイヤの重要度とレイテンシを推定する上での課題と、最適なレイヤ更新計画のスケジューリングに対処する。
その結果,AdaShadowは連続的なシフトの下で最高の精度-遅延バランスを達成することがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:41:39 GMT)
System-Level Defense against Indirect Prompt Injection Attacks: An Information Flow Control Perspective [24.6] LLMシステム(Large Language Model-based System)は、情報処理およびクエリ処理システムである。
本稿では,情報フロー制御の原理に基づくシステムレベルの防衛システムについて述べる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:29:07 GMT)
System-Level Defense against Indirect Prompt Injection Attacks: An Information Flow Control Perspective [24.6] LLMシステム(Large Language Model-based System)は、情報処理およびクエリ処理システムである。
本稿では,情報フロー制御の原理に基づくシステムレベルの防衛システムについて述べる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:29:07 GMT)
On Barycenter Computation: Semi-Unbalanced Optimal Transport-based Method on Gaussians [24.5] 本研究では,実測地線勾配Descent とHybrid Gradient Descent と名づけられたBures-Wasserstein多様体上のアルゴリズムを開発した。
両手法の理論的収束保証を確立し、エクサクソン測地勾配Descentアルゴリズムが非次元収束率を得ることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:01:57 GMT)
Few shot chain-of-thought driven reasoning to prompt LLMs for open ended medical question answering [24.4] 我々はMedQA-USMLEデータセットの修正版であるMedQA-OPENを提案する。
臨床シナリオを模倣する選択肢のないオープンエンドの医療質問と、臨床者が承認した理性的な回答を含んでいる。
思考の連鎖(CoT)推論(CLINICR)によって駆動されるプロンプトを実装し,漸進的推論の過程を反映する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:04:32 GMT)
A Lightweight Target-Driven Network of Stereo Matching for Inland Waterways [24.4] LTNetは軽量なターゲット駆動型ステレオマッチングニューラルネットワークである。
2つのデータセットの実験では、LTNetはわずか3.7Mのパラメータで競合する結果が得られる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:40:30 GMT)
Features are fate: a theory of transfer learning in high-dimensional regression [23.8] 対象タスクが事前学習されたモデルの特徴空間で適切に表現されている場合、転送学習はスクラッチからトレーニングに優れることを示す。
本モデルでは, 音源と目標タスクの重なり合う特徴空間が十分に強い場合, 線形転送と微調整の両方で性能が向上することを確認した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:26 GMT)
Offline Hierarchical Reinforcement Learning via Inverse Optimization [23.7] OHIOは、階層的ポリシーのオフライン強化学習のためのフレームワークである。
エンド・ツー・エンドのRL法を大幅に上回り、ロバスト性を向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:00:21 GMT)
RDT-1B: a Diffusion Foundation Model for Bimanual Manipulation [23.6] 本稿では,ロボット拡散変換器(RDT)について述べる。
RDTは、マルチモーダリティを効果的に表現するために拡散モデルを構築し、スケーラブルトランスフォーマーの革新的な設計である。
さらに,様々なロボットの動作表現を統一する物理解釈可能な統一行動空間を導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:33:46 GMT)
Task-oriented Time Series Imputation Evaluation via Generalized Representers [23.5] 時系列分析は電力エネルギー、経済、輸送など多くの分野で広く利用されている。
本稿では,効率的なダウンストリームタスク指向時系列計算評価手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:16:14 GMT)
Task-oriented Time Series Imputation Evaluation via Generalized Representers [23.5] 時系列分析は電力エネルギー、経済、輸送など多くの分野で広く利用されている。
本稿では,効率的なダウンストリームタスク指向時系列計算評価手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:16:14 GMT)
Dynamics of Concept Learning and Compositional Generalization [23.4] 本稿では,モデルが学習し,構造的に整理されたセントロイドとガウス混合体上でのアイデンティティマッピングを学習するSIMタスクを提案する。
我々は、このSIMタスクでトレーニングされたニューラルネットワークの学習力学を数学的に解析し、その単純さにもかかわらず、SIMの学習力学が重要な経験的観察を捉え、説明するのに役立っていることを示す。
私たちの理論はまた、トレーニングの初期段階におけるテスト損失の非単調学習ダイナミクスの新しいメカニズムを見つけるなど、いくつかの新しい洞察を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:58:29 GMT)
Imitation Learning with Limited Actions via Diffusion Planners and Deep Koopman Controllers [23.3] 本稿では,逆ダイナミクスコントローラのアクションデータ効率向上を目的としたプランテイン制御フレームワークを提案する。
具体的には、Deep Koopman Operatorフレームワークを用いて力学系をモデル化し、観測のみの軌跡を用いて潜在動作表現を学習する。
この潜在表現は、線形アクションデコーダを用いて実高次元連続的なアクションに効果的にマッピングすることができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:33:57 GMT)
Prototype-based Optimal Transport for Out-of-Distribution Detection [23.2] 本稿では,テスト入力とIDプロトタイプの分布差を計測する新しい手法を提案する。
結果として生じる輸送コストは、総合的な不一致に対する各テストインプットの個々の貢献を定量化するために使用される。
トランスポートコストとIDプロトタイプと仮想外れ値のコストを組み合わせることで,IDデータ近傍のOODデータの検出が重要となる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:11:06 GMT)
VFIMamba: Video Frame Interpolation with State Space Models [22.9] フレーム間モデリングはビデオフレーム(VFI)の中間フレーム生成において重要である
S6(Selective State Space Models)が登場し、ロングシーケンスモデリングに特化している。
本稿では,S6モデルを用いたフレーム間モデリングのための新しいフレーム手法であるVFIMambaを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:15:55 GMT)
miniCodeProps: a Minimal Benchmark for Proving Code Properties [22.5] 私たちはLeanの証明アシスタントで201のプログラム仕様のベンチマークであるminiCodePropsを紹介します。
その単純さにもかかわらず、MiniCodePropsは現在のLLMベースのプローバーを壊すのに十分である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:13:19 GMT)
Differentiability in Unrolled Training of Neural Physics Simulators on Transient Dynamics [22.4] 時間の経過とともにトレーニングトラジェクトリをアンロールすることは、ニューラルネットワーク強化された物理シミュレータの推論精度に影響を与える。
本稿では,物理システム,ネットワークサイズとアーキテクチャ,トレーニングセットアップ,テストシナリオについて検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:27:52 GMT)
Attention as a Hypernetwork [22.1] トランスフォーマーは、トレーニング中に構成部品に遭遇した可能性があるが、構成が存在しない新しい問題インスタンスに一般化することができる。
マルチヘッドアテンションをハイパーネットワークとして再構成することにより、構成可能な低次元ラテント符号がキークエリ固有の操作を規定していることを明らかにする。
この潜在コードは、ネットワークが目に見えないタスク構成で実行するサブタスクの予測であることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:15:10 GMT)
Invisibility Cloak: Disappearance under Human Pose Estimation via Backdoor Attacks [22.0] HPE(Human Pose Estimation)は、自動運転車などの自律システムに広く応用されている。
ラベルの異なるIntCフレームワークに基づく3つの特定のバックドア攻撃を提案する。
IntC法の有効性と一般化性を示す実験を行った。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:29:29 GMT)
Fuse to Forget: Bias Reduction and Selective Memorization through Model Fusion [21.9] モデル融合が不要な知識の削減に有効かどうかを考察する。
本稿では,3つのシナリオにおけるモデル融合の効果について検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:13:20 GMT)
A Gentle Introduction and Tutorial on Deep Generative Models in Transportation Research [21.7] 近年、DGM(Deep Generative Models)は急速に進歩し、様々な分野において重要なツールとなっている。
本稿では,DGMの総合的な紹介とチュートリアルについて紹介する。
これは生成モデルの概要から始まり、続いて基本モデルの詳細な説明、文献の体系的なレビュー、実装を支援するための実践的なチュートリアルコードなどが続く。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:47:04 GMT)
A Gentle Introduction and Tutorial on Deep Generative Models in Transportation Research [21.7] 近年、DGM(Deep Generative Models)は急速に進歩し、様々な分野において重要なツールとなっている。
本稿では,DGMの総合的な紹介とチュートリアルについて紹介する。
これは生成モデルの概要から始まり、続いて基本モデルの詳細な説明、文献の体系的なレビュー、実装を支援するための実践的なチュートリアルコードなどが続く。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:47:04 GMT)
An Item is Worth a Prompt: Versatile Image Editing with Disentangled Control [21.6] D-Editは、包括的な画像-プロンプトインタラクションをいくつかのアイテム-プロンプトインタラクションに切り離すためのフレームワークである。
クロスアテンション層が歪んだ事前学習拡散モデルに基づいており、アイテム・プロンプト・アソシエーションを構築するために2段階の最適化を採用している。
画像ベース,テキストベース,マスクベースの編集,アイテム削除を含む4種類の編集作業において,最先端の結果を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:42:18 GMT)
StablePrompt: Automatic Prompt Tuning using Reinforcement Learning for Large Language Models [21.6] 強化学習(Reinforcement Learning, RL)は, 即時チューニングに広く用いられているが, その固有の不安定性と環境依存性は, 実際にの使用を困難にしている。
トレーニング安定性と探索空間のバランスを保ち、RLの不安定性を軽減し、高性能なプロンプトを生成するStablePromptを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:35:51 GMT)
No Free Lunch: Retrieval-Augmented Generation Undermines Fairness in LLMs, Even for Vigilant Users [21.3] Retrieval-Augmented Generation (RAG) はその有効性とコスト効率に広く採用されている。
本研究では,フェアネスのユーザ認識の観点から,現実的な3段階の脅威モデルを提案する。
我々は,RAGの公正性について,検閲されていない,部分的に検閲された,完全に検閲されたデータセットを用いて検討した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:51:58 GMT)
Mind Your Questions! Towards Backdoor Attacks on Text-to-Visualization Models [21.2] VisPoisonは、これらのテキスト・ツー・ビジュアライゼーションモデルの脆弱性を体系的に識別するように設計されたフレームワークである。
我々は、VisPoisonが90%以上の攻撃成功率を達成したことを示し、現在のテキスト・ツー・ビジターモデルのセキュリティ問題を強調した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:32:52 GMT)
Mind Your Questions Towards Backdoor Attacks on Text-to-Visualization Models [21.2] VisPoisonは、これらのテキスト・ツー・ビジュアライゼーションモデルの脆弱性を体系的に識別するように設計されたフレームワークである。
我々は、VisPoisonが90%以上の攻撃成功率を達成したことを示し、現在のテキスト・ツー・ビジターモデルのセキュリティ問題を強調した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:32:52 GMT)
Semi-Supervised Video Desnowing Network via Temporal Decoupling Experts and Distribution-Driven Contrastive Regularization [21.2] 積雪除去のためのラベルのない実データを含む半教師付き精神におけるビデオ記述のための新しいパラダイムを提案する。
具体的には,85本の雪上ビデオを用いた実世界のデータセットを構築し,新しい配電型コントラスト正規化を備えたセミ教師付きビデオ認識ネットワーク(SemiVDN)を提案する。
厳密な対照的な正規化は、合成データと実データの間の分配ギャップを緩和し、したがって所望の積雪不変背景の詳細を維持する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:31:42 GMT)
Enhancing Zeroth-order Fine-tuning for Language Models with Low-rank Structures [21.2] ゼロ階数(ZO)アルゴリズムは、関数値の有限差を用いて勾配を近似することで、有望な代替手段を提供する。
既存のZO法は、LLM微調整で一般的な低ランク勾配構造を捉えるのに苦労し、準最適性能をもたらす。
本稿では,LLMにおけるこの構造を効果的に捕捉する低ランクZOアルゴリズム(LOZO)を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:10:53 GMT)
Protecting Your LLMs with Information Bottleneck [20.9] 本稿では,情報ボトルネック原理に基づく防御機構であるIBProtector(Information Bottleneck Protector)を紹介する。
IBProtectorは、軽量で訓練可能な抽出器によって促進されるプロンプトを選択的に圧縮し、摂動する。
IBProtectorはジェイルブレイク対策において,現在の防御方法よりも優れていた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:22:58 GMT)
Time Can Invalidate Algorithmic Recourse [20.8] 因果関係のレンズを通して問題を提示することにより、時間とともにアルゴリズム的言論の頑健さを考察する。
本稿では,時間に比例した時間的ARのための簡易かつ効果的なアルゴリズムを提案する。
合成および現実的なデータセットに関するシミュレーションでは、時間を考慮した場合、データ分布の潜在的なトレンドに対するよりレジリエントな解決方法が示される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:02:38 GMT)
Active Scout: Multi-Target Tracking Using Neural Radiance Fields in Dense Urban Environments [20.8] 都市におけるニューラルレージアンス・フィールド(NeRF)の表現は,RGBと異なる接点からの深度画像を用いて構築できることが示される。
この表現は、都市の未知の部分を探索し、ターゲットを追跡するための情報ゲインを計算するために使用される。
我々は、フィラデルフィアとニューヨーク市のオープンストリートマップデータを使ってカスタム構築されたシミュレーターを用いて、300ステップ以内に20の静止目標を探索、発見できることを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:33:59 GMT)
Controlling Large Language Model Agents with Entropic Activation Steering [20.6] In-context Learning Agent のためのアクティベーションステアリングである Entropic Activation Steering (EAST) を導入する。
EAST は LLM の出力から解析された高レベルな動作に直接影響を与えることにより LLM エージェントの探索を効果的に操作できることを示す。
また, この制御を適用することで, LLMの思考に現れる不確実性を調節し, エージェントをより探索的な行動へと導くことも明らかにした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:47:12 GMT)
DemoShapley: Valuation of Demonstrations for In-Context Learning [20.3] インコンテキスト学習(ICL)を利用した大規模言語モデル(LLM)は、タスク固有の微調整を必要とせずに、様々なタスク間で数ショットの学習を行う新しいベンチマークを設定した。
我々は、Data Shapleyの評価定理にインスパイアされたDemoShapleyを紹介する。
この結果から,DemoShapleyは精度と公平性の観点からモデル性能を向上するだけでなく,コンテキスト内デモとは異なる領域からのクエリを一般化することがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:35:03 GMT)
In Search of Forgotten Domain Generalization [20.3] Out-of-Domain (OOD) 一般化は、1つ以上のドメインでトレーニングされたモデルが見えないドメインに一般化する能力である。
コンピュータビジョンのImageNet時代において、モデルのOOD性能を測定するための評価セットは、スタイルに関して厳密にOODであるように設計されていた。
基礎モデルや拡張Webスケールデータセットの出現は、この評価プロセスを邪魔している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:50:45 GMT)
Breaking the curse of dimensionality in structured density estimation [20.1] マルコフの性質の下で、次元の呪いが避けられるか、あるいは大幅に緩和されるかを示す。
驚くべきことに、この問題のサンプルの複雑さは、度数などの局所グラフパラメータとスケールすると予想されるかもしれないが、そうではないことが判明した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:48:40 GMT)
The Impact of Generative Artificial Intelligence on Market Equilibrium: Evidence from a Natural Experiment [20.0] 生成人工知能(AI)は、人間の出力に似た創造的なコンテンツをより効率よく、コストを削減できる能力を示す。
本稿では,中国の主要なアートアウトソーシングプラットフォームにおいて,生成AIが市場均衡に与える影響を実証的に検討する。
我々の分析によると、生成AIの出現は平均価格を64%引き下げる結果となったが、同時に注文量が121%増加し、全体の売上が56%増加した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:19:55 GMT)
IceDiff: High Resolution and High-Quality Sea Ice Forecasting with Generative Diffusion Prior [19.7] より微細なスケールで海氷濃度を予測するための2段階の深層学習フレームワークIceDiffを提案する。
アイスディフは6.25km×6.25kmの解像度で海氷の予測を初めて示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:53:41 GMT)
Large Language Models for Orchestrating Bimanual Robots [19.6] 本稿では,Language-based Bimanual Orchestration (LABOR)を提案する。
NICOLヒューマノイドロボットを用いた2種類の長距離作業のシミュレーション実験により,本手法の評価を行った。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:07:42 GMT)
HeGraphAdapter: Tuning Multi-Modal Vision-Language Models with Heterogeneous Graph Adapter [19.6] 本稿では,下流タスクに対するVLMのチューニングを実現するために,新しいヘテロジニアスグラフアダプタを提案する。
我々は、下流タスクの多モード構造知識を探索するために、特定の不均一グラフニューラルネットワークを用いる。
11のベンチマークデータセットの実験結果は、提案したHeGraphAdapterの有効性とメリットを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:20:58 GMT)
Do You Know What You Are Talking About? Characterizing Query-Knowledge Relevance For Reliable Retrieval Augmented Generation [19.5] 言語モデル(LM)は幻覚や誤報に悩まされていることが知られている。
外部知識コーパスから検証可能な情報を検索する検索拡張生成(RAG)は、これらの問題に対する具体的な解決策を提供する。
RAG生成品質は、ユーザのクエリと検索したドキュメントの関連性に大きく依存する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:14:55 GMT)
Contrastive Learning Via Equivariant Representation [19.1] CLeVERは,任意の複雑性の増大戦略に適合する,新しい異種コントラスト学習フレームワークである。
実験結果から,CLeVERは実用自然画像から同変情報を効果的に抽出し,組み込んだ。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:49:44 GMT)
Artificial intelligence techniques in inherited retinal diseases: A review [19.1] 遺伝性網膜疾患(英: InheritedRetinal disease、IRD)は、進行性視力低下を引き起こす多様な遺伝性疾患群であり、労働年齢層の視覚障害の主要な原因である。
人工知能(AI)の最近の進歩は、これらの課題に対する有望な解決策を提供する。
このレビューは既存の研究を統合し、ギャップを特定し、IRDの診断と管理におけるAIの可能性の概要を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:14:51 GMT)
MOMENT: A Family of Open Time-series Foundation Models [19.1] 汎用時系列解析のためのオープンソース基盤モデルのファミリであるMOMENTを紹介する。
我々は、タイムシリーズパイル(Time series Pile)と呼ばれる公開時系列のコレクションをコンパイルし、時系列固有の課題に体系的に取り組みます。
我々は、様々なタスクやデータセットに関する時系列基礎モデルを、限られた監督設定で評価するためのベンチマークを設計するための最近の作業に基づいて構築する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:37:45 GMT)
Private Language Models via Truncated Laplacian Mechanism [18.8] 本稿では,高次元トラカート型ラプラシアン機構と呼ばれる新しいプライベート埋め込み手法を提案する。
提案手法は,従来のプライベート単語埋め込み法に比べて分散度が低いことを示す。
注目すべきは、高いプライバシー体制であっても、私たちのアプローチは、プライベートでないシナリオに比べて、実用性がわずかに低下することです。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:25:02 GMT)
BlockEmulator: An Emulator Enabling to Test Blockchain Sharding Protocols [18.8] BlockEmulatorはブロックチェーンシャーディングメカニズムをエミュレートするための実験的なプラットフォームである。
軽量なブロックチェーンアーキテクチャを採用しており、開発者は新しいプロトコルやメカニズムの実装のみに集中できる。
GithubでBlockEmulatorをオープンソース化しました。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:16:13 GMT)
Efficient Reinforcement Learning with Large Language Model Priors [18.7] 大規模言語モデル(LLM)は、最近、強力な汎用ツールとして登場した。
本稿では,従来の行動分布としてLLMを扱い,それらをRLフレームワークに統合することを提案する。
LLMに基づくアクションの事前処理を取り入れることで、探索と複雑性の最適化が大幅に削減されることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:54:11 GMT)
Provable Privacy Attacks on Trained Shallow Neural Networks [18.5] 我々は、トレーニングされた2層ReLUニューラルネットワーク上で、証明可能なプライバシ攻撃が示すものについて検討する。
2層ニューラルネットワークの暗黙バイアスに関する理論的結果は,集合を確実に再構成するために有効であることを示す。
私たちの知る限りでは、この設定で証明可能な脆弱性を最初に示すのは私たちの仕事です。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:54:01 GMT)
CSA: Data-efficient Mapping of Unimodal Features to Multimodal Features [18.5] CLIPのようなマルチモーダルエンコーダは、ゼロショット画像分類やクロスモーダル検索といったタスクに優れている。
そこで本研究では,2つのユニモーダルエンコーダを用いて,制限データを用いたマルチモーダルエンコーダを複製する正準類似性解析(CSA)を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:54:37 GMT)
One-Bit Quantization and Sparsification for Multiclass Linear Classification with Strong Regularization [18.4] 最高の分類は、$f(cdot) = |cdot|2$ と $lambda to infty$ によって達成されることを示す。
f(cdot) = |cdot|_infty$ とほぼ同等に機能するスパースと1ビットの解を見つけることは、大きめの $lambda$ regime においてしばしば可能である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:11:17 GMT)
Explaining Hypergraph Neural Networks: From Local Explanations to Global Concepts [18.2] 我々は、ハイパーグラフニューラルネットワークのための最初のモデルに依存しないポストホック説明器SHypXを紹介する。
インスタンスレベルでは、忠実で簡潔に最適化された説明副ハイパーグラフを個別にサンプリングすることで、入力属性を実行する。
モデルレベルでは、教師なし概念抽出を用いて、グローバルな説明副グラフを生成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:50:28 GMT)
Modeling User Preferences with Automatic Metrics: Creating a High-Quality Preference Dataset for Machine Translation [18.1] 両世界の最善を生かすアプローチを提案する。
我々はまず,複数の高品質MTシステムによって生成された翻訳について,専門言語学者から文レベルの品質評価を収集する。
次に、この分析を用いて18の言語方向をカバーする18kインスタンスからなる新しいデータセットMT-Prefをキュレートする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:09:54 GMT)
Adaptive AI-Driven Material Synthesis: Towards Autonomous 2D Materials Growth [17.9] 本研究では,進化的手法で学習したニューラルネットワーク(ANN)を用いた自律材料合成の最前線について検討する。
我々のアプローチは、ニューラルネットワークがグラフェンの効率的な成長のための時間依存プロトコルを反復的かつ自律的に学習できることを示します。
この研究は材料工学の分野に大きく貢献し、合成プロセスにおける革新と効率の新しい時代を育む。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:00:52 GMT)
LatteCLIP: Unsupervised CLIP Fine-Tuning via LMM-Synthetic Texts [17.9] カスタムドメイン内の既知のクラス名を分類したCLIPモデルを微調整するための教師なし手法であるLatteCLIPを提案する。
提案手法はLMMを利用して,画像群と画像群の両方の表現的テキスト記述を生成する。
ドメイン固有の10のデータセットに対する実験により、LatteCLIPは、事前訓練されたゼロショット法を、トップ1の精度で平均4.74ポイント改善して上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:59 GMT)
Degree Distribution based Spiking Graph Networks for Domain Adaptation [17.9] Spiking Graph Networks (SGNs)は、グラフ分類におけるエネルギー消費の課題に対処する能力のために、研究者と業界双方から大きな注目を集めている。
まず、SGNにおけるドメイン適応問題を提案し、Dgree-aware Spiking Graph Domain Adaptation for Classificationという新しいフレームワークを提案する。
The proposed DeSGDA address the spiking graph domain adapt problem by three aspects: node degree-aware Personal spiking representation, adversarial feature distribution alignment, pseudo-label distillation。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:59:04 GMT)
Degree Distribution based Spiking Graph Networks for Domain Adaptation [17.9] Spiking Graph Networks (SGNs)は、グラフ分類におけるエネルギー消費の課題に対処する能力のために、研究者と業界双方から大きな注目を集めている。
まず、SGNにおけるドメイン適応問題を提案し、Dgree-aware Spiking Graph Domain Adaptation for Classificationという新しいフレームワークを提案する。
The proposed DeSGDA address the spiking graph domain adapt problem by three aspects: node degree-aware Personal spiking representation, adversarial feature distribution alignment, pseudo-label distillation。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:59:04 GMT)
Skeleton-OOD: An End-to-End Skeleton-Based Model for Robust Out-of-Distribution Human Action Detection [17.9] そこで我々はSkeleton-OODと呼ばれる新しい骨格モデルを提案する。
Skeleton-OODは、ID認識の精度を確保しつつ、OODタスクの有効性を向上させる。
本研究は,骨格型行動認識タスクの文脈における従来のOOD検出技術の有効性を裏付けるものである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:36:11 GMT)
QCircuitNet: A Large-Scale Hierarchical Dataset for Quantum Algorithm Design [17.7] 量子アルゴリズムの設計と実装におけるAIの能力を評価するために設計された、最初のベンチマークおよびテストデータセットであるQCircuitNetを紹介する。
従来のコードの記述にAIを使用するのとは異なり、このタスクは基本的に異なり、非常に柔軟な設計空間と複雑なキュービット操作のため、さらに複雑である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:24:30 GMT)
FedRepOpt: Gradient Re-parametrized Optimizers in Federated Learning [17.6] フェデレートラーニング(FL)は、エッジデバイス上で分散型に機械学習モデルをトレーニングするためのプライバシ保護手法として登場した。
モデルのサイズが大きくなるにつれて、エッジデバイス上の勾配更新の頻度が減少し、最適なトレーニング結果が得られます。
我々はこの問題に対処するため、FLのためにパラメータ化された勾配再パラメータであるFedRepOptを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:29:24 GMT)
FedRepOpt: Gradient Re-parametrized Optimizers in Federated Learning [17.6] フェデレートラーニング(FL)は、エッジデバイス上で分散型に機械学習モデルをトレーニングするためのプライバシ保護手法として登場した。
モデルのサイズが大きくなるにつれて、エッジデバイス上の勾配更新の頻度が減少し、最適なトレーニング結果が得られます。
我々はこの問題に対処するため、FLのためにパラメータ化された勾配再パラメータであるFedRepOptを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:29:24 GMT)
PokeFlex: A Real-World Dataset of Deformable Objects for Robotics [17.5] PokeFlexは3Dテクスチャメッシュ、ポイントクラウド、RGBイメージ、深度マップを含む、実世界のペアと注釈付きマルチモーダルデータを特徴とするデータセットである。
このようなデータは、オンライン3Dメッシュ再構築など、いくつかのダウンストリームタスクに活用することができる。
オンライン3Dメッシュ再構築におけるPokeFlexデータセットのユースケースを実演する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:54:17 GMT)
Scaling Up Your Kernels: Large Kernel Design in ConvNets towards Universal Representations [17.4] 本稿では,現代畳み込みニューラルネットワーク(ConvNets)の設計における大規模畳み込みカーネルのパラダイムを提案する。
複数の小さなカーネルを積み重ねる代わりに、少数の大規模なカーネルを採用することが、優れた設計戦略であることを示す。
我々は,大規模なカーネル・コンバネット向けに構築されたアーキテクチャ設計の体系的原則を提供するUniRepLKNetアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:43:55 GMT)
FusionSense: Bridging Common Sense, Vision, and Touch for Robust Sparse-View Reconstruction [17.4] 人間は、常識の知識を視覚や触覚からの感覚入力と密接に統合し、周囲を理解する。
FusionSenseは、ロボットが視覚や触覚センサーから高度に疎らな観察を行い、基礎モデルから事前情報を融合することのできる、新しい3D再構成フレームワークである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:07:07 GMT)
SelfFed: Self-supervised Federated Learning for Data Heterogeneity and Label Scarcity in IoMT [17.1] IoMT(Internet of Medical Things)のためのSelfFedフレームワークを提案する。
提案するSelfFedフレームワークは,2つのフェーズで動作する。第1フェーズは,拡張モデリングを行う事前学習パラダイムである。
第2フェーズは、コントラストネットワークと新しいアグリゲーション戦略を導入した微調整パラダイムである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:27:22 GMT)
Parallel Digital Twin-driven Deep Reinforcement Learning for User Association and Load Balancing in Dynamic Wireless Networks [17.0] ネットワークにおけるユーザアソシエーションとロードバランシングのための並列ディジタルツイン(DT)駆動DRL法を提案する。
提案手法では,分散DRL戦略を用いて様々なユーザ数を処理するとともに,より高速な収束を実現するために改良されたニューラルネットワーク構造を利用する。
並列DT駆動DRL法は実環境訓練と同等の性能を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:54:48 GMT)
Explaining Explanation: An Empirical Study on Explanation in Code Reviews [17.0] コードレビューで使用される説明の種類を調査し,Large Language Models(LLMs)の可能性を探る。
Gerrit氏から733のコードレビューコメントを抽出し、提案や説明、あるいはその両方を含むかどうかに基づいて、手動でラベル付けしました。
分析の結果、コメントの42%は説明のない提案しか含んでいないことがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:58:53 GMT)
Is DPO Superior to PPO for LLM Alignment? A Comprehensive Study [17.0] Reinforcement Learning from Human Feedback (RLHF) は現在、大きな言語モデル(LLM)を人間の好みに合わせるために最も広く使われている手法である。
学術ベンチマークでは、最先端の結果は直接選好最適化(DPO)のような報酬のない手法によって達成されることが多い。
PPOは、あらゆるケースにおいて他のアライメント手法を超越し、挑戦的なコード競争において最先端の結果を得ることができることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:30:17 GMT)
Privately Learning from Graphs with Applications in Fine-tuning Large Language Models [17.0] 金融や医療といった繊細な分野のリレーショナルデータは、しばしば私的な情報を含んでいる。
DP-SGDのような既存のプライバシー保護手法は、関係学習には適していない。
トレーニング中にサンプル関係の依存関係を分離するプライバシー保護型関係学習パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:38:38 GMT)
Adapting Multi-modal Large Language Model to Concept Drift From Pre-training Onwards [17.0] マルチモーダル大規模言語モデル(MLLM)は、実世界のストリーミングデータを扱う際に、コンセプトドリフトから問題に直面することが多い。
本稿では、段階的ドリフトと急激なドリフトに起因する重大なバイアスに対するビジョンランゲージモデル(VL)の感受性と脆弱性を明らかにする。
本稿では,概念ドリフト理論をマルチモーダル領域に拡張し,VLモデルの分布予測不可能な変化への適応性を向上する統合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:11:52 GMT)
Convergence of Gradient Descent for Recurrent Neural Networks: A Nonasymptotic Analysis [16.9] 教師付き学習環境において,勾配降下を訓練した斜め隠れ重み行列を用いた繰り返しニューラルネットワークの解析を行った。
我々は,パラメータ化を伴わずに勾配降下が最適性を実現することを証明した。
この結果は、繰り返しニューラルネットワークによって近似および学習できる力学系のクラスを明示的に評価することに基づいている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:43:03 GMT)
$\textit{Jump Your Steps}$: Optimizing Sampling Schedule of Discrete Diffusion Models [16.7] 我々は、余分な計算コストを伴わずにCDEを最小化することにより、離散サンプリングタイムステップの割り当てを最適化する新しいアプローチである、textitJump Your Steps$(JYS)を提示する。
画像、音楽、テキスト生成に関する実験では、JYSはサンプリング品質を大幅に改善する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:44:25 GMT)
Differentiation Through Black-Box Quadratic Programming Solvers [16.5] 我々は,任意の2次プログラミング(QP)ソルバに対して,プラグアンドプレイの微分を可能にするモジュール型フレームワークであるdQPを紹介する。
我々の解は、QP最適化におけるアクティブ制約セットの知識が明示的な微分を可能にするというコア理論的知見に基づいている。
我々の実装は公開され、15以上の最先端QP解決器をサポートする既存のフレームワークとインターフェースします。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:56:48 GMT)
Differentiation Through Black-Box Quadratic Programming Solvers [16.5] 我々は,任意の2次プログラミング(QP)ソルバに対して,プラグアンドプレイの微分を可能にするモジュール型フレームワークであるdQPを紹介する。
我々の解は、QP最適化におけるアクティブ制約セットの知識が明示的な微分を可能にするというコア理論的知見に基づいている。
我々の実装は公開され、15以上の最先端QP解決器をサポートする既存のフレームワークとインターフェースします。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:56:48 GMT)
Backdooring Bias into Text-to-Image Models [16.5] 敵がバックドア攻撃によって任意のバイアスを加えることで、良質なユーザーが画像を生成することさえも影響することを示した。
私たちの攻撃は、テキストプロンプトで与えられた意味情報を保存しているため、ステルス状態のままです。
我々は、現在の最先端の生成モデルが、この攻撃を安価かつあらゆる敵に対して実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:21:22 GMT)
GrabDAE: An Innovative Framework for Unsupervised Domain Adaptation Utilizing Grab-Mask and Denoise Auto-Encoder [16.2] Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインでトレーニングされたモデルを、ドメインシフトに対処することによってラベルなしのターゲットドメインに適応することを目的としている。
視覚分類タスクのドメインシフトに対処するために設計された,革新的なUDAフレームワークであるGrabDAEを紹介する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:19:57 GMT)
EVALALIGN: Supervised Fine-Tuning Multimodal LLMs with Human-Aligned Data for Evaluating Text-to-Image Models [16.2] 本稿では,その精度,安定性,微粒度を特徴とする計量であるEvalAlignを提案する。
画像の忠実度とテキスト画像のアライメントという2つの重要な側面に焦点を当てた評価プロトコルを開発する。
EvalAlignは、既存のメトリクスよりも人間の好みと密に一致し、モデルアセスメントの有効性と有用性を確認している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:04:07 GMT)
From Logits to Hierarchies: Hierarchical Clustering made Simple [16.1] 事前訓練された非階層クラスタリングモデル上に実装された軽量なプロシージャは、階層クラスタリングに特化して設計されたモデルより優れていることを示す。
提案手法は,微調整を必要とせず,ログを出力する事前学習クラスタリングモデルに適用可能である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:27:45 GMT)
QuadMamba: Learning Quadtree-based Selective Scan for Visual State Space Model [16.0] QuadMambaと呼ばれる新しいビジョンMambaモデルは、クアッドツリーベースのイメージパーティションとスキャンを通じて、さまざまな粒度のローカル依存関係をキャプチャする。
QuadMambaは、画像分類、オブジェクト検出、インスタンスセグメンテーション、セマンティックセグメンテーションなど、さまざまなビジョンタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:19:20 GMT)
QuadMamba: Learning Quadtree-based Selective Scan for Visual State Space Model [16.0] QuadMambaと呼ばれる新しいビジョンMambaモデルは、クアッドツリーベースのイメージパーティションとスキャンを通じて、さまざまな粒度のローカル依存関係をキャプチャする。
QuadMambaは、画像分類、オブジェクト検出、インスタンスセグメンテーション、セマンティックセグメンテーションなど、さまざまなビジョンタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:19:20 GMT)
Toward Relieving Clinician Burden by Automatically Generating Progress Notes using Interim Hospital Data [15.8] 経過ノートの定期的な文書は、臨床医の負担に対する主要な貢献者の1つである。
医療記録における構造化チャート情報は、進捗ノートの自動作成の機会を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:03:27 GMT)
Calibration Error for Decision Making [15.8] そこで本研究では,決定理論のキャリブレーション誤差である決定損失(CDL)を,予測値から得られる意思決定報酬の最大化として定義する。
CDLと既存の校正誤差メトリクスの分離を示す。
我々の主な技術的貢献は、ほぼ最適の$O(fraclog TsqrtT)$期待のCDLを達成する、オンラインキャリブレーションのための新しい効率的なアルゴリズムである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:15:26 GMT)
Calibration Error for Decision Making [15.8] そこで本研究では,決定理論のキャリブレーション誤差である決定損失(CDL)を,予測値から得られる意思決定報酬の最大化として定義する。
CDLと既存の校正誤差メトリクスの分離を示す。
我々の主な技術的貢献は、ほぼ最適の$O(fraclog TsqrtT)$期待のCDLを達成する、オンラインキャリブレーションのための新しい効率的なアルゴリズムである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:15:26 GMT)
Grounding Robot Policies with Visuomotor Language Guidance [15.8] ロボットポリシーを現在の状況に基盤付けるためのエージェントベースのフレームワークを提案する。
提案するフレームワークは、特定の役割のために設計された会話エージェントのセットで構成されている。
弊社のアプローチは、操作ポリシーを効果的にガイドし、成功率を大幅に向上させることを実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:03:16 GMT)
Grounding Robot Policies with Visuomotor Language Guidance [15.8] ロボットポリシーを現在の状況に基盤付けるためのエージェントベースのフレームワークを提案する。
提案するフレームワークは、特定の役割のために設計された会話エージェントのセットで構成されている。
弊社のアプローチは、操作ポリシーを効果的にガイドし、成功率を大幅に向上させることを実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:03:16 GMT)
Functional Stochastic Gradient MCMC for Bayesian Neural Networks [15.8] 本稿では,より情報に富む事前を組み込むことのできる勾配版を含む,新しい機能的MCMCスキームを提案する。
提案手法は,複数のタスクにおける予測精度と不確実性の両方において,性能の向上を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:20:01 GMT)
Reversible Decoupling Network for Single Image Reflection Removal [15.8] 高レベルのセマンティックなヒントは、層間伝播中に圧縮または破棄される傾向がある。
我々はReversible Decoupling Network (RDNet)と呼ばれる新しいアーキテクチャを提案する。
RDNetは可逆エンコーダを使用して、転送時と反射時の特徴を柔軟に分離しながら、貴重な情報を確保する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:58:27 GMT)
Key-Point-Driven Mathematical Reasoning Distillation of Large Language Model [15.5] KPDD(Key-Point-Driven Mathematical Reasoning Distillation)を提案する。
KPDDは、問題解決プロセスを3段階に分割することで、SLMの推論性能を向上させる。
実験により、KPDD-CoTは推論能力を大幅に向上し、KPDD-PoTは数学的推論タスクにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:17:10 GMT)
TraderTalk: An LLM Behavioural ABM applied to Simulating Human Bilateral Trading Interactions [15.4] 本稿では,エージェントベースモデル(ABM)とLarge Language Models(LLM)を併用して,人間の取引相互作用をシミュレートする,新たなハイブリッドアプローチを提案する。
我々は、我々のモデルをTraderTalkと呼びます。LLMを利用して、金融取引における双方向の会話の詳細な表現とニュアンスな表現を取ります。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:58:07 GMT)
Towards Foundation Models for Mixed Integer Linear Programming [15.1] MILPの最近のディープラーニングアプローチは、特定の問題クラスに焦点を当てており、目に見えないクラスに一般化しない。
多様なMILPクラスを多数生成できる新しい進化的フレームワークであるMILP-Evolveを紹介する。
実験の結果,MILP-Evolveが生成したデータに基づいてトレーニングしたモデルでは,目に見えない問題に対して大幅な改善が得られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:20:44 GMT)
Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm [15.0] 介入データを含むデータセットは,データ分布に関する現実的な仮定の下で効果的に抽出可能であることを示す。
観察的および介入的設定における各変数の限界分布の比較に依拠する介入忠実性を導入する。
また、多数の単一変数の介入を含むデータセットから因果順序を推測するアルゴリズムであるIntersortを導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:31:09 GMT)
RNA: Video Editing with ROI-based Neural Atlas [14.8] 我々は、ROIベースのニューラルアトラス(RNA)という、新しい関心領域(ROI)ベースのビデオ編集フレームワークを提案する。
以前の作業とは異なり、RNAはユーザーが編集領域を指定できるようにし、前景分離の必要性を取り除くことで編集プロセスを簡素化する。
ビデオ再構成のためのソフトニューラルネットワークモデルを導入し,高品質な編集結果を確実にする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:17:19 GMT)
TPO: Aligning Large Language Models with Multi-branch & Multi-step Preference Trees [14.8] 本稿では、選好木からペア化された選好応答をサンプリングしないツリー選好最適化(TPO)を導入する。
TPOは、言語モデルのアライメントを、優先順位リストランキング問題として定式化し、ポリシーは、ランク付けされた優先順位リストからより効果的に学習することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:22:05 GMT)
Tracking objects that change in appearance with phase synchrony [14.8] ニューラルシンクロニーにより,新たな深層学習回路が,世界の場所と独立して特徴への注意を制御できることが示される。
大規模課題であるFeatureTrackerを用いて、人間、CV-RNN、その他のディープニューラルネットワーク(DNN)のオブジェクト追跡を比較した。
我々のCV-RNNは、この課題において人間と同じような振る舞いをし、相同期の役割の計算的概念実証を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:23:30 GMT)
Tracking objects that change in appearance with phase synchrony [14.8] ニューラルシンクロニーにより,新たな深層学習回路が,世界の場所と独立して特徴への注意を制御できることが示される。
大規模課題であるFeatureTrackerを用いて、人間、CV-RNN、その他のディープニューラルネットワーク(DNN)のオブジェクト追跡を比較した。
我々のCV-RNNは、この課題において人間と同じような振る舞いをし、相同期の役割の計算的概念実証を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:23:30 GMT)
Score Distillation via Reparametrized DDIM [14.8] スコア蒸留サンプリングで用いられる画像誘導は, 2次元デノベーション生成過程の速度場として理解できることを示す。
本研究では,SDS更新ステップ毎にDDIMを反転させることにより,より優れたノイズ近似を復元可能であることを示す。
本手法は、他の最先端のスコア蒸留法と比較して、より良く、あるいは類似した3D生成品質を実現する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:25:13 GMT)
HLM-Cite: Hybrid Language Model Workflow for Text-based Scientific Citation Prediction [14.7] 本稿では,表面的な言及を超越した批判的参照を識別する,コア引用という新しい概念を紹介する。
我々は、引用予測のための$textbfH$ybrid $textbfL$anguage $textbfM$odelワークフローである$textbfHLM-Citeを提案する。
我々はHLM-Citeを19分野にわたって評価し,SOTA法と比較して17.6%の性能向上を示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:46:06 GMT)
IC3M: In-Car Multimodal Multi-object Monitoring for Abnormal Status of Both Driver and Passengers [14.6] 運転者の早期異常を検知するための有望な技術として車内監視が登場している。
我々は車内でのドライバーと乗客の両方を監視するための効率的なカメラ回転に基づくマルチモーダル・フレームワークであるIC3Mを紹介した。
IC3Mは,適応しきい値の擬似ラベル戦略とモダリティの欠如という2つの重要なモジュールから構成される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:30:14 GMT)
IC3M: In-Car Multimodal Multi-object Monitoring for Abnormal Status of Both Driver and Passengers [14.6] 運転者の早期異常を検知するための有望な技術として車内監視が登場している。
我々は車内でのドライバーと乗客の両方を監視するための効率的なカメラ回転に基づくマルチモーダル・フレームワークであるIC3Mを紹介した。
IC3Mは,適応しきい値の擬似ラベル戦略とモダリティの欠如という2つの重要なモジュールから構成される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:30:14 GMT)
IC3M: In-Car Multimodal Multi-object Monitoring for Abnormal Status of Both Driver and Passengers [14.6] 運転者の早期異常を検知するための有望な技術として車内監視が登場している。
我々は車内でのドライバーと乗客の両方を監視するための効率的なカメラ回転に基づくマルチモーダル・フレームワークであるIC3Mを紹介した。
IC3Mは,適応しきい値の擬似ラベル戦略とモダリティの欠如という2つの重要なモジュールから構成される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:30:14 GMT)
The Dawn of Video Generation: Preliminary Explorations with SORA-like Models [14.5] テキスト・トゥ・ビデオ(T2V)、画像・トゥ・ビデオ(I2V)、ビデオ・トゥ・ビデオ(V2V)生成を含む高品質なビデオ生成は、コンテンツ作成においてかなりの重要性を持っている。
SORAのようなモデルでは、高解像度、より自然な動き、より良い視覚言語アライメント、コントロール可能性の向上といった高度なビデオを生成することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:17:30 GMT)
The Dawn of Video Generation: Preliminary Explorations with SORA-like Models [14.5] テキスト・トゥ・ビデオ(T2V)、画像・トゥ・ビデオ(I2V)、ビデオ・トゥ・ビデオ(V2V)生成を含む高品質なビデオ生成は、コンテンツ作成においてかなりの重要性を持っている。
SORAのようなモデルでは、高解像度、より自然な動き、より良い視覚言語アライメント、コントロール可能性の向上といった高度なビデオを生成することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:17:30 GMT)
LLM Cascade with Multi-Objective Optimal Consideration [14.5] 大規模言語モデル(LLM)は、自然言語の理解と生成において例外的な能力を示した。
それらの高いデプロイメントコストは、実用アプリケーションにとって障壁となることが多い。
本稿では,多目的最適化を用いた新しいLCMカスケード戦略を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:09:52 GMT)
PointOBB-v2: Towards Simpler, Faster, and Stronger Single Point Supervised Oriented Object Detection [14.4] 単一点教師付きオブジェクト指向オブジェクト検出が注目され、コミュニティ内で最初の進歩を遂げた。
本稿では,よりシンプルで高速で,より強力な手法であるPointOBB-v2を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:56 GMT)
A Penalty-Based Method for Communication-Efficient Decentralized Bilevel Programming [14.4] 本稿では,分散化ネットワーク上での双方向プログラミング問題の解法として,ペナルティ関数に基づく分散化アルゴリズムを提案する。
提案アルゴリズムの重要な特徴は,ペナルティ関数の過度勾配の推定である。
我々の理論的枠組みは、様々な凸条件下での原問題の最適解に漸近的でない収束を保証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:05:15 GMT)
RecurFormer: Not All Transformer Heads Need Self-Attention [14.3] 変換器をベースとした大規模言語モデル(LLM)は複雑な言語パターンをモデル化する上で優れているが、推論時にかなりの計算コストに直面している。
本稿では,リニアリカレントニューラルネットワークに注意を向ける新しいアーキテクチャであるRecurFormerを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:24:12 GMT)
SNN-PAR: Energy Efficient Pedestrian Attribute Recognition via Spiking Neural Networks [14.3] エネルギー効率の高い属性認識のためのスパイキングニューラルネットワークに基づくフレームワークを提案する。
さらに,ニューラルネットワークからスパイキングトランスフォーマーネットワークへの知識蒸留を利用して,より正確な属性認識を行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:26:06 GMT)
Scalable Representation Learning for Multimodal Tabular Transactions [14.2] これらの課題に対して、革新的でスケーラブルなソリューションを提示します。
トランザクションとテキストのモダリティをインターリーブするパラメータ効率の良いデコーダを提案する。
我々は,大規模な合成決済トランザクションデータセット上でのソリューションの有効性を検証した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:18:42 GMT)
VIVA: A Benchmark for Vision-Grounded Decision-Making with Human Values [14.1] 大規模視覚言語モデル(VLM)は、日常生活への統合に大きな可能性を示している。
本稿では,人間のVAluによって駆動されるVsion-grounded decision-makingのベンチマークであるVIVAを紹介する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:19:33 GMT)
The Power of Adaptivity in Experimental Design [14.1] 本稿では,治療効果を推定する際の最適精度を決定するための基本的な問題に対処する。
二重ロバストな手法の概念を逐次実験設計に取り入れることで、最適推定問題をオンラインバンディット学習問題としてモデル化する。
本稿では,バンディットアルゴリズム設計と適応統計的推定の両方のツールとアイデアを用いて,一般的な低スイッチング適応実験フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:28:08 GMT)
The Power of Adaptivity in Experimental Design [14.1] 本稿では,治療効果を推定する際の最適精度を決定するための基本的な問題に対処する。
二重ロバストな手法の概念を逐次実験設計に取り入れることで、最適推定問題をオンラインバンディット学習問題としてモデル化する。
本稿では,バンディットアルゴリズム設計と適応統計的推定の両方のツールとアイデアを用いて,一般的な低スイッチング適応実験フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:28:08 GMT)
Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond [14.1] TDA(Training Data Attribution)メソッドは、ニューラルネットワークの解釈可能性のための有望な方向として登場した。
我々は,TDA手法の評価を容易にするために設計されたPythonツールキットQuandaを紹介する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:36:19 GMT)
Quanda: An Interpretability Toolkit for Training Data Attribution Evaluation and Beyond [14.1] TDA(Training Data Attribution)メソッドは、ニューラルネットワークの解釈可能性のための有望な方向として登場した。
我々は,TDA手法の評価を容易にするために設計されたPythonツールキットQuandaを紹介する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:36:19 GMT)
Gaussian Loss Smoothing Enables Certified Training with Tight Convex Relaxations [14.1] 敵の例に対して高い精度でニューラルネットワークを訓練することは、依然としてオープンな課題である。
厳密な凸緩和を効果的に活用し、バウンド計算を行う。
トレーニングでは、これらの手法は緩やかに緩和されるよりも悪い結果をもたらす可能性がある。
ガウシアン・ロス・スムーシングはこれらの問題を緩和できることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:01:24 GMT)
DialSim: A Real-Time Simulator for Evaluating Long-Term Multi-Party Dialogue Understanding of Conversational Agents [13.9] リアルタイム対話シミュレータであるDialSimを紹介する。
本シミュレータでは、人気番組のキャラクターの役割をエージェントに割り当てる。
DialSimの主な特徴は、適切な時間内に応答するエージェントの能力を評価することである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:16:41 GMT)
ZeroComp: Zero-shot Object Compositing from Image Intrinsics via Diffusion [13.8] ZeroCompは、トレーニング中にペアの複合シーンイメージを必要としない。
仮想3Dオブジェクトをシームレスにシーンに統合し、シェーディングを調整してリアルな合成物を作る。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:45:12 GMT)
KnowGraph: Knowledge-Enabled Anomaly Detection via Logical Reasoning on Graph Data [13.5] KnowGraphは、グラフベースの異常検出を強化するために、ドメイン知識とデータ駆動学習を統合する。
テストでは、KnowGraphはトランスダクティブとインダクティブの両方で、最先端のベースラインを一貫して上回っている。
その結果は、高レベルのグラフベースのセキュリティアプリケーションのためのデータ駆動モデルにドメイン知識を統合する可能性を強調している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:53:33 GMT)
Verification and Refinement of Natural Language Explanations through LLM-Symbolic Theorem Proving [13.5] 本稿では,Large Language Models(LLMs)とTheorem Provers(TPs)の統合による自然言語説明の検証と改善について検討する。
本稿では, TPとLPMを統合して説明文の生成と定式化を行う, Explanation-Refiner というニューロシンボリック・フレームワークを提案する。
代わりに、TPは説明の論理的妥当性を公式に保証し、その後の改善のためのフィードバックを生成するために使用される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:51:51 GMT)
Unstable Unlearning: The Hidden Risk of Concept Resurgence in Diffusion Models [13.5] 一見無関係な画像にテキストから画像への拡散モデルを微調整することで、以前は「未学習」だった概念を「再学習」することができることを示す。
この結果から,インクリメンタルなモデル更新の脆弱さが浮き彫りになった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:10:27 GMT)
Sharp bounds on aggregate expert error [13.5] 我々は、条件に依存しない専門家からバイナリアドバイスを集約するという古典的な問題を再考する。
我々の関心事は、最適決定規則の誤り確率である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:39:58 GMT)
4D-CAT: Synthesis of 4D Coronary Artery Trees from Systole and Diastole [13.4] 心臓の鼓動は血管の変形を引き起こし、血管のイメージング状態と偽陽性の診断結果をもたらす。
コントラスト剤注入の投与限界のため, 有限位相イメージングにより4次元冠状動脈木を合成することが重要である。
そこで本研究では, 変形場予測により, システロールをダイアストロールにマッピングする4次元冠状動脈木を生成する方法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:33:14 GMT)
Generalization Ability Analysis of Through-the-Wall Radar Human Activity Recognition [13.1] through-the-Wall radar (TWR) Human Activity Recognition (HAR) は、低周波超広帯域(UWB)信号を用いて室内の人間の動きを検出し、分析する技術である。
本稿では,TWR HARの一般化能力について述べる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:29:10 GMT)
Mitigating Gender Bias in Code Large Language Models via Model Editing [13.1] MG-Editing というモデル編集手法を開発し,位置決めと編集のフェーズを含む。
MG-Editing はモデルパラメータの粒度の5つの異なるレベルに適用できる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:11:32 GMT)
Revealing COVID-19's Social Dynamics: Diachronic Semantic Analysis of Vaccine and Symptom Discourse on Twitter [12.8] 本稿では,あらかじめ定義されたアンカー語を使わずに,ソーシャルメディアデータ中の縦長的な意味変化を捉えるために,教師なしの動的単語埋め込み手法を提案する。
新型コロナウイルス(COVID-19)の大規模なTwitterデータセットに基づいて評価されたこの手法は、異なるパンデミック段階におけるワクチンおよび症状関連エンティティのセマンティックな進化パターンを明らかにする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:15:28 GMT)
SALINA: Towards Sustainable Live Sonar Analytics in Wild Ecosystems [12.7] 本稿では,サステナブルライブソナー分析システムであるSALINAを紹介する。
SALINAは空間的および時間的適応による音響ソナーデータのリアルタイム処理を可能にする。
SALINAは6ヶ月間、カナダのブリティッシュコロンビア州の2つの内陸河川に配備された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:32:28 GMT)
Visual Editing with LLM-based Tool Chaining: An Efficient Distillation Approach for Real-Time Applications [12.3] 本稿では, リアルタイムアプリケーションにおけるツール起動のための微調整LDMの実用的蒸留手法を提案する。
GPT-3.5-TurboのようなプロプライエタリなLCMはこのタスクの潜在的な可能性を示すが、その高コストと遅延によりリアルタイムアプリケーションには適さない。
その結果, 微調整の精度は, 低データ方式では25%向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:41:35 GMT)
Visual Editing with LLM-based Tool Chaining: An Efficient Distillation Approach for Real-Time Applications [12.3] 本稿では, リアルタイムアプリケーションにおけるツール起動のための微調整LDMの実用的蒸留手法を提案する。
GPT-3.5-TurboのようなプロプライエタリなLCMはこのタスクの潜在的な可能性を示すが、その高コストと遅延によりリアルタイムアプリケーションには適さない。
その結果, 微調整の精度は, 低データ方式では25%向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:41:35 GMT)
Visual Editing with LLM-based Tool Chaining: An Efficient Distillation Approach for Real-Time Applications [12.3] 本稿では, リアルタイムアプリケーションにおけるツール起動のための微調整LDMの実用的蒸留手法を提案する。
GPT-3.5-TurboのようなプロプライエタリなLCMはこのタスクの潜在的な可能性を示すが、その高コストと遅延によりリアルタイムアプリケーションには適さない。
その結果, 微調整の精度は, 低データ方式では25%向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:41:35 GMT)
How to Leverage Predictive Uncertainty Estimates for Reducing Catastrophic Forgetting in Online Continual Learning [12.3] この研究は、異なる不確実性推定とメモリの投入戦略を詳細に分析する。
負の対数類似度によって誘導される一般化分散を用いて予測の不確かさを推定する別の方法を提案する。
予測不確実性対策を用いることで, CFを異なる設定で低減できることが実証された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:34:08 GMT)
Universal Physics Transformers: A Framework For Efficiently Scaling Neural Operators [12.2] ユニバーサル物理変換器(Universal Physics Transformer、UPT)は、幅広い問題に対して効率的かつ統一的な学習パラダイムである。
UPTはグリッドやパーティクルベースの潜在メッシュを使わずに動作し、構造や粒子間の柔軟性を実現する。
メッシュ型流体シミュレーションおよび定常レイノルズ平均Navier-StokesシミュレーションにおけるUTTの適用性と有効性を示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:48:24 GMT)
A Survey on Physical Adversarial Attacks against Face Recognition Systems [12.1] 顔認識技術は、金融、軍事、公共安全、日常生活でますます普及している。
FRシステムを現実の環境でターゲットとする物理的敵対攻撃は、かなりの研究関心を集めている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:21:44 GMT)
Generalizable Indoor Human Activity Recognition Method Based on Micro-Doppler Corner Point Cloud and Dynamic Graph Learning [12.0] マイクロドップラーシグネチャ抽出とインテリジェントな意思決定アルゴリズムを融合させることで、TWRによる人間の活動認識を実現することができる。
本稿では,マイクロドップラー角点雲と動的グラフ学習に基づく,一般化可能な室内人間活動認識手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:24:07 GMT)
FDDM: Frequency-Decomposed Diffusion Model for Rectum Cancer Dose Prediction in Radiotherapy [12.0] 拡散モデルはコンピュータビジョンにおいて大きな成功をおさめ、より周波数の細かい画像を生成する。
線量マップの高周波サブバンドを改良する周波数分解拡散モデルを提案する。
高周波数サブバンドにおける粗い予測結果と基底真実との間には顕著な違いがある。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:48:42 GMT)
Causal Reasoning in Software Quality Assurance: A Systematic Review [11.9] 本研究は、SQAの因果推論に関する科学的文献の体系的なレビューを提供する。
障害のローカライゼーションは、特にWebサービス/マイクロサービスドメインにおいて、因果推論をより活用するアクティビティである。
アプリケーションを好むツールは急速に現れており、そのほとんどが2021年以降です。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:00:02 GMT)
Hybrid NeRF-Stereo Vision: Pioneering Depth Estimation and 3D Reconstruction in Endoscopy [11.8] 本稿では3次元再構成のためのNeural Radiance Fields (NeRF) を用いた革新的なパイプラインを提案する。
提案手法は, 粗いモデルが得られる予備的なNeRF再構成を用いて, 再建された環境内に双眼シーンを生成する。
高忠実度深度マップは、現実的な脳ファントムの単眼内視鏡映像から生成される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:19:18 GMT)
Hybrid NeRF-Stereo Vision: Pioneering Depth Estimation and 3D Reconstruction in Endoscopy [11.8] 本稿では3次元再構成のためのNeural Radiance Fields (NeRF) を用いた革新的なパイプラインを提案する。
提案手法は, 粗いモデルが得られる予備的なNeRF再構成を用いて, 再建された環境内に双眼シーンを生成する。
高忠実度深度マップは、現実的な脳ファントムの単眼内視鏡映像から生成される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:19:18 GMT)
Sm: enhanced localization in Multiple Instance Learning for medical imaging classification [11.7] マルチ・インスタンス・ラーニング(MIL)は医療画像分類において、ラベル付けの労力を減らすために広く用いられている。
ローカル依存関係をモデル化するための,新しい,原則付き,フレキシブルなメカニズムを提案する。
我々のモジュールは、最先端のローカライゼーションにおいて、競争力や優越性を保ちながら、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:19:34 GMT)
Sm: enhanced localization in Multiple Instance Learning for medical imaging classification [11.7] マルチ・インスタンス・ラーニング(MIL)は医療画像分類において、ラベル付けの労力を減らすために広く用いられている。
ローカル依存関係をモデル化するための,新しい,原則付き,フレキシブルなメカニズムを提案する。
我々のモジュールは、最先端のローカライゼーションにおいて、競争力や優越性を保ちながら、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:19:34 GMT)
Stability-Aware Training of Machine Learning Force Fields with Differentiable Boltzmann Estimators [11.7] 安定性を意識したボルツマン推定器(StABlE)トレーニングは、参照量子力学計算とシステムオブザーバブルから共同制御を利用するマルチモーダルトレーニング手法である。
StABlE TrainingはMLFFアーキテクチャやシステムにまたがる一般的な半経験的なフレームワークと見なすことができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:11 GMT)
UNIQ: Offline Inverse Q-learning for Avoiding Undesirable Demonstrations [11.7] 我々は、望ましくない実演を避ける政策としてオフライン学習の問題に対処する。
学習課題を学習方針と望ましくない政策との統計的距離を最大化するものとして定式化する。
我々のアルゴリズムUNIQは、逆Q-ラーニングフレームワークを構築し、これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:52:58 GMT)
Kernel Banzhaf: A Fast and Robust Estimator for Banzhaf Values [11.6] Banzhaf値は、広く使われているShapley値の、シンプルで解釈可能な代替手段を提供する。
本稿では,Banzhaf値と線形回帰とのエレガントな接続を利用する新しいアルゴリズムであるKernel Banzhafを紹介する。
我々はアルゴリズムの性能に関する理論的保証を証明し、Kernel Banzhafを機械学習の解釈に有用なツールとして確立した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:51:29 GMT)
Safe Task Planning for Language-Instructed Multi-Robot Systems using Conformal Prediction [11.6] 本稿では,新しい分散マルチロボットプランナであるS-ATLAS for Safe plAnning for Teams of Language-instructed Agentsを導入する。
理論的にも経験的にも,提案したプランナは,ヘルプリクエストの総数を最小限に抑えながら,ユーザ特定タスクの成功率を達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:35:50 GMT)
Symbolic Regression on Sparse and Noisy Data with Gaussian Processes [11.4] GPSINDyは、SINDy単独と比較して、スパースでノイズの多いデータで堅牢性を改善する。
SINDyを50%以上改善するなど,ベースラインよりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:47:13 GMT)
Meta-Learning from Learning Curves for Budget-Limited Algorithm Selection [11.4] 予算制限のシナリオでは、アルゴリズム候補を慎重に選択し、それを訓練するための予算を割り当てることが不可欠である。
本稿では,エージェントが十分に訓練されるまで待たずに,最も有望なアルゴリズムを学習する過程において,エージェントが選択しなければならない新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:09:58 GMT)
DPL: Cross-quality DeepFake Detection via Dual Progressive Learning [11.4] 現実世界のDeepFakeビデオは、様々な圧縮操作を受けており、様々なビデオ品質を生み出している。
これらの様々な性質は偽の痕跡のパターンを多様化させ、ディープフェイク検出の困難を著しく増大させる。
クロスクオリティなDeepFake検出のための新しいデュアルプログレッシブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:56:19 GMT)
Strategic Classification With Externalities [11.4] 戦略分類問題の新しい変種を提案する。
実世界のアプリケーションによって動機づけられた我々のモデルは、あるエージェントの操作が他のエージェントに影響を与えることを決定的に許している。
特定の仮定の下では、このエージェント操作ゲームの純粋なナッシュ平衡はユニークであり、効率的に計算できることが示される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:28:04 GMT)
Increasing the Difficulty of Automatically Generated Questions via Reinforcement Learning with Synthetic Preference [11.3] 本研究は,(1)PPOと合成データを用いた質問の難易度向上手法,(2)人的評価を含む手法の有効性の実証的証拠,(3)詳細な誤り分析と創発現象の研究に寄与する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:21:00 GMT)
Diversified and Adaptive Negative Sampling on Knowledge Graphs [11.1] 本稿では,知識グラフ上での多変量および適応負値サンプリングDANS(Diversified and Adaptive Negative Smpling DANS)手法を提案する。
DANSは2つの経路を通じてより多様な負の三重項を生成する双方向ジェネレータと、よりきめ細かい例を生成する適応機構を備えている。
一方,2方向ジェネレータはより多様な負の例で全体の情報量を増加させる一方,適応機構はよりきめ細かなサンプリングによって個々の情報量を増加させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:53:49 GMT)
Dimension Mixer: Group Mixing of Input Dimensions for Efficient Function Approximation [11.1] CNN、Transformers、Fourier-Mixersは、類似点と相違点を探す動機になりました。
これらのアーキテクチャは、一般的な次元混合の概念のレンズを通して解釈できることがわかった。
本研究では,グループワイズ,非線形,多層,学習可能な入力混合方式について検討し,それらが多くの標準的なニューラルネットワークアーキテクチャに相補的であることを明らかにする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:21:47 GMT)
Contrastive learning of T cell receptor representations [11.1] データ効率のよい転送学習が可能なTCR言語モデルSCEPTRを導入する。
本稿では,自己コントラスト学習とマスク付き言語モデリングを組み合わせた新しい事前学習戦略を提案する。
コントラスト学習は,TCRの特異性のルールを復号化するための有用なパラダイムとして期待できる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:32:44 GMT)
The Effects of Hallucinations in Synthetic Training Data for Relation Extraction [11.0] 文書と文レベルにおける関係抽出の性能に及ぼす幻覚の影響について検討する。
幻覚は、テキストから関係を抽出するモデルの能力を著しく損なう。
本研究では,幻覚の検出手法を開発し,データ品質とモデル性能を向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:00:16 GMT)
MetaReflection: Learning Instructions for Language Agents using Past Reflections [11.0] 本稿では,言語エージェントの性能を向上させる新しいオフライン強化学習手法であるMetaReflectionを紹介する。
本稿では, 複雑な論理的推論, バイオメディカルセマンティックな類似性, オープンワールド質問応答, 脆弱性検出など, 複数領域にわたる評価によるメタリフレクションの有効性を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:51:24 GMT)
Device-independent quantum secret sharing with noise preprocessing and postselection [11.0] デバイス非依存(DI)量子秘密共有(QSS)は、デバイスの内部動作に関するセキュリティ上の仮定を緩和することができる。
実用的な通信状況におけるDI QSSの性能特性の欠如がある。
本稿では,ノイズ前処理とポストセレクション戦略を備えた三部構成のDI QSSプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:28:09 GMT)
The cool and the cruel: separating hard parts of LWE secrets [11.0] スパースバイナリLWEシークレットに対する既知の攻撃には、スパースデュアルアタックとミドルアタックにおけるハイブリッドスパースデュアルミートが含まれる。
本稿では,メモリ要求の少ない新しい統計的攻撃を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:57:29 GMT)
The Geometry of Concepts: Sparse Autoencoder Feature Structure [11.0] 宇宙は3つのレベルで興味深い構造を持つ。
ブレイン」中間スケール構造は、空間的モジュラリティが著しく高い。
特徴点雲の「ガラクシー」スケールの大規模構造は等方性ではなく、中層で最も急勾配の固有値のパワー則を持つ。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:47 GMT)
AHA: Human-Assisted Out-of-Distribution Generalization and Detection [10.9] 本稿では,AHA(Adaptive Human-Assisted OOD learning)の新たな統合的アプローチを提案する。
OODの一般化と、野生のデータのラベル付けによる人力支援フレームワークによる検出の両方に対処する。
本手法は,人的援助を伴わない既存の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:57:11 GMT)
DragTraffic: Interactive and Controllable Traffic Scene Generation for Autonomous Driving [10.9] DragTrafficは、条件付き拡散に基づく、汎用的でインタラクティブで制御可能なトラフィックシーン生成フレームワークである。
我々は回帰モデルを用いて、一般的な初期解と条件拡散モデルに基づく改良プロセスを提供し、多様性を保証する。
実世界の運転データセットの実験によると、DragTrafficは信頼性、多様性、自由度で既存の手法より優れている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:51:28 GMT)
HierarchicalForecast: A Reference Framework for Hierarchical Forecasting in Python [10.9] HierarchicalForecastライブラリには、公開データセット、評価メトリクス、統計ベースラインモデルのセットが含まれている。
当社のPythonベースの参照フレームワークは,統計的・計量的モデリングと機械学習予測研究のギャップを埋めることを目的としています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:16:00 GMT)
Neural Architecture Search of Hybrid Models for NPU-CIM Heterogeneous AR/VR Devices [10.8] ヘテロジニアスエッジシステムのための効率的なハイブリッドCNN/ViTモデルを設計するためのニューラルネットワーク探索フレームワークであるH4H-NASを紹介する。
Algo/HW共同設計の結果、全体のレイテンシは56.08%、エネルギーは41.72%向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:30:34 GMT)
Moyun: A Diffusion-Based Model for Style-Specific Chinese Calligraphy Generation [10.7] 「もゆん」は、生成過程を効果的に制御し、特定の様式で書を書ける。
書道においても「もゆん」は書道の様式にマッチした書風を書ける。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:14:03 GMT)
Control, Transport and Sampling: Towards Better Loss Design [10.7] 我々は、最適制御されたダイナミクスを介して$nu$から$mu$への輸送に使用できる客観的関数を提案する。
我々は、パスワイズ・パースペクティブの重要性と、パス尺度における様々な最適条件が、有効なトレーニング損失の設計に果たす役割を強調した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:16:30 GMT)
Towards Understanding and Enhancing Security of Proof-of-Training for DNN Model Ownership Verification [10.7] 具体的スキームにインスタンス化できる汎用的学習証明(PoT)の構築を提案する。
我々は,既存のPoTスキームを侵害した攻撃に対して,我々の計画が抵抗可能であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:43:44 GMT)
Towards Understanding and Enhancing Security of Proof-of-Training for DNN Model Ownership Verification [10.7] 具体的スキームにインスタンス化できる汎用的学習証明(PoT)の構築を提案する。
我々は,既存のPoTスキームを侵害した攻撃に対して,我々の計画が抵抗可能であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:43:44 GMT)
Self-Recognition in Language Models [10.6] モデル生成型「セキュリティ問題」を用いたLMの自己認識評価手法を提案する。
現在公開されている最も有能なオープンソースかつクローズドなLMのうち10つにおいて、私たちのテストを使って自己認識を検証しています。
我々の結果は、一組の代替案が与えられた場合、LMはその起源に関係なく「ベスト」な答えを選択しようとすることを示唆している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:07:47 GMT)
Compressing high-resolution data through latent representation encoding for downscaling large-scale AI weather forecast model [10.6] 本稿では,高解像度データセットの圧縮に適した変分オートエンコーダフレームワークを提案する。
本フレームワークは,HRCLDASデータの3年間の保存容量を8.61TBから204GBに削減し,必須情報を保存した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:38:03 GMT)
Active Fourier Auditor for Estimating Distributional Properties of ML Models [10.6] 堅牢性、個人的公正性、グループ的公正性という3つの特性に注目します。
我々は,監査下のMLモデルのフーリエ係数の観点から,異なる特性を定量化する新しいフレームワークを開発する。
我々は、AFAの推定値に基づいて高い確率誤差境界を導出し、サンプルの複雑さに関する最悪の低い境界を検査するために導出する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:57:01 GMT)
Founding Quantum Cryptography on Quantum Advantage, or, Towards Cryptography from $\mathsf{\#P}$-Hardness [10.4] 近年の分離により、階層構造が崩壊しても持続する硬さの源から量子暗号を構築する可能性が高まっている。
量子暗号は、$mathsfP#P notsubseteq mathsf(io)BQP/qpoly$という非常に穏やかな仮定に基づいている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:49:09 GMT)
Are Large Language Models Good Statisticians? [10.4] StatQAは統計解析タスク用に設計された新しいベンチマークである。
GPT-4oのような最先端モデルでさえ、64.83%の最高の性能を実現していることを示す。
オープンソースのLLMは限られた能力を示すが、細調整されたものは顕著に改善されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:01:10 GMT)
PEDANTS: Cheap But Effective Answer Equivalence [10.4] 我々は,Triviaコミュニティで採用されているマシンQAを評価するために,ルーリックとデータセットを提供する。
また、正確なマッチングとニューラルメソッド(BERTScore)よりも安定な、効率的で解釈可能なQA評価を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:41:07 GMT)
Time Traveling to Defend Against Adversarial Example Attacks in Image Classification [10.4] 敵の例による攻撃は、機械学習にとって重要な脅威として浮上している。
画像分類における敵対的攻撃は、画像分類ニューラルネットワークを混乱させる画像への様々な小さな修正を悪用する。
この研究は「タイムトラベル」の概念を導入し、誰にでもアクセス可能な歴史的ストリートビュー画像を用いて、同じ標識の異なる過去のバージョンで推論を行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:56:28 GMT)
An $α$-regret analysis of Adversarial Bilateral Trade [10.3] 我々は、売り手と買い手のバリュエーションが完全に任意であるシーケンシャルな二国間取引を調査する。
我々は、社会福祉よりも近づきにくい貿易からの利益を考えます。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:27:18 GMT)
How Does Diverse Interpretability of Textual Prompts Impact Medical Vision-Language Zero-Shot Tasks? [10.1] 近年の医用視力訓練の進歩は、ゼロショットの医療用視力タスクを大幅に強化した。
これらのタスクのパフォーマンスは、カテゴリを記述するテキストプロンプトの変動性に大きく影響される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:31:49 GMT)
Can Large Language Models Understand DL-Lite Ontologies? An Empirical Study [10.1] 大規模モデル(LLM)は、幅広いタスクを解く上で大きな成果を上げている。
我々は、記述論理(DL-Lite)を理解するLLMの能力を実証的に分析する。
LLMは概念と役割の形式的構文とモデル理論的意味論を理解する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:03:07 GMT)
Multi-Agent Causal Discovery Using Large Language Models [10.0] 大規模言語モデル(LLM)は因果発見タスクにおいて大きな可能性を証明している。
本稿では,この可能性を検討するための一般的な枠組みを紹介する。
提案フレームワークは,LSMの専門知識,推論能力,マルチエージェント協調,統計的因果的手法を効果的に活用することで,有望な結果を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:48:42 GMT)
VoxelPrompt: A Vision-Language Agent for Grounded Medical Image Analysis [9.9] VoxelPromptは、自然言語、画像ボリューム、分析メトリクスの合同モデリングを通じて、様々な放射線学的な課題に取り組む。
我々は,VoxelPromptが数百の解剖学的,病理学的特徴を記述し,多くの複雑な形態的特性を計測し,病変の特徴をオープン言語で解析できることを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:11:43 GMT)
Ormer: A Manipulation-resistant and Gas-efficient Blockchain Pricing Oracle for DeFi [9.9] 現在、算術平均時間重み付き平均価格(TWAP)オーラクルは、プロトコルの実行に信頼性がありガス効率の高い固定時間フレームで外部価格データを平均化することで、DeFiにおいて広く使用されている。
本稿では,一括パラボリック式に基づいて,現在のストリーミング資産価格の中央値の予測を抑える新しいオンチェーンガス効率価格アルゴリズム(Ormer)を提案する。
評価の結果,Ormerは平均絶対価格誤差を15.3%,時間遅延を49.3%削減した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:18:00 GMT)
A Comprehensive Survey on Joint Resource Allocation Strategies in Federated Edge Learning [9.8] Federated Edge Learning (FEL)は、分散環境でのモデルトレーニングを可能にすると同時に、ユーザデータの物理的分離を利用することで、ユーザのプライバシを確保する。
IoT(Internet of Things)やSmart Earthといった複雑なアプリケーションシナリオの開発により、従来のリソース割り当てスキームは、これらの増大する計算および通信要求を効果的にサポートすることができなくなった。
本稿では,複数の資源需要が増大する中で,計算と通信の多面的課題を体系的に解決する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:02:00 GMT)
TurboRAG: Accelerating Retrieval-Augmented Generation with Precomputed KV Caches for Chunked Text [9.8] 現在のRetrieval-Augmented Generation (RAG)システムは、プリフィルのために多数の検索された文書チャンクを処理する。
本稿では,新しいRAGシステムであるTurboRAGを紹介する。
一連のRAGベンチマークによる実験の結果、TurboRAGは従来のRAGシステムと比較してTTFTを最大9.4倍削減することが示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:52:54 GMT)
Edu-Values: Towards Evaluating the Chinese Education Values of Large Language Models [9.8] 大規模言語モデルのアライメント能力を測定するために設計された,中国初の教育価値評価ベンチマークであるEdu-Valuesを提案する。
我々は,複数の選択,多モーダルな質問応答,主観的分析,敵対的プロンプト,伝統的な中国文化に関する質問など,1,418の質問を慎重に設計・コンパイルする。
教育文化の相違により、中国語のLLMは英語のLLMを大きく上回り、Qwen 2は81.37でランクインした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:58:35 GMT)
Edu-Values: Towards Evaluating the Chinese Education Values of Large Language Models [9.8] 大規模言語モデルのアライメント能力を測定するために設計された,中国初の教育価値評価ベンチマークであるEdu-Valuesを提案する。
我々は,複数の選択,多モーダルな質問応答,主観的分析,敵対的プロンプト,伝統的な中国文化に関する質問など,1,418の質問を慎重に設計・コンパイルする。
教育文化の相違により、中国語のLLMは英語のLLMを大きく上回り、Qwen 2は81.37でランクインした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:58:35 GMT)
Optimality of meta-converse for channel simulation [9.7] 単発設定におけるノイズレス通信を用いたチャネルシミュレーション問題に対する共有非シグナリング相関の効果について検討する。
古典的なチャネルでは、任意の非シグナリング支援シミュレーション戦略を、共有ランダム性のみを使用する戦略に丸める方法を示す。
量子チャネルでは、共有エンタングルメントのみを使用する戦略に、任意の非シグナリング支援シミュレーション戦略を丸めます。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:24:04 GMT)
Hierarchical Hypercomplex Network for Multimodal Emotion Recognition [9.5] 相関関係をフルに捉えるために,階層的な学習構造を持つ完全超複雑ネットワークを導入する。
提案アーキテクチャは感情認識のためのMAHNOB-HCIデータセットの最先端モデルを上回る。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:35:49 GMT)
Markov Decision Processes under External Temporal Processes [9.4] 本研究では,マルコフ決定過程(MDP)を外的時間的プロセスの影響下で研究する。
本稿では,この問題を解決するためのポリシー反復アルゴリズムを提案し,その性能を理論的に解析する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:07:41 GMT)
Rewriting Conversational Utterances with Instructed Large Language Models [9.4] 大規模言語モデル(LLM)は多くのNLPタスクで最先端のパフォーマンスを達成することができる。
本稿では,最高の検索性能をもたらす最も情報に富んだ発話を提示する手法について検討する。
その結果、LLMによる会話音声の書き直しは、MRRで25.2%、Precision@1で31.7%、NDCG@3で27%、Recall@500で11.5%の大幅な改善が達成された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:30:28 GMT)
Neuroplastic Expansion in Deep Reinforcement Learning [9.3] 本稿では,認知科学における皮質拡大に触発された新しいアプローチであるNeuroplastic Expansion(NE)を提案する。
NEは、ネットワークを小さな初期サイズからフル次元に動的に拡大することにより、トレーニングプロセス全体を通して学習性と適応性を維持する。
本手法は, 1) 電位勾配に基づく弾性ニューロン生成, (2) ネットワーク表現性を最適化するための休眠ニューロンプルーニング, (3) 経験的考察によるニューロン統合の3つの重要な要素で設計されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:51:14 GMT)
Study of Attacks on the HHL Quantum Algorithm [9.2] この研究は、クラウドベースの量子コンピュータに展開される可能性のある2種類の潜在的な攻撃の探索に焦点を当てている。
Improper Initialization Attack (IIA) と Higher Energy Attack (HEA) と呼ばれるこの2つの攻撃は、よく知られ広く使われている量子アルゴリズム HHL に初めて適用される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:08:21 GMT)
ByteCheckpoint: A Unified Checkpointing System for Large Foundation Model Development [9.1] ByteCheckpoint は大規模 LFM トレーニングのための産業レベルのチェックポイントシステムである。
ByteCheckpoint はチェックポイントストールを著しく減少させ、平均54.20倍の減少を達成する。
ByteCheckpointは、保存時間とロード時間を最大9.96倍と8.80倍に改善した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:29:09 GMT)
Evaluating Differentially Private Synthetic Data Generation in High-Stakes Domains [9.1] 実データの代わりに、微分プライベート言語モデルから生成された合成データを用いて、高速領域におけるNLPの開発を容易にする可能性について検討する。
以上の結果から,従来の簡易評価では,合成データの有用性,プライバシ,公平性を強調できなかったことが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:31:02 GMT)
Benchmarking Attacks on Learning with Errors [9.0] 誤りを伴う学習(LWE)に基づく格子暗号スキームは、後量子暗号システムとして使われるためにNISTによって標準化されている。
標準化されたパラメータのLWEシークレットリカバリのための最初のベンチマークを、小さくて低ウェイトな(スパースな)シークレットに対して提供します。
SALSAとCool & Cruelの攻撃を大きな形で拡張し、MitM攻撃の実装とスケールアップを初めて行います。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:48:45 GMT)
QGEval: Benchmarking Multi-dimensional Evaluation for Question Generation [9.0] 人間の評価は質問生成(QG)の分野で広く使われており、自動メトリクスのゴールドスタンダードとして機能している。
統一された評価基準が欠如しており、QGモデルと自動メトリクスの両方の一貫性のある評価を妨げている。
質問生成のための多次元評価ベンチマークであるQGEvalを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:12:23 GMT)
RAB$^2$-DEF: Dynamic and explainable defense against adversarial attacks in Federated Learning to fair poor clients [8.6] 異なるソースデータシナリオから派生した、データのプライバシに関する問題に対する解決策として、フェデレートラーニング(Federated Learning)が提案されている。
RAB$2$-DEF, a $textbfr$esilient $textbfa$gainst $textbfbtextyzantine$および $textbfb$ackdoor 攻撃を提案する。
画像データセットにおけるRAB$2$-DEFの性能と、最先端の防御を考慮したバイザンチンおよびバックドアアタックの性能を検証した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:32:59 GMT)
Generalized Out-of-distribution Fault Diagnosis (GOOFD) via Internal Contrastive Learning [8.6] 本稿では,診断サブタスクを統合するために,一般化されたアウト・オブ・ディストリビューション障害診断フレームワークを提案する。
内部のコントラスト学習とマハラノビス距離に基づく統一的な断層診断手法が提案手法の基盤となる。
提案手法は,複数の故障診断タスクに適用可能であり,既存の単一タスク法よりも優れた性能を実現することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:35:52 GMT)
FedEP: Tailoring Attention to Heterogeneous Data Distribution with Entropy Pooling for Decentralized Federated Learning [8.6] 本稿では,新しいDFL集約アルゴリズムFederated Entropy Pooling (FedEP)を提案する。
FedEPは、実際のデータではなく、局所分布の統計特性を取り入れることで、クライアントのドリフト問題を緩和する。
実験により、FedEPは最先端のアプローチよりも早く収束し、高いテスト性能を示すことが示されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:39:15 GMT)
Don't Look into the Dark: Latent Codes for Pluralistic Image Inpainting [8.6] 本稿では,離散潜在符号の生成枠組みに基づく大規模マスク多元画像の描画手法を提案する。
本手法は,画像の可視な場所でのみ計算を行うことで,トークンとして識別された遅延先行を学習する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:59:44 GMT)
Judging from Support-set: A New Way to Utilize Few-Shot Segmentation for Segmentation Refinement Process [8.4] セグメンテーションの改良は、セグメンテーションアルゴリズムによって生成された初期粗いマスクを強化することを目的としている。
セグメンテーション改良の成功を判断できる手法は開発されていない。
セグメンテーション・リファインメントの成功を判断する手法であるJFS(Judging From Support-set)を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:24:21 GMT)
Teaching-Inspired Integrated Prompting Framework: A Novel Approach for Enhancing Reasoning in Large Language Models [8.4] 大規模言語モデル(LLM)は、様々な領域で優れたパフォーマンスを示すが、算術的推論タスクに苦戦している。
近年の研究では,推理能力向上における迅速な設計手法の有効性が示されている。
本稿では,教師が指導する指導過程をエミュレートした,新しい効果的な指導インスパイアされた統合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:02:36 GMT)
Plug-and-Play Performance Estimation for LLM Services without Relying on Labeled Data [8.4] 大規模言語モデル(LLM)サービスは、インコンテキスト学習(ICL)による少数の例を活用した、未学習のタスクに印象的な能力を示す。
本稿では,異なるタスクやコンテキストにまたがるLLMサービスの性能を推定する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:15:14 GMT)
Generalizable autoregressive modeling of time series through functional narratives [8.2] 関数空間における異なる強度の作用素を構成することにより、時系列の代替系列を構築する。
我々は、最も単純化された変種から原サンプルを段階的に回収する自己回帰変換器を訓練する。
本結果は,汎用動的学習システムとしてのNoTSの可能性を示すものである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:48:39 GMT)
Food Portion Estimation via 3D Object Scaling [8.2] 本稿では2次元画像から食品の体積とエネルギーを推定する新しい枠組みを提案する。
入力画像中のカメラと食品オブジェクトのポーズを推定する。
また、45の食品の2D画像を含むSimpleFood45という新しいデータセットも導入しました。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:02:07 GMT)
Open-Vocabulary Action Localization with Iterative Visual Prompting [8.1] ビデオアクションのローカライゼーションは、長いビデオから特定のアクションのタイミングを見つけることを目的としている。
本稿では,新たな視覚言語モデルに基づく学習自由でオープンな語彙アプローチを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:22:48 GMT)
Optimal Strategies for Winning Certain Coset-Guessing Quantum Games [8.0] 最近発表されたコセット推測ゲームでは、アリスがボブとチャーリーと対戦し、共同勝利を狙った。
ボブとチャーリーの予想が同時に正しい確率は、m が増加するにつれて指数関数的にゼロとなることを示す。
CNOT と Hadamard ゲートのみを用いた符号化回路を考案した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:42:30 GMT)
Generalization from Starvation: Hints of Universality in LLM Knowledge Graph Learning [8.0] グラフ学習中にニューラルネットワークが知識をどのように表現するかを検討する。
我々は普遍性のヒントを見つけ、同値表現は様々なモデルサイズで学習される。
これらのアトラクタ表現は、一般化を目に見えない例に最適化することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:23:42 GMT)
Global Lyapunov functions: a long-standing open problem in mathematics, with symbolic transformers [8.0] 我々は、Lyapunov関数を発見し、システムのグローバルな安定性を保証するという、数学における長年のオープンな問題を考える。
この問題には既知の一般解はなく、いくつかの小さなアルゴリズム系にのみ存在する。
そこで本研究では,システム上でのシーケンス・ツー・シーケンス・トランスフォーマが,解法や人間よりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:50:10 GMT)
PizzaCommonSense: Learning to Model Commonsense Reasoning about Intermediate Steps in Cooking Recipes [7.8] レシピを効果的に推論するモデルは、レシピ内の中間ステップの入力と出力を正確に識別し、理解する必要がある。
そこで本研究では,各工程の入力と出力を記述した中間ステップを記述した料理レシピの新たなコーパスを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:03:20 GMT)
COMMA: A Communicative Multimodal Multi-Agent Benchmark [7.8] 本稿では,言語コミュニケーションによるマルチモーダルマルチエージェントシステムの協調性能を評価するための新しいベンチマークを提案する。
オープンソースモデルとクローズドソースモデルを用いてエージェントエージェントとエージェント-ヒューマンのコラボレーションをテストすることにより、最先端モデルにおける驚くほどの弱点が明らかとなった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:49:47 GMT)
VerifierQ: Enhancing LLM Test Time Compute with Q-Learning-based Verifiers [7.8] VerifierQは、オフラインQ学習を検証モデルに統合する新しいアプローチである。
LLMにQ-learningを適用する上での3つの課題に対処する。
本手法は,並列Q値計算と学習効率の向上を実現する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:43:55 GMT)
Executing Arithmetic: Fine-Tuning Large Language Models as Turing Machines [7.7] 大規模言語モデル(LLM)は、広範囲の自然言語処理と推論タスクで顕著な機能を示している。
チューリングマシンをエミュレートすることで,LCMがステップバイステップの計算を実行することを学べる構成可能な算術演算フレームワーク(CAEF)を提案する。
評価では, LLaMA 3.1-8B モデル上での7つの一般的な数学的操作に対して, CAEF は100%近い精度を達成している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:23:49 GMT)
SWE-Bench+: Enhanced Coding Benchmark for LLMs [7.6] SWE-benchデータセットは、2,294の現実世界のGitHubイシューとそれに対応するプルリクエストで構成されている。
SWE-Agent+GPT-4の分解率は12.47%から3.97%に減少した。
同様のデータ品質問題は、SWE-bench LiteとSWE-Bench Verifiedの2つの変種にも存在している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:13:09 GMT)
SWE-Bench+: Enhanced Coding Benchmark for LLMs [7.6] SWE-benchデータセットは、2,294の現実世界のGitHubイシューとそれに対応するプルリクエストで構成されている。
SWE-Agent+GPT-4の分解率は12.47%から3.97%に減少した。
同様のデータ品質問題は、SWE-bench LiteとSWE-Bench Verifiedの2つの変種にも存在している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:13:09 GMT)
Exploring ASR-Based Wav2Vec2 for Automated Speech Disorder Assessment: Insights and Analysis [7.6] Wav2Vec2 ASRベースのモデルは、自動音声認識品質評価タスクのために微調整されている。
本稿では,音声品質評価のためのベースラインモデルの最初の解析を行い,知能度と重大度タスクに着目した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:12:17 GMT)
SLIM: Let LLM Learn More and Forget Less with Soft LoRA and Identity Mixture [7.5] 下流タスクのためのモデル全体のトレーニングは費用がかかるため、破滅的な忘れ忘れをしがちです。
我々は,Soft LoRA と Identity Mixture (SLIM) をベースとした,新たな専門家(MoE) フレームワークを提案する。
SLIMはLoRAアダプタとスキップ接続間の動的ルーティングを可能にし、忘れの抑制を可能にする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:16:05 GMT)
Learning from higher-order statistics, efficiently: hypothesis tests, random features, and neural networks [7.5] ニューラルネットワークが高次累積から特徴を抽出する際の効率について検討する。
ニューラルネットワークが2つの分布を2次サンプルの複雑さで区別することを実際に学習していることが示される。
その結果,ニューラルネットワークはスパイクされた累積モデルにおいて,高次相関から情報を効率的に抽出できることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:27:40 GMT)
Remeasuring the Arbitrage and Sandwich Attacks of Maximal Extractable Value in Ethereum [7.4] 最大抽出可能な価値(MEV)は、ブロックチェーンエコシステムの繁栄を促進する。
収集した最大のデータセット上でMEV活動を特定するための収益性同定アルゴリズムを提案する。
私たちはMEVエコシステムの全体像、プライベートトランザクションアーキテクチャがもたらす影響、バックランニングメカニズムの採用を特徴としています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:04:58 GMT)
RMT-BVQA: Recurrent Memory Transformer-based Blind Video Quality Assessment for Enhanced Video Content [7.3] 本稿では,映像コンテンツの改良を目的とした新しいブラインド・ディープ・ビデオ品質評価手法を提案する。
新しいリカレントメモリトランス (Recurrent Memory Transformer, RMT) ベースのネットワークアーキテクチャを使用して、ビデオ品質の表現を得る。
抽出された品質表現は線形回帰によって合成され、ビデオレベルの品質指標を生成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:32:01 GMT)
CLIP Multi-modal Hashing for Multimedia Retrieval [7.3] 本稿では,CLIP Multi-modal Hashing (CLIPMH)法を提案する。
提案手法では,CLIPフレームワークを用いてテキストと視覚の両方の特徴を抽出し,それらを融合してハッシュコードを生成する。
最先端の教師なしおよび教師付きマルチモーダルハッシュ法と比較して,提案したCLIPMHは性能を著しく向上させることができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:13:48 GMT)
SAKA: An Intelligent Platform for Semi-automated Knowledge Graph Construction and Application [7.3] 半自動KG構築・アプリケーション(saka)のためのインテリジェントでユーザフレンドリーなプラットフォームを提案する。
音声データからKGを確立するために,音声に基づくKG情報抽出(AGIE)手法を提案する。
坂プラットフォーム上での半自動KG工法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:37:02 GMT)
Electrical excitation of color centers in phosphorus-doped diamond Schottky diodes [7.3] ダイヤモンドのカラーセンターは、室温と高温で撮影可能なエミッターであるため、有望な候補となっている。
電子ポンプによる色中心の放出を, 水素を媒介したn型ダイヤモンドを用いた新しいショットキーダイオード構成で実証した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:46:08 GMT)
A Practical Guide to Sample-based Statistical Distances for Evaluating Generative Models in Science [7.2] 我々は、異なる方法論を表す統計距離の4つの一般的な概念に焦点を当てる。
それぞれの距離の背後にある直感を強調し、そのメリット、スケーラビリティ、複雑さ、落とし穴を説明します。
我々は、異なる科学的領域、すなわち意思決定のモデルと医療画像の生成モデルから生成モデルを評価する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:51:27 GMT)
From Tokens to Words: on the inner lexicon of LLMs [7.1] 自然言語は単語から成り立っているが、現代のLLMはサブワードを入力として処理する。
本稿では,LLMが単語列をコヒーレントな単語表現に結合する固有デトケン化過程に関与することを示す。
以上の結果から, LLMはトークン化のスコープを超えて, 潜在語彙を保っていることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:41:26 GMT)
From Tokens to Words: On the Inner Lexicon of LLMs [7.1] 自然言語は単語から成り立っているが、現代のLLMはサブワードを入力として処理する。
本稿では,LLMが単語列をコヒーレントな単語表現に結合する固有デトケン化過程に関与することを示す。
以上の結果から, LLMはトークン化のスコープを超えて, 潜在語彙を保っていることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:41:26 GMT)
The Plug-in Approach for Average-Reward and Discounted MDPs: Optimal Sample Complexity Analysis [7.0] 平均回帰マルコフ決定過程において,$varepsilon$-optimal Policyを学習するためのプラグインアプローチのサンプル複雑性について検討した。
この問題の最も単純なアルゴリズムであるにもかかわらず、プラグインのアプローチは理論上は分析されていない。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:08:14 GMT)
MEMS Gyroscope Multi-Feature Calibration Using Machine Learning Technique [7.0] 本研究では、機械学習(ML)を活用し、MEMSジャイロ共振器の複数の信号を用いて校正を改善する。
XGBoostは、高い予測精度と複雑な非線形関係を扱う能力で知られており、校正プロセスを強化するために使われている。
その結果,XGBoostとモデルの両方がノイズを著しく低減し,精度と安定性を向上し,従来のキャリブレーション法よりも優れていた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:21:48 GMT)
Assessing Privacy Policies with AI: Ethical, Legal, and Technical Challenges [6.9] 大きな言語モデル(LLM)は、ユーザのプライバシポリシを自動評価するために使用することができる。
このアプローチの課題を,技術的実現性,倫理的意味,法的適合性の3つの柱で検討する。
本研究は,今後の研究の可能性を特定し,LLM技術の利用に関する議論を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:36:35 GMT)
CrossQuant: A Post-Training Quantization Method with Smaller Quantization Kernel for Precise Large Language Model Compression [6.9] 学習後量子化(PTQ)は大規模言語モデル(LLM)の圧縮に有効な手法である
量子化カーネル (quantization kernel) とは、ゼロに量子化される活性化の要素の集合のことである。
アクティベーションを定量化するシンプルで効果的な方法であるCrossQuantを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:44:24 GMT)
Deconstructing equivariant representations in molecular systems [6.8] 本稿では,QM9データセット上での単純な同変グラフ畳み込みモデルを用いた実験について報告する。
我々の重要な発見は、スカラー予測タスクでは、多くの既約表現はトレーニング中に単純に無視されることである。
経験的に,未使用の球面高調波の除去がモデル性能を向上させることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:15:46 GMT)
Cross-Embodied Affordance Transfer through Learning Affordance Equivalences [6.8] 我々は,物体,行動,効果を,私たちが「空き空間」と呼ぶ共通潜在空間内の1つの潜在ベクトルに統一するディープニューラルネットワークモデルを提案する。
我々のモデルは、一つのエージェントによって実行される個々のオブジェクトの振舞いを学習しない。
Affordance Equivalenceは、オブジェクトに対するアクションの一般化だけでなく、異なるロボットのアクションをリンクするクロス・エボディメント・トランスファーも促進する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:18:06 GMT)
Robustness Auditing for Linear Regression: To Singularity and Beyond [6.8] サンプル除去に対する線形回帰のロバスト性を検証するための効率的なアルゴリズムを提案する。
アルゴリズムを実装し、数百の次元を持ついくつかのランドマークなエコノメトリデータセット上で実行します。
データセット上の分布的仮定の下では、我々のアルゴリズムが生成する境界は1 + o(1)$乗算係数まできついことが証明される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:40:52 GMT)
Robust AI-Generated Text Detection by Restricted Embeddings [6.7] 我々は、AI生成したテキストの検出器の堅牢性、すなわち、目に見えないジェネレータやセマンティックドメインに転送する能力に焦点を当てる。
有害な線形部分空間の除去は、ドメイン固有のスプリアス機能を無視したロバストな分類器の訓練に役立つことを示す。
頭部および座標に基づく部分空間除去のための最良のアプローチは、平均分布分布(OOD)分類スコアを9%、特に14%向上させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:58:42 GMT)
Amplifying Main Memory-Based Timing Covert and Side Channels using Processing-in-Memory Operations [6.7] 本稿では,PIM(Processing-in-Memory)ソリューションが,悪質なユーザアプリケーションが悪用できるメインメモリに直接アクセスする新しい方法を提供することを示す。
本稿では,ハイスループットな主メモリベースのタイミングアタックであるIMPACTを導入し,PiMアーキテクチャの特性を活用して秘密チャネルとサイドチャネルを確立する。
以上の結果から,我々はそれぞれ12.87 Mb/s,14.16 Mb/sの通信スループットを達成できた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:57:34 GMT)
Theia: Distilling Diverse Vision Foundation Models for Robot Learning [6.7] Theiaは、さまざまな視覚タスクで訓練された複数の市販の視覚基礎モデルを蒸留する、ロボット学習のためのビジョン基礎モデルである。
テアの豊かな視覚表現は多様な視覚知識をエンコードし、下流のロボット学習を強化する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:27:46 GMT)
Benchmarking Counterfactual Interpretability in Deep Learning Models for Time Series Classification [6.7] Counterfactual (CF) メソッドは、モデル予測を変更するインスタンスの最小限の変更を識別するために使用される。
大規模な研究にもかかわらず、時系列領域におけるCFメソッドの既存のベンチマークは存在しない。
本研究では,CFの望ましい特性を正確に把握するために,定量的なメトリクスを再設計する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:52:38 GMT)
Neural Operators Learn the Local Physics of Magnetohydrodynamics [6.6] 磁気流体力学(MHD)は、プラズマと導電性流体の力学を記述する上で重要な役割を果たしている。
最近の進歩は、従来の数値解析のための代理モデルとしてフーリエニューラル演算子(FNO)のようなニューラル演算子を導入している。
本研究では, 理想的なMHDの数値フラックスを近似するために, 修正されたフラックスフーリエニューラル演算子モデルについて検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:19:57 GMT)
Minimax Hypothesis Testing for the Bradley-Terry-Luce Model [6.6] ブラッドリー・テリー・ルーシ(Bradley-Terry-Luce、BTL)モデルは、アイテムやエージェントのコレクションをランク付けする最も広く使われているモデルの一つである。
与えられたペア比較データセットとエージェントペアあたりの$k$の比較が、基礎となるBTLモデルに由来するかどうかを判定する仮説テストを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:28:05 GMT)
Human Stone Toolmaking Action Grammar (HSTAG): A Challenging Benchmark for Fine-grained Motor Behavior Recognition [6.3] Human Stone Toolmaking Action Grammar (HSTAG) は18,739本のビデオクリップで構成され、石器製作における専門家の活動の4.5時間を記録している。
HSTAGは、2つのハンドヘルドオブジェクト間の複雑な相互作用の迅速な継承を理解するために、高度な人工知能技術の応用を調査するために使用することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:57:11 GMT)
DualStreamFoveaNet: A Dual Stream Fusion Architecture with Anatomical Awareness for Robust Fovea Localization [6.3] マルチキュー核融合のためのDualStreamFoveaNet (DSFN) と呼ばれる新しいトランスフォーマーアーキテクチャを提案する。
このアーキテクチャは、網膜と血管の分布を用いた長距離接続とグローバルな特徴をはっきりと組み込んで、堅牢な葉の局在を図っている。
DSFNは、正常な網膜像と疾患のある網膜像の両方においてより堅牢であり、クロスデータセット実験においてキャパシティの一般化がより優れていることを実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:07:21 GMT)
Adam Exploits $\ell_\infty$-geometry of Loss Landscape via Coordinate-wise Adaptivity [6.3] 好ましくは $ell_infty$-geometry が SGD であるのに対して、Adam は影響を受けていない。
我々の実験は、好ましくは $ell_infty$-geometry が SGD であるのに対して、Adam が影響を受けていない場合、さらに悪化することを確認した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:58:53 GMT)
HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning [6.3] Heuristic Behavior Tree Planning (HBTP) はBT生成のための信頼性と効率的なフレームワークである。
本稿では,BT拡張プロセスと最適計画と満足度計画のための2つの変種を紹介する。
実験では、HBTPの理論的限界を示し、4つのデータセットから得られた結果により、日々のサービスロボット応用における実用性が確認された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:36:53 GMT)
Simultaneous Weight and Architecture Optimization for Neural Networks [6.2] アーキテクチャとパラメータを勾配降下と同時に学習することで、プロセスを変換する新しいニューラルネットワークトレーニングフレームワークを導入する。
このアプローチの中心はマルチスケールエンコーダデコーダで、エンコーダは互いに近くにある同様の機能を持つニューラルネットワークのペアを埋め込む。
実験により、我々のフレームワークは、高性能を維持しているスパースでコンパクトなニューラルネットワークを発見できることを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:57:36 GMT)
Closing the Loop: Learning to Generate Writing Feedback via Language Model Simulated Student Revisions [6.2] 本稿では,LM シミュレーションによる学生のリビジョンの学習を通じてフィードバックを生成できる ProF を提案する。
本稿では,PROFの有効性を実証的に検証し,本手法が学生の筆跡改善に有効であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:52:48 GMT)
Why do objects have many names? A study on word informativeness in language use and lexical systems [6.2] 視覚空間に接する単語や語彙システムの情報度を簡易に測定し,英語と中国語のカラー命名データを解析する。
最適な語彙システムは複数の単語が同じ参照語に適用でき、異なる量の情報を伝達できるものであると結論付けている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:29:08 GMT)
Microwave-activated two-qubit gates for fixed-coupling and fixed-frequency transmon qubits [6.2] 本研究では、固定周波数トランスモンカプラを介して結合された2つの固定周波数トランスモンキュービットに対するマイクロ波活性化2量子ゲート方式を提案する。
その結果, 脱コヒーレンス効果を除いて, 0.999以上のゲート忠実度を150 ns以内で達成できることが判明した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:04:34 GMT)
MorCode: Face Morphing Attack Generation using Generative Codebooks [6.2] 顔認識システムは、顔形態攻撃によって損なわれる可能性がある。
顔の自動モーフィング生成手法である textitMorCode について述べる。
提案手法であるtextitMorCode の攻撃電位を3種類の顔認識システムを用いてベンチマークした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:33:32 GMT)
Efficient Perspective-Correct 3D Gaussian Splatting Using Hybrid Transparency [6.1] 3D Gaussian (3DGS)は、リバースレンダリングとリアルタイムなシーン探索の両方のために、多用途レンダリングプリミティブを証明している。
最近の研究は多視点コヒーレンスを損なうアーティファクトを緩和し始めており、その中には不整合な透明性ソートや2Dスプラットの視点修正アウトラインによるアーティファクトのポップアップが含まれていた。
本研究では, リアルタイムフレームレートを維持するために, 高精度なブレンディング, ハイブリッド透明性の高精度な近似を用いて, 完全視点補正された3次元ガウスアンを最大コヒーレンスを達成することを目的としている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:14:16 GMT)
A note on the VC dimension of 1-dimensional GNNs [6.1] グラフニューラルネットワーク(GNN)は,グラフ構造化データを解析するための重要なツールとなっている。
本稿では,GNNの一般化について,Vapnik-Chervonenkis(VC)次元について検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:33:15 GMT)
Optical ISAC: Fundamental Performance Limits and Transceiver Design [6.0] 本稿では,光学的ポイント・ツー・ポイントシステムにおける最適容量・歪み(C-D)トレードオフを特徴付ける。
最適率歪み(R-D)領域を考察し、いくつかの内外境界(OB)を探索する。
本稿では,Blahut-Arimoto型アルゴリズム (BAA) 方式と,メモリ効率の高い閉形式 (CF) 方式の2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:58:36 GMT)
Optical ISAC: Fundamental Performance Limits and Transceiver Design [6.0] 本稿では,光ポイントツーポイントシステムにおける最適容量歪み(C-D)トレードオフを特徴付ける。
我々は、最適速度歪み(R-D)領域を考察し、いくつかの内外境界(OB)を探索する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:58:36 GMT)
HiFiSeg: High-Frequency Information Enhanced Polyp Segmentation with Global-Local Vision Transformer [6.0] HiFiSegは、高周波情報処理を強化する、大腸ポリープセグメンテーションのための新しいネットワークである。
GLIMは並列構造を用いてグローバルおよびローカル情報を複数のスケールで融合し、より微細な特徴を効果的にキャプチャする。
SAMは、高レベルの特徴からのセマンティック情報と低レベルの特徴から境界の詳細を選択的に統合し、ポリープを正確に検出し、セグメント化するモデルの能力を大幅に改善する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:43:47 GMT)
HiFiSeg: High-Frequency Information Enhanced Polyp Segmentation with Global-Local Vision Transformer [6.0] HiFiSegは、高周波情報処理を強化する、大腸ポリープセグメンテーションのための新しいネットワークである。
GLIMは並列構造を用いてグローバルおよびローカル情報を複数のスケールで融合し、より微細な特徴を効果的にキャプチャする。
SAMは、高レベルの特徴からのセマンティック情報と低レベルの特徴から境界の詳細を選択的に統合し、ポリープを正確に検出し、セグメント化するモデルの能力を大幅に改善する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:43:47 GMT)
Efficient Generation of Molecular Clusters with Dual-Scale Equivariant Flow Matching [5.9] トレーニングと推論を粗い粒度と全原子ステージに分離する2次元フローマッチング法を開発した。
MDシミュレーションにより得られたY6分子クラスターのデータセット上で,本手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:17:27 GMT)
GameTraversalBenchmark: Evaluating Planning Abilities Of Large Language Models Through Traversing 2D Game Maps [5.9] 大規模言語モデル(LLM)は、最近、自然言語の生成と理解において大きな成功を収めた。
多様な2次元グリッドベースのゲームマップからなるベンチマークであるGameTraversalBenchmark (GTB)を提案する。
GPT-4-TurboはGTB_Score(GTBS)で44.97%の最高スコアを記録した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:54:28 GMT)
What makes a language easy to deep-learn? Deep neural networks and humans similarly benefit from compositional structure [5.9] 言語の基本的性質は、その構成構造であり、人間は新しい意味の形を作ることができる。
人間にとって、より構成的で透明な構造を持つ言語は、不透明で不規則な構造を持つ言語よりも学習しやすい。
この学習可能性の利点は、人間の言語学習のモデルとしての使用を制限するディープニューラルネットワークでは、まだ示されていない。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:43:58 GMT)
Metalic: Meta-Learning In-Context with Protein Language Models [5.9] このような予測タスクの有望なテクニックとして機械学習が登場した。
データ不足のため、私たちはメタラーニングがタンパク質工学の進歩に重要な役割を果たすと信じています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:19:35 GMT)
System-2 Reasoning via Generality and Adaptation [5.8] 本稿では,システム2推論の高度化における既存手法の限界について考察する。
これらのギャップに対処するための4つの重要な研究指針を提案する。
我々は,AI(Artificial General Intelligence, AGI)に必要な推論能力に,計算モデルを近づけることで,一般化と適応の能力の向上を目指している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:34:25 GMT)
Unpaired Image Translation to Mitigate Domain Shift in Liquid Argon Time Projection Chamber Detector Responses [5.8] ドメインシフト問題」は、アルゴリズムがシミュレーションデータに基づいて訓練されるが、実際のデータセットに適用される多くの科学領域で一般的である。
この研究は、ダウンストリームアルゴリズムに特有でないドメインシフト問題を解決するために、代替手法を使用することの可能性を探る。
提案手法は、教師なしの方法で異なる画像領域間の翻訳を見つけるために設計された、最新の画像から画像への翻訳技術に依存している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:48:42 GMT)
Learning Tree Pattern Transformations [5.8] ツリー$t$が別のツリー$t*$と構造的に異なる理由と理由を説明することは、コンピュータサイエンス全体で遭遇する問題である。
本稿では,サンプルデータから木組間の構造的差異を説明する方法について考察する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:20:57 GMT)
LADIMO: Face Morph Generation through Biometric Template Inversion with Latent Diffusion [5.6] 顔改ざん攻撃は、顔認識システムに深刻なセキュリティ脅威をもたらす。
本稿では,2つの顔認識の埋め込みにおいて,表現レベルの顔形態形成手法であるLADIMOを提案する。
顔形態変種は個々の攻撃成功率を持ち、形態的攻撃ポテンシャルを最大化できることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:41:37 GMT)
Multi-Scale Deformable Transformers for Student Learning Behavior Detection in Smart Classroom [5.5] マルチスケール変形型変圧器(SCB-DETR)を用いた学生の学習行動検出について紹介する。
この技術は、学生の行動分析のための堅牢なソリューションを提供することにより、マルチスケールおよび隠蔽対象の検出能力を著しく改善する。
SCB-DETRは平均平均精度(mAP)が0.626で、これはベースラインモデルのmAPよりも1.5%改善され、AP50は6%増加した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:51:57 GMT)
On Wagner's k-Tree Algorithm Over Integers [5.4] k-Tree は平均ケース k-SUM 問題に対する非自明なアルゴリズムである。
入力リストのサイズがこれよりもかなり大きい場合、高い確率で成功することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:55:21 GMT)
Continual Learning in Medical Image Analysis: A Comprehensive Review of Recent Advancements and Future Prospects [5.4] 継続的学習は、統一的で持続可能な深層モデルを開発するための重要なアプローチとして現れてきた。
本稿では,医用画像解析に応用した継続的学習技術の現状を概観する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:30:21 GMT)
Continual Learning in Medical Image Analysis: A Comprehensive Review of Recent Advancements and Future Prospects [5.4] 継続的学習は、統一的で持続可能な深層モデルを開発するための重要なアプローチとして現れてきた。
本稿では,医用画像解析に応用した継続的学習技術の現状を概観する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:30:21 GMT)
Identifying Money Laundering Subgraphs on the Blockchain [5.4] 反マネーロンダリングには、金融活動におけるマネーロンダリング犯罪の特定が含まれる。
最近の研究では、グラフベースの機械学習のレンズを通してAMLが進歩している。
RevTrackはグラフベースのフレームワークで、低コストで高精度な大規模AML分析を可能にする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:01:14 GMT)
Medical Image Quality Assessment based on Probability of Necessity and Sufficiency [5.2] 因果推論の概念に基づくMIQAフレームワークを提案する。
PNSは、必要な(常に結果に存在している)機能セットと十分な(結果を保証することができる)機能セットの両方を計測します。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:01:57 GMT)
CoSS: Co-optimizing Sensor and Sampling Rate for Data-Efficient AI in Human Activity Recognition [5.2] ニューラルネットワークの最近の進歩は、複数の時系列センサーを用いた人間の活動認識を大幅に改善した。
高周波サンプリングレートの多数のセンサを用いることで結果が向上するが、多くの場合、データ非効率性とANNの不要な拡張につながる。
本稿では,HARタスクにおけるデータ効率向上のための実用的フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:18:58 GMT)
EvGGS: A Collaborative Learning Framework for Event-based Generalizable Gaussian Splatting [5.2] 本稿では,EvGGSと呼ばれるイベントベース汎用3D再構成フレームワークを提案する。
フィードフォワード方式でイベント入力のみから3Dガウスとしてシーンを再構築する。
提案手法は, 再現性, 深度・強度予測において, 良好な速度で全てのベースラインより優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:41:26 GMT)
Enhancing Language Model Reasoning via Weighted Reasoning in Self-Consistency [5.1] Wang氏らの自己整合性フレームワークは、多数決を受ける前に複数の論理をサンプリングすることで、様々なクローズドな回答の推論タスクにおけるモデルパフォーマンスが確実に向上することを示している。
我々の研究は、多数決を下す前に、最終的な決定に加えて、これらの理性の両方の理性経路を取り入れ、分析することによって、このアプローチを強化します。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:58:48 GMT)
Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decomposition [4.9] 有限水平マルコフ決定過程(MDPs)に対するオンラインQ-ラーニングのための2つの重要なアルゴリズムのギャップ依存境界について検討する。
本稿では, UCB-Advantage と Q-EarlySettled-Advantage のギャップ依存的再帰境界を, 対数的に$T$で証明する新しい誤り分解フレームワークを開発する。
また, UCB-Advantage の政策切替コストのギャップ依存境界を確立し, 最悪の MDP でそれを改善する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:19:46 GMT)
Emergence of the Gibbs ensemble as a steady state in Lindbladian dynamics [4.9] 我々は、ギブスアンサンブルを特徴とするリンドブラッドマスター方程式のユニークな非平衡定常状態(NESS)を明示的に構成する。
XXモデルとフレドキンモデルを研究することにより、ギブス状態がユニークな定常状態としてどのように現れるかを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:12:12 GMT)
LaB-CL: Localized and Balanced Contrastive Learning for improving parking slot detection [4.8] 駐車スロット検出, 局所化, バランス付きコントラスト学習(LaB-CL)のための最初の教師付きコントラスト学習フレームワークを提案する。
提案するLaB-CLフレームワークは2つの主要なアプローチを用いており、まず、局所的な視点から各ミニバッチの全てのクラスから表現を考察するクラスプロトタイプを含める。次に、高い予測誤差で局所表現を選択できる新しいハードネガティブサンプリングスキームを提案する。ベンチマークデータセットを用いた実験により、提案したLaB-CLフレームワークは、既存の駐車スロット検出方法より優れていることを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:50:26 GMT)
Revisiting Logistic-softmax Likelihood in Bayesian Meta-Learning for Few-Shot Classification [4.8] ロジスティック・ソフトマックスは、多クラスガウス過程分類におけるソフトマックス可能性の代替としてしばしば用いられる。
我々は,温度パラメータによるテクティタ事前信頼度を制御できるロジスティック・ソフトマックスの可能性を再検討し,再検討する。
提案手法では, 精度の高い不確実性推定値が得られ, 標準ベンチマークデータセットにおいて, 同等あるいは優れた結果が得られる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:32:36 GMT)
Towards Trustworthy Web Attack Detection: An Uncertainty-Aware Ensemble Deep Kernel Learning Model [4.8] 本稿では,Web攻撃を検出するために,不確実性を意識したEnsemble Deep Kernel Learning(UEDKL)モデルを提案する。
提案したUEDKLは、ディープカーネル学習モデルを用いて、通常のHTTPリクエストと異なるタイプのWeb攻撃を区別する。
BDCIとSRBHデータセットの実験により、提案したUEDKLフレームワークは、Web攻撃検出性能と不確実性推定品質の両方に大きな改善をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:47:55 GMT)
Thought2Text: Text Generation from EEG Signal using Large Language Models (LLMs) [4.7] 本稿では、この目的を達成するために、脳波データを微調整した命令調整大型言語モデル(LLM)を用いたThought2Textを提案する。
画像刺激を伴う6人の被験者を対象に収集したパブリック脳波データセットによる実験により,マルチモーダルLLMの有効性が示された。
このアプローチは、ニューロサイエンスと自然言語処理(NLP)の両方に潜在的に応用可能なポータブルで低コストな「テキストへの思考」技術への大きな進歩を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:47:59 GMT)
ICPR 2024 Competition on Multiple Sclerosis Lesion Segmentation -- Methods and Results [4.7] このコンペティションは、MRIスキャンで複数の硬化病変を自動的に分類する手法を開発することを目的としていた。
MSLesSegは、患者の未検査コホートの多発性硬化病変を独立に分断できるアルゴリズムの開発に重点を置いている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:49:47 GMT)
Metamizer: a versatile neural optimizer for fast and accurate physics simulations [4.7] 本稿では,広範囲の物理システムを高精度で反復的に解く,新しいニューラルネットワークであるMetamizerを紹介する。
我々は,メタマイザがディープラーニングに基づくアプローチにおいて,前例のない精度で達成できることを実証した。
以上の結果から,メタミザーは将来の数値解法に大きな影響を与える可能性が示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:54:31 GMT)
Electronic structure prediction of medium and high entropy alloys across composition space [4.6] 本研究では,集中型合金の組成空間における電子密度を予測するための機械学習モデルを提案する。
トレーニングデータ要求を最小限に抑えるためにベイジアンアクティブラーニング(AL)を採用している。
本モデルでは, 電子密度とエネルギーの両方を合成空間にわたって予測する際の精度と一般化性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:29:31 GMT)
RealVul: Can We Detect Vulnerabilities in Web Applications with LLM? [4.5] 本稿では,PHP 脆弱性検出用に設計された最初の LLM ベースのフレームワークである RealVul を紹介する。
コードの合理化と不要なセマンティック情報を排除しながら、潜在的な脆弱性トリガを分離できます。
また、データ合成法の改善により、PHPの脆弱性サンプルが不足している問題にも対処する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:16:34 GMT)
Holographic View of Mixed-State Symmetry-Protected Topological Phases in Open Quantum Systems [4.4] D次元混合対称性保護位相(mSPTs)と(d+1)次元サブシステム対称性保護位相(SSPTs)のホログラフィック双対性を確立する。
具体的には、サブシステム対称性を持つ(d+1)次元SSPTの境界層の還元密度行列が、強い$mathcalS$と弱い$mathcalG$対称性を持つd次元mSPTに対応することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:42 GMT)
TiM4Rec: An Efficient Sequential Recommendation Model Based on Time-Aware Structured State Space Duality Model [4.4] 線形計算複雑性を特徴とするマンバアーキテクチャが出現した。
Mamba 1のハードウェア対応アルゴリズムは、現代の行列計算ユニットを効率的に活用するのに苦労している。
本稿では,SSDアーキテクチャの低次元性能損失を改善するため,新しいレコメンデーションバックボーンモデルTiM4Recを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:10:50 GMT)
Improved Estimation of Ranks for Learning Item Recommenders with Negative Sampling [4.3] レコメンデーションシステムでは、推奨アイテムの数が増加している。
このコストを下げるために、ネガティブな項目をサンプリングすることが一般的になった。
本研究では, 負のサンプリングによって生じるバイアスの補正の利点を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:58:55 GMT)
TRIAGE: Ethical Benchmarking of AI Models Through Mass Casualty Simulations [4.3] 本稿では,MLMが大量事故時に倫理的判断を下す能力をテストする,新しい機械倫理(ME)ベンチマークであるTRIAGE Benchmarkを提案する。
現実の倫理的ジレンマと医療専門家が設計した明確なソリューションを使用しており、アノテーションベースのベンチマークよりも現実的な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:06:12 GMT)
Variational Inequality Methods for Multi-Agent Reinforcement Learning: Performance and Stability Gains [4.2] 本稿では,変分不等式(VI)に基づく多エージェント強化学習(MARL)の改善の可能性について検討する。
シングルエージェントとマルチエージェントの両方の設定に対してアクター・クリティカル・アルゴリズムの VI 改訂を提案する。
我々は, nLA-VI, EG, および LA-MADDPG, EG-MADDPG, LA-EG-MADDPG という2つの組み合わせを用いた3つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:34:14 GMT)
Towards Full-parameter and Parameter-efficient Self-learning For Endoscopic Camera Depth Estimation [4.2] 内視鏡的深度推定のための全パラメータおよびパラメータ効率学習フレームワークを提案する。
第1段階では、注意、畳み込み、多層知覚のサブ空間が異なるサブ空間内に同時に適応される。
第2段階では,部分空間合成におけるメモリ効率の最適化が提案され,性能がさらに向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:48:46 GMT)
Towards Full-parameter and Parameter-efficient Self-learning For Endoscopic Camera Depth Estimation [4.2] 内視鏡的深度推定のための全パラメータおよびパラメータ効率学習フレームワークを提案する。
第1段階では、注意、畳み込み、多層知覚のサブ空間が異なるサブ空間内に同時に適応される。
第2段階では,部分空間合成におけるメモリ効率の最適化が提案され,性能がさらに向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:48:46 GMT)
Large Legislative Models: Towards Efficient AI Policymaking in Economic Simulations [4.2] AIポリシー作成は、大規模にデータを処理する能力を通じて、人間のパフォーマンスを上回る可能性を秘めている。
既存のRLベースの手法では、サンプルの非効率性が示され、意思決定プロセスにニュアンス情報を柔軟に組み込むことができないことにより、さらに制限される。
本稿では,事前学習された大規模言語モデル(LLM)を,サンプル効率のよい政策立案者として利用する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:04:58 GMT)
CitDet: A Benchmark Dataset for Citrus Fruit Detection [4.1] 本研究は,キツネ果実の検出における技術状況の進展と,黄龍病の被害を受けた樹木の収量を正確に推定するための新しいデータセットを提案する。
データセットは579の高解像度画像に含まれるフルーツインスタンスのための32,000以上のバウンディングボックスアノテーションで構成されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:35:59 GMT)
A Generalization Result for Convergence in Learning-to-Optimize [4.1] 最適化における従来の収束保証は幾何学的引数に基づいており、アルゴリズムには適用できない。
私たちは、私たちの知識のベストを証明する最初の人であり、私たちの知識のベストを証明する最初の人です。私たちは、私たちの知識のベストを証明する最初の人です。私たちは、私たちの知識のベストを証明する最初の人です。私たちは、私たちの知識のベストを証明する最初の人です。私たちは、私たちの知識のベストを証明する最初の人です。私たちは、私たちの知識のベストを証明する最初の人です。私たちは、私たちの知識のベストを証明する最初の人です。私たちは、私たちの知識のベストを証明する最初の人です。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:17:04 GMT)
Parallax: A Compiler for Neutral Atom Quantum Computers under Hardware Constraints [4.1] 本稿では、中性原子系に適した非SWAPでスケーラブルで並列化可能なコンパイルおよび原子移動スケジューリング手法であるParallaxを紹介する。
高いエラー操作を25%削減し、最先端技術と比較して平均して28%の成功率を高めます。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:03:10 GMT)
Adversarial Robustness Overestimation and Instability in TRADES [4.1] TRADES は多クラス分類タスクにおける AutoAttack テストの精度と比較して,PGD の検証精度が極めて高い場合が多い。
この矛盾は、勾配マスキングに結びつく可能性のある、これらのインスタンスに対するロバストネスのかなりの過大評価を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:32:40 GMT)
REDO: Execution-Free Runtime Error Detection for COding Agents [4.0] Execution-free Error Detection for Coding Agents (REDO)は、実行時のエラーと静的解析ツールを統合する方法である。
我々はREDOが11.0%の精度と9.1%の重み付きF1スコアを達成し、最先端の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:06:29 GMT)
Characterizing Quantum Codes via the Coefficients in Knill-Laflamme Conditions [4.0] 量子誤り訂正(QEC)は、ノイズに対する量子情報の保護に不可欠である。
我々は, Knill-Laflamme (KL) 係数 $lambda_ij$ の構造を条件 $PE_idagger E_j P = lambda_ij P$ から検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:38:15 GMT)
M$^2$-ViT: Accelerating Hybrid Vision Transformers with Two-Level Mixed Quantization [4.0] We present M$2-ViT to accelerate Convolution-Transformer hybrid ViTs with two-level mixed Quantization。
具体的には、混合量子化精度と混合量子化スキームの両方を特徴とする、ハードウェアフレンドリーな2レベル混合量子化戦略(M$2$Q)を導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:16:57 GMT)
Conditional Lagrangian Wasserstein Flow for Time Series Imputation [3.9] 本研究では,条件付きラグランジアンワッサースタイン流という時系列計算法を提案する。
提案手法は(条件付き)最適輸送理論を利用して,シミュレーションのない方法で確率流を学習する。
実単語データセットを用いた実験結果から,提案手法は時系列計算における競合性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:46:28 GMT)
Paramanu: A Family of Novel Efficient Generative Foundation Language Models for Indian Languages [3.9] インド語のための新しい言語モデル(LM)のファミリーである「Paramanu」を提示する。
10の言語(アッサム語、バングラ語、ヒンディー語、コンカニ語、マイティシ語、マラティ語、オディア語、サンスクリット語、タミル語、テルグ語)を5文字でカバーしている。
モデルは、コンテキストサイズが1024の1つのGPUで事前トレーニングされており、サイズは13.29万(M)から367.5Mまで様々である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:19:59 GMT)
A Target-Aware Analysis of Data Augmentation for Hate Speech Detection [3.9] ヘイトスピーチは、ソーシャルネットワークの普及によって引き起こされる主要な脅威の1つだ。
本稿では,既存のデータを生成言語モデルで拡張し,ターゲットの不均衡を低減する可能性を検討する。
起源、宗教、障害などのヘイトカテゴリーでは、トレーニングのための強化データを用いたヘイトスピーチ分類は、拡張ベースラインが存在しない場合、10%以上のF1が向上する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:46:27 GMT)
Improving Numerical Stability of Normalized Mutual Information Estimator on High Dimensions [3.8] k-Nearest Neighbor (k-NN) に基づく手法を用いて正規化された相互情報を推定するには、スケーリング不変なk-NN半径の計算が必要となる。
本研究では,高次元空間における半径計算の数値安定性を向上させる対数変換手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:20:44 GMT)
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion [3.7] ビデオ処理の課題に対処するための4つの重要なコントリビューションを提示する。
まず,3次元逆ベクトル量子化バリエンコエンコオートコーダを紹介する。
次に,テキスト・ビデオ生成フレームワークであるMotionAuraを紹介する。
第3に,スペクトル変換器を用いたデノナイジングネットワークを提案する。
第4に,Sketch Guided Videopaintingのダウンストリームタスクを導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:07:56 GMT)
MOLA: Enhancing Industrial Process Monitoring Using Multi-Block Orthogonal Long Short-Term Memory Autoencoder [3.7] 産業プロセスの高精度かつ信頼性の高い故障検出を行うために,MOLA: Multi-block Orthogonal Long short-term memory Autoencoder パラダイムを導入する。
本稿では,プロセス変数を専門的なプロセス知識を活用することで,複数のブロックに分類するマルチブロック監視構造を提案する。
テネシー・イーストマン・プロセスに適用することで,MOLAフレームワークの有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:49:43 GMT)
Mind the Gap: a Spectral Analysis of Rank Collapse and Signal Propagation in Transformers [3.7] 本稿では,無作為マトリクスの観点から,テキスト分割のみの変圧器における信号伝搬について検討する。
本研究では,注目行列の2つの最大の特異値間のテクストスペクトルギャップが,ランク崩壊の原因となることを示す。
そこで本研究では,スペクトルギャップを除去することにより,広帯域におけるランク崩壊を解消する,新しい,シンプルかつ実用的な解法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:34:18 GMT)
SwitchLoRA: Switched Low-Rank Adaptation Can Learn Full-Rank Information [3.7] SwitchLoRAはパラメータ効率のトレーニング手法で、LoRAのトレーニング可能なパラメータを代替パラメータに頻繁にスムーズに置き換える。
以上の結果から,SwitchLoRAはフルランクトレーニングを上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:03:59 GMT)
O1O: Grouping of Known Classes to Identify Unknown Objects as Odd-One-Out [3.6] 現在のオブジェクト検出方法は、オブジェクトの候補位置に対応する擬似ラベルによる近似的な監視に依存している。
幾何的手がかりは未知のリコールを改善する。
超クラス内のクラス間の類似性を特定することで、奇数一点のスコアリング機構によって未知のクラスを識別できる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:08:04 GMT)
Forecasting mortality associated emergency department crowding [3.6] 救急部門(ED)の混雑は世界的な公衆衛生問題であり、死亡率の上昇と繰り返し関連付けられている。
最近のEDでは,90%以上の占有率は10日間の死亡率の増加と関連していることが示された。
匿名管理データを用いた死亡関連集団の予測が可能であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:38:39 GMT)
Self-Consistent Determination of Single-Impurity Anderson Model Using Hybrid Quantum-Classical Approach on a Spin Quantum Simulator [3.6] 本稿では,相関物質に対するハイブリッド量子古典的アプローチを実験的に実証する。
我々は計算の最も計算に要求される側面、すなわちグリーン関数の計算に対処する。
制御率の高い量子ビットの数は増え続けており、実験結果によりさらに複雑なモデルの解法が導かれる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:49:40 GMT)
News Reporter: A Multi-lingual LLM Framework for Broadcast T.V News [3.5] 大規模言語モデル(LLM)は、さまざまなクエリに対して一貫性のある回答を提供する能力のため、多くの会話チャットボットにとって、急速に重要なツールになっている。
我々は、米国中の様々なニュースチャンネルからニュース録音から抽出された大量のQAペアを収集し、共有する。
我々は,回答の文脈化を改善するためのRAG手法を提案し,それを検証可能なニュース記録に向ける。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:21:48 GMT)
ClaimBrush: A Novel Framework for Automated Patent Claim Refinement Based on Large Language Models [3.3] ClaimBrushは、データセットと書き換えモデルを含む、自動パテントクレーム改善のための新しいフレームワークである。
本研究は,特許請求書書き換え事例を多数集めて,特許請求書書き換えモデルの訓練と評価のためのデータセットを構築した。
提案する書き換えモデルは,最先端の大規模言語モデルにおいて,ベースラインとゼロショット学習に優れていた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:45:21 GMT)
ClaimBrush: A Novel Framework for Automated Patent Claim Refinement Based on Large Language Models [3.3] ClaimBrushは、データセットと書き換えモデルを含む、自動パテントクレーム改善のための新しいフレームワークである。
本研究は,特許請求書書き換え事例を多数集めて,特許請求書書き換えモデルの訓練と評価のためのデータセットを構築した。
提案する書き換えモデルは,最先端の大規模言語モデルにおいて,ベースラインとゼロショット学習に優れていた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:45:21 GMT)
Reducing the Cost of Dropout in Flash-Attention by Hiding RNG with GEMM [3.3] 本稿では,RNG ランタイムを隠蔽し,エンドツーエンドの性能を向上させるため,従来の GEMM レイヤと重複する RNG を提案する。
Llama2の1つの変圧器ブロックで1.14倍のスピードアップ、ワークロードサイズが変化すると最大1.23倍のスピードアップを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:59:06 GMT)
Beyond Scores: A Modular RAG-Based System for Automatic Short Answer Scoring with Feedback [3.3] そこで本研究では,厳密なゼロショットと少数ショットの学習シナリオにおいて,回答のスコアとフィードバックを生成するモジュール型検索拡張生成システムASAS-Fを提案する。
その結果, 微調整に比べて解答精度が9%向上し, スケーラブルで費用対効果の高い解が得られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:45:51 GMT)
Promptly Yours? A Human Subject Study on Prompt Inference in AI-Generated Art [3.3] 本稿では,マーケットプレースで販売されている隠蔽プロンプトを,セキュアな知的財産とみなすことができるかを検討する。
人間とAIツールは、公開されているサンプル画像に基づいて、プロンプトをおよそ推測することができる。
この結果から,人間とAIのコラボレーションは,プロンプトを推論し,高精度に類似画像を生成することができるが,本来のプロンプトを用いた場合ほど成功しないことがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:41:13 GMT)
GSR-BENCH: A Benchmark for Grounded Spatial Reasoning Evaluation via Multimodal LLMs [3.3] 画像中の物体間の空間的関係を理解する能力は、視覚的推論の重要な構成要素である。
我々は、以前リリースされたWhat'sUpデータセットを拡張し、空間関係理解のための新しい包括的評価を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:22:52 GMT)
Speeding Up Speech Synthesis In Diffusion Models By Reducing Data Distribution Recovery Steps Via Content Transfer [3.3] 拡散に基づくボコーダはサンプリングに必要な多くのステップのために遅いと批判されている。
本稿では,目標がプロセスの進行時間ステップの異なる出力となる設定を提案する。
提案手法は競争時間帯に高忠実度音声を生成することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:22:43 GMT)
Calibration of 3D Single-pixel Imaging Systems with a Calibration Field [3.3] 3Dシングルピクセルイメージング(SPI)は、様々なウェーブバンドに適用できる有望なイメージング技術である。
3D SPIの主な課題は、キャリブレーションが参照として多くの標準点を必要とすることである。
本研究では,単一画像から標準点を生成するためのフィールド(CaliF)を構築する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:34:21 GMT)
Mapping the Unseen: Unified Promptable Panoptic Mapping with Dynamic Labeling using Foundation Models [3.1] 本稿では,UPPM法について述べる。
UPPMは、従来のパン光学マッピング技術に動的ラベリング戦略を取り入れている。
その結果、UPPMは、リッチなセマンティックラベルを生成しながら、シーンやセグメントオブジェクトを正確に再構築できることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:03:42 GMT)
CAMIL: Context-Aware Multiple Instance Learning for Cancer Detection and Subtyping in Whole Slide Images [3.1] がん診断のためのコンテキスト認識型マルチインスタンス学習(CAMIL)アーキテクチャを提案する。
CAMILは隣接する制約のある注意を取り入れて、WSI(Whole Slide Images)内のタイル間の依存関係を考慮し、コンテキスト制約を事前の知識として統合する。
CAMILは非小細胞肺癌(TCGA-NSCLC)の亜型であり,リンパ節転移は検出され,AUCは97.5%,95.9%,88.1%であった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:13:06 GMT)
Flying in air ducts [3.1] 小型の四翼ドローンは、直径350mmから、小型の空気ダクトの中をホバリングして飛ぶことができる。
これらの結果は、ドローンのための新しくて有望なアプリケーションドメインを開く。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:33:57 GMT)
ST-WebAgentBench: A Benchmark for Evaluating Safety and Trustworthiness in Web Agents [3.1] 本稿では,企業におけるWebエージェントの安全性と信頼性を評価するためのベンチマークであるST-WebAgentBenchを紹介する。
我々の評価は、現在のSOTAエージェントが政策遵守に苦慮し、重要なビジネスアプリケーションにはまだ頼っていないことを示している。
本稿では,Webエージェントのポリシー意識とコンプライアンス向上を目的としたアーキテクチャ原則を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:38:21 GMT)
ST-WebAgentBench: A Benchmark for Evaluating Safety and Trustworthiness in Web Agents [3.1] 本稿では,企業におけるWebエージェントの安全性と信頼性を評価するためのベンチマークであるST-WebAgentBenchを紹介する。
このベンチマークは、セーフで信頼できる(ST)エージェントの振る舞いを定義する詳細なフレームワークに基づいている。
我々の評価は、現在のSOTAエージェントが政策遵守に苦慮し、重要なビジネスアプリケーションにはまだ頼っていないことを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:38:21 GMT)
Understanding Adversarially Robust Generalization via Weight-Curvature Index [3.1] We propose a novel perspective to decipherally robust generalization through the Lens of the Weight-Curvature Index (WCI)。
提案したWCIは、重量行列のフロベニウスノルムとヘッセン行列のトレースを用いて、逆摂動に対するモデルの脆弱性を定量化する。
私たちの研究は、よりレジリエントなディープラーニングモデルを設計し、信頼性とセキュリティを高める上で、重要な洞察を提供します。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:34:43 GMT)
Crossing Margins: Intersectional Users' Ethical Concerns about Software [3.1] 本研究の目的は,交差点利用者のソフトウェア関連視点に関する研究のギャップを埋めることである。
ソフトウェアアプリケーションについて議論する700以上の交差点のサブレディットからの投稿を収集しました。
その結果,交差するコミュニティでは,サイバーいじめ,不適切な内容,差別に関連する批判的苦情が報告されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:33:05 GMT)
Protect Before Generate: Error Correcting Codes within Discrete Deep Generative Models [3.1] 本稿では,離散潜在変数モデルにおける変分推論を強化する新しい手法を提案する。
我々は誤り訂正符号(ECC)を活用し、潜伏表現に冗長性を導入する。
この冗長性は変分後部によって利用され、より正確な推定値が得られる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:59:58 GMT)
PublicHearingBR: A Brazilian Portuguese Dataset of Public Hearing Transcripts for Summarization of Long Documents [3.0] データセットはブラジル代議院が主催する公聴会の書き起こしからなり、ニュース記事や構成された要約と組み合わせられている。
このデータセットは、ポルトガル語における長期文書要約システムの開発と評価を支援する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:13:59 GMT)
How Maintainable is Proficient Code? A Case Study of Three PyPI Libraries [3.0] ファイル内の有能なコードのリスクレベルについて検討する。
リスクの高い高度に熟練したコードのいくつかの例を特定します。
この研究は、開発者が有能なコードが将来のコードメンテナンス活動に有害かもしれないシナリオを特定するのに役立ちます。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:50:59 GMT)
How Maintainable is Proficient Code? A Case Study of Three PyPI Libraries [3.0] コード保守性とPythonのコード習熟度の関係について検討する。
具体的には,ファイル内の有能なコードのリスクレベルについて検討する。
私たちの例では、ほとんどのコード習熟開発は保守可能性の低いリスクを示していますが、熟練したコードもメンテナンスにリスクがあるケースもあります。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:50:59 GMT)
Sonnet or Not, Bot? Poetry Evaluation for Large Models and Datasets [3.0] 大規模言語モデル(LLM)が詩を生成、認識できるようになった。
我々はLLMが英語詩の1つの側面をいかに認識するかを評価するタスクを開発する。
我々は,現在最先端のLLMが,一般的な文体と一般的でない文体の両方を識別できることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:35:56 GMT)
Gaussian Process Thompson Sampling via Rootfinding [2.9] トンプソンサンプリング(Thompson sample, TS)は、ベイズ決定における単純かつ効果的な政策である。
連続最適化では、目的関数の後方はしばしばガウス過程(GP)であり、サンプルパスは多数の局所最適値を持つ。
本稿では,勾配に基づくマルチスタートの開始点を慎重に選択するGP-TSの効率的なグローバル最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:06:45 GMT)
Exploring Foundation Models in Remote Sensing Image Change Detection: A Comprehensive Survey [2.9] 変化検出は環境モニタリング,都市開発,土地利用分析などの分野に広く応用されている。
ディープラーニング、特に基礎モデルの開発は、特徴抽出とデータ融合のためのより強力なソリューションを提供してきた。
本稿では, リモートセンシングタスクにおける基礎モデルの適用を中心に, 変更検出の分野における最新の進歩を体系的にレビューする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:16:05 GMT)
End-to-End Protocol for High-Quality QAOA Parameters with Few Shots [2.9] 我々は,複数のパラメータ設定と微調整技術を組み合わせたエンドツーエンドプロトコルを開発した。
最大32キュービットと5QAOA層を用いたトラップイオンプロセッサを実装した。
パイプラインは少量のハードウェアノイズに対して堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:18:41 GMT)
The Sets of Power [2.8] 投票力の対策は1940年代半ばから広範囲の研究の対象となっている。
重要性の尺度は、単調に増加する述語が与えられるたびに任意の参照集合に対して計算できる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:35:50 GMT)
FSW-GNN: A Bi-Lipschitz WL-Equivalent Graph Neural Network [2.8] グラフを区別するMPNNの能力は、Weisfeiler-Lemann (WL) グラフ同型テストによって分離できるグラフに限られる。
我々のMPNNは、いくつかのグラフ学習タスクで標準的なMPNNと競合し、過度な長距離タスクでははるかに正確であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:11:23 GMT)
On the Generalization Properties of Deep Learning for Aircraft Fuel Flow Estimation Models [2.7] 本稿では,燃料消費予測におけるディープラーニングモデルの一般化能力について検討する。
本稿では,ニューラルネットワークアーキテクチャとドメイン一般化技術を統合する新しい手法を提案する。
以前は目に見えない航空機に対して、航空機へのノイズの導入とエンジンパラメーターはモデルの一般化を改善した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:34:19 GMT)
Automating Easy Read Text Segmentation [2.7] 読みやすいテキストは、読み難い人のための情報にアクセスするための主要な形態の1つである。
このタイプのテキストの重要な特徴の1つは、文をより小さな文法セグメントに分割する必要があることである。
マスク付きおよび生成言語モデルと構成的構文解析を併用して,タスクのための新しい手法について検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:18:59 GMT)
A Framework for Collaborating a Large Language Model Tool in Brainstorming for Triggering Creative Thoughts [2.7] 本研究は, 設計者に対して, ブレインストーミング時のアイデアの創造性向上のために, LLMツールで体系的に作業するための目標, プロンプト, 戦略を取り入れたGPSというフレームワークを提案する。
設計事例とケーススタディを通じてテストした本フレームワークは,創造性を刺激する効果と,設計プラクティスへのLCMツールのシームレスな統合を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:39:27 GMT)
Two-color laser control of photocurrent and high harmonics in graphene [2.7] グラフェンモデルにおける2色レーザー駆動光電流と高調波発生(HHG)について検討した。
我々は,レーザー場軌道の空間対称性を調整することにより,HHGスペクトルを劇的に変化させることができることを示した。
また, 2色レーザーの周波数, 強度, 楕円性, 位相を変化させることで, 光電流の大きさと方向を制御できることも示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:54:41 GMT)
Rethinking the Principle of Gradient Smooth Methods in Model Explanation [2.7] グラディエント・スムーシング(Gradient Smoothing)は、勾配モデル記述法における雑音の低減に有効な手法である。
これらの知見に基づいて適応的な勾配平滑化手法AdaptGradを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:24:27 GMT)
The Descriptive Complexity of Graph Neural Networks [2.7] 本稿では,GNN の有界深度ファミリーで計算できるグラフクエリが,一階述語論理のガード付き GFO+C フラグメントで定義可能であることを証明した。
GFO+Cでは1つのGNNで1つの線形アクティベーションと有理重みを持つクエリが組込み関係なく定義可能であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:52:17 GMT)
A phase transition in sampling from Restricted Boltzmann Machines [2.7] 制限ボルツマンマシンにおけるギブスサンプリング器の混合時間における位相遷移現象を証明した。
重要な洞察は、Gibbsサンプルと動的システムとのリンクである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:51:22 GMT)
VREM-FL: Mobility-Aware Computation-Scheduling Co-Design for Vehicular Federated Learning [2.6] 車両用無線環境マップフェデレートラーニング(VREM-FL)を提案する。
車両の移動性と5G無線環境マップを組み合わせる。
VREM-FLは無線リソース使用のためのトレーニング時間に調整することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:12:51 GMT)
A framework for compressing unstructured scientific data via serialization [2.6] 本稿では,非構造化科学データを局所接続で圧縮するための一般的な枠組みを提案する。
一般的な応用は任意の有限要素メッシュ上で定義されたシミュレーションデータである。
このフレームワークは、既存のデータ処理パイプラインへのシームレスな統合を可能にする、オリジナルのノードの順序変更を保存する、欲張りなトポロジを採用している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:53:35 GMT)
On the Detection of Aircraft Single Engine Taxi using Deep Learning Models [2.5] 単機関タクシーは燃料効率と持続可能性を高めるための有望な技術として登場した。
SETの利点を評価することは、SET固有のデータの限られた可用性によって妨げられる。
地上軌道データを用いてSET操作を検出するための新しい深層学習手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:51:59 GMT)
Noise-induced shallow circuits and absence of barren plateaus [2.5] 雑音がほとんどの量子回路を効果的に対数深度に切り離すことを示す。
次に,非単位雑音下での量子回路は,局所可観測物からなるコスト関数に対するバレンプラトーの欠如を証明した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:00:14 GMT)
PP-GWAS: Privacy Preserving Multi-Site Genome-wide Association Studies [2.5] 本稿では,データプライバシを犠牲にすることなく,計算効率とスケーラビリティの観点から,既存の標準を改善するために設計された新しいアルゴリズムPP-GWASを提案する。
実世界および合成データを用いた実験により、PP-GWASは最先端のアルゴリズムの2倍の速さで計算できることが示された。
我々は、様々なデータセットを用いてその性能を評価し、より効率的でプライベートなゲノム解析を促進する可能性を強調した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:07:57 GMT)
Learning to Compress: Local Rank and Information Compression in Deep Neural Networks [2.5] ディープニューラルネットワークは、トレーニング中に低次元の特徴表現を暗黙的に学習する、低ランクなソリューションに対するバイアスを示す傾向がある。
特徴多様体次元の尺度として局所階乗の概念を導入し、この階乗が訓練の最終段階の間に減少することを示す。
学習した表現のランクを下げるネットワークは、入力層と中間層の間の相互情報を圧縮する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:53:34 GMT)
CTBENCH: A Library and Benchmark for Certified Training [2.5] 認定トレーニングのための高品質なベンチマークであるCTBENCHを紹介する。
CTBENCHのほぼ全てのアルゴリズムが、文学における報告された性能を上回っていることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:13:52 GMT)
The Large Language Model GreekLegalRoBERTa [2.5] 我々は,ギリシア語法と非法文に基づいて訓練された4つの大きな言語モデルである,ギリシャ語LegalRoBERTaの4つのバージョンを開発する。
我々のモデルは、ギリシャの法的文書を含む2つのタスクにおいて、ギリシャのLegalBERT、ギリシャのLegalBERT-v2、ギリシャのLegalBERTのパフォーマンスを上回ることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:54:39 GMT)
FLIER: Few-shot Language Image Models Embedded with Latent Representations [2.4] 画像認識のための潜在表現(FLIER)を組み込んだFew-shot Language Image Model。
まず、GPT-3からのテキスト入力で、安定拡散による画像とそれに対応する潜在表現を生成する。
潜在表現を「モデル理解可能なピクセル」として、2つの畳み込み層を持つ柔軟な畳み込みニューラルネットワークを導入し、潜り込みエンコーダとする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:27:46 GMT)
APOLLO: A GPT-based tool to detect phishing emails and generate explanations that warn users [2.4] 大規模言語モデル(LLM)は、様々なドメインでテキスト処理を約束する。
我々は,OpenAIのGPT-4oに基づくツールであるAPOLLOを紹介し,フィッシングメールを検出し,説明メッセージを生成する。
また,20名の被験者を対象に,フィッシング警告として提示された4つの説明を比較検討した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:53:39 GMT)
MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation [2.3] MedCLIP-SAMv2はCLIPとSAMモデルを統合して臨床スキャンのセグメンテーションを行う新しいフレームワークである。
提案手法は,DHN-NCE(Decoupled Hard Negative Noise Contrastive Estimation)によるBiomedCLIPモデルの微調整を含む。
また,ゼロショットセグメンテーションラベルを弱教師付きパラダイム内で使用することにより,セグメンテーション品質をさらに向上する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:40:20 GMT)
MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation [2.3] MedCLIP-SAMv2はCLIPとSAMモデルを統合して臨床スキャンのセグメンテーションを行う新しいフレームワークである。
提案手法は,DHN-NCE(Decoupled Hard Negative Noise Contrastive Estimation)によるBiomedCLIPモデルの微調整を含む。
また,ゼロショットセグメンテーションラベルを弱教師付きパラダイム内で使用することにより,セグメンテーション品質をさらに向上する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:40:20 GMT)
Rescriber: Smaller-LLM-Powered User-Led Data Minimization for Navigating Privacy Trade-offs in LLM-Based Conversational Agent [2.2] Rescriberは、LLMベースの会話エージェントでユーザ主導のデータ最小化をサポートするブラウザエクステンションである。
我々の研究によると、Rescriberはユーザーが不必要な開示を減らし、プライバシー上の懸念に対処するのに役立ちました。
以上の結果から,LLMによる小型ユーザ向けオンデバイスプライバシコントロールの実現可能性が確認された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:23:16 GMT)
BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics [2.2] $texttBirdSet$は、鳥のバイオ音響に焦点を当てたオーディオ分類のための大規模なベンチマークデータセットである。
$texttBirdSet$はAudioSetを上回り、1万近いクラスから6800時間以上録音する。
我々は,3つの異なる学習シナリオにまたがる多ラベル分類において,よく知られた6つのDLモデルをベンチマークした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:36:05 GMT)
Do Current Language Models Support Code Intelligence for R Programming Language? [2.2] コード要約とメソッド名予測の2つのタスクに対して,複数の設定と戦略を用いてコード-PLMを評価する。
以上の結果から, 研究モデルでは, 性能劣化の程度が異なっていたことが示唆された。
Rの二重構文パラダイムは、特にコード要約タスクにおいて、モデルの性能に大きな影響を及ぼした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:23:23 GMT)
Understanding Spatio-Temporal Relations in Human-Object Interaction using Pyramid Graph Convolutional Network [2.2] 本稿では,人間と物体の相互作用を自動的に認識する新しいピラミッドグラフ畳み込みネットワーク(PGCN)を提案する。
このシステムは、映像データをグラフとして検出した結果から、人間と物体の2次元または3次元空間関係を表す。
我々は,人間と物体の相互作用認識の分野で,2つの挑戦的データセット上でモデルを評価した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:39:17 GMT)
Understanding Human Activity with Uncertainty Measure for Novelty in Graph Convolutional Networks [2.2] 本稿では,テンポラルフュージョングラフ畳み込みネットワークについて紹介する。
これは、アクティビティストリーム内の個々のアクションの境界推定が不十分であることを是正することを目的としている。
また、時間次元における過分割の問題も緩和する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:44:18 GMT)
MERGE: Matching Electronic Results with Genuine Evidence for verifiable voting in person at remote locations [2.2] 本稿では,電子投票の速さと紙返却の信頼性を組み合わせたMERGEプロトコルを提案する。
このプロトコルにより、有権者は投票の電子的記録を迅速に提出し、同時に紙票を送信して検証を行うことができる。
電子記録は予備的な結果に使用することができるが、紙の投票は時間が経過した場合にはリスク限界監査(RLA)で使用され、選挙の完全性を保証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:07:26 GMT)
MERGE: Matching Electronic Results with Genuine Evidence for verifiable voting in person at remote locations [2.2] 本稿では,電子投票の速さと紙返却の信頼性を組み合わせたMERGEプロトコルを提案する。
このプロトコルにより、有権者は投票の電子的記録を迅速に提出し、同時に紙票を送信して検証を行うことができる。
電子記録は予備的な結果に使用することができるが、紙の投票は時間が経過した場合にはリスク限界監査(RLA)で使用され、選挙の完全性を保証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:07:26 GMT)
NusaMT-7B: Machine Translation for Low-Resource Indonesian Languages with Large Language Models [2.2] 本稿では,低リソースインドネシア語用機械翻訳モデルであるNusaMT-7Bを紹介する。
提案手法は, 単言語データ, Supervised Fine-Tuning (SFT) , 自己学習, LLMベースのデータクリーナーを併用し, 並列文のノイズを低減する。
この結果から,LLMの微調整により,低リソース言語への翻訳品質が向上し,言語保存や異文化間コミュニケーションに寄与することが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:33:25 GMT)
Anti-patterns in Students' Conditional Statements [2.2] 本研究では,Pythonの入門コースにおける学生によるコード提出における条件文に関するアンチパターンについて検討した。
オープンソースの"qChecker"ツールを使って、条件付きステートメントに関連する15のアンチパターンを識別しました。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:12:50 GMT)
Wait, that's not an option: LLMs Robustness with Incorrect Multiple-Choice Options [2.1] 本研究では,大規模言語モデル(LLM)が「誤解を招く」命令を与えられた場合,推論や真理よりも次の命令を優先するかどうかを考察する。
本稿では,学習前アライメントと学習後アライメントの関連性に新たな光を当てる「反射判断」という新しい指標を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:46:36 GMT)
Experimental Realization of Self-Contained Quantum Refrigeration [1.9] 同じ分子内の3つの炭素13核は、冷却プロセスを促進するために関与する。
自己完結型機能は、外部の作業に頼らずに運用することができる。
本研究では, 各種条件下での性能評価を行い, 各種シナリオの冷却制約を精査する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:45:31 GMT)
Concretization of Abstract Traffic Scene Specifications Using Metaheuristic Search [1.9] AVのシナリオベースのテストに向けた第一歩として、トラフィックシナリオの初期シーンを減らさなければならない。
本稿では,車両を現実的な道路地図上に配置し,一連の抽象的制約を満たす交通シーンの促進手法を提案する。
提案手法の8つの構成を,最先端のScenicツールの3つのバリエーションと比較するために,現実的な3つの道路地図上で一連の実験を行った。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:40:48 GMT)
Fine-detailed Neural Indoor Scene Reconstruction using multi-level importance sampling and multi-view consistency [1.9] そこで本研究では,FD-NeuSと呼ばれるニューラルな暗黙表面再構成手法を提案する。
具体的には,領域に基づくレイサンプリングの導出にセグメンテーションの先行を生かし,重み付けとして指数関数を用いて3次元点サンプリングを行う。
さらに,多視点特徴整合と多視点正規整合をそれぞれ監督と不確実性として導入し,詳細の再構築をさらに改善する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:08:06 GMT)
Synthesizing Multi-Class Surgical Datasets with Anatomy-Aware Diffusion Models [1.9] コンピュータ支援手術では,解剖学的臓器の自動認識が手術現場の理解に不可欠である。
機械学習モデルはそのような構造を識別できるが、それらの展開はラベル付き多様な外科的データセットの必要性によって妨げられる。
アノテーションを用いた多段階手術データセットを生成するために拡散モデルを用いた多段階的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:29:23 GMT)
Reliable Probabilistic Human Trajectory Prediction for Autonomous Applications [1.8] 車両システムは信頼性、正確、高速、資源効率、スケーラブル、低遅延軌道予測を必要とする。
本稿では,これらの要求に対処する軽量な手法として,Long Short-Term Memory と Mixture Density Networks を提案する。
自動運転車アプリケーションにおける人体軌道予測の必須要件について考察し,交通関連データセットを用いて本手法の性能を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:25:25 GMT)
Reliable Probabilistic Human Trajectory Prediction for Autonomous Applications [1.8] 車両システムは信頼性、正確、高速、資源効率、スケーラブル、低遅延軌道予測を必要とする。
本稿では,これらの要求に対処する軽量な手法として,Long Short-Term Memory と Mixture Density Networks を提案する。
自動運転車アプリケーションにおける人体軌道予測の必須要件について考察し,交通関連データセットを用いて本手法の性能を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:25:25 GMT)
On Wagner's k-Tree Algorithm Over Integers [1.8] k-Tree は平均ケース k-SUM 問題に対する非自明なアルゴリズムである。
入力リストのサイズがこれよりもかなり大きい場合、高い確率で成功することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:55:21 GMT)
Unlocking Guidance for Discrete State-Space Diffusion and Flow Models [1.8] 本稿では、離散状態空間モデルにガイダンスを適用するための汎用的および原則的手法を提案する。
我々は,小分子の誘導生成,DNA配列,タンパク質配列など,様々な応用にアプローチの有用性を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:28:59 GMT)
Agents Thinking Fast and Slow: A Talker-Reasoner Architecture [1.7] 大規模言語モデルにより、あらゆる種類のエージェントが自然な会話を通じてユーザと対話できるようになった。
提案手法は,高速かつ直感的であり,会話応答の合成に係わる"Talker"エージェントで構成されている。
本稿では,新しいTalker-Reasonerアーキテクチャについて述べる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:31:35 GMT)
Context-Aware Command Understanding for Tabletop Scenarios [1.7] 本稿では,テーブルトップシナリオにおける自然人コマンドの解釈を目的とした,新しいハイブリッドアルゴリズムを提案する。
音声、ジェスチャー、シーンコンテキストを含む複数の情報ソースを統合することにより、ロボットに対して実行可能な指示を抽出する。
システムの長所と短所、特にマルチモーダルコマンド解釈の扱い方について論じる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:59:22 GMT)
Context-Aware Command Understanding for Tabletop Scenarios [1.7] 本稿では,テーブルトップシナリオにおける自然人コマンドの解釈を目的とした,新しいハイブリッドアルゴリズムを提案する。
音声、ジェスチャー、シーンコンテキストを含む複数の情報ソースを統合することにより、ロボットに対して実行可能な指示を抽出する。
システムの長所と短所、特にマルチモーダルコマンド解釈の扱い方について論じる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:59:22 GMT)
Secure Wearable Apps for Remote Healthcare Through Modern Cryptography [1.7] スマートウォッチ、リストバンド、フィットネストラッカーなどのウェアラブルデバイスは、人体に装着するための軽量デバイスとして設計されている。
ウェアラブルデバイスの接続性の向上により、遠隔医療ソリューションに不可欠なものになるだろう。
本稿では,最新の暗号をセキュアなウェアラブルアプリに適用するためのソリューションについて検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:50:12 GMT)
Machine Learning-based feasibility estimation of digital blocks in BCD technology [1.7] 本稿では,高レベルの特徴セットを用いて,デジタル実装の実現可能性を予測するための機械学習に基づく評価手法を提案する。
このアプローチは、Place-and-Routeトライアルの時間の浪費を回避することを目的としており、トップレベルの配置において、DigitalとAnalog Back-Endデザイナ間の迅速なフィードバックを可能にする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:43:49 GMT)
Equivariant Manifold Neural ODEs and Differential Invariants [1.6] 我々は同変多様体ニューラル常微分方程式(NODE)の明らかな幾何学的枠組みを開発する。
私たちは、対称データに対するモデリング能力を解析するためにそれを使用します。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:22:30 GMT)
Boosting Deep Ensembles with Learning Rate Tuning [1.6] 学習率(LR)は、ディープラーニングトレーニングのパフォーマンスに高い影響を与える。
本稿では,学習率を効果的に調整し,深層アンサンブル性能を向上させるための新しいフレームワークであるLREnsembleを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:59:38 GMT)
Generalization Bounds and Model Complexity for Kolmogorov-Arnold Networks [1.6] Kolmogorov-Arnold Network (KAN)は、Liuらによって最近提案されたネットワーク構造である。
活性化関数を備えたカンの一般化境界を確立することにより、カンの厳密な理論的解析を提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:23:21 GMT)
Fine-Tuning Language Models for Ethical Ambiguity: A Comparative Study of Alignment with Human Responses [1.6] 言語モデルは曖昧さを扱うため、人間の意図を誤解することが多い。
道徳的にあいまいな文脈では人間とLLMの判断が不十分であることを示す。
テキスト・トゥ・テキスト・フォーマットにおけるモデルによるテキスト・配信の理解を改善するための微調整手法により、性能とアライメントを効果的に向上する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:24:04 GMT)
Learning Low-Level Causal Relations using a Simulated Robotic Arm [1.5] 因果学習により、人間の行動が既知の環境に与える影響を予測することができる。
シミュレーションロボットアームによって生成されたデータに基づいて,前方モデルと逆モデルを学ぶことにより因果関係を研究する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:28:30 GMT)
Injective flows for star-like manifolds [1.5] 我々は、星状多様体密度に対して、NFsと同じコストで、ジャコビアン行列式を正確かつ効率的に計算できることを示します。
これは特に、サンプルが入手できず、正規化されていないターゲットのみが知られているような変動推論設定に関係している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:09:54 GMT)
CCA-Secure Key-Aggregate Proxy Re-Encryption for Secure Cloud Storage [1.5] クラウドストレージにおけるデータ保護は、クラウド産業の存続の鍵である。
Proxy Re-Encryptionスキームにより、ユーザーは再暗号化キーを使用して暗号文を他の暗号文に変換することができる。
近年,C-PREの鍵記憶コストを一定サイズに削減し,最初のキーアグリゲートプロキシ再暗号化方式を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:02:49 GMT)
Positional Encoding Helps Recurrent Neural Networks Handle a Large Vocabulary [1.5] 位置符号化は入力データ上の時間指標の高次元表現である。
RNNは、データポイントの時間情報を自身でエンコードすることができ、位置エンコーディングの使用は、一見冗長/不要なように見える。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:40:57 GMT)
Dialectical Behavior Therapy Approach to LLM Prompting [1.4] 大規模言語モデルは、チェーン・オブ・シンクレット(CoT)プロンプト技術を適用する際に、様々な推論タスクに対して最先端の結果を示した。
弁証的行動療法(DBT)にインスパイアされた新しいプロンプト戦略を提案する。
提案手法を応用したプロンプトにより,より小さなモデルにおける結果が大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:58:03 GMT)
A transition towards virtual representations of visual scenes [1.4] 視覚的シーン理解は、視覚データから意味のある情報を抽出することを目的とした、コンピュータビジョンの基本的なタスクである。
本稿では3次元仮想合成に向けた視覚的シーン理解と記述の課題に対処するアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:41:04 GMT)
Towards Robust IoT Defense: Comparative Statistics of Attack Detection in Resource-Constrained Scenarios [1.4] リソースの制約は、IoTスマートデバイスに重大なサイバーセキュリティの脅威をもたらす。
我々は、資源制約下でのサイバー攻撃検出アルゴリズムの広範な統計的解析を行い、最も効率的なものを特定する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:58:03 GMT)
Towards Assurance of LLM Adversarial Robustness using Ontology-Driven Argumentation [1.4] 本稿では,形式的議論に基づく大規模言語モデル (LLM) の保証のための新しいアプローチを提案する。
我々は、最先端の攻撃と防衛を構成し、人間の読み取り可能な保証ケースの作成を容易にする。
我々は,技術者,データ科学者,ユーザ,監査者を対象とすることで,理論と実践に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:24:43 GMT)
The Rise of AI-Generated Content in Wikipedia [1.4] 私たちは、プロプライエタリなAI検出ツールであるGPTZeroと、オープンソースの代替手段であるBinocularsを使って、最近作成されたWikipediaページでAI生成コンテンツの存在を低く設定しています。
しきい値はGPT-3.5以前の記事に対して1%の偽陽性率を達成するために調整されており、新たに作成されたウィキペディア記事の5%以上をAI生成としてフラグ付けしている。
フラッグ付きのウィキペディア記事は、典型的には品質が低く、しばしば自己宣伝的または特定の視点に向けて部分的である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:36:10 GMT)
Efficient Parameter Optimisation for Quantum Kernel Alignment: A Sub-sampling Approach in Variational Training [1.4] 本稿では,カーネル行列のサブセットをトレーニングの各ステップで使用するサブサンプリングトレーニング手法を提案する。
本研究では,合成データセットと実世界の乳癌データセットにサブサンプリング法を適用し,量子カーネルのトレーニングに必要な回路数を大幅に削減することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:13:53 GMT)
Investigating Developers' Preferences for Learning and Issue Resolution Resources in the ChatGPT Era [1.3] 最近のトレンドはビデオチュートリアルのような魅力的なフォーマットを好んでいる。
ChatGPTのような大規模言語モデル(LLM)の出現は、新しい学習パラダイムを提示します。
我々は,ソフトウェア開発者とコンピュータサイエンスの学生を対象に,341の回答を集め,そのうち268の回答を完成・分析した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:57:29 GMT)
Variance-reduced first-order methods for deterministically constrained stochastic nonconvex optimization with strong convergence guarantees [1.3] 既存の方法は典型的には$epsilon$-stochasticの固定点を見つけることを目的としている。
多くの実践的応用において、制約がほぼ確実に満たされることが重要であり、そのような$epsilon$-stochasticの定常点が望ましくない可能性がある。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:30:14 GMT)
Quantum simulation of single-server Markovian queues: A dynamic amplification approach [1.2] 本研究では,シングルサーバマルコビアン(M/M/1)キューをシミュレーションする量子手法を提案する。
本稿では,待ち行列に適応し,シミュレーション効率を向上する動的増幅手法を提案する。
我々の量子法は、特に高速なシナリオにおいて、古典的なシミュレーションよりも潜在的に有利であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:55:17 GMT)
The Effect of Surprisal on Reading Times in Information Seeking and Repeated Reading [1.2] 我々は視線追跡データを用いて日常生活に共通する3つの言語処理体制を調べる。
処理時間に対する線形効果の存在に関する前提理論の予測は,これらの体制にまで及んでいることが判明した。
情報探索においては、そのような推定値が通常の推定値と比較して処理時間の予測能力を改善することはない。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:43:34 GMT)
Upper Bounds for Learning in Reproducing Kernel Hilbert Spaces for Orbits of an Iterated Function System [1.2] 学習理論における重要な問題は、ある入力$x$と対応する出力$y$の関係を近似した関数$f$を計算することである。
この近似はサンプル点 $(x_t,y_t)_t=1m$ に基づいている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:34:22 GMT)
Rethinking Adversarial Inverse Reinforcement Learning: From the Angles of Policy Imitation and Transferable Reward Recovery [1.1] 逆逆強化学習(AIRL)は、包括的で伝達可能なタスク記述を提供するための基礎的なアプローチとして機能する。
本稿では,AIRLの再検討を行う。
その結果,AIRLは特定の条件に関わらず,高い確率で効果的な転送を行うために報酬をアンタングルすることができることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:21:32 GMT)
Quantifying Jitter Transfer for Differential Measurement: Enhancing Security of Oscillator-Based TRNGs [1.1] 本稿では,TRNGにおける位相雑音の統計的パラメータの測定の信頼性を向上させる方法について述べる。
エントロピーレートが標準又はセキュリティ仕様で定める範囲内であることを保証する必要がある。
ハードウェア実装によるシミュレーションと実験により,本手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:57:03 GMT)
Inequality constraints in variational quantum circuits with qudits [1.1] 量子最適化は、短期量子デバイスの能力を利用するための重要な候補として浮上している。
本稿では,QAOAアルゴリズムにおける不等式制約をQudit-SUMゲートを用いて直接実装する手法を提案する。
不平等な罰則の直接的実装はスラック変数法を著しく上回り、特に実世界において多くの制約を課した問題を研究する場合に顕著である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:32:38 GMT)
Active Learning to Guide Labeling Efforts for Question Difficulty Estimation [1.1] トランスフォーマーベースのニューラルネットワークは、主に教師なしの手法ではなく、教師なし学習における独立した研究によって、最先端のパフォーマンスを達成する。
この研究は、教師付きヒューマン・イン・ザ・ループアプローチであるQDEのアクティブ・ラーニングを探求することで、研究ギャップを埋める。
PowerVarianceの取得によるアクティブな学習は、トレーニングデータの10%だけをラベル付けした後、完全に教師されたモデルに近いパフォーマンスを達成することを示す実験である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:11:09 GMT)
What is Left After Distillation? How Knowledge Transfer Impacts Fairness and Bias [1.0] クラスの41%は、クラス単位の精度を比較する際に、蒸留によって統計的に有意な影響を受けている。
本研究は, あるクラスに対する知識蒸留の不均一な影響と, その公正性における潜在的役割を明らかにする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:43:00 GMT)
Turbocharge Speech Understanding with Pilot Inference [1.0] 本稿では,資源制約のあるエッジデバイス上での現代音声理解の促進を図る。
デバイス上での実行をスピードアップする、デバイス容量を超える入力をオフロードする、というハイブリッドなアプローチが必要です。
プロトタイプはPASUと呼ばれ、Armプラットフォーム上で6~8コアでテストされており、SOTAの精度が得られます。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:04:17 GMT)
Growing Efficient Accurate and Robust Neural Networks on the Edge [0.9] 現在のソリューションは、Edgeにデプロイする前にモデルをトレーニングし、圧縮するためにCloudに依存しています。
これにより、ローカルに取得したフィールドデータをクラウドに送信する上で、高エネルギとレイテンシのコストが発生すると同時に、プライバシの懸念も高まる。
We propose GEARnn to grow and training robust network completely on the Edge device。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:01:42 GMT)
Merging in a Bottle: Differentiable Adaptive Merging (DAM) and the Path from Averaging to Automation [0.9] 本稿では,モデルマージ手法を複雑度の範囲にわたって検討する。
本稿では,効率よく適応的なマージ手法である微分適応マージ(DAM)を導入する。
以上の結果から,モデル類似度が高い場合,モデルソープのような単純な平均化手法でさえ競争力を発揮することが明らかとなった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:58:29 GMT)
Real-Time Detection for Small UAVs: Combining YOLO and Multi-frame Motion Analysis [0.9] 無人航空機(UAV)検出技術は、セキュリティリスクの軽減と、軍用および民間の双方のアプリケーションにおけるプライバシーの保護において重要な役割を担っている。
従来の検出手法は、長距離で非常に小さなピクセルを持つUAVターゲットを識別する上で重要な課題に直面している。
我々は,YOLO(You Only Look Once)オブジェクト検出と多フレームモーション検出を併用したGlobal-Local YOLO-Motion(GL-YOMO)検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:30:50 GMT)
Deep Learning-based Accelerated MR Cholangiopancreatography without Fully-sampled Data [0.8] 我々は、教師付き(SV)と自己教師付き(SSV)アプローチを用いて、ディープラーニング(DL)再建を訓練した。
標準技術, 並列イメージング (PI) および圧縮センシング (CS) によるDL再構成の評価を行った。
599/542から3T/0.55TでMRCPを55/180秒に短縮した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:35:35 GMT)
Inferring biological processes with intrinsic noise from cross-sectional data [0.8] データから動的モデルを推定することは、計算生物学における重要な課題である。
確率フロー推論(PFI)は,ODE推論のアルゴリズム的容易性を維持しつつ,本質性から力を引き離すことを示す。
実例では,PFIは高次元反応ネットワークにおける正確なパラメータと力の推定を可能にし,分子ノイズによる細胞分化動態の推測を可能にする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:33:25 GMT)
Animating the Past: Reconstruct Trilobite via Video Generation [0.8] トリロビットは保存状態のよい化石記録を通じて古生代の環境に関する貴重な洞察を提供する。
テキスト・トゥ・ビデオ(T2V)のような現在の計算手法では、視覚リアリズムや一貫性の維持といった課題に直面している。
本稿では,これらの障害を克服する自動T2Vプロンプト学習手法を提案する。
提案手法は,強力なベースラインに比べて視覚的リアリズムが著しく高いトリロビットビデオを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:54:58 GMT)
Enhancing Hyperspectral Image Prediction with Contrastive Learning in Low-Label Regime [0.8] 自己教師付きコントラスト学習は、限られたラベル付きデータの課題に対処するための効果的なアプローチである。
単一ラベルと複数ラベルの分類タスクに対して,本手法の性能を評価する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:20:16 GMT)
RayEmb: Arbitrary Landmark Detection in X-Ray Images Using Ray Embedding Subspace [0.8] 術前CTによるX線画像の術中2D-3D記録は整形外科手術において極めて重要である。
本稿では,X線画像中の任意のランドマーク点を検出することで,この問題に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:36:21 GMT)
Heterogeneous Graph Auto-Encoder for CreditCard Fraud Detection [0.8] 本稿では、金融データの異種グラフ表現に注意機構を応用したグラフニューラルネットワーク(GNN)を用いたクレジットカード不正検出手法を提案する。
提案モデルはグラフセージやFI-GRLなどのベンチマークアルゴリズムより優れており、AUC-PRが0.89、F1スコアが0.81である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:05:27 GMT)
Multimodal Optimization with k-Cluster Big Bang-Big Crunch Algorithm and Postprocessing Methods for Identification and Quantification of Optima [0.8] マルチモーダル最適化は工学的な問題、特に異なる代替解を求める場合にしばしば発生する。
本稿では,あまり知られていないビッグバン・ビッグ・Crunch(BBBC)アルゴリズムがマルチモーダル最適化に適しているかを検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:16:15 GMT)
Universal algorithm for transforming Hamiltonian eigenvalues [0.7] 我々は、その固有状態を不変に保ちながら、その固有値を変換することで、ハミルトニアンを操作する新しい方法を提供する。
我々は、未知のハミルトニアンの固有値上の任意の所望の関数を決定的に実装する普遍的アルゴリズムを開発する。
補助量子ビットを加えることなく、正時を負時へ変換する普遍的アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:14:36 GMT)
Information-Theoretic Measures on Lattices for High-Order Interactions [0.7] 格子と演算関数のペアを用いた高次情報理論測度を導出する体系的枠組みを提案する。
この枠組みでは,多くのよく用いられる測度が導出可能であるが,分割格子の格子に制限されることがしばしばある。
$d$変数間の全ての相互作用をフルに特徴付けるために、KL発散の一般化を演算関数として用いたStreitberg Informationを導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:17:20 GMT)
Correspondence of NNGP Kernel and the Matern Kernel [0.7] 本稿では,ニューラルネットワークガウス過程(NNGP)カーネルとそのガウス過程回帰データへの応用について検討する。
有効なNNGPカーネルを生成するための正規化の必要性を実証し、関連する数値課題を探求する。
次に,NNGPカーネルからの予測が,特定の状況下でのMaternカーネルの予測と密接に一致することを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:00:05 GMT)
A Framework to Audit Email Address Privacy and Analyze Email Marketing Practices of Online Services and Apps [0.7] 本研究は,メールアドレスなどの個人情報を利用者の同意なく共有・販売できるという認識の広汎化を考察する。
私たちは、最も人気のある150のオンラインサービスやアプリにサインアップした後、ユーザーが受信したメールのソース、ボリューム、頻度、内容を収集し、分析しました。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:44:18 GMT)
It Cannot Be Right If It Was Written by AI: On Lawyers' Preferences of Documents Perceived as Authored by an LLM vs a Human [0.7] 大きな言語モデル(LLM)は、ある種類の法律文書を自動的に生成する未来を可能にする。
この研究は、成熟した生成AIシステムへの継続的な移行の必要な分析である。
我々の分析では、AIによって生成されたと考えられるものよりも、人間によって作成されたと考えられる文書が明らかに好まれていた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:48:13 GMT)
Using LLMs to Discover Legal Factors [0.6] 私たちは、法律ドメインを効果的に表現する要因を見つけるために、大きな言語モデルを使用します。
提案手法は, 原告の意見を入力として, 一連の要因と関連する定義を生成する。
人間の関与が最小限に抑えられた半自動的アプローチが,適度な成功率でケースアウトを予測できる因子表現を生み出すことを実証した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:42:10 GMT)
A Generative AI Technique for Synthesizing a Digital Twin for U.S. Residential Solar Adoption and Generation [0.6] 本稿では,米国全土の屋上ソーラー導入のための,きめ細かな,住宅規模の現実的なデータセットを作成するための新しい手法について論じる。
データ駆動方式は、(i)PV導入者を識別するための統合機械学習モデル、(ii)説明可能なAI技術を用いてデータを増強する方法、(iii)家庭レベルの太陽エネルギー出力を生成する方法からなる。
生成された合成データセットは実世界のデータを使用して検証され、下流タスクをモデリングするためのデジタルツインとして機能する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:41:43 GMT)
Approximation Theory, Computing, and Deep Learning on the Wasserstein Space [0.6] 有限標本からの無限次元空間における近似関数の挑戦に対処する。
我々の焦点はワッサーシュタイン距離関数であり、これは関連する例である。
機能近似を定義するために,機械学習に基づく3つのアプローチを採用する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:30:32 GMT)
MELO: An Evaluation Benchmark for Multilingual Entity Linking of Occupations [0.6] 本稿では,21言語におけるエンティティ参照とESCO Occupations分類とのリンクを評価するために,48のデータセットのコレクションを新たに提示する。
MELOは高品質で既存の人間のアノテーションを使って構築された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:14:54 GMT)
Four-qubit critical states [0.6] 文献に現れる高絡み合いや有用な4ビット状態は,そのような絡み合い対策の静止点であることを示す。
我々は(ケンプ=ネッス定理の意味で)臨界点の概念をヴィンバーグ理論と共に使用し、問題の複雑さを著しく減少させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:07:09 GMT)
A Comprehensive Survey and Classification of Evaluation Criteria for Trustworthy Artificial Intelligence [0.6] この体系的な文献レビューは、現在の評価基準を特定し、分析し、それらをEU TAI原則にマッピングし、各原則の新しい分類システムを提案する。
この結果から,TAI評価基準の標準化に必要かつ重要な障壁があることが判明した。
提案した分類は, TAIガバナンスの評価基準の開発, 選定, 標準化に寄与する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:54:14 GMT)
Evaluating Transformer Models for Suicide Risk Detection on Social Media [0.5] 本稿では,ソーシャルメディア投稿における自殺リスクの同定に最先端の自然言語処理ソリューションを活用することを提案する。
これらのモデルと最小限のチューニングが組み合わさって,ソーシャルメディア上での自殺リスクの自動検出に有効な解決策となる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:15:25 GMT)
Optimizing Hard-to-Place Kidney Allocation: A Machine Learning Approach to Center Ranking [0.5] そこで本稿では, 中心に腎を配置するデータ駆動型機械学習によるランキングシステムを提案する。
本実験により, 提案方針は, 全腎臓に4倍, 固着腎臓に10倍のセンター数を減らした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:15:41 GMT)
KRAG Framework for Enhancing LLMs in the Legal Domain [0.5] 本稿ではKRAG(Knowledge Representation Augmented Generation)を紹介する。
KRAGは、ドメイン固有のアプリケーションにおけるLarge Language Models(LLM)の機能を強化するために設計されたフレームワークである。
KRAGに基づく実装モデルであるSoft PROLEGを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:48:06 GMT)
Deep and Probabilistic Solar Irradiance Forecast at the Arctic Circle [0.5] この研究は、長短記憶単位(LSTM)の変動を用いたノルウェーのデータによる太陽光の予測である。
LSTM上では、Quantile RegressionとMaximum Likelihood (MLE)が最適化されている。
確率的不確実性推定は、観測された照射の分布に比較的よく適合している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:45:52 GMT)
Multi wavefunction overlap and multi entropy for topological ground states in (2+1) dimensions [0.5] 多重波関数重なりは、2つ以上の量子多体状態に対する量子力学的内部積の一般化である。
バルク境界対応と (1+1) 次元エッジ理論を用いて, これらの重なりがどのように計算されるかを示す。
この手法を用いて, (2+1) 次元ギャップ基底状態のマルチエントロピーを評価できることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:12:03 GMT)
Private and Communication-Efficient Federated Learning based on Differentially Private Sketches [0.5] フェデレーテッド・ラーニング(FL)は、プライバシー漏洩のリスクとコミュニケーションの非効率の2つの主な課題に直面している。
そこで我々は,差分プライベートスケッチを利用したフェデレーション学習手法であるDPSFLを提案する。
提案手法のプライバシーと収束に関する理論的解析を行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:35:54 GMT)
Private and Communication-Efficient Federated Learning based on Differentially Private Sketches [0.5] フェデレーテッド・ラーニング(FL)は、プライバシー漏洩のリスクとコミュニケーションの非効率の2つの主な課題に直面している。
そこで我々は,差分プライベートスケッチを利用したフェデレーション学習手法であるDPSFLを提案する。
提案手法のプライバシーと収束に関する理論的解析を行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:35:54 GMT)
On the grid-sampling limit SDE [0.4] 最近の研究で、連続的な強化学習における探索をモデル化するためのプロキシとしてグリッドサンプリングSDEを導入しました。
本稿では、このSDEの使用動機をさらに明らかにし、ジャンプの有無におけるその正当性について論じる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:09:44 GMT)
Extendibility of fermionic states and rigorous ground state approximations of interacting fermionic systems [0.3] 我々は、フェルミオンガウス積状態が真の基底状態にどの程度よく近似できるかを厳密に保証する。
我々の結果は、フェルミオン量子状態の拡張性の結果と見なすことができる。
一方、これはフェルミオンに対する非対称デ・フィネッティの定理であり、ブランダオとハローによる定理の直接フェルミオン類似である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:19:35 GMT)
Federated Learning for Data Market: Shapley-UCB for Seller Selection and Incentives [0.3] 本稿では,フェデレート学習アーキテクチャに基づくトランザクションフレームワークを提案し,販売者選択アルゴリズムとインセンティブ補償機構を設計する。
具体的には、グラデーション類似性とシェープリーアルゴリズムを用いて販売者の貢献度を正確に評価する。
トレーニング後、販売者のトレーニングへの参加に応じて公正な補償が行われる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:50:20 GMT)
From student to working professional: A graduate survey [0.3] 本稿では,最近のコンピュータサイエンス(CS)卒業生の経験を探求する2023年の調査結果について報告する。
調査では,WiL(Work Integrated Learning)体験の継続点における卒業生の認識について質問した。
結果は、卒業生がキャップストーンの経験を尊重し、移行可能なスキルを提供すると信じていることを示している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 02:58:34 GMT)
Decision-Aware Predictive Model Selection for Workforce Allocation [0.3] 本稿では、機械学習を利用して労働者の行動を予測する新しいフレームワークを提案する。
本手法では,作業者の振舞いを表現するための最適予測モデルを,その作業員の割り当て方法によって決定する。
本稿では,予測モデル選択と作業員割り当てを統合した意思決定対応最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:59:43 GMT)
Automated test generation to evaluate tool-augmented LLMs as conversational AI agents [0.3] 対話型AIエージェントを評価するテスト生成パイプラインを提案する。
当社のフレームワークでは,ユーザ定義の手順に基づく多種多様なテストを生成するためにLLMを使用している。
ツール拡張LDMは単一のインタラクションでよく機能するが、完全な会話を扱うのに苦労することが多い。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:37:51 GMT)
The language of sound search: Examining User Queries in Audio Search Engines [0.2] テキストベースの音声検索システムの設計における現実世界のユーザニーズと振る舞いについて、研究は不十分に対処する。
このギャップを埋めるために、カスタムサーベイとFreesound Webサイトクエリログという、2つのソースからの検索クエリを分析しました。
その結果,調査クエリは一般にFreesoundクエリよりも長いことが示唆され,システム制約によって制限されない場合,ユーザが詳細なクエリを好むことが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:24:13 GMT)
Quantum applications of hexagonal boron nitride [0.2] 六方晶窒化ホウ素(hBN)は、古典的および量子技術の双方にとって魅力的なプラットフォームとして出現している。
本稿では、量子センシング、量子鍵分布、量子コンピューティング、量子メモリなど、hBNの基本概念と重要な応用について概説する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:28:19 GMT)
Stress Detection Using PPG Signal and Combined Deep CNN-MLP Network [0.2] この研究は、ストレス事象を検出するためにPSG信号を利用する。
この研究で使用されるPG信号は、UBFC-Physと名付けられた最新の公開データセットから収集される。
その結果, 応力を約82%の精度で検出できることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:38:55 GMT)
Flat-band (de)localization emulated with a superconducting qubit array [0.2] 超伝導量子ビットアレイを用いてロンベック格子上の密結合モデルをエミュレートする。
分散バンドに対する障害誘発パラメータの局在と、フラットバンドに対する障害誘発非局在を観察する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:53:53 GMT)
State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features [0.2] そこで我々は,3つの深層学習手法を開発し,セグメンテーションと軌道周辺距離予測を行った。
また, 疾患分類における眼窩周囲距離の有用性についても検討した。
我々は、オープンソースの健康な目で訓練されたモデルを用いて、病気の目で堅牢なセグメンテーションを実現することができることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:50:05 GMT)
State-of-the-Art Periorbital Distance Prediction and Disease Classification Using Periorbital Features [0.2] そこで我々は,3つの深層学習手法を開発し,セグメンテーションと軌道周辺距離予測を行った。
また, 疾患分類における眼窩周囲距離の有用性についても検討した。
我々は、オープンソースの健康な目で訓練されたモデルを用いて、病気の目で堅牢なセグメンテーションを実現することができることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:50:05 GMT)
Baseflow identification via explainable AI with Kolmogorov-Arnold networks [0.1] 我々は記号表現を識別するために設計されたニューラルネットワークのクラスを開発する。
Kanは単純さと透明性の利点を提供し、特定のソフトウェアや計算ツールを必要としない。
このケーススタディでは、乾燥度指数の定式化に焦点が当てられているが、そのアプローチは柔軟で、他の水理過程に伝達可能である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:56:17 GMT)
Explainability of Deep Neural Networks for Brain Tumor Detection [0.1] 我々は、実世界の医療データに基づいて、様々なモデルの性能を評価するために、説明可能なAI(XAI)技術を適用した。
より浅いアーキテクチャを持つCNNは、小さなデータセットに対してより効果的であり、医療的な意思決定をサポートすることができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:01:21 GMT)
Prompt Engineering a Schizophrenia Chatbot: Utilizing a Multi-Agent Approach for Enhanced Compliance with Prompt Instructions [0.1] 統合失調症の患者は、しばしば認知障害を伴い、自分の状態について学ぶ能力を妨げることがある。
大規模言語モデル(LLM)は、トピックのメンタルヘルス情報をよりアクセシビリティとエンゲージメントを高める可能性を秘めているが、それらのブラックボックスの性質は倫理と安全に関する懸念を喚起する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:49:24 GMT)
When the Small-Loss Trick is Not Enough: Multi-Label Image Classification with Noisy Labels Applied to CCTV Sewer Inspections [0.1] 下水道網の保守は、効率的な閉鎖回路テレビ(CCTV)検査に大きく依存している。
多ラベル画像分類に基づく多くの有望なアプローチは、これらの検査を自動化するために、過去の検査レポートのデータベースを活用している。
しかし、これらのデータベースにラベルノイズが存在することは知られているが、未解決である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 07:55:17 GMT)
Using Lagrangian descriptors to calculate the Maslov index of periodic orbits [0.0] 周期軌道のマスロフ指数は、非可積分系の半古典的量子化において重要な要素である。
本稿では,ラグランジアン記述子に基づく2自由度システムのための簡単な手法について述べる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:48:15 GMT)
Unsupervised Data Validation Methods for Efficient Model Training [0.0] 自然言語処理(NLP)、テキスト音声処理(TTS)、音声テキスト処理(STT)、視覚言語モデル(VLM)は大規模なデータセットに大きく依存している。
本研究では,「品質データ」の定義,適切なデータ生成方法の開発,モデルトレーニングへのアクセシビリティ向上など,重要な分野について検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:00:53 GMT)
Tridiagonal Hamiltonians modeling the density of states of the Double-Scaled SYK model [0.0] 本研究では,Double-Scaled Sachdev-Ye-Kitaev(DSSYK)モデルにおける状態(DOS)のグローバル密度を分析する。
我々はハミルトニアンを三角化してパラメータ範囲内の平均ランツォス係数を決定する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:13:17 GMT)
Towards Quantifying The Privacy Of Redacted Text [0.0] 我々は、アートトランスフォーマーに基づくディープラーニングネットワークの状態を用いて、オリジナルのテキストを再構築する。
このようにして、修正されたテキストと整合したフルテキストの数、多様性、品質を推定できる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:00:27 GMT)
Towards Probabilistically-Sound Beam Search with Masked Language Models [0.0] ビームサーチマスキング言語モデル(MLM)は,分布上の結合確率が得られないため,部分的には困難である。
このような分布を推定することは、古代のテキスト復元やタンパク質工学といったドメイン固有の重要な応用がある。
ここでは,系列を用いたビームサーチの確率論的手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:34:02 GMT)
To Be or Not to Be (in the EU): Measurement of Discrepancies Presented in Cookie Paywalls [0.0] 本研究では,1)クライアントブラウザ,2)デバイスタイプ(デスクトップまたはモバイル),3)クッキーペイウォールの存在と動作に対する地理的な位置の影響について検討する。
クッキーペイウォールを提示する804のWebサイトで構成されたデータセット上の自動クローラを用いて,クッキーペイウォールの存在がユーザの地理的な位置に影響されていることを確認した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:59:54 GMT)
To Be or Not to Be (in the EU): Measurement of Discrepancies Presented in Cookie Paywalls [0.0] 本研究では,1)クライアントブラウザ,2)デバイスタイプ(デスクトップまたはモバイル),3)クッキーペイウォールの存在と動作に対する地理的な位置の影響について検討する。
クッキーペイウォールを提示する804のWebサイトで構成されたデータセット上の自動クローラを用いて,クッキーペイウォールの存在がユーザの地理的な位置に影響されていることを確認した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:59:54 GMT)
Think Beyond Size: Dynamic Prompting for More Effective Reasoning [0.0] 本稿では,Large Language Models(LLM)の推論能力向上を目的とした新しいフレームワークであるDynamic Promptingを提案する。
従来の静的プロンプト法とは対照的に、Dynamic Promptingはリアルタイムタスクの複雑さとモデル性能に基づいて、プロンプトシーケンスとステップカウントの適応的な修正を可能にする。
実験により, より小型のLCMにおいて, より大型のモデルと競争的に動作できることが示され, 推理効果の第一決定要因として, 従来のモデルサイズ重視に挑戦した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:14:36 GMT)
Thermal Decay of Planar Jones-Roberts Solitons [0.0] 希薄ガスボース・アインシュタイン凝縮では、ジョーンズ・ロバーツ・ソリトン族は渦双極子と希薄パルスを含む。
これらの励起はエネルギーと線形運動量の両方を持ち、その崩壊特性は超流動力学を理解するために重要である。
我々は,貯水池相互作用のGross-Pitaevskii理論で説明されるように,熱影響による平面ソリトン崩壊の理論を発展させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:32:54 GMT)
Theoretical limits of descending $\ell_0$ sparse-regression ML algorithms [0.0] 本研究では,emphmaximum-likelihood (ML)デコーディングの性能解析プログラムを開発した。
ML性能パラメータの鍵となるのは、残留エンフェロ平均二乗誤差(textbfRMSE$)を発見し、いわゆるエンフェロ遷移(PT)現象を示す。
Fl RDTの具体的実装と実用的妥当性は、典型的には、基礎となる数値評価のサイズのセットを実行する能力に依存している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:33:41 GMT)
The Space Just Above One Clean Qubit [0.0] 本稿では、その制限にもかかわらず、$frac12$BQPはよく知られた量子計算を実行できることを示す。
$frac12$BQPは、瞬時量子多項式時間(IQP)をシミュレートし、Deutsch-Jozsa問題、Bernstein-Vazirani問題、Simonの問題、周期探索を解く。
我々は$frac12$BQPが$$$-Forrelationを解決できないと推測する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:45:37 GMT)
Taming the Interacting Particle Langevin Algorithm -- the superlinear case [0.0] 我々は、この非線型性の下で、タグ付き相互作用粒子ランゲヴィンアルゴリズム(tIPLA)と呼ばれる新しい安定なクラスを開発する。
We obtain non-asymptotic convergence error estimates in Wasserstein-2 distance for the new class under an optimal rate。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:49:46 GMT)
Structural Manipulation of Spin Excitations in a Molecular Junction [0.0] 走査トンネル顕微鏡(STM)のデコレーションにおいて、単一メタロセン分子は感度の高いスピン検出器として機能する
ここでは、Nc〜Cu(111)のアンカーに対するスピン励起スペクトルの依存性を明確に示す、ニッケル(Nc)STM接合を原子的に操作する。
分子スピンと基板の電子連続体との非自明な磁気交換相互作用は、スピン励起のスペクトル線形状を決定する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:08:28 GMT)
Spin systems as quantum simulators of quantum field theories in curved spacetimes [0.0] 一般の2次元曲面時空における量子場理論(QFT)は、量子スピンあるいは量子ビットの系によって実現可能であることを実証する。
辞書によると、FLRW計量上のマヨラナフェルミオンのQFTは、時間依存の逆磁場を持つイジングモデルに対応する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 03:38:26 GMT)
Spectral theory of non-Markovian dissipative phase transitions [0.0] 非マルコフ系への散逸相転移の理論の一般化を示す。
我々のフレームワークは、挑戦的な$U(1)$-symmetric two-mode Dickeモデルで現れる超ラジアント相転移のすべての期待されたシグネチャをキャプチャできることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:04:37 GMT)
Simulating the Fermi-Hubbard model with long-range hopping on a quantum computer [0.0] 地上および励起状態の計算を行うための量子回路を提供する。
我々は,L=6部位と周期境界条件のチェーン上でのアプローチをベンチマークした。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:19:02 GMT)
Shift and matching queries for video semantic segmentation [0.0] 本稿では,問合せに基づく画像分割モデルをビデオに拡張する手法を提案する。
この方法はクエリベースのアーキテクチャを使用し、デコードされたクエリはセグメンテーションマスクを表す。
CityScapes-VPSとVSPWの実験結果は、ベースラインから大きく改善された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:07:33 GMT)
Shaping Integrity: Why Generative Artificial Intelligence Does Not Have to Undermine Education [0.0] この論文は、生成人工知能(GAI)がデジタルリテラシーを高め、真の知識構築を奨励し、教育における倫理的基準を維持できると主張している。
この研究は、生徒が現代世界の複雑さを倫理的かつ効果的にナビゲートするための、豊かでパーソナライズされた学習環境を構築するための、GAIの可能性を強調している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:49:22 GMT)
Self-Attention Mechanism in Multimodal Context for Banking Transaction Flow [0.0] バンキングトランザクションフロー(英: Banking Transaction Flow、BTF)は、日付、数値、単語の3つのモードからなる逐次データである。
自己教師型方式でBTFを多用した2つの一般モデルを訓練した。
これら2つのモデルの性能は、トランザクション分類タスクと信用リスクタスクの2つの下流タスクで評価された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:13:39 GMT)
Robust Finite-Temperature Many-Body Scarring on a Quantum Computer [0.0] 無障害多体系における熱化抑制機構は注目されている。
我々は,IBMのKolkata量子プロセッサを用いて,有限温度における量子多体傷の予期せぬ堅牢性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:25:01 GMT)
Revealing spoofing of quantum illumination using entanglement [0.0] 我々は、スパウファーの存在を検知しようとする古典的レーダーオペレーターのシナリオを分析する。
ノイズや損失がない場合、直接検出はより忠実なスプーフを生成する傾向にある。
この結果から, 絡み合いはスプーフ検出のための量子レーダとして利用可能な新しい資源であることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:19:11 GMT)
Random Natural Gradient [0.0] 量子自然勾配 (Quantum Natural Gradient, QNG) は、量子状態空間の局所幾何学に関する情報を利用する方法である。
そこで本研究では,QNG最適化の利点と性能を維持しつつ,QNGに必要な資源/状態準備を削減できる2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:56:45 GMT)
RAIN: Reinforcement Algorithms for Improving Numerical Weather and Climate Models [0.0] 現在の気候モデルは、サブグリッドスケールのプロセスを表現するために複雑な数学的パラメータ化に依存している。
本研究は,重要なパラメータ化課題に対処するために,強化学習と理想的な気候モデルを統合することを検討する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:24:01 GMT)
Quantum teleportation implies symmetry-protected topological order [0.0] 標準」テレポーテーションプロトコルでは、すべての結果依存ユニタリは、測定結果の線形関数に条件付けられたパウリ作用素である。
このようなプロトコルはすべて、対称性保護トポロジカル(SPT)順序を示す「資源状態」を作成することを含み、Abelian protect symmetric $mathcalG_k= (mathbbZ times mathbbZ_2)k$である。
k$論理状態は、バルク内の対応する2k$文字列順序パラメータを測定し、結果依存のポールを適用することで、チェーンの端の間でテレポートされる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:59:30 GMT)
Quantum optical neural networks with programmable nonlinearities [0.0] 線形光学よりもプログラム可能な非線形性を用いることで、量子光学回路を構築するのがより効率的な方法であることが示される。
このアプローチは、高忠実度演算を実現するのに必要な調整可能なパラメータの数を大幅に削減する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:37:05 GMT)
Quantum many-body solver using artificial neural networks and its applications to strongly correlated electron systems [0.0] 我々は質的な理解だけでなく、量子多体現象の定量的予測と設計も目指している。
新たな数値的アプローチとして、量子多体問題を分析する機械学習技術が2017年に導入された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:11:20 GMT)
Quantum many-body solver using artificial neural networks and its applications to strongly correlated electron systems [0.0] 我々は質的な理解だけでなく、量子多体現象の定量的予測と設計も目指している。
新たな数値的アプローチとして、量子多体問題を分析する機械学習技術が2017年に導入された。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:11:20 GMT)
Quantum logic control of a transition metal ion [0.0] 多数の準安定状態を持つ48$Ti$+$のような複雑な量子系は、遠波長ラマンレーザーで制御できる。
純粋な量子状態の合成は、ゼーマン構造のコヒーレントな操作と高分解能な測定を可能にする。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:01:38 GMT)
Quantum circuits for digital quantum simulation of nonlocal electron-phonon coupling [0.0] 本稿では,一次元格子モデルのデジタル量子シミュレータを提案する。
このシステムの自然初期(プリクエンチ)状態を生成する回路を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:07:57 GMT)
Quantum Algorithm for the Advection-Diffusion Equation with Optimal Success Probability [0.0] 明示的時間マーチ演算子は、対流様成分と補正シフト演算子とに分離される。
その結果、最適な成功確率を持つタイムマーチング演算子の非スケールブロック符号化が得られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:37:08 GMT)
Pseudo-Entanglement is Necessary for EFI Pairs [0.0] 我々は、新しい量子資源、擬似絡み合いを考察し、EFI対の存在が擬似絡み合いの存在を意味することを示す。
この結果は,計算暗号の分野において重要な意味を持つ。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:22:34 GMT)
Programmable Quantum Linear Interference with Pulse Shaping of Quantum Light [0.0] 光非線形効果を用いることなく、周波数多重化フォトニック量子状態の干渉を行う新しい手法を提案する。
本手法を周波数領域のHong-Ou-Mandel(HOM)干渉により実験的に実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:12:00 GMT)
Probabilistic Satisfaction of Temporal Logic Constraints in Reinforcement Learning via Adaptive Policy-Switching [0.0] Constrained Reinforcement Learning (CRL)は、従来の強化学習(RL)フレームワークに制約を導入する機械学習のサブセットである。
純粋学習(逆)と制約満足度を切り替えることに依存する新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:19:45 GMT)
Optimizing YOLO Architectures for Optimal Road Damage Detection and Classification: A Comparative Study from YOLOv7 to YOLOv10 [0.0] 本稿では,ディープラーニングモデルを用いた道路損傷検出のための総合ワークフローを提案する。
ハードウェアの制約を満たすため、大きな画像が収穫され、軽量モデルが利用される。
提案手法では,コーディネートアテンションレイヤを備えたカスタムYOLOv7モデルや,Tiny YOLOv7モデルなど,複数のモデルアーキテクチャを採用している。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:55:12 GMT)
Optimal Transportation by Orthogonal Coupling Dynamics [0.0] 本稿では,プロジェクション型勾配勾配法に基づくモンゲ・カントロビッチ問題に対処する新しい枠組みを提案する。
マイクロダイナミクスは条件付き期待の概念に基づいて構築され、そこでは意見力学との関係を探求する。
提案手法は,計算性能がよいランダムマップを復元できることを実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:53:48 GMT)
On Logic Gates with Complex Numbers [0.0] 論理ゲートは複素微分作用素の項で書けることを示し、入力と出力は複数の変数を持つ正則関数である。
様々な計算システムにおけるこの形式主義の普遍性について論じる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:24:20 GMT)
On Logic Gates with Complex Numbers [0.0] 論理ゲートは複素微分作用素の項で書けることを示し、入力と出力は複数の変数を持つ正則関数である。
様々な計算システムにおけるこの形式主義の普遍性について論じる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 06:24:20 GMT)
OWPCP: A Deep Learning Model to Predict Octanol-Water Partition Coefficient [0.0] 本稿では,Morgan の指紋とMACCS キーを入力として,logP を計算するためのディープラーニングモデル OWPCP を提案する。
26,254化合物から抽出したlogP値とこのような分子表現の相互結合を用いる。
その結果,OWPCPはlogPの信頼性の高い予測を提供することがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:14:31 GMT)
Nonlinear second-order dynamics describe labial constriction trajectories across languages and contexts [0.0] 言語や文脈において、即時変位と瞬時速度の比率は、一般的に運動開始から移動オフセットまでの指数的減衰曲線に従う。
我々は、この経験的発見を微分方程式で定式化し、点引力力学の仮定と組み合わせることで、口唇収縮軌跡を記述する非線形二階力学系を導出する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:13:51 GMT)
Neural Methods for Amortized Inference [0.0] 統計的推論のシミュレーションに基づく手法は、過去50年間で劇的に進化し、技術進歩のペースを維持している。
結果として得られるツールは、初期設定コストの後、高速フィードフォワード操作による迅速な推論を可能にするという意味で、償却される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 04:30:04 GMT)
Nesterov acceleration in benignly non-convex landscapes [0.0] 本研究では, モーメントに基づく最適化アルゴリズムが, 深層学習問題の非凸設定に応用可能であることを示す。
本稿では、加速理論と実践設定のこのギャップを部分的に埋める。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 22:02:10 GMT)
Multimodal Perception System for Real Open Environment [0.0] 提案システムには、組み込み計算プラットフォーム、カメラ、超音波センサー、GPS、IMUデバイスが含まれる。
従来のフレームワークとは異なり、私たちのシステムは複数のセンサーと高度なコンピュータビジョンアルゴリズムを統合し、ユーザーが確実に外を歩けるようにします。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:53:42 GMT)
Modeling Alzheimer's Disease: From Memory Loss to Plaque & Tangles Formation [0.0] ホップフィールドモデルを用いて、記憶障害とアルツハイマー病に特徴的な生化学的プロセスの両方を探索する。
記憶喪失, 混乱, 回復時間の遅れなど, 認知症の徴候症状がみられた。
我々の研究は、神経変性疾患におけるシナプスと代謝障害の二重影響を理解するための計算フレームワークを提供する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:35:10 GMT)
Mobility-GCN: a human mobility-based graph convolutional network for tracking and analyzing the spatial dynamics of the synthetic opioid crisis in the USA, 2013-2020 [0.0] オピオイド(Opioids)は、アメリカ合衆国で最も一般的な薬物である。
2018年、薬物過剰摂取死の約70%がオピオイドであり、オピオイド関連死亡の67%が合成オピオイドである。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:18:45 GMT)
Mitigating noise in digital and digital-analog quantum computation [0.0] デジタルアナログ量子コンピューティング(DAQC)は、よりレジリエントな代替量子コンピューティングパラダイムを提供する。
DAQCは、特にプロセッササイズが大きくなるにつれて、デジタルアプローチを忠実に上回っている。
これらの結果は、NISQ時代の量子コンピューティングの代替手段としてDAQCを確立した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:41:57 GMT)
Meta-Learning Integration in Hierarchical Reinforcement Learning for Advanced Task Complexity [0.0] 階層強化学習(HRL)は、それらを構造化されたポリシーに分解することで、複雑なタスクに効果的に取り組む。
我々は、メタラーニングをHRLに統合し、エージェントの学習能力を高め、階層的な政策を迅速に適応させる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:47:37 GMT)
Megastable quantization in generalized pilot-wave hydrodynamics [0.0] 調和ポテンシャルの古典粒子は連続エネルギースペクトルを生じさせ、対応する量子粒子は数え切れないほど無限の量子化されたエネルギーレベルを示す。
近年、歩行液滴として生成する古典的非マルコフ波動粒子は、様々な流体力学的量子アナログを示すことが示されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:38:12 GMT)
Machine Learning for Missing Value Imputation [0.0] 本論文の主な目的は、ミス・バリュー・インプットにおける最先端の機械学習アプリケーションの解析と同様に、包括的で厳密なレビューを行うことである。
2014年から2023年にかけて発行された100以上の記事が、その方法や発見を考慮して批判的にレビューされている。
最新の文献は,MVI法の動向とその評価を精査するために検討されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:56:49 GMT)
MGMD-GAN: Generalization Improvement of Generative Adversarial Networks with Multiple Generator Multiple Discriminator Framework Against Membership Inference Attacks [0.0] 我々は、複数のジェネレータと複数の識別器(MGMD-GAN)で構成される新しいGANフレームワークを提案する。
本稿では,複数のジェネレータと複数識別器(MGMD-GAN)で構成される新しいGANフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:43:59 GMT)
Loschmidt Echo for Deformed Wigner Matrices [0.0] 互いに近い2つのハミルトン系を考える。
対応するLoschmidtエコー$mathfrakM(t)の時間遅延の解析
我々の結果はそのような$H$と$H$の2可解法則である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:55:57 GMT)
Linguistically-Informed Multilingual Instruction Tuning: Is There an Optimal Set of Languages to Tune? [0.0] 本研究では,言語情報を用いた指導指導のための言語選択手法を提案する。
簡単なアルゴリズムを用いて、多様な言語を選択し、様々なベンチマークやオープンエンドの質問でそれらの有効性をテストする。
その結果、この慎重な選択は、言語をランダムに選択するよりも、より優れた結果をもたらすことがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 10:57:24 GMT)
Level of agreement between emotions generated by Artificial Intelligence and human evaluation: a methodological proposal [0.0] 生成画像と人間の感情反応の一致度はまだ評価されていない。
本研究は、感情評価に固有の主観性を確認した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:44:32 GMT)
Inverted-circuit zero-noise extrapolation for quantum gate error mitigation [0.0] 本稿では,量子回路で発生する誤差の強度を簡易に推定する手法を提案する。
逆回路を付加し、初期状態の確率を測定することにより、回路の誤差強度を決定する。
提案手法は,現在のハードウェアにおいて特に有効であることが証明され,その短期量子コンピューティングアプリケーションへの適用性を示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:59:17 GMT)
Intellectual Property Blockchain Odyssey: Navigating Challenges and Seizing Opportunities [0.0] 本稿では,知的財産権(IPR)保護とブロックチェーン技術との関係について考察する。
ブロックチェーン技術を知的財産権やその他の技術コンポーネントに統合するための、広範なフレームワークを提供します。
このフレームワークは、知的財産の景観に対して、構造化された方法で新しい視点を与える可能性がある。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:27:55 GMT)
Impact of Missing Values in Machine Learning: A Comprehensive Analysis [0.0] 本稿では,機械学習(ML)モデルにおける欠落値の影響について検討する。
分析では、バイアス付き推論、予測能力の低下、計算負荷の増大など、欠落した値による課題に焦点を当てた。
この研究は、欠落した値に対処する実践的な意味を説明するためにケーススタディと実例を用いている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:31:44 GMT)
How Powerful are Decoder-Only Transformer Neural Models? [0.0] GPT-xで採用されている基礎技術のチューリング完全性に対処する最初の研究である。
単語埋め込みの空間性/圧縮性はチューリング完全性を維持する上で重要な考慮事項であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:51:10 GMT)
Higher-order incompatibility improves distinguishability of causal quantum networks [0.0] 非実装の量子テスタや非互換な量子テスタは、互換の量子テスタよりも識別可能性のタスクが優れていることを示す。
また、資源理論測度凸重みを用いて、テスタに存在する一般的な量子リソースは、量子コム排除タスクに精通していることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:33:50 GMT)
Heating Up Quasi-Monte Carlo Graph Random Features: A Diffusion Kernel Perspective [0.0] 我々は最近導入された準グラフランダムな特徴のクラス(q-GRF)の上に構築する。
拡散核は2正規化ラプラシアンと最もよく似ている。
我々は、以前に確立されたアンチテーゼの終了手順の恩恵を受けるグラフタイプを探索する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:51:31 GMT)
Harmonic Oscillator based Particle Swarm Optimization [0.0] 一般に、パラメータ(パラメータ空間)の集合は、これらのパラメータ(コスト関数)に依存する関数の最低値を見つけるように調整される。
ほとんどの場合、パラメータ空間は完全に探索するには大きすぎるため、最も効率的な手法は要素(最適化プロセスの開始設定と意思決定に含まれるランダム性)とよく設計された決定論的プロセスを組み合わせることである。
本稿では,食品を探す鳥の群れにインスパイアされた高効率で成功したアルゴリズムであるParticle Optimization(PSO)をハーモニックス(Harmonics)の原理と統合する手法を提案する。
この物理に基づくアプローチは集合エネルギーの概念を導入し、よりスムーズかつスムーズにします。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:35:45 GMT)
Haldane model on the Sierpiński gasket [0.0] Sierpi'nskiガスケット上のHaldaneモデルの位相位相について検討した。
フラクタル幾何学の結果、複数のフラクタルギャップが生じる。
平らなバンドが出現し、複雑な隣のアレストホッピングのため、このバンドは分裂し、複数のトポロジカルフラックスによって引き起こされるギャップが出現する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:11:00 GMT)
Geometry and proper time of a relativistic quantum clock [0.0] 量子自由度を含むように古典的な経路長関数を摂動させる新しい枠組みが示されている。
この枠組みでは、量子時計は、時計の量子状態を指定するパラメータによって変形した時空の族の測地線を走行する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:39:29 GMT)
From Uncertainty to Innovation: Wearable Prototyping with ProtoBot [0.0] この研究は4つのユニークなウェアラブルデバイスの概念を生み出し、参加者は選択したコンポーネントのプロトタイプにProtobotを使用した。
我々の研究は、ウェアラブルエレクトロニクスの迅速なプロトタイピングに大規模な言語モデルを使うことを初めて実証した。
このアプローチは、ウェアラブルプロトタイプと他の製品の両方を開発したいと考えている人々にとって、不確実性を恐れることなく、迅速なプロトタイピングのパイオニアになると考えています。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:57:58 GMT)
Formation, Prevalence and Stability of Bouncing-Ball Scars [0.0] 量子傷は不安定な古典周期軌道に沿った高密度の確率密度に対応する。
この研究は、二次元(2D)量子井戸における線形「バウンシングボール」(BB)傷の生成、有病率、安定性に焦点をあてる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:21:03 GMT)
Field theory for monitored Brownian SYK clusters [0.0] ブラウン・サハデフ・イェ・キタエフ系の複数のクラスターの時間的進化を考察する。
我々は、高次対称性群に対するスピンコヒーレント状態の一般化により、ダイナミクスのコヒーレント状態経路積分を構築する。
定常状態においては,2つの監視されたクラスターが線形-in-Nの絡み合いを示し,その比例係数は単位結合の強さに依存することを示した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:21:19 GMT)
Exploring Natural Language-Based Strategies for Efficient Number Learning in Children through Reinforcement Learning [0.0] 本稿では,強化学習(RL)の枠組みを用いて,子どもが数を学ぶ方法を検討する。
最先端の強化学習モデルを用いて,様々な言語命令が数獲得に与える影響をシミュレートし,解析する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:49:13 GMT)
Experimental verification of the quantum nature of a neural network [0.0] システムを量子化する理由と、ニューラルネットワークが量子残基を持つと解釈できる範囲について論じる。
古典的ニューラルネットワークの量子関数規則(マップ)から絡み合いを抽出できる可能性のある実験を提案する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:16:30 GMT)
Exactly solvable inhomogeneous fermion systems [0.0] シュル「オーディンガー」方程式とハイゼンベルク方程式は、固有値と固有状態全体の集合が知られているので明示的に解かれる。
基底状態2点相関関数を明示的に導出する。
シュル・オーディンガー方程式の正確な可解性は、対応するフォッカー・プランク方程式の可解性を意味する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:01:32 GMT)
Exact spectral form factors of non-interacting fermions with Dyson statistics [0.0] スペクトル形成因子(SFF)は、量子多体系におけるランダム行列の振る舞いの強力な診断である。
SFFを$textitexactly$で計算できるランダム回路アンサンブルのファミリーを導入する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:00:00 GMT)
Entropy bounds for device-independent quantum key distribution with local Bell test [0.0] デバイス非依存量子鍵分布(DIQKD)における大きな課題の1つは、長い距離でベル違反を達成することである。
最近の研究は、局所ベル試験を用いて、距離を延ばす非局所相関の証明という概念を探求している。
ここでは、長距離での非局所的な振る舞いを検証するために短距離相関を用いて、追加の量子デバイスを一方に近接して配置する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:41:26 GMT)
Enhanced physics-informed neural networks (PINNs) for high-order power grid dynamics [0.0] 我々は高次・高次元電力系統モデルのための改良された物理インフォームドニューラルネットワーク(PINN)を開発した。
このような拡張PINNは、安定で信頼性の高い再生可能エネルギーに富む将来のグリッドを確保するために必要な高忠実度シミュレーションを加速することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 01:52:47 GMT)
Emulating quantum computing with optical matrix multiplication [0.0] 光コンピューティングは光の速度を利用してベクトル行列演算を効率的に行う。
量子力学原理を用いてフォトニック行列乗法を定式化する。
我々はよく知られたアルゴリズム、すなわちDeutsch-Jozsaのアルゴリズムを実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:11:57 GMT)
Emulating quantum computing with optical matrix multiplication [0.0] 光コンピューティングは光の速度を利用してベクトル行列演算を効率的に行う。
量子力学原理を用いてフォトニック行列乗法を定式化する。
我々はよく知られたアルゴリズム、すなわちDeutsch-Jozsaのアルゴリズムを実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:11:57 GMT)
Efficient fiber-pigtailed source of indistinguishable single photons [0.0] 本稿では, 決定的に作製した単一光子源のファイバピグテール法について報告する。
連続動作10時間以上は,不明瞭性と単光子速度が安定であることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 09:42:04 GMT)
Efficient Systematic Reviews: Literature Filtering with Transformers & Transfer Learning [0.0] 特定のトピックに関する重要な研究項目を特定するのに必要な時間に関して、負担が増大する。
本研究では,必要な内容の自然言語記述として提案される研究課題に適合する汎用フィルタリングシステムを構築する方法を提案する。
以上の結果から, バイオメディカル文献に基づいて事前学習したトランスフォーマーモデルを用いて, 特定のタスクを微調整したトランスフォーマーモデルにより, この問題に対する有望な解決策が得られた。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:20:34 GMT)
Dynamical and invariance algebras of the $d$-dimensional Dunkl-Coulomb problem [0.0] 標準$d$-次元クーロン問題のリッチ代数構造はダンクル問題にまで拡張できることが示されている。
標準微分を so($d+1$,2) の Dunkl で置き換えると、前者の動的代数生成元は、同様の可換関係を持つ変形代数を生み出す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 12:30:19 GMT)
Diversity of Thought Elicits Stronger Reasoning Capabilities in Multi-Agent Debate Frameworks [0.0] 大規模言語モデルの推論と事実的正確性を改善するために, 思考の促進, 自己検証, マルチエージェントの議論が提案されている。
マルチエージェントの議論はどんなモデルスケールでも有効であり、思考の多様性はLLMの議論においてより強力な推論をもたらす。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:59:01 GMT)
Disorder-Free Localization for Benchmarking Quantum Computers [0.0] ゲート型量子コンピュータにおいて,障害のないローカライゼーションの標準モデルをどのように効率的に実装できるかを示す。
相関拡散の欠如と調整可能なエンタングルメント成長のボリューム法則との同時観測により,量子コンピュータの能力のベンチマークを行う上で理想的なテストベッドが提供されることを示す。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:00:00 GMT)
Disease Entity Recognition and Normalization is Improved with Large Language Model Derived Synthetic Normalized Mentions [0.0] 大規模言語モデル(LLM)の生成により、これらの情報抽出タスクの性能が向上する可能性がある。
疾患エンティティ認識(DER)と疾患エンティティ正規化(DEN)の総合的およびアウトオブディストリビューション(OOD)性能を測定した。
SapBERTとKrissBERTの総合成績は3~9ポイント,OODは20~55ポイント向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:18:34 GMT)
Designing metasurface optical interfaces for solid-state qubits using many-body adjoint shape optimization [0.0] 本稿では, 基本形状からなる地表面の逆設計に関する一般的な戦略について述べる。
私たちは、ダイヤモンドの窒素空洞センターから光を集め、衝突させる構造を設計するためにそれを使用します。
このような準曲面は、固体量子ビットのためのスケーラブルな光学インターフェースを構成する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 14:11:52 GMT)
Dense Optimizer : An Information Entropy-Guided Structural Search Method for Dense-like Neural Network Design [0.0] 本稿では,高性能高密度ネットワークを自動検索するDenseNetというアーキテクチャ検索手法を提案する。
DenseNetはCIFAR-100で84.3%の精度を達成しており、これはオリジナルのものよりも5.97%高い。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 00:23:34 GMT)
Deep Learning for Generalised Planning with Background Knowledge [0.0] 計画上の問題は簡単に解決できるが、最適化は難しい。
ユーザがバックグラウンド知識を指定できる新しい機械学習アプローチを提案する。
BKを導入することで、私たちのアプローチは、スクラッチから問題を解決する方法を学ぶ必要性を回避し、代わりに計画品質の最適化を学ぶことに集中します。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:49:05 GMT)
Deep Generative Quantile Bayes [0.0] 深部生成量学習による後部サンプリング法を開発した。
多変量体におけるモンゲ・カントロビッチ深度を利用して、ベイズ集合から直接サンプリングする。
確率の欠如が古典的MCMCの実現を不可能とするいくつかの事例に対して,本手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 21:25:15 GMT)
Cryptanalysis of the SIMON Cypher Using Neo4j [0.0] 本稿では,SIMON LEA における差分間の複雑な関係を識別するために知識グラフを用いた新しい手法を提案する。
これにより、差分全体の最適経路の同定が可能となり、SIMONの差分セキュリティ解析の有効性が向上する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 05:15:06 GMT)
Consistency for constrained maximum likelihood estimation and clustering based on mixtures of elliptically-symmetric distributions under general data generating processes [0.0] P$ が十分に分離されているが非パラメトリック分布の混合である場合、推定器の集団バージョンの成分は、よく分離された$P$ の成分に対応することが示される。
このことは、もしこれらのサブポピュレーションが混合モデルが仮定したものと異なるとしても、$P$が十分に分離されたサブポピュレーションを持つ場合のクラスタ分析にそのような推定子を使用するための理論的正当化を与える。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 23:07:12 GMT)
Comparison of Controlled-Z operation and beam-splitter transformation for generation of squeezed Fock states by measurement [0.0] ビームスプリッタを用いた2モード絡み合ったガウス状態からの1つ以上の光子サブトラクションによる圧縮フォック状態の生成と制御Z動作に対処する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 13:14:00 GMT)
Beyond the semiclassical approximation in atom interferometry [0.0] 弱無調波トラップにおける原子干渉計の位相シフトを評価するための量子摂動的アプローチについて述べる。
半古典的近似の形式は、アンハーモニック摂動において一階に有効であることが判明した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 15:33:55 GMT)
Avoiding mode collapse in diffusion models fine-tuned with reinforcement learning [0.0] 強化学習(RL)による微調整基礎モデルは、下流の目標に整合する上で有望であることが証明されている。
拡散モデル (DM) の階層的性質を生かし, 各エポックでRL法で動的に訓練する。
HRFで訓練したモデルは、下流タスクにおける多様性の保存性を向上し、微調整の堅牢性を高め、平均報酬を損なうことなく達成できることが示される。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 19:06:23 GMT)
Asynchronous Graph Generator [0.0] AGGは、学習可能な埋め込みを通じて、ノード内の計測、タイムスタンプ、チャネル固有の機能をエンコードする。
AGGは、例えば、所定のタイムスタンプとチャネル仕様に条件付けされた新しいノードを作成することで、エンプレクショナルアテンション生成による計算を実行する。
実験の結果、AGGは、ベンチマークデータセットであるemphBeijing Air Quality、emphPhysioNet ICU 2012、emphUCIローカライゼーションにおいて、時系列の計算、分類、予測において最先端の結果を達成し、近年の注目を集めていることがわかった。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:44:12 GMT)
Asymmetric dynamical localization and precision measurement of BEC micromotion [0.0] ボースコンデンサット(BEC)をベースとした原子光蹴りロータを用いて非対称局在運動量分布を生成する。
非対称な特徴は、壊れたパリティ対称性によって引き起こされる初期の時間力学から生じることが示されている。
本研究では,「微小運動」の精密測定も行う。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:42:19 GMT)
An Updated Quantum Complementarity Principle [0.0] ボーアの補性原理は長い間、量子力学の基本的な概念であった。
近年の進歩により、量子力学の公理から量子相補関係が厳密に導かれることが示されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 16:15:20 GMT)
An Accessible Planar Ion Trap for Experiential Learning in Quantum Technologies [0.0] 本稿では,平面状線形イオントラップを用いたイオントラップを探索する,安価でアクセス可能な命令セットについて述べる。
学生はトラップ電圧を制御でき、粒子運動の特性とトラップの解析モデルを比較することができる。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:43:37 GMT)
Adaptive Real-Time Multi-Loss Function Optimization Using Dynamic Memory Fusion Framework: A Case Study on Breast Cancer Segmentation [0.0] 適応型マルチロス関数をリアルタイムにペナル化するための動的メモリ融合という新しいフレームワークを提案する。
乳房超音波データセットを用いた実験により,様々な測定値のセグメンテーション性能が向上した。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 11:23:04 GMT)
A universal speed limit for spreading of quantum coherence [0.0] 分離された原子ガス中の凝縮物の生成を平衡から遠ざかる。
システムを通してのコヒーレンスの普及は、相互作用の弱さに対して、当初は遅くなっていることを示す。
これらの観測は、初期状態、ガス密度、システムサイズの変化に対して堅牢である。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 17:59:41 GMT)
A Hate Speech Moderated Chat Application: Use Case for GDPR and DSA Compliance [0.0] 本研究は、コンテンツモデレーションプロセスに法的・倫理的推論を実装する新しい応用法を提案する。
GPT-3.5やSolid Pods,ルール言語Provaといった技術を使って,オンラインコミュニケーションの基本となる2つのユースケースを提示し,実装する。
この研究は、ヘイトスピーチの法的および倫理的定義の異なる範囲で推論するための新しいアプローチを提案し、ヘイトスピーチに適合するカウンターを計画する。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 08:28:38 GMT)
A Framework to Enable Algorithmic Design Choice Exploration in DNNs [0.0] 深層学習ネットワーク(DNN)のための粒度アルゴリズム制御を容易に利用できるオープンソースフレームワークを提案する。
このフレームワークは、DNNが利用する独自のアルゴリズムの実装と選択を可能にする。
フレームワークは追加のパフォーマンスオーバーヘッドを発生させません。つまり、パフォーマンスはユーザが選択したアルゴリズムにのみ依存します。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 18:41:56 GMT)
1-Shot Oblivious Transfer and 2-Party Computation from Noisy Quantum Storage [0.0] Oblivious Transfer (OT) を達成するために必要な前提を最小化する研究経路
この研究では、量子資源を活用することで、3つの主要な貢献が証明されている。
論文参考訳(メタデータ) (Thu, 10 Oct 2024 20:54:09 GMT)