On Affine Homotopy between Language Encoders [127.6] 言語エンコーダのエファフィンアライメント特性について検討する。
アフィンアライメントは基本的には類似性の非対称な概念であるが、外生的類似性についてはいまだに有益である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:58:28 GMT)
Competition-Level Problems are Effective LLM Evaluators [121.2] 本稿では,Codeforcesにおける最近のプログラミング問題の解決において,大規模言語モデル(LLM)の推論能力を評価することを目的とする。
まず,問題の発生時間,難易度,遭遇したエラーの種類など,様々な側面を考慮して,GPT-4の望ましくないゼロショット性能を総合的に評価する。
驚くべきことに、GPT-4のTheThoughtivedのパフォーマンスは、2021年9月以降、あらゆる困難と種類の問題に対して一貫して問題が減少するような崖を経験している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:49:50 GMT)
Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression [109.2] 本研究は,Large Language Models (LLM) の最初の完全評価を行う。
量子化は現在、効率性と信頼性を同時に達成する上で、プルーニングよりも効果的なアプローチであることが分かっています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:40:12 GMT)
Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.4] 人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:33:22 GMT)
Deep Learning for Camera Calibration and Beyond: A Survey [100.8] カメラキャリブレーションでは、キャプチャされたシーケンスから幾何学的特徴を推測するために、カメラパラメータを推定する。
近年の取り組みでは,手動キャリブレーションの繰り返し作業に代えて,学習ベースのソリューションが活用される可能性が示唆されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:57:38 GMT)
Enhancing Temporal Consistency in Video Editing by Reconstructing Videos with 3D Gaussian Splatting [94.8] Video-3DGSは、ゼロショットビデオエディタの時間的一貫性を高めるために設計された3Dガウススプラッティング(3DGS)ベースのビデオ精細機である。
本手法は動的モノクロビデオの編集に適した2段階の3次元ガウス最適化プロセスを利用する。
58の動的モノクロビデオ間の時間的一貫性を確保することで、ビデオ編集を強化する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:57:37 GMT)
The Crystal Ball Hypothesis in diffusion models: Anticipating object positions from initial noise [92.5] 拡散モデルはテキスト・画像生成タスクにおいて顕著な成功を収めた。
我々は、初期ノイズ画像内の特定の領域をトリガーパッチと呼び、結果として発生する画像のオブジェクト生成に重要な役割を果たす。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:06:00 GMT)
Fine-Grained Image-Text Alignment in Medical Imaging Enables Explainable Cyclic Image-Report Generation [91.6] 本稿では,胸部X線画像領域と医療報告における単語を関連付けるために,適応パッチワードマッチング(AdaMatch)モデルを提案する。
AdaMatchは、適応パッチと単語のきめ細かい関係を利用して、対応する単語で特定の画像領域の説明を提供する。
CXRレポート生成タスクの明示的な説明性を提供するため,循環型CXRレポート生成のためのAdaMatchベースの双方向大言語モデルを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:27:38 GMT)
Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation [91.4] 高速かつ高精度なオープン語彙型3Dインスタンスセグメンテーション手法Open-YOLO 3Dを提案する。
オープンな3Dインスタンスセグメンテーションのために、マルチビューRGB画像からの2Dオブジェクト検出のみを効果的に活用する。
テキストプロンプトと3Dマスクとのマッチング性能は、2Dオブジェクト検出器でより高速に実現できることを実証的に見出した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:59:31 GMT)
Think Twice Before Trusting: Self-Detection for Large Language Models through Comprehensive Answer Reflection [90.7] 本稿では, LLM生成解を超える包括的解答空間を考察した, 新たな自己検出パラダイムを提案する。
複数の候補回答の信頼性を徹底的に比較し、LLM生成の不正確な回答における過剰信頼を軽減する。
このフレームワークは、優れた自己検出のための既存のアプローチとシームレスに統合できる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:42:12 GMT)
Large Language Models for Generative Information Extraction: A Survey [89.7] 情報抽出は、平易な自然言語テキストから構造的知識を抽出することを目的としている。
生成型大規模言語モデル(LLM)は、テキストの理解と生成において顕著な能力を示した。
LLMは生成パラダイムに基づいたIEタスクに対して実行可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:20:27 GMT)
Editing Factual Knowledge and Explanatory Ability of Medical Large Language Models [89.1] モデル編集は、大きな言語モデル(LLM)の振る舞いを、特定の知識に関連して正確に変更することを目的としている。
このアプローチは、LLMにおける幻覚や時代遅れの情報の問題に対処する上で有効であることが証明されている。
しかし、医療分野における知識の修正にモデル編集を用いることの可能性はほとんど解明されていない。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:38:34 GMT)
Rank-based No-reference Quality Assessment for Face Swapping [88.5] 顔スワップ法における品質測定の基準は、操作された画像とソース画像の間のいくつかの距離に依存する。
顔スワップ用に設計された新しい非参照画像品質評価法(NR-IQA)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:36:29 GMT)
Iterative Forward Tuning Boosts In-Context Learning in Language Models [88.3] 本研究では,大規模言語モデル(LLM)における文脈内学習を促進する新しい2段階フレームワークを提案する。
具体的には、当社のフレームワークでは、ICLプロセスをDeep-ThinkingとTest Stageの2つの別々のステージに分類しています。
ディープシンキング段階にはユニークな注意機構、すなわち反復的な注意強化機構が組み込まれており、複数の情報の蓄積を可能にしている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:49:01 GMT)
KPZ scaling from the Krylov space [83.9] 近年,Cardar-Parisi-Zhangスケーリングをリアルタイムの相関器や自動相関器に示す超拡散が報告されている。
これらの結果から着想を得て,Krylov演算子に基づく相関関数のKPZスケーリングについて検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:57:59 GMT)
On Context Utilization in Summarization with Large Language Models [83.8] 大きな言語モデル(LLM)は抽象的な要約タスクに優れ、流動的で関連する要約を提供する。
最近の進歩は、100kトークンを超える長期入力コンテキストを扱う能力を拡張している。
要約における文脈利用と位置バイアスに関する最初の総合的研究を行う。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:56:48 GMT)
Timer: Generative Pre-trained Transformers Are Large Time Series Models [83.0] 本稿では,大規模時系列モデル(LTSM)の早期開発を目的とした。
事前トレーニング中に、最大10億のタイムポイントを持つ大規模なデータセットをキュレートします。
多様なアプリケーションのニーズを満たすため,予測,計算,時系列の異常検出を統一的な生成タスクに変換する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:08:59 GMT)
Transferable and Principled Efficiency for Open-Vocabulary Segmentation [82.7] 事前学習された基礎視覚言語計算モデルの最近の成功は、Open-Vocabulary (OVS)を可能にする。
このアプローチでは,1) 背骨のモデルサイズが大きいこと,2) 微調整時にコストがかかること,の2つの課題に対して,計算上のオーバーヘッドが発生する。
本稿では,大規模な視覚言語基盤モデルに基づいて,従来のOVSに匹敵する,あるいはさらに優れた性能を実現することを目的とする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:15:51 GMT)
Exploring Precision and Recall to assess the quality and diversity of LLMs [82.2] 我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。
このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:33:27 GMT)
Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF [80.3] オンラインとオフラインのRLHFに統一的なアプローチを導入します。
VPOは、報酬関数の最大値推定を対応する値関数で正規化する。
テキスト要約とダイアログの実験は、VPOの実用性と有効性を検証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:49:36 GMT)
FitDiff: Robust monocular 3D facial shape and reflectance estimation using Diffusion Models [79.7] 拡散型3次元顔アバター生成モデルFitDiffを提案する。
本モデルでは,「近距離」2次元顔画像から抽出したアイデンティティ埋め込みを利用して,再現性のある顔アバターを高精度に生成する。
FitDiffは、顔認識の埋め込みを前提とした最初の3D LDMであり、一般的なレンダリングエンジンで使用可能な、ライティング可能な人間のアバターを再構築する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:08:25 GMT)
Feedback Loops With Language Models Drive In-Context Reward Hacking [79.0] フィードバックループがコンテキスト内報酬ハッキング(ICRH)を引き起こす可能性があることを示す。
ICRHに繋がる2つのプロセス、すなわちアウトプット・リファインメントとポリシー・リファインメントを同定し研究する。
AI開発が加速するにつれて、フィードバックループの効果が増大する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:16:52 GMT)
EduNLP: Towards a Unified and Modularized Library for Educational Resources [78.9] 我々はEduNLPという,統一された,モジュール化された,広範なライブラリを紹介し,教育資源の理解に焦点をあてる。
このライブラリでは、ワークフロー全体を4つのキーモジュールに分離し、データ構成、処理、モデル実装、モデル評価など、一貫したインターフェースを提供します。
現在のバージョンでは、主に4つのカテゴリから10の典型的なモデルを提供し、教育領域における5つのダウンストリーム評価タスクを、ユーザの使用に対して8つの被験者に提供します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:44:59 GMT)
VideoPoet: A Large Language Model for Zero-Shot Video Generation [78.6] VideoPoetは、高品質なビデオと一致するオーディオを合成できる言語モデルである。
VideoPoetはマルチモーダル入力を処理するデコーダのみのトランスフォーマーアーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:25:20 GMT)
Are More LLM Calls All You Need? Towards Scaling Laws of Compound Inference Systems [76.7] LM呼び出し回数がVotteとFilter-Voteのパフォーマンスに与える影響について検討する。
意外なことに、複数の言語タスクにおいて、VoteとFilter-Voteの両方のパフォーマンスは、まず増大するが、LM呼び出しの回数の関数として減少する可能性がある。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:20:33 GMT)
Fortify the Shortest Stave in Attention: Enhancing Context Awareness of Large Language Models for Effective Tool Use [74.7] 大規模言語モデル(LLM)の注意配分における固有波形パターンは、高い文脈認識を必要とするタスクにおいて、その性能に大きな影響を及ぼす。
この問題に対処するため,Attention Buckets という新しい推論手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:33:12 GMT)
Diffusion-Refined VQA Annotations for Semi-Supervised Gaze Following [74.3] 訓練用視線モデルには、人間のアノテータによって注釈付けされた視線目標座標を持つ多数の画像が必要である。
タスクに2つの新しい前処理を導入することで、視線追跡のための最初の半教師付き手法を提案する。
提案手法は,GazeFollow画像データセットに基づく単純な擬似アノテーション生成ベースラインよりも優れている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:43:26 GMT)
Representation Surgery: Theory and Practice of Affine Steering [72.6] 言語モデルは、しばしば好ましくない振る舞いを示す。
モデルが望ましくない振る舞いを示すのを防ぐための自然な(そして一般的な)アプローチの1つは、モデルの表現を操ることである。
本稿では, ステアリング機能の形式的および経験的特性について検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:26:07 GMT)
PROXYQA: An Alternative Framework for Evaluating Long-Form Text Generation with Large Language Models [72.6] ProxyQAは、長文生成を評価するための革新的なフレームワークである。
さまざまなドメインにまたがる詳細なヒューマンキュレートされたメタクエストで構成されており、それぞれに事前にアノテートされた回答を持つ特定のプロキシクエストが伴っている。
プロキシクエリに対処する際の評価器の精度を通じて、生成されたコンテンツの品質を評価する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:46:47 GMT)
KPEval: Towards Fine-Grained Semantic-Based Keyphrase Evaluation [69.6] KPEvalは、参照合意、忠実性、多様性、有用性という4つの重要な側面からなる総合的な評価フレームワークである。
KPEvalを用いて、23のキーフレーズシステムを再評価し、確立されたモデル比較結果に盲点があることを発見した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:00:56 GMT)
Leveraging Visual Tokens for Extended Text Contexts in Multi-Modal Learning [68.4] 本研究では,大規模言語モデル(MLLM)において,テキスト中のテキスト長を効率的に向上する革新的な手法を提案する。
視覚トークンを用いて長文のテキストを処理するビジュアルインコンテキストテキスト処理(VisInContext)を提案する。
この技術は、トレーニングおよび推論段階の両方において、GPUメモリ使用率と浮動小数点演算(FLOP)を大幅に削減する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:59:25 GMT)
StrucTexTv3: An Efficient Vision-Language Model for Text-rich Image Perception, Comprehension, and Beyond [68.0] 我々は、テキストリッチな画像のための様々なインテリジェントなタスクに取り組むために、効率的な視覚言語モデルStrucTexTv3を開発した。
学習を通してStrucTexTv3の知覚と理解能力を高める。
提案手法は,テキストに富んだ画像認識タスクでSOTAを達成し,理解タスクの性能を大幅に向上させた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:14:39 GMT)
Meta-Learners for Partially-Identified Treatment Effects Across Multiple Environments [67.8] 観察データから条件平均治療効果(CATE)を推定することは、パーソナライズされた医療など多くの応用に関係している。
ここでは、観測データが複数の環境からやってくる広範囲な環境に焦点を当てる。
任意の機械学習モデルと組み合わせて使用可能な境界を推定するために、異なるモデルに依存しない学習者(いわゆるメタ学習者)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:31:43 GMT)
Contextualized Diffusion Models for Text-Guided Image and Video Generation [67.7] 条件拡散モデルは高忠実度テキスト誘導視覚生成および編集において優れた性能を示した。
本研究では,テキスト条件と視覚的サンプル間の相互作用とアライメントを包含するクロスモーダルコンテキストを組み込むことにより,コンテキスト拡散モデル(ContextDiff)を提案する。
理論的導出を伴うDDPMとDDIMの両方にモデルを一般化し、テキスト・ツー・イメージ生成とテキスト・ツー・ビデオ編集という2つの課題を伴う評価において、モデルの有効性を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:08:56 GMT)
What Improves the Generalization of Graph Transformers? A Theoretical Dive into the Self-attention and Positional Encoding [67.6] 自己アテンションと位置エンコーディングを組み込んだグラフトランスフォーマーは、さまざまなグラフ学習タスクのための強力なアーキテクチャとして登場した。
本稿では,半教師付き分類のための浅いグラフ変換器の理論的検討について紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:30:16 GMT)
Vertical Federated Learning for Effectiveness, Security, Applicability: A Survey [67.5] Vertical Federated Learning(VFL)は、プライバシ保護のための分散学習パラダイムである。
近年の研究では、VFLの様々な課題に対処する有望な成果が示されている。
この調査は、最近の展開を体系的に概観する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:04:53 GMT)
SuperGaussian: Repurposing Video Models for 3D Super Resolution [67.2] 本稿では,幾何学的および外観的詳細を付加することにより,粗い3次元モデルをアップサンプルする,単純でモジュラーで汎用的な手法を提案する。
既存の3次元超解像モデルを直接再利用できることを実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:47:45 GMT)
CoNav: A Benchmark for Human-Centered Collaborative Navigation [66.6] 協調ナビゲーション(CoNav)ベンチマークを提案する。
われわれのCoNavは、現実的で多様な人間の活動を伴う3Dナビゲーション環境を構築するという重要な課題に取り組む。
本研究では,長期的意図と短期的意図の両方を推論する意図認識エージェントを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:44:25 GMT)
Cross-modality Data Augmentation for End-to-End Sign Language Translation [66.5] エンドツーエンド手話翻訳(SLT)は、手話動画を中間表現なしで直接音声言語テキストに変換することを目的としている。
署名ビデオとテキスト間のモダリティのギャップとラベル付きデータの不足のため、これは難しい課題だった。
本稿では,強力な光沢からテキストへの翻訳機能をエンドツーエンドの手話翻訳に変換するための,新しいクロスモダリティデータ拡張(XmDA)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:27:40 GMT)
GrootVL: Tree Topology is All You Need in State Space Model [66.4] GrootVLは、視覚的タスクとテキストタスクの両方に適用できる多目的マルチモーダルフレームワークである。
本手法は, 画像分類, オブジェクト検出, セグメンテーションにおいて, 既存の構造化状態空間モデルよりも大幅に優れる。
大規模言語モデルの微調整により,本手法は訓練コストの少ない複数のテキストタスクにおいて一貫した改善を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:09:29 GMT)
Cluster-Aware Similarity Diffusion for Instance Retrieval [64.4] 拡散に基づく再ランク付け(diffusion-based re-level)は、隣り合うグラフで類似性の伝播を実行することで、インスタンスを検索する一般的な方法である。
本稿では,新しいクラスタ・アウェア類似性(CAS)拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:19:50 GMT)
DrEureka: Language Model Guided Sim-To-Real Transfer [64.1] シミュレーションで学んだ政策を現実世界に伝達することは、ロボットのスキルを大規模に獲得する上で有望な戦略である。
本稿では,Large Language Models (LLMs) を用いてシム・トゥ・リアル設計の自動化と高速化を行う。
本手法では,ヨガボールの上を歩行する四足歩行や四足歩行など,新しいロボットタスクを解くことができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:53:05 GMT)
An Independence-promoting Loss for Music Generation with Language Models [63.7] 音楽生成方式は音声トークンの語彙に依存しており、一般にオートエンコーダによって学習された離散潜在空間の符号として提供される。
本稿では,音楽生成のための言語モデルにおけるトークン化器として使用されるオートエンコーダを正規化するために,独立性向上の損失を導入する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:44:39 GMT)
APT: Adaptive Pruning and Tuning Pretrained Language Models for Efficient Training and Inference [63.5] 大規模言語モデル(LM)による微調整と推論は一般的に高価であることが知られている。
LMのパラメータを適応的にプーンし調整するAPTを導入する。
APTは、LMの微調整を最大8倍高速化し、LMのメモリトレーニングのフットプリントを最大70%削減する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:39:23 GMT)
M3DM-NR: RGB-3D Noisy-Resistant Industrial Anomaly Detection via Multimodal Denoising [63.4] 既存の産業異常検出手法は主に、原始RGB画像を用いた教師なし学習に重点を置いている。
本稿では,CLIPの強力なマルチモーダル識別機能を利用する新しい耐雑音性M3DM-NRフレームワークを提案する。
M3DM-NRは3D-RGBマルチモーダルノイズ異常検出において最先端の手法より優れていた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:33:02 GMT)
KG-FIT: Knowledge Graph Fine-Tuning Upon Open-World Knowledge [63.2] 知識グラフ埋め込み(KGE)技術は、知識グラフ内の実体と関係のコンパクトな表現を学習するために重要である。
本研究では、エンティティクラスタのセマンティックコヒーレントな階層構造を構築するKG-FITを紹介する。
ベンチマークデータセットFB15K-237、YAGO3-10、PrimeKGの実験は、最先端の訓練済み言語モデルに基づく手法よりもKG-FITの方が優れていることを示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:35:32 GMT)
LanEvil: Benchmarking the Robustness of Lane Detection to Environmental Illusions [61.9] レーン検出(LD)は自律走行システムにおいて不可欠な要素であり、適応型クルーズ制御や自動車線センターなどの基本的な機能を提供している。
既存のLDベンチマークは主に、環境錯覚に対するLDモデルの堅牢性を無視し、一般的なケースを評価することに焦点を当てている。
本稿では、LDに対する環境錯覚による潜在的な脅威について検討し、LanEvilの最初の総合ベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:26:10 GMT)
Fast Chain-of-Thought: A Glance of Future from Parallel Decoding Leads to Answers Faster [61.8] FastCoTは並列デコーディングに基づくモデルに依存しないフレームワークである。
我々は、FastCoTが通常のアプローチと比較して、無視できる性能低下だけで、推論時間を20%近く削減できることを示します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:10:34 GMT)
MultiMax: Sparse and Multi-Modal Attention Learning [60.5] SoftMaxは現代の機械学習アルゴリズムのユビキタスな成分である。
分散性はSoftMaxの変種族によって達成できるが、それらはしばしば代替損失関数を必要とし、多重モダリティを保たない。
入力入力範囲に応じて出力分布を適応的に変調するMultiMaxを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:58:32 GMT)
InfoLossQA: Characterizing and Recovering Information Loss in Text Simplification [60.1] 本研究は, 簡易化による情報損失を問合せ・問合せ形式で特徴づけ, 回復する枠組みを提案する。
QAペアは、読者がテキストの知識を深めるのに役立つように設計されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:36:07 GMT)
ASETF: A Novel Method for Jailbreak Attack on LLMs through Translate Suffix Embeddings [58.8] 本稿では, 連続的な逆接接尾辞埋め込みを一貫性のある, 理解可能なテキストに変換するために, ASETF (Adversarial Suffix Embedding Translation Framework) を提案する。
本手法は,逆接接尾辞の計算時間を著しく短縮し,既存の手法よりもはるかに優れた攻撃成功率を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:59:58 GMT)
BiomedParse: a biomedical foundation model for image parsing of everything everywhere all at once [58.4] 全体像解析は、セグメンテーション、検出、関連するオブジェクトの認識などのサブタスクを含む。
そこで本研究では,9つの画像モダリティにまたがる82種類のオブジェクトの分割,検出,認識を共同で行うことができる,画像解析のためのバイオメディカル基礎モデルであるBiomedParseを提案する。
共同学習により、個々のタスクの精度を向上し、テキストプロンプトを通じてノイズの多い画像中のすべての関連オブジェクトを分割するといった新しいアプリケーションを可能にする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:16:52 GMT)
Learning to Optimize for Reinforcement Learning [58.0] 強化学習(Reinforcement Learning, RL)は、教師付き学習とは本質的に異なり、実際、これらの学習は単純なRLタスクでもうまく機能しない。
エージェント勾配分布は非独立で同一分布であり、非効率なメタトレーニングをもたらす。
おもちゃのタスクでしか訓練されていないが、我々の学習はブラックスの目に見えない複雑なタスクを一般化できることを示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:52:31 GMT)
Learning Temporally Consistent Video Depth from Video Diffusion Priors [57.9] 本研究は,映像深度推定の課題に対処する。
我々は予測タスクを条件付き生成問題に再構成する。
これにより、既存のビデオ生成モデルに埋め込まれた事前の知識を活用することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:33:52 GMT)
Linguistic Calibration of Long-Form Generations [57.8] 言語モデル(LM)は、ユーザーに自信を持って幻覚を与えるとき、最適な下流決定をさせるかもしれない。
この問題は、LMが主張が正しい確率を口頭で伝えることで緩和できるが、既存のモデルでは、評価された信頼度のある長文を生成できない。
LMは、その世代がユーザがキャリブレーションされた確率予測を行えるようにすれば、言語的にキャリブレーションされる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:39:58 GMT)
DFA-GNN: Forward Learning of Graph Neural Networks by Direct Feedback Alignment [57.6] グラフニューラルネットワークは、様々なアプリケーションにまたがる強力なパフォーマンスで認識されている。
BPには、その生物学的妥当性に挑戦する制限があり、グラフベースのタスクのためのトレーニングニューラルネットワークの効率、スケーラビリティ、並列性に影響を与える。
半教師付き学習のケーススタディを用いて,GNNに適した新しい前方学習フレームワークであるDFA-GNNを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:24:51 GMT)
Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding [57.6] 時間的複合イベント(TCE)として、長い期間にわたって多くのニュース記事から構成される複合イベントについて述べる。
本稿では,Large Language Models (LLMs) を用いて,TCE内のイベントチェーンを系統的に抽出し,解析する手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:42:17 GMT)
C-RAG: Certified Generation Risks for Retrieval-Augmented Language Models [57.1] RAGモデルの生成リスクを認証する最初のフレームワークであるC-RAGを提案する。
具体的には、RAGモデルに対して共形リスク分析を行い、生成リスクの上限以上の信頼度を認定する。
検索モデルと変圧器の品質が非自明な場合, RAG は単一の LLM よりも低い共形生成リスクを達成できることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:51:08 GMT)
Towards a Better Theoretical Understanding of Independent Subnetwork Training [56.2] 独立サブネットワークトレーニング(IST)の理論的考察
ISTは、上記の問題を解決するための、最近提案され、非常に効果的である。
圧縮通信を用いた分散手法など,ISTと代替手法の基本的な違いを同定する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:11:20 GMT)
Generative Active Learning for Long-tailed Instance Segmentation [55.7] キャッシュ勾配に基づいて生成したデータの寄与を推定する新しいアルゴリズムであるBSGALを提案する。
実験により,BSGALはベースラインアプローチより優れ,長い尾のセグメンテーションの性能が効果的に向上することが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:57:43 GMT)
Rethinking the Vulnerabilities of Face Recognition Systems:From a Practical Perspective [55.4] 顔認識システム(FRS)は、監視やユーザー認証を含む重要なアプリケーションにますます統合されている。
最近の研究によると、FRSの脆弱性は敵(例えば、敵パッチ攻撃)やバックドア攻撃(例えば、データ中毒の訓練)であることが明らかになっている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:56:27 GMT)
OpenGaussian: Towards Point-Level 3D Gaussian-based Open Vocabulary Understanding [55.0] 本稿では,3次元点レベルの開語彙理解が可能な3次元ガウススティング(3DGS)に基づくOpenGaussianを紹介する。
我々の主な動機は、既存の3DGSベースのオープン語彙法が主に2Dピクセルレベルの解析に焦点を当てていることに起因している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:42:33 GMT)
Mixtures of Experts Unlock Parameter Scaling for Deep RL [54.3] 本稿では,Mixture-of-Expert(MoE)モジュールを値ベースネットワークに組み込むことで,パラメータスケーラブルなモデルが得られることを示す。
この研究は、強化学習のためのスケーリング法則の開発に関する強力な実証的証拠を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:36:10 GMT)
CIF-Bench: A Chinese Instruction-Following Benchmark for Evaluating the Generalizability of Large Language Models [54.0] 本研究では,中国語に対する大規模言語モデル(LLM)の一般化性を評価するために,中国語命令追跡ベンチマーク(CIF-Bench)を導入する。
CIF-Benchは150のタスクと15,000の入力出力ペアで構成され、複雑な推論と中国の文化的ニュアンスをテストするためにネイティブスピーカーによって開発された。
データ汚染を軽減するため、データセットの半分しか公開せず、残りは非公開であり、スコア分散を最小限に抑えるために多種多様な命令を導入する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:26:30 GMT)
Follow-Your-Emoji: Fine-Controllable and Expressive Freestyle Portrait Animation [53.8] Follow-Your-Emojiは、ポートレートアニメーションのための拡散ベースのフレームワークである。
参照ポートレートとターゲットランドマークシーケンスを識別する。
本手法は,フリースタイルの肖像画の表現を制御できることを実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:05:57 GMT)
A Probabilistic Model behind Self-Supervised Learning [53.6] 自己教師付き学習(SSL)では、アノテートラベルなしで補助的なタスクを通じて表現が学習される。
自己教師型学習のための生成潜在変数モデルを提案する。
識別性SSLのいくつかのファミリーは、表現に匹敵する分布を誘導することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:59:20 GMT)
How Do Neural Spoofing Countermeasures Detect Partially Spoofed Audio? [53.6] 部分的にスプーフされたオーディオで訓練された対策(CM)は、そのようなスプーフを効果的に検出することができる。
我々はGrad-CAMを利用し、CMの判断を解釈するために定量的分析指標を導入する。
バルナフッ化物とスプーフドオーディオを連結した場合に発生する遷移領域のアーティファクトをCMが優先していることが判明した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:51:42 GMT)
Controllable Prompt Tuning For Balancing Group Distributional Robustness [53.3] グループ間で優れたパフォーマンスを実現するための最適化スキームを導入し、それらの性能を著しく犠牲にすることなく、全員に良い解決策を見出す。
本稿では,制御可能なプロンプトチューニング(CPT)を提案する。
突発的相関ベンチマークでは, 変換器と非変換器の両アーキテクチャ, および非モーダルおよびマルチモーダルデータにまたがって, 最先端の結果が得られた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:25:20 GMT)
OpenDataLab: Empowering General Artificial Intelligence with Open Datasets [53.2] 本稿では,多様なデータソース間のギャップと統一データ処理の必要性を埋めるプラットフォームであるOpenDataLabを紹介する。
OpenDataLabは、幅広いオープンソースのAIデータセットを統合し、インテリジェントクエリと高速ダウンロードサービスを通じて、データ取得効率を向上させる。
我々は,OpenDataLabが人工知能(AGI)の研究を大幅に促進し,関連するAI分野の進歩を促進することを期待する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:42:01 GMT)
Motion-aware Latent Diffusion Models for Video Frame Interpolation [51.8] 隣接するフレーム間の動き推定は、動きのあいまいさを避ける上で重要な役割を担っている。
我々は、新しい拡散フレームワーク、動き認識潜在拡散モデル(MADiff)を提案する。
提案手法は,既存手法を著しく上回る最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:23:51 GMT)
A-SDM: Accelerating Stable Diffusion through Model Assembly and Feature Inheritance Strategies [51.8] 安定拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)生成のための一般的かつ効果的なモデルである。
本研究では、SDMにおける冗長計算の削減と、チューニング不要とチューニング不要の両方の手法によるモデルの最適化に焦点をあてる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:26:06 GMT)
CODE: Contrasting Self-generated Description to Combat Hallucination in Large Multi-modal Models [51.7] CODE(Countering Description Contrastive Decoding)という,新しいコントラストベースのデコーディング手法を提案する。
提案手法は幻覚を著しく低減し,様々なベンチマークや最先端のLMM間の相互整合性を改善する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:04:21 GMT)
To Believe or Not to Believe Your LLM [51.3] 大規模言語モデル(LLM)における不確実性定量化について検討する。
疫学的な不確実性が大きい場合にのみ確実に検出できる情報理論の指標を導出する。
定式化の利点を実証する一連の実験を行う。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:58:18 GMT)
PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.2] 私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:51:08 GMT)
NeoRL: Efficient Exploration for Nonepisodic RL [50.7] 非線形力学系における非線形強化学習(RL)の問題点について検討する。
我々は不確実性に直面した楽観主義の原理に基づくNonepisodic Optimistic RL(NeoRL)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:29:27 GMT)
MARS: Benchmarking the Metaphysical Reasoning Abilities of Language Models with a Multi-task Evaluation Dataset [50.4] 大きな言語モデル(LLM)は、一般化可能な推論能力を持つ意識的なエージェントとして機能する。
この能力は、イベントにおける無限の可能な変更をモデル化する複雑さのために、まだ探索されていない。
我々は,各ステップに対応する3つのタスクからなる最初のベンチマークMARSを紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:35:04 GMT)
LVLM-Intrepret: An Interpretability Tool for Large Vision-Language Models [50.3] 本稿では,大規模視覚言語モデルの内部メカニズムの理解を目的とした対話型アプリケーションを提案する。
このインタフェースは, 画像パッチの解釈可能性を高めるために設計されており, 応答の生成に有効である。
本稿では,一般的な大規模マルチモーダルモデルであるLLaVAにおける障害機構の理解に,アプリケーションがどのように役立つかのケーススタディを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:55:39 GMT)
Landscape-Aware Growing: The Power of a Little LAG [49.9] 成長戦略のプールから最適な成長戦略をどのように選択するかという課題について検討する。
ランドスケープ・アウェア・グロース(LAG)と呼ぶ早期学習力学に基づく代替視点を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:38:57 GMT)
Rule or Story, Which is a Better Commonsense Expression for Talking with Large Language Models? [49.8] 人間は物語を通して暗黙的にコモンセンスを伝え、伝承する。
本稿では,物語を通して表現される大規模言語モデル(LLM)の固有コモンセンス能力について検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:05:51 GMT)
GOMAA-Geo: GOal Modality Agnostic Active Geo-localization [49.6] エージェントが空中ナビゲーション中に観測された一連の視覚的手がかりを用いて、複数の可能なモダリティによって特定されたターゲットを見つけるという、アクティブなジオローカライゼーション(AGL)の課題を考察する。
GOMAA-Geo は、ゴールモダリティ間のゼロショット一般化のためのゴールモダリティアクティブなジオローカライゼーションエージェントである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:59:36 GMT)
Advancing Generalized Transfer Attack with Initialization Derived Bilevel Optimization and Dynamic Sequence Truncation [49.5] 転送攻撃はブラックボックスアプリケーションに大きな関心を惹きつける。
既存の作業は、本質的に単一のレベルの目的 w.r.t. シュロゲートモデルを直接最適化する。
本稿では,上位レベル(UL)と下位レベル(LL)のサロゲート攻撃とのネスト関係を明示的に再構築する2レベル最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:45:27 GMT)
On Universally Optimal Algorithms for A/B Testing [49.4] ベルヌーイ報奨を伴う多腕バンディットにおける固定予算によるベストアーム識別の問題について検討する。
A/Bテスト問題としても知られる2つのアームの問題に対して,各アームを等しくサンプリングするアルゴリズムが存在しないことを証明した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:14:46 GMT)
A Unifying Framework for Action-Conditional Self-Predictive Reinforcement Learning [48.6] 優れた表現を学ぶことは、強化学習(RL)エージェントにとって重要な課題である。
近年の研究では、これらのアルゴリズムに関する理論的洞察が生まれている。
我々は,行動条件の自己予測的目的を分析することによって,理論と実践のギャップを埋める一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:22:12 GMT)
FastLGS: Speeding up Language Embedded Gaussians with Feature Grid Mapping [48.4] 我々は高解像度で3Dガウススプラッティング(3DGS)内でリアルタイムなオープン語彙クエリをサポートするアプローチであるFastLGSを提案する。
FastLGSはLERFより98倍、LangSplatより4倍速い。
実験により、FastLGSは3Dセグメンテーションや3Dオブジェクトのインペイントなど、多くの下流タスクに適応し、互換性があることが示されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:57:09 GMT)
Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models [48.4] テキスト透かしにおける言語間整合性の概念を紹介する。
予備的な実証実験の結果、現在のテキスト透かし技術は、テキストが様々な言語に翻訳されるときに一貫性が欠如していることが判明した。
透かしを回避するための言語横断型透かし除去攻撃(CWRA)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:24:15 GMT)
Fine-Grained Modeling of Narrative Context: A Coherence Perspective via Retrospective Questions [48.2] この研究は、物語の中の個々の通路が孤立するよりも密接な関係にある傾向があるという特徴から生まれた、物語理解のためのオリジナルで実践的なパラダイムを取り入れたものである。
本稿では,タスク非依存のコヒーレンス依存を明示的に表現したNarCoというグラフを定式化することにより,物語コンテキストのきめ細かいモデリングを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:26:19 GMT)
Mitigate Position Bias in Large Language Models via Scaling a Single Dimension [47.8] 本稿ではまず,位置バイアスのマイクロレベル表現について考察し,注目重みが位置バイアスのマイクロレベル表現であることを示す。
さらに、位置埋め込みに加えて、因果注意マスクは位置特異的な隠れ状態を作成することによって位置バイアスに寄与する。
これらの知見に基づいて,この位置隠れ状態のスケーリングにより位置バイアスを軽減する手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:55:38 GMT)
Reweighted Solutions for Weighted Low Rank Approximation [47.8] 重み付き低階近似(WLRA)は、統計解析から信号処理に至るまで、重要かつ困難なプリミティブである。
そこで本研究では,WLRAに対して,必ずしも低ランクではないが極めて少ないパラメータで保存可能な行列を出力する緩和解を提案する。
我々の中心となる考え方は、重み行列自体を低階解の重み付けに利用することであり、これは非常に単純なアルゴリズムであり、顕著な経験的性能を与える。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:50:35 GMT)
Coresets for Multiple $\ell_p$ Regression [47.8] サイズ $tilde O(varepsilon-2d)$ for $p2$ と $tilde O(varepsilon-pdp/2)$ for $p>2$ のコアセットを構築します。
1p2$の場合、すべての行列は$tilde O(varepsilon-1k)$行のサブセットを持ち、$(varepsilon-1k)$-a optimal $k$-dimensional subspace for $ell_p$ subspace approximationである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:50:42 GMT)
Self-Control of LLM Behaviors by Compressing Suffix Gradient into Prefix Controller [47.4] Self-Controlは、人間の明示的なアノテーションを使わずに、大規模言語モデル(LLM)の振る舞いを制御する新しい方法である。
自己制御は、モデルの隠された状態に関するモデルの自己判断の勾配を計算する。
実験では、感情変調、無害性の確保、複雑な推論の強化など、複数の領域にまたがる自己制御の有効性を実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:05:10 GMT)
RAM-EHR: Retrieval Augmentation Meets Clinical Predictions on Electronic Health Records [47.2] RAM-EHRはRetrieval AugMentationパイプラインであり、Electronic Health Recordsにおける臨床予測を改善する。
RAM-EHRはまず複数の知識ソースを収集し、それらをテキスト形式に変換し、密度の高い検索を用いて医療概念に関する情報を取得する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:11:19 GMT)
Modeling Emotional Trajectories in Written Stories Utilizing Transformers and Weakly-Supervised Learning [47.0] 本研究では,個別の感情カテゴリーで注釈付けされた子どもの物語の既存のデータセットに対して,連続的原子価と覚醒ラベルを導入する。
得られた感情信号を予測するために,DeBERTaモデルを微調整し,弱教師付き学習手法を用いてベースラインを改善する。
詳細な分析では、著者、個々の物語、物語内のセクションなどの要因によって結果がどの程度異なるかが示される。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:17:16 GMT)
Graph Neural Networks Do Not Always Oversmooth [46.6] グラフ畳み込みネットワーク (GCN) における過剰スムーシングを, 無限に多くの隠れた特徴の極限におけるガウス過程 (GP) の等価性を用いて検討する。
ネットワークの初期重みが十分に大きな場合、GCNは過度に過度に動き、ノード特徴は大きな深さでも情報的であり続ける。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:47:13 GMT)
Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding [46.5] 投機的デコーディングは、LLM(Large Language Models)推論のための新しいデコーディングパラダイムとして登場した。
復号処理の各ステップにおいて、この手法はまず、複数の将来のトークンを効率的にドラフトし、それらを並列に検証する。
本稿では,この有望な復号化パラダイムの概観と解析について述べる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:08:37 GMT)
Large Language Models Make Sample-Efficient Recommender Systems [46.2] 大規模言語モデル(LLM)は自然言語処理(NLP)分野において顕著な進歩を遂げている。
これによってレコメンデーターシステム(RS)に採用する新たな機会が開ける
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:46:25 GMT)
Distortions in Judged Spatial Relations in Large Language Models [45.9] GPT-4は55%の精度で優れた性能を示し、GPT-3.5は47%、Llama-2は45%であった。
モデルは、ほとんどの場合において最も近い基数方向を同定し、その連想学習機構を反映した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:01:56 GMT)
Decoupling of neural network calibration measures [45.7] 本稿では,AUSE(Area Under Sparsification Error curve)測定値に焦点をあてて,異なるニューラルネットワークキャリブレーション尺度の結合について検討する。
本稿では,現行の手法は自由度を保ち,安全クリティカルな機能のホモログ化のユニークなモデルを妨げると結論付けている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:21:37 GMT)
Scalable Online Exploration via Coverability [45.7] 探索は、特に関数近似を必要とする高次元領域において、強化学習において大きな課題である。
従来の探索手法を一般化し,3つの基本デシラタをサポートする新しい目的である$L_Coverageを導入する。
$L_Coverageは、カバー可能性の低いMDPにおけるオンライン(リワードフリーまたは報酬駆動)強化学習のための、最初の計算効率のよいモデルベースおよびモデルフリーのアルゴリズムを可能にする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:12:47 GMT)
Morphological Symmetries in Robotics [45.3] 形態的対称性は ロボットの形態の固有の特性です
これらの対称性は、ロボットの状態空間とセンサーの測定にまで拡張される。
データ駆動型手法では, 機械学習モデルのサンプル効率と一般化を, モルフォロジー対称性により向上させることができることを示す。
解析手法の文脈では、ロボットの力学を低次元独立力学の重ね合わせに分解するために抽象調和解析を用いる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:54:45 GMT)
Randomized Geometric Algebra Methods for Convex Neural Networks [45.3] 我々はクリフォードの幾何代数にランダム化アルゴリズムを導入し、超複素ベクトル空間にランダム化線形代数を一般化する。
この新しいアプローチは、凸最適化によるグローバル最適性へのニューラルネットワークのトレーニングを含む、機械学習に多くの意味を持つ。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:22:39 GMT)
Astral: training physics-informed neural networks with error majorants [45.2] 我々は、残差は、少なくとも、近似解の誤差の間接測度であると主張する。
エラーメジャートはエラーの直接上限を与えるので、正確な解にどれだけ近いかを確実に推定することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:11:49 GMT)
On the Recoverability of Causal Relations from Temporally Aggregated I.I.D. Data [45.2] 時間的アグリゲーションが一般環境における瞬時因果発見に及ぼす影響を考察する。
理論的,実験的に,因果発見結果は凝集により著しく歪む可能性があることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:35:16 GMT)
Hyperbolic Active Learning for Semantic Segmentation under Domain Shift [45.1] HALOは、ドメインシフトの下でセマンティックセグメンテーションをアクティブに学習する上で、新たな最先端を設定できる。
これは、少数のラベルを使用しながら、教師付きドメイン適応の性能を上回る最初のアクティブな学習手法である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:11:21 GMT)
Transformers Implement Functional Gradient Descent to Learn Non-Linear Functions In Context [44.9] 非線形変換器は自然に関数空間の勾配降下を実装することを学習する。
また、非線形活性化の最適選択は、学習すべき関数のクラスに自然に依存していることも示している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:20:05 GMT)
MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark [44.8] 本稿では、主に知識駆動型MMLUベンチマークを拡張するために設計された拡張データセットであるMMLU-Proを紹介する。
24種類のプロンプトを試験した結果,MMLUの4-5%からMMLU-Proの2%に低下した。
MMLU-Proは、この分野の進歩をよりよく追跡するための、より差別的なベンチマークであることを確認した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:36:49 GMT)
Loki: Low-Rank Keys for Efficient Sparse Attention [44.7] 低次元空間で計算された注目スコアに基づいて、KVキャッシュ内のトークンをランク付けし、選択する新しいスパースアテンション手法を提案する。
評価の結果,ロキは他の近似法よりもモデルの有効性を向上できることが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:58:03 GMT)
GeminiFusion: Efficient Pixel-wise Multimodal Fusion for Vision Transformer [44.4] クロスモーダル変換器は、様々なモダリティを効果的に統合することにより、様々な視覚タスクにおいて優位性を証明している。
本稿では,画素単位の融合手法であるGeminiFusionを提案する。
我々は,層間相互作用を適応的に制御するために層適応雑音を用い,調和した融合プロセスを実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:14:19 GMT)
Inference Attacks in Machine Learning as a Service: A Taxonomy, Review, and Promising Directions [44.3] この調査は、ML-as-a-serviceにおける攻撃の詳細な包括的推測とそれに対応する対策を提供する。
まず,コミュニティ研究状況に基づく3MP分類法を提案する。
また、各種類の推論攻撃の長所と短所、ワークフロー、対策、およびそれらが他の攻撃とどのように相互作用するかを分析する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:06:06 GMT)
Graph Machine Learning in the Era of Large Language Models (LLMs) [44.3] グラフは、ソーシャルネットワーク、知識グラフ、分子発見など、さまざまな領域における複雑な関係を表現する上で重要な役割を果たす。
ディープラーニングの出現に伴い、グラフニューラルネットワーク(GNN)がグラフ機械学習(Graph ML)の基盤として登場した。
近年、LLMは言語タスクにおいて前例のない能力を示し、コンピュータビジョンやレコメンデータシステムなど様々なアプリケーションで広く採用されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:31:30 GMT)
Layer-Condensed KV Cache for Efficient Inference of Large Language Models [44.2] 少数の層のKVのみを計算・キャッシュする新しい手法を提案する。
提案手法は標準変圧器よりも最大26$times$高いスループットを実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:08:10 GMT)
Networked Inequality: Preferential Attachment Bias in Graph Neural Network Link Prediction [44.0] ネットワークの度合いバイアスがグラフ畳み込みネットワーク(GCN)のリンク予測に与える影響について検討する。
対称正規化グラフフィルタを持つGCNは、群内優先アタッチメントバイアスを有する。
本稿では,ソーシャルグループ内のリンク予測スコアの相違を定量化する,グループ内公正度尺度を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:47:06 GMT)
PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling [44.0] ピラミッドKVは新規かつ効果的なKVキャッシュ圧縮法である。
提案手法は,KVキャッシュの12%しか保持せず,完全なKVキャッシュでモデルの性能と一致していることを示す。
メモリ効率を強調するシナリオでは、KVキャッシュのわずか0.7%しか維持されていないが、Praamid KVは他のKVキャッシュ圧縮技術を超え、TRECでは最大20.5の絶対精度の向上を実現している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:51:30 GMT)
Investigating the Impact of Model Instability on Explanations and Uncertainty [43.3] テキスト入力における不確かさを推測時に雑音を導入することでシミュレートする。
高い不確実性は必ずしも説明可能性の低さを暗示しない。
このことは、ノイズ増強モデルが不確実性のあるトークンを特定するのに優れていることを示唆している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:18:03 GMT)
Lay-A-Scene: Personalized 3D Object Arrangement Using Text-to-Image Priors [43.2] 現在の3D生成技術は、複数の高解像度オブジェクトでシーンを生成するのに苦労している。
ここでは,オープンセット3Dオブジェクトアレンジメントの課題を解決するLay-A-Sceneを紹介する。
本研究では,2次元シーン上にオブジェクトの一貫した投影を見出すことにより,オブジェクトの3次元ポーズや配置を2次元画像から推測する方法を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:19:47 GMT)
Understanding Heterophily for Graph Neural Networks [42.6] グラフニューラルネットワーク(GNN)における異方性パターンの影響に関する理論的理解について述べる。
分離性ゲインは、$l$の近隣分布の正規化距離によって決定されることを示す。
合成データと実世界のデータの両方の実験により、我々の理論の有効性が検証された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:15:55 GMT)
Embezzling entanglement from quantum fields [41.9] 絡み合いの埋め込みは、補助系の参照状態から絡み合った量子状態を抽出する直感的な可能性を指す。
エンベジングエンタングルメントの操作タスクとフォン・ノイマン代数の数学的分類との深い関係を明らかにする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:17:47 GMT)
Embezzlement of entanglement, quantum fields, and the classification of von Neumann algebras [41.9] 我々は、フォン・ノイマン代数の設定におけるエンタングルメントの埋め込みの量子情報理論的タスクについて研究する。
与えられた資源状態の性能を最悪のエラーで定量化する。
我々の発見は、III型代数が自然に現れる相対論的場の量子論に影響を及ぼす。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:44:34 GMT)
CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psychological Counseling [41.7] 中国における心理カウンセリングのための多面的対話再構築・評価フレームワークCPsyCounを提案する。
心理カウンセリングレポートを完全に活用するために、高品質な対話を構築するための2段階のアプローチが考案された。
マルチターン心理相談の効果的な自動評価のための総合評価ベンチマークを開発した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:25:25 GMT)
Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Models [41.5] クロスドキュメントイベントコア参照解決(CDECR)では、複数のドキュメントにまたがって、同じ実世界のイベントを参照するイベントをクラスタリングする。
既存のアプローチでは、イベント参照のコンテキスト間の互換性に対処するために、小さな言語モデル(SLM)の微調整を利用している。
本稿では,CDECR の協調的アプローチを提案し,汎用性のある LLM とタスク固有の SLM の両機能を活用している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:35:47 GMT)
An Entropy-based Text Watermarking Detection Method [41.4] 本研究では,エントロピーを用いたテキスト透かし検出(EWD)を提案する。
実験の結果,提案手法は低エントロピーシナリオにおいて,より優れた検出性能を実現することができることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:00:18 GMT)
Block Transformer: Global-to-Local Language Modeling for Fast Inference [41.4] Block Transformerアーキテクチャは階層的グローバル・ローカル・モデリングを採用し、自己アテンションの推論ボトルネックを軽減する自動回帰トランスフォーマーである。
本研究では,グローバル・ローカル・モデリングの新たな応用を通じて,言語モデル推論を最適化する新たなアプローチを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:45:26 GMT)
R2C2-Coder: Enhancing and Benchmarking Real-world Repository-level Code Completion Abilities of Code Large Language Models [41.1] 我々は,R2C2-Coderを提案し,大規模言語モデルの実世界のリポジトリレベルのコード補完能力を向上し,ベンチマークする。
R2C2-Coderには、コードプロンプトコンストラクションメソッドR2C2-Enhanceと、よく設計されたベンチマークR2C2-Benchが含まれている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:13:43 GMT)
A Sentiment Consolidation Framework for Meta-Review Generation [40.9] 我々は、科学的領域に対する感情要約の一形態であるメタレビュー生成に焦点を当てる。
本稿ではメタレビューを生成するために,大規模言語モデルのための新しいプロンプト手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:10:13 GMT)
How to Explore with Belief: State Entropy Maximization in POMDPs [40.8] 我々は、**状態で定義された目的の1次緩和に対処するために、メモリと効率的な*政治*手法を開発する。
本稿では、アプリケーションの課題を満たすより現実的な領域に状態エントロピーを一般化することを目的とする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:16:34 GMT)
Activation Addition: Steering Language Models Without Optimization [40.0] アクティベーションエンジニアリングは、モデル動作を予測可能に変更するために、推論時のアクティベーションを変更する。
ActAddは微調整やRLHFよりも計算と実装の労力がはるかに少ない。
その計算オーバーヘッドは、モデルサイズの増加よりも安定または改善しているように見える。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:08:39 GMT)
Taxi1500: A Multilingual Dataset for Text Classification in 1500 Languages [40.0] 我々は、多数の言語を含むテキスト分類データセットを作成することを目指している。
我々は、このようなデータセットを構築するために聖書の平行翻訳を利用する。
データの英語側をアノテートし、アライメントされた節を通してラベルを他の言語に投影することにより、1500以上の言語に対してテキスト分類データセットを生成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:03:12 GMT)
Bileve: Securing Text Provenance in Large Language Models Against Spoofing with Bi-level Signature [40.0] 両レベルシグネチャスキームであるBileveを導入し、整合性チェックのための微細なシグネチャビットと粗いシグネチャを埋め込んでテキストソースをトレースする。
バイナリ結果のみを出力する従来の透かし検出器と比較して、Bileveは検出中に5つのシナリオを区別することができる。
OPT-1.3BとLLaMA-7Bで実施された実験は、スプーフィング攻撃を倒す際のビリーブの有効性を実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:58:14 GMT)
SLTrain: a sparse plus low-rank approach for parameter and memory efficient pretraining [39.6] 大規模言語モデル(LLM)をゼロから訓練するには、計算能力と広範なメモリ容量が必要である。
最近の研究では、パラメータとメモリの点で効率的な微調整のための重量の低ランク構造を探索している。
本稿では,SLTrain と呼ばれる事前学習用低ランク行列とスパース行列の和として重みをパラメータ化することを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:14:21 GMT)
Chain of Agents: Large Language Models Collaborating on Long-Context Tasks [39.3] CoA(Chain-of-Agents)は、自然言語によるマルチエージェントコラボレーションを利用して、情報集約とコンテキスト推論を可能にする新しいフレームワークである。
CoAは読み出しと推論をインターリーブすることで入力全体を処理し、各エージェントに短いコンテキストを割り当てることで、長いコンテキストのフォーカス問題を軽減します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:36:08 GMT)
Asymptotics of feature learning in two-layer networks after one gradient-step [39.0] 本研究では,2層ニューラルネットワークがデータからどのように学習するかを考察し,カーネルの仕組みを改良する。
トレーニングネットワークをスパイクされたランダム特徴量(sRF)モデルでモデル化する。
高次元極限におけるsRFの一般化誤差を正確に記述する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:28:52 GMT)
A Survey of Transformer Enabled Time Series Synthesis [38.9] 生成AIは画像と言語領域で多くの注目を集めている。
本稿では,変換器,生成AI,時系列データの交点におけるこのギャップを明らかにする。
レビューされた研究はアプローチの多様さを示しており、ドメインがもたらす問題に対する決定的な回答にはまだ収束していない。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:52:42 GMT)
Evidentially Calibrated Source-Free Time-Series Domain Adaptation with Temporal Imputation [38.9] ソースフリードメイン適応(SFDA)は、ラベル付きソースドメインで事前訓練されたモデルを、ソースデータにアクセスせずにラベルなしのターゲットドメインに適応することを目的としている。
本稿では, 時系列SFDAの新規かつ効果的なアプローチであるMAsk And imPUte(MAPU)を提案する。
ソフトマックス予測に固有の過信問題に対処するために、明らかな不確実性推定を取り入れたE-MAPUも導入する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:36:29 GMT)
DisCo: Towards Harmonious Disentanglement and Collaboration between Tabular and Semantic Space for Recommendation [38.7] 本研究では,2つの表現空間からユニークなパターンを分離し,2つの空間をコラボしてレコメンデーションエンハンスメントを提案する。
これらの加群は2つの表現空間の解離と協調のバランスをとり、情報的パターンベクトルを生成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:17:46 GMT)
TopViewRS: Vision-Language Models as Top-View Spatial Reasoners [38.4] トップビューの視点は、人間が様々な種類の地図を読み、推論する典型的な方法である。
11,384の質問からなるTopViewRSデータセットを視覚入力として,現実的あるいは意味的なトップビューマップで紹介する。
次に、異なるレベルの複雑さを持つ4つの知覚と推論タスクにわたるVLMの研究と評価に使用します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:55:43 GMT)
Redefining DDoS Attack Detection Using A Dual-Space Prototypical Network-Based Approach [38.4] 我々は、DDoS攻撃を検出するための新しいディープラーニングベースの技術を導入する。
本稿では,一意な双対空間損失関数を利用する新しい双対空間原型ネットワークを提案する。
このアプローチは、潜在空間における表現学習の強みを生かしている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:22:52 GMT)
Blockchains for Internet of Things: Fundamentals, Applications, and Challenges [38.3] すべてのブロックチェーンシステムが、特定のIoTアプリケーションに適しているわけではない。
パブリックブロックチェーンは機密データを格納するのに適していない。
ブロックチェーンのアプリケーションを、エッジAI、通信、ヘルスケアの3つの重要なIoT領域で調査する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:45:27 GMT)
Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning [38.3] より長い応答に対する微調整は、命令微調整の作業においてデフォルトのベースラインであるべきであることを示す。
いくつかのLLM(Llama-2-7B,Llama-2-13B,Mistral-7B-v0.1)とデータセット(Alpaca-52k,Evol-Instruct-70k)に対してこれを実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:20:01 GMT)
Lightweight CNN-BiLSTM based Intrusion Detection Systems for Resource-Constrained IoT Devices [38.2] 侵入検知システム(IDS)は、従来のコンピュータシステムにおけるサイバー攻撃の検出と防止に重要な役割を果たしてきた。
Internet of Things(IoT)デバイスで利用可能な限られた計算リソースは、従来のコンピューティングベースのIDSのデプロイを困難にしている。
軽量CNNと双方向LSTM(BiLSTM)を組み合わせたハイブリッドCNNアーキテクチャを提案し,UNSW-NB15データセット上でのIDSの性能向上を図る。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:36:21 GMT)
LLMCRIT: Teaching Large Language Models to Use Criteria [38.1] 本稿では,大規模言語モデル (LLM) がタスク実行に対する自然言語フィードバックの提供において,タスクの包括的基準を利用できるフレームワークを提案する。
特に,各基準に対する異なる記述タスクのガイドラインとコンテクスト内デモの構成から,半自動で基準を導出するモデル・イン・ザ・ループ・フレームワークを提案する。
その結果, 基準と実演を取り入れることによるきめ細かい効果を明らかにし, 基準をより効果的に活用するためのLLMの教え方に関する貴重な知見を提供することができた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:30:20 GMT)
Harnessing Neural Unit Dynamics for Effective and Scalable Class-Incremental Learning [38.1] クラスインクリメンタルラーニング(Class-incremental Learning, CIL)は、古いクラスを忘れずに、非定常データストリームから新しいクラスを学ぶためのモデルをトレーニングすることを目的としている。
本稿では、ニューラルネットワークの動作をCILに適応させるニューラルネットワークユニットダイナミクスを調整し、新しい種類のコネクショナリストモデルを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:47:03 GMT)
UA-Track: Uncertainty-Aware End-to-End 3D Multi-Object Tracking [37.9] 3D多重物体追跡(MOT)は自律運転知覚において重要な役割を担っている。
最近のエンドツーエンドのクエリベースのトラッカーは、オブジェクトを同時に検出および追跡し、3D MOTタスクの有望な可能性を示している。
既存の方法では、追跡対象の状態や位置に関する正確な信頼が欠如しているため、不確実性の問題を見落としている。
本稿では,不確実性を考慮した3D MOTフレームワークUA-Trackを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:34:46 GMT)
Interacting chiral fermions on the lattice with matrix product operator norms [37.7] 我々は格子上の相互作用するカイラルフェルミオンをシミュレートするハミルトン形式を開発する。
フェルミオン倍問題(fermion doubleling problem)は、半定ノルムを持つフォック空間を構成することによって回避される。
自由模型のスケーリング限界がカイラルフェルミオン場を回復することを示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:01:16 GMT)
QuIP#: Even Better LLM Quantization with Hadamard Incoherence and Lattice Codebooks [37.7] 後トレーニング量子化(PTQ)は、LLMのメモリフットプリントを減らし、その重みを低精度に定量化する。
重みのみのPTQ方式であるQuIP#を導入する。
実験の結果,QuIP#は既存のPTQメソッドよりも優れ,PTQスケーリングにおける新しい動作を可能にし,高速な推論をサポートすることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:51:52 GMT)
When to Sense and Control? A Time-adaptive Approach for Continuous-Time RL [37.6] 離散時間マルコフ決定過程(MDP)の最適化における強化学習(RL)の特長
この課題に対処するRLフレームワークであるTime-Adaptive Control & Sensing(TaCoS)を形式化する。
我々は、TaCoSで訓練された最先端のRLアルゴリズムが、その離散時間に対する相互作用量を劇的に削減できることを実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:06:20 GMT)
Why Only Text: Empowering Vision-and-Language Navigation with Multi-modal Prompts [37.2] Vision-and-Language Navigation with Multi-Modal Prompts (VLN-MP) は、自然言語と画像の両方を命令に統合することにより、従来のVLNを増強する新しいタスクである。
VLN-MPは、テキストのみのプロンプトを効果的に扱うことで後方互換性を維持するだけでなく、異なる量と視覚的プロンプトの関連性を一貫して示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:06:13 GMT)
Predict Click-Through Rates with Deep Interest Network Model in E-commerce Advertising [36.6] 本稿では,Deep Interest Network(DIN)モデルを用いて,クリックスルー率(CTR)予測モデルを改善する手法を提案する。
本研究では, 広範囲なユーザ行動データを活用することで, 広告ターゲティングのための局所的ユーザ行動アクティベーションに焦点を当てた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:52:14 GMT)
OTTAWA: Optimal TransporT Adaptive Word Aligner for Hallucination and Omission Translation Errors Detection [36.6] オタワ(Ottawa)は、機械翻訳システムにおける幻覚や失語の検出を強化するために特別に設計された単語整合器である。
提案手法は,HalOmiベンチマークを用いた18言語対の最先端手法と比較して,競争力のある結果が得られる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:00:55 GMT)
ICC: Quantifying Image Caption Concreteness for Multimodal Dataset Curation [36.4] ペア化されたテキストイメージデータのWebスケールトレーニングは、ますますマルチモーダルな学習の中心になりつつある。
標準的なデータフィルタリングアプローチでは、ミスマッチしたテキストイメージペアを削除できない。
画像参照なしで字幕テキストを評価し,その具体性を計測する新しい指標である画像キャプション具体性を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:08:42 GMT)
MEDIQ: Question-Asking LLMs for Adaptive and Reliable Clinical Reasoning [36.4] 臨床推論のような高度な領域では、大きな言語モデル(LLM)を利用したAIアシスタントはまだ信頼性と安全性が低い。
我々は,必要な情報を集め,確実に応答するためのフォローアップ質問を行う,より慎重なLCMを開発することを提案する。
我々は,現実的な臨床相互作用をシミュレートするフレームワークであるMEDIQを紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:55:05 GMT)
PDHG-Unrolled Learning-to-Optimize Method for Large-Scale Linear Programming [36.1] 本稿では,大規模線形計画問題の解法として PDHG-Net と呼ばれる FOM-Unrolled Neural Network (NN) を提案する。
提案手法は,大規模LP問題に対するFOMと比較して,最大3ドル以上の高速化を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:39:42 GMT)
Deterministic Reversible Data Augmentation for Neural Machine Translation [36.1] 本稿では,ニューラルネットワーク翻訳のための簡易かつ効果的なデータ拡張法であるDRDA(Deterministic Reversible Data Augmentation)を提案する。
余分なコーパスやモデルの変更は必要ないため、DRDAはいくつかの翻訳タスクにおいて、明確なマージンで強いベースラインを上回ります。
DRDAはノイズ、低リソース、クロスドメインデータセットにおいて優れた堅牢性を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:39:23 GMT)
Neural Representations of Dynamic Visual Stimuli [36.0] fMRIで測定した脳活動から視運動情報を光学的流れとして予測(あるいは復号化)できることを示す。
動き条件付き映像拡散モデルを用いて静的画像をリアルにアニメーションできることを示す。
この研究は、人間の脳がどのように視覚情報を動的に処理するかを解釈するための新しい枠組みを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:59:49 GMT)
Retaining Key Information under High Compression Ratios: Query-Guided Compressor for LLMs [35.9] 圧縮比が増加するにつれて従来の手法の性能は劇的に低下し、時にはクローズドブックレベルにまで低下する。
本稿では、クエリを利用してコンテキスト圧縮プロセスをガイドするQuery-Guided (QGC)を紹介する。
提案したQGCの有効性を,NaturalQuestions,TriviaQA,HotpotQAデータセットを含む質問応答タスクで検証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:53:24 GMT)
MedAgents: Large Language Models as Collaborators for Zero-shot Medical Reasoning [35.8] 大規模言語モデル(LLM)は医療や医療において重大な障壁に直面している。
MedAgentsは医療分野のための新しい多分野連携フレームワークである。
私たちの研究は、現実世界のシナリオに適用可能なゼロショット設定に焦点を当てています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:47:43 GMT)
LDB: A Large Language Model Debugger via Verifying Runtime Execution Step-by-step [35.8] 大規模言語モデル(LLM)はコード生成の大きな進歩を導いている。
本研究では,Large Language Model Debugger (LDB)を紹介する。
LDBはプログラムを基本ブロックに分割し、実行中の各ブロックの後に中間変数の値を追跡する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:55:27 GMT)
Guiding a Diffusion Model with a Bad Version of Itself [35.6] 非条件モデルではなく、より小さく、訓練の少ないモデル自体を用いて、生成を誘導することで、画像品質の変動量を補うことなく、画像品質を制御できることを示す。
これによりImageNetの生成が大幅に改善され、64x64で1.01、公開ネットワークで512x512で1.25のFIDが設定された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:25:59 GMT)
Dsfer-Net: A Deep Supervision and Feature Retrieval Network for Bitemporal Change Detection Using Modern Hopfield Networks [35.4] 本稿では,バイテンポラル変化検出のためのDeep Supervision and feature Retrieval Network (Dsfer-Net)を提案する。
具体的には、バイテンポラル画像の高度に代表的な深い特徴を、完全に畳み込みされたシームズネットワークを通じて、共同で抽出する。
エンド・ツー・エンドのネットワークは,異なるレイヤから抽出した特徴と特徴のペアを集約することで,新たなフレームワークを確立する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:55:02 GMT)
Preference Optimization for Molecule Synthesis with Conditional Residual Energy-based Models [35.3] 現在のデータ駆動戦略では、トップボトム方式で合成経路を予測するために、ワンステップのレトロモデルと検索アルゴリズムを採用している。
既存の戦略では、材料コスト、収量、ステップ数といった可能な基準に基づいて合成経路の生成を制御できない。
本稿では, コンディショナル残エネルギーモデル(EBM)を用いて, 合成経路全体の品質に焦点をあてた, 汎用的, 原則的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:49:30 GMT)
Harnessing Density Ratios for Online Reinforcement Learning [35.3] 密度比に基づくアルゴリズムにはオンラインのアルゴリズムがある。
新しいアルゴリズム (GLOW) は, サンプル効率の良いオンライン探索を行うために, 密度比の実現可能性と値関数の実現可能性を利用する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:19:10 GMT)
Noise-aware Speech Enhancement using Diffusion Probabilistic Model [35.2] 拡散モデルにおける逆過程を導出する雑音固有情報を抽出する雑音認識音声強調(NASE)手法を提案する。
NASEは任意の拡散SEモデルに一般化できるプラグイン・アンド・プレイモジュールであることが示されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:57:43 GMT)
LinguAlchemy: Fusing Typological and Geographical Elements for Unseen Language Generalization [35.1] LinguAlchemyは,類型的,地理的,系統的特徴を網羅する様々な言語情報を組み込んだ正規化手法である。
我々のLinguAlchemyは低リソース言語におけるmBERTとXLM-Rの性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:58:22 GMT)
RoomTex: Texturing Compositional Indoor Scenes via Iterative Inpainting [34.8] 本研究では,RoomTexと呼ばれる3次元シーンフレームワークを提案する。
RoomTexは、一貫性のないシーンメッシュのために、高忠実でスタイル一貫性のあるテクスチャを生成する。
本稿では,RGBとエッジ検出手法の整合性を維持することを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:27:09 GMT)
Nonsmooth Implicit Differentiation: Deterministic and Stochastic Convergence Rates [34.8] パラメトリックな非微分可縮写像の固定点の微分を効率的に計算する問題について検討する。
我々は、反復的分化(ITD)と近似的暗黙的分化(AID)の2つの一般的なアプローチを分析する。
我々はNSIDの収束率を確立し、スムーズな環境での最良の利用率を含む。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:53:01 GMT)
On the Intrinsic Self-Correction Capability of LLMs: Uncertainty and Latent Concept [34.5] 本稿では,大規模言語モデルを収束状態に導くための適切な命令を提示する。
本稿では,活性化潜在概念がモデルの不確実性と自己補正性能の収束を促進することを示す数学的定式化を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:55:43 GMT)
On the Identifiability of Switching Dynamical Systems [34.5] 潜在変数モデルの識別可能性は、解釈可能性と分布外一般化の関係から注目されている。
スイッチング力学系の識別可能性について検討し, 逐次潜在変数モデルへの識別可能性解析の展開に向けた第一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:28:29 GMT)
A Global Geometric Analysis of Maximal Coding Rate Reduction [34.3] 構造化およびコンパクトな深層表現を学習するための最大符号化レート低減(MCR$2$)目標の特性について検討する。
具体的には、MCR$2$問題の各(局所的あるいは大域的)最大化器が、低次元、差別的で多様な表現に対応することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:39:48 GMT)
Adversarial Attacks on Combinatorial Multi-Armed Bandits [34.1] 我々は、コンビニアル・マルチアーム・バンドイット(CMAB)に対する報酬中毒攻撃について研究する。
まず,CMABの攻撃性について十分かつ必要な条件を提示する。
次に、攻撃可能なCMABインスタンスに対する攻撃アルゴリズムを考案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:49:53 GMT)
Active Label Correction for Semantic Segmentation with Foundation Models [34.1] 本稿では,画素の擬似ラベルを補正する補正クエリの設計に基づく,アクティブラベル補正(ALC)の有効なフレームワークを提案する。
提案手法は, (i) 擬似ラベルを用いた補正クエリのアノテータフレンドリな設計, (ii) スーパーピクセルに基づくラベル展開を先取りする取得関数の2つの重要な手法からなる。
PASCAL,Cityscapes,Kvasir-SEGデータセットの実験結果から,ALCフレームワークの有効性が示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:15:16 GMT)
An Empirical Study into Clustering of Unseen Datasets with Self-Supervised Encoders [34.0] トレーニングされていないデータセットに事前トレーニングされたイメージモデルをデプロイし、それらの埋め込みが意味のあるクラスタを形成するかどうかを調査します。
この評価は、教師付きモデルに異なる特徴を優先する自己教師付きモデルの埋め込みに関する新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:34:17 GMT)
Phonetic Enhanced Language Modeling for Text-to-Speech Synthesis [33.9] TTSモデルの性能向上のための音素拡張言語モデリング手法を提案する。
我々は,自己回帰言語モデルの訓練対象として,音声的にリッチな自己教師表現を活用している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:43:34 GMT)
Fingerprint Matching with Localized Deep Representation [33.8] LDRFと呼ばれる指紋の局所的な深部表現を提案する。
LDRFは、様々な可視領域を持つ指紋に対して、より堅牢で正確な固定長表現を提供する。
非常に小さな重複領域の場合の不確実性を軽減するために,一致するスコア正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:39:34 GMT)
Sequence Compression Speeds Up Credit Assignment in Reinforcement Learning [33.3] 時間差(TD)学習は、分散を克服するためにブートストラップを使用するが、多くのイテレーションでしか修正できないバイアスを導入する。
ラムダ$-returnターゲットの計算モデルからトランジションの予測確率を利用するチャンク付きTDを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:28:56 GMT)
Research on Driver Facial Fatigue Detection Based on Yolov8 Model [33.2] 疲労運転検出技術(特にYOLOv8ディープラーニングモデルに基づくもの)は、効果的な予防策として広く研究され応用されている。
本研究の目的は,疲労運転の防止と検出のための堅牢な技術ソリューションを提供することであり,交通事故の低減と生活保護に大きく貢献することである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:45:11 GMT)
Continual Contrastive Spoken Language Understanding [33.1] COCONUTは、経験リプレイとコントラスト学習の組み合わせに依存するクラスインクリメンタルラーニング(CIL)手法である。
我々は,COCONUTをデコーダ側で動作するメソッドと組み合わせることで,さらなるメトリクス改善を実現することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:43:02 GMT)
Adaptive and Optimal Second-order Optimistic Methods for Minimax Optimization [32.9] 私たちのアルゴリズムは、イテレーション毎に1つの線形システムだけを解決する必要のある、単純な更新ルールを備えています。
また,提案アルゴリズムの実用性能を,既存の2次アルゴリズムと比較して評価した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:56:41 GMT)
Explicitly Encoding Structural Symmetry is Key to Length Generalization in Arithmetic Tasks [32.8] 本稿では,加法や乗算などの算術的なタスクにおいて,トランスフォーマーが長さを超越して一般化できないことを示す。
この失敗の背後にある大きな理由は、数字とテキストの間の大きな違いである。
本稿では,これらのセマンティクスを,修正された数値フォーマッティングとカスタム位置符号化によってモデルに明示的にエンコードすることを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:00:07 GMT)
Cross-Domain Graph Data Scaling: A Showcase with Diffusion Models [32.5] 拡散モデル上に構築された普遍グラフ構造拡張器UniAugを提案する。
まず、各領域にまたがる数千のグラフ上の離散拡散モデルを事前学習し、グラフ構造パターンを学習する。
下流相では,事前学習拡散モデルの助けを借りて,グラフ構造拡張を施すことにより適応的な拡張を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:04:09 GMT)
Building Socially-Equitable Public Models [32.4] パブリックモデルは、さまざまなダウンストリームタスクを予測し、さまざまなAIアプリケーションにおいて重要な役割を果たす。
我々は、下流エージェントの目的を最適化プロセスに統合することを提唱する。
本研究では,不均一なエージェント間の公平性を育成し,パフォーマンスの相違に対処する新しいエクイタブル・オブジェクトを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:27:43 GMT)
DPDR: Gradient Decomposition and Reconstruction for Differentially Private Deep Learning [32.3] 本稿では,早期の勾配分解と再構成を伴う,差分プライベートなトレーニングフレームワークを提案する。
従来の雑音勾配に基づいてそれらを分解することで、現在の勾配における共通の知識と漸進的な情報を解き放つ。
収束率と精度の両方で最先端のベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:57:47 GMT)
Stable-Pose: Leveraging Transformers for Pose-Guided Text-to-Image Generation [32.2] Stable-Poseは、粗い注目マスキング戦略を視覚変換器に導入する新しいアダプタモデルである。
我々は、ViTのクエリキー自己保持機構を利用して、人間のポーズスケルトンにおける異なる解剖学的部分間の相互接続を探索する。
Stable-PoseはLAION-HumanデータセットのAPスコア57.1を達成し、確立したControlNetよりも約13%改善した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:54:28 GMT)
Towards Robust Physical-world Backdoor Attacks on Lane Detection [31.8] ディープラーニングに基づく車線検出(LD)は、適応クルーズ制御のような自律走行システムにおいて重要な役割を果たす。
LD上の既存のバックドア攻撃手法は、動的現実シナリオにおいて限られた効果を示す。
本稿では,現実の動的シーン要因の変化に耐えるように設計されたLDの動的シーン適応バックドアアタックであるBadLANEを紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:13:03 GMT)
Disentangling Logic: The Role of Context in Large Language Model Reasoning Capabilities [31.7] 包括的なドメイン集合からの抽象的および文脈的論理的問題に対するコントラストについて検討する。
我々は、標準的な命題論理、特に命題推論と帰納論理推論に焦点を当てる。
本実験は,LLMの論理的推論と真の推論能力に関する知見を提供することを目的としている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:25:06 GMT)
Dreamguider: Improved Training free Diffusion-based Conditional Generation [31.7] Dreamguiderは、拡散ネットワークを介して計算量の多いバックプロパゲーションを伴わない推論時ガイダンスを可能にする手法である。
提案するモジュールの有効性を示すために,複数のデータセットやモデルにまたがる複数のタスクに対してDreamguiderを用いて実験を行った。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:59:32 GMT)
Leveraging Predicate and Triplet Learning for Scene Graph Generation [31.1] SGG(Scene Graph Generation)は、エンティティを特定し、関係トリプルを予測することを目的としている。
本稿では,大きめの述語に加えて細粒度三重項キューを利用するためのDRMネットワークを提案する。
提案手法は,Visual Genome, Open Image, GQAデータセット上での最先端性能を確立する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:23:41 GMT)
Repoformer: Selective Retrieval for Repository-Level Code Completion [30.7] 検索強化生成(RAG)の最近の進歩は、リポジトリレベルのコード補完の新たな時代が始まった。
本稿では,不要な場合の検索を回避するため,選択的なRAGフレームワークを提案する。
我々のフレームワークは、異なる世代モデル、レトリバー、プログラミング言語に対応できることを示します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:04:33 GMT)
Physics Inspired Criterion for Pruning-Quantization Joint Learning [30.4] PIC-PQ(Pruning-quantization Joint Learning)のための新しい物理基準を提案する。
物理インスパイアされた基準(PIC)における学習可能なスケール変形によるフィルタの重要度分布とフィルタ特性(FP)の線形関係を確立する。
画像分類のベンチマーク実験により、PIC-PQは精度とビット演算(BOP)圧縮比の良好なトレードオフをもたらすことが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:34:05 GMT)
FedCal: Achieving Local and Global Calibration in Federated Learning via Aggregated Parameterized Scaler [29.9] フェデレートラーニング(FedCal)は、クライアント固有のスケーラをローカルおよびグローバルキャリブレーションに使用する。
実験では、FedCalが最高性能のベースラインを大幅に上回り、グローバルキャリブレーションエラーを平均47.66%削減した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:36:14 GMT)
Textless Acoustic Model with Self-Supervised Distillation for Noise-Robust Expressive Speech-to-Speech Translation [29.8] ノイズロスト表現型音声音声合成(S2ST)のための自己教師型蒸留方式を用いたテキストレス音響モデルを提案する。
提案手法は雑音非依存の表現を捉えるため,雑音環境においても有資格音声を生成することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:22:13 GMT)
Meta-Designing Quantum Experiments with Language Models [29.8] 合成データに基づいて訓練されたコード生成言語モデルが,一発でクラス全体の問題を解決する方法を示す。
具体的には、新しい量子物理学実験の設計のために、シーケンス・ツー・シーケンス・トランスフォーマーアーキテクチャは解釈可能なPythonコードを生成する。
我々は、無限大の量子状態のクラスに対する一般的な、以前は知られていなかった設計規則を発見する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:40:55 GMT)
Edit Distance Robust Watermarks for Language Models [29.7] AI生成テキストの検出の問題に触発されて、証明可能な保証付き言語モデルの出力を透かしする問題を考える。
a)非検出性、(a)Christ, Gunn & Zamir (2024) が導入した暗号概念、(b) 敵の挿入、置換、削除を一定の割合で導入するチャネルに対する堅牢性。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:03:17 GMT)
SEER: Facilitating Structured Reasoning and Explanation via Reinforcement Learning [29.5] 構造的推論と説明を容易にする構造的回帰を最大化する新しい手法であるSEERを提案する。
提案手法は構造的推論に固有の階層構造と分岐構造を正確に記述する。
実験の結果,SEERは最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:14:56 GMT)
A Survey of Mix-based Data Augmentation: Taxonomy, Methods, Applications, and Explainability [29.4] データ拡張(DA)は、現代の機械学習やディープニューラルネットワークでは不可欠である。
この調査は、MixDA(Mix-based Data Augmentation)と呼ばれるDAテクニックの重要なサブセットを包括的にレビューする。
単一のサンプルやデータセット全体を運用する従来のDAアプローチとは対照的に、MixDAはその有効性、単純性、柔軟性、計算効率、理論的基礎、幅広い適用性のために際立っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:11:25 GMT)
Event-horizon-scale Imaging of M87* under Different Assumptions via Deep Generative Image Priors [29.3] 本稿では,画像再構成に様々なバイアスを与える,フレキシブルな事前設計の枠組みを提案する。
当社のフレームワークは、深層生成モデルから生じるデータ駆動の事前処理であるスコアベースの事前処理で使用しています。
シミュレーションデータに加えて、実際のEHT M87*データを画像化し、以前の選択によってどのように復元された特徴が影響されるかについて議論する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:08:07 GMT)
Test-Time Regret Minimization in Meta Reinforcement Learning [28.7] マルコフ決定過程を通じてモデル化されたタスクの有限集合を様々なダイナミクスで考える。
未知のテストタスクにおける最適方針に対する後悔の最小化に焦点を当てる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:56:10 GMT)
KnowGPT: Knowledge Graph based Prompting for Large Language Models [28.6] 本稿では,知識グラフに基づく PrompTing フレームワーク,すなわち KnowGPT を導入し,ドメイン知識で大規模言語モデルを強化する。
KnowGPTには、KGから最も情報性の高い知識を抽出する知識抽出モジュールと、抽出した知識を自動的に効果的なプロンプトに変換するコンテキスト対応プロンプト構築モジュールが含まれている。
KnowGPTはOpenbookQAのリーダーボードで92.6%の精度を実現している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:10:37 GMT)
NewsBench: A Systematic Evaluation Framework for Assessing Editorial Capabilities of Large Language Models in Chinese Journalism [28.4] 我々は,中国語ジャーナリズムにおける編集能力のための大規模言語モデル(LLM)の能力を体系的に評価する新しい評価フレームワークであるNewsBenchを提案する。
構築したベンチマークデータセットは、筆記能力の4つの面と安全性の6つの面に焦点を当てている。
本稿では,GPT-4をベースとした自動評価プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:50:58 GMT)
ODE-based Learning to Optimize [28.4] 我々は、慣性系とヘッセン駆動制振方程式(ISHD)を統合した包括的枠組みを提案する。
収束・安定条件を考慮した停止時間を最小化することを目的とした新しい学習法(L2O)を定式化する。
本フレームワークの実証検証は,多種多様な最適化問題に対する広範な数値実験を通じて行われる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:39:45 GMT)
Latent Style-based Quantum GAN for high-quality Image Generation [28.3] 本稿では,GAN(Generative Adversarial Networks)の学習に古典量子アプローチを併用したLastnt Style-based Quantum GAN(LaSt-QGAN)を紹介する。
私たちのLaSt-QGANは、標準的なMNISTを超えるリアルなコンピュータビジョンデータセット、すなわちファッション製品であるFashion MNISTと10キュービットのSAT4(地球観測画像)でうまくトレーニングできます。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:00:00 GMT)
Measure-Observe-Remeasure: An Interactive Paradigm for Differentially-Private Exploratory Analysis [28.2] 差分プライバシー(DP)は、機密データのプライバシー保護分析を可能にする可能性がある。
しかし、探索分析を行うアナリストは、事前に全てのクエリを知っておらず、DPの専門知識はめったにない。
本稿では,データベースを限定的な$epsilon$で測定する対話型分析パラダイムであるMeteor-Observe-Remeasureを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:48:40 GMT)
Ai-Sampler: Adversarial Learning of Markov kernels with involutive maps [28.2] 本稿では,マルコフ連鎖の遷移核のパラメータ化と訓練を行い,効率的なサンプリングと良好な混合を実現する方法を提案する。
この訓練方法は、チェーンの定常分布とデータの経験分布との総変動距離を最小化する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:00:14 GMT)
Extreme Point Supervised Instance Segmentation [28.2] 本稿では,各オブジェクトの極端点,左極端点,最下極点,右極端点を用いて,インスタンスセグメンテーションを学習するための新しいアプローチを提案する。
これらの点は、正確なセグメンテーションのための強力な手がかりを提供しながら、現代のバウンディングボックスアノテーションプロセスで容易に利用可能である。
本モデルでは,対象物を複数の部品に分けた場合に高品質なマスクを生成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:31:49 GMT)
SimulTron: On-Device Simultaneous Speech to Speech Translation [28.1] 同時音声音声翻訳(S2ST)は、コミュニケーション障壁を分解し、言語間での会話を可能にするという約束を果たす。
この課題に対処するために設計された新しいS2STアーキテクチャであるSimulTronを紹介する。
SimulTronは、Translatotronフレームワークの強度を使用し、ストリーミング操作のための重要な変更と調整可能な固定遅延を組み込んだ軽量な直接S2STモデルである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:21:31 GMT)
Finding NeMo: Localizing Neurons Responsible For Memorization in Diffusion Models [28.0] DMのクロスアテンション層において,個々のデータサンプルの記憶をニューロンのレベルまでローカライズする最初の方法であるNeMoを導入する。
これらの記憶ニューロンを非活性化することにより、推論時のトレーニングデータの複製を回避し、生成した出力の多様性を高め、プライベートおよび著作権データの漏洩を軽減することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:45:47 GMT)
In-Context Unlearning: Language Models as Few Shot Unlearners [28.0] 我々は,Large Language Models (LLMs) のための新しいアンラーニング手法を提案する。
このメソッドは、モデルパラメータを更新することなく、コンテキスト内で特定の種類の入力を提供することで、モデルからインスタンスを解放する。
実験の結果、文脈内アンラーニングは、モデルパラメータへのアクセスを必要とする他の最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:35:56 GMT)
More PAC-Bayes bounds: From bounded losses, to losses with general tail behaviors, to anytime validity [27.9] 我々は、異なる種類の損失に対して、新しい高確率PAC-Bayes境界を提案する。
有界範囲の損失に対して、すべてのパラメータ値に対して一様に保持されるカトーニ境界の強化版を復元する。
より一般的な尾の挙動を持つ損失に対して、2つの新しいパラメータフリー境界を導入する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:09:44 GMT)
FedDr+: Stabilizing Dot-regression with Global Feature Distillation for Federated Learning [27.8] フェデレートラーニング(FL)は、効果的なグローバルモデル開発のための重要なフレームワークとして登場した。
FLの主な課題はクライアントのドリフトであり、データの不均一性は分散した知識の集約を妨げる。
我々は,ドット回帰損失を用いた局所モデルアライメントを実現するFedDr+という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:34:13 GMT)
Efficient Exploration for LLMs [27.6] 我々は,大規模な言語モデルを改善するために,人間のフィードバックを収集する際の効率的な探索の実質的なメリットを示す。
実験では,受信したフィードバックに報酬モデルを適用しながら,エージェントが逐次クエリを生成する。
その結果,効率の良い探索により,クエリをはるかに少なくして高いレベルの性能を実現することができた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:35:09 GMT)
The Illusion of State in State-Space Models [27.6] ステートスペースモデル(SSM)は、大きな言語モデルを構築するための代替アーキテクチャとして考えられる。
我々は,SSMが変圧器のような非リカレントモデルに類似した制約があることを示し,実世界の状態追跡問題を解く能力を制限する可能性があることを示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:05:45 GMT)
Efficiently Train ASR Models that Memorize Less and Perform Better with Per-core Clipping [27.5] Per-core clip-ping (PCC) は、ASRモデルにおける意図しない記憶を効果的に緩和することができる。
PCCはASRのパフォーマンス指標に肯定的な影響を与え、収束率の改善と単語誤り率の削減につながった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:34:33 GMT)
LIRE: listwise reward enhancement for preference alignment [27.5] 本稿では、複数の応答のオフライン報酬を合理化されたリストワイズフレームワークに組み込む、勾配に基づく報酬最適化手法を提案する。
LIREは実装が簡単で、最小限のパラメータチューニングを必要とし、ペアワイズパラダイムとシームレスに整合する。
実験の結果,LIREは対話タスクや要約タスクのベンチマークにおいて,既存のメソッドよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:21:05 GMT)
Navigating the Future of Federated Recommendation Systems with Foundation Models [27.4] 近年,FRS(Federated Recommendation Systems)として知られるFLとレコメンデーションシステムの統合が注目されている。
しかし、FLのプライバシー要件とRSの典型的なデータ空間の問題により、FRSはデータの不均一性や不足といった固有の制限に直面している。
本研究では、ファンデーションモデル(FM)を用いたFRSの総合的なレビューを行う。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:10:54 GMT)
Surge Phenomenon in Optimal Learning Rate and Batch Size Scaling [27.1] 本稿では,Adamスタイルにおける最適学習率とバッチサイズとの関係について検討する。
最適学習率が最初に上昇し、バッチサイズが大きくなるにつれて低下することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:11:13 GMT)
Language Models Do Hard Arithmetic Tasks Easily and Hardly Do Easy Arithmetic Tasks [27.0] 大規模言語モデル(LLM)はm桁乗算タスクによってn桁の最初の桁を正確かつ確実に予測することができる。
実際には LLM は m-digit 乗算によって n-digit の最後の桁を正しくあるいは確実に予測できないことが多い。
LLMが正しい高次桁の全てに条件付けされている場合、後者のタスクはより堅牢に解決できることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:34:39 GMT)
Synergistic Integration of Coordinate Network and Tensorial Feature for Improving Neural Radiance Fields from Sparse Inputs [26.9] 本稿では,低周波信号に対する強いバイアスで知られる座標ネットワークと多面表現を統合する手法を提案する。
提案手法は,スパース入力を持つ静的および動的NeRFのベースラインモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:56:57 GMT)
Structure-based Drug Design Benchmark: Do 3D Methods Really Dominate? [26.9] 構造に基づく薬物設計におけるアルゴリズム間の比較は少ない。
1D/2D法は,標的タンパク質の3D構造を明示的に用いた3D法と比較して,競合性能が高いことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:37:14 GMT)
Adaptive Variance Reduction for Stochastic Optimization under Weaker Assumptions [26.5] 非函数に対して$mathcalO(log T)$の最適収束率を達成する新しい適応還元法を導入する。
また、提案手法を拡張して、合成最適化のために$mathcalO(log T)$と同じ最適率を得る。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:39:51 GMT)
Can We Remove the Square-Root in Adaptive Gradient Methods? A Second-Order Perspective [26.5] 適応手法の動作が根の除去時にどのように変化するかを検討する。
このような平方根自由適応法は畳み込みアーキテクチャ上のSGDへの一般化ギャップを埋める。
シャンプーのような根ベースの方法とは対照的に、根のない手法は数値的に不安定な行列の根分解や逆変換を必要としない。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:47:41 GMT)
CMOSE: Comprehensive Multi-Modality Online Student Engagement Dataset with High-Quality Labels [26.5] 本稿では,異なるエンゲージメントレベルからの大量のデータと,心理的アドバイスに従ってアノテートされた高品質なラベルを含むCMOSEデータセットを提案する。
また,クラス内多様度とクラス内多様度の順序パターンを扱うためのトレーニング機構であるMocoRankを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:27:35 GMT)
PLA4D: Pixel-Level Alignments for Text-to-4D Gaussian Splatting [26.4] 我々は,静的な3Dオブジェクトを生成し,それらに動きを注入するために,テキストからビデオまでのフレームを明示的な画素アライメントターゲットとして提案する。
本研究では、変形ネットワークを用いてガウスの変化を駆動し、滑らかな4次元物体表面に対する参照再ファインメントを実装するモーションアライメントを開発する。
従来の方法と比較して、PLA4Dはより少ない時間でより優れたテクスチャの詳細を持つ合成出力を生成し、Janus-faced問題を効果的に緩和する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:56:39 GMT)
M$^3$AV: A Multimodal, Multigenre, and Multipurpose Audio-Visual Academic Lecture Dataset [26.3] マルチモーダル・マルチジャンル・多目的音声視覚学術講義データセット(M$3$AV)を提案する。
M$3$AVには、コンピュータ科学、数学、医学、生物学に関する5つの情報源から367時間分のビデオがある。
スライドテキストと音声単語の高品質な人間のアノテーションにより、データセットは複数の音声視覚認識および理解タスクに使用することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:05:09 GMT)
How Smooth Is Attention? [26.3] いくつかの実践シナリオにおいて、リプシッツ定数の自己注意について詳細に研究する。
任意のコンパクト集合における長さ$n$の入力に対して、自己注意のリプシッツ定数は定数係数まで$sqrtn$で有界であることを示す。
マスクされた自己注意のための平均フィールドフレームワークは、新しくて独立した関心事です。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:51:36 GMT)
Interdisciplinary Fairness in Imbalanced Research Proposal Topic Inference: A Hierarchical Transformer-based Method with Selective Interpolation [26.3] 自動トピック推論は、手動のトピックフィリングによるヒューマンエラーを低減し、資金調達機関とプロジェクト申請者の間の知識ギャップを埋め、システム効率を向上させる。
既存の手法は、学際的な研究提案と学際的でない提案とのスケールの差を見落とし、不当な現象へと繋がる。
本稿では,Transformerエンコーダ・デコーダアーキテクチャに基づくトピックラベル推論システムを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:01:18 GMT)
Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue [26.2] 対話システムの中核は、広範囲な対話履歴に基づいて、関連性、情報的、人間的な応答を生成することである。
そのようなモデルには、本来ある位置バイアスという自然な欠点がある。
本稿では,摂動に基づく因果変数探索手法を用いた因果知覚長期対話フレームワーク(CPD)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:33:13 GMT)
Dishonesty in Helpful and Harmless Alignment [26.1] 大規模言語モデル(LLM)は、人間の好みを満たす場合の報酬を得る強化学習によって、人間の価値に整合している。
また、LSMが無害反応を生じさせると嘘をつくような無害なアライメントにおいても、これは不当な結果をもたらすことが判明した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:31:09 GMT)
Language Models can Infer Action Semantics for Classical Planners from Environment Feedback [26.0] 大規模言語モデル(LLM)は、常識的知識と最小限のドメイン情報に基づく計画手順を直接推論するために使用することができる。
提案するPSALMは,古典的プランナーが部分的ドメイン知識を付与した完全部分計画に推論を利用する。
7つの環境について分析した結果,LLMをプランナとして,ルール予測器として使用することにより,環境実行手順や環境リセットをランダムな探索よりも低くすることができることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:29:56 GMT)
Exploration of Adapter for Noise Robust Automatic Speech Recognition [26.0] 音声認識システム(ASR)を未確認ノイズ環境に適用することは重要である。
ニューラルネットワークへのアダプタの統合は、トランスファーラーニングの強力なテクニックとして現れている。
本研究は, 雑音環境下でのアダプタに基づくASR適応について, 徹底的に検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:20:02 GMT)
Neural Common Neighbor with Completion for Link Prediction [25.9] 我々は,MPNNの表現プーリングを誘導する構造的特徴(SF)を活用した革新的なアーキテクチャであるMPNN-then-SFを紹介する。
グラフの不完全性が SF に与える影響について検討する。
この問題に対処するために、リンク予測モデルを用いて、一般的な隣り合う構造を完成させる手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:46:09 GMT)
FightLadder: A Benchmark for Competitive Multi-Agent Reinforcement Learning [25.9] 我々は、リアルタイムの格闘ゲームプラットフォームであるFightLadderを紹介し、競争力のあるMARL研究を促進する。
競争ゲームのための最先端のMARLアルゴリズムの実装と評価指標のセットを提供する。
シングルプレイヤーモードで12文字を連続的に打ち破る汎用エージェントを訓練することにより,このプラットフォームの実現可能性を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:04:23 GMT)
Auto-Encoding or Auto-Regression? A Reality Check on Causality of Self-Attention-Based Sequential Recommenders [25.7] 我々は,自己注意型シーケンシャルレコメンデータのためのAEモデルとARモデルとして機能するBERT4RecとSASRecを比較した。
ARモデルは一般的に、逐次推奨でAEモデルを上回ることが分かりました。
AE/ARのパフォーマンスに関する2つの重要な視点から、潜在的な説明と洞察を提供する。
論文参考訳(メタデータ) (Tue, 04 Jun 2024 07:29:59 GMT)
RoboCasa: Large-Scale Simulation of Everyday Tasks for Generalist Robots [25.7] 本稿では,汎用ロボットを日常的に訓練するための大規模シミュレーションフレームワークであるRoboCasaを紹介する。
私たちは、150以上のオブジェクトカテゴリと数十の対話可能な家具とアプライアンスに対して、何千もの3Dアセットを提供しています。
本実験は, 大規模模倣学習のための合成ロボットデータを用いて, スケーリングの傾向を明らかにするものである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:41:31 GMT)
Generalizing Conversational Dense Retrieval via LLM-Cognition Data Augmentation [25.6] 既存の会話高密度検索モデルは、主に会話を質問や回答の固定シーケンスとして見る。
本稿では,LLM認識データ拡張(ConvAug)による会話高密度検索の一般化のためのフレームワークを提案する。
人間の認知にインスパイアされた私たちは、偽陽性、偽陰性、幻覚の発生を緩和する認知認識プロセスを考案した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:09:15 GMT)
MLIP: Efficient Multi-Perspective Language-Image Pretraining with Exhaustive Data Utilization [25.5] Contrastive Language-Image Pretraining (CLIP) は、マルチモーダル研究の急速な進歩に繋がる顕著な成功を収めた。
CLIPは、表現学習中の各画像テキストペアに対して、単一のコントラスト的な監督に依存している。
これらの問題に対処するために,MLIP(Multi-Perspective Language- Image Pretraining)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:36:57 GMT)
Modelling Commonsense Commonalities with Multi-Facet Concept Embeddings [25.5] 概念埋め込みは興味のある性質を共有する概念を識別する。
標準埋め込みは基本的な分類学的カテゴリーを反映しており、より特定の側面を参照する共通点を見つけるのに適さない。
これは、より多様なコモンセンス特性をキャプチャし、下流タスクの結果を継続的に改善する埋め込みにつながることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:36:42 GMT)
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models [25.3] Retrieval-augmented Large Language Models (RALMs) は、元の検索自由言語モデル (LMs) を一貫して上回るものではない。
提案実験により, この例レベルの性能不整合性は, 検索強化と検索不要のLMの間だけでなく, 異なる検索者の間にも存在することが明らかとなった。
本稿では,異なる知識ソースから適応的に検索し,予測不能な読み出し誤りを効果的に低減できるトレーニング可能なフレームワークであるEnsemble of Retrievers(EoR)を紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:51:53 GMT)
TreePIR: Efficient Private Retrieval of Merkle Proofs via Tree Colorings with Fast Indexing and Zero Storage Overhead [25.3] Batch Private Information Retrieval (Batch-PIR)は、クライアントがデータベースから複数のデータアイテムを格納サーバに公開せずに取得することを可能にする。
バッチPIRの既存のアプローチのほとんどは、大きなストレージオーバーヘッドを引き起こすバッチコードに基づいている。
木型データベースでは,テキスタイルストレージのオーバーヘッドが実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:24:18 GMT)
3D Gaussian Splatting with Deferred Reflection [25.3] 本稿では,ガウススプラッティングによるスペクトル反射の遅延シェーディング法を提案する。
提案手法は,高品質なスペクトル反射効果の合成における最先端技術と同時処理を著しく上回っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:59:54 GMT)
A Survey of Generative Information Retrieval [25.1] Generative Retrieval (GR) は、情報検索における新たなパラダイムであり、従来のクエリ処理やドキュメントの再ランクを必要とせずに、生成モデルを利用してクエリを関連するドキュメント識別子(DocID)にマップする。
この調査はGRの総合的な概要を提供し、主要な開発、索引付けと検索戦略、課題を強調している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:12:39 GMT)
Self-Modifying State Modeling for Simultaneous Machine Translation [25.1] 同時機械翻訳(SiMT)は、ストリームソース入力を受信しながらターゲット出力を生成する。
既存のSiMT手法は、様々な意思決定経路を探索することでポリシーを学習し、固有の制約に直面している。
我々は、SiMTタスクのための新しいトレーニングパラダイムであるtextbfSelf-textbfModifying textbfState textbfModeling (SM$2$)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:57:58 GMT)
Power Mean Estimation in Stochastic Monte-Carlo Tree_Search [25.1] Monte-Carlo Tree Search (MCTS)は、Monte-Carloサンプリングとフォワードツリー検索を組み合わせたオンラインプランニングのための広く使われている戦略である。
UCTの理論的基礎は対数的ボーナス項の誤りにより不完全である。
本稿では,MDPに適したパワー平均推定器を用いたアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:56:37 GMT)
Cross-Embodiment Robot Manipulation Skill Transfer using Latent Space Alignment [24.9] 本稿では,形態の異なるロボットマニピュレータ間の制御ポリシの伝達に着目した。
主要な洞察は、ソースとターゲットロボットの状態と行動空間を共通の潜在空間表現に投影することである。
我々は、異なる状態、行動、実施形態のソースとターゲットロボットによるシム・トゥ・シム・トゥ・シム・トゥ・シム・トゥ・リアルな操作ポリシーの伝達を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:00:24 GMT)
Unifying the Perspectives of NLP and Software Engineering: A Survey on Language Models for Code [24.9] 本稿では,最近のソフトウェア工学の進歩を言語モデルを用いて体系的にレビューする。
私たちは、コード処理モデルを、GPTファミリで表される一般的な言語モデルと、特にコードで事前訓練された特殊なモデルに分解します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:39:47 GMT)
Addressing Diverging Training Costs using Local Restoration for Precise Bird's Eye View Map Construction [24.9] 本稿では,新しいTrumpet Neural Network(TNN)機構について紹介する。
TNNは、プラグアンドプレイのメモリ効率のパイプラインを提供しており、実際のサイズの(あるいは正確な)セマンティックラベルを効果的に推定することができる。
実験の結果,TNN機構は,実サイズ(あるいは正確な)セマンティックラベルを効果的に推定できる,プラグアンドプレイのメモリ効率の高いパイプラインを提供することがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:03:39 GMT)
Towards Effective Time-Aware Language Representation: Exploring Enhanced Temporal Understanding in Language Models [24.8] BiTimeBERT 2.0は、テンポラリニュース記事コレクションに事前トレーニングされた新しい言語モデルである。
それぞれの目的は、時間情報のユニークな側面を目標としている。
その結果、BiTimeBERT 2.0はBERTや他の既存のトレーニング済みモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:30:37 GMT)
Personalized Topic Selection Model for Topic-Grounded Dialogue [24.7] 現在のモデルは、ユーザに興味がなく、文脈的に無関係なトピックを予測する傾向があります。
我々はtextbfTopic-grounded textbfDialogue のための textbfPersonalized topic stextbfElection model を提案する。
提案手法は,多種多様な応答を生成でき,最先端のベースラインを達成できる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:09:49 GMT)
Dynamics Harmonic Analysis of Robotic Systems: Application in Data-Driven Koopman Modelling [24.7] 我々は,対称ロボットシステムの状態空間を異型部分空間に分解するために調和解析を導入する。
線形力学では、この分解が各部分空間上の独立線型系への力学の分割にどのように繋がるかを特徴づける。
本アーキテクチャは, 合成システムと四足歩行ロボットの運動力学に基づいて, 一般化, サンプル効率, 解釈可能性の向上を図っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:39:17 GMT)
ShadowBound: Efficient Heap Memory Protection Through Advanced Metadata Management and Customized Compiler Optimization [24.5] ヒープの破損は システムのセキュリティに深刻な脅威をもたらす
ユニークなヒープメモリ保護設計であるShadowBoundを紹介します。
LLVMフレームワーク上にShadowBoundを実装し、最先端の3つの無防備を統合しました。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:02:53 GMT)
Online Learning and Information Exponents: On The Importance of Batch size, and Time/Complexity Tradeoffs [24.3] 我々は,1パス勾配勾配(SGD)を有する2層ニューラルネットワークの繰り返し時間に対するバッチサイズの影響について検討した。
大規模なバッチで勾配更新を行うことで、サンプル全体の複雑さを変えることなく、トレーニング時間を最小化できることが示される。
低次元常微分方程式(ODE)のシステムにより、トレーニングの進捗を追跡できることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:44:49 GMT)
Analyzing Social Biases in Japanese Large Language Models [24.3] 本稿では,英語バイアスベンチマークBBQに基づいて,質問回答のための日本語バイアスベンチマークデータセット(JBBQ)を構築した。
日本語大言語モデル(LLM)における社会的バイアスの分析
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:31:06 GMT)
Social Choice Should Guide AI Alignment in Dealing with Diverse Human Feedback [24.0] GPT-4のような基礎モデルは、安全でない、あるいは問題のある振る舞いを避けるために微調整されている。
人間のフィードバックから強化学習と呼ばれる微調整の1つのアプローチは、複数の出力に対する人間の表現された好みから学習する。
もうひとつのアプローチは、人間からの入力が高レベルの原則のリストであるコンスティチューションAIである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:34:38 GMT)
Learning to Intervene on Concept Bottlenecks [23.9] 概念ボトルネックメモリモデル (CB2Ms) は2倍のメモリを利用して、介入を適切な新しい状況に一般化する。
CB2Mは、見当たらないデータに対する介入をうまく一般化することができ、正しく推論された概念を識別することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:21:51 GMT)
RKLD: Reverse KL-Divergence-based Knowledge Distillation for Unlearning Personal Information in Large Language Models [23.9] 我々は,大規模言語モデル(LLM)のための新しいtextbfReverse textbfKL-Divergence-based Knowledge textbfDistillation unlearningアルゴリズムであるRKLDを提案する。
我々は,実験におけるモデルの有用性を効果的に維持し,品質を著しく忘れることを実現した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:51:43 GMT)
Demystifying Oversmoothing in Attention-Based Graph Neural Networks [23.9] グラフニューラルネットワーク(GNN)におけるオーバースムーシング(Oversmoothing in Graph Neural Networks)とは、ネットワーク深度の増加がノードの均質表現につながる現象である。
これまでの研究により、グラフ畳み込みネットワーク(GCN)は指数関数的に表現力を失うことが判明した。
グラフアテンション機構が過剰なスムースを緩和できるかどうかはまだ議論の余地がある。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:30:31 GMT)
CAMP: Compiler and Allocator-based Heap Memory Protection [23.8] 我々は,ヒープメモリの破損を検知し,キャプチャする新しいサニタイザであるCAMPを提案する。
CAMPは様々なコンパイラ最適化戦略を可能にし、冗長で不要なチェックインスツルメンテーションを排除する。
実環境アプリケーションとSPEC CPUベンチマークの両方を用いてCAMPと既存のツールを比較した結果,実行時のオーバーヘッドを低減して,より優れたヒープ破損検出能力が得られることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:37:41 GMT)
RATT: AThought Structure for Coherent and Correct LLMReasoning [23.3] 本稿では,思考過程の各段階における論理的健全性と事実的正当性の両方を考慮した新しい思考構造であるRetrieval Augmented Thought Tree(RATT)を紹介する。
様々な種類のタスクに関する実験では、RATT構造が既存の手法を事実的正当性と論理的整合性で著しく上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:02:52 GMT)
AMOSL: Adaptive Modality-wise Structure Learning in Multi-view Graph Neural Networks For Enhanced Unified Representation [22.8] マルチビューグラフニューラルネットワーク(MVGNN)は、オブジェクト表現の学習に様々なモダリティを活用するのに長けている。
既存の手法では、実世界の相違を見渡すモダリティを越えて同じ局所トポロジー構造を仮定する。
これらの問題に対処するため,適応型モーダリティ構造学習(AMoSL)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:24:30 GMT)
Polynomial-Augmented Neural Networks (PANNs) with Weak Orthogonality Constraints for Enhanced Function and PDE Approximation [22.7] 現在拡張されたニューラルネットワーク(PANN)
本稿では、ディープニューラルネットワーク(DNN)と近似を組み合わせた新しい機械学習アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:06:15 GMT)
Gated Attention Coding for Training High-performance and Efficient Spiking Neural Networks [22.7] Gated Attention Coding (GAC) は、多次元アテンションユニットを利用して入力を効率よく強力な表現にエンコードするプラグイン・アンド・プレイモジュールである。
GACは、SNNのスパイク駆動特性を損なわない前処理層として機能する。
CIFAR10/100とImageNetデータセットの実験では、GACが最先端の精度を目覚ましい効率で達成していることが示されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:27:50 GMT)
Disguised Copyright Infringement of Latent Diffusion Models [22.5] 著作権侵害は、生成モデルがトレーニング期間中にアクセスしたいくつかの著作権データと実質的に類似したサンプルを生成するときに起こりうる。
このような視覚的監査は、著作権が隠された著作権侵害をほとんど見落としていると我々は主張する。そこでは、著作権サンプルと大きく異なるように見える偽装を構築するが、それでも遅延拡散モデルを訓練する効果を誘導する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:35:06 GMT)
CondTSF: One-line Plugin of Dataset Condensation for Time Series Forecasting [22.5] データセット凝縮の目的は、合成データセットでトレーニングされたモデルが、完全なデータセットでトレーニングされたモデルと互換性を持って動作できることを保証することである。
分類において、合成データは、全データセットで訓練されたモデルと合成データセットで訓練されたモデルが同じ入力に対して同一のラベルを生成する場合、よく蒸留されると考えられる。
TS予測において, 合成データ蒸留の有効性は, モデル間の距離によって決定される。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:18:20 GMT)
Click Without Compromise: Online Advertising Measurement via Per User Differential Privacy [22.4] 本稿では,広告測定結果のための新しいユーザレベルの差分プライバシー保護スキームであるAds-BPCを紹介する。
Ads-BPCは、広告測定に適用された既存のストリーミングDPメカニズムよりも25%から50%精度が向上する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:31:19 GMT)
I4VGen: Image as Stepping Stone for Text-to-Video Generation [22.4] I4VGenは、トレーニングフリーでプラグアンドプレイのビデオ拡散推論フレームワークである。
堅牢な画像技術を活用することで、テキスト・ビデオ生成を強化する。
I4VGenは、より高いビジュアルリアリズムとテキスト忠実度を持つビデオを生成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:48:44 GMT)
CityLight: A Universal Model Towards Real-world City-scale Traffic Signal Control Coordination [22.3] 交通信号制御(TSC)は、既存の道路インフラに影響を与えることなく、交通効率を高めるための安価な手段である。
都市交通管理にTSCを適用させるため,都市規模高速道路網におけるTSC調整を目標とした。
本稿では,パラメータ共有MAPPOに基づく最適化手法であるCityLightを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:10:14 GMT)
Enhancing Jailbreak Attack Against Large Language Models through Silent Tokens [22.2] 既存のジェイルブレイク攻撃では、人間の専門家か、複雑なアルゴリズムを使ってプロンプトを作らなければならない。
eosトークンのみを活用する単純な攻撃であるBOOSTを導入する。
LLMがジェイルブレイク攻撃に対して脆弱であることが判明し、強力な安全アライメントアプローチの開発が動機となった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:29:48 GMT)
An Archive Can Bring Provable Speed-ups in Multi-Objective Evolutionary Algorithms [22.1] アーカイブを使うことでMOEAのスピードアップを保証できることを示す。
2つの確立されたMOEAに対して、アーカイブを使用することで、期待される実行時間に加速がもたらされることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:59:16 GMT)
ViDiT-Q: Efficient and Accurate Quantization of Diffusion Transformers for Image and Video Generation [22.0] ポストトレーニング量子化(PTQ)は、メモリコストと計算複雑性を低減する効果的な方法である。
既存の拡散量子化手法をU-Netに適用することは品質維持の課題に直面している。
我々は、新しい距離分離型混合精度量子化法(ViDiT-Q-MP)により、ViDiT-Qを改善する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:57:10 GMT)
FaceCom: Towards High-fidelity 3D Facial Shape Completion via Optimization and Inpainting Guidance [21.9] FaceComはメッシュベースの生成ネットワークに基づく3次元顔形状補完手法である。
まず、2405のIDを含む混合3次元顔データセット上で形状生成装置を訓練する。
不完全な顔入力に基づいて、画像の塗装指導下での最適化手法を用いて、完全な顔に適合する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:54:10 GMT)
RAG-based Crowdsourcing Task Decomposition via Masked Contrastive Learning with Prompts [21.7] 本稿では、自然言語理解の観点からタスク分解(TD)をイベント検出として再認識する、検索強化世代ベースのクラウドソーシングフレームワークを提案する。
本稿では,TD (PBCT) のための Prompt-based Contrastive Learning framework を提案する。
実験結果は,教師付きおよびゼロショット検出における本手法の競合性を実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:34:19 GMT)
Effects of Exponential Gaussian Distribution on (Double Sampling) Randomized Smoothing [21.6] 本研究では,2種類の分布がランダム化平滑化と二重サンプリング平滑化に及ぼす影響を包括的に研究した。
我々は,EGGがDSRSよりも厳密な定数因子を付与できることを証明した。
実世界のデータセットに関する我々の実験は、ESGの理論的解析を確認し、RSとDSRSの双方に対して、異なる指数$eta$でほぼ同じ認証を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:41:00 GMT)
mCoT: Multilingual Instruction Tuning for Reasoning Consistency in Language Models [21.6] 大規模言語モデル(LLM)とChain-of-Thought(CoT)は、最近、下流タスクを改善するために推論を誘発する強力なテクニックとして登場した。
オープンソース LLM を用いて,多言語間の多言語推論の整合性について検討する。
言語間の推論能力を向上させるため,多言語CoT命令チューニングを導入し,モデルの整合性を向上させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:30:45 GMT)
Sensitivity-Informed Augmentation for Robust Segmentation [21.6] カメラ品質の変動やレンズ歪みなどの内部ノイズはセグメンテーションモデルの性能に影響を与える可能性がある。
我々は,学習ベースセグメンテーションモデルの堅牢性を高めるために,効率的で適応性があり,勾配のない手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:20:27 GMT)
E-ICL: Enhancing Fine-Grained Emotion Recognition through the Lens of Prototype Theory [21.5] 本稿では,プロトタイプ理論の観点からICLの性能低下の原因を明らかにする。
感情認識のための感情文脈学習法(E-ICL)を提案する。
EDOS, Empathetic-Dialogues, EmpatheticIntent, GoEmotionsの詳細な感情データセット実験により, E-ICLが優れた感情予測性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:59:43 GMT)
Enhancing 2D Representation Learning with a 3D Prior [21.5] 視覚データの堅牢で効果的な表現を学習することは、コンピュータビジョンの基本的な課題である。
従来、これはラベル付きデータによるトレーニングモデルによって達成される。
本稿では,3次元構造を明示的に強制することで,既存の自己管理手法を強化するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:55:22 GMT)
Observable Propagation: Uncovering Feature Vectors in Transformers [21.2] 与えられたタスクを計算する際にトランスフォーマー言語モデルで使用される線形特徴を見つけるために「観測可能な伝搬」(略してObProp)を導入する。
我々のパラダイムは、与えられたタスクに対応する線形汎関数である「観測可能」の概念に焦点を当てている。
我々はObPropを使って、ジェンダー付き職業バイアス、政党予測、プログラミング言語検出など、様々なタスクの質的な調査を行う。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:26:01 GMT)
Understanding Retrieval Robustness for Retrieval-Augmented Image Captioning [21.0] 本研究では,SmallCap検索拡張キャプションモデルのロバスト性を解析した。
より多様な集合から抽出されたキャプションを抽出してモデルを訓練する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:41:54 GMT)
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation [20.9] 空間的整合性を高めるために,多視点にわたって共有ノイズモデリング機構を備えた拡散型長ビデオ生成手法を提案する。
本手法は,最先端の手法に比べて約5倍長くなる一貫性を損なうことなく,最大40フレームの映像を生成することができる。
我々のフレームワークは、認識と予測タスクを超えて、エンド・ツー・エンドの自動運転モデルの計画性能を25%向上させることができます。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:10:20 GMT)
Causal Effect Identification in LiNGAM Models with Latent Confounders [20.8] 線形非ガウス非環モデル (LiNGAM) における因果効果の一般同定可能性について検討した。
観察された変数間の直接因果効果や全因果効果の完全なグラフィカルな特徴付けを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:30:27 GMT)
Maintaining Diversity Provably Helps in Evolutionary Multimodal Optimization [20.6] 解空間における解の多様性を考慮に入れた簡単な方法が進化的アルゴリズム(EA)の探索に有効であることを示す。
提案手法は,クロスオーバーで作業することで探索の促進に寄与し,予測走行時間において,マルチモーダルあるいは指数加速度がもたらされることを実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:52:14 GMT)
Optimal Transport Guided Correlation Assignment for Multimodal Entity Linking [20.6] マルチモーダルエンティティリンクは、マルチモーダルなコンテキストにおける曖昧な言及をマルチモーダルな知識グラフ内のエンティティにリンクすることを目的としている。
既存の手法は、自動的に学習された注意重みに大きく依存して、いくつかの局所的な相関機構を試行する。
本稿では,OT-MELを用いた新しいMELフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:35:25 GMT)
Context Gating in Spiking Neural Networks: Achieving Lifelong Learning through Integration of Local and Global Plasticity [20.6] ヒトは前頭前皮質(PFC)の文脈ゲーティング機構を通じて、最小の相互干渉で連続して複数のタスクを学習する
本研究では,生涯学習のための局所可塑性規則(CG-SNN)によって訓練された文脈ゲーティングを用いたSNNを提案する。
実験により,提案モデルは過去の学習経験を維持する上で有効であり,生涯学習における他の方法よりも優れたタスク選択性を有することが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:35:35 GMT)
Aligning Large Language Models via Fine-grained Supervision [20.4] 事前訓練された大規模言語モデル(LLM)は、一貫性のある記事を生成するのに優れていますが、そのアウトプットは非現実的、有毒、あるいはユーザの期待に沿わないかもしれません。
現在のアプローチは、モデルアライメントを改善するために、人間のフィードバックによる強化学習を使うことに重点を置いている。
トークンレベルの微粒化によるLCMアライメント向上手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:21:45 GMT)
GenS: Generalizable Neural Surface Reconstruction from Multi-View Images [20.2] GenSは、エンドツーエンドの一般化可能なニューラルサーフェス再構成モデルである。
我々の表現はより強力であり、グローバルな滑らかさを維持しながら高周波の詳細を回復することができる。
人気のあるベンチマーク実験により、我々のモデルは新たなシーンにうまく一般化できることが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:13:10 GMT)
Creativity, Generative AI, and Software Development: A Research Agenda [20.2] 本稿では,GenAIがソフトウェア開発において創造性に与える影響を明らかにするために,GenAIがソフトウェア開発をより広範囲に破壊するシナリオと並行して,McLuhanテトラッドを用いる。
個人の能力、チームの能力、製品、意図しない結果、社会、人間的側面にどのように影響するかを考察する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:51:59 GMT)
OODRobustBench: a Benchmark and Large-Scale Analysis of Adversarial Robustness under Distribution Shift [20.1] OODRobustBenchは60.7Kの敵評価を用いて706のロバストモデルを評価するために使用される。
この大規模解析は、敵対的ロバスト性は深刻なOOD一般化問題に苦しむことを示している。
次に、既存の手法が高いOODロバスト性を達成できないことを予測し、検証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:01:05 GMT)
ARL2: Aligning Retrievers for Black-box Large Language Models via Self-guided Adaptive Relevance Labeling [20.0] ARL2は、大規模な言語モデルをラベル付けとして活用するレトリバー学習技術である。
ARL2は適応的な自己学習戦略を用いて、高品質で多様な関連データをキュレートする。
実験はARL2の有効性を示し、NQでは5.4%、MMLUでは4.6%の精度向上を実現した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:17:24 GMT)
State-Constrained Zero-Sum Differential Games with One-Sided Information [20.0] 状態制約と一方的な情報を持つゼロサム差分ゲームについて検討する。
我々の貢献は、状態制約のあるゲームの拡張であり、行動戦略の計算に必要な原始的および双対的準力学原理の導出である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:26:30 GMT)
Latent Logic Tree Extraction for Event Sequence Explanation from LLMs [19.9] 医療やロボティクスなどの現代のハイテイクシステムは、しばしば巨大なストリーミングイベントシーケンスを生成する。
我々のゴールは、Large Language Models (LLMs) から論理木に基づく説明を引き出すための効率的なプラグイン・アンド・プレイツールを設計し、観測された各イベントシーケンスに対するカスタマイズされた洞察を提供することです。
オンライン設定では、ローカルに構築された軽量なモデルが、数回だけ繰り返して、各シーケンスのLSMから最も関連性の高いルールを反復的に抽出します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:09:03 GMT)
Multimodal Reasoning with Multimodal Knowledge Graph [19.9] 大規模言語モデル(LLM)を用いたマルチモーダル推論は、幻覚や、不十分な知識や時代遅れな知識の存在に悩まされることが多い。
マルチモーダル知識グラフを用いたマルチモーダル推論(MR-MKG)手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:13:23 GMT)
Neural Thermodynamic Integration: Free Energies from Energy-based Diffusion Models [19.9] 熱力学積分(TI)は、自由エネルギー差を推定するための厳密な方法を提供する。
本稿では、トレーニング可能なニューラルネットワークで表されるアルケミカル経路に沿ってTIを実行することを提案する。
すべての中間アンサンブルをサンプリングするエネルギーベース拡散モデルの能力により、単一の参照計算からTIを実行することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:42:42 GMT)
Conditional Language Learning with Context [19.7] 本研究では、条件ファインタニングと呼ばれる因果言語モデリングの簡易な修正を提案する。
我々は、あるコンテキストが特定のコーパス統計を「説明」し、モデルがそれらを学ぶのを避けることができることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:22:24 GMT)
Environment-induced Transitions in Many-body Quantum Teleportation [19.6] 環境下での多体量子テレポーテーションについて検討する。
量子状態においては、テレポーテーションは古典的よりも優れ、古典的状態では古典的なチャネルに置き換えられる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:51:23 GMT)
MoLA: Motion Generation and Editing with Latent Diffusion Enhanced by Adversarial Training [19.6] 高速かつ高品質なモーション生成を実現し,複数の編集タスクをひとつのフレームワークで処理可能なMoLAを提案する。
高品質かつ高速な生成には,変分オートエンコーダと潜時拡散モデルを用い,対向訓練による性能向上を図る。
本研究では,テキスト・ツー・モーション生成における対人学習の有効性を定量的に示すとともに,動作領域における複数の編集タスクに対する編集フレームワークの適用性を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:38:44 GMT)
One-Shot Federated Learning with Bayesian Pseudocoresets [19.5] 分散関数空間推論はベイズ擬似コア集合の学習と密接に関連していることを示す。
提案手法は,最先端技術と競合する予測性能を実現するとともに,最大2桁の通信コストの大幅な削減を図っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:14:39 GMT)
V-Express: Conditional Dropout for Progressive Training of Portrait Video Generation [19.4] V-Expressは、プログレッシブトレーニングと条件付きドロップアウト操作を通じて異なる制御信号のバランスをとる単純な方法である。
本手法は,音声によって制御された肖像画を効果的に生成することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:32:52 GMT)
Velocity Scanning Tomography for Room-Temperature Quantum Simulation [19.2] 本研究では,異なる速度の原子の応答を識別するための速度走査トモグラフィー手法を発明し,検証した。
吸収スペクトルと特定の速度で移動する原子とを比べることで、SLのワニエ・スターク・はしごを導出することができる。
我々は,ラダー周波数シフトを原子速度の関数として監視することにより,SLのザック位相を抽出する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:08:30 GMT)
Towards Practical Non-Adversarial Distribution Matching [19.2] 分布マッチングは、フェアネスとロバストネスの応用で不変表現を学ぶのに使うことができる。
ほとんどの先行研究は敵のマッチング手法を頼りにしているが、結果として生じるミニマックス問題は不安定で最適化が難しい。
本稿では,任意のモデルパイプラインに適用可能な,非逆VAEベースのマッチング手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:00:47 GMT)
SMCL: Saliency Masked Contrastive Learning for Long-tailed Recognition [19.2] 本稿では,偏見予測の問題を緩和するために,相反学習を隠蔽するサリエンシを提案する。
我々のキーとなる考え方は、画像の重要な部分を塩分濃度検出を用いてマスキングし、対照的な学習を用いて、マスクされた画像を特徴空間の小さなクラスへ移動させることである。
実験結果から,提案手法は,ベンチマーク長尾データセット上での最先端性能を実現することが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:33:40 GMT)
ST-DPGAN: A Privacy-preserving Framework for Spatiotemporal Data Generation [19.2] プライバシー保護データを生成するグラフモデルを提案する。
3つの実時間データセットを用いて実験を行い,本モデルの有効性を検証した。
生成されたデータに基づいてトレーニングされた予測モデルは、元のデータでトレーニングされたモデルと比較して、競争力のあるエッジを維持している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:43:54 GMT)
Wukong: Towards a Scaling Law for Large-Scale Recommendation [19.2] スケーリング法則はモデル品質の持続的な改善に重要な役割を果たしている。
現在までの勧告モデルは、大きな言語モデルの領域で見られるような法則を示さない。
本稿では,階層化された因子化マシンをベースとした効率的なネットワークアーキテクチャと,Wukongと呼ばれる相乗的アップスケーリング戦略を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:29:24 GMT)
Private Stochastic Convex Optimization with Heavy Tails: Near-Optimality from Simple Reductions [19.0] 重み付き勾配を持つ差分プライベート凸最適化(DP-SCO)の問題を考察し、一様境界ではなく、サンプル関数のリプシッツ定数上の$ktextth$-momentを仮定する。
Gcdot frac 1 sqrt n + G_k cdot (fracsqrt dnepsilon) 1 の誤差を達成し、重み付け設定における第1次最適率(対数係数まで)を得るための新しい還元ベースのアプローチを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:26:29 GMT)
SpecExec: Massively Parallel Speculative Decoding for Interactive LLM Inference on Consumer Devices [18.8] SpecExecは単純な並列デコード方式で、LLMファミリ向けのターゲットモデルイテレーション毎に最大20個のトークンを生成することができる。
我々は,RAMオフロードが4~6トークン/秒,量子化が4ビット,あるいは16ビット重みが2~3トークン/秒の一般GPU上で50B以上のパラメータLLMを推定した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:53:36 GMT)
Long Range Propagation on Continuous-Time Dynamic Graphs [18.6] Continuous-Time Graph Anti-Symmetric Network (CTAN) は情報伝達の効率化を目的としている。
合成長範囲ベンチマークと実世界のベンチマークにおけるCTANの実証的性能は他の方法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:42:19 GMT)
Replicability in High Dimensional Statistics [18.5] 本稿では,いくつかの基本的高次元統計課題に対する再現性の計算的および統計的コストについて検討する。
我々の主な貢献は、最適なレプリカブルアルゴリズムと高次元等尺波の計算的および統計的等価性を確立することである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:06:42 GMT)
HoneyGPT: Breaking the Trilemma in Terminal Honeypots with Large Language Model [18.5] ハニーポットは柔軟性、相互作用の深さ、騙しの能力のバランスをとるのに苦労する。
本稿では,ChatGPTをベースとしたハニーポットアーキテクチャであるHoneyGPTを紹介する。
本稿では、長期のインタラクションメモリと堅牢なセキュリティ分析を増強する構造化プロンプトエンジニアリングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:31:20 GMT)
Feature Attribution with Necessity and Sufficiency via Dual-stage Perturbation Test for Causal Explanation [18.5] FANS(Feature Attribution with Necessity and Sufficiency)を紹介する。
FANSは、この地区内の摂動サンプルが必要かつ十分(PNS)である確率が高く、予測の変化を引き起こすような入力の近傍を見つける。
FANSは6つのベンチマークで既存の属性法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:15:01 GMT)
Stein Random Feature Regression [18.5] スタインランダム特徴(SRF)は、高品質なRFFサンプルを生成し、非分析スペクトル測定後部を柔軟に近似するために用いられる。
SRFは、カーネル近似とベイズカーネル学習の両方を実行するために、ログ確率勾配の評価のみを必要とする。
カーネル近似とよく知られたGP回帰問題に基づくベースラインと比較することにより、SRFの有効性を実証的に検証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:57:19 GMT)
FedMKT: Federated Mutual Knowledge Transfer for Large and Small Language Models [18.4] FedMKTは、大小の言語モデルのためのパラメータ効率の良い相互知識伝達フレームワークである。
サーバのLLMからクライアントのSLMへ知識を適応的に転送し、同時にクライアントのユニークなドメイン洞察でLLMを豊かにするように設計されている。
NLPテキスト生成タスクにおける各種公共LLMおよびSLMを用いたFedMKTの有効性を評価する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:36:09 GMT)
Tolerant Algorithms for Learning with Arbitrary Covariate Shift [18.4] 学習者は,ある分布からラベル付き集合を学習するが,異なる,潜在的に逆向きに生成されたテスト分布で評価する。
我々は,PQ学習 (Goldwasser, A. Kalai, Y. Kalai, Montasser NeurIPS 2020) とTDS学習 (Klivans, Stavropoulos, Vasilyan COLT 2024) の2つのフレームワークに注目した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:50:05 GMT)
DiarizationLM: Speaker Diarization Post-Processing with Large Language Models [18.3] DiarizationLMは、大きな言語モデル(LLM)を利用して話者ダイアリゼーションシステムから出力を後処理するフレームワークである。
このフレームワークは、市販のASRや話者ダイアリゼーションシステムにも容易に適用できる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:08:15 GMT)
On the Limitations of Fractal Dimension as a Measure of Generalization [18.3] フラクタル次元は、低初期化から訓練されたモデルの一般化を予測できないことを示す。
また、学習理論における最も単純な複雑性測度の一つである最終パラメータのell2$ノルムが、これらのフラクタル次元の概念よりも一般化ギャップと強く相関していることも示している。
この研究は、フラクタル幾何学、トポロジカルデータ分析、ニューラルネットワーク最適化の間の因果関係のより深い研究の基盤となる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:56:19 GMT)
Dr. Strategy: Model-Based Generalist Agents with Strategic Dreaming [18.2] 本稿では,新しいドリーム戦略を備えたモデルベース強化学習エージェントDr. Strategyを提案する。
提案するエージェントは,ドリームにおける配当型戦略のバージョンを実現する。
実験により,提案手法は様々な視覚的かつ部分的に観察可能なナビゲーションタスクにおいて,画素ベースのMBRL法よりも優れた性能を示すことが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:26:15 GMT)
MeshVPR: Citywide Visual Place Recognition Using 3D Meshes [18.2] メッシュベースのシーン表現は、大規模な階層的な視覚的ローカライゼーションパイプラインを簡素化するための有望な方向を提供する。
既存の研究は、視覚的ローカライゼーションのためのメッシュの実現可能性を示しているが、視覚的位置認識においてそれらから生成された合成データベースを使用することによる影響は、明らかにされていない。
実世界のドメインと合成ドメインのギャップを埋めるために、軽量な特徴アライメントフレームワークを利用する新しいVPRパイプラインであるMeshVPRを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:45:53 GMT)
Break the Chain: Large Language Models Can be Shortcut Reasoners [18.0] CoT(Chain-of-Thought)推論は複雑なモジュールを利用するが、高いトークン消費、適用可能性の制限、思考上の課題によって妨げられる。
本稿では、複雑な論理的および常識的推論タスクを含む算術を超えて、CoTプロンプトの批判的評価を行う。
そこで我々は,「チェーンを破る」戦略を通じて,人型やショートカットを言語モデル(LM)に統合することを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:02:53 GMT)
Contextual Optimization under Covariate Shift: A Robust Approach by Intersecting Wasserstein Balls [18.0] 2つのワッサーシュタイン球の交叉によって設定されたあいまいさを利用する分布的ロバストなアプローチを提案する。
提案したモデルの強烈な経験的性能を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:46:41 GMT)
Machine learning framework for predicting the entangling capability of parameterized quantum circuits [18.0] 変分量子アルゴリズム(VQA)は有望な解であるが、その性能はパラメータ化量子回路(PQC)に大きく依存している。
PQCsの絡み合いはPQCsを構築する上で重要な指標である。
本稿では,長期記憶(LSTM)モデルとゲート符号化技術を用いて,PQCの絡み合う能力を予測する機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:28:05 GMT)
SSNet: A Lightweight Multi-Party Computation Scheme for Practical Privacy-Preserving Machine Learning Service in the Cloud [18.0] MPCベースのMLフレームワークのバックボーンとして,Shamirの秘密共有(SSS)を初めて採用したSSNetを提案する。
SSNetは、パーティ番号を簡単にスケールアップする機能を示し、計算の正しさを認証するための戦略を組み込む。
当社は,Amazon AWSによる商用クラウドコンピューティングインフラストラクチャに関する総合的な実験的評価を実施している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:55:06 GMT)
Discrete Multimodal Transformers with a Pretrained Large Language Model for Mixed-Supervision Speech Processing [17.9] DMLM(Decoder-only Discrete Multimodal Language Model)を提案する。
DMLMは、複数のタスク(ASR、T2S、S2TTなど)とモダリティ(テキスト、音声、ビジョン)に柔軟に適用できる。
その結果,DMLMは複数のタスクやデータセットにまたがって,教師なしと教師なしのトレーニングの組み合わせによって大きなメリットがあることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:08:25 GMT)
Learning to Edit Visual Programs with Self-Supervision [17.9] 視覚プログラムの編集方法を学ぶシステムを設計する。
編集ネットワークは、完全な入力プログラムと視覚的ターゲットを消費する。
入力プログラムに適用可能なローカル編集操作の予測をネットワーク上で行うことで,ターゲットとの類似性を向上する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:59:38 GMT)
Promotional Language and the Adoption of Innovative Ideas in Science [17.8] 我々は、科学振興言語に焦点をあてて、承認申請の成功のセマンティック分析を行う。
我々は、プロモーション言語と、資金提供者と他の科学者による革新的なアイデアの支持と採用との間に、堅牢な関連性を見出した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:54:36 GMT)
ReLUs Are Sufficient for Learning Implicit Neural Representations [17.8] 暗黙的神経表現学習におけるReLUアクティベーション関数の使用について再考する。
2次B-スプラインウェーブレットにインスパイアされ、ディープニューラルネットワーク(DNN)の各層にReLUニューロンに一連の簡単な制約を組み込む。
我々は、一般的な信念とは対照的に、ReLUニューロンのみからなるDNNに基づいて最先端のINRを学習できることを実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:51:08 GMT)
RefuteBench: Evaluating Refuting Instruction-Following for Large Language Models [17.8] 本稿では,質問応答,機械翻訳,電子メール作成などのタスクをカバーするベンチマークRefuteBenchを提案する。
評価の目的は、モデルが反響命令の形で肯定的にフィードバックを受けられるか、会話を通してユーザー要求に一貫して従えられるかを評価することである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:48:51 GMT)
On The Statistical Representation Properties Of The Perturb-Softmax And The Perturb-Argmax Probability Distributions [17.7] Gumbel-Softmax と Gumbel-Argmax の確率分布は、識別学習における離散構造学習に有用である。
これらの確率モデルの最適化に費やした努力にもかかわらず、それらの統計的性質は未探索である。
それらの表現特性について検討し、これらの確率分布が完成するパラメータの族を決定する。
これらの仮定を満たすパラメータの集合を2つ同定することで解析を終了し、完全かつ最小限の表現を許容する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:22:12 GMT)
Deep Stochastic Mechanics [17.6] 本稿では,時間発展するシュリンガー方程式の数値シミュレーションのための,ディープラーニングに基づく新しい手法を提案する。
本手法により,マルコフ拡散からサンプリングすることで,波動関数の潜時低次元構造に適応することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:30:51 GMT)
RoutePlacer: An End-to-End Routability-Aware Placer with Graph Neural Network [17.6] この研究は、エンドツーエンドのroutability-aware配置手法であるRoutePlacerを導入している。
カスタマイズされたグラフニューラルネットワークであるRouteGNNをトレーニングして、ルタビリティを効率的かつ正確に予測する。
オープンソースのAI4EDAプラットフォームであるDREAMPlaceの実験は、RoutePlacerがトータルオーバーフローを最大16%削減できることを示している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:39:41 GMT)
Demystifying the Compression of Mixture-of-Experts Through a Unified Framework [17.4] エキスパートの混合(MoE)アプローチは、専門家のサブセットのみを動的に選択し、活性化する。
MoEは潜在的な冗長性(パラメータなど)と余分なコスト(通信オーバーヘッドなど)を導入している。
まずこのギャップを,主流圧縮メソッドをシームレスに統合するだけでなく,MoE圧縮を体系的に理解する上でも有効である,最先端の統一フレームワークで埋める。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:18:40 GMT)
Measuring Bargaining Abilities of LLMs: A Benchmark and A Buyer-Enhancement Method [17.4] 本稿では,Bargainingタスクを非対称な不完全情報ゲームとして記述する。
これにより、Bargainタスクにおけるエージェントのパフォーマンスを定量的に評価することができます。
本稿では,OG-Narratorと呼ばれる新手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:12:04 GMT)
On the Robustness of LDP Protocols for Numerical Attributes under Data Poisoning Attacks [17.4] ローカルディファレンシャルプライバシ(LDP)プロトコルは、データ中毒攻撃に対して脆弱である。
この脆弱性は、敵対的環境におけるLDPの堅牢性と信頼性に関する懸念を引き起こす。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:30:36 GMT)
Quantum Computing in Intelligent Transportation Systems: A Survey [17.3] 本研究は,量子コンピューティングとインテリジェントトランスポートシステムの急成長する交差点に焦点をあてる。
本調査は,現在の研究成果,課題,今後の方向性を検証し,量子コンピューティングが輸送の未来に与える影響について概観する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:37:28 GMT)
Process-Driven Autoformalization in Lean 4 [17.2] 大規模言語モデルの自己形式化能力を評価するためのベンチマークを開発する。
また、Lean 4コンパイラからの正確なフィードバックを利用して自動形式化を強化するモデルも導入しています。
実験の結果,PSV法ではオートフォーマライゼーションが向上し,フィルタの少ないトレーニングデータによる精度が向上した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:48:08 GMT)
Cyclic Sparse Training: Is it Enough? [17.0] そこで本研究では,任意のスパースマスクの繰り返しサイクルトレーニングと,パラメータとマスクをペアリングする単一プルーニングステップを提案する。
これは、計算コストの削減により、高疎性状態における最先端の反復的プルーニング手法の性能に匹敵する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:40:27 GMT)
Keyword-Guided Adaptation of Automatic Speech Recognition [17.0] 本稿では,Whisper ベースモデルを用いた文脈バイアスによる単語認識の改良手法を提案する。
本稿では,Whisperエンコーダ表現を利用したキーワードスポッティングモデルを用いて,書き起こし処理中にデコーダを誘導するプロンプトを動的に生成する。
その結果,特定のキーワードの認識精度が向上し,全体的な単語誤り率の低減が図られた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:20:38 GMT)
Whistle: Data-Efficient Multilingual and Crosslingual Speech Recognition via Weakly Phonetic Supervision [17.0] 本稿では,データ効率のよい自動音声認識(MCLASR)に対する音声指導の弱い事前学習のアプローチについて検討する。
我々は,LanguageNet grapheme-to-phoneme(G2P)モデルを活用して,ゴールドスタンダードな人間検証音声書き起こしの要求を緩和し,国際音声アルファベット(IPA)に基づく書き起こしを得る。
MCL-ASRにおける音素モデルの有効性を示す実験では, 未知言語に対する音声認識, 数ショットのデータ量の違いによる言語間のクロスリンガル性能, 破滅的な忘れ込み, 訓練効率を克服した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:56:05 GMT)
The complexity of approximate (coarse) correlated equilibrium for incomplete information games [17.0] 不完全情報ゲームにおける近似平衡の分散学習の複雑さについて検討する。
我々の下限は、$epsilon$-approximate $mathitco$ correlation equilibriumというより簡単な解の概念にも当てはまる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:35:27 GMT)
Proof-of-Learning with Incentive Security [16.9] ほとんどの並行ブロックチェーンシステムは、分散コンセンサスとセキュリティ保証のためのProof-of-Work(PoW)あるいはProof-of-Stake(PoS)メカニズムに大きく依存しています。
計算効率,証明可能なインセンティブ-セキュリティ保証,制御容易な難易度を備えたPoL機構を設計する上で,既成の難しさを回避し,合理的なプローバーに率直に行動を促すインセンティブ-セキュリティの概念を導入する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:34:30 GMT)
An Open-Source Tool for Mapping War Destruction at Scale in Ukraine using Sentinel-1 Time Series [16.9] 本研究では、戦争による建物被害を推定するためのスケーラブルで伝達可能な手法を提案する。
まず、SAR(Synthetic Aperture Radar)衛星画像時系列から画素単位の破壊確率を出力する機械学習モデルを訓練する。
次に、オープン・ビル・フットプリントを用いて、これらの評価を後処理し、建物ごとの最終的な損傷推定値を得る。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:24:19 GMT)
FourierKAN-GCF: Fourier Kolmogorov-Arnold Network -- An Effective and Efficient Feature Transformation for Graph Collaborative Filtering [16.9] 本稿では,FourierKAN-GCFと呼ばれる簡易かつ効果的なグラフベースレコメンデーションモデルを提案する。
我々は、モデルの表現力と堅牢性を改善するために、メッセージドロップアウトとノードドロップアウト戦略を採用しています。
論文参考訳(メタデータ) (Tue, 04 Jun 2024 06:10:11 GMT)
SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution [16.8] 生成した実世界の画像の超解像のセマンティックな忠実さをよりよく保存するためのセマンティックス・アウェア・アプローチを提案する。
まず, 高精度なソフト・ハード・セマンティック・プロンプトを高い劣化下でも生成できる劣化対応プロンプト抽出器を訓練する。
実験により,本手法はよりリアルな画像の詳細を再現し,セマンティクスをよりよく保持できることが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:30:58 GMT)
Differentially private exact recovery for stochastic block models [16.8] ネットワークがプライベートな場合のブロックモデル(SBM)の回復可能性問題について検討する。
我々のプライベートアルゴリズムは、入力グラフのサイズに対して時間w.r.t.を実行し、非プライベート設定の回復しきい値と一致する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:38:05 GMT)
Mamba as Decision Maker: Exploring Multi-scale Sequence Modeling in Offline Reinforcement Learning [16.7] 我々はMamba Decision Maker (MambaDM) という新しいアクション予測手法を提案する。
MambaDMは、マルチスケール依存関係の効率的なモデリングのため、シーケンスモデリングのパラダイムの有望な代替品として期待されている。
本稿では,RL領域におけるMambaDMのシーケンスモデリング機能について述べる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:49:18 GMT)
$\texttt{ACCORD}$: Closing the Commonsense Measurability Gap [16.6] $texttACCORD$は、大きな言語モデルの常識的な基礎化と推論能力を切り離すためのフレームワークである。
$texttACCORD$は任意の推論複雑性のベンチマークを自動的に生成できる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:08:24 GMT)
PETRA: Parallel End-to-end Training with Reversible Architectures [16.5] 可逆的アーキテクチャは、可逆的でないアーキテクチャと同等に動作できることが示されている。
本稿では,並列化勾配計算のためのバックプロパゲーションの代替となるPETRAを紹介する。
CIFAR-10, ImageNet32, ImageNet上で, PETRAのためのカスタムオートグレードライクなトレーニングフレームワークを開発し, その効果を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:35:23 GMT)
Audio Mamba: Selective State Spaces for Self-Supervised Audio Representations [16.3] 本研究は,汎用音声表現学習のための選択状態空間モデルであるAudio Mambaを提案する。
10種類の多様なオーディオ認識ダウンストリームタスクに対する実験結果から、提案したモデルは、同等の自己教師型オーディオスペクトログラム変換器のベースラインを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:19:14 GMT)
Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model [16.2] 本稿では,高度な自然言語処理技術を活用したマテリアル知識グラフ(MKG)を紹介する。
MKGは、情報を名前、フォーミュラ、アプリケーションなどの包括的なラベルに分類する。
ネットワークベースのアルゴリズムを実装することで、MKGは効率的なリンク予測を容易にするだけでなく、従来の実験手法への依存を著しく低減する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:04:05 GMT)
Improving Group Robustness on Spurious Correlation Requires Preciser Group Inference [15.9] 標準経験的リスク(ERM)モデルは、スプリアス特徴と真のラベルの間の学習の急激な相関を優先し、これらの相関が持たないグループでは精度が低下する可能性がある。
GICは,グループラベルを正確に推測する手法であり,グループ性能が向上する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:25:52 GMT)
Differentially Private Decentralized Learning with Random Walks [15.9] ランダムウォークアルゴリズムを用いて分散学習のプライバシー保証を特徴付ける。そこでは、あるノードから別のノードへ通信グラフのエッジに沿って移動することで、モデルを更新する。
その結果、ランダムウォークアルゴリズムは、互いに近接するノードに対するゴシップアルゴリズムよりも、より優れたプライバシ保証をもたらす傾向があることが明らかとなった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:46:22 GMT)
Dynamic Incremental Optimization for Best Subset Selection [15.8] 最良のサブセット選択は、多くの学習問題に対する金の標準と見なされている。
主問題構造と双対問題構造に基づいて,効率的な部分集合双対アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:57:16 GMT)
Improved Convergence of Score-Based Diffusion Models via Prediction-Correction [15.8] スコアベース生成モデル(SGM)は、複雑なデータ分布からサンプリングする強力なツールである。
本稿では,一般的な予測器・相関器方式のバージョンを考慮し,この問題に対処する。
まず、不正確なランゲヴィン力学を用いて最終分布を推定し、次にその過程を逆転する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:24:50 GMT)
Label-wise Aleatoric and Epistemic Uncertainty Quantification [15.6] 本稿では,不確実性尺度のラベルワイズ分解に基づく分類タスクにおける不確実性定量化手法を提案する。
提案手法は,いくつかの望ましい特性に則っていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:33:23 GMT)
CheckEmbed: Effective Verification of LLM Solutions to Open-Ended Tasks [15.6] 大きな言語モデル(LLM)は様々なドメインに革命をもたらしていますが、その答えを検証することは大きな課題です。
本研究では,精度が高く,スケーラブルで,シンプルなLCM検証手法であるCheckEmbedを提案する。
CheckEmbedは、GPT Text Embedding Largeのようなモデルで得られた回答レベルの埋め込みを比較。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:42:21 GMT)
System-Aware Neural ODE Processes for Few-Shot Bayesian Optimization [15.6] 本稿では,システムの事前情報に基づくベイズ最適化フレームワークについて紹介する。
数発のBOに対するSANODEPの可能性を示す広範囲な実験を行った。
また、SANODEPの様々な事前情報への適応性についても検討し、事前の柔軟性とモデルの適合精度のトレードオフを強調した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:28:36 GMT)
Can Dense Connectivity Benefit Outlier Detection? An Odyssey with NAS [15.4] 我々は、外乱検出器のDense Connectivity Search(DCSOD)という新しいパラダイムを提案する。
ニューラルアーキテクチャサーチ(NAS)を用いた近OOD検出タスクにおけるCNNアーキテクチャの密結合性の自動探索
我々は,広く使用されているアーキテクチャや以前のNASベースラインに対して,DCSODが優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:19:32 GMT)
Learning Image Priors through Patch-based Diffusion Models for Solving Inverse Problems [15.3] 拡散モデルは、基礎となるデータ分布から強力な画像前処理を学習し、それを使って逆問題を解決することができるが、トレーニングプロセスは計算コストが高く、大量のデータを必要とする。
本稿では,画像のパッチのみに基づく拡散モデルのトレーニングにより,画像全体に対する効率的なデータ学習手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:30:37 GMT)
Precise asymptotics of reweighted least-squares algorithms for linear diagonal networks [15.1] 我々は、IRLS、最近提案されたリンリン-RFMアルゴリズム、交互対角ニューラルネットワークを含むアルゴリズム群を統一的に分析する。
適切に選択された再重み付けポリシーにより、少数のスパース構造が良好な性能が得られることを示す。
また、これを再重み付け方式で活用することで、座標ワイド再重み付けよりもテスト誤差が良好に向上することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:37:17 GMT)
On the Semantic Latent Space of Diffusion-Based Text-to-Speech Models [15.1] DDMデノイザの遅延ボトルネックアクティベーションからなる冷凍TSモデルの潜時空間について検討する。
この空間には豊富な意味情報が含まれており、教師なしと教師なしの両方で、その内部の意味的方向を見つけるための新しい方法をいくつか紹介する。
これにより、さらなるトレーニング、アーキテクチャの変更、データ要求なしに、オフザシェルフオーディオ編集が可能になることを実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:03:57 GMT)
Efficient Detection of LLM-generated Texts with a Bayesian Surrogate Model [15.0] 本稿では,特に大規模言語モデル(LLM)から機械生成テキストを検出する新しい手法を提案する。
ベイジアンサロゲートモデルを用いて、ベイジアン不確実性に基づいて典型的なサンプルを選択し、典型的なサンプルから他のサンプルへのスコアを補間し、クエリ効率を向上させる。
実験の結果,提案手法はクエリコストの低い既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:05:48 GMT)
SVASTIN: Sparse Video Adversarial Attack via Spatio-Temporal Invertible Neural Networks [14.9] 既存の敵攻撃法は、主に勾配に基づくアプローチを採り、目立った摂動を伴う敵映像を生成する。
本稿では,S-Brittany Invertible Neural Networks (VASTIN) を介し,非知覚的特徴空間情報交換による対角的映像生成のための新しいスパース・アタックを提案する。
UCF-101 と Kinetics-400 に関する実験により,提案したSVASTIN は,非知覚性の高い対人的例を,より高い騙し率を持つ最先端の手法よりも生成できることが実証された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:58:32 GMT)
A Bayesian Approach to Online Planning [14.8] モンテカルロの木探索とニューラルネットワークの組み合わせは、オンライン計画に革命をもたらした。
ネットワークのアウトプットに関する不確実性推定が計画の改善に有効かどうかを問う。
このような不確実な定量化を促進するためのベイズ計画手法を開発し、メタ推論文学から古典的な考え方に着想を得た。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:33:17 GMT)
Unsupervised Few-Shot Continual Learning for Remote Sensing Image Scene Classification [14.8] リモートセンシング画像シーン分類における教師なし数ショット連続学習のためのunsupervised flat-wide learning approach (UNISA)
リモートセンシング画像シーンデータセットとハイパースペクトルデータセットを用いた数値解析により,提案手法の利点が確認された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:06:41 GMT)
Dealing with All-stage Missing Modality: Towards A Universal Model with Robust Reconstruction and Personalization [14.6] 現在のアプローチでは、推論中にモダリティ不完全入力を処理するモデルの開発に重点を置いている。
本稿では、モダリティ再構成とモデルパーソナライゼーションを備えた頑健な普遍モデルを提案する。
本手法は2つの脳腫瘍セグメンテーションベンチマークで広範囲に検証されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:07:24 GMT)
Sparse and Structured Hopfield Networks [14.4] 我々は、Fenchel-Young損失とリンクを確立することにより、疎ホップフィールドネットワークのための統一的なフレームワークを提供する。
損失マージン,疎度,正確なメモリ検索の関連を明らかにする。
複数のインスタンス学習とテキスト合理化の実験は、我々のアプローチの有用性を実証している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:04:40 GMT)
Generating Query Recommendations via LLMs [14.3] GQR(Generative Query Recommendation)と呼ばれる新しい手法を提案する。
GQRはLLMを基礎として使用しており、クエリレコメンデーション問題に対処するためにトレーニングや微調整を必要としない。
我々はRetriever-Augmented GQR(RA-GQR)と呼ばれるクエリログを利用するバージョンを提案する。
論文参考訳(メタデータ) (Tue, 04 Jun 2024 07:45:06 GMT)
AROMA: Preserving Spatial Structure for Latent PDE Modeling with Local Neural Fields [14.2] 本稿では、局所的なニューラルネットワークを用いた偏微分方程式(PDE)のモデリングを強化するためのフレームワークであるAROMAを提案する。
我々のフレキシブルエンコーダ・デコーダアーキテクチャは、様々なデータタイプから空間物理場のスムーズな遅延表現を得ることができる。
拡散型定式化を用いることで、従来のMSEトレーニングと比較して安定性が向上し、ロールアウトが長くなる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:12:09 GMT)
Harnessing the Power of Neural Operators with Automatically Encoded Conservation Laws [14.2] 保存法で符号化されたニューラル演算子(ClawNOs)を紹介する。
ClawNOsは、物理的整合性に不可欠な最も基本的でユビキタスな保存法に準拠している。
それらは、特に小規模データ体制において、学習効率において最先端のNOを著しく上回っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:43:59 GMT)
Unsupervised Contrastive Analysis for Salient Pattern Detection using Conditional Diffusion Models [14.0] コントラスト分析(CA)は、背景(BG)データセットとターゲット(TG)データセット(不健康な被験者)を区別できる画像内のパターンを識別することを目的としている。
この話題に関する最近の研究は、BGサンプルからTGサンプルを分離するパターンを教師付きで学習するために、変分オートエンコーダ(VAE)や対照的な学習戦略に依存している。
自己教師付きコントラストエンコーダを用いて、入力画像から共通パターンのみを符号化する潜時表現を学習し、トレーニング中にBGデータセットからのみサンプルを用いて学習し、データ拡張技術を用いて対象パターンの分布を近似する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:53:24 GMT)
In value-based deep reinforcement learning, a pruned network is a good network [13.8] 段階的等級プルーニングにより,パラメータの有効性を最大化できることを示す。
この結果、従来のネットワークよりも劇的なパフォーマンス向上をもたらすネットワークが生まれる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:42:06 GMT)
Improving Hateful Meme Detection through Retrieval-Guided Contrastive Learning [13.7] 本稿では,検索誘導型コントラスト学習により,ヘイトフルネスを考慮した埋め込み空間を構築することを提案する。
提案手法は,87.0のAUROCでHatefulMemesデータセット上での最先端性能を実現し,より大規模なマルチモーダルモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:06:36 GMT)
Looks Too Good To Be True: An Information-Theoretic Analysis of Hallucinations in Generative Restoration Models [13.6] 生成モデルは、しばしば実際のデータと視覚的に区別できない結果を生み出すことができる。
生成モデルは幻覚を生成する - 地上の真実のイメージには存在しない現実的な外観の細部。
完全な知覚品質を達成するには、少なくともこの不確実性が2倍必要であることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:53:44 GMT)
Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models [13.5] 利用可能な最大規模でトレーニングされた最先端モデルの機能と推論能力の劇的な破壊を実演する。
モデルは間違った解に強い自信を表現し、しばしば非感覚的な「推論」のような説明を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:43:33 GMT)
Solving Partial Differential Equations in Different Domains by Operator Learning method Based on Boundary Integral Equations [13.5] 本稿では、任意の領域における偏微分方程式(PDE)の解を、再学習を必要とせずに導出できる演算子学習モデルについて検討する。
境界積分方程式(BIE)に根ざした2つの革新的なモデルを導入する。
一度完全にトレーニングされると、これらのBIEベースのモデルは、追加のトレーニングを必要とせずに、任意のドメインにおけるPDEのソリューションを積極的に予測する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:19:06 GMT)
Quality Diversity through Human Feedback: Towards Open-Ended Diversity-Driven Optimization [13.4] 本稿では,ヒトフィードバックによる品質の多様性(QDHF)について紹介する。
実証的な研究によると、QDHFは自動多様性発見において最先端の手法を著しく上回っている。
オープンな生成タスクにおいて、QDHFは拡散モデルからテキストから画像への生成の多様性を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:39:33 GMT)
IterMask2: Iterative Unsupervised Anomaly Segmentation via Spatial and Frequency Masking for Brain Lesions in MRI [13.4] 病理セグメント化に対する教師なし異常セグメンテーションアプローチは、正常な被験者の画像に基づいてモデルを訓練し、「正常な」データ分布と定義する。
本稿では,この問題を緩和するために,空間マスク修復戦略のイタマスク2を提案する。
いくつかの脳病変データセットの実験を行い,本手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:39:49 GMT)
The current status of large language models in summarizing radiology report impressions [13.4] 大きな言語モデル(LLMs)が放射線学レポートの印象を要約する効果は、まだ不明である。
北京大学医学部附属病院からCT,PET-CT,超音波の3種類の放射線学報告を収集した。
本報告では,ゼロショット,ワンショット,3ショットのプロンプトを完全な実例で構築し,インプレッションを生成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:23:30 GMT)
Diver: Large Language Model Decoding with Span-Level Mutual Information Verification [13.4] Diverは、スパンレベルのPMI検証を通じてLLMデコーディングを強化する新しいアプローチである。
提案手法を様々な下流タスクで評価し,Diverが既存のデコード手法を性能と汎用性の両方で著しく上回っていることを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:02:22 GMT)
Reinforcement Tuning for Detecting Stances and Debunking Rumors Jointly with Large Language Models [13.4] 大型言語モデル(LLMs)は、JSDRVと呼ばれる共同姿勢検出(SD)および噂検証(RV)タスクのための基礎アノテーションである。
LLM ベースの SD と RV コンポーネントのジョイント予測能力を向上する新たな強化チューニングフレームワークを提案する。
以上の結果から,JSDRVはタスクモデルとして適合する非LLMへの一般化だけでなく,共同作業におけるLLMの能力の向上を図っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:31:18 GMT)
Learning Hamiltonian neural Koopman operator and simultaneously sustaining and discovering conservation law [13.3] 本研究では,HNKO(Hanadian Neural Koopman Operator)を提案する。
我々は,HNKOとその拡張性能を,代表的物理系を用いて実証する。
この結果から,基礎となるシステムの事前知識と数学的理論を学習フレームワークに適切に供給することで,物理問題の解法における機械学習の能力を高めることが示唆された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:42:34 GMT)
Statistical Guarantees of Group-Invariant GANs [13.1] GAN(Group-invariant Generative Adversarial Network)は、ジェネレータと識別器を群対称性で固定したGANの一種である。
本研究は,グループ不変な生成モデル,特にGANに対する最初の統計的性能保証を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:48:43 GMT)
Dynamic Online Recommendation for Two-Sided Market with Bayesian Incentive Compatibility [13.1] オンラインの嗜好学習環境において,インセンティブを意識したリコメンデーションのための原則的アプローチを提案する。
我々の研究は、オンラインの嗜好学習環境におけるインセンティブを意識したレコメンデーションに原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:46:10 GMT)
On Sparse High-Dimensional Graphical Model Learning For Dependent Time Series [12.9] 本稿では,スパース,高次元定常時系列の条件独立グラフ(CIG)を推定する問題を考察する。
スパースグループラッソに基づく周波数領域の定式化について述べる。
また,ベイズ情報基準に基づくチューニングパラメータの選択についても実験的に検討した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:14:13 GMT)
Contrastive Language Video Time Pre-training [12.9] 本稿では,コントラスト学習による長文ビデオにおける言語,ビデオ,時間表現の新たな学習手法であるLAVITIを紹介する。
我々のモデルは、学習可能なモーメントクエリを用いて、クリップレベルの視覚的特徴、言語的特徴、時間的特徴をデコードする。
本手法をCharadesEgo行動認識に応用し,最先端の結果を得た。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:48:59 GMT)
Hybrid Automated Program Repair by Combining Large Language Models and Program Analysis [12.7] 自動プログラム修復(APR)は、人間の開発者のバグ修正プロセスを合理化する可能性から、大きな注目を集めている。
本稿ではGIANTREPAIRと呼ばれる革新的なAPR手法を紹介する。
この知見に基づいて、GIANTREPAIRはまず、LLM生成したパッチからパッチスケルトンを構築して、パッチ空間を閉じ込め、その後、特定のプログラムに適した高品質なパッチを生成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:11:51 GMT)
Measuring Stochastic Data Complexity with Boltzmann Influence Functions [12.5] テストポイントにおけるモデルの予測の不確かさを推定することは、分散シフトの下で信頼性とキャリブレーションを確保する重要な要素である。
温度スケールボルツマンの影響関数でモデルを線形化するpNML分布のスケーラブルかつ効率的な近似であるIF-COMPを提案する。
IF-COMPは不確実性の校正、誤ラベル検出、OOD検出のタスクに対して実験により検証され、そこでは強いベースライン法と一貫した一致または打ち負かされる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:01:39 GMT)
Evaluating ChatGPT as a Recommender System: A Rigorous Approach [12.5] 本稿では,ChatGPTのRSとしての能力とプロセス後ChatGPTレコメンデーションを評価するためのロバストな評価パイプラインを提案する。
モデルの機能は,トップNレコメンデーション,コールドスタートレコメンデーション,リコメンデーションリストの再ランクの3つの設定で分析する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:25:45 GMT)
Branches: A Fast Dynamic Programming and Branch & Bound Algorithm for Optimal Decision Trees [12.4] 決定木学習は、解釈可能な機械学習の基本的な問題である。
両パラダイムの長所を統合する新しいアルゴリズムであるBranchesを紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:11:46 GMT)
Assessing the Performance of Chinese Open Source Large Language Models in Information Extraction Tasks [12.4] 自然言語処理(NLP)における情報抽出(IE)の役割
英語IEタスクに焦点をあてた最近の実験は、LLM(Large Language Models)が最適性能を達成する上で直面する課題に光を当てている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:00:40 GMT)
CR-UTP: Certified Robustness against Universal Text Perturbations [12.4] ランダムな平滑化に基づく既存の証明されたロバスト性は、入力固有のテキスト摂動の証明にかなりの可能性を示している。
ナイーブな方法は、単にマスキング比とマスキング攻撃トークンの可能性を増大させることであるが、認証精度と認証半径の両方を著しく低下させる。
本研究では,マスキングにおいて高い認証精度を維持する優れたプロンプトを識別する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:02:22 GMT)
DA-HFNet: Progressive Fine-Grained Forgery Image Detection and Localization Based on Dual Attention [12.4] DA-HFNet鍛造画像データセットをテキストまたは画像支援GANおよび拡散モデルで作成する。
我々のゴールは、階層的なプログレッシブネットワークを使用して、異なるスケールの偽造物を検出およびローカライゼーションするために捕獲することである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:39:20 GMT)
AI-Face: A Million-Scale Demographically Annotated AI-Generated Face Dataset and Fairness Benchmark [12.4] AI-Faceデータセットは、人口統計学的にアノテートされた最初のAI生成顔画像データセットである。
このデータセットに基づいて、さまざまなAI顔検出装置を評価するために、最初の総合的公正度ベンチマークを行う。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:08:07 GMT)
Rectifying Reinforcement Learning for Reward Matching [12.3] 我々は,GFlowNetsと統一政策の政策評価の新たなつながりを確立する。
本稿では,GFlowNetsと同じ報酬マッチング効果を達成できる新しいポリシー評価アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:11:53 GMT)
EPIC: Graph Augmentation with Edit Path Interpolation via Learnable Cost [12.2] 本稿では,グラフデータセットを新たに拡張するEPIC (Edit Path Interpolation via learnable Cost)を提案する。
不規則な領域にある2つのグラフの間を補間するために、EPICは2つのグラフ間の変換プロセスを表す編集パスを構築する。
我々のアプローチは多くのタスクにおいて既存の拡張テクニックよりも優れています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:54:38 GMT)
Optimal Rates for DP-SCO with a Single Epoch and Large Batches [12.2] 我々は,この独立性を破り,勾配差でのみプライバシを支払うことができる新しいDPアルゴリズムを提案する。
我々のアルゴリズムは、バッチサイズが少なくとも$sqrtn$のバッチグラデーションステップで実行できます。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:59:42 GMT)
Towards an Extensible Model-Based Digital Twin Framework for Space Launch Vehicles [12.2] Digital Twin(DT)の概念は、ドメイン間の異なる抽象化レベルにあるシステムにますます適用されています。
DTの定義は明確ではなく、DTの能力を完全に実現するための明確な経路も存在しない。
本稿では,モデルに基づくDT開発手法を提案するDT成熟度行列を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:31:00 GMT)
Generative Conditional Distributions by Neural (Entropic) Optimal Transport [12.2] 本稿では,条件分布の生成モデル学習を目的とした,ニューラルエントロピー最適輸送手法を提案する。
提案手法は,2つのニューラルネットワークのミニマックストレーニングに依存する。
実世界のデータセットを用いた実験では,現状条件分布学習法と比較して,アルゴリズムの有効性が示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:45:35 GMT)
Riemannian coordinate descent algorithms on matrix manifolds [12.1] 行列多様体上で計算効率の良い座標降下(CD)アルゴリズムを開発するための一般的なフレームワークを提供する。
我々は、Stiefel, Grassmann, (Generalized) hyperbolic, symplectic, and symmetric positive (semi) definite などの多様体に対するCDアルゴリズムを提案する。
我々はそれらの収束と複雑性を分析し、いくつかのアプリケーションでその効果を実証的に説明する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:37:11 GMT)
Multi-Layer Attention-Based Explainability via Transformers for Tabular Data [11.9] グラフ指向の注意に基づく表データの説明可能性法を提案する。
すべての頭とレイヤーの注意行列を考慮に入れます。
多層アテンションに基づく説明の質を評価するために、一般的なアテンション、勾配、摂動に基づく説明可能性法と比較する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:59:23 GMT)
Experimental single-photon quantum key distribution surpassing the fundamental coherent-state rate limit [11.8] 単一光子源は量子ネットワークに必須であり、量子鍵分布(QKD)から急成長する量子インターネットへの応用を可能にする。
本稿では、高効率単一光子源を用いた高速QKDを報告し、コヒーレント光の基本速度限界を超越するSKRを実現する。
我々の研究は、QKDアプリケーションにおけるコヒーレント光よりもナノテクノロジーベースの単一光子源の方が優れた性能を示し、グローバル量子インターネットの実現に向けて重要な一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:28:15 GMT)
Don't Fine-Tune, Decode: Syntax Error-Free Tool Use via Constrained Decoding [11.5] 大きな言語モデル(LLM)は多くのタスクで優れていますが、複雑な構文制約のため、外部ツールの使用に失敗することが多いのです。
本研究では,有限状態マシンを用いた復号アルゴリズムTOOLDECを提案する。
実験の結果、TOOLDECはすべての構文エラーを排除し、様々なベースモデルやベンチマークのパフォーマンスが大幅に向上した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:50:22 GMT)
A New Analysis of Differential Privacy's Generalization Guarantees [11.5] 適応的に選択された統計的クエリに、差分的にプライベートで、サンプル精度が正確に答えるメカニズムも正解であることを示す。
私たちの新しい証明は初等的で、他の場所で役立つと期待されている構造的な洞察を与えてくれます。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:08:58 GMT)
Prompting Large Language Models with Human Error Markings for Self-Correcting Machine Translation [11.4] 後編集(PE)は、エラーを訂正し、専門ドメインの項翻訳品質を高めるために依然として必要である。
技術的領域における正しい一貫した項翻訳の必要性に対する翻訳記憶(TM)の強化に関するパイロット研究について述べる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:43:47 GMT)
Charting the Landscape of Nefarious Uses of Generative Artificial Intelligence for Online Election Interference [11.3] Generative Artificial Intelligence (GenAI) と Large Language Models (LLMs) は、特にオンライン選挙干渉の領域において大きなリスクをもたらす。
本稿では、GenAIの悪用を探求し、ディープフェイク、ボットネット、偽情報キャンペーン、合成IDを通じて民主的プロセスを破壊できる可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:26:12 GMT)
Nutrition Estimation for Dietary Management: A Transformer Approach with Depth Sensing [11.3] 栄養推定のためのトランスフォーマーネットワークであるNuNetを提案する。
我々は,2種類の機能融合モジュールとともに,マルチスケールエンコーダとデコーダを設計,実装した。
実験により,NuNetは栄養推定において,その変種および既存ソリューションを著しく上回っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:45:08 GMT)
Comparative Analysis Vision of Worldwide AI Courses [11.2] この研究は、先進大学の多様なコース構造を掘り下げ、現代のトレンドと優先順位を探求し、AI教育における曖昧なアプローチを明らかにする。
また、コアAIトピックと、頻繁に教えられる学習内容について、CS2023のカリキュラムガイダンスと比較し、収束と分散を識別する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:53:57 GMT)
ChebMixer: Efficient Graph Representation Learning with MLP Mixer [11.2] Graph Transformerはノードをトークンとして扱う。
このグラフMixerは、コンピュータビジョンからの効率的なMixerテクニックを使用して、この問題に対処する。
我々は,高速なChebyshevsに基づくスペクトルフィルタリングを用いてトークン列を抽出するChebMixerという新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:22:48 GMT)
MALIBO: Meta-learning for Likelihood-free Bayesian Optimization [11.1] 本稿では,サロゲートモデルをバイパスし,タスク間のクエリの有用性を直接学習するメタラーニングBO手法を提案する。
本手法は,タスクの不確実性を明示的にモデル化し,新しいタスクへのロバスト適応を可能にする補助モデルを含む。
提案手法は, 常に高い性能を示し, 様々なベンチマークにおいて, 最先端のメタラーニングBO法より優れた性能を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:54:09 GMT)
Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters [11.1] 最近、Mixture of Experts (MoE)アーキテクチャは、計算コストを安価に保ちながらモデルの容量を拡大する能力のために、急成長を始めた。
本稿では,音響スペクトル変換器のパラメータ効率の高い微調整におけるMoEの使用を,下流の音声や音声の処理に用いていることを示す。
アダプタをエキスパートとして利用し、最近のSoft MoEメソッドを利用して、入力トークンとエキスパートの間のソフトな割り当てに依存して計算時間を制限している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:53:28 GMT)
Optimised ProPainter for Video Diminished Reality Inpainting [11.0] 医用画像の専門的要求を満たすため,ProPainter法から最適化した精細な映像塗装技術を導入する。
我々の拡張アルゴリズムは、最適化されたパラメータと前処理を特徴とするゼロショットProPainterを用いて、手術用ビデオシーケンスをインペイントする複雑なタスクを積極的に管理する。
閉鎖領域の時間的一貫性と詳細に富んだ再構築を図り、手術現場のより明確な視認を促進することを目的としている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:00:22 GMT)
An Empirical Study of In-context Learning in LLMs for Machine Translation [11.0] 本研究は,機械翻訳における文脈内学習の徹底的な研究である。
まず、ICLが主に例駆動であり、命令駆動ではないことを確認します。
分析には、実演の質や量、空間的近接性、ソース対目的の独創性などの要因が含まれている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:37:52 GMT)
Zyda: A 1.3T Dataset for Open Language Modeling [11.0] Zydaは1.3兆のトークンからなる寛容なライセンス下でのデータセットで、主要なオープンソースのデータセットを単一の高品質なコーパスに統合することによって組み立てられる。
我々の評価によると、ZydaはDolma、FinalWeb、RefinedWebといった他のオープンデータセットと競合するだけでなく、Pythiaスイートの同等モデルの性能を大幅に改善している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:47:17 GMT)
Self-Pro: A Self-Prompt and Tuning Framework for Graph Neural Networks [10.8] Self-Promptは、モデルとデータ自体に基づいたグラフのプロンプトフレームワークである。
非対称なグラフコントラスト学習を導入し、不均質に対処し、プリテキストと下流タスクの目的を整合させる。
11のベンチマークデータセットに対する広範な実験を行い、その優位性を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:31:15 GMT)
Version Control of Speaker Recognition Systems [10.8] 本稿では,Googleが長年の工学的実践から学んだ話者認識システムのバージョン管理戦略について述べる。
SpeakerVerSimは、容易に拡張可能なPythonベースのシミュレーションフレームワークである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:22:00 GMT)
Fine-Tuned Machine Translation Metrics Struggle in Unseen Domains [10.7] このデータセットを用いて、人為的なMT品質判断に基づいて微調整された機械翻訳(MT)メトリクスが、トレーニングと推論の間のドメインシフトに対して堅牢であるかどうかを調べる。
微調整されたメトリクスは、表面形状に依存するメトリクスと、MT品質判断に基づいて微調整されていない事前訓練されたメトリクスとに対して、目に見えない領域シナリオにおいて、かなりのパフォーマンス低下を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:14:16 GMT)
An Empirical Analysis on Large Language Models in Debate Evaluation [10.7] GPT-3.5 や GPT-4 のような先進大言語モデル (LLM) の機能と固有バイアスを議論評価の文脈で検討する。
GPT-3.5 と GPT-4 の両者に一貫した偏りがみられた。
また, GPT-3.5 および GPT-4 の語彙バイアスも明らかにした。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:51:25 GMT)
How many labelers do you have? A closer look at gold-standard labels [10.6] 我々は、非集約ラベル情報へのアクセスによって、ゴールドスタンダードラベルよりも、トレーニングの適格化がより実現可能であることを示す。
我々は,非アグリゲートラベルが学習性能を改善することを含む,実世界のデータセットの予測を行う。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:23:11 GMT)
Inhomogeneous graph trend filtering via a l2,0 cardinality penalty [10.6] グラフ信号の断片的スムーズさを推定するために,$ell_2,0$-norm Penalized Graph Trend Filtering (GTF) モデルを提案する。
提案したGTFモデルは,エッジセットが大きいデータセットに対して,既存のモデルよりも効率的に解けることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:13:12 GMT)
Reducing Bias in Federated Class-Incremental Learning with Hierarchical Generative Prototypes [10.5] Federated Learning (FL) は、ディープモデルのトレーニングを、複数のデバイスに分散した計算によって解き放つことを目的としている。
FCLで自然に現れるインクリメンタルとフェデレーションのバイアスに光を当てました。
我々の提案は、トレーニング済みのバックボーンを効率的に微調整することで、最後の層のバイアスを抑える。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:12:27 GMT)
Generating grid maps via the snake model [10.5] グリッドマップはタイルマップと呼ばれ、地理空間の可視化において重要なツールである。
地理的領域をグリッドに変換するため、コヒーレントグリッドアレンジメントを確立するために、セントロイドと境界ノードの両方の変位を必要とする。
既存のアプローチは通常、領域セントロイドと境界ノードを別々に置き換える。
本研究では,Snake変位アルゴリズムを地図一般化から適用し,領域セントロイドと境界ノードを同時に変位させる手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:24:39 GMT)
Calibrated Regression Against An Adversary Without Regret [10.5] データポイントの任意のストリーム上でこれらの目標を達成するために保証されたオンラインアルゴリズムを導入する。
具体的には、アルゴリズムは(1)キャリブレーションされた予測を生成する。すなわち、80%の信頼区間は、その時間の80%の真の結果を含む。
我々は、回帰においてこれらの目標を確実に達成するポストホックリカレーション戦略を実装している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:33:04 GMT)
Verifiable Encodings for Secure Homomorphic Analytics [10.4] ホモモルフィック暗号化は、機密データ上のクラウドで除算された計算のプライバシを保護するための有望なソリューションである。
本稿では,クラウドベースの同型計算のクライアント検証を実現するための2つの誤り検出符号化とビルド認証手法を提案する。
我々は,暗号化されたデータ上で実行されたアウトソース計算の検証システムであるVERITASにソリューションを実装した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:58:08 GMT)
Brain-Inspired Spiking Neural Networks for Industrial Fault Diagnosis: A Survey, Challenges, and Opportunities [10.4] Spiking Neural Network (SNN)は、Brainにインスパイアされたコンピューティングの原理に基づいている。
本稿では,SNNモデルの理論的進歩を体系的にレビューし,SNNとは何かという疑問に答える。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:31:10 GMT)
A Multi-Perspective Analysis of Memorization in Large Language Models [10.3] 大規模言語モデル(LLM)は様々な分野で前例のない性能を示す。
LLMはそれらをトレーニングするのと同じコンテンツを生成することができる。
この研究は、様々な観点から記憶を包括的に議論した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:28:20 GMT)
Robust and highly scalable estimation of directional couplings from time-shifted signals [10.3] 間接的測定から直接結合を推定することは、神経科学、システム生物学、経済学などの科学分野における中心的な方法論的課題である。
我々は,遅延に対する不確実性を疎外し,保守的な結合推定値を得るため,変分ベイズフレームワークを用いる。
本実験では,ネットワークが結合の信頼性と保守性を提供し,回帰DCMなどの類似の手法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:58:33 GMT)
Calibrated and Conformal Propensity Scores for Causal Effect Estimation [10.2] 学習された確率スコアモデルの確率的出力は校正されるべきである。
校正確率スコアはGWAS解析の速度を2倍以上に向上させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:40:48 GMT)
Privacy Attacks in Decentralized Learning [10.2] Decentralized Gradient Descent (D-GD)は、データを共有することなく、複数のユーザが協調学習を行うことを可能にする。
本稿では,D-GDに対する最初の攻撃を提案する。
実際のグラフやデータセットに対する攻撃の有効性を検証することで、単一の攻撃者や少数の攻撃者によって侵入されたユーザの数が驚くほど大きいことを示しています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:34:25 GMT)
AI Agents Under Threat: A Survey of Key Security Challenges and Future Pathways [10.2] 人工知能(AI)エージェント(英: Artificial Intelligence, AI)は、自律的にタスクを実行したり、事前に定義された目的やデータ入力に基づいて決定を行うソフトウェアエンティティである。
この調査は、AIエージェントが直面している新たなセキュリティ脅威を掘り下げ、これらを4つの重要な知識ギャップに分類する。
これらの脅威を体系的にレビューすることにより、この論文はAIエージェントの保護における進歩と既存の制限の両方を強調している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:22:31 GMT)
Dynamic and Adaptive Feature Generation with LLM [10.1] 本稿では,特徴生成プロセスの解釈可能性を高める動的かつ適応的な特徴生成手法を提案する。
弊社のアプローチは、さまざまなデータタイプやタスクに適用可能性を広げ、戦略的柔軟性よりも優位性を引き出す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:32:14 GMT)
SSFlowNet: Semi-supervised Scene Flow Estimation On Point Clouds With Pseudo Label [10.1] 本稿では,シーンフロー推定のための半教師付きアプローチであるSSFlowNetを紹介する。
ラベル付きデータとラベルなしデータの混合を利用し、ラベル付けコストとモデルトレーニングの精度のバランスを最適化する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:59:48 GMT)
Contextual Dynamic Pricing: Algorithms, Optimality, and Local Differential Privacy Constraints [10.1] 企業が商品をT$で販売する状況的動的価格問題について検討する。
まず、最適後悔上限は、対数係数まで、次数$sqrtdT$であることを示す。
理論的結果の重要な洞察は、動的価格と文脈的マルチアームバンディット問題との本質的な関係である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:44:10 GMT)
Using Self-supervised Learning Can Improve Model Fairness [10.0] 自己教師型学習(SSL)は,大規模モデルのデファクトトレーニングパラダイムとなっている。
本研究では,事前学習と微調整が公正性に及ぼす影響について検討する。
SSLの公平性評価フレームワークを導入し、データセット要件の定義、事前トレーニング、段階的凍結による微調整、人口統計学的に条件付けられた表現類似性の評価、ドメイン固有の評価プロセスの確立の5段階を含む。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:38:30 GMT)
Kernel vs. Kernel: Exploring How the Data Structure Affects Neural Collapse [10.0] ニューラル・コラプス(Neural Collapse)とは、NC1と呼ばれるネットワークの最も深い機能のクラス内での多様性の低下である。
この制限に悩まされないカーネルベースの分析を提供する。
NTKは、原型データモデルに対するNNGPよりも崩壊した特徴を表現していないことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:33:56 GMT)
On the Mode-Seeking Properties of Langevin Dynamics [9.8] マルチモーダル分布からのサンプル生成におけるLangevin Dynamicsについて検討する。
本稿では,データベクトルを一定サイズのパッチに分割し,前回のパッチで逐次条件付きパッチを生成するChained Langevin Dynamicsを提案する。
合成および実画像データセットに関する数値実験の結果について述べる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:57:12 GMT)
SaVeR: Optimal Data Collection Strategy for Safe Policy Evaluation in Tabular MDP [9.7] 表型マルコフ決定過程(MDP)における政策評価を目的とした安全なデータ収集について検討する。
まず、問題パラメータに関する知識を持つ安全なオラクルアルゴリズムが、データを効率よく収集し、安全性の制約を満たすような、難解なMDPのクラスが存在することを示す。
次に、この問題に対するアルゴリズムSaVeRを導入し、安全オラクルアルゴリズムを近似し、アルゴリズムの有限サンプル平均二乗誤差を拘束し、安全性の制約を満たすことを保証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:54:55 GMT)
Majority Vote for Distributed Differentially Private Sign Selection [9.7] 本稿では,分散セットアップにおける符号選択問題に対する分散グループ差分なプライマリティー投票機構を提案する。
適用性を向上させるために,平均回帰問題と線形回帰問題に対するプライベートサインの選択について検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:11:25 GMT)
Chronosymbolic Learning: Efficient CHC Solving with Symbolic Reasoning and Inductive Learning [9.6] Solving Constrained Horn Clauses (CHCs) は、幅広い検証と分析タスクの背後にある根本的な課題である。
データ駆動アプローチは、さまざまなものの作成とチューニングを手作業で行わずに、CHC解決を改善する上で大きな可能性を秘めている。
シンボリック情報と数値データポイントを統一し、CHCシステムを効率的に解くための、シンプルで効果的なフレームワーク「Chronosymbolic Learning」を開発した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:11:50 GMT)
Research on the Application of Computer Vision Based on Deep Learning in Autonomous Driving Technology [9.5] 本稿では、画像認識、リアルタイム目標追跡・分類、環境認識・意思決定支援、経路計画・ナビゲーションにおけるディープラーニングの適用について詳細に分析する。
提案システムでは,画像認識,目標追跡,分類の精度が98%を超え,高い性能と実用性を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:15:41 GMT)
From Macro to Micro: Boosting micro-expression recognition via pre-training on macro-expression videos [9.5] マイクロ圧縮認識(MER)は、インテリジェント医療や嘘検出に応用される可能性があるため、近年注目を集めている。
我々は、textbfMAcro-expression textbfTO textbfMIcro-expression (MA2MI) と呼ばれる一般化トランスファー学習パラダイムを提案する。
我々のパラダイムでは、ネットワークは将来のフレームを再構築することで、微妙な顔の動きを表現する能力を学ぶことができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:15:50 GMT)
Domain Game: Disentangle Anatomical Feature for Single Domain Generalized Segmentation [9.5] 医用画像セグメンテーションのための機能ディスタングを行うために,textitDomain Game という新しいフレームワークを提案する。
ドメインゲームでは、特異音源画像から導出されるランダムに変換された画像の集合を戦略的に2つの特徴集合に符号化する。
クロスサイトテスト領域の評価の結果、前立腺のセグメンテーションが約11.8%、脳腫瘍のセグメンテーションが約10.5%向上した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:10:02 GMT)
Adaptive Online Experimental Design for Causal Discovery [9.4] 因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:55:56 GMT)
Multiply Robust Estimation for Local Distribution Shifts with Multiple Domains [9.4] 我々は、全人口の複数のセグメントにまたがってデータ分布が変化するシナリオに焦点を当てる。
そこで本研究では,各セグメントのモデル性能を改善するために,二段階多重ロバスト推定法を提案する。
本手法は,市販の機械学習モデルを用いて実装されるように設計されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:30:07 GMT)
Activation Bottleneck: Sigmoidal Neural Networks Cannot Forecast a Straight Line [9.3] ニューラルネットワークは、隠れたレイヤの1つが有界なイメージを持つ場合、アクティベーションボトルネックを持つ。
アクティベーションボトルネックのあるネットワークは、非有界シーケンスを予測できないことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:34:08 GMT)
On the Duality of Teleportation and Dense Coding [9.3] 量子テレポーテーション(quantum teleportation)は、量子通信プリミティブである。
本稿では,この問題を国家差別問題として再定義する方法について述べる。
我々の主な成果の1つは、古典的状態に対する一方通行のテレポーテーションプロトコルに利点を与えない状態の完全な特徴づけを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:48:12 GMT)
CantonMT: Cantonese to English NMT Platform with Fine-Tuned Models Using Synthetic Back-Translation Data [9.2] この研究は、標準データ拡張手法を、新しい言語翻訳の方向であるCantonese-to- Englishにバック翻訳することで展開する。
実データ量と合成データを用いて微調整したモデルを提案する。
我々は、このtextsc CantonMT研究プロジェクトに含まれるモデルのユーザフレンドリなインターフェースを作成し、カントン語から英語へのMT研究を促進するために利用できるようにする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:31:20 GMT)
Adaptive Convolutional Forecasting Network Based on Time Series Feature-Driven [9.1] 実世界のシナリオにおける時系列データは、かなりの量の非線形情報を含んでいる。
マルチレゾリューション畳み込み演算と変形可能な畳み込み演算を導入する。
本稿では,局所的およびグローバルな時間的依存関係を効果的にモデル化する適応型畳み込みネットワークACNetを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:30:49 GMT)
Mixed-Precision Over-The-Air Federated Learning via Approximated Computing [9.1] OTA-FL(Over-the-Air Federated Learning)は,プライバシ保護型分散学習機構として広く研究されている。
既存のOTA-FL研究における重要な研究ギャップは、均質なクライアント計算ビット精度の仮定である。
本稿では、複数の精度を持つクライアントのAxCベースのOTA-FLフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:07:45 GMT)
The Role of Learning Algorithms in Collective Action [9.0] 本研究では,学習アルゴリズムの特性に大きく依存していることを示す。
このことは、機械学習における集団行動の影響を研究する際に、学習アルゴリズムを考慮に入れる必要性を強調している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:34:01 GMT)
Wasserstein Wormhole: Scalable Optimal Transport Distance with Transformers [8.9] 本稿では,変圧器をベースとした自己エンコーダWasserstein Wormholeを紹介し,経験的分布を潜在空間に埋め込む。
目的関数は、非ユークリッド距離を埋め込む際に発生する誤差の有界性を示す。
Wasserstein Wormholeは計算幾何学と単細胞生物学の分野でデータ解析の新しい道を開く。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:09:59 GMT)
FineDiffusion: Scaling up Diffusion Models for Fine-grained Image Generation with 10,000 Classes [8.8] 我々は,1万のカテゴリからなる大規模きめ細粒度画像生成にスケールする大規模な事前学習拡散モデルに対して,FunDiffusionと呼ばれるパラメータ効率の戦略を提案する。
FineDiffusionは、微調整されたクラス埋め込み、バイアス項、正規化レイヤのパラメータのみによって、トレーニングを著しく加速し、ストレージオーバーヘッドを低減する。
本稿では,特に細粒度分類に適したスーパークラス条件付きガイダンスを用いた,微細粒度画像生成のための新しいサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:29:24 GMT)
TinyLlama: An Open-Source Small Language Model [8.7] TinyLlamaは、約3エポックの約1兆トークンで事前訓練された、コンパクトな1.1B言語モデルである。
これは、既存のオープンソース言語モデルと同等のサイズで大幅に上回っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:05:30 GMT)
Scalable MatMul-free Language Modeling [8.7] 行列乗法(MatMul)は、大規模言語モデルの全体的な計算コストを支配している。
MatMul操作は大規模言語モデルから完全に除去可能であることを示す。
提案するMatMulフリーモデルは,最先端のトランスフォーマーと同等の性能を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:50:34 GMT)
Bipartite entanglement of noisy stabilizer states through the lens of stabilizer codes [8.6] 本研究では、対応する縮小状態のスペクトルを、対応する安定化器符号の特性で表すことができることを示す。
雑音に対する耐性のある安定化状態が得られ、短期量子ネットワークにおけるより堅牢な絡み合い分布が可能となる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:46:51 GMT)
A Standardized Machine-readable Dataset Documentation Format for Responsible AI [8.6] Croissant-RAIは、AIデータセットの発見性、相互運用性、信頼性を高めるために設計された、機械可読なメタデータフォーマットである。
主要なデータ検索エンジン、リポジトリ、機械学習フレームワークに統合されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:40:14 GMT)
Radar Spectra-Language Model for Automotive Scene Parsing [8.5] 自動走行の文脈において,レーダスペクトルに含まれる意味情報を探索することを目的としている。
既存の視覚言語モデルの埋め込み空間をマッチングすることにより,レーダスペクトルデータの不足を克服する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:45:04 GMT)
Robust Interaction-based Relevance Modeling for Online E-Commerce and LLM-based Retrieval [8.5] 従来のテキストマッチング技術は、検索意図のニュアンスを正確に捉えることができない。
このような欠点に対処するために、ロバストなインタラクションベースのモデリングパラダイムを導入します。
我々の知る限りでは、この手法は大規模なeコマース検索関連性計算のための対話に基づく最初のアプローチである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:24:04 GMT)
Noninvasive magnetic detection of 2D van der Waals room-temperature ferromagnet Fe3GaTe2 using divacancy spins in SiC [8.5] 二次元(2D)ファンデルワールス(vdW)強磁性体は次世代のスピントロニクスデバイスに大いに期待できる。
本研究では,vdW積層強磁性体Fe3GaTe2の非侵襲的In situ磁気検出を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:21:56 GMT)
Bringing motion taxonomies to continuous domains via GPLVM on hyperbolic manifolds [8.4] 人間の動きは、人間の動きと環境との相互作用の仕方を分類する高レベルの階層的抽象化として機能する。
本稿では,関連する階層構造を捉えるハイパーボリック埋め込みを用いて分類データをモデル化することを提案する。
本モデルでは,既存の分類群や新分類群の未確認データを適切にエンコードし,EuclideanおよびVAEベースの分類群よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:34:57 GMT)
Data-driven Energy Efficiency Modelling in Large-scale Networks: An Expert Knowledge and ML-based Approach [8.3] 本稿では,通信ネットワーク(SRCON)フレームワークのシミュレーション現実について紹介する。
ライブのネットワークデータを活用し、機械学習(ML)とエキスパートベースのモデルをブレンドする。
その結果、ネットワークエネルギー効率のモデリングにオペレーターが使用する最先端技術よりも大きな効果が得られた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:01:55 GMT)
Implicit Regularization in Feedback Alignment Learning Mechanisms for Neural Networks [8.3] フィードバックアライメント(FA)法は、階層間の通信を減らしたニューラルネットワークをトレーニングするための生物学的にインスパイアされた局所学習規則である。
本研究では、FAにおけるアライメントの背後にある運用原則を解明する統一的なフレームワークを紹介する。
全体として、これらの理論的および実践的な進歩は、生物工学的な学習規則の解釈可能性を改善し、強化されたFAアルゴリズムを開発するための基盤を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:42:04 GMT)
WE-GS: An In-the-wild Efficient 3D Gaussian Representation for Unconstrained Photo Collections [8.3] 制約のない写真コレクションからの新規ビュー合成(NVS)は、コンピュータグラフィックスでは困難である。
写真コレクションからのシーン再構築のための効率的なポイントベース微分可能レンダリングフレームワークを提案する。
提案手法は、新しいビューのレンダリング品質と、高収束・レンダリング速度の外観合成において、既存のアプローチよりも優れている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:17:37 GMT)
ReLU-KAN: New Kolmogorov-Arnold Networks that Only Need Matrix Addition, Dot Multiplication, and ReLU [8.2] Kolmogorov-Arnold Networks (KAN) はGPU上での並列計算能力の制限に悩まされている。
本稿では,kanのコアアイデアを継承する新しいReLU-KANの実装を提案する。
実験の結果,ReLU-KANは従来の4層ネットワークのKANと比較して20倍の高速化を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:54:31 GMT)
Toeplitz non-liquids and Toeplitz braiding [8.2] 我々は、Toeplitz non-Liquids'と呼ばれる3ドルの非液体状態のクラスを研究する。
実効場理論は無限チャーン・サイモンズ理論(英語版)(iCS)によって記述される。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:49:40 GMT)
A Generalized Apprenticeship Learning Framework for Modeling Heterogeneous Student Pedagogical Strategies [8.1] 本稿では,最適あるいは準最適の実証から効果的な教育政策を誘導する一般ALフレームワークである期待最大化(EM)-EDMを提案する。
提案したEM-EDMにより誘導されるポリシーと,DRLにより誘発される4つのALベースラインと2つのポリシーの有効性を比較した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:14:55 GMT)
Sliding down the stairs: how correlated latent variables accelerate learning with neural networks [8.1] 入力累積に符号化された方向に沿った潜伏変数間の相関が高次相関から学習を高速化することを示す。
この結果は2層ニューラルネットワークのシミュレーションで確認された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:43:45 GMT)
The Scandinavian Embedding Benchmarks: Comprehensive Assessment of Multilingual and Monolingual Text Embedding [8.1] Scandinavian Embedding Benchmark (SEB)は、スカンジナビア語のテキスト埋め込み評価を可能にするフレームワークである。
SEBに基づいて26以上のモデルを評価し、パブリックソリューションと商用ソリューションの大幅なパフォーマンス格差を明らかにします。
我々はSEBをオープンソースにしてMTEBと統合し、スカンジナビア語のテキスト埋め込み評価のギャップを埋める。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:11:27 GMT)
Nearly Minimax Optimal Regret for Multinomial Logistic Bandit [8.1] 本研究では,学習エージェントが文脈情報に基づいて順にアソシエーションを選択する,文脈多項ロジット(MNL)バンディット問題について検討する。
すべてのアイテムが同じ期待される報酬を持つ均一な報酬の下では、$Omega(dsqrtT)$と一致する上限の$tildeO(dsqrtT)$を確立する。
非一様報酬の下では、$Omega(dsqrtT)$の低い境界と$tildeの上限を証明する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:34:55 GMT)
Toward Conversational Agents with Context and Time Sensitive Long-term Memory [8.1] 最近まで、RAGに関するほとんどの研究は、ウィキペディアのような巨大なテキストデータベースからの情報検索に重点を置いてきた。
我々は,静的なデータベース検索と比較して,長文の対話データからの効果的な検索は2つの問題に直面していると論じる。
我々は、最近の長文でシミュレートされた会話のデータセットの上に構築された、あいまいで時間に基づく質問の新しいデータセットを生成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:01:03 GMT)
Accelerated Variance-Reduced Forward-Reflected Methods for Root-Finding Problems [8.0] そこで本研究では,Nesterovの高速前方反射法と分散還元法を新たに提案し,根絶問題の解法を提案する。
我々のアルゴリズムは単ループであり、ルートフィリング問題に特化して設計された非バイアス分散還元推定器の新たなファミリーを利用する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:23:29 GMT)
DNCs Require More Planning Steps [7.8] 暗黙的アルゴリズム解法の一般化に対する計算時間とメモリの影響について検討する。
計画予算が学習アルゴリズムの挙動を劇的に変える方法を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:31:03 GMT)
OccamLLM: Fast and Exact Language Model Arithmetic in a Single Step [7.7] 本稿では,1つの自己回帰的なステップで正確な算術を可能にするフレームワークを提案する。
我々は,LLMの隠れ状態を用いて,演算を行う記号的アーキテクチャを制御する。
OccamNet をシンボルモデル (Occalama) として用いた Llama 3 8B を用いた実装は, 単算術演算における100%の精度を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:17:40 GMT)
Reinforcement Learning with Lookahead Information [7.7] エージェントが報酬や移行の実現を現在の状態で観察し、どの行動をとるかを決定するという強化学習問題について検討する。
これまでの研究は、このルックアヘッド情報が収集された報酬を大幅に増加させることを示している。
我々は、ルックアヘッド情報を組み込むことができる確率効率の高い学習アルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:29:51 GMT)
Exploring Mathematical Extrapolation of Large Language Models with Synthetic Data [7.5] このモデルは,高品質な合成データを微調整することで,多段階推論タスクで良好に動作可能であることを示す。
3つの異なるテストデータセットにおけるopen-llama-3Bモデルによる実験結果から、0ショットパス@1に0.44で到達できることが示されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:30:37 GMT)
N-photon solutions to the two-qubit quantum Rabi model [7.5] 我々は、2量子ビットのRabiモデルを研究し、ほとんどのN光子でその暗黒状態解を発見した。
一般に、全ての光子数状態は2量子量子ラビモデルに関係しているが、そのような$N$光子解は存在し、超強結合を持つ量子情報処理に応用できる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:32:45 GMT)
A generalized cycle benchmarking algorithm for characterizing mid-circuit measurements [7.3] ミドルサーキット計測(MCM)は、フォールトトレラント量子計算の開発において重要な要素である。
我々は,サイクルベンチマークの一般化により,ノイズの多いMCMを特徴付けるアルゴリズムを開発した。
MCMにおける計測ノイズと状態準備ノイズの独立性をテストするために学習した情報を利用する方法を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:00:00 GMT)
ARK: Robust Knockoffs Inference with Coupling [7.3] 本稿では,モデル-Xノックオフフレームワークの,不特定あるいは推定された特徴分布に対するロバスト性について検討する。
鍵となる手法は、近似ノックオフ手順とモデル-Xノックオフ手順を結合して、これらの2つのプロシージャのランダム変数が実現時に近いようにすることである。
このような結合モデル-Xノックオフ手順が存在する場合、その近似ノックオフ手順は、目標レベルのFDRまたは$k$-FWER制御を達成することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:50:58 GMT)
Representations as Language: An Information-Theoretic Framework for Interpretability [7.2] 大規模ニューラルモデルは、幅広い言語的タスクにまたがる印象的なパフォーマンスを示す。
それにもかかわらず、それらは主にブラックボックスであり、解釈が難しい入力のベクトル表現を誘導する。
本稿では,モデルが文から表現へ学習するマッピングを,言語の一種として表現する,解釈可能性に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:14:00 GMT)
Demonstration of superior communication through thermodynamically free channels in an optical quantum switch [7.2] フォトニックプラットフォームにおける熱力学のツールキットを用いた不定因数順序の情報強調効果について検討した。
量子スイッチに埋め込まれたシステムキュービットと2つの熱浴の間の熱的相互作用をシミュレートする。
この結果から、制御量子ビットも考慮された場合、量子スイッチはリソースと見なされるべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:56:37 GMT)
Fast Decision Boundary based Out-of-Distribution Detector [7.0] アウト・オブ・ディストリビューション(OOD)検出は、AIシステムの安全なデプロイに不可欠である。
既存の特徴空間法は有効であるが、しばしば計算上のオーバーヘッドを生じさせる。
補助モデルを用いない計算効率の良いOOD検出器を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:01:27 GMT)
MaskSR: Masked Language Model for Full-band Speech Restoration [7.0] 音声の復元は,様々な歪みが存在する場合に高品質な音声を復元することを目的としている。
雑音,リバーブ,クリップング,低帯域を考慮したフルバンド44.1kHz音声の復元が可能なマスク付き言語モデルであるMaskSRを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:23:57 GMT)
FLAP: Flow-Adhering Planning with Constrained Decoding in LLMs [7.0] タスク指向対話(TOD)におけるエージェントにとって,計画は重要なタスクである
タスク指向対話(TOD)におけるエージェントにとって,計画は重要なタスクである
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:55:04 GMT)
Span-Based Optimal Sample Complexity for Weakly Communicating and General Average Reward MDPs [7.0] 平均回帰マルコフ決定過程(MDP)において,$varepsilon$-optimal Policyを生成モデルで学習する際のサンプル複雑性について検討した。
MDP を弱通信するためには、$widetildeO(SAfracHvarepsilon2 )$, $H$ は最適ポリシーのバイアス関数のスパンであり、$SA$ は状態作用空間の濃度である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:22:45 GMT)
Approximate Nearest Neighbor Search with Window Filters [7.0] 我々は、$textitc-approximate window search$: Near Near neighbor search where the dataset each point has anumeric label, and the goal to find Near neighbors to query within any label ranges。
本稿では,従来のc-近似近傍問題の解法を,ウィンドウ探索の解法であるデータ構造に変換するためのモジュラーツリーベースフレームワークを提案し,理論的に解析する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:38:08 GMT)
A Toolbox for Supporting Research on AI in Water Distribution Networks [7.0] 複雑なシナリオモデリングと生成のためのPythonツールボックスを紹介します。
一般的なイベント検出ベンチマークへのアクセスが容易で、制御アルゴリズムを開発するための環境を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:58:19 GMT)
COMQ: A Backpropagation-Free Algorithm for Post-Training Quantization [7.0] ポストトレーニング量子化(PTQ)は、大規模なニューラルネットワークを圧縮するための実践的なアプローチとして登場した。
本稿では,階層的再構成誤りの座標最小化を逐次行う,COMQと呼ばれる革新的なPTQアルゴリズムを提案する。
COMQは、4ビットビジョン変換器を量子化し、Top-1の精度で1%未満の損失を負う。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:57:16 GMT)
Copyright Traps for Large Language Models [6.9] 我々は著作権トラップを用いて,大規模言語モデルにおける著作権コンテンツの使用を検出することを提案する。
1.3Bモデルをスクラッチからトレーニングし、オリジナルコンテンツ(ブック)にトラップを挿入します。
直観とは裏腹に,従来の手法では,中長のトラップ文の繰り返し(100)が検出できないことが示されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:07:11 GMT)
Layer-2 Arbitrage: An Empirical Analysis of Swap Dynamics and Price Disparities on Rollups [6.9] 本稿では,レイヤ2エコシステムにおける分散ファイナンス(DeFi)のダイナミクスについて考察する。
AMMと中央集権取引所の価格差を調べることで、ロールアップにおける0.5万以上の未公表の仲裁機会が明らかになる。
以上の結果から,アルビタラム,ベース,オプティミズムプールの仲裁は取引量の0.03%から0.05%の範囲で,zkSync時代には0.25%,LVRは5倍の仲裁を過大評価していることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:03:23 GMT)
Epistemic Uncertainty-Weighted Loss for Visual Bias Mitigation [6.9] 偏見の存在を完全に無視する探索手法の妥当性を論じる。
本稿では,予測不確実性重み付き損失関数を持つベイズニューラルネットワークを用いて潜在的なバイアスを特定することを提案する。
本手法は、バイアスベンチマークデータセットや実世界の顔検出問題において、視覚バイアスを緩和する可能性があることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:24:11 GMT)
MetaMixer Is All You Need [6.8] Transformerは、自己注意とフィードフォワードネットワークで構成され、様々なビジョンタスクにわたるネットワークデザインの展望に革命をもたらした。
最近の研究は、FFNがキー値記憶のような機能を持っていることも示している。
本稿では,自己注意をよりFFN様の効率的なトークンミキサーに変換することを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:00:14 GMT)
Multi-target stain normalization for histology slides [6.8] 我々は,複数の参照画像を活用する新しい手法を導入し,染色変化に対する堅牢性を高める。
提案手法はパラメータフリーであり,有意な変化のない既存の計算病理パイプラインに適用可能である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:57:34 GMT)
MidiCaps -- A large-scale MIDI dataset with text captions [6.8] 本研究の目的は,最初の大規模MIDIデータセットとテキストキャプションであるMidiCapsを提示することにより,LLMとシンボリック音楽を組み合わせた研究を可能にすることである。
様々なドメインに適用されたキャプション手法の最近の進歩に触発されて,テキスト記述を伴う168kのMIDIファイルからなる大規模キュレートデータセットを提示する。
このデータセットには様々なジャンル、スタイル、複雑さが混在しており、音楽情報検索、音楽理解、クロスモーダル翻訳といったタスクのモデルのトレーニングと評価のための豊富な情報源を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:21:55 GMT)
An Axiomatic Approach to Loss Aggregation and an Adapted Aggregating Algorithm [6.7] 監視された学習は、予想されるリスク最小化フレームワークを超えています。
一般化された集約は、学習者の損失に対する態度を表していると論じる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:11:01 GMT)
PACIT: Unlocking the Power of Examples for Better In-Context Instruction Tuning [6.7] PACITは、望ましい難易度という教育的概念にインスパイアされた、コンテキスト内インストラクションチューニング手法である。
PACITの有効性を実証し、ICITベースラインをドメイン内およびドメイン外の両方でそれぞれ9.16と3.14のROUGE-Lスコアで上回った。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:21:11 GMT)
EUFCC-340K: A Faceted Hierarchical Dataset for Metadata Annotation in GLAM Collections [6.7] EUFCC340Kデータセットは、AAT(Art & Architecture Thesaurus)に基づいた階層構造に従って、材料、オブジェクトタイプ、ディシプリエンス、主題という、複数の面にまたがって構成されている。
2つの異なるテストシナリオにおけるモデルロバスト性および一般化能力の評価実験は、マルチラベル分類ツールの改善におけるデータセットの有用性を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:57:56 GMT)
Quantum-enabled continuous microwave-to-optics frequency conversion [6.6] マイクロ波と光子の間の量子インターフェースは、遠隔超伝導量子プロセッサの絡み合わせに不可欠である。
結晶シリコン製デバイスにおける静電気的相互作用と光学的相互作用の組み合わせを利用して,これらの基準を満たすプラットフォームを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:34:01 GMT)
Decoupled Alignment for Robust Plug-and-Play Adaptation [6.5] 教師付き微調整(SFT)や人間フィードバックからの強化学習(RLHF)を必要とせずに,大規模言語モデル(LLM)を整列させる低リソース安全性向上手法を提案する。
本研究の主な目的は、知識蒸留を利用して、既存のよく整合したLLMからアライメント情報を抽出し、プラグイン・アンド・プレイ方式で非整合なLLMに統合することである。
有害な質問データセットでは, 平均防御成功率が約14.41%向上し, 51.39%に達した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:04:09 GMT)
Kolmogorov-Arnold Networks for Time Series: Bridging Predictive Power and Interpretability [6.4] Kolmogorov-Arnold Networks (KAN)は、最近MITチームが提案した画期的なモデルである。
Kanは時系列内の概念ドリフトを検知し、予測と過去の時間ステップの間の非線形関係を説明するように設計されている。
T-KANは、時系列内の概念ドリフトを検知し、予測と過去の時間ステップの間の非線形関係を説明するように設計されている。
一方,MT-KANは変数間の複雑な関係を効果的に発見・活用することで予測性能を向上させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:14:31 GMT)
Multiway Multislice PHATE: Visualizing Hidden Dynamics of RNNs through Training [6.3] リカレントニューラルネットワーク(Recurrent Neural Network, RNN)は、シーケンシャルなデータ分析に広く使われているツールであるが、計算のブラックボックスとしてよく見られる。
本稿では,RNNの隠れ状態の進化を可視化する新しい手法であるMultiway Multislice PHATE(MM-PHATE)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:05:27 GMT)
Noise-adapted qudit codes for amplitude-damping noise [6.3] 本稿では,振幅減衰騒音に対する対策として,Qudit誤り訂正符号のクラスを提案する。
具体的には、全単一量子の誤り訂正条件を満たす4量子符号のクラスと、数個の2量子減衰誤りを満足する2量子符号を構築する。
for the $d=2$ case, our QEC scheme is similar to the known example of the $4$-qubit code and the associated syndrome-based recovery。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:07:26 GMT)
Probing multipartite entanglement through persistent homology [6.1] 永続的ホモロジーによる多部交絡の研究を提案する。
永続ホモロジーは トポロジカルデータ分析で 使われるツールです
永続バーコードはそのトポロジ的要約よりもきめ細かな情報を提供することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:58:37 GMT)
Optimality of Matrix Mechanism on $\ell_p^p$-metric [6.1] そのようなエラーを$(epsilon,delta)$-differential privacyで特徴づける。
差分プライバシの下では、$ell_pp$エラーの点において、すべての定数$p$に対して、プレフィックス和とパリティクエリの応答に厳密な制限を与えます。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:27:35 GMT)
Almost linear time differentially private release of synthetic graphs [6.1] 本稿では,指数関数的メカニズムから,ほぼ線形時間と空間のアルゴリズムをサンプリングする。
直接的な結果として、差分入力を指数関数的に大きな$G$mエッジとして定義する。
これらは合成グラフを公開するためのプライベートファーストのプライベートアルゴリズムである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:44:24 GMT)
Iteration Head: A Mechanistic Study of Chain-of-Thought [6.1] CoT(Chain-of-Thought)推論は、大規模言語モデルを改善することが知られている。
本稿では,制御・解釈可能な環境下での変圧器のCoT推論について述べる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:11:46 GMT)
HPE-CogVLM: New Head Pose Grounding Task Exploration on Vision Language Model [6.1] 頭部ポーズ推定(HPE)タスクは3次元空間関係の精密な理解とヨー、ピッチ、ロール角の正確な数値出力を必要とする。
従来の研究は主に非大規模言語モデル(Non-LLMs)に基づいていた。
CogVLMは、オブジェクト境界ボックス(BBox)を予測する基盤機能を備えた視覚言語モデル(VLM)である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:51:26 GMT)
Learning-Based WiFi Fingerprint Inpainting via Generative Adversarial Networks [6.0] 本稿では,AP間相関とAP内相関を捉えることを目的とした,新規な合成インパインティングモデルを提案する。
評価結果の質を高めるために,特殊設計の対向判別器を組み込んだ。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:51:39 GMT)
Fast networked data selection via distributed smoothed quantile estimation [6.0] 我々は,最も情報性の高いデータを選択することと,マルチセットの上位k$要素を見つけることの関連性を確立する。
ネットワークにおけるトップ$kの選択は、量子的推定として知られる分散非平滑凸最適化問題として定式化することができる。
我々は、高い凸性の欠如による挑戦的な課題である、トップ$選択を達成するために必要な複雑さを特徴付けている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:26:15 GMT)
Towards Practical Single-shot Motion Synthesis [6.0] 我々は単発モーション生成に焦点を当て、より具体的にはGAN(Generative Adversarial Network)のトレーニング時間を短縮することに焦点を当てる。
特に,ミニバッチトレーニングにおけるGANの平衡崩壊の課題に対処する。
改良されたGANは、元のGANアーキテクチャと比較して、Mixamoベンチマークの競合品質と多様性を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:02:14 GMT)
Description Boosting for Zero-Shot Entity and Relation Classification [5.9] 我々は、ゼロショット学習(ZSL)手法が、エンティティ(または関係)のテキスト記述に敏感であることを示す。
本稿では、初期記述のバリエーションを生成するための戦略と、記述拡張によるゼロショットモデルの予測を向上するアンサンブル手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:09:44 GMT)
Unveiling the Cycloid Trajectory of EM Iterations in Mixed Linear Regression [5.9] 2成分混合線形回帰(2MLR)における反復の軌跡と期待最大化(EM)アルゴリズムの収束率について検討する。
近年, ノイズレスおよび高SNR環境下での2MLRにおけるEMの超線形収束が確立されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:56:22 GMT)
Prototypical Self-Explainable Models Without Re-training [5.8] 自己説明可能なモデル(SEM)は、予測とともに説明を提供するために直接訓練される。
現在のSEMは複雑なアーキテクチャと高度に規則化された損失関数を必要とするため、具体的かつコストのかかる訓練が必要である。
我々は、既存の事前学習されたモデルからプロトタイプSEMに変換することができる、KMExと呼ばれる単純で効率的な普遍的手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:40:40 GMT)
GraVITON: Graph based garment warping with attention guided inversion for Virtual-tryon [5.8] 衣服のフローにおけるコンテキストの価値を強調する新しいグラフベースのワープ手法を提案する。
提案手法は,VITON-HDとDresscodeのデータセットで検証され,衣服のワープ,テクスチャ保存,および全体リアリズムの大幅な改善を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:29:18 GMT)
A KL-based Analysis Framework with Applications to Non-Descent Optimization Methods [5.8] クルディカ・ロジャシエヴィチ特性に基づく非発散型シナリオにおける非発散型最適化手法の新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:49:46 GMT)
3D-HGS: 3D Half-Gaussian Splatting [5.8] 光リアルな3D再構成は、3Dコンピュータビジョンの基本的な問題である。
本稿では,プラグアンドプレイカーネルとして使用できる3Dハーフガウス(3D-HGS)カーネルを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:04:29 GMT)
3D Imaging of Complex Specular Surfaces by Fusing Polarimetric and Deflectometric Information [5.7] そこで本研究では,新しい手法を用いて,反射光場に含まれる情報を符号化し,復号化するための計測原理を提案する。
提案手法では,SfPの非現実的正像像像の仮定を除去し,それぞれの結果を大幅に改善する。
複素形状の鏡面上での単発・多発計測を実演し,本手法について紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:24:07 GMT)
Learning Cellular Network Connection Quality with Conformal [5.7] 我々は不確実性マップを構築するための新しい共形予測手法を導入する。
我々は、目標とする手動データ収集を優先するために、不確実性の高い地域を特定する。
また,提案手法は,研究者が高品質なデータを選択的に収集するためのサンプリング戦略にも繋がる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:33:00 GMT)
XRec: Large Language Models for Explainable Recommendation [5.6] 我々は、XRecと呼ばれるモデルに依存しないフレームワークを導入し、大規模言語モデルがレコメンデーションシステムにおけるユーザの振る舞いを説明することを可能にする。
我々の実験は、説明可能なレコメンデータシステムにおいて、ベースラインアプローチよりも優れた、包括的で意味のある説明を生成するXRecの能力を実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:55:14 GMT)
Naming, Describing, and Quantifying Visual Objects in Humans and LLMs [5.6] 視覚・言語大言語モデル(VLLM)を3つのカテゴリ(名詞・属性・量化子)で評価する。
我々は、VLLMsが人間の命名選好を世代毎に捉える能力について、様々な証拠を見出している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:49:06 GMT)
Efficient Behavior Tree Planning with Commonsense Pruning and Heuristic [5.6] 行動木(BT)計画は自律的なロボット行動制御に不可欠であるが、複雑なシナリオにおけるその適用は長い計画時間によって妨げられる。
本稿では,Large Language Models (LLM) が提供するコモンセンス推論を利用した日常サービスロボットのBT計画の改善を提案する。
微調整なしでLCMの推論性能を向上させるために,学習可能かつ伝達可能なコモンセンスライブラリを導入する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:41:24 GMT)
Detecting Endangered Marine Species in Autonomous Underwater Vehicle Imagery Using Point Annotations and Few-Shot Learning [5.4] AUV(Autonomous Underwater Vehicles)が収集した海底画像は、より広い生息環境の中で個人を特定するために利用することができる。
機械学習モデルは、訓練されたオブジェクト検出器を使用して、画像中の特定の種の存在を特定するために使用することができる。
本論文は, 数発学習における最近の研究に触発され, 一般的な海洋生物のイメージやアノテーションを利用して, 希少種と秘密種を識別する能力を高める。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:31:42 GMT)
Aggregated Text Transformer for Scene Text Detection [5.4] 本稿では,シーン画像中のテキストをマルチスケールの自己認識機構で表現するアグリゲートテキストTRansformer(ATTR)を提案する。
マルチスケール画像表現は頑健であり、様々なサイズのテキストコンテンツに関する豊富な情報を含んでいる。
提案手法は,各テキストインスタンスを個々のバイナリマスクとして表現することで,シーンテキストを検出する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:54:51 GMT)
Learning to grok: Emergence of in-context learning and skill composition in modular arithmetic tasks [5.4] モジュール型算術タスクの集合における文脈内学習とスキル構成の出現について検討する。
本稿では,GPT方式のトランスフォーマーが,事前学習タスクの数が増加するにつれて,分布内から分布外への遷移を示すことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:59:36 GMT)
TENG: Time-Evolving Natural Gradient for Solving PDEs With Deep Neural Nets Toward Machine Precision [5.3] 偏微分方程式 (Partial differential equation, PDE) は、科学と工学における力学系をモデル化するための道具である。
本稿では、時間依存の変動原理と最適化に基づく時間統合を一般化した、$textitTime-Evolving Natural Gradient (TENG)$を紹介する。
私たちの包括的開発には、TENG-Eulerのようなアルゴリズムと、TENG-Heunのような高階の亜種が含まれています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:11:56 GMT)
Differentially Private Federated Learning without Noise Addition: When is it Possible? [5.3] Federated Learning with Secure Aggregation (SA)は、マシンラーニングモデルをトレーニングするためのプライバシ保護フレームワークとして注目されている。
近年の研究では、複数のトレーニングラウンドで集約モデルを通じて情報漏洩をバウンドすることで、FLとSAとのプライバシー保証を拡張している。
FLとSAが最短ケースの差分プライバシーを保証できる条件について検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:17:56 GMT)
Low-Rank Adaption on Transformer-based Oriented Object Detector for Satellite Onboard Processing of Remote Sensing Images [5.2] 衛星搭載時の深層学習モデルは、リモートセンシング画像のリアルタイム解釈を可能にする。
本稿では,ローランク適応 (LoRA) モジュールを用いたパラメータ効率の高い微調整技術を提案する。
モデル全体のパラメータの12.4$%だけを微調整し、更新することで、完全な微調整モデルの性能の97$%から100$%までを達成できる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:00:49 GMT)
GRAM: Generative Retrieval Augmented Matching of Data Schemas in the Context of Data Security [5.2] 本研究では,大規模言語モデルの文脈における基礎的問題を再考する。
ますます厳しいデータセキュリティポリシーに則り、ゼロショットと少数ショットのシナリオに重点を置いています。
このような厳密な要求の下で属性を正確にマッチングする能力は、この領域におけるこれまでの文献との違いを識別します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:08:00 GMT)
Enhancing the sensitivity of quantum fiber-optical gyroscopes via a non-Gaussian-state probe [5.2] 非ガウス状態プローブによる量子ファイバー光学ジャイロスコープ(QFOG)の感度を高めるための理論的スキームを提案する。
我々は,QFOGの感度について検討し,PACSプローブの光子励起を増大させることにより,その感度を著しく向上させることができることを示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:18:21 GMT)
Exploring Real World Map Change Generalization of Prior-Informed HD Map Prediction Models [5.1] ハイディフィニション(HD)マップの構築と維持は、自動運転車の配備にとって大きな障壁となる。
実世界のHDマップの変化を一般化するために,どの合成摂動が最も有用かを決定するための大規模実験を行った。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:43:58 GMT)
Node-Level Topological Representation Learning on Point Clouds [5.1] 複素点雲からノードレベルの位相的特徴を抽出する新しい手法を提案する。
我々は,これらのトポロジ的特徴が合成データと実世界のデータの両方に与える影響を検証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:29:12 GMT)
Investigating the Online Recruitment and Selection Journey of Novice Software Engineers: Anti-patterns and Recommendations [5.0] ソフトウェア開発市場は成長し、ソフトウェア工学(SE)の資格を持つ専門家の需要が増加した。
本稿では、R&Sプロセスに関する初期のSE専門家に対して、アンチパターンとレコメンデーションのセットを特定することを目的とする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:56:51 GMT)
Can CLIP help CLIP in learning 3D? [5.0] 本研究では2つの3次元サンプル間の神経知覚類似性を計算するための2つの教師なし手法を提案する。
提案手法を用いて3次元のハードネガティブを抽出し,マルチモーダルなコントラストパイプラインを構築する。
その結果, ゼロショットおよび標準3次元分類において, 本手法は同等あるいは優れた性能を達成できた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:57:59 GMT)
Improving Prototypical Visual Explanations with Reward Reweighing, Reselection, and Retraining [5.0] ProtoPNetは、入力の有意義な部分に基づいて画像の分類を試みる。
このアーキテクチャは視覚的に解釈可能な分類を生成することができるが、意味論的に意味を持たない画像の部分に基づいて分類することを学ぶことが多い。
Reward Reweighing, Reselecting, and Retraining (R3)後処理フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:25:20 GMT)
Pancreatic Tumor Segmentation as Anomaly Detection in CT Images Using Denoising Diffusion Models [4.9] 本研究は, 膵腫瘍検出に対する新しいアプローチとして, デノナイズ拡散法を用いて, 弱い監督異常検出を応用した手法を提案する。
本手法は, 複雑なトレーニングプロトコルやセグメンテーションマスクを必要とせずに, 画像のシームレスな翻訳を可能にする。
本研究は, 膵癌の生存率の低さを認識し, 医療セグメント化作業における拡散モデルの効率を活用するための継続的な研究の必要性を強調した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:38:11 GMT)
CAP: A Context-Aware Neural Predictor for NAS [4.9] 我々は、トレーニングにいくつかのアノテートアーキテクチャしか必要としない文脈認識型ニューラル予測器(CAP)を提案する。
異なる探索空間における実験結果は、最先端のニューラル予測器と比較してCAPの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:37:47 GMT)
Towards Neural Architecture Search for Transfer Learning in 6G Networks [4.9] 本稿では,ニューラルネットワーク検索と伝達学習の現状とネットワークへの適用性について述べる。
オープンな研究課題を特定し、将来のネットワークに特有の要素を持つ3つの主要な要件に特化して方向性を設定します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:01:03 GMT)
ArguMentor: Augmenting User Experiences with Counter-Perspectives [4.8] ArguMentorは意見項目のクレームをハイライトし、反引数を生成し、現在のイベントに基づいて、パスのコンテキストベースのサマリを生成する。
さらに、Q&Aボット、DebateMe、ハイライトトリガーウィンドウなどの追加機能を通じて、ユーザのインタラクションと理解をさらに強化する。
調査と結果から,利用者はより多くの対策を作成でき,システムに関わった後,平均してより多くのビューを得られることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:43:56 GMT)
Efficient Model-Stealing Attacks Against Inductive Graph Neural Networks [4.8] 本稿では,誘導型GNNに対する教師なしモデルステアリング攻撃の新しい手法を提案する。
対象モデルから効率的に情報を抽出するために,グラフのコントラスト学習とスペクトルグラフ拡張に基づいている。
その結果,既存の盗難攻撃と比較して高い効率性を示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:08:09 GMT)
Trust the Model Where It Trusts Itself -- Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption [4.7] ダイナスタイルモデルベース強化学習(MBRL)はモデルベースロールアウトを通じてモデルフリーエージェントと予測遷移モデルを組み合わせる。
そこで本研究では,データ効率と性能の大幅な向上を図り,使い易いロールアウト機構を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:51:10 GMT)
UniOQA: A Unified Framework for Knowledge Graph Question Answering with Large Language Models [4.6] OwnThinkは、近年導入された中国の最も広範なオープンドメイン知識グラフである。
質問応答のための2つの並列アプローチを統合する統合フレームワークであるUniOQAを紹介する。
UniOQAは特にSpCQL Logical Accuracyを21.2%に、Execution Accuracyを54.9%に向上させ、このベンチマークで新たな最先端結果を達成した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:36:39 GMT)
Gifts from long-range interaction: Emergent gapless topological behaviors in quantum spin chain [4.5] 凝縮物質物理学のトポロジーは典型的にはバルクエネルギーギャップと関連している。
最近の研究は、バルクエネルギーギャップのない位相相に焦点を移し、非自明な隙間のない位相挙動を示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:18:44 GMT)
Bi-DCSpell: A Bi-directional Detector-Corrector Interactive Framework for Chinese Spelling Check [4.5] Chinese Spelling Check (CSC) は、中国語の文中の潜在的な誤字を検出し、訂正することを目的としている。
現在のCSCアプローチには2つのタイプがある。
本稿では,CSC(Bi-DCSpell)のための双方向検出器・コレクタフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:20:14 GMT)
Games for Artificial Intelligence Research: A Review and Perspectives [4.4] 本稿では,人工知能研究のためのゲームとゲームベースのプラットフォームについてレビューする。
特定のタイプの人工知能と、適切な人工知能技術を用いて、ゲームにおける特定のニーズをテストし、マッチングするための適切なゲームとのマッチングに関するガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:18:04 GMT)
Its Not a Modality Gap: Characterizing and Addressing the Contrastive Gap [4.4] CLIPのような2エンコーダコントラストモデルでは、モダリティギャップが報告されている。
これらの要因を全て考慮しても、対照的な損失は実際にトレーニング中にギャップを生じさせます。
この対照的なギャップがCLIP空間の低均一性に起因する証拠を提示する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:53:32 GMT)
Inpainting Pathology in Lumbar Spine MRI with Latent Diffusion [4.4] 病理組織学的特徴をMRIで健全な解剖学的特徴に塗布する効率的な方法を提案する。
腰椎椎間板ヘルニアと中心管狭窄に対し,T2 MRIにて椎間板ヘルニアを挿入する能力について検討した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:47:47 GMT)
Parameterizing Federated Continual Learning for Reproducible Research [4.4] 複雑な学習シナリオをキャプチャし、エミュレートする実験的なベストプラクティスのセットを提案する。
私たちのフレームワークであるFreddieは、FCL(Federated Continual Learning)の最初の完全なフレームワークです。
我々は,CIFAR100におけるFreddieの大規模フェデレート学習と,FCLにおける異種タスクシーケンスの2つのユースケースにおける効果を実証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:54:53 GMT)
Enhancing Retrieval-Augmented LMs with a Two-stage Consistency Learning Compressor [4.4] 本研究では,検索強化言語モデルにおける検索情報圧縮のための2段階一貫性学習手法を提案する。
提案手法は複数のデータセットにまたがって実験的に検証され,質問応答タスクの精度と効率が顕著に向上したことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:43:23 GMT)
ODA: Observation-Driven Agent for integrating LLMs and Knowledge Graphs [4.4] 我々は、知識グラフ(KG)に関わるタスクに適した新しいAIフレームワークである観測駆動エージェント(ODA)を紹介する。
織田氏はKG推論能力をグローバルな観察を通じて取り入れており、観察・行動・反射の循環的パラダイムを通じて推論能力を高める。
ODAはいくつかのデータセットで最先端のパフォーマンスを示し、特に12.87%と8.9%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:16:14 GMT)
Eliciting the Priors of Large Language Models using Iterated In-Context Learning [4.3] 本研究では,大規模言語モデルから事前分布を抽出するためのプロンプトベースのワークフローを開発する。
実験では, 従来, 反復学習を用いて, 被験者の先行する超人格を推定する手法を検証した。
そこで我々は,AIの開発時期など,さまざまな投機的事象に対して,GPT-4から先行情報を抽出するために,同じ手法を用いた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:09:43 GMT)
Fast and Scalable Multi-Kernel Encoder Classifier [4.2] 提案手法は,高速でスケーラブルなカーネルマトリックスの埋め込みを容易にするとともに,複数のカーネルをシームレスに統合して学習プロセスを向上する。
我々の理論解析は、確率変数を用いたこのアプローチの集団レベルの特徴付けを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:34:40 GMT)
Large Language Model-Enabled Multi-Agent Manufacturing Systems [4.1] 本研究は,大規模言語モデルによって生産におけるエージェントの能力が向上する新しい枠組みを提案する。
ケーススタディでは、エージェントが効果的にコミュニケーションし、タスクを理解し、製造プロセスを実行する方法を示している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:57:37 GMT)
Evaluating extractable work of quantum batteries via entropic uncertainty relations [4.1] その結果, 抽出可能な作業(エクセルギーとエルゴトロピー)は, 異なるシナリオにおいて多彩な特性を有することがわかった。
これらの知見は、量子電池の性能を評価する上での量子不確実性の役割をよりよく理解するために有用であると考えられている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:33:09 GMT)
RepCNN: Micro-sized, Mighty Models for Wakeword Detection [4.1] 常時オンの機械学習モデルは、非常に少ないメモリと計算フットプリントを必要とする。
より大規模なマルチブランチアーキテクチャへの計算によって、小さな畳み込みモデルをよりよく訓練できることが示される。
我々は、常時起動するウェイクワード検出モデルであるRepCNNが、推論中のレイテンシと精度のトレードオフを良好に提供することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:14:19 GMT)
ExGRG: Explicitly-Generated Relation Graph for Self-Supervised Representation Learning [4.1] 自己教師型学習は、ディープラーニングモデルの事前学習において、強力なテクニックとして登場した。
本稿では,合成関係グラフを明示的に生成する新しい非競合SSL手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:30:15 GMT)
Speeding up Policy Simulation in Supply Chain RL [4.1] 本稿では,Picard Iteration をダブしたポリシーシミュレーションの反復アルゴリズムを提案する。
イテレーション内では、ひとつのプロセスが割り当てられたタスクに対してのみポリシーを評価し、他のタスクに対する特定の"キャッシュ"評価を仮定する。
多くのSCO問題によって得られる構造は、水平線に依存しない少数の反復の収束を可能にすることを証明している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:48:08 GMT)
Predicting AI Agent Behavior through Approximation of the Perron-Frobenius Operator [4.1] 我々は,AIエージェントを非線形力学系として扱い,確率論的観点からその統計的挙動を予測する。
エントロピー最小化問題としてペロン・フロベニウス作用素(PF)の近似を定式化する。
我々のデータ駆動手法は、エージェントの進化を予測するためにPF演算子を同時に近似し、AIエージェントの終端確率密度を予測する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:06:49 GMT)
#EpiTwitter: Public Health Messaging During the COVID-19 Pandemic [3.9] 本研究では,パンデミックの期間中にTwitter上でPHEや疑似専門家がいかにコミュニケーションしたかを検討する。
私たちはメッセージ戦略における重要な優先順位と違いを特定しました。
否定的な感情的・道徳的な言語はエンゲージメントを促進する傾向にあるが、PHEからの肯定的な言語は世論の反応において肯定性を育む。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:37:29 GMT)
InGaP $χ^{(2)}$ integrated photonics platform for broadband, ultra-efficient nonlinear conversion and entangled photon generation [3.9] 広帯域2次非線形光学系のためのInGaP集積フォトニクスプラットフォームを実証する。
InGaPナノフォトニック導波路は、正規化効率が128,000%/W/cm$2$の第二高調波発生を可能にする。
我々は,通信C帯を中心とする97GHz/mWと115nmの帯域幅で,超高輝度で広帯域な光子源を実現する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:57:23 GMT)
Synthetic Data Outliers: Navigating Identity Disclosure [3.9] 合成データのプライバシを外部から分析する。
本研究は, リンク攻撃による異常再同定が可能であり, 容易に達成できることを示唆する。
差分プライバシーなどの追加の保護は、データユーティリティを犠牲にして、再識別を防止することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:35:44 GMT)
Choroidal Vessel Segmentation on Indocyanine Green Angiography Images via Human-in-the-Loop Labeling [3.8] 本研究は, HITLフレームワークを用いて, 限られた労力で高精度な脈絡膜細管分割モデルを構築することを目的としている。
手動で1サイクルあたりのICGA画像の修正に必要な平均時間は20分から1分に短縮された。
55度のICGA画像とUWF-ICGA画像の両方で高いセグメンテーション精度が達成されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:23:27 GMT)
Identifying Equivalent Training Dynamics [3.8] トポロジカル共役性は、動的同値の正確な定義を与える。
共役および非共役のトレーニングダイナミクスを識別するフレームワークを開発する。
この結果はフレームワークの柔軟性を示し、トレーニングダイナミクスに新たな光を放つ可能性を強調します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:20:15 GMT)
ORACLE: Leveraging Mutual Information for Consistent Character Generation with LoRAs in Diffusion Models [3.8] 単一テキストプロンプトから一貫した文字表現を生成するための新しいフレームワークを提案する。
我々のフレームワークは、一貫した視覚的アイデンティティを持つ文字を生成する既存の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:39:08 GMT)
MagicBathyNet: A Multimodal Remote Sensing Dataset for Bathymetry Prediction and Pixel-based Classification in Shallow Waters [3.7] MagicBathyNetはSentinel2、SPOT-6、空中画像、海底クラスのフォーマットとアノテーションからなるベンチマークデータセットである。
その後、学習ベースの浴量測定とピクセルベースの分類において最先端の手法をベンチマークするために利用される。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:35:14 GMT)
Analyzing the Benefits of Prototypes for Semi-Supervised Category Learning [3.6] 半教師付き学習におけるプロトタイプベース表現の利点について検討する。
プロトタイプの作成により,半教師付きカテゴリー学習が向上することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:47:11 GMT)
VHS: High-Resolution Iterative Stereo Matching with Visual Hull Priors [3.5] 本稿では,視覚的包絡を先行として高解像度画像から深度推定を行うステレオマッチング手法を提案する。
提案手法では,シーンの補助的な視点から抽出したオブジェクトマスクを用いて,不一致推定を導出し,マッチングの検索スペースを効果的に削減する。
このアプローチは、下流の復元作業において、正確な深さが重要な役割を果たすボリュームキャプチャシステムにおけるステレオリグに特化している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:59:57 GMT)
Practical Performance Guarantees for Pipelined DNN Inference [3.5] グラフを$k$のステージに分割することで、ディープニューラルネットワーク(DNN)推論のためのパイプライン並列性を最適化する。
改良された下限が最適性ギャップを9.855xで閉じていることが示される。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:58:30 GMT)
MOTIF: A tool for Mutation Testing with Fuzzing [3.5] ミューテーションテストは、セーフティクリティカルなサイバー物理システムで動作する組み込みソフトウェアにとって望ましいプラクティスである。
MOTIFは、グレーボックスファジィツールを活用して、ミュータント内の注入された欠陥を検出するCの単体テストケースを生成することで制限を克服する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:12:01 GMT)
Multiple Choice Questions and Large Languages Models: A Case Study with Fictional Medical Data [3.5] 非存在腺であるGlianorexに焦点をあてた架空の医療ベンチマークを開発した。
このアプローチにより、LSMの知識をテストテイク能力から切り離すことができます。
我々は、これらの質問をゼロショット設定で、様々なオープンソース、プロプライエタリ、ドメイン固有のLCMを評価した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:08:56 GMT)
Temporal Graph Rewiring with Expander Graphs [3.5] 時間グラフリウィリング(TGR)は、時間グラフ上でグラフをリウィリングするための最初のアプローチである。
TGRは、連続時間動的グラフにおいて、時間的に離れたノード間の通信を可能にする。
我々はTGRが広く使われているTGNモデルの性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:39:51 GMT)
A Unified Framework for Microscopy Defocus Deblur with Multi-Pyramid Transformer and Contrastive Learning [3.3] マルチピラミド変圧器 (MPT) と拡張周波数コントラスト正規化 (EFCR) は、顕微鏡欠陥の2つの課題に対処するために提案されている。
MPTは、各ネットワークステージに明示的なピラミッド構造を採用し、クロススケールウィンドウアテンションを統合している。
EFCRは、異なる周波数帯域からの潜伏遅延信号を探索することで、データ不足の問題に対処する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:47:19 GMT)
Soft Partitioning of Latent Space for Semantic Channel Equalization [3.3] 本研究では,タスク構造が意味空間と行動空間の1対1マッピングを伴うシナリオにおける意味空間分割の役割について検討する。
本稿では, ソフトデコーダの出力を利用して, セマンティック空間の構造をより包括的に理解する分割の原子を導出するソフトな基準を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:15:42 GMT)
Pragmatic Goal-Oriented Communications under Semantic-Effectiveness Channel Errors [3.3] 近日中のAI支援6Gネットワークでは、セマンティック、プラグマティック、ゴール指向のコミュニケーション戦略の統合が必須となる。
本稿では,意味的および有効性の両レベルでの言語ミスマッチから生じる誤りを数学的にモデル化する手法を提案する。
本稿では,言語ミスマッチを補うメカニズムが提案される可能性を示し,ノイズの多い通信環境下での信頼性通信の実現可能性を高める。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:10:22 GMT)
Latent Space Alignment for Semantic Channel Equalization [3.3] セマンティック通信とゴール指向通信システムにおいて,エージェント間の共通言語制約を緩和する。
本稿では,エージェントが異なる言語を使用する場合のコミュニケーションで導入された意味的歪みのモデル化と尺度を提供する数学的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:13:13 GMT)
Understanding Auditory Evoked Brain Signal via Physics-informed Embedding Network with Multi-Task Transformer [3.3] マルチタスク変換器(PEMT-Net)を用いた物理インフォームド・エンベディング・ネットワークという,革新的なマルチタスク学習モデルを提案する。
PEMT-Netは物理インフォームド埋め込みとディープラーニング技術によりデコード性能を向上させる。
特定のデータセットに対する実験は、PEMT-Netがマルチタスクの聴覚信号復号における顕著な性能を示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:53:32 GMT)
GaitGuard: Towards Private Gait in Mixed Reality [3.2] GaitGuardは、AR/MRデバイスのカメラビュー内の歩行機能のプライバシを保護するために設計された最初のリアルタイムフレームワークである。
GaitGuardは識別のリスクを最大68%削減し、最小遅延は118.77msである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:13:26 GMT)
Robust Energy Consumption Prediction with a Missing Value-Resilient Metaheuristic-based Neural Network in Mobile App Development [3.1] 我々はメタヒューリスティックアプローチによって強化された新しいニューラルネットワークベースのフレームワークを提案し、モバイルアプリ開発における堅牢なエネルギー予測を実現する。
13のベースと高度なメタヒューリスティックアルゴリズムを用いて、欠落した値に対する精度と耐性に基づいて最適なアルゴリズムを同定する。
提案手法はエネルギー消費予測を大幅に改善する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:14:20 GMT)
Offline Bayesian Aleatoric and Epistemic Uncertainty Quantification and Posterior Value Optimisation in Finite-State MDPs [3.1] 有限状態マルコフ決定過程(MDP)のオフライン使用例におけるベイズの不確かさを未知のダイナミクスで定量化することの課題に対処する。
我々は標準ベイズ強化学習法を用いて,MDPパラメータの後方不確実性を捉える。
次に、後続サンプル間の戻り分布の最初の2つのモーメントを解析的に計算し、全分散の法則を適用する。
我々は,AIクリニック問題に適用することで,実世界の影響と計算能力のスケーラビリティを強調した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:21:14 GMT)
How Western, Educated, Industrialized, Rich, and Democratic is Social Computing Research? [3.1] 我々は,AAAI ICWSMカンファレンスで行った研究において,WEIRD人口に対する依存度を評価した。
その結果、これらの論文の37%は、欧米のデータにのみ焦点をあてていることがわかった。
ICWSMの研究では、教育、工業化、富の国からの人口を主に調査している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:17:47 GMT)
Optimizing for ROC Curves on Class-Imbalanced Data by Training over a Family of Loss Functions [3.1] 重度のクラス不均衡の下で信頼性の高い分類器を訓練することは、コンピュータビジョンにおいて難しい問題である。
近年の研究では、損失関数や最適化方法の変更により、不均衡下でのトレーニングの効果を緩和する手法が提案されている。
単一損失関数ではなく、損失関数の族に対するトレーニングを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:03:25 GMT)
A Framework for Neurosymbolic Robot Action Planning using Large Language Models [3.1] 本稿では,象徴的タスク計画と機械学習アプローチのギャップを埋めることを目的としたフレームワークを提案する。
大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する根拠
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1,000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:03:28 GMT)
ENOT: Expectile Regularization for Fast and Accurate Training of Neural Optimal Transport [3.0] 本稿では,二元ポテンシャルの特定正規化による最適輸送計画の正確かつ効率的に推定する新しい手法を提案する。
既存のNOTの主なボトルネックは、10倍近い改善を見出す手順である。
本稿では,画像生成などさまざまなタスクに対する費用対効果を考慮した予測正規化ニューラルトランスポート(ENOT)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:41:11 GMT)
DL-KDD: Dual-Light Knowledge Distillation for Action Recognition in the Dark [2.9] 暗黒における行動認識のためのDual-Light KnowleDge Distillation for Action Recognition (DL-KDD) という教師によるビデオ分類フレームワークを提案する。
このフレームワークは、推論中に追加の計算コストを導入することなく、オリジナルのビデオと拡張ビデオの両方から学習することができる。
実験では,提案するDL-KDDフレームワークがARID,ARID V1.5,Dark-48データセットの最先端手法より優れていた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:38:06 GMT)
Noise Correction on Subjective Datasets [2.9] 我々は、損失に基づくラベル補正と合わせてマルチタスク学習を利用して、多様な意見のより正確な表現を学習する。
新規な定式化を用いることで、アノテーションの同意と同意の相違をきれいに分離できることを示す。
この修正により、単一または複数アノテーション設定での予測性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:53:23 GMT)
Enhancing predictive imaging biomarker discovery through treatment effect analysis [2.8] 本研究は,前処理画像を利用して新たな因果関係を明らかにすることを目的とした,予測画像バイオマーカーの発見に焦点を当てた。
以前のアプローチは、労働集約的な手工芸や手作業による特徴に依存しており、バイアスをもたらす可能性がある。
本稿では,モデルが予測画像バイオマーカーを識別し,それを認識できないものと区別する能力を評価するための評価プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:54:44 GMT)
Investigating the Potential of Using Large Language Models for Scheduling [2.8] AIを利用したソフトウェアに関するACM International ConferenceがAIware Challengeを発表した。
プログラムスケジューリングにおけるLarge Language Models (LLM) の利用について検討する。
LLMは、ゼロショット設定でも、合理的に優れたカンファレンススケジュールの最初のドラフトを作成します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:56:56 GMT)
HLOB -- Information Persistence and Structure in Limit Order Books [2.8] 本稿では,制約順序書の中間価格変化予測のための大規模ディープラーニングモデルについて紹介し,HLOBと命名する。
我々は、NASDAQ取引所で取引された15株を含む3つの現実世界のLimit Order Bookデータセット上で、9つの最先端のディープラーニング代替品に対して、我々のモデルをテストした。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:42:46 GMT)
Deep Limit Order Book Forecasting [2.8] 我々は、最先端の深層学習手法を利用して、高頻度リミットオーダーブックの中間価格変化の予測可能性を探る。
大規模なリミットオーダーブックデータを効率的に処理するオープンソースコードベースであるLOBFrame'をリリースする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:05:33 GMT)
QROA: A Black-Box Query-Response Optimization Attack on LLMs [2.8] 大規模言語モデル(LLM)は近年人気が高まっているが、操作時に有害なコンテンツを生成する能力を持っている。
本研究は,問合せのみの相互作用を通じてLCMを利用する最適化戦略であるクエリ応答最適化攻撃(QROA)を紹介する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:27:36 GMT)
Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation [2.7] 本稿では,Flash拡散モデルの生成を高速化する,効率的で高速で多用途な蒸留法を提案する。
この手法は、COCO2014とCOCO 2017データセット上の画像生成のために、FIDとCLIP-Scoreの観点から最先端のパフォーマンスに達する。
この手法の汎用性は、テキスト・トゥ・イメージ、インペイント、フェイス・スワッピング、スーパーレゾリューション、UNetベースのデノイザ(SD1.5, SDXL)やDiT(Pixart-$alpha$)などの異なるバックボーンの使用など、いくつかのタスクにまたがる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:23:27 GMT)
Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.7] 赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:23:09 GMT)
Variable importance measure for spatial machine learning models with application to air pollution exposure prediction [2.6] 本研究の目的は, 大気汚染の健康影響を学習する能力を最大限に活用するために, データのない場所での被験者の大気汚染の予測を行うことである。
これらの課題を、米国国家PM2.5亜種規制データの硫黄(S)と、シアトルの交通関連大気汚染データセットの超微粒子(UFP)の2つのデータセットで解決する。
私たちの重要な貢献は、幅広いモデルの解釈可能かつ同等の尺度に導かれる、変数の重要度に対する一対一のアプローチである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:51:36 GMT)
Large Language Models Spot Phishing Emails with Surprising Accuracy: A Comparative Analysis of Performance [2.6] 何十年にもわたるサイバー犯罪戦術であるフィッシングは、今日のデジタル世界において大きな脅威となっている。
本稿では,15大言語モデル (LLM) がフィッシング手法の検出に有効であることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:37:08 GMT)
Will we run out of data? Limits of LLM scaling based on human-generated data [2.6] 我々は、現在の傾向に基づいて、トレーニングデータの需要が増加していることを予測する。
我々は、公開人文データの総在庫を推定する。
我々は、合成データ生成、データリッチドメインからの変換学習、データ効率の改善がさらなる進歩を後押しするのではないかと論じている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:09:46 GMT)
Spatial and social situation-aware transformer-based trajectory prediction of autonomous systems [2.5] エージェントの振る舞いを所定の状況で予測するには、時間内に適切に反応する必要がある。
近年,深層学習に基づくモデルが動き予測の主流となっている。
より長い予測地平線の場合、予測軌道の地平線からの偏差は、空間的・社会的に非依存なモデルに比べて低い。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:36:16 GMT)
Incorporating Navigation Context into Inland Vessel Trajectory Prediction: A Gaussian Mixture Model and Transformer Approach [2.5] 船舶の移動がフェアウェイ内で制限されている内陸輸送では、航行コンテキスト情報は不可欠である。
本研究では,多モード分布曲線を生成するためにAISと放電測定の融合データセットを適用した。
これらの分布特徴を組み込むことで予測精度が向上する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:20:10 GMT)
Improving the Validity of Decision Trees as Explanations [2.5] 葉ノード間の最大誤分類誤差を最小限に抑えるために,浅い木を訓練する。
浅い木の全体的な統計性能は最先端の手法に匹敵する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:09:10 GMT)
Momentum Particle Maximum Likelihood [2.5] 自由エネルギー関数を最小化するための類似の力学系に基づくアプローチを提案する。
システムを離散化することにより、潜在変数モデルにおける最大推定のための実用的なアルゴリズムを得る。
このアルゴリズムは既存の粒子法を数値実験で上回り、他のMLEアルゴリズムと比較する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:17:53 GMT)
Analysis of Multiscale Reinforcement Q-Learning Algorithms for Mean Field Control Games [2.4] MFCG(Mean Field Control Games)は、多数のエージェント間の競争ゲームである。
MFCGを解くために,3次元強化Q-Learning (RL) アルゴリズムの収束性を証明する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:58:13 GMT)
Multi-layer Learnable Attention Mask for Multimodal Tasks [2.4] ラーナブル・アテンション・マスク(LAM)は、グローバルなアテンションマップの規制と重要なトークンの優先順位付けのために戦略的に設計された。
LAMはBERTのようなトランスフォーマーネットワークでトークン間の関連を受信する。
MADv2、QVHighlights、ImageNet 1K、MSRVTTなど、さまざまなデータセットに対する総合的な実験的検証。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:28:02 GMT)
Symmetric Kernels with Non-Symmetric Data: A Data-Agnostic Learnability Bound [2.3] カーネルリッジ回帰(KRR)とガウス過程(GP)は統計学と機械学習の基本的なツールである。
これらのツールがターゲット関数を学習する能力は、入力データ上にサンプリングされたカーネルの固有値に直接関係している。
本稿では,この共通ルアーとは対照的に,実データに有界な学習性を示すために,高度に理想化されたデータ尺度に付随する固有値と固有関数を用いることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:00:00 GMT)
Image steganography based on generative implicit neural representation [2.3] 本稿では,生成的暗黙的神経表現に基づく画像ステガノグラフィーを提案する。
ニューラルネットワークをメッセージ抽出器として固定することにより、トレーニング負荷を画像自体に効果的にリダイレクトする。
メッセージ抽出の精度は、100%の印象的なマークを得た。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:00:47 GMT)
Improved context-sensitive transformer model for inland vessel trajectory prediction [2.3] 物理関連およびモデルに基づく船舶軌道予測は非常に正確であるが、検討中の船舶の具体的な知識が必要である。
機械学習に基づく軌道予測モデルは専門家の知識を必要としないが、大量のデータから抽出された暗黙の知識に依存している。
近年,血管軌跡予測のための深層学習法が提案されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:39:14 GMT)
Smaller Batches, Bigger Gains? Investigating the Impact of Batch Sizes on Reinforcement Learning Based Real-World Production Scheduling [2.3] この研究は、強化学習ソリューションに対する様々なバッチサイズの影響について考察する。
適切なバッチサイズの選択に関して、インフォームドな決定を下すことができる。
この研究の成果は、同等のスケジューリング問題を持ついくつかの工業用ユースケースに応用できる可能性をもたらす。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:16:08 GMT)
Piecewise Polynomial Regression of Tame Functions via Integer Programming [2.2] 我々は,tame関数,すべての共通活性化をもつ非平滑関数,混合整数プログラムの値関数,小分子の波動関数を考える。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:38:39 GMT)
PASOA- PArticle baSed Bayesian Optimal Adaptive design [2.2] 本稿では,パラメータ推定のための後続分布の正確な推定を同時に提供することによって,逐次設計最適化を行う新しい手法を提案する。
予測情報ゲイン(EIG)を最大化するために、SMC(Sequential Monte Carlo)サンプリングと最適化を用いて、コントラスト推定原理を用いてシーケンシャル設計を行う。
提案手法は, 高い情報ゲインと正確なSMCサンプリングの両方を同時に行うことが提案され, 性能に欠かせないことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:01:50 GMT)
Data-Driven Approaches for Thrust Prediction in Underwater Flapping Fin Propulsion Systems [2.2] システムのフィンジオメトリとキネマティクスを考慮し, 推力予測のための機械学習手法を提案する。
本研究では,データ効率のよいフィン形状パラメータ化手法を導入し,未知のフィン測地に対するスラストプロファイルの予測を可能にする。
一般化可能なサロゲートモデルは、無人水中車両制御システムで使用できる高速で正確な予測を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:58:58 GMT)
Triadic-OCD: Asynchronous Online Change Detection with Provable Robustness, Optimality, and Convergence [2.1] 本稿では,証明可能な堅牢性,証明可能な最適性,保証された収束性を備えた3進OCDフレームワークを開発する。
提案アルゴリズムは、完全に非同期な分散方式で実現でき、単一のサーバにデータを送信する必要がなくなる。
Triadic-OCDの非漸近収束特性は理論的に解析され、$epsilon$-Optimal点を達成するための複雑さが導出される。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:40:50 GMT)
Fairness-Optimized Synthetic EHR Generation for Arbitrary Downstream Predictive Tasks [2.1] 本稿では,実EHRデータと整合した合成EHRデータを生成するパイプラインを提案する。
下流タスクと2つの異なるEHRデータセットにまたがるパイプラインの有効性を実証する。
提案したパイプラインは、ヘルスAIアプリケーションの公正性に対処する既存のツールボックスに、広く適用可能な補完ツールを追加することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:29:21 GMT)
Biharmonic Distance of Graphs and its Higher-Order Variants: Theoretical Properties with Applications to Centrality and Clustering [2.1] バイハーモニック距離と呼ばれる有効抵抗の変種について検討する。
両調和距離がグラフの大域的位相に対するエッジの重要性を測るという考えを支持する理論的な結果をいくつか証明する。
両高調波および$k$-高調波距離のエッジ中心性とグラフクラスタリングに対する有効性について実験的に検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:59:37 GMT)
Position-based Rogue Access Point Detection [2.0] ローグWi-Fiアクセスポイント(AP)攻撃は、データ漏洩と不正アクセスにつながる可能性がある。
既存のローグAP検出法は、しばしばチャネル状態情報(CSI)または受信信号強度指標(RSSI)に依存する。
本稿では,異なるサブセットのAPを用いてローグAPを検出する手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:22:36 GMT)
Explainable Deep Learning Analysis for Raga Identification in Indian Art Music [1.8] 機械学習とディープラーニングは、Ragasを人間の専門家と同じような方法で学習し、解釈するだろうか?
プラサーバーティ・インディアン・ミュージック(Prasarbharti Indian Music)バージョン1(PIM-v1)は、ヒンズータニ・クラシック・ミュージック(HCM)のレコードの最大のデータセットである。
我々はモデル説明可能性技術を用いて分類器の予測を評価し、それらがラガの人間の理解と一致しているか、あるいは任意のパターンによって駆動されているかを確認する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:06:51 GMT)
Enhance Image-to-Image Generation with LLaVA Prompt and Negative Prompt [1.8] LLaVAは入力画像を分析し、テキスト記述を生成するフレームワークを提案する。
これらのプロンプトと元のイメージは、イメージ・ツー・イメージ生成パイプラインに入力される。
広汎な実験は、LLaVA生成プロンプトが画像類似性を促進する効果を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:31:39 GMT)
MS-IMAP -- A Multi-Scale Graph Embedding Approach for Interpretable Manifold Learning [1.8] 本稿では,コントラスト学習手法を用いたスペクトルグラフウェーブレットに基づくマルチスケールグラフネットワークの組込みフレームワークを提案する。
提案した埋め込みの重要な特徴は,埋め込み空間と入力特徴空間との対応性を確立する能力である。
提案手法の有効性を,下流タスクを通じて,様々な公開データセットに埋め込まれたグラフの有効性を検証した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:48:33 GMT)
Echoes of Socratic Doubt: Embracing Uncertainty in Calibrated Evidential Reinforcement Learning [1.8] 提案アルゴリズムは,共形推論の原理に基づいて,深い明解学習と量子キャリブレーションを組み合わせる。
ミニチュア化されたアタリゲームスイート(MinAtar)でテストされる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:04:00 GMT)
RayProNet: A Neural Point Field Framework for Radio Propagation Modeling in 3D Environments [1.7] 本稿では,無線チャネルモデリングのための機械学習を利用した新しい手法を提案する。
主な材料は、ポイントクラウドベースのニューラルネットワークと、光プローブを備えた球高調波エンコーダである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:06:41 GMT)
Optimization of decoder priors for accurate quantum error correction [1.7] 本稿では,論理的誤り率の最小化を目的とした事前校正のための強化学習法を提案する。
提案手法は,GoogleのSycamoreプロセッサ上で実行された繰り返しおよび表面コードメモリ実験における復号精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:26:09 GMT)
Bayesian Mesh Optimization for Graph Neural Networks to Enhance Engineering Performance Prediction [1.7] 工学設計において、サロゲートモデルは計算コストのかかるシミュレーションを置き換えるために広く使われている。
本稿では3次元ディープラーニングに基づく代理モデルのためのベイズグラフニューラルネットワーク(GNN)フレームワークを提案する。
我々のフレームワークはベイズ最適化によってメッシュ要素の最適サイズを決定し、その結果、高精度なサロゲートモデルが得られる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:27:48 GMT)
Unified Framework for Open Quantum Dynamics with Memory [1.6] メモリカーネルと影響関数の正式な接続を示す。
また, 近似メモリカーネルを用いて, 近似パス積分法がいかに理解できるかを示す。
私たちが提供する洞察は、非マルコフ力学の理解を著しく前進させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:49:53 GMT)
Learning-Rate-Free Stochastic Optimization over Riemannian Manifolds [1.6] そこで本研究では,リーマン数に対する最適化のための革新的な学習速度自由アルゴリズムを提案する。
我々は、決定論的設定において最もよく知られた最適調整率と比較して、対数的要因まで最適である高い確率収束を保証する。
提案手法は数値実験によって検証され,学習速度依存アルゴリズムに対する競合性能が実証された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:17:24 GMT)
A Risk Estimation Study of Native Code Vulnerabilities in Android Applications [1.6] 我々は,Androidアプリケーションのネイティブな部分に関連するリスクスコアを提供する,高速なリスクベースのアプローチを提案する。
多くのアプリケーションには、誤信が潜在的に悪用する可能性のある、よく知られた脆弱性が含まれていることが示されています。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:44:07 GMT)
Posterior Inference on Shallow Infinitely Wide Bayesian Neural Networks under Weights with Unbounded Variance [1.6] 1つの隠れた層を持つベイズニューラルネットワークの無限幅スケーリング限界は、ネットワーク重みが事前の分散に束縛されたガウス過程であることが知られている。
Nealの結果は、複数の隠蔽層を持つネットワークや、ガウスのプロセススケーリング制限を伴う畳み込みニューラルネットワークにまで拡張されている。
我々の貢献は、条件付きガウス表現を用いて、後部推論の解釈可能かつ計算学的に効率的な手順であり、非ガウス系におけるトラクタブルな後部推論と不確実な定量化のためにガウス過程の機械をフル活用することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:54:55 GMT)
Linguistic Fingerprint in Transformer Models: How Language Variation Influences Parameter Selection in Irony Detection [1.6] 本研究の目的は、異なる英語のバリエーションが、皮肉検出のためのトランスフォーマーベースモデルにどのように影響するかを検討することである。
以上の結果から, 言語的差異が強い言語的差異と, より大きな相違点を示す言語的差異との類似性が示唆された。
本研究は、同一言語の異なる変種に基づいて訓練されたモデル間の構造的類似点と、これらのニュアンスを捉える際のパラメータ値の重要な役割を強調した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:09:36 GMT)
Verifying the Generalization of Deep Learning to Out-of-Distribution Domains [1.6] ディープニューラルネットワーク(DNN)は、機械学習の分野において重要な役割を果たす。
DNNは時折、一般化に伴う課題、すなわち訓練中に遭遇しなかった入力を処理できなくなることがある。
この制限は、セーフティクリティカルなタスクにディープラーニングをデプロイする上で、重要な課題である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:02:59 GMT)
Hybrid Quantum-Classical Neural Network for LAB Color Space Image Classification [1.6] 量子畳み込みニューラルネットワーク(QCNN)は、古典的畳み込みニューラルネットワークと構造的に類似している。
異なる色空間の画像の分類精度は,2つのチャンネルが3つ目よりも常に高い値を示すことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:46:56 GMT)
The computational power of random quantum circuits in arbitrary geometries [1.5] 近年のQuantinuumのH2量子コンピュータのアップグレードにより、任意の接続性を持つ最大56ドルの量子ビットと99.843(5)%の2ビットゲートフィデリティで動作できるようになった。
我々は、高度に連結されたジオメトリーにおけるランダム回路サンプリングのデータを示し、前代未聞の忠実さと、最先端の古典的アルゴリズムの能力を超えるスケールを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:20:30 GMT)
FAIRSECO: An Extensible Framework for Impact Measurement of Research Software [1.5] 研究ソフトウェアと研究ソフトウェア技術者を信用する既存の手法は不十分であることが証明されている。
FAIRSECOは,研究ソフトウェアが研究に与える影響を評価するためのオープンソースフレームワークである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:22:48 GMT)
Demonstration of two-dimensional connectivity for a scalable error-corrected ion-trap quantum processor architecture [1.5] 大規模量子コンピュータを構築するための大きなハードルは、量子ビット間の接続性を維持しながら、量子ビットの数をスケールアップすることである。
閉じ込められたイオンデバイスでは、この接続は、プロセッサにまたがる数個のイオンからなるサブレジストを物理的に移動させることによって提供される。
ここでは、長方形の2次元格子に基づいて、各格子サイトが線形なイオン列を持つサブレジスタを含むアーキテクチャに焦点を当てる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:17:04 GMT)
By Fair Means or Foul: Quantifying Collusion in a Market Simulation with Deep Reinforcement Learning [1.5] 本研究は、反復価格競争の実験的なオリゴポリーモデルを用いる。
我々は,エージェントが開発する戦略と価格パターンについて検討し,その結果を導出する可能性がある。
以上の結果から,RLをベースとしたAIエージェントは,超競争的価格帯電を特徴とする癒着状態に収束することが示唆された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:35:08 GMT)
Learned Regularization for Inverse Problems: Insights from a Spectral Model [1.5] この章は、逆問題に対する最先端の学習アプローチに関する理論的に確立された調査を提供する。
正規化法とそれらの収束を、基礎となるデータ分布の観点から拡張した定義を与える。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:49:01 GMT)
Online Fair Allocation of Perishable Resources [1.5] 我々は、標準オンラインフェアアロケーション問題の事実上の動機付け型を考察する。
意思決定者は、一定回数のラウンドを割り当てるために、パーシシブルなリソースの予算を持っている。
目標は、うらやましいほど効率的で効率的なアロケーションのシーケンスを構築することです。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:14:10 GMT)
Investigating controlled teleportation capability of quantum states with respect to $k$-separability [1.5] 両党標準テレポーテーション方式におけるテレポーテーションの忠実度について検討する。
分離可能な状態の場合、そのテレポーテーションの忠実度は閾値を超えない。
我々はこの分析を、制御テレポーテーションとして知られる多人数のシナリオに拡張する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:53:13 GMT)
Sample Complexity of Algorithm Selection Using Neural Networks and Its Applications to Branch-and-Cut [1.5] 本研究は,最適な性能を持つ1つのアルゴリズムを選択するのではなく,インスタンスに基づいてアルゴリズムを選択することが可能となるような設定を考慮し,最近の研究を基礎にしている。
特に、代表的なインスタンスのサンプルが与えられた場合、問題のインスタンスをそのインスタンスの最も適切なアルゴリズムにマッピングするニューラルネットワークを学習する。
言い換えれば、ニューラルネットワークは混合整数最適化インスタンスを入力として取り、そのインスタンスの小さな分岐とカットツリーをもたらす決定を出力する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:05:20 GMT)
PuFace: Defending against Facial Cloaking Attacks for Facial Recognition Models [1.5] 最近提案された顔認識攻撃は、ユーザーが無許可の顔認識モデルで認識されるのを防ぐために、顔画像に目に見えない摂動(クローク)を付加する。
本稿では,ニューラルネットワークの一般化能力を活用してクロークの影響を低減した画像浄化システムであるPuFaceを紹介する。
我々の実証実験は、PuFaceが2つの最先端の顔認識攻撃に対して効果的に防御でき、攻撃の成功率を平均で69.84%から7.61%に下げることを示している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:19:09 GMT)
Generator-Based Fuzzers with Type-Based Targeted Mutation [1.5] 以前の研究では、カバレッジ誘導型ファジィザは静的解析、テイント解析、制約解法を混合してこの問題に対処していた。
本稿では,Java GBFの文字列検索とともに,型ベースの突然変異を導入する。
ベースラインのGBFツールと比較すると、アプリケーションカバレッジは平均20%改善しており、サードパーティのコードを含めると、より大きく改善されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:20:13 GMT)
LACS: Learning-Augmented Algorithms for Carbon-Aware Resource Scaling with Uncertain Demand [1.4] 本稿では,未知の作業時間(OCSU)を用いたオンラインCO_2-Awareリソーススケーリング問題について検討する。
我々は,論理的に堅牢な学習拡張アルゴリズムであるLACSを提案し,OCSUを解く。
LACSは、納期を意識した炭素に依存しない作業と比較して、炭素フットプリントの32%の削減を実現している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:34:24 GMT)
Superfast Selection for Decision Tree Algorithms [1.4] 最適分割」を選択するための,超高速選択という,新しい体系的手法を提案する。
この方法は、時間的複雑さを減らし、単一機能の分割選択を高速化する。
実験によると、UDTは1秒以内にKDD99-10%データセット(41のフィーチャを持つ494Kのサンプル)で1回のトレーニングを終えることができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:19:30 GMT)
An Image Segmentation Model with Transformed Total Variation [1.3] 変換された$ell_1$正規化に基づいて、全変動(TTV)は、他の非全変動(TV)正規化器と競合する堅牢な画像回復を有する。
ファジィ・メンバシップ・イメージを用いたTTV規則化された交互方向分割-Shahモデルを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:36:22 GMT)
Discovering Dynamic Symbolic Policies with Genetic Programming [1.3] 遺伝的プログラミングが象徴的な制御系を発見するのに有効であることを示す。
これは、観測を制御信号に変換する関数の記号表現を学ぶことで達成される。
メモリのない静的制御ポリシーを実装するシステムと動的メモリベースの制御ポリシーを実装するシステムの両方を考慮する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:33:29 GMT)
Fast and Secure Decentralized Optimistic Rollups Using Setchain [1.2] レイヤ2の楽観的なロールアップ(L2)は、スマートコントラクト開発とユーザインタラクションの面で同じインターフェースを提供する、より高速な代替手段です。
本稿では,集合の非分散化ビザンチン耐性実装であるSetchainに基づく分散L2楽観的なロールアップを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:45:12 GMT)
Disentangled Representation via Variational AutoEncoder for Continuous Treatment Effect Estimation [1.1] 可変オートエンコーダ(DRVAE)を用いた新しいDose-Response曲線推定器を提案する。
我々のモデルは現在の最先端手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:41:07 GMT)
Quantum bounds for compiled XOR games and $d$-outcome CHSH games [1.1] Kalai et al. のコンパイル手順は、2種類のゲームに対する量子境界を保存することを示す。
任意の qubit の測定に対して、XOR ゲームが存在し、その最適な勝利確率はその測定の特定のペアの自己テストとして機能する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:51:27 GMT)
Enhancing Trust in LLMs: Algorithms for Comparing and Interpreting LLMs [1.1] 本稿では,大規模言語モデル(LLM)の信頼性と理解を高めるための評価手法について検討する。
主な評価指標は、パープレキシティ測定、NLPメトリクス(BLEU, ROUGE, METEOR, BERTScore, GLEU, Word Error Rate, character Error Rate), Zero-Shot and Few-Shot Learning Performance, Transfer Learning Evaluation, Adversarial Testing, Fairness and Bias Evaluationである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:54:53 GMT)
Strengthening Network Intrusion Detection in IoT Environments with Self-Supervised Learning and Few Shot Learning [1.1] IoT(Internet of Things)は、インテリジェンスを日常のオブジェクトに統合するブレークスルー技術として紹介されている。
IoTネットワークが拡大し、拡大するにつれ、サイバーセキュリティ攻撃の影響を受けやすくなっている。
本稿では,これらの課題に対処する新しい侵入検知手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:30:22 GMT)
Experimental Validation of Enhanced Information Capacity by Quantum Switch in Accordance with Thermodynamic Laws [1.0] 熱力学の法則を用いて量子スイッチの相互作用を実験的に探索する。
量子スイッチングチャネルが情報伝達能力を高める方法を示す。
制御系のコヒーレンスに付随する自由エネルギーを消費しながら, 熱状態から熱的でない状態への切り替えが可能であることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:03:51 GMT)
Composite Quantile Regression With XGBoost Using the Novel Arctan Pinball Loss [1.0] 量子回帰は、点推定だけでは不十分な条件付き量子状態を得るための一般的なアプローチである。
既存の回避策は典型的には非効率であり、深刻な量的交差をもたらす。
我々は,XGBoostのニーズに合わせて,ピンボール損失,アークタンピンボール損失のスムーズな近似を提示する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:13:29 GMT)
Can Entanglement-enhanced Quantum Kernels Improve Data Classification? [1.0] 本研究では, 量子支援ベクトルマシンにおけるエンタングルメント強化量子カーネルを用いて, 複雑な呼吸データセットのトレーニングを行った。
従来のアルゴリズムと比較すると,QSVMは複雑な呼吸データセットに対して45%高い精度で高い性能を示した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:59:28 GMT)
Isolation of individual Er quantum emitters in anatase TiO$_2$ on Si photonics [1.0] 単一光子源と量子メモリは、長距離量子ネットワークに必要な量子リピータの構成要素である。
本研究では, シリコンオン絶縁体 (SOI) 上にモノリシックに集積した二酸化チタン薄膜において, 単一Er$3+$イオンの光学的分離を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:51:23 GMT)
Dynamical Survival Analysis with Controlled Latent States [1.0] 静的な変数の集合から,個々の個別の計算過程の強度を学習するタスクについて考察する。
制御された微分方程式の解となる強度をモデル化する新しい手法を導入する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:57:58 GMT)
Superhuman performance in urology board questions by an explainable large language model enabled for context integration of the European Association of Urology guidelines: the UroBot study [0.9] UroBotはOpenAIのGPT-3.5、GPT-4、GPT-4oモデルで開発された。
評価には200の欧州耳鼻咽喉科委員会(EBU)の質問10件が含まれていた。
UroBot-4oの平均RoCAは88.4%、GPT-4oは10.8%、スコアは77.6%だった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:39:15 GMT)
Towards Generalizability of Multi-Agent Reinforcement Learning in Graphs with Recurrent Message Passing [0.9] 分散化されたアプローチでは、エージェントは与えられたグラフ内で動作し、部分的または時代遅れな観察に基づいて決定を行う。
この研究は一般化性に焦点をあて、グラフ全体の連続的な情報フローで観測された近傍のサイズのトレードオフを解消する。
我々の手法は、実行時に分散的に使用することができ、選択した強化学習アルゴリズムと組み合わせることができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:16:33 GMT)
Improved Modelling of Federated Datasets using Mixtures-of-Dirichlet-Multinomials [0.9] 連合学習を用いたトレーニングは、標準的な集中型トレーニングよりも桁違い遅くなる可能性がある。
サーバサイドプロキシデータは、トレーニングシミュレーションの実行に使用することができる。
これらのシミュレーションが実際のフェデレーショントレーニングのダイナミクスを正確に反映していることを保証することは困難である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:27:53 GMT)
Fruit Classification System with Deep Learning and Neural Architecture Search [0.9] この研究では、Avocado、Bana、Cherry、Apple Braeburn、Apple Golden 1, Apricot、Grape、Kiwi、Mango、Orange、Papaaya、Peach、Pineapple、Pomegranate、Strawberryの合計15種類の果物が特定された。
提案した99.98% mAPモデルにより,Fruitデータセットを用いた先行研究における検出性能が向上した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:41:47 GMT)
LLMs cannot find reasoning errors, but can correct them given the error location [0.9] 低い自己補正性能は、LLMが既知の誤りを訂正する能力ではなく、論理的な誤りを見つけることができないことに起因する。
我々は,そのミスフィリング能力について,最先端のLLMのいくつかをベンチマークし,そのタスクに一般的に苦労していることを示す。
そこで本研究では,地平線ラベルやドメイン内トレーニングデータを使わずに,誤った位置情報を得られることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:25:13 GMT)
Generating Synthetic Net Load Data with Physics-informed Diffusion Model [0.9] 条件付き認知ニューラルネットワークは、拡散モデルの遷移核のパラメータを共同で訓練するように設計されている。
総合的な評価指標を用いて、生成された合成ネット負荷データの正確性と多様性を評価する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:50:19 GMT)
Autonomous Adaptive Security Framework for 5G-Enabled IoT [0.9] 5Gは、より高速な接続速度、レイテンシーの低減、ダウンロードの高速化、より多くのデバイスを接続する機能を提供する。
5G対応IoTネットワークは、これらのダイナミクスによるセキュリティ脅威に対するシステムの脆弱性を増大させる。
このタスクは、セキュリティインテリジェンスの新たな適応戦略と関連するシナリオを定義し、5G-IoT特性の課題を満たす。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:17:04 GMT)
Local control and mixed dimensions: Exploring high-temperature superconductivity in optical lattices [0.8] 局所制御と光二重層機能は、ニケレートと銅酸化物高温超伝導体を研究するための多用途ツールボックスを作成する。
本研究では,コヒーレントなペアリング相関が部分的に粒子-ホール変換および回転ベースでどのようにアクセス可能であるかを示す。
本研究では, 固体実験を補完する可観測物へのアクセスを実現するため, 運動量分解ドパント密度を測定する手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:59:45 GMT)
Multi-level quantum signal processing with applications to ground state preparation using fast-forwarded Hamiltonian evolution [0.8] 大きなスペクトル半径を持つハミルトンの$H$の基底状態の合成は多くの領域で応用されている。
高速転送機能を利用するマルチレベル量子信号処理(QSP)ベースのアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:09:51 GMT)
Random Pulse Sequences for Qubit Noise Spectroscopy [0.8] クビットノイズスペクトロスコピーは、オープン量子系の実験的研究にとって重要なツールである。
ここでは、スペクトル密度を素早く特徴づける別の方法について述べる。
現実的な物理系, 自己集合量子ドット上でのランダムパルス列の性能のシミュレーションにより, ノイズスペクトルの抽出における桁違いの高速化が明らかとなった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:20:35 GMT)
Variational quantum state preparation for quantum-enhanced metrology in noisy systems [0.8] 我々は,低深さ変動量子回路(VQC)を,重畳雑音を受ける量子ビットの連鎖に適用した大域回転とエンタングリング演算からなるシミュレーションを行った。
VQCで実装されたエンタングリング操作の詳細にかかわらず、最適量子状態は、定性的な状態の三重項に広く分類できる。
この知見は,絡み合いを利用した次世代量子センサの最適状態調整戦略の設計に有用である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:09:05 GMT)
The Origin and Evolution of Information Handling [0.7] 本稿では、情報制御の開始過程と、生命の原始的な制御機構がいかに進化し、ますます洗練されていくかを説明する。
化学計算における原始遷移を正確に記述することにより、上記のギャップを説明することができる。
自由エネルギーの原理と互換性があるので、生命の起源からより高いレベルの認知までを記述できる計算エアクティビスト理論の枠組みを開発した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:02:58 GMT)
Entanglement-swapping in generalised probabilistic theories, and iterated CHSH games [0.7] 一般化確率論(GPT)における絡み合い交換の研究
我々は,GPTのパワーを計測し,非古典的相関を保ちながら繰り返しCHSHゲームを導入する。
このことは、最近文献で提起されたそのようなゲームに対する量子論の最適性に関する問題に対処する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:54:17 GMT)
The Deep Latent Space Particle Filter for Real-Time Data Assimilation with Uncertainty Quantification [0.7] 本稿では,ニューラルネットワークに基づくサロゲートモデルを用いた新しい粒子フィルタ手法であるDeep Latent Space Particle Filter(D-LSPF)を提案する。
D-LSPFは高忠実度粒子フィルタより桁違いに速く、代替手法より3~5倍速く、精度は桁違いに高い。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:59:54 GMT)
Introspective Planning: Aligning Robots' Uncertainty with Inherent Task Ambiguity [0.7] 大きな言語モデル(LLM)は高度な推論能力を示し、ロボットは自然言語の指示を理解することができる。
LLMの幻覚は、ユーザーの目標と不一致の計画を実行するロボットや、極端な場合、安全ではない。
本稿では,ロボットタスク実行のための不確実性を考慮した計画作成において,LLMを指導する体系的手法としての内省的計画の概念を考察する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:25:30 GMT)
How pure can we go with adiabatic state manipulation? [0.6] スペクトルギャップが$gamma$である純粋散逸系の遅い進化について検討する。
状態進化に対する非断熱的な補正は、デコヒーレンスを引き起こす。
本稿では,量子情報処理における速度制限について検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:59:29 GMT)
Hyperbolic Benchmarking Unveils Network Topology-Feature Relationship in GNN Performance [0.5] グラフ機械学習のための総合的なベンチマークフレームワークを導入する。
我々は,現実的なトポロジ特性とノード特徴ベクトルを持つ合成ネットワークを生成する。
その結果,ネットワーク構造とノード特徴間の相互作用にモデル性能が依存していることが明らかになった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:40:06 GMT)
Representing Piecewise-Linear Functions by Functions with Minimal Arity [0.5] 入力空間 $mathbbRn$ の関数 $F$ によるテッセルレーションは、$max$ 関数の引数の数に直結することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:39:08 GMT)
A Comparative Study of Sampling Methods with Cross-Validation in the FedHome Framework [0.5] 本稿では,家庭内健康モニタリングの個人化を目的としたFedHomeフレームワークにおけるサンプリング手法の比較検討を行った。
SMOTE, Borderline-SMOTE, Random OverSampler, SMOTE-Tomek, SVM-SMOTE, SMOTE-ENN の6つのオーバーサンプリング手法について検討した。
SMOTE-ENNは、標準偏差範囲0.0167-0.0176の最も一貫したテスト精度を達成し、他のサンプルよりも安定した性能を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:03:07 GMT)
Improving Transformers with Dynamically Composable Multi-Head Attention [0.5] MHA(Multi-Head Attention)はTransformerの重要なコンポーネントである。
パラメータとして動的に構成可能なマルチヘッドアテンション(DCMHA)を提案する。
DCMHAは、任意のトランスアーキテクチャにおけるMHAのドロップイン置換として使用することができ、対応するDCFormerを得ることができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:49:36 GMT)
Randomized Kaczmarz with geometrically smoothed momentum [0.5] ランダム化Kaczmarzアルゴリズムに幾何的に滑らかな運動量を加える効果について検討する。
最小二乗損失を定義する行列の特異ベクトルの方向の予測誤差に関する結果を証明する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 23:57:33 GMT)
Learning topological states from randomized measurements using variational tensor network tomography [0.5] 量子状態の忠実な表現を学ぶことは、量子プロセッサ上で生成される多体状態の多様性を完全に特徴づけるのに不可欠である。
本研究では,テンソルネットワーク上の変分最適化とランダムな計測手法を組み合わせたトモグラフィー手法の実装と検討を行う。
我々は、実験により実現可能な量子スピン液体状態と同様に、表面符号の基底状態を学ぶ能力を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:47:51 GMT)
Probing the Category of Verbal Aspect in Transformer Language Models [0.5] 事前訓練された言語モデルがロシア語のアスペクトの文法的カテゴリーをどう符号化するかを検討する。
代替および非代替的な文脈でBERTとRoBERTaを用いて探索を行う。
実験ではBERTとRoBERTaがアスペクトをエンコードしている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:06:03 GMT)
A Study of Optimizations for Fine-tuning Large Language Models [0.5] 微調整された大きな言語モデルは、特定のアプリケーションに適応しようとするユーザの間では一般的な選択である。
しかし、これらのモデルの微調整は、ユーザがリソース予算、ランタイム、モデルサイズ、コンテキストの長さなど、いくつかの要因を調べる必要があるため、必要なタスクである。
特定の課題は、微調整がメモリ集約であり、処理可能なハードウェアメモリとトレーニングデータのコンテキスト長に制約を課すことである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:05:47 GMT)
EuSQuAD: Automatically Translated and Aligned SQuAD2.0 for Basque [0.4] この作業は、SQuAD2.0をバスク語に自動翻訳・調整する最初のイニシアチブであるEuSQuADを提示する。
我々は、EuSQuADをトレーニングデータとしてサポートした広範囲な定性分析とQA実験により、EuSQuADの価値を実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:43:54 GMT)
Uncertainty of Joint Neural Contextual Bandit [0.4] 本稿では,1つのモデルにおける全ての推奨項目を補完する,結合型ニューラルネットワークのコンテキスト的包帯解について述べる。
パラメータ $alpha$ のチューニングは通常、その性質のため、実際は複雑である。
我々は, 統合神経コンテキストバンドモデルの不確実性$sigma$に関する理論的解析と実験的知見の両方を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:38:24 GMT)
Why Would You Suggest That? Human Trust in Language Model Responses [0.4] フレーミングと説明の存在がユーザ信頼とモデルパフォーマンスにどのように影響するかを分析する。
今後の研究は、人間と機械のチームリングシステムにおける信頼度の評価を、より深く掘り下げることを目的としている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:57:47 GMT)
Simple Cycle Reservoirs are Universal [0.4] 貯留層モデル(Reservoir model)は、トレーニング不能な入力と動的結合重みを固定したリカレントニューラルネットワークのサブクラスを形成する。
制限のない線形貯水池系を普遍的に近似できることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:11:46 GMT)
Controlled Gate Networks Applied to Eigenvalue Estimation [0.3] 制御ゲートネットワークと呼ばれる量子回路設計の新しい手法を提案する。
新しい戦略は、個々のユニタリ操作の複雑さを減らすのではなく、最も少ない数のゲートで必要なユニタリ操作を切り替えることである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:43:57 GMT)
Image contrast enhancement based on the Schrödinger operator spectrum [0.3] 本研究では,2次元シュリンガー作用素の2次元固有関数への画像投影に基づく新しい画像コントラスト強調法を提案する。
提案手法の性能をカラー画像に応用して検討した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:37:11 GMT)
Tabular and Deep Learning for the Whittle Index [0.3] 本稿では,QWIとQWINNの2つの強化学習アルゴリズムについて紹介する。
我々の主要な理論的結果において、QWI は真のウィトル指標に収束することを示す。
QWINN の場合、ベルマン誤差の局所最小値はすべて局所安定平衡であることを示す。
数値計算により、QWIとQWINNは標準Q-ラーニングアルゴリズムよりも高速に収束することが示された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:41:15 GMT)
Survey on Plagiarism Detection in Large Language Models: The Impact of ChatGPT and Gemini on Academic Integrity [0.3] 大規模言語モデル(LLM)は、学術的不正行為の急増につながっている。
AIツールが進歩し、ますます人間らしいテキストを生成するようになると、そのようなコンテンツの検出はより困難になる。
この研究はまず、LLMが学術的不正性を高めたことを実証し、その後、学術的盗作に対する最先端の解決策をレビューする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:38:03 GMT)
LADI v2: Multi-label Dataset and Classifiers for Low-Altitude Disaster Imagery [0.2] LADI v2データセットは、アメリカ合衆国でシビル・エア・パトロールによって撮影された約10,000の災害画像のキュレートされたデータセットである。
2つの事前訓練されたベースライン分類器を提供し、その性能を多ラベル分類における最先端の視覚言語モデルと比較する。
データとコードは、緊急管理研究およびアプリケーションのためのコンピュータビジョンモデルの開発をサポートするために、一般公開されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:51:04 GMT)
GEFL: Extended Filtration Learning for Graph Classification [0.2] 拡張永続化は、グラフからグローバルなマルチスケールトポロジ情報を得るための、トポロジデータ解析の技法である。
グラフ分類のための教師付き学習フレームワークに永続性の拡張を導入する。
WL[1]グラフ同型テストと0次元バーコードの両方を表現性の観点から超越した持続性を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:18:05 GMT)
Story Generation from Visual Inputs: Techniques, Related Tasks, and Challenges [0.2] この調査では、画像やビデオのキャプション、視覚的質問応答など、自動ストーリ生成に関わるタスクについても取り上げている。
これらのタスクは、視覚的なストーリー生成と共通の課題を共有し、現場で使用されるテクニックのインスピレーションとなった。
主要なデータセットと評価指標を分析し、それらの制限について重要な視点を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:07:58 GMT)
Improving Generalization in Aerial and Terrestrial Mobile Robots Control Through Delayed Policy Learning [0.2] 深層強化学習(Dreep Reinforcement Learning, DRL)は, 運動制御と意思決定の促進に向けた, 有望なアプローチとして登場した。
本稿では,DPU(Delayed Policy Updates)技術が新たな状況への一般化を促進する効果について考察する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 04:16:38 GMT)
CredSec: A Blockchain-based Secure Credential Management System for University Adoption [0.1] 本稿では,ブロックチェーンベースのセキュア認証管理システム(BCMS)を提案する。
提案したBCMSは、修正された2因子暗号化(m2FE)技術、RSA暗号システムとDNAエンコーディングを組み合わせて、認証のプライバシーを確保し、教師や学生の認証方法を強化する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:07:54 GMT)
Optimally scrambling chiral spin-chain with effective black hole geometry [0.0] ブラックホールの時空幾何学におけるディラックフェルミオンの挙動を,平均場理論が効果的に捉えたカイラルスピン鎖について検討する。
ブラックホールの内部を記述した鎖の領域では、強い相関関係が強くなり、多体カオス力学がもたらされる。
我々の発見は、ブラックホールの幾何学と量子カオスの相互作用の深い理解に寄与し、量子重力の基本的な側面に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:29:52 GMT)
kNN Classification of Malware Data Dependency Graph Features [0.0] データ依存グラフから構築した特徴に基づく分類について検討する。
特徴表現に基づく分類は精度が高いことを示す。
この結果は,データ依存グラフが意味情報と構造情報の両方を正確に捉えていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:39:02 GMT)
Window to Wall Ratio Detection using SegFormer [0.0] Window to Wall Ratios (WWR) は、建物のエネルギー、換気、日光性能を評価する鍵となる。
本稿では,既存のコンピュータビジョンウィンドウ検出手法を活用し,セマンティックセグメンテーションを用いた外部ストリートビュー画像から建物のWWRを予測する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:36:11 GMT)
Von Neumann's 1927 Trilogy on the Foundations of Quantum Mechanics. Annotated Translations [0.0] ジョン・フォン・ノイマン(John von Neumann)が1927年に発表した、量子力学の基礎に関する三部作の英訳。
20世紀の最も重要な小説の紹介と解説。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:35:55 GMT)
ViHateT5: Enhancing Hate Speech Detection in Vietnamese With A Unified Text-to-Text Transformer Model [0.0] 提案する大規模ドメイン固有データセット VOZ-HSD を事前トレーニングした T5 ベースのモデルである ViHateT5 を紹介する。
ViHateT5はテキストからテキストへのアーキテクチャのパワーを活用することで、統一モデルを使用して複数のタスクに対処し、ベトナムのすべての標準HSDベンチマークで最先端のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:51:41 GMT)
Using Explainable AI for EEG-based Reduced Montage Neonatal Seizure Detection [0.0] 新生児発作検出のゴールドスタンダードは、現在連続したビデオEEGモニタリングに依存している。
脳波モンタージュを低減した新生児発作検出プロセスを自動化するための新しい説明可能な深層学習モデルを提案する。
提案したモデルは、それぞれ曲線下面積(AUC)とリコールにおける8.31%と42.86%の絶対的な改善を達成している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:53:56 GMT)
Two dimensional quantum lattice models via mode optimized hybrid CPU-GPU density matrix renormalization group method [0.0] 2つの空間次元量子格子モデル上で量子多体問題をシミュレートするためのハイブリッド数値計算手法を提案する。
本研究では, 2次元スピンレスフェルミオンモデルと, トーラス幾何学上のハバードモデルについて, 計算時間における数桁の大きさを節約できることを実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:41:03 GMT)
Tumor likelihood estimation on MRI prostate data by utilizing k-Space information [0.0] 本研究は,前立腺癌推定におけるk-Spaceの有用性を示す。
コイル圧縮に高いアンダーサンプリング率と簡単な主成分分析(PCA)を用いることで,再構成に必要な時間を短縮する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:05:20 GMT)
TruthEval: A Dataset to Evaluate LLM Truthfulness and Reliability [0.0] 我々は、TruthEvalと呼ばれるベンチマークのためのセンシティブなトピックに関する難解なステートメントのキュレートしたコレクションを提示する。
これらのステートメントは手作業でキュレートされ、既知の真理値を含んでいる。
このデータセットを用いていくつかの初期分析を行い、単純な質問を理解できないという単純なタスクでLLMが失敗する事例をいくつか見出した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:01:35 GMT)
Towards Supervised Performance on Speaker Verification with Self-Supervised Learning by Leveraging Large-Scale ASR Models [0.0] 大規模ASRモデルからの音声表現には、貴重な話者情報が含まれる。
本稿では,事前学習したWavLMを教師付き損失で微調整することにより,SSLコンテキストで話者表現を学習するフレームワークを提案する。
提案手法はVoxCeleb1-O上で0.99%のEERを達成し,自己教師型SVにおける新たな最先端技術を確立する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:58:19 GMT)
The Qudit ZH Calculus for Arbitrary Finite Fields: Universality and Application [0.0] 原動力次元$q = pt$のクォーディットに対するグラフィカルなZH計算の一般化を提案する。
この計算は、$mathbb Cqn から mathbb Cqm$ への行列上の普遍性を示し、環 $mathbb Z[omega]$ ここで $omega$ はユニタリの$p$thルートである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:21:10 GMT)
The Art of Deception: Robust Backdoor Attack using Dynamic Stacking of Triggers [0.0] 近年の研究では、聴覚バックドアが特定の変更を開始メカニズムとして用いる可能性があることが判明している。
DynamicTriggerは動的バックドアアタックを実行するための方法論として紹介されている。
動的音源トリガーによる変動信号のサンプリング率と話者の身元をマスキングすることにより、音声認識システムを欺くことができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:50:47 GMT)
Temporal distribution of clusters of investors and their application in prediction with expert advice [0.0] 本研究では,20k外国為替(FX)トレーダーの実際の取引から得られたクラスターの分布を実証することにより,この分野に寄与する。
専門家アドバイスアルゴリズムを用いたオンライン予測アルゴリズムであるAggregating Algorithm (AA) が、上記の実世界のデータに適用でき、トレーダーリスクのポートフォリオのリターンを改善することができることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:28:06 GMT)
Technical Language Processing for Telecommunications Specifications [0.0] 大規模言語モデル(LLM)は、より多様なコンテキストに継続的に適用されています。
実際の技術資料のあるそのような分野の1つは、通信工学である。
本稿では,通信専門家が生成した技術情報を処理するためのNLPツールの限界について概説する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:57:22 GMT)
Symbiotic Connectivity: Optimizing Rural Digital Infrastructure with Solar-Powered Mesh Networks Using Multi-Objective Evolutionary Algorithms [0.0] 本稿では,ノードメッシュネットワークと再生可能エネルギーシステムとを融合した,農村接続のためのオープンソース・エコロジー統合モデルを提案する。
このモデルは、コミュニティの協力に基づいて、技術進歩と環境管理のバランスを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:54:57 GMT)
Steady-State Entanglement Generation via Casimir-Polder Interactions [0.0] 我々は、平面媒体から$sim25$nm離れた距離に配置された原子の原子-原子絡み合いダイナミクスを解析した。
完全導電および超伝導表面は, ほぼ0.5の最適定常収束値が得られることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:47:39 GMT)
Spin Orbit and Hyperfine Simulations with Two-Species Ultracold Atoms in a Ring [0.0] 集合スピンモデルを用いて、トロイダルトラップに閉じ込められた相互に相互作用する超低温ボソニック原子の2種を記述する。
線形成分はゼーマン・ハミルトニアンのアナログであり、二次成分はスピン軌道と超微細相互作用のマクロスコピックシミュレータを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:17:43 GMT)
Shape patterns in popularity series of video games [0.0] オンラインプラットフォームSteamに掲載されている約6万ゲームについて,11年間にわたる月次人気シリーズに基づく人気ゲームシリーズのパターンを調査した。
以上の結果から, 減少, 丘, 隆起, 谷, 破裂と命名された5つの形状パターン群の存在が示唆された。
人気シリーズの初期に現れる一定のパターンを除いて、ほとんどのゲームはそのパターンを時間とともに維持する傾向にあることがわかりました。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:26:19 GMT)
Semi-Supervised Learning guided by the Generalized Bayes Rule under Soft Revision [0.0] 擬似ラベル選択のためのロバストな基準としてソフトリビジョンを用いたガンマ・マキシミン法の提案
我々は,最適化問題としてソフトリビジョンを用いたガンマ・マキシミン法を用いて,最適な擬似ラベル付きデータを求めるタスクを定式化する。
特にラベル付きデータの比率が低い場合, ソフトリビジョンによるガンマ・マキシミン法は非常に有望な結果が得られることが観察された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:28:34 GMT)
Self-Trained Model for ECG Complex Delineation [0.0] 心電図(ECG)のデライン化は、正確な診断で心臓科医を支援する上で重要な役割を担っている。
我々は,ECGデライン化のためのデータセットを導入し,大量のラベルのないECGデータを活用することを目的とした,新たな自己学習手法を提案する。
我々のアプローチでは、データセットでトレーニングされたニューラルネットワークを使用してラベルなしデータの擬似ラベル付けを行い、その後、新たにラベル付けされたサンプル上でモデルをトレーニングし、デライン化の品質を高める。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:54:10 GMT)
SatSplatYOLO: 3D Gaussian Splatting-based Virtual Object Detection Ensembles for Satellite Feature Recognition [0.0] 本研究では、軌道上の未知の非協力衛星の成分のマッピングと高信頼度検出のためのアプローチを提案する。
我々は、衛星の3次元表現を学習し、ターゲットの仮想ビューをレンダリングし、仮想ビュー上でYOLOv5オブジェクト検出器をアンサンブルするために、加速3次元ガウススプラッティングを実装した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:54:20 GMT)
SMS Spam Detection and Classification to Combat Abuse in Telephone Networks Using Natural Language Processing [0.0] この研究は、ユーザのプライバシーとセキュリティに脅威をもたらすSMSスパムの広範にわたる問題に対処する。
本研究では、自然言語処理(NLP)と機械学習モデル、特にスパム検出と分類にBERT(Bidirectional Representations from Transformers)を利用した新しいアプローチを提案する。
評価の結果、Na"ive Bayes + BERT"モデルは97.31%の精度で、テストデータセットでは0.3秒で実行された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:44:36 GMT)
Room-temperature entanglement of the nickel-radical molecular complex (Et3NH)[Ni(hfac)2L] [0.0] 単核分子複合体(Et3NH)[Ni(hfac)2L]Lにおいて、二部体の絡み合いを研究する。
磁性の観点からは、分子化合物(Et3NH)[Ni(hfac)2L]は交換結合したスピン-1 Ni2+磁性イオンとスピン-1/2ニトロニル-ニトロオキシドラジカル置換ニトロフェノールからなる。
ニッケル-ラジカル分子複合体における熱絡み合いは、室温で完全に絡み合ったベル状態に対応する最大値の約40%を保持する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:31:27 GMT)
Relating non-local quantum computation to information theoretic cryptography [0.0] 非局所量子計算(NLQC)は位置検証スキームの不正な方法であり、AdS/CFT対応の文脈に現れている。
我々は、NLQCの特別な場合として、$f$-routing(英語版)と呼ばれ、シークレットプリミティブの条件開示の量子アナログと等価であることを示す。
これらの暗号プリミティブに位置検証を関連付けることで、暗号文学における多くの結果がNLQCに新しい意味を与える。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:53:52 GMT)
Reinforcement Learning Based Quantum Circuit Optimization via ZX-Calculus [0.0] 本稿では,ZX-ダイアグラムのグラフ理論的単純化規則を用いて,量子回路を最適化するための新しい強化学習法を提案する。
そこで本研究では,ZX-Calculusをベースとした最良性能のアルゴリズムと比較し,提案手法の能力を示す。
我々のアプローチは、短期中間スケール範囲(NISQ)における量子アルゴリズムの実装のための貴重なツールとして使われる準備ができている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:54:38 GMT)
Quasi-fragmentation functions in the massive Schwinger model [0.0] 我々は、コリンズ=クーパー分断関数(FF)の等時的および空間的に増強された形式を用いたクォーク準分断関数(qFF)の概念を導入する。
我々は、Kogut-Susskind Hamiltonian を用いて、2次元量子電磁力学 (QED2) におけるフェルミオンの qFF を導出した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:54:32 GMT)
Quantum states from normalizing flows [0.0] 正規化フローに基づく多体量子力学系のためのニューラル量子状態のアーキテクチャを提案する。
我々は、このアーキテクチャを地中準備とリアルタイム進化の両方に活用することを実証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:16:58 GMT)
Quantum algorithm for time-dependent differential equations using Dyson series [0.0] 誤差と微分に複雑性の対数依存を持つ時間依存線形微分方程式を解くための量子アルゴリズムを提案する。
我々の方法は、線形方程式系のダイソン級数を符号化し、最適量子線型方程式解法によって解くことである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:30:27 GMT)
Quantum Transport Theory of Strongly Correlated Matter [0.0] 本報告では, 一般相互作用ハミルトニアンに対するKubo式計算の最近の進歩について述べる。
ボルツマン方程式とホール伝導率プロキシがそれらの妥当性を超える強い散乱状態における電気的および熱的導電率を計算することを目的としている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:00:02 GMT)
Quantized tensor networks for solving the Vlasov-Maxwell equations [0.0] 本稿では量子化テンソルネットワーク(QTN)を用いた量子インスピレーション半単純Vlasov-Maxwell解法を提案する。
ここで考慮された5次元テスト問題に対して、期待される物理学を捉えるのに、控えめな$D=64$が十分であることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:55:16 GMT)
ProGEO: Generating Prompts through Image-Text Contrastive Learning for Visual Geo-localization [0.0] そこで本稿では,視覚性能を向上させるための2段階学習手法を提案する。
提案手法の有効性を複数の大規模視覚的ジオローカライゼーションデータセットで検証する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 02:28:51 GMT)
Privacy-Preserving CNN Training with Transfer Learning: Multiclass Logistic Regression [0.0] 本稿では,ただのホモモルフィック暗号化(HE)技術に基づくプライバシー保護型CNNトレーニングを実現するための実践的ソリューションを提案する。
私たちの知る限りでは、これはこのナットを突破する最初の試みであり、これまでこの目標を達成した作業はありませんでした。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:18:21 GMT)
Position: The Causal Revolution Needs Scientific Pragmatism [0.0] 因果モデルと手法は大きな可能性を秘めているが、その進歩は停滞している。
因果関係を用いた提案は、対立する2つの世界観の間で圧迫される。
システム中心の帰納的バイアスは、人間中心の哲学に置き換えられるべきである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:50:33 GMT)
Piecewise linear potentials for false vacuum decay and negative modes [0.0] 本研究では, 正接解と負のモードを, 片方向線形三角形ポテンシャルのクラスで検討する。
バウンス解と作用は、一般時空次元$D$に対して解析的に得ることができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:23:53 GMT)
Phase control of transmission and reflection in a sample of duplicated two-level systems driven by a stationary control field [0.0] プローブの反射・透過成分を吸収・増幅できることを示す。
低光深度では、反射係数と透過係数は、制御場とプローブ場の間の相対位相によって制御される。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:26:00 GMT)
Path-integral approaches to strongly-coupled quantum many-body systems [0.0] この理論の中核は、場の量子論の経路積分の定式化である。
有限サイズの量子系の処理における理論的アプローチの効率性を研究することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:44:27 GMT)
Path integrals, complex probabilities and the discrete Weyl representation [0.0] この研究はワイル代数の離散バージョンに基づいており、有限個の結果を持つ可観測物に適用できる。
この研究における複素確率の起源は完全性関係である。
離散系による無限次元量子系の近似について論じる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:34:52 GMT)
Operators of quantum theory of Dirac's free field [0.0] 自由ディラックの質量フェルミオンの量子論は、新しい保存されたスピン作用素の周りに再構成される。
これらの新しい観測器を測定する装置は、ジッタベグングやスピンダイナミクスを使わずに一粒子波束を均一に移動させて検出することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:01:48 GMT)
On the non-uniqueness of the energy-momentum and spin currents [0.0] 相対論的スピン流体力学の巨視的エネルギー-運動量とスピン密度は,それぞれの微視的定義のアンサンブル平均から得られる。
ネーターの第2定理を用いて、スピン 1-半の自由ディラック粒子に対する擬ゲージ変換を必要とせず、(対称)エネルギー-運動量テンソルと(反対称)スピンテンソルを導出する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:11:01 GMT)
NordIQuEst: the Nordic-Estonian Quantum Computing e-Infrastructure Quest [0.0] NordIQuEstはデンマーク、エストニア、フィンランド、ノルウェー、スウェーデンの科学・学術機関の国際協力団体である。
我々は、イニシアチブの概要を詳述し、プロジェクトの開始以来の進捗状況を要約し、確立されたフレームワークを説明します。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:17:02 GMT)
Non-Hermitian Casimir effect of magnons [0.0] 我々は、カシミール効果のマグノニックアナログを非エルミート系に展開する。
我々は、この非エルミートカシミール効果が、ギルバート減衰定数が増加するにつれて強化されることを示す。
以上の結果から,エネルギー散逸がカシミール工学の重要な要素であることが示唆された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:02:38 GMT)
Neural Green's Operators for Parametric Partial Differential Equations [0.0] この研究は、線形偏微分方程式(PDE)のパラメトリック族に対する解演算子を学習する新しいニューラル演算子ネットワークアーキテクチャであるニューラルグリーン演算子(NGO)を導入する。
NGOはディープ・オペレーター・ネットワーク(DeepONets)や可変ミメティック・オペレーター・ネットワーク(VarMiONs)に類似している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:02:52 GMT)
Multifractality in monitored single-particle dynamics [0.0] 繰り返し測定した単一粒子の時間発展におけるマルチフラクタル特性について検討した。
どちらの場合も、マルチフラクタルの挙動は波動関数のアンサンブルや、測定結果に条件付けられた確率分布に現れる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:01:13 GMT)
Microscopic understanding of NMR signals by dynamic mean-field theory for spins [0.0] 非局所スピンDMFT(nl-spinDMFT)の多元性アプローチ
最近開発された不規則スピン(spinDMFT)の動的平均場理論は、核スピンのスピンダイナミクスをうまく捉えている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:58:27 GMT)
Mask-based Invisible Backdoor Attacks on Object Detection [0.0] ディープラーニングモデルは、バックドア攻撃に弱い。
本研究では,マスクベースのアプローチを用いて,物体検出に対する効果的な視覚的バックドア攻撃を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:28:42 GMT)
Machine learning Hubbard parameters with equivariant neural networks [0.0] 等変ニューラルネットワークに基づく機械学習モデルを提案する。
ここでは,繰り返し線形応答計算を用いて自己整合的に計算したハバードパラメータの予測を行う。
本モデルでは,Hubbard $U$および$V$パラメータの平均絶対相対誤差を平均3%,5%とする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:21:24 GMT)
LongSSM: On the Length Extension of State-space Models in Language Modelling [0.0] 隠れた状態がゼロで訓練された状態空間モデルでは長さ拡張が困難であることを示す。
そこで本研究では,長さ拡張を改善するために,隠れ状態を変更する,シンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:02:39 GMT)
LlamaCare: A Large Medical Language Model for Enhancing Healthcare Knowledge Sharing [0.0] 24G GPUでChatGPTと同等の性能を示した。
冗長な分類解の問題を解き、拡張分類統合と呼ばれる新しいモジュールを提案することでLCMの性能を改善した。
提案手法は,ベンチマークにおける最先端モデルと密接な関係を保ちながら,同じパラメータを持つLLMと比較してGPUリソースの削減を図っている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:24:53 GMT)
Linguistic Analysis, Description, and Typological Exploration with Categorial Grammar (TheBench Guide) [0.0] TheBenchは自然言語でモナディック構造を研究するためのツールである。
モナディック文法を記述し、分析を探索し、それらのカテゴリを通して多様な言語を比較し、フォーム意味のペアから文法のモデルを訓練する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:52:20 GMT)
Learning the Hodgkin-Huxley Model with Operator Learning Techniques [0.0] 我々は,Hudgkin-Huxleyイオンモデルの膜貫通電位に時間依存の印加電流をマッピングする演算子を3つの演算子学習アーキテクチャを構築し,比較する。
これらの演算子学習手法を適切に設計することにより,Hudgkin-Huxleyイオンモデルの解を学習する際の相対的なL2誤差を1.4%以下に抑えることにより,これらの課題に効果的に対処できることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:04:54 GMT)
Krylov complexity of density matrix operators [0.0] KrylovをベースとしたKrylovの複雑性(C_K$)やSpreadの複雑性(C_S$)などが注目されている。
密度行列演算子で表される状態の複雑さを考慮し,それらの相互作用を考察する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:23:39 GMT)
Kirigami: large convolutional kernels improve deep learning-based RNA secondary structure prediction [0.0] 我々は,リボ核酸(RNA)分子の二次構造を予測するために,新しい完全畳み込みニューラルネットワーク(FCN)アーキテクチャを導入する。
深層学習を用いてヌクレオチド残基間の塩基対の確率を推定する。
広く採用されている1,305分子からなる標準化されたテストセットにおいて、本手法の精度は現在のSOTA(State-of-the-art)二次構造予測ソフトウェアよりも高い。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:58:10 GMT)
Investigating Assumptions and Proposals for Blockchain Integration in the Circular Economy. A Delphi Study [0.0] この研究は、循環経済の多くの領域における技術統合を批判的に分析し、その可能性を予測する。
結果は、循環経済の統合が成功する可能性は低いが、特定の条件が満たされた場合、長期的には成功する可能性があるという見解を支持している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:11:13 GMT)
Inverse problem in energy-dependent potentials using semiclassical methods [0.0] 半古典的なWKB法を用いて、ポテンシャル井戸の有界状態と反射/透過係数の摂動を再検討する。
次に、後者の観測値を用いてポテンシャルの性質を再構築する逆問題について議論する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:55:23 GMT)
Into the Unknown: Self-Learning Large Language Models [0.0] 本研究では,LLMが未知の知識を独立して学習することのできる自己学習フレームワークを提案する。
幻覚スコアを用いて未知の点(PiU)の新たな概念を導入する。
これは、未知のポイントにおける知識ギャップにのみ焦点をあてた、自己学習ループの作成を容易にする。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 12:44:46 GMT)
Inherent quantum resources in the stationary spin chains [0.0] 様々なスピン-1/2鎖の固有状態に多体ベル相関が本質的に存在することを示す。
特に,Lipkin-Meshkov-Glickモデルの固有状態と熱状態が多体ベル相関を持つことを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:15:17 GMT)
I've got the "Answer"! Interpretation of LLMs Hidden States in Question Answering [0.0] 本稿では,知識に基づく質問応答の文脈における大規模言語モデル(LLM)の解釈について検討する。
この研究の主な仮説は、正誤モデル行動は隠れた状態のレベルで区別できるというものである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:43:12 GMT)
How to discretize continuous state-action spaces in Q-learning: A symbolic control approach [0.0] 本稿では,空間離散化法における大きな欠点を浮き彫りにした系統解析について述べる。
この課題に対処するために,行動関係を表す記号モデルを提案する。
この関係により、オリジナルのシステムへの抽象化に基づいて、合成されたコントローラをシームレスに適用することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 13:07:40 GMT)
High fidelity two-qubit quantum state tomography of Electron-14N hybrid spin register in diamond [0.0] ダイヤモンド中の単一NV中心の14N核スピンの制御とキャラクタリゼーションの大幅な改善について報告する。
ラビ振幅量子状態トモグラフィ(RAQST)とラビ位相量子状態トモグラフィ(RPQST)という2つのサブメソッドを定義する。
Rabi ベースのトモグラフィー手法の利点は、他の手法、特に標準手法で使われるユニタリ演算の要件を引き上げることである。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:14:04 GMT)
Hiding Text in Large Language Models: Introducing Unconditional Token Forcing Confusion [0.0] 本研究では,無条件トークンフォーシングと呼ばれる抽出手法を提案する。
本研究では,無条件トークン強制に耐性のあるテキストを隠蔽する手法を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:49:06 GMT)
GP+: A Python Library for Kernel-based learning via Gaussian Processes [0.0] ガウス過程(GP)を通したカーネルベースの学習用オープンソースライブラリGP+を紹介する。
GP+はPyTorch上に構築されており、確率的学習と推論のためのユーザフレンドリでオブジェクト指向のツールを提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:34:51 GMT)
Fuzzy Convolution Neural Networks for Tabular Data Classification [0.0] 畳み込みニューラルネットワーク(CNN)は、様々な領域における顕著な性能のために、多くの注目を集めている。
本稿では,表データに適したファジィ畳み込みニューラルネットワーク(FCNN)を提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:33:35 GMT)
Fusion of deterministically generated photonic graph states [0.0] 絡み合いは、量子物理学の謎的な概念から、量子技術の鍵となる要素へと進化してきた。
ここでは、2つの原子を含む光共振器を用いてこの目標を達成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:41:54 GMT)
Flying-cat parity checks for quantum error correction [0.0] 長距離マルチキュービットパリティチェックは、量子誤差補正と測定に基づく絡み合い発生の両方に応用できる。
我々は、Schr"odinger's cat state $vertalpharanglepm vert-alpharangle$に対する量子非破壊(QND)のエンタングル演算に基づく「フライングキャット」パリティチェックについて検討する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:57:07 GMT)
Fight Scene Detection for Movie Highlight Generation System [0.0] 我々は,MHGS(Movie Highlight Generation Systems)に使用できる新しいFight Scene Detection(FSD)モデルを提供する。
提案するFSDシステムは,映画シーンの時間的特徴を利用して,戦闘シーンを自動的に識別する。
提案手法の精度は93.5%であり,Hough Forestsによる2D CNNよりも92%高く,精度が65%である3D CNNよりもかなり高い。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:18:05 GMT)
Extended Mind Transformers [0.0] ロングインプットは、推論時に情報を記憶するボトルネックになる。
微調整の必要性など,元の手法の欠点の多くを修正することが可能であることを示す。
我々は、新しい反ファクトの長距離検索ベンチマークをオープンソース化し、拡張マインドトランスフォーマーが、現在の最先端の最先端を平均6%上回っていることを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 14:00:25 GMT)
Entangling four logical qubits beyond break-even in a nonlocal code [0.0] 量子誤り訂正は、論理量子情報を環境デコヒーレンスから保護する。
我々は、4つの論理量子ビットのGHZ状態を99.5 pm 0.15 % le F le 99.7 pm 0.1%$でエンコードする(結果の98%以上でポストセレクトした後)。
我々の結果は、幾何学的に非局所的な量子低密度パリティチェック符号で符号化された論理量子ビットを用いたフォールトトレラント量子計算の実現に向けた第一歩である。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 18:00:00 GMT)
Entanglement-enhanced quantum metrology: from standard quantum limit to Heisenberg limit [0.0] エンタングルメント強化量子メートル法は、測定精度を高めるために量子エンタングルメントの利用を探求する。
量子操作と検出のための技術の急速な進歩により、多粒子の絡み合った状態の生成、操作、検出が可能になった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:42:20 GMT)
Entangled Photon-pair Generation in Nonlinear Thin-films [0.0] 非線形薄膜における自発パラメトリックダウンコンバージョンを記述するために, 完全ベクトルおよび非パラ軸形式を開発した。
非線形薄膜における絡み合った光子対生成のダイナミクスを詳細に研究する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:01:50 GMT)
Elastic Full-Waveform Inversion : How the physics of problem improves data-driven techniques? [0.0] フルウェーブフォーム・インバージョン(Full-Waveform Inversion, FWI)は、非線形反復型地震探査技術である。
FWIは地下物理特性の詳細な推定を行うことができる。
FWIの強い非線形性は、局所ミニマにおける最適化をトラップすることができる。
本稿では、時間調和FWIの解法を提案し、純粋なデータ駆動手法と比較して精度を向上させる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:30:40 GMT)
Efficient characterization of qudit logical gates with gate set tomography using an error-free Virtual-Z-gate model [0.0] クアディットに対してより効率的な GST アプローチを提案し、キュディット・アダマールと仮想Zゲートを用いてフィデューシャルを構築する。
提案手法は,評価結果の計算コストを削減し,GSTの大規模化を図る。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 11:24:00 GMT)
EchoMamba4Rec: Harmonizing Bidirectional State Space Models with Spectral Filtering for Advanced Sequential Recommendation [0.0] シークエンシャルレコメンデーションは,ユーザ行動の動的嗜好とシーケンシャルな依存関係を推定することを目的としている。
注意に基づくモデルはシーケンシャルな推薦に有効であることが証明されているが、注意機構の複雑さにより推論の効率が低下している。
本稿では、双方向処理と周波数領域フィルタリングを統合したEchoMamba4Recを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:07:58 GMT)
Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0] そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。
この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 17:15:25 GMT)
Dividing quantum circuits for time evolution of stochastic processes by orthogonal series density estimation [0.0] 量子モンテカルロ積分(Quantum Monte Carlo integration, QMCI)は、確率変数の予測を推定する量子アルゴリズムである。
本稿では直交級数密度推定に基づいて$U_X(t)$を分割する手法を提案する。
本手法は,回路深度と総クエリ複雑性のスケーリングを,それぞれ$O(sqrtN)$と$O(N3/2)$として達成する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:50:21 GMT)
Diagnostic Digital Twin for Anomaly Detection in Floating Offshore Wind Energy [0.0] 診断デジタルツインは、リアルタイムデータとモデルを組み合わせて、損傷を監視し、異常を検出し、障害を診断する資産の仮想表現である。
教師なし学習手法は、正常な動作モデルを構築し、異常を検出し、故障診断を提供するために用いられる。
この論文は、オフショアエンジニアリングのより広い文脈で診断デジタル双生児について議論することで締めくくっている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 20:45:20 GMT)
Demonstration of Erasure Conversion in a Molecular Tweezer Array [0.0] 本研究では, 内部状態の誤りと量子消去を, 既知位置の量子ビット誤差として検出する手法を提案する。
これにより、低い欠陥率で分子配列を作成することができ、量子多体系の高忠実度シミュレーションへの扉を開くことができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:07:24 GMT)
Deep ReLU networks and high-order finite element methods II: Chebyshev emulation [0.0] ディープフィードフォワードReLUニューラルネットワーク(NN)のソボレフノルムにおける発現速度と安定性を示す。
チェビシェフ展開係数の観点から関数近似を符号化するReLU NNの新しい構成法を開発した。
モノミアルのReLU NNエミュレーションに基づく構造よりも優れた発現速度と安定性のバウンドが得られた。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 08:19:46 GMT)
Convergence Analysis of Fractional Gradient Descent [0.0] 最適化のためには、分数微分を用いて性質の収束を理解することが重要である。
本稿では,分数勾配降下のポテンシャルを解析する。
実験結果が提示されます
論文参考訳(メタデータ) (Tue, 4 Jun 2024 05:40:40 GMT)
Complete positivity violation of the reduced dynamics in higher-order quantum adiabatic elimination [0.0] 本稿では,複合リンドブラッドシステムのモデル還元手法である量子断熱除去について論じる。
還元力学の完全肯定性が高次寄与に反する2つの例を示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 01:40:36 GMT)
Communication Complexity of Graph Isomorphism, Coloring, and Distance Games [0.0] 最適な条件下では,完全非署名戦略が通信複雑性を崩壊させることを示す。
意外なことに、非シグナリング戦略は、古典的および量子的戦略と比較して、新しいゲームにとってより微妙な区別を提供する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 10:53:16 GMT)
Beyond trace class -- Tensor products of Hilbert spaces and operator ideals in quantum physics [0.0] バナッハ作用素のイデアルは量子物理学と量子情報理論の基礎と哲学に潜んでいる。
我々はヒルベルト空間 $Hotimes (K otimes L)$ と $(H otimes K) otimes L$ (Theorem 3.8) の間の正準同型を確立し、トレースクラス作用素の役割を再考する。
ヒルベルト・シュミット作用素のクラスの有効性や、2つの複素空間$H otimes K$ (Proposition 3.4) のテンソル積の暗黙のバナッハ作用素の理想表現など、いくつかの応用が特定されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 22:48:49 GMT)
Asymptotic Purification of Quantum Trajectories under Random Generalized Measurements [0.0] 定常雑音下でのランダムな測定を繰り返すことによって生じる量子軌道について検討する。
量子状態の結果として生じる軌道は、ランダムな環境における時間的不均一なマルコフ連鎖である。
我々は、このランダム部分空間の集合が空である場合にのみ、浄化が生じることを証明している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:36:27 GMT)
Application of ZX-calculus to Quantum Architecture Search [0.0] 本稿では,ZX計算と遺伝的プログラミング(GP)を融合した量子アーキテクチャ探索手法を提案する。
本稿では,量子回路の可視化と操作を簡略化するグラフィカル言語ZX-calculusを用いて定義された突然変異を利用するGPフレームワークを提案する。
以上の結果から, 量子アーキテクチャ探索(QAS)におけるZX計算に基づく変異は, 検討された全ての指標において, 他よりも有意に優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:05:40 GMT)
Antiferromagnetic bosonic $t$-$J$ models and their quantum simulation in tweezer arrays [0.0] 本研究では, 局所ヒルベルト空間を3つの内部原子状態あるいは分子状態の集合に符号化することで, ボゾンt-Jモデルを実現する実験手法を提案する。
スピン間の反強磁性(AFM)カップレートの工学的結合により、高T_c$カップレートと同様の電荷運動と磁気秩序の競合を実現することができる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 19:21:39 GMT)
Analyzing the Feature Extractor Networks for Face Image Synthesis [0.0] 本研究では,FID,KID,Precision/Recallといったさまざまな指標を考慮した多様な特徴抽出器(InceptionV3,CLIP,DINOv2,ArcFace)の挙動について検討した。
実験には、$L$正規化、抽出中のモデル注意、機能空間におけるドメイン分布など、機能に関する詳細な分析が含まれている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:41:40 GMT)
Analyzing the Effect of Combined Degradations on Face Recognition [0.0] 露光条件下で拡張した実世界の劣化パイプラインを用いて, 単一・複合劣化の影響を解析した。
その結果, 単一および複合劣化は異種モデル挙動を示すことが明らかとなった。
この研究は、実世界の環境における顔認識モデルの堅牢性を評価するために、実世界の複雑さを考慮に入れることの重要性を強調している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:29:59 GMT)
An agent-based model of modal choice with perception biases and habits [0.0] 本稿では,習慣や知覚バイアスといった人的要因の影響を受け,エージェントによる移動選択モデルを提案する。
Netlogoシミュレータで実装されており、モビリティの知覚に関するオンライン調査の結果から校正されている。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:44:57 GMT)
Alternative Methods to SHAP Derived from Properties of Kernels: A Note on Theoretical Analysis [0.0] 本研究では,LIME のカーネルにおける AFA (Additive Feature Attribution) の一般的および分析的表現を導出する。
我々は、カーネルの適切な性質を持つ新しいAFAや、協調ゲーム理論におけるLS前核と一致するいくつかの新しいAFAを提案する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 15:16:28 GMT)
Adaptive multiple optimal learning factors for neural network training [0.0] 提案した適応多重最適学習因子(AMOLF)アルゴリズムは,乗算毎の誤差変化に基づいて動的に学習因子数を調整する。
この論文は、目的関数の曲率に基づいて重みをグループ化する手法や、大きなヘッセン行列を圧縮する手法も導入している。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 21:18:24 GMT)
Accelerating Quantum Computations of Chemistry Through Regularized Compressed Double Factorization [0.0] 分子ハミルトニアンの圧縮表現を計算するための正規化圧縮二重分解法(RC-DF)を提案する。
すでに12から20キュービットの小型システムでは、NISQ測定方式が測定基地数を減少させることがわかった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:03:45 GMT)
A table-top high-sensitivity gyroscope based on slow light and cavity enhanced photon drag [0.0] 高感度ジャイロスコープは、基礎物理学の研究と地球の振舞いの微妙な変化のモニタリングの両方に不可欠である。
本稿では,光子ドラッグに基づく卓上ジャイロスコープの高感度実装法を理論的に提案する。
この研究は、地球の自転速度と向きの小さな変化を正確に検出する方法を練り上げ、少量の機器で一般相対性理論によって予測される測地的およびフレーム描画効果をテストできる。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 03:56:04 GMT)
A rank decomposition for the topological classification of neural representations [0.0] この研究では、ニューラルネットワークが連続的なピースワイズアフィンマップと等価であるという事実を活用している。
多様体 $mathcalM$ と部分集合 $A$ の商のホモロジー群を研究し、これらの空間上のいくつかの極小性質を仮定する。
ランダムに狭いネットワークでは、データ多様体の(コ)ホモロジー群が変化する領域が存在することを示す。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:47:30 GMT)
A new quantum computational set-up for algebraic topology via simplicial sets [0.0] simplicial set theoryに基づく代数トポロジーの量子計算フレームワークについて述べる。
提案された集合は任意のパラ有限単純集合に適用され、それを有限次元の単純ヒルベルト空間に関連付けることによって進行する。
simplicial homology spaceとsimplicial setのベッチ数を計算することができる量子アルゴリズムスキームを概説する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 07:44:18 GMT)
A multilingual dataset for offensive language and hate speech detection for hausa, yoruba and igbo languages [0.0] 本研究では,ナイジェリアの3大言語であるHausa,Yoruba,Igboにおいて,攻撃的言語検出のための新しいデータセットの開発と導入の課題に対処する。
私たちはTwitterからデータを収集し、それを手動でアノテートして、ネイティブスピーカーを使用して、3つの言語毎にデータセットを作成しました。
学習済み言語モデルを用いて、データセット中の攻撃的言語の検出の有効性を評価し、最高の性能モデルが90%の精度で達成した。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 09:58:29 GMT)
A Temporal Kolmogorov-Arnold Transformer for Time Series Forecasting [0.0] Temporal Kolmogorov-Arnold Transformer (TKAT)は、データストリームの時間パターンをキャプチャするために設計された、新しいアテンションベースのアーキテクチャである。
TKATは、TFT(Temporal Fusion Transformer)にインスパイアされた強力なエンコーダ・デコーダモデルとして登場し、観測された特徴が既知の部分よりも重要となるタスクを処理する。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 16:55:42 GMT)
A Survey of Unikernel Security: Insights and Trends from a Quantitative Analysis [0.0] 本研究では、TF-IDFを用いた定量的手法を用いて、ユニカーネル研究文献におけるセキュリティ議論の焦点の分析を行う。
メモリ保護拡張とデータ実行防止は最も頻度の低いトピックであり、SGXは最も頻繁なトピックであった。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 00:51:12 GMT)
A Novel Implementation of Marksheet Parser Using PaddleOCR [0.0] OCRを使ってアップロードされたマークシートを読み、オンライン形式で行や列を自動的に埋めるシステムを構築した。
システムはテストされ、7つの州で評価された。
論文参考訳(メタデータ) (Tue, 4 Jun 2024 06:51:03 GMT)