EasyInv: Toward Fast and Better DDIM Inversion [107.5] 本稿では DDIM インバージョンへの容易かつ斬新なアプローチである EasyInv を紹介する。
EasyInvの中核となるのは、逆ノイズを近似するための洗練された戦略です。
我々は、EasyInvが従来のDDIMインバージョン手法と同等かそれ以上の結果を提供することができることを説明している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:31:02 GMT)
VITA: Towards Open-Source Interactive Omni Multimodal LLM [106.5] ビデオ, 画像, テキスト, 音声の同時処理と解析に適応した, MLLM (Multimodal Large Language Model) を初めて導入したVITAについて紹介する。
VITAは、多言語、視覚、および音声理解の堅牢な基礎機能を示す。
我々はMLLMにおける非覚醒相互作用と音声割り込みを利用する最初の人物である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:59:49 GMT)
A Survey on Graph Neural Networks for Time Series: Forecasting, Classification, Imputation, and Anomaly Detection [98.4] 時系列分析は、利用可能なデータに暗黙的な情報の富を解放するために不可欠である。
グラフニューラルネットワーク(GNN)の最近の進歩は、時系列解析のためのGNNベースのアプローチの急増につながっている。
この調査は、GNNベースの時系列研究に関する膨大な知識をまとめ、基礎、実践的応用、時系列分析のためのグラフニューラルネットワークの機会を強調します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:39:41 GMT)
What Evidence Do Language Models Find Convincing? [94.9] 議論の的になっているクエリと、さまざまな事実を含む実世界の証拠文書を組み合わせたデータセットを構築します。
このデータセットを用いて、感度と反ファクト分析を行い、どのテキスト特徴がLLM予測に最も影響するかを探索する。
全体として、現在のモデルは、クエリに対するWebサイトの関連性に大きく依存している一方で、人間が重要と考えるスタイル的特徴をほとんど無視している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:00:19 GMT)
Mini-Monkey: Multi-Scale Adaptive Cropping for Multimodal Large Language Models [87.1] Mini-Monkeyは、マルチスケール適応作物戦略(MSAC)と呼ばれるプラグアンドプレイ方式を組み込んだ軽量MLLMである。
Mini-Monkeyは適応的にマルチスケールの表現を生成し、様々なスケールから非セグメンテーションオブジェクトを選択できる。
OCRBenchでは、Mini-Monkeyは802のスコアを獲得し、8Bパラメーターの最先端モデルであるInternVL2-8Bを上回っている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:01:11 GMT)
On the Element-Wise Representation and Reasoning in Zero-Shot Image Recognition: A Systematic Survey [82.5] ゼロショット画像認識(ZSIR)は、目に見えない領域の認識と推論をモデルに与えることを目的としている。
本稿では,近年の素子ワイドZSIRの進歩について概説する。
まず、オブジェクト認識、合成認識、基礎モデルに基づくオープンワールド認識という3つの基本的なZSIRタスクを、統一された要素的視点に統合する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:49:21 GMT)
DeepInteraction++: Multi-Modality Interaction for Autonomous Driving [80.9] 我々は,モダリティごとの個別表現を学習し,維持することのできる,新しいモダリティインタラクション戦略を導入する。
DeepInteraction++はマルチモーダルなインタラクション・フレームワークであり、マルチモーダルな表現型インタラクション・エンコーダとマルチモーダルな予測型インタラクション・デコーダを特徴とする。
実験では,3次元物体検出とエンドツーエンドの自律走行の両方において,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:04:21 GMT)
Kalman-Inspired Feature Propagation for Video Face Super-Resolution [78.8] 時間前に安定した顔を維持するための新しい枠組みを導入する。
カルマンフィルタの原理は,従来の復元フレームからの情報を用いて,現在のフレームの復元過程をガイドし,調整することができる。
ビデオフレーム間で顔の細部を連続的にキャプチャする手法の有効性を実験により実証した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:57:12 GMT)
DreamLCM: Towards High-Quality Text-to-3D Generation via Latent Consistency Model [77.8] 本稿では,LCM(Latent Consistency Model)を組み込んだDreamLCMを提案する。
提案手法は, 対象3次元モデルの最適化のために, 高精度かつ詳細な勾配を与えることができる。
DreamLCMは、生成品質とトレーニング効率の両面で最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:12:49 GMT)
Hyper-YOLO: When Visual Object Detection Meets Hypergraph Computation [74.7] 本稿では,画像特徴量間の複雑な高次相関を捉えるためにハイパーグラフ計算を統合する新しいオブジェクト検出手法を提案する。
Hyper-YOLOは、高度なYOLOv8-NとYOLOv9Tを12%のtextval$と9%のAPMoonLabの改善で大幅に上回っている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:21:15 GMT)
CULTURE-GEN: Revealing Global Cultural Perception in Language Models through Natural Language Prompting [73.9] 110か国・地域での3つのSOTAモデルの文化認識を,文化条件付き世代を通して8つの文化関連トピックについて明らかにした。
文化条件付き世代は、デフォルトの文化と区別される余分な文化を区別する言語的な「マーカー」から成り立っていることが判明した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:06:02 GMT)
LLaVA-VSD: Large Language-and-Vision Assistant for Visual Spatial Description [73.8] ビジュアル空間記述は、画像内のオブジェクト間の空間的関係を記述するテキストを生成することを目的としている。
LLaVA-VSDは視覚空間関係の分類、記述、オープンな記述のために設計されている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:22:40 GMT)
MambaByte: Token-free Selective State Space Model [71.9] マンババイト(英: MambaByte)は、マンバSSMがバイト配列で自己回帰的に訓練したトークンレス適応である。
MambaByteは、言語モデリングタスクにおいて、最先端のサブワードトランスフォーマーよりも優れています。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:18:57 GMT)
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models [71.4] 本稿では,多目的なマルチモーダル大言語モデルであるmPLUG-Owl3を提案する。
具体的には、視覚と言語を共通の言語誘導意味空間に効率的に統合する新しいハイパーアテンションブロックを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:25:42 GMT)
Performative Prediction on Games and Mechanism Design [69.8] 具体的ゲーム理論における演出予測について検討する。
よりよいトレードオフを実現し、それらをメカニズム設計に使用する方法を示します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:03:44 GMT)
DeVAn: Dense Video Annotation for Video-Language Models [68.7] 実世界のビデオクリップに記述を生成する視覚言語モデルの有効性を評価するために,人間の注釈付きデータセットを提案する。
データセットには、20秒から60秒間の8.5KのYouTubeビデオクリップが含まれており、幅広いトピックや関心事をカバーしている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:26:01 GMT)
UVMap-ID: A Controllable and Personalized UV Map Generative Model [67.7] 制御可能でパーソナライズされたUVマップ生成モデルであるUVMap-IDを導入する。
従来の2次元の大規模学習法とは異なり,本研究では,事前学習したテキスト・画像拡散モデルの微調整を提案する。
定量的および定性的な解析は、制御可能でパーソナライズされたUVマップ生成における本手法の有効性を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:05:09 GMT)
GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI [67.1] LVLM(Large Vision-Language Model)は、画像、テキスト、生理学的信号などの多様なデータタイプを扱うことができる。
GMAI-MMBenchは、よく分類されたデータ構造と、これまででもっとも包括的な一般医療用AIベンチマークである。
その結果,高度なGPT-4oでも52%の精度しか得られず,改善の余地は有意であった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:59:52 GMT)
Fast Peer Adaptation with Context-aware Exploration [63.1] マルチエージェントゲームにおける学習エージェントに対するピア識別報酬を提案する。
この報酬は、効果的な探索と迅速な適応のための文脈認識ポリシーを学ぶためのエージェントのモチベーションとなる。
我々は,競争力のある(クーンポーカー),協力的(PO-Overcooked),あるいは混合的(Predator-Prey-W)な(Pedator-Prey-W)ゲームを含む多種多様なテストベッドについて評価を行った。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:05:39 GMT)
Efficient Multimodal Large Language Models: A Survey [60.8] MLLM(Multimodal Large Language Models)は、視覚的質問応答、視覚的理解、推論などのタスクにおいて顕著な性能を示す。
モデルサイズと高いトレーニングと推論コストが、MLLMのアカデミックや産業への応用を妨げている。
本調査は,効率的なMLLMの現状を包括的かつ体系的に概観するものである。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:28:14 GMT)
Multi-Granularity Hand Action Detection [58.9] FHA-Kitchensデータセットは2,377のビデオクリップと30,047フレームで構成され、約200kのバウンディングボックスと880のアクションカテゴリがアノテートされている。
このデータセットは2,377のビデオクリップと30,047フレームで構成され、約200kのバウンディングボックスと880のアクションカテゴリが注釈付けされている。
MG-HAD (End-to-End Multi-Granularity Hand Action Detection) を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:19:42 GMT)
PDDLEGO: Iterative Planning in Textual Environments [56.1] テキスト環境における計画は、現在のモデルにおいても長年にわたる課題であることが示されている。
我々は,あるサブゴールの部分的な計画に導く計画表現を反復的に構築するPDDLEGOを提案する。
数ショットのPDDLEGOで作成するプランは,Coin Collectorシミュレーションでエンドツーエンドのプランを生成するよりも43%効率がよいことを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:18:23 GMT)
FUSE-ing Language Models: Zero-Shot Adapter Discovery for Prompt Optimization Across Tokenizers [55.2] FUSEは、あるモデルのテキスト埋め込み空間から別のモデルへのマッピングを行うアダプタ層を、異なるトークン化器にまたがっても近似するアプローチである。
画像キャプションと感情に基づく画像キャプションのための視覚言語モデルと因果言語モデルに対する多目的最適化によるアプローチの有効性を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:16:37 GMT)
A Modular Approach for Multimodal Summarization of TV Shows [55.2] 分離されたコンポーネントが特別なサブタスクを実行するモジュール方式を提案する。
我々のモジュールは、シーン境界の検出、異なるイベント間のカット回数の最小化、視覚情報をテキストに変換すること、各シーンの対話を要約すること、シーン要約をエピソード全体の最終要約に融合することを含む。
我々はまた、生成した要約の精度とリコールを計測し、原子事実に分解する新しい測度であるPRISMAを提示する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:48:52 GMT)
Pair then Relation: Pair-Net for Panoptic Scene Graph Generation [54.9] Panoptic Scene Graph (PSG) は、ボックスの代わりにパン光学セグメンテーションを使用して、より包括的なシーングラフ表現を作成することを目的としている。
現在のPSGメソッドは性能が限られており、下流のタスクやアプリケーションを妨げる。
Pair then Relation (Pair-Net) - Pair Proposal Network (PPN) を用いて、対象と対象間の疎対関係を学習・フィルタリングする。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:08:32 GMT)
ProFuser: Progressive Fusion of Large Language Models [53.7] トレーニングモードと推論モードの両方を組み込むことで、融合プロセスを強化する新しいアプローチを導入する。
本手法は,トレーニング中のクロスエントロピーだけでなく,推論出力も考慮してモデル優位性を評価する。
ProFuserの有効性を検証するために, vicuna-7b-v1.5, Llama-2-7b-chat, mpt-7b-8k-chatの3つのモデルを融合した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:18:29 GMT)
Spherical World-Locking for Audio-Visual Localization in Egocentric Videos [53.7] 我々は,エゴセントリックなシーン表現のための一般的なフレームワークとして,球状ワールドロックを提案する。
従来の2次元平面場を持つ自己中心表現と比較して、SWLは自動による課題を効果的に相殺する。
シーン表現の球面構造を保存する統一エンコーダデコーダトランスアーキテクチャを設計する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:29:04 GMT)
Tabular Transfer Learning via Prompting LLMs [53.0] 大規模言語モデル(LLM)を用いたラベル付き(あるいは異種)ソースデータを利用した新しいフレームワークPrompt to Transfer (P2T)を提案する。
P2Tは、ターゲットタスク機能と強く相関しているソースデータセットの列の特徴を特定し、ターゲットタスクに関連する例を作成し、プロンプトの擬似宣言を生成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:30:52 GMT)
Decoding Quantum LDPC Codes Using Graph Neural Networks [52.2] グラフニューラルネットワーク(GNN)に基づく量子低密度パリティチェック(QLDPC)符号の新しい復号法を提案する。
提案したGNNベースのQLDPCデコーダは,QLDPC符号のスパースグラフ構造を利用して,メッセージパスデコーダとして実装することができる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:47:49 GMT)
In Defense of Lazy Visual Grounding for Open-Vocabulary Semantic Segmentation [50.8] 我々は,非教師対象マスク発見の2段階的アプローチである遅延視覚接地を行い,それに続いて物体接地を行う。
私たちのモデルは、追加のトレーニングは必要ありませんが、5つの公開データセットで優れたパフォーマンスを示します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:28:35 GMT)
Inspecting and Editing Knowledge Representations in Language Models [49.8] ニューラル言語モデル(英語版)(LM)は、テキストによって記述された世界に関する事実を表す。
本稿では,自然言語におけるステートメントを,LMの内部表現システムにおけるファクトエンコーディングにマッピングする方法であるREMEDIについて述べる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:00:11 GMT)
Proceedings of the 21st International Conference on Quantum Physics and Logic [49.2] QPLは毎年恒例のカンファレンスであり、量子計算、量子物理学、および関連する分野の数学的基盤に取り組んでいる学術的、産業的な研究者を集めている。
主な焦点は、代数的および分類的構造、形式言語、意味論的方法、および物理系、物理過程、およびそれらの構成の研究に適用可能な他の数学的およびコンピュータ科学技術の使用である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:04:17 GMT)
On estimating the entropy of shallow circuit outputs [49.2] 確率分布と量子状態のエントロピーを推定することは情報処理の基本的な課題である。
本稿では,有界ファンインと非有界ファンアウトのゲートを持つ対数深度回路か定数深度回路のいずれかによって生成された分布や状態に対するエントロピー推定が,少なくともLearning with Errors問題と同程度難しいことを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:41:42 GMT)
Lindbladian reverse engineering for general non-equilibrium steady states: A scalable null-space approach [49.2] NESS を対象とするリンドバルディアン・マスター方程式を再構成する手法を提案する。
相関行列の核(ヌル空間)はリンドブラディアン解に対応する。
ボソニックガウスから散逸駆動の集合スピンまで、様々なシステムでこの方法を説明する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:00:18 GMT)
h4rm3l: A Dynamic Benchmark of Composable Jailbreak Attacks for LLM Safety Assessment [48.6] 我々は,静的なデータセットや攻撃や被害を克服するために,構成可能なジェイルブレイク攻撃の新たなベンチマークを提案する。
我々は、h4rm3lを使用して、6つの最先端(SOTA)オープンソースおよびプロプライエタリなLLMをターゲットにした2656の新たなジェイルブレイク攻撃のデータセットを生成する。
合成攻撃のいくつかは、以前報告した攻撃よりも効果的であり、SOTAクローズド言語モデルでは、アタック成功率は90%以上である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:45:39 GMT)
Paradigm Completion for Derivational Morphology [48.4] 派生形態学はNLPでは見落とされた問題である。
本稿では、帰納的パラダイム補完の課題を、帰納的パラダイム補完の並列化として紹介する。
我々は、最先端のニューラルモデルが様々な派生パターンを学習でき、非神経ベースラインを16.4%上回っていることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:44:35 GMT)
Can a Bayesian Oracle Prevent Harm from an Agent? [48.1] 我々は、所定の安全仕様に違反する確率に基づいて、文脈依存境界を推定することを検討する。
世界の異なる仮説が全く異なる結果をもたらす可能性があることに注意し、我々は真だが未知の仮説の下で予測される安全違反の確率に基づいて導かれる。
iidの場合と非idの場合の2つの形態を考察し、その結果を実用的なAIガードレールに変換するためのオープンな問題に結論付ける。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:10:42 GMT)
Do Sharpness-based Optimizers Improve Generalization in Medical Image Analysis? [47.3] Sharpness-Aware Minimization (SAM)は、一般的なドメイン画像データセットの一般化性能を高める可能性を示している。
本研究は、深層学習ネットワークの一般化を改善するための、近年のシャープネスに基づく手法を提供し、医療用胸部超音波画像上での評価を行う。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:31:03 GMT)
Relevance Filtering for Embedding-based Retrieval [46.9] 埋め込み型検索では、ANN(Approximate Nearest Neighbor)検索により、大規模データセットから類似したアイテムを効率的に検索することができる。
本稿では,この課題に対処するために,埋め込み型検索のための新しい関連フィルタリングコンポーネント("Cosine Adapter" と呼ぶ)を提案する。
少ないリコールの損失を犠牲にして、回収したセットの精度を大幅に向上することが可能です。
論文参考訳(メタデータ) (Fri, 09 Aug 2024 06:21:20 GMT)
AmbigDocs: Reasoning across Documents on Different Entities under the Same Name [46.3] 混乱したエンティティの言及を扱うことは、言語モデル(LM)にとって重要なスキルである。
この機能をテストするために、新しいベンチマークであるAmbigDocsを導入しました。
あいまいな名前とそれに対応する答えの集合を含む質問を生成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:40:51 GMT)
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations [45.6] AURORAデータセット(AURORA data)は、ビデオやシミュレーションエンジンから人間に注釈を付け、キュレートされた高品質なトレーニングデータの集合である。
AURORA-finetuned model on a new expert-curated benchmark across 8 various editing task。
我々のモデルは従来の編集モデルよりもはるかに優れており、人間のレーティングによって判断される。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:03:59 GMT)
Topological transitions in quantum jump dynamics: Hidden exceptional points [45.6] 例外点(EP)に関連する現象は超伝導回路に関して広く研究されている。
計測された3レベル系を考慮し、数え上げ場の関数と見なされるリンドブラディアン固有値に複数のEPを求める。
これらの遷移によって影響を受ける動的観測変数を同定し、実験によって測定された量子ジャンプ分布から基礎となるトポロジーをどのように回収できるかを実証する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:00:02 GMT)
Vision Language Models for Spreadsheet Understanding: Challenges and Opportunities [45.1] 本稿では,スプレッドシート理解における視覚言語モデルの有用性について考察する。
我々は,OCR,空間認識,視覚的フォーマット認識のVLMを評価するための評価指標を用いた3つの自己監督的課題を提案する。
以上の結果から,VLMは有望な機能を示すが,細胞欠失や不適応による不満足な結果をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:30:15 GMT)
On the Liouville-von Neumann equation for unbounded Hamiltonians [45.0] M. Courbage による Liouville superoperator の領域の特性について論じる。
また、明示的な証明とともに、リウヴィリアの本質的な自己随伴性(コア)のいくつかの領域も提供する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:13:35 GMT)
PriPHiT: Privacy-Preserving Hierarchical Training of Deep Neural Networks [44.0] エッジデバイスとクラウドサーバの両方でディープラーニングモデルのトレーニングフェーズを実行する方法を提案する。
提案するプライバシ保存方法は,敵の早期出口を利用してエッジのセンシティブなコンテンツを抑制し,タスク関連情報をクラウドに送信する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:33:34 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [43.6] 本稿では,知識グラフタスクに大規模言語モデル(LLM)を活用する新しいフレームワークである知識グラフ大言語モデル(KG-LLM)を紹介する。
まず、構造化知識グラフデータを自然言語に変換し、次にこれらの自然言語プロンプトを微調整 LLM に変換する。
KG-LLMフレームワークの有効性を示すため,Flan-T5,LLaMa2,Gemmaの3つのLLMを微調整した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:39:05 GMT)
RadarPillars: Efficient Object Detection from 4D Radar Point Clouds [42.9] 本稿では,柱型物体検出ネットワークRadarPillarsを提案する。
放射速度データを分解することにより、RadarPillarsは、View-of-Delftデータセットの最先端検出結果を大幅に上回る。
これはパラメータ数を大幅に削減し、既存のメソッドを効率面で上回り、エッジデバイス上でのリアルタイムパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:13:38 GMT)
Beyond the Eye: A Relational Model for Early Dementia Detection Using Retinal OCTA Images [42.8] 早期発症アルツハイマー病 (AD) と軽度認知障害 (MCI) をコントロールから識別するために, 網膜光コヒーレンストモグラフィー (OCTA) を用いた新しいPolarNet+を提案する。
提案手法は,まずカルト座標から極座標へのOCTA画像のマッピングを行う。
次に,包括的かつ臨床的に有用な情報抽出のための3次元画像のシリアライズと解析を行う多視点モジュールを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:10:34 GMT)
SHIELD: LLM-Driven Schema Induction for Predictive Analytics in EV Battery Supply Chain Disruptions [42.5] ShiELDは、大型言語モデル(LLM)とEVバッテリサプライチェーンリスクアセスメントのためのドメインの専門知識を組み合わせたものだ。
365の資料(2022-2023)から12,070段落を評価したところ、ShiELDは破壊予測においてベースラインGCNとLLM+prompt法より優れていた。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:08:12 GMT)
Minimal Areas from Entangled Matrices [41.9] 本稿では, 絡み合いエントロピーの最小化を図り, 龍高柳式に類似点が多いことを示す。
我々の構成は、絡み合いエッジモード、非可換幾何学、量子内部参照フレームの物理をまとめる。
微視的導出には粗粒化が不可欠であることが判明し,高度に湾曲した非幾何学的部分領域の増殖を制御した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:00:03 GMT)
Ab-initio variational wave functions for the time-dependent many-electron Schrödinger equation [41.9] 本研究は, フェルミオン時間依存波動関数に対する変動的アプローチを導入し, 多体相関を捉えることで平均場近似を超越した。
時間依存変動モンテカルロ法を用いて最適時間依存パラメータを効率的に計算する。
この結果は、量子状態の時間的進化を正確に捉えるための、我々の変分的アプローチの能力を示している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:35:09 GMT)
Cell Morphology-Guided Small Molecule Generation with GFlowNets [41.8] 本稿では,GFlowNetsの報酬として潜在類似性を定義するために,教師なしマルチモーダルジョイント埋め込みを提案する。
提案したモデルでは、与えられた画像ターゲットと類似した表現型効果を生じさせる新しい分子の生成を学習する。
提案手法は, ターゲットに高い形態的, 構造的類似性を有する分子を生成し, 類似した生物活性の可能性が高まることを示した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:40:35 GMT)
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model [41.3] 初期ビジョン言語Fusion-based SAM (EVF-SAM) について紹介する。
EVF-SAMは、マルチモーダルプロンプト(画像とテキスト)を利用する、シンプルだが効果的な参照セグメンテーション手法である
BEIT-3をベースとしたEVF-SAMにより,RefCOCO/+/gにおける表現セグメンテーションの最先端性能が得られた。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:52:31 GMT)
TaSL: Task Skill Localization and Consolidation for Language Model Continual Learning [41.3] 言語モデル継続学習(CL)は、大規模な言語モデルを動的現実環境に適応させる可能性を秘めているため、最近大きな関心を集めている。
この分野で重要な課題は、新しいタスクを学ぶ際に、モデルが以前獲得した知識を失う、破滅的な忘れことである。
既存の手法では、タスク毎のタスク固有の知識を得るために、複数のパラメータ効率の良い微調整ブロック(PEFT)を用いることが多いが、これらの手法は効率を欠き、タスク間相互作用による知識伝達の可能性を見落としている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:44:45 GMT)
CodeAgent: Enhancing Code Generation with Tool-Integrated Agent Systems for Real-World Repo-level Coding Challenges [41.0] 大規模言語モデル(LLM)は自動コード生成において有望であるが、通常は単純なタスクでのみ優れている。
私たちの研究は、実世界のリポジトリレベルのコード生成という、より現実的な設定でLLMを評価することに向かっています。
我々は,効率的なリポジトリレベルのコード生成に外部ツールを利用する,新しいLLMベースのエージェントフレームワークであるCodeAgentを紹介する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:16:55 GMT)
Livestock Fish Larvae Counting using DETR and YOLO based Deep Networks [39.9] 魚の幼虫を数えることは、水生栽培において重要な、しかし必要で時間のかかる作業である。
魚類幼生計数作業において,畳み込みニューラルネットワークやトランスフォーマーを含む4つのニューラルネットワークアーキテクチャを評価した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:36:56 GMT)
Constant-Time Quantum Search with a Many-Body Quantum System [39.6] 並列クエリに自然に影響を及ぼす多体量子システムを考える。
パラメータを一定時間でデータベースを検索するように調整できることが示される。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:57:59 GMT)
DocMath-Eval: Evaluating Math Reasoning Capabilities of LLMs in Understanding Long and Specialized Documents [38.5] 本稿では,LLMの数値推論能力を評価するベンチマークであるDocMath-Evalを紹介する。
我々は,48 LLMをChain-of-Thought法とProgram-of-Thought法で評価する。
我々は、最も優れたシステム(GPT-4o)でさえ、長い文脈に根ざした複雑な数値推論問題の解法において、人間の専門家よりかなり遅れていることを発見した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:57:26 GMT)
Exploring Self-Supervised Vision Transformers for Deepfake Detection: A Comparative Analysis [38.1] 本稿では,教師付き事前学習型視覚変換器(ViTs)と従来のニューラルネットワーク(ConvNets)とを比較し,顔深度画像やビデオの検出に有効であることを示す。
これは、特に限られたトレーニングデータを用いて、一般化と説明可能性を改善する可能性について検討する。
SSL ViTsを利用して、平易なデータによるディープフェイク検出と部分的な微調整を行い、注意機構を介してディープフェイク検出と説明可能性に匹敵する適応性を見出す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:38:35 GMT)
Enhancing Surface Neural Implicits with Curvature-Guided Sampling and Uncertainty-Augmented Representations [37.4] 本研究では,高忠実度3次元再構成作業において,深度画像を直接消化する手法を提案する。
高効率なトレーニングデータを生成するため,簡単なサンプリング手法を提案する。
その単純さにもかかわらず、本手法は古典的および学習的ベースラインの両方に優れる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:52:15 GMT)
Report on the 1st Workshop on Large Language Model for Evaluation in Information Retrieval (LLM4Eval 2024) at SIGIR 2024 [37.1] 本研究の目的は,情報検索における評価のためのLLMの話題を中心に,情報検索研究者を集結させることである。
このトピックの新規性を考えると、ワークショップは多面的な議論に焦点を当てていた。
論文参考訳(メタデータ) (Fri, 09 Aug 2024 23:55:58 GMT)
LLMJudge: LLMs for Relevance Judgments [37.1] この挑戦は、SIGIR 2024のLLM4Evalワークショップの一部として組織されている。
近年の研究では,LLMが検索システムに対して信頼性の高い妥当性判定を生成できることが示されている。
収集したデータは、自動関連判断研究を支援するパッケージとして公開される。
論文参考訳(メタデータ) (Fri, 09 Aug 2024 23:15:41 GMT)
DisenSemi: Semi-supervised Graph Classification via Disentangled Representation Learning [36.9] 本研究では,半教師付きグラフ分類のための不整合表現を学習するDisenSemiという新しいフレームワークを提案する。
具体的には,非教師付きモデルと教師なしモデルの両方に対して因子ワイドグラフ表現を生成するために,非教師付きグラフエンコーダを提案する。
教師付き客観情報と相互情報(MI)に基づく制約によって2つのモデルを訓練する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:23:12 GMT)
Learning to Generate Parameters of ConvNets for Unseen Image Data [36.7] ConvNetは大量の画像データに依存しており、ネットワークパラメータを学習するための反復最適化アルゴリズムを採用している。
本稿では,新しい学習パラダイムを提案し,予測タスクにConvNetのパラメータ学習を定式化する。
提案手法は,2種類の画像データセットに対して有効であることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:35:45 GMT)
Surveying the Landscape of Image Captioning Evaluation: A Comprehensive Taxonomy and Novel Ensemble Method [35.7] 本稿では,70以上の画像キャプション指標の初回調査と分類について紹介する。
提案されたメトリクスの多様性にもかかわらず、ほとんどの研究は5つの人気のあるメトリクスに頼っている。
本研究では,人間の判断と最も高い相関性を示す評価手法のアンサンブルであるEnsembEvalを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:31:06 GMT)
Natural Language Outlines for Code: Literate Programming in the LLM Era [35.5] 我々は、開発者がAI支援を提供するための新しいモダリティとインタラクションサーフェスとして、自然言語のアウトラインを使うことを提案する。
コード関数のNLアウトラインは、簡潔な散文で書かれた複数のステートメントを含み、コードを分割し、その主要なアイデアをリテラトプログラミングのスタイルで要約する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:22:51 GMT)
The Rlign Algorithm for Enhanced Electrocardiogram Analysis through R-Peak Alignment for Explainable Classification and Clustering [34.9] 我々は,サポートベクタマシンや主成分分析などの浅層学習技術をECG信号処理に再導入することを目指している。
そこで我々は,ECG信号を完全に構造化されたフォーマットに効果的に再構成する変換を開発し,評価した。
我々のアプローチは、特に限られたトレーニングデータを扱う場合、CNNよりも浅い機械学習手法に顕著な優位性を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:05:22 GMT)
Improving Large Language Models in Event Relation Logical Prediction [33.9] イベント関係抽出は、綿密な意味的理解と厳密な論理的推論を必要とする課題である。
本稿では,イベント関連論理の理解と適用におけるLLMの能力について,詳細な調査を行う。
本研究により,LLMは論理的に一貫した推論子ではないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:14:44 GMT)
Generalisation First, Memorisation Second? Memorisation Localisation for Natural Language Classification Tasks [33.1] 記憶は、現実世界のデータから学ぶ自然な部分です。
記憶は局所的なものではなく,段階的なプロセスであることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:30:57 GMT)
ProxyCLIP: Proxy Attention Improves CLIP for Open-Vocabulary Segmentation [32.9] オープン語彙セマンティックセグメンテーションは、視覚表現とセマンティックラベルを統合するモデルを必要とする。
本稿では,CLIP(Contrastive Language- Image Pre-Training)とVFM(Vision Foundation Models)の強みを調和させるフレームワークであるProxyCLIPを紹介する。
トレーニングなしのアプローチとして、ProxyCLIP は平均的な平均接点(mIoU)を40.3から44.4までの8つのベンチマークで大幅に改善する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:17:00 GMT)
Unsupervised Episode Detection for Large-Scale News Events [32.6] エピソード構造は本質的に解釈可能であり、大規模キーイベントの進化に適応可能である。
本稿では,重要なイベント記事を含むニュースコーパスからエピソードを識別する新しいタスクであるエピソード検出について紹介する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:26:31 GMT)
Img-Diff: Contrastive Data Synthesis for Multimodal Large Language Models [32.6] 本研究は,MLLMにおけるきめ細かい画像認識を強化するために,Img-Diffという新しいデータセットを提案する。
類似画像間のオブジェクト差を解析することにより、マッチングと異なるコンポーネントの両方を識別するモデルに挑戦する。
我々は、安定拡散XLモデルと高度な画像編集技術を用いて、オブジェクト置換をハイライトする類似画像のペアを作成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:24:34 GMT)
HiRoPE: Length Extrapolation for Code Models Using Hierarchical Position [31.8] 階層型回転位置埋め込み(HiRoPE)について紹介する。
HiRoPEは、ソースコードの階層構造に基づいた階層形式への伝統的な回転位置埋め込みを強化する。
我々は,この分野でのさらなる開発を促進するために,現実世界のコードプロジェクトに対して,新たな長大なコード理解タスクを導入する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:15:19 GMT)
Distributionally Robust Policy Evaluation under General Covariate Shift in Contextual Bandits [31.6] 本稿では,オフライン政策評価の信頼性を高めるための分散ロバストな手法を提案する。
本手法は, 状況と政策分布の両面での相違点が存在する場合に, 堅牢な政策評価結果を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:14:53 GMT)
Loc4Plan: Locating Before Planning for Outdoor Vision and Language Navigation [31.5] VLN(Vision and Language Navigation)は、視覚環境において、エージェントが指示を理解し、目的地にナビゲートする必要がある課題である。
これまでの研究は主に、自然言語を視覚入力に基盤付けることに焦点を当てていたが、接地過程におけるエージェントの空間的位置情報の重要な役割を無視した。
本研究では,屋外VLNタスクにおける行動計画のための空間認識を取り入れた新しい枠組みであるLocating be for Planning(Loc4Plan)を紹介する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:31:09 GMT)
AutoGen Studio: A No-Code Developer Tool for Building and Debugging Multi-Agent Systems [31.1] ATOGEN STUDIOは、マルチエージェントシステムを迅速にプロトタイピングするためのノーコード開発ツールである。
エージェント仕様のための直感的なドラッグ&ドロップUI、インタラクティブな評価、再利用可能なエージェントコンポーネントのギャラリーを提供する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:27:37 GMT)
Coding-PTMs: How to Find Optimal Code Pre-trained Models for Code Embedding in Vulnerability Detection? [30.8] 本研究では,10種類のコード PTM が生成したコード埋め込みが脆弱性検出性能に与える影響について検討する。
我々は,特定の脆弱性検出タスクに対して,エンジニアが最適なコードPTMを選択するのを支援するための推奨フレームワークであるCoding-PTMを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:56:26 GMT)
OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation [30.8] 従来の3Dシーン理解アプローチでは、高価なラベル付き3Dデータセットを使用して、単一のタスクに対してモデルのトレーニングと監視を行う。
我々は,3次元シーン再構成とオープン語彙理解をニューラルラディアンスフィールドで統合する新しいフレームワークOpenOccを提案する。
提案手法は3次元シーン理解タスクにおいて,特に小型・長距離オブジェクトにおいて,競争性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:00:21 GMT)
Envisioning Future Deep Learning Theories: Some Basic Concepts and Characteristics [30.4] 将来的な深層学習理論は,3つの特徴を継承すべきである,と我々は主張する。 階層構造型ネットワークアーキテクチャ, 勾配法を用いてテキストに最適化されたパラメータ, テキスト圧縮的に進化するデータからの情報。
我々はこれらの特徴をTextitneurashedと呼ばれるグラフィカルモデルに統合し、ディープラーニングにおける一般的な経験的パターンを効果的に説明する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:33:00 GMT)
Efficient automatic segmentation for multi-level pulmonary arteries: The PARSE challenge [30.3] textbfPulmonary textbfARtery textbfSEgmentation (PARSE)チャレンジは、マルチレベルPAセグメンテーションアルゴリズムをベンチマークするために実施された。
本稿では,上位アルゴリズムの要約と,効率的かつ高精度なマルチレベルPA自動セグメンテーションを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:17:53 GMT)
Enhancing the Code Debugging Ability of LLMs via Communicative Agent Based Data Refinement [29.7] 本稿ではまず,大規模言語モデル(LLM)のデバッグ能力を評価するためのベンチマークであるEVALを紹介する。
Masterは、教師付き微調整のための定義されたタスクに従って洗練されたコードデータを生成する。
最後に、Code Learnerは、批評家として機能し、解決できない発生した問題を予約する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:35:44 GMT)
UNIC: Universal Classification Models via Multi-teacher Distillation [29.3] 我々は、いくつかの補完的な事前訓練されたモデルから得られるユニークなエンコーダを学ぼうとしている。
このようなエンコーダをマルチティーチンガー蒸留により学習することを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:18:57 GMT)
GaussianTalker: Speaker-specific Talking Head Synthesis via 3D Gaussian Splatting [27.7] GaussianTalkerは3D Gaussian Splattingに基づく音声駆動音声ヘッド合成手法である。
話者固有のモーショントランスレータは、普遍化音声特徴抽出により、対象話者固有の正確な唇の動きを達成する。
Dynamic Gaussian Rendererは話者固有のBlendShapesを導入し、潜在ポーズを通じて顔の詳細表現を強化する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:45:26 GMT)
Generative AI on SpectrumNet: An Open Benchmark of Multiband 3D Radio Maps [27.5] 本稿では、SpectrumNetデータセット生成のためのパラメータと設定を紹介し、SpectrumNetデータセットに基づいて、無線マップ構築のための3つのベースライン手法を評価する。
実験では、空間、周波数、シナリオドメインを強く一般化したトレーニングモデルのためのSpectrumNetデータセットの必要性が示されている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:54:11 GMT)
Bootstrap Latents of Nodes and Neighbors for Graph Self-Supervised Learning [27.3] 対照的な学習は、モデルの崩壊を防ぎ、差別的な表現を学ぶために負のサンプルを必要とする。
我々は、アンカーノードに対する隣人の支持率を予測するために、クロスアテンションモジュールを導入する。
本手法は, 負の正試料と雑音の正試料とのクラス衝突を緩和し, クラス内コンパクト度を同時に向上する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:17:52 GMT)
DataNarrative: Automated Data-Driven Storytelling with Visualizations and Texts [27.2] データストーリ生成のための新しいタスクと,さまざまなソースから1,449のストーリを含むベンチマークを導入する。
2つのLLMエージェントを用いたマルチエージェントフレームワークを提案する。
我々のエージェント・フレームワークは一般的にモデルベースと人的評価の両方において非エージェント・フレームワークよりも優れていますが、結果はデータ・ストーリー・ジェネレーションにおけるユニークな課題を明らかにします。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:31:33 GMT)
Diffusion Reward: Learning Rewards via Conditional Video Diffusion [26.7] Diffusion Rewardは、条件付きビデオ拡散モデルを通じて専門家のビデオから報酬を学ぶフレームワークである。
シミュレーションプラットフォームと実世界の両方におけるロボット操作タスクに対する視覚入力の有効性を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:06:42 GMT)
Evaluating Language Model Math Reasoning via Grounding in Educational Curricula [25.5] 本研究は,言語モデル(LM)の数学的能力を評価するために,数学的内容によって実現されるスキルや概念を識別できるかどうかを考察する。
1つは、Achieve the Core(ATC)のK-12数学スキルと概念を385のきめ細かい記述からなり、もう1つは、これらの標準(MathFish)でラベル付けされた9.9K問題の1つである。
経験豊富な教師と一緒に働くと、LMは問題に関連する標準をタグ付けして検証するのに苦労し、代わりに、真実に近いが微妙な方法で異なるラベルを予測することに気付きます。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:51:05 GMT)
MVMR: A New Framework for Evaluating Faithfulness of Video Moment Retrieval against Multiple Distractors [24.9] 本稿では,MVMR(Massive Videos Moment Retrieval for Faithfulness Evaluation)タスクを提案する。
それは、VMRモデルの忠実さを評価するために、複数のイントラクタを含む巨大なビデオセット内でビデオモーメントを検索することを目的としている。
そこで本研究では, 自動大容量ビデオプール構築フレームワークの提案を行い, 負(ディトラクタ)と正(偽)の動画セットを分類する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:53:10 GMT)
Advancing Prompt Learning through an External Layer [24.8] 本稿では,新しい外部層(EnLa)を備えたEnPromptというパラダイムを提案する。
学習可能な外部レイヤは、トレーニング済みのCLIPの有効な埋め込みに基づいて構築される。
4つの実験により,本手法が既存の即時学習法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:09:44 GMT)
L4DR: LiDAR-4DRadar Fusion for Weather-Robust 3D Object Detection [24.6] L4DRは,LiDARと4Dレーダ融合を効果的に実現する3次元物体検出法である。
我々のL4DRには、センサギャップを再現するためのマルチモーダルMMEとフォアグラウンド・アウェア・デノナイジング(FAD)技術が含まれています。
霧のレベルによってパフォーマンスが大幅に向上し、3D mAPは従来のLiDARのみのアプローチよりも最大20.0%向上した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:59:36 GMT)
TrajCogn: Leveraging LLMs for Cognizing Movement Patterns and Travel Purposes from Trajectories [24.4] S時間軌道は様々なデータマイニング作業において重要である。
異なるタスクを高精度に行う多目的軌跡学習法を開発することが重要である。
モデルキャパシティの制限と、トラジェクトリデータセットの品質とスケールのため、これは難しい。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:54:41 GMT)
Adversarially Robust Industrial Anomaly Detection Through Diffusion Model [24.0] そこで本研究では, 拡散モデルを用いて, 逆解析器と逆解析器の両方を動作させることができる, 簡易かつ効果的な逆解析手法である textitAdvRAD を提案する。
提案手法は,産業用異常検出ベンチマークデータセットの最先端手法と同等に強い異常検出性能を維持しつつ,優れた(認証された)対向性を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:25:19 GMT)
TrajFM: A Vehicle Trajectory Foundation Model for Region and Task Transferability [23.9] 望ましい軌道学習モデルは、再訓練することなく、異なる領域とタスク間を移動すべきである。
そこで我々は,TrajFMを提案する。TrajFMは,領域とタスクの移動性の両方に優れる車両軌道基礎モデルである。
様々な環境下での2つの実世界の車両軌道データセットの実験は、TrajFMの有効性を実証している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:40:44 GMT)
Explainable AI Reloaded: Challenging the XAI Status Quo in the Era of Large Language Models [23.5] 我々は、人間中心の視点が説明可能な(XAI)への道のりであると論じる。
ブラックボックスの外側の説明可能性、ブラックボックスの端付近の説明可能性、インフラの縫い目を利用した説明可能性の3つの側面に沿って、XAI研究による議論を運用する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:28:31 GMT)
PTrajM: Efficient and Semantic-rich Trajectory Learning with Pretrained Trajectory-Mamba [22.6] 車両軌道は様々な現実世界の用途に重要な移動情報を提供する。
移動や旅行目的を含む豊かな意味情報を効率的に抽出する軌道学習手法を開発することが不可欠である。
本稿では,効率的な意味豊かな車両軌道学習法であるPTrajMを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:48:51 GMT)
Logically Constrained Robotics Transformers for Enhanced Perception-Action Planning [22.0] 本稿では、軌道計画のための自己回帰変換器モデルを用いて、信号時間論理仕様の因子を新たに提案する。
提案手法はベースラインよりも74.3%高い仕様満足度を実現する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:13:08 GMT)
SELD-Mamba: Selective State-Space Model for Sound Event Localization and Detection with Source Distance Estimation [21.8] 選択状態空間モデルであるMambaを利用するSELD-Mambaと呼ばれるSELDのネットワークアーキテクチャを提案する。
本研究では,イベント独立ネットワークV2(EINV2)を基本フレームワークとして採用し,コンバータブロックを双方向のMambaブロックに置き換える。
本研究では,2段階の訓練手法を実装し,第1段階は音事象検出(SED)とDoAの方向推定損失に着目し,第2段階は音源距離推定(SDE)の損失を再導入する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:26:08 GMT)
IllusionVQA: A Challenging Optical Illusion Dataset for Vision Language Models [21.6] IllusionVQA: 難解な錯視と難解なシーンのデータセットを提示する。
人間の評価は、人間が理解と局在において91.03%と100%の精度を達成することを明らかにしている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:26:02 GMT)
A Survey on Deep Neural Network Pruning-Taxonomy, Comparison, Analysis, and Recommendations [21.0] 現代のディープニューラルネットワークには、膨大な計算とストレージリソースを必要とする巨大なモデルサイズが伴っている。
研究者たちは、ニューラルネットワーク圧縮の一般的な研究方向として、プルーニングテクニックを探求している。
我々は,1)普遍的/特異的なスピードアップ,2)いつプーンするか,3)プーンする方法,および4)プルーニングと他の圧縮技術との融合について,ディープニューラルネットワークプルーニングに関する既存の研究成果をレビューする。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:44:50 GMT)
RuleFuser: An Evidential Bayes Approach for Rule Injection in Imitation Learned Planners for Robustness under Distribution Shifts [20.4] RuleFuserは、ILプランナーと古典的なルールベースのプランナーを組み合わせることで、両方の相補的な利点を引き出す。
我々のアプローチは現実世界のnuPlanデータセットでテストされ、ILプランナよりも平均38.43%の安全性向上を実現しています。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:31:44 GMT)
Beyond Item Dissimilarities: Diversifying by Intent in Recommender Systems [20.0] 我々は,提案システムの最終段階を対象とした確率論的意図に基づく全ページ多様化フレームワークを開発する。
さまざまな意図のライブ実験は、私たちのフレームワークがデイリーアクティブユーザーを増やし、全体のユーザーを楽しませていることを示している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:04:19 GMT)
TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation [20.0] テトラ拡散(TetraDiffusion)は、3次元空間の四面体分割で動作する拡散モデルであり、効率的で高分解能な3次元形状生成を可能にする。
注目すべきは、TetraDiffusionは前例のない解像度で、ほぼリアルタイムで詳細な3Dオブジェクトの迅速なサンプリングを可能にすることだ。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:57:51 GMT)
Model Debiasing by Learnable Data Augmentation [19.6] 本稿では,トレーニングを正規化可能なデータ拡張戦略を備えた,新しい2段階学習パイプラインを提案する。
合成および現実的なバイアス付きデータセットの実験は、最先端の分類精度を示し、競合する手法より優れている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:19:59 GMT)
Instruction-tuning Aligns LLMs to the Human Brain [19.5] 命令チューニングが大規模言語モデルと人間の言語処理機構の整合性に及ぼす影響について検討する。
インストラクションチューニングは一般に脳のアライメントを高めるが、行動アライメントに類似した影響はない。
LLMにおける世界知識を符号化するメカニズムは、人間の脳への表現的アライメントを改善することも示唆している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:33:58 GMT)
GeniL: A Multilingual Dataset on Generalizing Language [19.4] 生成言語におけるステレオタイプの存在を評価するための現在の手法は、単純なテンプレートや共起に基づく尺度に依存している。
意味的文脈を理解することは一般化の事例を検出するために重要であると論じる。
我々は、一般化の例に注釈を付けた9言語から50K以上の文からなる多言語データセットGeniLを構築した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:20:27 GMT)
Modeling Electromagnetic Signal Injection Attacks on Camera-based Smart Systems: Applications and Mitigation [18.9] 電磁波は安全またはセキュリティクリティカルなシステムに脅威をもたらす。
このような攻撃により、攻撃者はリモートで画像を操作でき、誤ったAI判断につながる。
本研究は,攻撃に対する堅牢性を向上させるための対人訓練に関するパイロット研究である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:33:28 GMT)
LiD-FL: Towards List-Decodable Federated Learning [18.9] 本稿では,中央サーバが敵のリストを維持できる,リスト記述可能なフェデレーション学習のためのアルゴリズムフレームワークを提案する。
実験結果から,提案アルゴリズムは様々な攻撃において悪意ある多数派に耐えうることが示された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:29:02 GMT)
LLMind: Orchestrating AI and IoT with LLM for Complex Task Execution [18.8] 我々は,IoTデバイス間の効果的なコラボレーションを可能にするタスク指向AIフレームワークであるLLMindを紹介する。
脳の機能的特殊化理論に触発されて、我々のフレームワークはLLMとドメイン固有のAIモジュールを統合する。
複数のドメイン固有のAIモジュールとIoTデバイスのコラボレーションを含む複雑なタスクは、コントロールスクリプトを介して実行される。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:07:49 GMT)
UGrid: An Efficient-And-Rigorous Neural Multigrid Solver for Linear PDEs [18.5] 本稿では,線形PDEに対する数学的に厳密なニューラルソルバについて述べる。
U-NetとMultiGridを原理的に統合したUGridソルバは、収束性と正確性の両方の数学的に厳密な証明である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:46:35 GMT)
Indian-BhED: A Dataset for Measuring India-Centric Biases in Large Language Models [18.2] 大規模言語モデル(LLM)は社会的バイアスを符号化し、ユーザを表現上の害に晒す。
本研究は,LLMにおけるステレオタイプバイアスを,そのタイプデータセットであるIndian-BhEDを用いて,インド中心のフレームに従って定量化する。
テストされたLLMの大多数は、インドの文脈でステレオタイプを出力する確率が強いことが判明した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:36:00 GMT)
Preserving Multilingual Quality While Tuning Query Encoder on English Only [17.8] 二重エンコーダの問合せ部が英語のみのデータセットで調整された場合、多言語検索の品質がどの程度劣化するかを調べることを目的として実験を行った。
我々は、英語のみのチューニングが、多言語検索の本来の品質を保っているだけでなく、改善していることを観察する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:02:12 GMT)
Towards Consistent Object Detection via LiDAR-Camera Synergy [17.7] 物体の位置を点雲と画像の両方で検出できる既存のモデルは存在しない。
本稿では,エンドツーエンドの一貫性オブジェクト検出(COD)アルゴリズムフレームワークを提案する。
本稿では,点雲と画像間の物体相関の精度を評価するために,新しい評価指標である一貫性精度(Consistency Precision)を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:49:50 GMT)
GlitchProber: Advancing Effective Detection and Mitigation of Glitch Tokens in Large Language Models [17.6] 大規模言語モデル(LLM)は、自然言語処理の分野で前例のない成功を収めた。
最近の研究では、モデルの語彙空間に異常トークンのクラスを発見し、それらを「グリッチトークン」と名付けた。
本研究では,グリッチトークンの理解を深め,その検出と緩和のための手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:19:53 GMT)
Constant-time Motion Planning with Anytime Refinement for Manipulation [17.5] 本研究では,CTMP(Constant-time Motion Planners)アルゴリズムと組み合わせたリアルタイム改良手法を提案する。
提案するフレームワークは,定数時間アルゴリズムとして動作するため,ユーザ定義時間しきい値内の初期解を高速に生成する。
任意の時間アルゴリズムとして機能し、割り当てられた時間予算内で、ソリューションの品質を反復的に改善します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:51:33 GMT)
Your Classifier Can Be Secretly a Likelihood-Based OOD Detector [17.4] Intrinsic Likelihood (INK) を提案する。
INKは、far-OODと near-OODを含む様々なOOD検出設定において、新しい最先端技術を確立している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:00:53 GMT)
Range Membership Inference Attacks [17.3] 本研究では,RaMIA(Ra Range Membering Inference attack)のクラスを導入し,モデルが特定の範囲の任意のデータに対してトレーニングされたかどうかを検証した。
各種データ上でのMIAよりも,プライバシ損失をより正確に,包括的に捉えることができることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:39:06 GMT)
Byzantine-Resilient Federated PCA and Low Rank Column-wise Sensing [17.2] 本研究は,フェデレーション・プリンシパル・コンポーネント分析(PCA)とフェデレーション・ローランク・カラム・ワイド・センシング(LRCS)の2つの関連する学習問題を考察する。
ノード攻撃はビザンティンであると仮定され、これは攻撃者は全能であり、共謀できることを意味する。
本稿では,PCA問題の解法として,LRCS問題の鍵となる部分であるSubspace-Medianという,ビザンチン耐性のある通信効率・サンプリング効率のアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:01:03 GMT)
Get Confused Cautiously: Textual Sequence Memorization Erasure with Selective Entropy Maximization [17.2] 大規模言語モデル(LLM)は、トレーニングセットの冗長性からいくつかのテキストシーケンスを暗記し、引用することが発見されている。
このTSM(Textual Sequence Memorization)現象は、特定の記憶されたテキストを生成するのを防ぐために、LCM出力の調整を要求される。
TSM消去のための既存の方法は、モデルユーティリティを実質的に損なうことなく、大量の記憶されたサンプルを忘れることができない。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:26:11 GMT)
DCNv3: Towards Next Generation Deep Cross Network for CTR Prediction [17.2] 本稿では,次世代のディープクロスネットワークであるディープクロスネットワークv3(DCNv3)と,CTR予測のための2つのサブネットワークであるリニアクロスネットワーク(LCN)と指数クロスネットワーク(ECN)を提案する。
6つのデータセットに関する総合的な実験は、DCNv3の有効性、効率、解釈可能性を示している。
論文参考訳(メタデータ) (Fri, 09 Aug 2024 06:31:56 GMT)
HETHUB: A Distributed Training System with Heterogeneous Cluster for Large-Scale Models [17.1] 大規模モデルのトレーニングは、膨大な数のコンピューティングリソースに依存している。
ひとつのタイプのGPUアクセラレータを備えた大規模クラスタを構築するのは、非常に難しい。
本稿では,大規模モデルを対象としたハイブリッド並列処理を用いた分散トレーニングシステムHETHUBを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:38:07 GMT)
An Evaluation of Standard Statistical Models and LLMs on Time Series Forecasting [16.6] 本研究では,大言語モデルが時系列予測の文脈で直面する重要な課題を明らかにする。
実験結果から、大規模な言語モデルは特定のデータセットのゼロショット予測において良好に機能するが、様々な時系列データや従来の信号に直面すると、予測精度は顕著に低下することが示された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:13:03 GMT)
FuXi-ENS: A machine learning model for medium-range ensemble weather forecasting [16.6] 我々は,最大15日間のグローバルアンサンブル天気予報を実現するために設計された,高度なMLモデルであるFuXi-ENSを紹介する。
FuXi-ENS は空間分解能が 0.25 度大きく向上し、13の圧力レベルで5つの大気変数と13の表面変数が組み込まれている。
その結果,FXi-ENSは360変数の98.1%のCRPSと予測リードタイムの組み合わせで,世界有数のNWPモデルであるECMWFのアンサンブル予測よりも優れていた。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:14:05 GMT)
DreamCouple: Exploring High Quality Text-to-3D Generation Via Rectified Flow [16.1] 我々はSDS (Score Distillation Sampling) を正流に適応させ, オーバースムース化問題を再検討する。
我々は,NeRF法と3Dガウス法の両方に適用し,最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:40:20 GMT)
Don't Complete It! Preventing Unhelpful Code Completion for Productive and Sustainable Neural Code Completion Systems [16.0] 現在、大きな事前訓練された言語モデルは、ニューラルコード補完システムに広く適用されている。
Github Copilotの表示されたコード補完の約70%は、開発者に受け入れられていない。
本稿では,コード補完性能を予見することで,低リターンプロンプトを停止させる早期リジェクション機構を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:10:49 GMT)
Linear quadratic control of nonlinear systems with Koopman operator learning and the Nyström method [16.0] 計算量を大幅に削減するために,ランダムな部分空間をどのように利用できるかを示す。
我々の主な技術的貢献は、Nystr"om近似の効果に関する理論的保証を導出することである。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:49:58 GMT)
Optimizing Crowd-Aware Multi-Agent Path Finding through Local Communication with Graph Neural Networks [15.9] 混在環境におけるマルチエージェントパス探索 (MAPF) は, 移動計画において困難な問題となる。
本稿では,この問題を解決するために,クラウド対応の分散強化学習手法であるCRAMPを紹介する。
CRAMPは, メースパンと衝突数で測定された溶液品質を最大59%改善し, 従来の方法と比較して最大35%改善した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:39:10 GMT)
Generating novel experimental hypotheses from language models: A case study on cross-dative generalization [15.7] 我々は、シミュレーション学習者としてLMを用いて、人間と実験するための新しい実験仮説を導出する。
子ども指向の音声で訓練されたLMを用いて,クロスダクティブ・ジェネリゼーション(CDG)について検討した。
被曝条件の最初の言語的議論が固有であり, 明確で, 短く, かつ, 被曝条件の原型的アニマシー期待に適合している場合, CDGは促進される。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:17:36 GMT)
Tensor Frames -- How To Make Any Message Passing Network Equivariant [15.7] 等価なメッセージパッシングアーキテクチャを構築するための新しいフレームワークを提案する。
我々は、点雲上の通常のベクトル回帰について、最先端の結果を生成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:40:27 GMT)
On the Geometry of Deep Learning [15.3] 本稿では,深層ネットワークのアフィンスプラインマッピングの幾何特性の解明について概説する。
ご覧のように、アフィンスプライン接続と幾何学的視点は、ディープネットワークの内部構造を閲覧、分析、改善するための強力なポータルを提供する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:40:12 GMT)
Learning from Similar Linear Representations: Adaptivity, Minimaxity, and Robustness [15.1] 我々は,不整形なタスクを扱いながら,テキストに類似するタスクから学習する方法を研究している。
両手法が大局的に最適であることを示すために,情報理論の下限を提供する。
また,未知の固有次元に適応するしきい値アルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:26:15 GMT)
Meta-Learning Guided Label Noise Distillation for Robust Signal Modulation Classification [14.9] 頑健な自動変調分類(AMC)のためのメタラーニングガイド付きラベルノイズ蒸留法を提案する。
本手法は,様々な複雑なラベルノイズのシナリオにおいて,信号AMCの性能とロバスト性を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:14:40 GMT)
Locally Private Histograms in All Privacy Regimes [14.5] 中~下級のプライバシ体制において,局所的な私的ヒストグラムと,それに関連する分布学習課題について検討する。
局所的な私的ヒストグラム問題において, 基板間の境界を改良した新しい解析結果から, 理論的知見が得られた。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:22:45 GMT)
A conformalized learning of a prediction set with applications to medical imaging classification [14.3] 本稿では,真のラベルを含む予測セットをユーザが特定した確率で生成するアルゴリズムを提案する。
提案アルゴリズムをいくつかの標準医用画像分類データセットに適用した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:49:04 GMT)
Demystifying and Detecting Cryptographic Defects in Ethereum Smart Contracts [14.2] スマートコントラクトにおける暗号欠陥の解読と検出を目的とした,最初の研究を行った。
我々は,スマートコントラクトにおける暗号欠陥検出を自動化するファジィベースのツールであるCrySolを提案した。
25,745の暗号関連スマートコントラクトを含む大規模データセットを収集し,CrySolの有効性を評価した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:40:08 GMT)
Rethinking Multiple Instance Learning: Developing an Instance-Level Classifier via Weakly-Supervised Self-Training [14.2] 複数インスタンス学習(MIL)問題は現在、バッグ分類またはインスタンス分類の観点から解決されている。
我々は、MILを半教師付きインスタンス分類問題として定式化し、ラベル付きインスタンスとラベルなしインスタンスを全て活用できるようにした。
本稿では,正の袋ラベルを用いてグローバルな制約を構築する,弱教師付き自己学習手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:53:41 GMT)
A generative foundation model for five-class sleep staging with arbitrary sensor input [14.1] 金標準睡眠スコアは、PSG信号のサブセット、すなわちEEG、EOG、EMGに基づいている。
PSGは、心臓や呼吸の調節など、睡眠のステージングに使える可能性のある多くのシグナル導出物で構成されている。
本稿では,複数のセンサからの完全自動睡眠ステージ作成のための深層生成基盤モデルとその組み合わせを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:09:28 GMT)
Cooperative Online Learning with Feedback Graphs [14.1] 協調的なオンライン学習環境におけるコミュニケーションとフィードバックの相互作用について検討する。
我々の分析は、専門家や盗賊のフィードバックによる協調的なオンライン学習のための、これまでに知られていた多くの境界として回復する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:52:26 GMT)
SCOI: Syntax-augmented Coverage-based In-context Example Selection for Machine Translation [13.9] そこで本研究では,機械翻訳(MT)における文脈内例の選択に統語的知識を導入する。
我々は、構文拡張されたコベレージベースのIn-context example selection (SCOI) という新しい戦略を提案する。
提案するSCOIは,すべての学習自由手法の中で,平均COMETスコアが最も高い。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:25:17 GMT)
InfinityMATH: A Scalable Instruction Tuning Dataset in Programmatic Mathematical Reasoning [13.7] InfinityMATHは、プログラム数学的推論のためのスケーラブルな命令チューニングデータセットである。
オープンソースの言語とLlama2やCodeLlamaといったコードモデルによる微調整実験は、InfinityMATHの実用的メリットを実証している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:18:20 GMT)
Deep Feature Surgery: Towards Accurate and Efficient Multi-Exit Networks [13.5] 本稿では,マルチエクイットネットワークのトレーニングにおいて,勾配コンフリクトの問題を解決するためのDeep Feature Surgery (methodname)を提案する。
methodnameは、バックプロパゲーションの複雑さを減らしたトレーニング操作を再現する。
予算バッチ分類評価は、DFSがCifar100のベースライン法と同じ分類精度を達成するために、画像毎の平均FLOPを約$$$mbolbolbolf2boldtimesで削減していることを示している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:34:14 GMT)
Scaling Deep Learning Computation over the Inter-Core Connected Intelligence Processor [13.3] AIチップ上でコア間通信帯域とオンチップメモリを利用する最初のDLコンパイラであるT10を提案する。
T10は、オンチップメモリ消費とコア間通信オーバーヘッドのトレードオフをグローバルに最適化する。
実際のコア間接続型AIチップであるGraphcore IPUによる評価は、最大3.3$times$パフォーマンス改善を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:28:09 GMT)
A Hybrid RAG System with Comprehensive Enhancement on Complex Reasoning [13.1] Retrieval-augmented Generation (RAG) は、大規模言語モデルでその精度を高め、外部知識ベースを統合することで幻覚を低減できるフレームワークである。
本稿では,検索品質,拡張推論能力,精巧な数値能力など,総合的な最適化によって強化されたハイブリッドRAGシステムを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:53:55 GMT)
MooER: LLM-based Speech Recognition and Translation Models from Moore Threads [13.0] MooERはムーアスレッドの大規模自動音声認識(ASR)/自動音声翻訳(AST)モデルである。
オープンソースおよび自己収集音声データを含む5000hの擬似ラベル付きデータセットをトレーニングに使用する。
Covost2 Zh2enテストセットで行った実験は、我々のモデルが他のオープンソースのLLMよりも優れていることを示唆している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:43:56 GMT)
How Well Do LLMs Identify Cultural Unity in Diversity? [13.0] 本稿では,概念の文化的統一性を理解するために,デコーダのみの大規模言語モデル(LLM)を評価するためのベンチマークデータセットを提案する。
CUNITは、10か国で285の伝統的な文化的概念に基づいて構築された1,425の評価例で構成されている。
高い関連性を持つ異文化のコンセプトペアを識別するLLMの能力を評価するために,コントラストマッチングタスクを設計する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:45:22 GMT)
Rate-Optimal Rank Aggregation with Private Pairwise Rankings [12.5] 我々は、ペアのランキングに基づいてランクアグリゲーションの実用性を確保しつつ、プライバシを保護するという課題に対処する。
そこで本研究では,ランダム化応答機構からランキングを適応的にデバイアスする手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:07:00 GMT)
Cross-Domain Learning for Video Anomaly Detection with Limited Supervision [12.3] ビデオ異常検出(VAD)は、監視ビデオにおけるセキュリティ脅威などの異常事象の識別を自動化する。
既存のドメイン間VADメソッドは教師なし学習に重点を置いており、結果として実世界の期待に届かないパフォーマンスをもたらす。
本稿では, 予測バイアスを推定し, 予測不確実性を用いて学習を適応的に最小化することにより, トレーニング中に外部データを組み込んだ, クロスドメイン学習(CDL)の枠組みを新たに導入する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:28:29 GMT)
Surgical-VQLA++: Adversarial Contrastive Learning for Calibrated Robust Visual Question-Localized Answering in Robotic Surgery [12.2] 医用視覚質問応答(VQA)は、視覚情報と臨床的意思決定のギャップを埋める。
特に、外科的VQAは、正確な診断、効果的な教育、臨床介入を補助し、外科的データの解釈を強化することができる。
本稿では,外科的画像に関する特定のクエリに対して,精密かつコンテキスト認識の応答を行うために,外科的視覚的質問応答(VQLA)を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:23:07 GMT)
Ultrabright-entanglement-based quantum key distribution over a 404-km-long optical fiber [12.2] この研究は3.2mWのポンプ出力を持つ絡み合った光子発生において17.9nWの直接測定力を達成した。
その結果、波長多重偏光共役光子源による高速長距離量子通信の可能性が示された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:43:04 GMT)
Investigating a Benchmark for Training-set free Evaluation of Linguistic Capabilities in Machine Reading Comprehension [12.1] 合成課題集合上でのトレーニングセット自由設定において最適化モデルを評価するためのフレームワークについて検討する。
生成手法の単純さにもかかわらず、データは自然性や語彙の多様性に関してクラウドソースのデータセットと競合する。
我々は、さらに実験を行い、最先端の言語モデルに基づくMRCシステムが、挑戦セットを正しく成功させるために学習できることを示します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:23:36 GMT)
Rag and Roll: An End-to-End Evaluation of Indirect Prompt Manipulations in LLM-based Application Frameworks [12.1] Retrieval Augmented Generation (RAG) は、分散知識を欠くモデルによく用いられる手法である。
本稿では,RAGシステムのエンドツーエンドの間接的なプロンプト操作に対する安全性について検討する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:26:05 GMT)
Enhancing Source Code Classification Effectiveness via Prompt Learning Incorporating Knowledge Features [11.7] 我々は,事前学習したモデルから入力シーケンスに関連する豊富な知識を抽出するために,素早い学習を利用するテキスト分類手法であるCodeClassPromptを提案する。
注意機構を適用することで、タスク固有の特徴に多層的知識を合成し、分類精度を向上する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:12:45 GMT)
Teamwork Makes TEE Work: Open and Resilient Remote Attestation on Decentralized Trust [11.7] リモート(RA)は、Trusted Execution Environment(TEE)におけるアプリケーションの完全性と信頼性を検証する。
既存のTEE RA設計では、リモートパーティの信頼を確立するために、単一のプロビジョニングされた秘密鍵と集中型検証器に依存する集中型信頼モデルを採用している。
しかし、このモデルは不安定であり、近年の先進攻撃では信頼できない。
ほとんどの設計では、一度デプロイしただけで、異なる状況に適応し、回復力のある機能を提供するのが難しくなる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:03:17 GMT)
Cost-Effective Hallucination Detection for LLMs [11.6] 大規模な言語モデル(LLM)は幻覚を起こす傾向があり、入力、外部事実、あるいは内部的矛盾に反する信頼できない出力を生成する。
幻覚検出のためのパイプラインでは,まず,生成した回答が幻覚である可能性を示す信頼スコアを生成し,第2に,入力の属性と候補応答に基づいてスコア条件を調整し,第3に,スコアを閾値付けして検出を行う。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:58:55 GMT)
Regeneration of Spin Wave in Atomic Vapor [11.5] 原子蒸気に蓄積された原子スピン波は、外部の光源からエネルギーを吸収する能力を持ち、アクティブな再生に似た挙動を示す。
以上の結果から, 室温媒質のスピン波で発生する顕著な脱コヒーレンスを緩和するための再生機構が期待できることが示唆された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:09:40 GMT)
Do Text-to-Vis Benchmarks Test Real Use of Visualisations? [11.4] ベンチマークデータセットと公開リポジトリのコードを比較します。
この結果から,グラフの種類や属性,アクション数など,同じ分布をテストせずに評価した結果,データセットの実質的なギャップが明らかとなった。
これは、ユーザの視覚的ニーズに真に対処するシステムの開発をサポートするために、新しい、より多くのベンチマークが必要であることを示している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:54:02 GMT)
Learning to Predict Program Execution by Modeling Dynamic Dependency on Code Graphs [11.3] 本稿では,コードカバレッジを予測し,実行時のエラーを検出するための,新しい機械学習ベースのフレームワークであるCodeFlowを紹介する。
CodeFlowは、可能なすべての実行パスと、異なるステートメント間の関係を表現します。
実行中のステートメント間の影響を反映した実行トレースを通じて動的依存関係を学習する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:48:04 GMT)
XNN: Paradigm Shift in Mitigating Identity Leakage within Cloud-Enabled Deep Learning [11.3] 本稿では,ニューラルネットワーク機能にランダムな摂動を注入する先駆的手法であるXNNとXNN-dを紹介する。
トレーニングフェーズ用に設計されたXNNは、ランダムな置換と行列乗法を巧みにブレンドし、特徴写像を難読化する。
推論フェーズ用に考案されたXNN-dは、生成的対向ノイズを統合するために対向訓練を採用している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:54:11 GMT)
Towards Understanding the Bugs in Solidity Compiler [11.2] 本稿では,533のSolidityコンパイラのバグに関する最初の系統的研究について述べる。
本研究は, その特徴(症状, 根本原因, 分布など)とトリガー試験例について検討した。
次に,Solidityコンパイラファザの限界について検討するため,Solidityコンパイラファザを3つ評価した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:12:46 GMT)
Gemma Scope: Open Sparse Autoencoders Everywhere All At Once on Gemma 2 [11.2] スパースオートエンコーダ(SAE)は、ニューラルネットワークの潜在表現を解釈可能な特徴に学習するための教師なしの方法である。
本研究では,JumpReLU SAEのオープンスイートであるGemma Scopeを紹介した。
各SAEの品質を標準メトリクスで評価し、その結果を公表する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:06:42 GMT)
Engaging Developers in Exploratory Unit Testing through Gamification [11.1] 我々は、Gamekinsシステムによって生成される課題とクエストを示し、テストをより魅力的でシームレスに、通常のコーディングタスクとブレンドできるようにします。
60分間の実験では、Gamekinsがテストスイートの品質とバグ検出に与える影響を評価した。
その結果、参加者は積極的にツールと対話し、90%近いラインカバレッジを達成し、14のバグのうち11が検出された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:00:41 GMT)
Benchmarking Conventional and Learned Video Codecs with a Low-Delay Configuration [11.0] 本稿では,低遅延構成に基づく従来型および学習型ビデオ符号化手法の比較研究を行う。
その結果, YCbCr 4:2:0色空間におけるAOMおよびMPEG共通試験条件で定義された試験系列について, 公平かつ有意義な比較を行うことができた。
評価結果から,JVETのECMコーデックは,テスト対象のすべてのコーデックの中で,最高の全体的な符号化性能を提供することがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:55:23 GMT)
ORBIT: Oak Ridge Base Foundation Model for Earth System Predictability [10.9] 我々はOak Ridge Base Foundation Model for Earth System Predictability (ORBIT)を紹介する。
ORBITは、その種の最大のモデルであり、現在の気候AIファンデーションモデルサイズを1000倍に超えている。
Frontierスーパーコンピュータの性能スケーリングテストでは、ORBITは684ペタFLOPSから1.6ペタFLOPSの持続スループットを達成した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:49:02 GMT)
Distributed Quantum Computing for Chemical Applications [10.7] 分散量子コンピューティング(DQC)は、計算処理を多くのデバイスに分散させることによって計算能力を高めることを目的としている。
DQCは、多くのデバイスに計算プロセスを分散させることによって計算能力を高めることを目的としており、量子デバイスに必要なノイズと回路深度を最小限にすることを目的としている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:42:51 GMT)
LucidDreaming: Controllable Object-Centric 3D Generation [10.6] 本稿では,テキストプロンプトコマンドや3Dバウンディングボックスのみから3次元生成を空間的,数値的に制御できるパイプラインを提案する。
LucidDreamingは、現在のアプローチと比較して、オブジェクトの配置精度と生成精度において優れた結果を得る。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:34:04 GMT)
Assessment of Cell Nuclei AI Foundation Models in Kidney Pathology [10.6] この研究は、これまでで最大規模の評価であり、我々の知る限り、これまでで最大規模の評価である。
評価モデルのうち,CellViTは腎病理におけるセグメンテーション核の優れた性能を示した。
しかし、どの基礎モデルも完璧ではなく、腎臓病理学の一般的な核分割における性能ギャップは依然として残っている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:34:13 GMT)
Early Exit Strategies for Approximate k-NN Search in Dense Retrieval [10.5] アーリーエグジットのための最先端のA-kNNを構築し,忍耐の概念に基づく教師なし手法を提案する。
我々は,A-kNNの効率を最大5倍の高速化で向上すると同時に,無視可能な効率損失を達成できることを示す。
論文参考訳(メタデータ) (Fri, 09 Aug 2024 10:17:07 GMT)
Tree Attention: Topology-aware Decoding for Long-Context Attention on GPU clusters [10.4] 自己アテンションは、シーケンス長の複雑さのため、重要な計算ボトルネックである。
本研究では、勾配が自己アテンションブロックを計算するスカラーエネルギー関数を導出する。
我々の定式化により,木伐採により,配列軸を横断する還元を効率的に並列に計算できることが判明した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:07:21 GMT)
SimCT: A Simple Consistency Test Protocol in LLMs Development Lifecycle [10.4] 我々は,SimCTという,シンプルで効果的な一貫性テストプロトコルを提案する。
SimCT は主に、"ベアメタル" LLM または関連サービスの様々な開発段階における一貫性を積極的にチェックすることを目的としている。
本プロトコルは,2つのコンポーネントに対してそれぞれLightGBMと学生のt-testを実装し,SimCTの有効性を実証するための広範囲な実験を行う。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:14:51 GMT)
Differentiable Annealed Importance Sampling Minimizes The Symmetrized Kullback-Leibler Divergence Between Initial and Target Distribution [10.1] DAIS は初期分布と目標分布の対称性を持つ Kullback-Leibler の分散を最小化することを示す。
DAISは、その初期分布が難解なターゲット分布に適合するパラメトリックであるため、変分推論(VI)の形式と見なすことができる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:53:03 GMT)
Self-augmented Gaussian Splatting with Structure-aware Masks for Sparse-view 3D Reconstruction [10.0] スパースビュー3D再構成は、コンピュータビジョンにおいて非常に難しい課題である。
本稿では,構造対応マスクにより拡張された自己拡張型粗大なガウススプラッティングパラダイムを提案する。
本手法は,知覚的品質と効率の両面において,スパース入力ビューの最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:09:22 GMT)
Weak-Annotation of HAR Datasets using Vision Foundation Models [9.9] 本稿では,アノテータがアノテータに注釈を付ける必要のあるデータの量を大幅に削減する,新しいクラスタリングベースのアノテーションパイプラインを提案する。
提案手法を用いることで,3つのHARベンチマークデータセットに対して平均的なラベル付け精度を90%近い精度で達成できることがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:46:53 GMT)
Interactive-T2S: Multi-Turn Interactions for Text-to-SQL with Large Language Models [9.9] 本稿では,データベースとの直接対話を通じてクエリを生成するフレームワークであるInteractive-T2Sを紹介する。
フレームワーク内のステップワイズ推論プロセスを示すための詳細な例を開発してきた。
BIRD-Devデータセットを用いた実験により,本手法が最先端の成果を達成できたのは2つの例に過ぎなかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:43:21 GMT)
MT-Ladder: A Model-Agnostic Framework Boosting LLM-based Machine Translation to the Next Level [9.7] 汎用大規模言語モデル(LLM)は,広範なWebコンテンツを活用することで,機械翻訳(MT)において顕著な進歩を遂げている。
しかし、翻訳固有のLLMは、ドメイン固有の単言語コーパスを事前学習し、人間の注釈付き翻訳データを用いて微調整することで構築される。
MT用汎用LLMの性能向上のための,新しいモデルに依存しない費用対効果ツールMT-Ladderを開発した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:06:39 GMT)
One Shot is Enough for Sequential Infrared Small Target Segmentation [9.4] 逐次赤外小ターゲットセグメンテーションのためのワンショット・トレーニングフリー手法を提案する。
1つの注釈付きフレームが参照として与えられると、この手法はシーケンスの他のフレームに小さなターゲットを正確に分割することができる。
実験の結果,最先端の手法に匹敵する性能を達成するためには,本手法では1ショットしか必要としないことがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:36:56 GMT)
Hyperbolic Learning with Multimodal Large Language Models [9.0] BLIP-2アーキテクチャを用いたパラメータ(ビリオン)とトレーニングの複雑さの観点から,マルチモーダル双曲モデルを桁違いにスケールする上での課題に対処する。
本稿では, BLIP-2のハイパーボリックバージョンに対する新たなトレーニング戦略を提案する。これはユークリッドと同等の性能を達成できると同時に, トレーニングプロセス全体の安定性を維持しつつ, 埋め込み毎に不確実性を有意義に示すものである。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:39:15 GMT)
CROCODILE: Causality aids RObustness via COntrastive DIsentangled LEarning [9.0] CROCODILEフレームワークを導入し、因果関係のツールがモデルの堅牢性からドメインシフトを育む方法を示します。
我々はCXRの多ラベル肺疾患分類に750万枚以上の画像を用いて本手法を適用した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:08:06 GMT)
Knowledge Base Embeddings: Semantics and Theoretical Properties [8.9] 本稿では,ベクトル空間に記述論理に知識ベースを組み込む手法を提案する。
我々は、文献から引き出すいくつかの関連する理論的性質を特定し、時には一般化または統一する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:43:28 GMT)
A Collaborative PIM Computing Optimization Framework for Multi-Tenant DNN [8.7] 現代の人工知能(AI)アプリケーションは、マルチテナントディープニューラルネットワーク(DNN)をますます活用している
本稿では,ReRAMベースのPIM設計におけるマルチテナントDNNの効率的な展開を可能にする,ReRAMベースのインメモリ・コンピューティング・フレームワークを提案する。
従来のReRAMベースのPIM設計の直接デプロイと比較して,提案するPIMコンピューティングフレームワークは,速度(1.75xから60.43x)とエネルギー(最大1.89x)の大幅な向上を実現している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:46:33 GMT)
MDS-GNN: A Mutual Dual-Stream Graph Neural Network on Graphs with Incomplete Features and Structure [8.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データから表現を分析し学習するための強力なツールとして登場した。
GNNの卓越した性能にとって重要な前提条件は、完全なグラフ情報の提供である。
本研究では,特徴と構造間の相互利益学習を実装した相互二重ストリームグラフニューラルネットワーク(MDS-GNN)を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:42:56 GMT)
BoFire: Bayesian Optimization Framework Intended for Real Experiments [7.9] 私たちのオープンソースのPythonパッケージであるBoFireは、ベイジアン最適化(BO)と、新しい化学の開発と最適化に焦点を当てた他の実験設計(DoE)戦略を組み合わせています。
以前のBO実装は、例えば文学やソフトウェアに存在するため、化学産業における実世界の効果的な展開に相当な適応が必要である。
本稿では,BoFireと他のBO実装の違いについて論じるとともに,BO研究が化学環境での実際の利用に適応する必要がある方法について概説する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:50:48 GMT)
Evaluating Feature Attribution Methods in the Image Domain [7.9] 既存のメトリクスについて検討し、属性マップの評価のための新しいメトリクスの変種を提案する。
異なる帰属指標は、帰属写像の根底にある異なる概念を測っているように見える。
本稿では,あるユースケースに対して理想的な特徴属性法を特定するための一般的なベンチマーク手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:48:25 GMT)
Geo-UNet: A Geometrically Constrained Neural Framework for Clinical-Grade Lumen Segmentation in Intravascular Ultrasound [7.8] UNetのような現在のセグメンテーションネットワークは、IVUSにおける臨床応用に必要な精度を欠いている。
そこで我々はGeo-UNetフレームワークを提案する。
静脈性IVUSデータセットに対する我々のフレームワークの有効性を,最先端モデルに対して示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:55:25 GMT)
Capsule Vision 2024 Challenge: Multi-Class Abnormality Classification for Video Capsule Endoscopy [7.3] 本稿では,ビデオカプセル内視鏡におけるカプセルビジョン2024チャレンジ:マルチクラス異常分類について紹介する。
事実上、ドナウ私立大学医学部医学画像解析・人工知能研究センター(MIAAI)によって組織されている。
本資料では,課題の概要,登録とルール,提出形式,活用データセットの記述について述べる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:46:22 GMT)
Ensemble BERT: A student social network text sentiment classification model based on ensemble learning and BERT architecture [7.3] 本稿では,BERTに基づく新たなアンサンブル学習ネットワークを提案する。
本研究では,中学生のソーシャル・ネットワーク・テキストの感情傾向を分類する作業に本手法を適用した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:57:31 GMT)
AcousAF: Acoustic Sensing-Based Atrial Fibrillation Detection System for Mobile Phones [6.9] 心房細動(AF)は、房室から発生する不規則な電気的インパルスによって特徴づけられる。
現在のモバイルベースのAF検出システムはポータブルソリューションを提供する。
本稿では,スマートフォンの音響センサを用いた新しいAF検出システムであるAcousAFを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:43:16 GMT)
A Jailbroken GenAI Model Can Cause Substantial Harm: GenAI-powered Applications are Vulnerable to PromptWares [6.9] 我々は、ジェイルブレイクしたGenAIモデルが、GenAIベースのアプリケーションに重大なダメージを与える可能性があることを示す。
PromptWareは、GenAIモデルの振る舞いを、アプリケーションの提供から攻撃へと反転させる新しいタイプの攻撃である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:32:50 GMT)
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention [6.7] 本研究では,トランスフォーマーをベースとしたLarge Language Modelを,メモリと計算を境界とした無限に長い入力に拡張する効率的な手法を提案する。
提案手法の重要な要素は、Infini-attentionと呼ばれる新しい注意手法である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:37:25 GMT)
From Text to Insight: Leveraging Large Language Models for Performance Evaluation in Management [6.7] 本研究では,大規模言語モデル(LLM),特にGPT-4の可能性を探り,組織的タスクパフォーマンス評価における客観性を高める。
以上の結果から,GPT評価は人間の評価に匹敵するが,一貫性と信頼性が高いことが示唆された。
LLMはテキストベースのデータから意味のある構成物を抽出できるが、その範囲は特定のパフォーマンス評価形式に限定されている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:35:10 GMT)
MS-Twins: Multi-Scale Deep Self-Attention Networks for Medical Image Segmentation [6.6] マルチスケールアテンションネットワークに基づく新しいマルチラベル胸部画像分類手法を提案する。
このスキームでは、マルチスケール情報を反復的に融合させ、病気の確率の高い地域に集中させ、データからより有意義な情報を効果的にマイニングする。
また、視覚知覚の合理性と多ラベル画像分類の性能を向上させるために、新たな損失関数を設計した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:35:25 GMT)
GMISeg: General Medical Image Segmentation without Re-Training [6.6] 本稿では,ユーザ購入行動予測のための情報融合とアンサンブル学習に基づくSE-Stackingモデルを提案する。
公開データセットで実施された実験によると、SE-Stackingモデルは98.40%のF1スコアを達成でき、最適なベースモデルよりも約0.09%高い。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:36:24 GMT)
Variational Bayesian Phylogenetic Inference with Semi-implicit Branch Length Distributions [6.6] 本稿では,グラフニューラルネットワークを用いた半単純階層分布に基づく分岐長変動後続の柔軟な系を提案する。
この構造は単純置換同変分布を出力するので、ユークリッドでない枝長空間を異なる木位相で容易に扱えることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:29:08 GMT)
Temporal Analysis and Repair of Flaky Dockerfiles [6.5] Dockerfileのフレキネスは、Dockerfileやプロジェクトのソースコードの変更なしに、一貫性のないビルド動作によって特徴づけられる。
本稿では、依存性関連エラーやサーバ接続の問題など、一般的なフレキネスカテゴリの包括的分類について述べる。
我々はFrakiDockを紹介した。これは大規模な言語モデルと検索拡張生成技術を利用して、不安定なDockerfileを自動的に修復するツールだ。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:17:56 GMT)
GLEAMS: Bridging the Gap Between Local and Global Explanations [6.3] 本稿では,入力空間を分割し,各サブリージョン内で解釈可能なモデルを学習する新しい手法であるGLEAMSを提案する。
我々は、GLEAMSが合成データと実世界のデータの両方で有効であることを示し、その望ましい特性と人間の理解可能な洞察を強調した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:30:37 GMT)
Federated Hypergraph Learning with Hyperedge Completion [6.3] ハイパーグラフニューラルネットワークは、ノード間の高次関係をキャプチャすることで、従来のグラフニューラルネットワークを強化する。
我々はフェデレートハイパーグラフ学習のための新しいアルゴリズムであるFedHGNを提案する。
本アルゴリズムは,分散デバイスに格納されたハイパーグラフのサブグラフを用いて,ローカルHGNNモデルをフェデレートした方法でトレーニングする。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:31:41 GMT)
Exploration of Masked and Causal Language Modelling for Text Generation [6.3] 本稿では,テキスト生成タスクにおける因果言語モデリング手法の広範な比較を行う。
まず、定量的な指標を用いて、コヒーレンスと文法的正当性を分析する定性的な人的評価を行う。
その結果、すべてのデータセットでテキスト生成において、CLMは一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:01:58 GMT)
PRISM Lite: A lightweight model for interactive 3D placenta segmentation in ultrasound [6.2] 3次元超音波(3DUS)画像から測定した胎盤体積は成長軌跡を追跡する重要なツールであり、妊娠の結果と関連している。
手動セグメンテーションは金の標準であるが、時間がかかり主観的である。
本稿では,3DUS画像から胎盤をリアルタイムでインタラクティブに分割するための,臨床利用を目的とした軽量なインタラクティブセグメンテーションモデルを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:49:19 GMT)
Cycle-Configuration: A Novel Graph-theoretic Descriptor Set for Molecular Inference [6.2] サイクル・コンフィグレーション(CC)ディスクリプタは、mol-inferの標準の2層(2L)モデルで使用することができる。
提案された記述子は、芳香族環に現れる正統/メタ/パラパターンの概念を捉えている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:45:41 GMT)
MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling [6.2] シンボリックギターのタブリング推定のための新しいディープラーニングソリューションを提案する。
我々は、文字列に音符を割り当てるために、マスク付き言語モデリングパラダイムでエンコーダ・デコーダ変換モデルを訓練する。
このモデルは、まず25K以上のタブチュアのデータセットであるDadaGPで事前トレーニングされ、その後、プロが書き起こしたギター演奏のキュレートセットで微調整される。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:25:23 GMT)
LLaMA based Punctuation Restoration With Forward Pass Only Decoding [6.1] 本稿では,大規模言語モデル分野における2つの進歩を紹介する。
最初のコントリビューションは、確立されたベンチマークよりも優れた性能を示す、句読点復元のためのLLaMAの応用である。
2つ目のコントリビューションは、アノテーションタスクのための新しいデコードアプローチであるForward Pass Only Decodingである。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:20:56 GMT)
Entanglement Witness for Indistinguishable Electrons using Solid-State Spectroscopy [6.0] 量子材料における絡み合いを特徴づけることは、次世代量子技術の進歩に不可欠である。
共振性非弾性X線散乱(RIXS)スペクトルの非線形性を解析することにより,様々な4つのフェミオン相関を抽出する手法を提案する。
この絡み合いの目撃者は、異なる位相領域にまたがる多重粒子の絡み合いを効率的に定量化し、量子フィッシャー情報(QFI)に対するその優位性を明らかにする。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:46:05 GMT)
Decomposition of one-layer neural networks via the infinite sum of reproducing kernel Banach spaces [6.0] RKBSsの和は特徴空間の直和と互換性があることが示される。
積分 RKBS を$p$-norm RKBSs の和に分解する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:10:29 GMT)
Automated flakiness detection in quantum software bug reports [5.6] 量子ソフトウェアのバグレポートにおいて、フレキなテストの自動検出の課題と潜在的な解決策を概説する。
我々は、量子ソフトウェアにおけるフレキネスの認識を高め、この新たな課題を解決するために、ソフトウェアエンジニアリングコミュニティが協力して働くことを奨励することを目的としています。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:42:20 GMT)
General Lipschitz: Certified Robustness Against Resolvable Semantic Transformations via Transformation-Dependent Randomized Smoothing [5.6] 構成可能な可解なセマンティック摂動に対してニューラルネットワークを認証する新しいフレームワークであるEmph General Lipschitz (GL)を提案する。
提案手法は,ImageNetデータセットにおける最先端のアプローチと同等に機能する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:17:04 GMT)
A Psychology-based Unified Dynamic Framework for Curriculum Learning [5.4] 本稿では、心理学に基づくカリキュラム学習のための統一動的フレームワーク(PUDF)を提案する。
我々は、人工集団(AC)からの応答にIRT(Item Response Theory)を適用して、データトレーニングの難しさを定量化する。
本稿では,モデル学習中に適切なデータ量をスケジュールするDDS-MAE戦略を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:30:37 GMT)
AI-assisted Coding with Cody: Lessons from Context Retrieval and Evaluation for Code Recommendations [5.4] 我々は最近,LLMベースのコーディングアシスタントとして人気の高いタイプのレコメンデーションシステムについて論じる。
ドメイン特化による類似点と相違点について概説する。
このユースケースにおいて、LLMに関連するコンテキストを提供することの重要性を強調し、文脈拡張から学んだ教訓と、このようなAI支援コーディングシステムのオフラインおよびオンライン評価について議論する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:21:15 GMT)
Graph Matching via convex relaxation to the simplex [5.4] 本稿では,2つの入力グラフの最適アライメントを求めるグラフマッチング問題に対処する。
この問題に対処するための一般的なアプローチは、NP-hard emphQuadratic Assignment Problem (QAP) の凸緩和である。
単位単純度に新しい凸緩和を導入し、この問題を解決するための閉形式反復を用いた効率的なミラー降下スキームを開発する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:53:34 GMT)
scASDC: Attention Enhanced Structural Deep Clustering for Single-cell RNA-seq Data [5.2] scRNA-seqデータに固有の高空間性および複雑なノイズパターンは、従来のクラスタリング手法において重要な課題である。
本稿では,深層クラスタリング手法であるアテンション強化構造深層埋め込みグラフクラスタリング(scASDC)を提案する。
scASDCはクラスタリングの精度と堅牢性を改善するために、複数の高度なモジュールを統合している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:10:36 GMT)
ASDF: Assembly State Detection Utilizing Late Fusion by Integrating 6D Pose Estimation [5.1] 医療・産業分野では、効率と安全性を確保するために、組み立てプロセスのガイダンスを提供することが重要である。
その場でのビジュアライゼーションを可能にするため、6次元のポーズ推定を利用して、拡張の正確な位置を特定することができる。
我々は,リアルタイム能動オブジェクト検出フレームワークであるYOLOv8の長所の上に構築し,アセンブリ状態検出と組み合わせて6次元ポーズ推定の課題に対処する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:38:07 GMT)
Masked adversarial neural network for cell type deconvolution in spatial transcriptomics [5.1] 実STデータと、cRNA-seqデータから生成されたシミュレーションSTデータとを整合させるMasked Adversarial Neural Network (MACD)を提案する。
シミュレーションされた32のデータセットと2つの実データセット上でセル型デコンボリューションを行う際の精度を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:46:28 GMT)
Separating Style from Substance: Enhancing Cross-Genre Authorship Attribution through Data Selection and Presentation [5.1] 2つの文書は異なるジャンルで同じ著者によって書かれています。
マシンにとって問題は、トピック境界を越えた実世界のトレーニング例の相対的欠如によって複雑である。
本研究では,データ選択を学習するためのターゲット手法と,新しい学習カリキュラムを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:31:37 GMT)
Progressive Neural Network for Multi-Horizon Time Series Forecasting [4.9] ProNetは、マルチ水平時系列予測用に設計された新しいディープラーニングアプローチである。
本手法では,予測水平線をセグメントに分割し,非自己回帰的に各セグメントの最も重要なステップを予測し,残りのステップを自己回帰的に行う。
ARモデルと比較して、ProNetは顕著なアドバンテージを示し、ARイテレーションを少なくし、予測速度を高速化し、エラーの蓄積を軽減している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:56:49 GMT)
EclipseNETs: a differentiable description of irregular eclipse conditions [4.9] 我々は、非常に不規則な天体に対する日食領域の完全な微分可能なモデルを開発する。
本研究では、太陽の方向に基づいて日食円錐の形状を定義する暗黙のニューラルネットワークアーキテクチャについて検討する。
宇宙飛行力学計算におけるこれらの微分可能なモデルの可能性について論じる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:53:28 GMT)
A Recurrent YOLOv8-based framework for Event-Based Object Detection [4.9] 本研究では、時間的モデリング機能を備えたフレームベース検出システムを強化する高度なオブジェクト検出フレームワークであるReYOLOv8を紹介する。
イベントデータを符号化する低レイテンシでメモリ効率の手法を実装し,システムの性能を向上する。
また、イベントデータのユニークな属性を利用するように調整された新しいデータ拡張手法を開発し、検出精度を向上した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:00:16 GMT)
GuidedNet: Semi-Supervised Multi-Organ Segmentation via Labeled Data Guide Unlabeled Data [4.8] 半監督型多臓器画像分割は、医師が疾患の診断と治療計画を改善するのに役立つ。
キーとなる概念は、ラベル付きデータとラベルなしデータからのボクセル機能は、同じクラスに属する可能性が高い機能空間で互いに近接しているということである。
我々は、ラベル付きデータから得られた事前知識を活用してラベルなしデータのトレーニングをガイドする知識伝達クロス擬似ラベルスーパービジョン(KT-CPS)戦略を導入する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:46:01 GMT)
Sensitivity-Aware Mixed-Precision Quantization and Width Optimization of Deep Neural Networks Through Cluster-Based Tree-Structured Parzen Estimation [4.7] 本稿では,個々のニューラルネットワーク層に対して最適なビット幅と層幅を自動的に選択する革新的な探索機構を提案する。
これにより、ディープニューラルネットワークの効率が著しく向上する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:40:35 GMT)
Performance Metric for Multiple Anomaly Score Distributions with Discrete Severity Levels [4.7] 本稿では, 受信機動作特性曲線(WS-AUROC)に基づいて, 異常スコアに基づいて重み付けされた領域の重み付け和を提案する。
また、分布の明確な分離を実現し、WS-AUROCおよびAUROCメトリクスのアブレーションモデルより優れる異常検出器を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:17:49 GMT)
Shifting the Lens: Detecting Malicious npm Packages using Large Language Models [4.5] 既存の悪意のあるコード検出技術は、しばしば高い誤分類率に悩まされる。
悪意のあるコードレビューワークフローであるSecurityAIを紹介し、ChatGPTを使って悪意のあるコードを検出する。
ベースライン比較では, 静的解析の精度とF1スコアよりも16%, 9%向上した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:29:44 GMT)
Multi-Conditional Ranking with Large Language Models [4.4] 大規模言語モデルを用いて項目をランク付けすることは、レコメンデーションと検索システムにおいて一般的なアプローチとなっている。
しかし、現実のシナリオは、比較的小さな項目のセットをランク付けするなど、異なる課題を呈することが多い。
本稿では, 条件を抽出し, ソートし, 項目を反復的にランク付けする, 分割推論手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:28:30 GMT)
Noisy Pairing and Partial Supervision for Stylized Opinion Summarization [4.3] ノイズペアリングと部分監督(NAPA)は、非並列顧客と専門レビューセットからスタイル化された意見要約システムを訓練する。
YelpとMichelinから顧客とプロフェッショナルのレビューを収集することで、ProSumのベンチマークを作成します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:44:40 GMT)
Physics-constrained convolutional neural networks for inverse problems in spatiotemporal partial differential equations [4.3] 偏微分方程式(PDE)における2種類の逆問題を解決するために,物理制約付き畳み込みニューラルネットワーク(PCCNN)を提案する。
第1の逆問題では、偏りのあるデータからオフセットしたデータを与えられる。
第2の逆問題では、PDEの解に関する情報が与えられる。
我々は,PC-CNNが様々なバイアスに対する真の解決策を正しく回復することを発見した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:10:35 GMT)
Counterfactual Explanations with Probabilistic Guarantees on their Robustness to Model Change [4.2] 対実的説明(CFE)は、望ましいアウトプットを達成するために、機械学習モデルへの入力の調整方法をユーザに案内する。
この問題に対処する現在のメソッドは、しばしば特定のモデルや変更タイプのみをサポートする。
本稿では,任意のモデルや変更タイプに対して確率的保証を提供するCFEの生成手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:35:53 GMT)
NuLite -- Lightweight and Fast Model for Nuclei Instance Segmentation and Classification [4.2] 病理学では、ヘマトキシリンとエオシン(H&E)スライドの正確かつ効率的な解析は、タイムリーかつ効果的ながん診断に不可欠である。
我々は,SOTA(State-of-the-art)軽量CNNであるFast-ViT上に明示的に設計された,新しい畳み込みニューラルネットワークであるNuLiteを導入する。
我々は、PanNukeデータセットでトレーニングしたNuLite-S、NuLite-M、NuLite-Hの3つのモデルを得た。実験結果、我々のモデルは、汎視的品質と検出の点でCellViT(SOTA)と同等であることが証明された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:57:09 GMT)
Controllable seismic velocity synthesis using generative diffusion models [4.2] 本研究では, 地震波速度合成のための条件付き生成拡散モデルを提案する。
このアプローチは、予測された目標分布と密接に一致する地震波速度の生成を可能にする。
OpenFWIデータセット上での拡散モデルのトレーニングにより,本手法の柔軟性と有効性を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:37:48 GMT)
Impact of Log Parsing on Deep Learning-Based Anomaly Detection [4.1] 本研究では,ログ解析精度と異常検出精度との間には強い相関関係がないことを示す。
本研究は,ログ解析結果の識別可能性を示す特性として,既存の理論結果について実験的に検証する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:59:51 GMT)
Learning k-Level Structured Sparse Neural Networks Using Group Envelope Regularization [4.1] 制約のあるリソースに大規模ディープニューラルネットワークをデプロイするための新しいアプローチを導入する。
この手法は推論時間を短縮し、メモリ需要と消費電力を減らすことを目的とする。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:46:36 GMT)
Natural Gradient Interpretation of Rank-One Update in CMA-ES [4.0] 我々は,CMA-ESにおけるランクワン更新の新しい解釈を,先行分布による自然勾配の観点から提案する。
我々は、平均ベクトルが進化経路の方向に存在すべきという考えに基づいて、事前分布を設定することにより、MAP-IGOフレームワークからのランクワン更新を導出する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:35:03 GMT)
AI and Machine Learning Driven Indoor Localization and Navigation with Mobile Embedded Systems [3.9] 本稿では,最先端の屋内ナビゲーションソリューションに直面する課題について概説する。
次に、モバイル組み込みシステムにデプロイされるAIアルゴリズムがこれらの課題を克服する方法について説明する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:30:22 GMT)
Software Engineering Through Community-Engaged Learning and an Inclusive Network [3.9] InSPIRE: STEM for Social Impact Program at the University of Victoria, Canadaについて述べる。
まず,30人以上の学生,6人のコミュニティパートナ,20人以上の業界や学術メンターが参加した初年度から学んだ教訓について述べる。
当社のアプローチを採用したいかもしれない大学や組織に対して、レコメンデーションを提供します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:15:32 GMT)
Generative Inverse Design of Metamaterials with Functional Responses by Interpretable Learning [3.9] 本稿では, オンデマンド機能的振る舞いを持つメタマテリアル設計の高速な生成を実現するために, ランダムフォレストに基づく解釈可能生成逆設計(RIGID)手法を提案する。
トレーニングされたフォワードモデルから得られた目標満足度の可能性に基づいて、マルコフ連鎖モンテカルロ法を用いて設計ソリューションをサンプリングすることができる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:22:02 GMT)
UAV-Enhanced Combination to Application: Comprehensive Analysis and Benchmarking of a Human Detection Dataset for Disaster Scenarios [3.8] 無人航空機(UAV)は捜索救助(SAR)活動に革命をもたらした。
機械学習モデルをトレーニングするための、特殊なヒューマン検出データセットが欠如していることは、大きな課題である。
本稿では,UAVが捉えた災害現場に人間のポーズをオーバーレイして合成したC2Aデータセットについて述べる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:07:19 GMT)
Avoid Wasted Annotation Costs in Open-set Active Learning with Pre-trained Vision-Language Model [3.6] アクティブラーニング(AL)は、高情報データを選択的に収集することでモデル性能を向上させることを目的としている。
実際のシナリオでは、ラベルなしデータは配布外サンプル(OOD)を含んでいて、無駄なアノテーションコストにつながる可能性がある。
OODサンプルを必要とせずにコスト損失を最小限に抑える新しい選択戦略であるCLIPNALを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:54:57 GMT)
ECG-FM: An Open Electrocardiogram Foundation Model [3.6] 本稿では,ECG分析のためのオープン基盤モデルであるECG-FMを提案する。
ECG-FMはトランスフォーマーベースのアーキテクチャを採用し、250万のサンプルで事前訓練されている。
文脈情報のコマンドが強靭なパフォーマンス、豊富な事前学習された埋め込み、信頼性のある解釈可能性をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:06:49 GMT)
Better Not to Propagate: Understanding Edge Uncertainty and Over-smoothing in Signed Graph Neural Networks [3.4] 本稿では,学習中のブロックと署名された伝搬の動的選択と一体化して,ホモフィリーとエッジの誤差比を推定する新しい手法を提案する。
我々の理論解析は, 広範囲な実験によって支持され, 高エッジ誤差比下では, 符号付き伝搬よりもブロックMPの方が有効であることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:46:06 GMT)
Neural Machine Unranking [3.2] 我々はニューラル・マシン・アンランキング(NuMuR)と呼ばれるニューラル情報検索における機械学習の課題に取り組む。
我々は、CoCoL(Contrastive and Consistent Loss)と呼ばれるNuMuRの方法論を開発する。
実験により,CoCoLは既存の技術よりも効率的かつ制御可能なデータ除去を容易にすることが示された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:36:40 GMT)
Enhancing Exploratory Learning through Exploratory Search with the Emergence of Large Language Models [3.2] 本研究では,探索探索戦略と探索学習理論を組み合わせることで,この複雑さを解き明かそうとする。
本研究は,高頻度探索とフィードバックループを取り入れたKolbの学習モデルに適応し,学生の深い認知・高次認知スキル開発を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:30:16 GMT)
Determination of All Unknown Pure Quantum States with Two Observables [3.2] 主系上の極小観測値を用いて純粋量子状態から情報を効率的に抽出することは、量子情報理論における長年の根本的問題である。
2つの直交基底は測度ゼロ集合を無視して2d-1$の有限候補を効果的にフィルタリングできることを示す。
また、ほとんどの純粋なキューディットは、中央にPOVMを適応的に組み込んだ上で、補完的な可観測性を測定することで、一意に決定できることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:50:38 GMT)
Is ChatGPT a Good Software Librarian? An Exploratory Study on the Use of ChatGPT for Software Library Recommendations [3.2] ChatGPTは、人間の開発者よりも10%近い頻度でサードパーティのライブラリを使用している。
14.2%の推奨ライブラリには制限付きのコピーレフトライセンスがあり、ChatGPTは明示的に通信しなかった。
LLM生成コードをプロジェクトに統合する前に、厳格な依存性管理プラクティスとライブラリライセンスの二重チェックを実装することを推奨します。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:36:59 GMT)
Privacy-Preserved Taxi Demand Prediction System Utilizing Distributed Data [3.2] CC-Netは、タクシー需要予測のためのコントラスト学習に強化された協調学習を用いた新しいアプローチである。
本手法は,複数当事者が協調して需要予測モデルを訓練できるようにすることにより,高い性能を確保する。
その結果、CC-Netは顧客のデータのプライバシーを維持しつつ、予測精度を既存の技術に比べて少なくとも2.2%向上していることがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:24:47 GMT)
Multi-Garment Customized Model Generation [3.2] マルチゲージカスタマイズモデル生成は、潜在拡散モデル(LDM)に基づく統合フレームワークである
本フレームワークは,脱結合型マルチガーメント機能融合による複数衣服の条件生成を支援する。
提案する衣料エンコーダは,他の拡張モジュールと組み合わせることができるプラグアンドプレイモジュールである。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:57:33 GMT)
Quantitative Information Extraction from Humanitarian Documents [3.1] 我々は,その重要な文脈に沿って,このような量的情報の抽出に注釈付きデータセットを貢献する。
我々は,そのユニットと合わせて量の抽出を行うために,独自の自然言語処理パイプラインを開発した。
提案したモデルは、特にドミニカ共和国および一部のアフリカ諸国に関する文書において、パフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:46:38 GMT)
CCVA-FL: Cross-Client Variations Adaptive Federated Learning for Medical Imaging [3.0] Federated Learning(FL)は、分散データ上でモデルをトレーニングするためのプライバシ保護アプローチを提供する。
Cross-Client Variations Adaptive Federated Learning (CCVA-FL)は、イメージを共通の特徴空間に変換することで、クロスクライアントのバリエーションを最小限にすることを目的としている。
その結果、CCVA-FLはプライバシーを損なうことなく、クライアント間でのデータ分散の違いを効果的に解決することで、Vanilla Federated Averagingよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:56:23 GMT)
Collaborative Static-Dynamic Teaching: A Semi-Supervised Framework for Stripe-Like Space Target Detection [2.9] Stripeのような宇宙ターゲット検出は、宇宙の状況認識に不可欠である。
従来の教師なし手法は、低信号対雑音比と可変ストライプのような空間ターゲットシナリオで失敗することが多い。
我々は,静的および動的教師モデルと学生モデルを含む,革新的な協調静的動的教師(CSDT)SSLフレームワークを導入する。
また,マルチスケールデュアルパス畳み込み(MDPC)ブロックと特徴マップ重み付き注目(FMWA)ブロックを備えた新しいSSTDネットワークであるMSSA-Netを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:33:27 GMT)
Towards improving Alzheimer's intervention: a machine learning approach for biomarker detection through combining MEG and MRI pipelines [2.9] 本研究は、健常者と軽度認知障害者を区別するために、MEG特徴を用いた分類手法を評価する。
我々は、324人のBioFIND参加者のTesla MRIソースMEGデータ(158と166 HC)を使用した。
LCMVベースのMEGを用いたGLMNETでは、MRIとMEGの特徴を組み合わせることで、0.76の精度と0.82のAUCが達成された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:15:01 GMT)
A Machine Learning Approach for Identifying Anatomical Biomarkers of Early Mild Cognitive Impairment [2.9] アルツハイマー病は重要な課題であり、効果的な介入のために早期発見が必要である。
本研究では、MRIに基づくバイオマーカーの選択と分類のための機械学習手法を解析し、5年以内に健康的なコントロールと軽度の認知障害を区別する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:00:05 GMT)
Beyond Diversity:Computing for Inclusive Software [2.9] 本章は、ヴィクトリア大学における多様性と包摂性に基づくSTEMプログラムの文脈における包摂的ソフトウェアに関する我々の研究から紹介する。
共感に基づく要件収集のテクニックと、ソフトウェア開発チームのモチベーションレベルへの影響は、チームが包括的ソフトウェアを構築する能力に影響を与えます。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:01:58 GMT)
Large Language Models and Thematic Analysis: Human-AI Synergy in Researching Hate Speech on Social Media [2.8] 本稿では,定性解析におけるLarge Language Models(LLMs)の台頭に寄与する。
この研究は、EUが出資したプロジェクトから派生したYouTubeデータセットを使用して、テーマ分析(TA)を実行することに焦点を当てている。
このデータセットは、2015年の難民危機の余波を特徴とする2016年のスウェーデンにおけるロマ移民の表現に関するものだ。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:34:41 GMT)
Optimization Dynamics of Equivariant and Augmented Neural Networks [2.8] 対称データに基づくニューラルネットワークの最適化について検討する。
アーキテクチャを制約する戦略を、データ拡張を使用する戦略と同等に扱う戦略と比較する。
後者の状況においても, 定常点が拡張トレーニングにおいて不安定であることは明らかだが, 明らかな同変モデルに対しては安定である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:52:14 GMT)
AutoTemplate: A Simple Recipe for Lexically Constrained Text Generation [2.8] シンプルなが効果的な語彙制約付きテキスト生成フレームワークであるAutoTemplateを紹介する。
本稿では,キーワード対文生成とエンティティ誘導要約という2つのタスクについて実験を行う。
実験の結果、AutoTemplateは両方のタスクで競合するベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:34:26 GMT)
Noise-Aware Distributed Quantum Approximate Optimization Algorithm on Near-term Quantum Hardware [2.8] 本稿では,短期量子ハードウェア上での動作に適した雑音対応分散量子近似最適化アルゴリズム(QAOA)を提案する。
我々は、現在のノイズ中間量子(NISQ)デバイスの限界に対処し、量子ビット数の制限と高いエラー率によって妨げられている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:00:20 GMT)
Back-Projection Diffusion: Solving the Wideband Inverse Scattering Problem with Diffusion Models [2.7] 広帯域散乱データから後部分布を近似するためのエンドツーエンド確率的フレームワークを提案する。
この問題では、条件拡散モデルと波動伝播および対称性の基礎物理学を併用する。
我々のフレームワークは、マルチスキャッタリング方式でNyquistのサブ機能を回復させることなく、鋭い再構築を実現することができる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:44:38 GMT)
Performance Prediction of Hub-Based Swarms [2.7] ハブベースのコロニーは、ハブと呼ばれる共通の巣の場所を共有する複数のエージェントで構成されている。
本稿では、グラフベースのエンコーダと組み合わせて、集合状態の低次元表現を作成することができるグラフベースの植民地表現を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:31:03 GMT)
The Distributional Uncertainty of the SHAP score in Explainable Machine Learning [2.7] 本稿では,未知の実体集団分布下でのSHAPスコアの推論の原理的枠組みを提案する。
我々は,この関数の最大値と最小値を求める基本的な問題について検討し,すべての特徴のSHAPスコアに対して厳密な範囲を決定できることを示した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:08:04 GMT)
Hidden curved spaces in Bosonic Kitaev model [2.6] 曲面空間における量子物質は、平坦空間では到達できない顕著な性質を示す。
2つの双曲曲面が物理的歪みのないボソニック・キタエフモデルで容易に存在することを示す。
有限化学ポテンシャルはこれらの2つの双曲面を結合し、システムのサイズとともに指数関数的に感度が増大する量子センサーを提供する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:40:10 GMT)
RT-Surv: Improving Mortality Prediction After Radiotherapy with Large Language Model Structuring of Large-Scale Unstructured Electronic Health Records [2.6] 本研究では、構造化されていない電子健康記録(EHR)データを構造化する大規模言語モデル(LLM)の可能性について検討する。
yonsei Cancer Centerにおける放射線療法(RT)を施行した34,276例のデータを分析した。
生存予測モデルは統計的、機械学習、ディープラーニングアプローチを用いて開発された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:02:24 GMT)
Audio-visual cross-modality knowledge transfer for machine learning-based in-situ monitoring in laser additive manufacturing [2.6] マルチモーダル融合は、複数のモーダルからデータを取得し、統合することにより、その場での監視性能を向上させることができる。
本稿では,資源から目標モダリティへ知識を伝達する相互モダリティ・ナレッジ・トランスファー(CMKT)手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:06:38 GMT)
Analysis of Parameterized Quantum Circuits: on The Connection Between Expressibility and Types of Quantum Gates [2.5] 等化量子回路(PQC)の表現性は重要な要素である
本稿では,PQC内の表現可能性と量子ゲートの型との関係を解析する。
分析の結果から,高表現能PQCの設計指針が得られた。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:41:41 GMT)
Axiomatic Characterisations of Sample-based Explainers [2.5] サンプルやデータセットから特徴に基づく説明を生成する説明を精査する。
我々は、他のすべてと互換性のある2つの重要な特性を満たす説明者のファミリー全体を識別する。
我々は、説明の存在と不確実なグローバル整合性を保証する最初の(広義の)説明者を紹介する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:10:07 GMT)
Dynamics of Relativistic Vortex Electrons in External Laser Fields [2.5] 電磁場との渦電子相互作用は、粒子加速技術の進歩、背景場の散乱理論、材料診断のための新しい電子ビームの獲得に不可欠である。
線形偏光(LP)および円偏光(CP)レーザーパルスにおける渦電子の伝播を2モードレーザーパルスで分離・結合した形で検討した。
レーザーパルスによる渦電子の多角的制御は, レーザー背景における渦散乱の基準となり, レーザー制御による新たな渦モードの達成を刺激し, 特殊な材料を標的とした診断プローブとして実現した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:40:23 GMT)
ConfusedPilot: Compromising Enterprise Information Integrity and Confidentiality with Copilot for Microsoft 365 [2.4] 我々は、Copilotを混乱させ、応答に完全性と機密性を侵害するRAGシステムのセキュリティ脆弱性のクラスであるConfusedPilotを紹介します。
本研究は,現在のRAGベースのシステムにおけるセキュリティ脆弱性を強調し,今後のRAGベースのシステムを保護するための設計ガイドラインを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:20:05 GMT)
Unleashing Artificial Cognition: Integrating Multiple AI Systems [2.4] 本稿では,人工知能の認知を解き明かすために,言語モデルとクエリ解析技術の革新的な融合を提案する。
我々のシステムは、Chessエンジンを言語モデルとシームレスに統合し、動きを予測し、戦略的説明を提供する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:36:30 GMT)
MADE-WIC: Multiple Annotated Datasets for Exploring Weaknesses In Code [2.4] MADE-WICは、機能とコメントの大規模なデータセットであり、技術的負債とコードの弱点に対する複数のアノテーションがある。
約860Kのコード関数と、12のオープンソースプロジェクトからの2.7M以上の関連コメントが含まれている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:32:38 GMT)
YOWOv3: An Efficient and Generalized Framework for Human Action Detection and Recognition [2.3] YOWOv3はYOWOv2の改良版である。
YOWOv3 はパラメータや GFLOP の数を大幅に削減すると同時に、同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:17:51 GMT)
The impact of internal variability on benchmarking deep learning climate emulators [2.3] 完全複雑地球系モデル(ESM)は計算に非常に高価であり、複数の放出経路の気候結果の探索に使用を制限している。
ESMを近似するより効率的なエミュレータは、放射を気候データセットに直接マッピングすることができる。
我々は、データ駆動型気候エミュレーションの一般的なベンチマークであるClimateBenchを調査し、ディープラーニングベースのエミュレータが現在、最高のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:17:17 GMT)
Quantum Generative Adversarial Networks: Generating and Detecting Quantum Product States [2.2] 我々は、画像生成と分類のための古典的なスタイルネットGANの量子アナログを作成する。
純粋に量子情報を持つQGANを実証する問題を選択する。
実積状態は、量子発生器によって生成された偽の量子積状態から検出され分離される。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:11:47 GMT)
EmoWrite: A Sentiment Analysis-Based Thought to Text Conversion -- A Validation Study [2.2] EmoWriteは、既存のBCIベースのシステムの限界に対処することを目的とした、新しい脳コンピュータインタフェース(BCI)システムである。
タイピング速度は6.6ワード毎分(WPM)と31.9文字毎分(CPM)で、精度は90.36%である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:45:04 GMT)
Clustering-friendly Representation Learning for Enhancing Salient Features [2.2] 本稿では、下流タスクとして教師なし画像クラスタリングに焦点を当てる。
クラスタリングフレンドリーなコントラスト学習手法を拡張し,コントラスト分析手法を取り入れた。
すべてのデータセットに対して,従来のコントラスト解析やディープクラスタリング手法と比較して,高いクラスタリングスコアを達成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:27:19 GMT)
Rehabilitation Exercise Quality Assessment through Supervised Contrastive Learning with Hard and Soft Negatives [2.2] 運動ベースのリハビリテーションプログラムは、生活の質を高め、死亡率と再入院率を減らすのに有効であることが証明されている。
これらのプログラムは一般的に様々なエクササイズタイプを規定しており、リハビリテーションエクササイズアセスメントデータセットにおいて明確な課題となっている。
本稿では,すべての運動タイプに適用可能な単一モデルをトレーニングするための,硬質で軟質な負のサンプルを用いた教師付きコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:54:49 GMT)
Monero Traceability Heuristics: Wallet Application Bugs and the Mordinal-P2Pool Perspective [2.0] Moneroのようなプライバシー重視の暗号通貨は、意図的に追跡するのが難しい。
モネロのコミュニティでは、"Differ By One"と"10 Block Decoy Bug"が観察され、同定されている。
10ブロックデコイバグ」やデコイの識別は、2019年から2023年の間に最も大きな影響を与えた。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:50:53 GMT)
Efficient Radiation Treatment Planning based on Voxel Importance [2.0] 本稿では,情報ボクセルの代表的な部分集合のみを用いることで,大規模な最適化問題を削減する手法を提案する。
オープンベンチマークデータに関する実証実験では、最適化時間が大幅に短縮され、オリジナルのものよりも最大50倍速くなった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:49:19 GMT)
AttackER: Towards Enhancing Cyber-Attack Attribution with a Named Entity Recognition Dataset [2.0] サイバー攻撃の属性に関する最初のデータセットを提供する。
私たちのものは、句や文にまたがるいくつかのものを含む、コンテキストの詳細を持った豊富なアノテーションセットを提供します。
攻撃属性に対するデータセットの有効性を示すため,広範囲な実験を行い,NLP手法を適用した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:10:35 GMT)
When do molecular polaritons behave like optical filters? [1.9] この観点からは、集合的な強い光-物質結合系で生じる分子偏光子によって特徴づけられるいくつかの線形光学効果を概説する。
このような状況下では、キャビティ内の分子吸収は、偏光子透過と素分子吸収スペクトルの重なりとして理解することができる。
ダークステート・ポラリトン緩和を促進する単一分子プロセスの速度を無視できない場合、この処理の限界を強調する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:48:34 GMT)
Pedestrian Motion Prediction Using Transformer-based Behavior Clustering and Data-Driven Reachability Analysis [1.9] 本稿では,過去の軌跡データに基づいて,将来の歩行者状態を予測するためのトランスフォーマーベースのフレームワークを提案する。
階層的密度に基づくクラスタリングと組み合わされた変換器エンコーダを用いて、多様な行動パターンを自動的に識別する。
これらの行動クラスタは、歩行者の将来の動きを予測するために、エンドツーエンドのデータ駆動アプローチによって、データ駆動の到達可能性分析に使用できることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:24:30 GMT)
Anomaly Prediction: A Novel Approach with Explicit Delay and Horizon [1.9] 時系列データの異常検出は、さまざまな領域において重要な課題である。
従来の手法は、通常、後続のステップで異常を特定することに重点を置いている。
本稿では,異常予測と呼ばれる時系列異常を検出する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:44:28 GMT)
Unboxing Default Argument Breaking Changes in 1 + 2 Data Science Libraries [1.9] データサイエンス(DS)は現代のソフトウェアの基礎となり、企業サービスを改善するためにデータ駆動型決定を可能にする。
データサイエンティストは、使用をシンプルにするためにデフォルト値に頼る。
その結果、これらのデフォルト値は時間とともに変化し、デフォルト引数のブレークング・チェンジ(DABC)として定義された特定のタイプの破壊的変更につながることが判明した。
この研究は、データサイエンスタスクで頻繁に使用される3つのPythonライブラリで93のDABCを明らかにしている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:38:45 GMT)
Inferring Ingrained Remote Information in AC Power Flows Using Neuromorphic Modality Regime [1.9] この研究は、スパイクの形でマルチモーダル方式を用いてデータ正規化の手段として、パワーと情報を統一する。
我々は、電力変換器のスイッチングのための変調パルスを得るために、遅延駆動型非教師なしヘビアン学習ルールを利用する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:35:52 GMT)
Eliciting Latent Knowledge from Quirky Language Models [1.8] 潜在知識の排除は、世界の本当の状態を確実に追跡する能力のあるニューラルネットワークのアクティベーションのパターンを見つけることを目的としている。
12のデータセットと、質問に答える際の体系的なエラーを微調整した「奇抜な」言語モデル(LM)スイートを導入します。
特に中層では、線形プローブは通常、LMが出力するものとは無関係に、LMの知識を報告する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:51:15 GMT)
Evolutionary mechanisms that promote cooperation may not promote social welfare [1.8] 協力度を最大化する目的と社会福祉を最大化する目的とが、しばしば不一致であることを示す。
社会・集団商品の進化的メカニズムを設計・実装する際に,社会福祉を主目的とする必要性を論じる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:51:13 GMT)
Object as a Service: Simplifying Cloud-Native Development through Serverless Object Abstraction [1.7] 我々は、アプリケーションデータと関数をクラウドオブジェクトの抽象化にカプセル化する、Object as a Service (O)と呼ばれる新しいパラダイムを提案する。
Oは、組み込み最適化機能を提供しながら、開発者がリソースとデータ管理の負担を軽減します。
我々は、一貫性とフォールトトレラント保証を備えた構造化データと非構造化データの状態抽象化を提供する、Oparacaという名前のプラットフォームを開発した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:55:00 GMT)
Cautious Calibration in Binary Classification [1.7] 慎重であることは、機械学習システムの信頼性を高めるために不可欠である。
リスクの高いシナリオでは、予測される各確率が不信に傾くことが重要です。
本研究では,二項分類における慎重な校正という新しい概念を紹介する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:19:40 GMT)
Causal Discovery of Linear Non-Gaussian Causal Models with Unobserved Confounding [1.7] 我々は,線形非ガウス構造方程式モデルについて考察する。
この設定では、因果構造は特定可能であるが、一般に、特定の因果効果を識別することはできない。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:24:12 GMT)
The Misclassification Likelihood Matrix: Some Classes Are More Likely To Be Misclassified Than Others [1.7] 本研究では、分散シフト下でのニューラルネットワーク予測の信頼性を定量化するための新しいツールとして、MLM(Misclassification Likelihood Matrix)を紹介した。
この研究の意味は、画像の分類を超えて、自動運転車などの自動運転システムで進行中の応用に及んでいる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:41:15 GMT)
High dimensional Bayesian Optimization via Condensing-Expansion Projection [1.6] 高次元設定では、ベイズ最適化(BO)は高価で実現不可能である。
実効的な部分空間仮定に応答しない高次元BOに対して、新しいランダムなプロジェクションに基づくアプローチを導入する。
実験の結果、どちらのアルゴリズムも既存のランダムな埋め込みに基づくアルゴリズムよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:47:38 GMT)
A Formal Approach For Modelling And Analysing Surgical Procedures (Extended Version) [1.6] 外科手術の形式的および自動的解析のための新しいアプローチを提案する。
我々は、そのような儀式の分析のために開発された、確立された技術を活用して、安全儀式をモデル化する。
本手法により,外科手術の意図する特性の違反を自動的に識別することができる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:28:22 GMT)
A model for efficient dynamical ranking in networks [1.5] そこで本研究では,有向時間ネットワークにおける動的ランク付けを推算する物理に着想を得た手法を提案する。
本手法は線形方程式系を解き、調整すべきパラメータは1つだけである。
各種アプリケーションにおける相互作用(エッジの存在)とその結果(エッジの方向)を予測する能力を評価することにより,本手法を検証した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:07:35 GMT)
Multi-Slice Spatial Transcriptomics Data Integration Analysis with STG3Net [1.4] 複数のスライス間のバッチ効果は、トランスクリプトミクスデータを解析する上で大きな課題となる。
我々はG2N(Global Nearest Neighbor)アンカーペア選択という,プラグアンドプレイによるバッチ補正手法を開発した。
G2Nをベースとして,マスク付きグラフ畳み込みオートエンコーダをバックボーンモジュールとして巧みに組み合わせたSTG3Netを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:31:12 GMT)
Privacy in Cloud Computing through Immersion-based Coding [1.4] プライバシ保護方式でデータの共有と処理が可能なコーディング機構を設計するためのフレームワークを提案する。
提案手法は,制御理論に基づく差分プライバシとシステム浸漬ツールの相乗効果に基づいて構築される。
提案手法は,アルゴリズムの有用性を損なうことなく,任意のレベルの差分プライバシーを提供するように設計されていることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:14:57 GMT)
Masked Graph Autoencoders with Contrastive Augmentation for Spatially Resolved Transcriptomics Data [1.3] ドメイン識別のための低次元潜在表現を学習するために,StMGAC (Contrastively Augmented Masked Graph Autoencoder) を提案する。
潜伏空間において、表現のための永続的な信号は自己蒸留によって得られ、自己教師付きマッチングを誘導する。
5つのデータセット上でSTMGACの性能を評価し,既存のベースライン法よりも優れた結果を得た。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:49:23 GMT)
Enhancing Person Re-Identification via Uncertainty Feature Fusion and Auto-weighted Measure Combination [1.3] 本研究では、人物再同定(Re-ID)を大幅に向上させる新しい手法を提案する。
ベンチマークデータセット( Market-1501, DukeMTMC-ReID, MSMT17)で検証した結果,我々の手法はランク1の精度と平均平均精度(mAP)を大幅に改善した。
UFFMは、複数の画像から特徴合成のパワーを生かし、異なる視点の被写体の多様性によって課される制限を克服する。
WDAはさらに、類似度メトリクスをインテリジェントに集約することでプロセスを洗練し、それによって、被験者間の微妙だが批判的な違いを識別するシステムの能力を高める。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:51:54 GMT)
Leveraging Ontologies to Document Bias in Data [1.1] Doc-BiasOは、textitfair-MLの文献とその尺度で定義されたバイアスの統合語彙の作成を目的としたリソースである。
私たちの主な目的は、AIのあらゆる領域に急速に拡大するにつれて、バイアス研究に関する既存の用語を明確にすることへの貢献です。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:18:55 GMT)
HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction [1.0] 本稿では,知識グラフ(KG)に基づくRAG手法のハイブリッドRAG(HybridRAG)を用いた新しい手法を提案する。
ベクトルデータベースとKGの両方からコンテキストを抽出するHybridRAGは、従来のVectorRAGとGraphRAGの両方を個別に比較する。
提案手法は金融分野を超えて応用できる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:07:48 GMT)
Time-Series Foundation Models for Forecasting Soil Moisture Levels in Smart Agriculture [1.0] 本研究は土壌水ポテンシャルを予測するため,SOTA (State-of-the-art) 時系列基盤モデルである $texttTimeGPT$ を新たに適用した。
我々の結果は、$textttTimeGPT$が、過去の$psi_mathrmsoil$データのみを使用して、競合予測精度を達成することを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:19:20 GMT)
Generalizing Few Data to Unseen Domains Flexibly Based on Label Smoothing Integrated with Distributionally Robust Optimization [0.9] 大規模なデータセットにディープニューラルネットワーク(DNN)を適用する場合、一般的にオーバーフィッティングが発生する。
ラベル平滑化 (LS) は, 1ホットラベルと一様ラベルベクトルを混合することにより, オーバーフィッティングを防止する効果的な正規化手法である。
本稿では、LSに分散ロバスト最適化(DRO)を導入し、既存のデータ分布を柔軟に未確認領域にシフトさせる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:13:33 GMT)
A Density Ratio Super Learner [0.9] 我々は,スーパーラーニングに基づく新たな損失関数を持つ密度比のアンサンブル推定器を開発した。
この新たな損失関数が,超学習者構築に有効であることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:28:22 GMT)
Enriching thermal point clouds of buildings using semantic 3D building models [0.9] 本稿では,LoD3ビルディングモデルのジオポジションとセマンティクスを用いて,熱点雲を豊かにするワークフローを提案する。
提案手法は, 異なる音源からの点群を自動的に登録し, サーマル点群をファサード詳細セマンティクスで強化する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:59:35 GMT)
Integrating Edge Information into Ground Truth for the Segmentation of the Optic Disc and Cup from Fundus Images [0.8] この研究は、ラプラシアンフィルタを用いて光学ディスクとカップの両端を基底真理から抽出することを目的としている。
エッジは、光学ディスクカップ接地真実に加えて、エッジ接地真実を得るように再構成される。
著者らは、REFUGEベンチマークデータセットとDrishti-GSデータセットを使用して研究を行っている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:18:50 GMT)
Interlayer Dzyaloshinskii-Moriya interactions induced via non-linear phononics in bilayer van der Waals materials [0.8] 本研究では, 非線形フォニックスによる光駆動構造変化が2層ファンデルワールス材料の磁気秩序に及ぼす影響について検討した。
本研究は, 層状ファンデルワールス材料における層間ダイザロシンスキー-モリヤ相互作用を誘導する戦略を示唆する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:06:12 GMT)
Concept learning of parameterized quantum models from limited measurements [0.7] 古典的モデリングにおいて量子測定の確率論的性質を考慮し、これらの量について単一の統合学習フレームワークで議論する。
パラメータ化量子モデルを学習し、学習アルゴリズムの性能に対する2つの変数の非対称効果と相互作用を定量化する。
我々の研究は、量子システムの古典的学習における有限計測ノイズの操作的影響を分析するための新しいツールを提供する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:07:42 GMT)
Psychological Profiling in Cybersecurity: A Look at LLMs and Psycholinguistic Features [0.7] 心理学的プロファイリング手法の可能性を探り、特に大規模言語モデル(LLM)と心理言語学的特徴の利用に焦点を当てる。
我々の研究は、サイバーセキュリティの実践に心理学的視点を統合することが、進化する脅威に対する防御メカニズムを強化することの重要性を強調している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:57:00 GMT)
Towards a Generative Approach for Emotion Detection and Reasoning [0.7] 大規模言語モデルを用いたゼロショット感情検出と感情推論のための新しいアプローチを提案する。
本論文は,テキストに対する感情検出と感情推論の課題に共同で対処するための生成的アプローチを用いた最初の研究である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:20:15 GMT)
AutoOffAB: Toward Automated Offline A/B Testing for Data-Driven Requirement Engineering [0.7] 「オフラインA/Bテスト」が注目され、過去の記録データを推定し、新技術のオフライン評価を行うことを目指している。
本稿では,最新のログに対してオフラインA/Bテストの変種を自動的に実行し,オフライン評価結果を更新するAutoOffABを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:17:37 GMT)
Characterization of $k$-positive maps [0.7] パラメータによって異なる次元の行列代数間の正の写像の族を構築する。
k$-正のパラメータの見積もり境界は、Cru'sci'nski と Kossakowski が考えるスペクトル条件から導出した値よりも優れている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:39:25 GMT)
A Context-Contrastive Inference Approach To Partial Diacritization [0.6] ダイアクリプティゼーションは、読みやすさを改善し、アラビア語のテキストの意味を曖昧にする上で重要な役割を担っている。
partial Diacritzation (PD) は、必要に応じて理解を助けるためにマークされる文字のサブセットの選択である。
我々は,既存のアラビア語発音システムとシームレスに統合されたPDの新しいアプローチである,文脈コントラスト部分発音システム(CCPD)を紹介する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:49:20 GMT)
Educational Customization by Homogenous Grouping of e-Learners based on their Learning Styles [0.5] 学習スタイルに基づいたFelder-Silvermanモデルを用いて,類似学習者をグループ化する。
学習者の学習スタイルを識別することにより、共用的な学習グループを形成し、各グループが好み、ニーズ、才能、能力に基づいて適応的なコンテンツを受け取る。
教育的成功」の観点では、実験グループの重み付き平均スコアは20点中17.65点、制御グループは20点中12.6点である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:06:42 GMT)
HistoKernel: Whole Slide Image Level Maximum Mean Discrepancy Kernels for Pan-Cancer Predictive Modelling [0.5] 計算病理学(CPath)における機械学習は、WSI(Whole Slide Images)からパッチレベルの予測を集約して、生存予測や薬物効果予測といった重要なタスクのためのWSIレベルの予測スコアを生成する。
我々は、下流予測タスクにおける予測性能を向上させるために、WSI間の分布類似性を測定する新しいカーネルであるHisto Kernelを紹介する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:40:08 GMT)
Neural Quantum Embedding: Pushing the Limits of Quantum Supervised Learning [0.4] 本稿では, 量子埋め込みの最適化手法であるNeural Quantum Embedding(NQE)について述べる。
NQEは経験的リスクの低いバウンダリを強化し、分類性能を大幅に改善する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:26:33 GMT)
AI-driven Java Performance Testing: Balancing Result Quality with Testing Time [0.4] 我々は,実行時のウォームアップイテレーションを動的に停止するAIベースのフレームワークを提案し,研究する。
本フレームワークは,最先端および最先端手法によるウォームアップ推定の精度を大幅に向上させる。
我々の研究は、ウォームアップフェーズの終了を動的に推定するためにAIを統合することで、Javaのパフォーマンステストのコスト効率が向上することを示した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:41:32 GMT)
Active Learning in Symbolic Regression with Physical Constraints [0.4] 進化的記号回帰(SR)は記号方程式をデータに適合させ、簡潔な解釈可能なモデルを与える。
本研究では,身体的制約のあるアクティブな学習環境において,どのデータを収集すべきかをSRを用いて提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:06:15 GMT)
Examining the Behavior of LLM Architectures Within the Framework of Standardized National Exams in Brazil [0.4] Exame Nacional do Ensino M'edio (ENEM)はブラジルの学生にとって重要な試験であり、ブラジルの多くの大学に入学するために必要である。
ブラジル政府の透明性政策により、学生の回答と社会経済的地位に関するアンケートは毎年公にされている(匿名化されている)。
人間の異なるグループとAIを比較し、人間と機械の回答の分布にアクセスできるようにします。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:47:28 GMT)
FiST-Financial Style Transfer with Hallucination and Creativity Control Framework [0.4] 本稿では、パブリックドメインの財務報告を即時補完に処理し、簡単なLCMプロンプトを用いて拡張する新しい2段階微調整プロセスを提案する。
提案した微調整フレームワークは,正しい質問の回答数を2倍にし,幻覚を50%以上低減する。
2段階の微調整モデルでは、パープレキシティが低く、ROUGE、TER、BLEUスコアが向上し、創造性と知識密度が向上し、不確実性とクロスエントロピーが低下した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:29:23 GMT)
AI-Powered Camera and Sensors for the Rehabilitation Hand Exoskeleton [0.4] 本研究は,障害者の手の動きを支援する視覚機能付きリハビリテーション・ハンド・エキソスケルトンを提案する。
設計目標は、トレーニングを必要とせずにシンプルなインターフェイスを利用できるツールを作ることだった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 04:47:37 GMT)
Universal Approximation Theorem for Vector- and Hypercomplex-Valued Neural Networks [0.4] 普遍近似定理(英: universal approximation theorem)は、1つの隠れた層を持つニューラルネットワークがコンパクト集合上の連続関数を近似できるという定理である。
これは、実数値ニューラルネットワークと超複素数値ニューラルネットワークに有効である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:24:05 GMT)
Text classification optimization algorithm based on graph neural network [0.4] 本稿では,グラフニューラルネットワークを用いたテキスト分類最適化アルゴリズムを提案する。
適応的なグラフ構築戦略と効率的なグラフ畳み込み操作を導入することにより、テキスト分類の精度と効率を効果的に向上する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:25:37 GMT)
Learning symmetry-protected topological order from trapped-ion experiments [0.4] 我々は、トラップイオン量子コンピュータによって生成された実験データを解析するために、テンソルカーネルサポートベクターマシン(TK-SVM)を用いる。
この教師なしの手法は直接解釈可能な訓練パラメータの恩恵を受け、非自明な弦順特徴化対称性保護トポロジカル位相(SPT)を識別することができる。
以上の結果から,TK-SVM法はノイズの多い実験データセットの2つの位相を識別することに成功した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:08:59 GMT)
Overcoming the Thermal-Noise Limit of Room-Temperature Microwave Measurements by Cavity Pre-cooling with a Low-Noise Amplifier. Application to Time-resolved Electron Paramagnetic Resonance [0.3] 空洞前冷却(CPC)は、測定を行う直前に、室温でマイクロ波空洞の電磁モードを占有する有害な熱光子の大部分が除去される。
HEMTをベースとした商用低雑音増幅器 (LNA) の入力を再利用し, 一時的に空洞に過結合した光子吸収型コールドロードとして機能する。
概念実証実験では、モニターされたマイクロ波モードのノイズ温度が室温以下から108Kに低下する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:43:29 GMT)
Approximate Quantum Codes From Long Wormholes [0.3] 近似量子誤り訂正符号のファミリは、量子多体ハミルトニアンのほぼ退化した基底状態として生じる。
我々は、この相互情報を小さくすることを要求して得られる近似符号の距離の概念を考察する。
両モデルともフェルミオン符号が一定速度で生成され、フェルミオンの数は無限大となる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:04:03 GMT)
Multi-dimensional Parameter Space Exploration for Streamline-specific Tractography [0.3] 実世界のデータを用いた合理化に着目し,パラメータ空間に対する洞察を得る方法について述べる。
合成データ上でのストリーム毎パラメータを用いた最先端の確率的追跡手法を検証する。
本研究では,SSPがパラメータ空間のパターンを明らかにするためにどのように使用できるかを示すことで,SSPの潜在的付加価値を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:25:05 GMT)
Conceptual Design and Implementation of FIDO2 compatible Smart Card for Decentralized Financial Transaction System [0.3] オンラインバンキングシステムにおける既存のパスワードレスおよびパスワードベースのピアツーピアトランザクションは、高度なデジタル攻撃に対して脆弱である。
本稿では,クラウドセキュリティのベストプラクティス,暗号の適切な利用,共通脆弱性の軽減に信頼性の高いコンピューティングを活用する,新規で堅牢なピアツーピアトランザクションシステムを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:08:10 GMT)
Hybrid Efficient Unsupervised Anomaly Detection for Early Pandemic Case Identification [0.3] 教師なし異常検出は、ラベル付きトレーニング例を必要とせずに、データの異常パターンを特定するための有望なテクニックである。
本研究は,距離と密度を結合した異常検出のための新しいハイブリッド手法を提案する。
新型コロナウイルスの感染拡大に伴うパンデミック(パンデミック)の状況に特に関係している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:31:39 GMT)
Neuromorphic Keyword Spotting with Pulse Density Modulation MEMS Microphones [0.3] キーワードスポッティングタスクには、事前に定義された単語を検出するための継続的オーディオストリーム監視が含まれる。
ニューロモルフィックデバイスはこのエネルギー課題に効果的に対処する。
マイクロホンとSNNの直接接続を提案する。
システムはGoogle Speech Commandデータセットで91.54%の精度を達成した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:27:51 GMT)
Improved Robustness for Deep Learning-based Segmentation of Multi-Center Myocardial Perfusion MRI Datasets Using Data Adaptive Uncertainty-guided Space-time Analysis [0.2] 灌流データセットの完全な自動解析により、患者のストレス/レスト研究の迅速かつ客観的な報告が可能になる。
トレーニングデータやソフトウェアやハードウェアのバリエーションが限られているにもかかわらず、マルチセンタデータセットを分析できるディープラーニング技術は、現在進行中の課題である。
提案したDAUGS分析手法は,多心応力灌流データセットのセグメンテーションのためのディープラーニング手法の堅牢性を向上させる可能性を秘めている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 01:21:41 GMT)
Kolmogorov-Arnold Network for Online Reinforcement Learning [0.2] Kolmogorov-Arnold Networks (KANs)は、ニューラルネットワークにおけるMLP(Multi-Layer Perceptrons)の代替としての可能性を示している。
Kansはパラメータが少なく、メモリ使用量が減ったユニバーサル関数近似を提供する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:32:37 GMT)
Natural Language Interaction with a Household Electricity Knowledge-based Digital Twin [0.2] ドメイン固有のデジタルツインは、スマートグリッドの様々なセグメントのデジタルレプリカを表すもので、各セグメントをモデル化、シミュレート、制御することができる。
本稿では,RAG (Retrieval Augmented Generation) 質問応答の可能性を初めて評価し,報告する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:35:43 GMT)
Deterministic remote entanglement using a chiral quantum interconnect [0.2] 本研究では、2つの名前のついた同一モジュール間のカイラル量子相互接続を別々のマイクロ波パッケージに構築する。
量子干渉を利用して、必要に応じてマイクロ波光子を放出し、これらのモジュール間で選択された方向に吸収する。
我々は62.4 +/- 1.6%(左光子伝播)と62.1 +/- 1.2%(右)の4量子W状態の形で、モジュール間のリモート絡み合いを生成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:35:43 GMT)
Deep-change at AXOLOTL-24: Orchestrating WSD and WSI Models for Semantic Change Modeling [0.2] 本稿では,AXOLOTL-24共有タスクのセマンティック・チェンジ・モデリングにおける最初のサブタスクの解について述べる。
本稿では,この課題を解く3つの新しい手法を提案し,実験する。
我々は、与えられた単語の使用法が与えられた感覚定義のいずれかによって説明されないかどうかを判断できるモデルを開発する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:15:54 GMT)
A Novel Spatiotemporal Coupling Graph Convolutional Network [0.2] 本稿では,新しいグラフ・コンテンポラル・ネットワーク(GCN)に基づく動的推定器,すなわちスペース・カップリングGCN(SCG)モデルについて述べる。
その結果、SCGは最先端技術と比較して精度が高く、ユーザやクラウドサービスへの強力な表現を学習できることを示した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:02:01 GMT)
CREMP: Conformer-rotamer ensembles of macrocyclic peptides for machine learning [0.2] 本稿では,マクロ環状ペプチドを用いた機械学習モデルの迅速開発と評価のためのリソースであるCREMPを紹介する。
CREMPは36,198個のマクロ環状ペプチドとコンフォーマー-ロタマーアンサンブルサンプリングツール(CREST)を用いた高品質な構造アンサンブルを含む
さらに、この新しいデータセットには3130万近いユニークなマクロサイクルのジオメトリが含まれており、それぞれが半経験的拡張タイトバインディング(xTB)DFT計算から導かれるエネルギーでアノテートされている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:16:32 GMT)
Exploiting the Lock: Leveraging MiG-V's Logic Locking for Secret-Data Extraction [0.2] MiG-Vは、世界初の商用論理ロック型RISC-Vプロセッサである。
論理ロックキーの1ビットを変更すれば、暗号暗号鍵の100%を公開できることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:59:23 GMT)
Overcoming the Limitations of Layer Synchronization in Spiking Neural Networks [0.1] 真に非同期なシステムでは、すべてのニューロンが閾値を同時に評価し、シナプス前電流を受けるとスパイクを発生させることができる。
本稿では,ネットワーク同期を実装したシミュレーション環境において,この問題を3つのデータセットで文書化し,定量化する。
レイヤ同期で訓練されたモデルは、同期がない場合にサブ最適に実行するか、エネルギーと遅延の低減の恩恵を受けないことを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:39:23 GMT)
Online Model-based Anomaly Detection in Multivariate Time Series: Taxonomy, Survey, Research Challenges and Future Directions [0.0] 時系列異常検出は、エンジニアリングプロセスにおいて重要な役割を果たす。
この調査では、オンラインとオフラインの区別とトレーニングと推論を行う新しい分類法を紹介した。
文献で使用される最も一般的なデータセットと評価指標、および詳細な分析を示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:10:52 GMT)
vFusedSeg3D: 3rd Place Solution for 2024 Waymo Open Dataset Challenge in Semantic Segmentation [0.0] VFusedSeg3Dは、カメラ画像のリッチなセマンティックコンテンツと、LiDARの正確な深度センシングを使用して、強力で包括的な環境理解を生成する。
我々の新しい特徴融合技術は、LiDAR点雲の幾何学的特徴とカメラ画像の意味的特徴を組み合わせたものである。
マルチモダリティ技術を用いることで、性能が大幅に向上し、検証セットで72.46%の最先端のmIoUが得られる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:34:19 GMT)
rule4ml: An Open-Source Tool for Resource Utilization and Latency Estimation for ML Models on FPGA [0.0] 本稿では、FPGA上での合成と実装に先立って、ニューラルネットワーク(NN)のリソース利用と推論遅延を予測する新しい手法を提案する。
NNを高レベル合成(HLS)コードに変換するツールフローであるHLS4MLを活用している。
本手法では, 即時前合成予測に適応した回帰モデルを用いる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:35:10 GMT)
\textit{re}CSE: Portable Reshaping Features for Sentence Embedding in Self-supervised Contrastive Learning [0.0] textitreCSEは自己指導型コントラスト学習文表現フレームワークである。
textitreCSEはセマンティック類似性タスクにおいて競合性能を達成した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:56:30 GMT)
Verifiable Decentralized IPFS Cluster: Unlocking Trustworthy Data Permanency for Off-Chain Storage [0.0] 本稿では、検証可能なデータ永続性保証により、オフチェーンストレージの信頼性を高めるために、VDIC(Verible Decentralized IPFS Clusters)を提案する。
性能評価は、VDICが従来のピンニングサービスと競合していることを示している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:26:55 GMT)
Variance-based sensitivity analysis in the presence of correlated input variables [0.0] 分散に基づく感度指標の推定のための古典的ソボ推定器の拡張を提案する。
この手法は、入力変数の寄与を相関部と非相関部に分解するために用いられる線形相関モデルを仮定する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:32:58 GMT)
UCB Exploration for Fixed-Budget Bayesian Best Arm Identification [0.0] 固定予算設定におけるベストアーム識別(BAI)について検討した。
ベイズ条件下での固定予算BAI問題に対して理論的かつ実験的に効率的であるUPB探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:15:36 GMT)
Two-Step QAOA: Enhancing Quantum Optimization by Decomposing One-Hot Constraints in QUBO Formulations [0.0] 本稿では,QAOAの有効性を向上させるための簡単なアプローチであるTwo-Step QAOAを提案する。
問題を2段階に分けて,ソフト制約をハード制約に変換する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:38:28 GMT)
Towards aerodynamic surrogate modeling based on $β$-variational autoencoders [0.0] 次元の低減と回帰技術を組み合わせた代理モデルは、コストの高い高忠実なCFDデータの必要性を減らすために不可欠である。
飛行条件を考慮に入れた超音速翼の圧力分布(マッハ数と攻撃角度)を予測するために,潜時空間回帰に基づく代理モデルを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:43:10 GMT)
Towards Resilient and Efficient LLMs: A Comparative Study of Efficiency, Performance, and Adversarial Robustness [0.0] 大規模言語モデル (LLM) の効率性, 性能, 対向ロバスト性の間のトレードオフについて検討する。
GLUEデータセットとAdvGLUEデータセットを使用して、Transformer++、Gated Linear Attention (GLA) Transformer、MatMul-Free LMという、さまざまな複雑さと効率のレベルを持つ3つの著名なモデルを比較した。
その結果,GLA Transformer と MatMul-Free LM は GLUE タスクではわずかに精度が低いが,AdvGLUE タスクでは,異なる攻撃レベルにおける Transformer++ と比較して高い効率と高いロバスト性を示した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:09:31 GMT)
The probabilistic world II : Quantum mechanics from classical statistics [0.0] 確率的環境における活動的あるいは静かな状態のニューロンに基づく単純なニューロモルフィックコンピュータは、絡み合った2量子ビット系のユニタリ変換を学習することができる。
我々の明示的な構成は、古典統計学における量子力学の埋め込みのノーゴー定理が回避されるという証明を構成する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:02:55 GMT)
Text Clustering with LLM Embeddings [0.0] テキストクラスタリングの有効性は、テキスト埋め込みとクラスタリングアルゴリズムの選択に大きく依存する。
大規模言語モデル(LLM)の最近の進歩は、このタスクを強化する可能性を秘めている。
LLM埋め込みは構造化言語の微妙さを捉えるのに優れていることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:57:09 GMT)
Survey on Computational Applications of Tensor Network Simulations [0.0] Reviewは、どのテンソルネットワークに対してどのクラスが提案されているかを明らかにすることを目的としている。
我々は,このレビューを,非専門家による読みやすいテンソルネットワークアプリケーションに関するハイレベルなツアーとして意図している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:46:47 GMT)
Spontaneous PT-symmetry breaking transitions under the influence of noise in an optomechanical system [0.0] 自発対称性の破れ(英: Spontaneous symmetric breaking)は、状態対称性がシステム対称性に変化を伴わない現象である。
本稿では,ノイズの影響下での異常点を有するオプトメカニカルシステムの挙動を考察する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 06:05:59 GMT)
ServerFi: A New Symbiotic Relationship Between Games and Players [0.0] 本稿では、ブロックチェーンゲームの進化を考察し、現在のトケノミクスモデルにおける重要な欠点を特定する。
本稿では,アセット合成によるプライバタイズを重視したServerFiと,ハイレテンションプレイヤーのためのContinuous Rewardsに着目したモデルを提案する。
この結果から,ServerFiはプレイヤーのエンゲージメントの維持と,ゲームエコシステムの長期的生存性確保に特に有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:32:07 GMT)
Retrieval-augmented code completion for local projects using large language models [0.0] 我々は,局所的な実行に適した約1億6000万のパラメータを持つ大規模言語モデル (LLM) の利用に注力する。
我々は、オープンソースのPythonファイル上に、トランスフォーマーアーキテクチャ、生成モデルGPT-2と検索適応RETROモデルに基づく2つのモデルをトレーニングする。
トークンのジャカード類似性に基づいてコードスニペットを検索するIn-context Search-augmented Generationを用いて、モデルの性能を改善する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:26:57 GMT)
Retinotopic Mapping Enhances the Robustness of Convolutional Neural Networks [0.0] 本研究では,葉緑体視覚の重要成分であるレチノトピックマッピングが,画像分類と局所化性能を向上させることができるかどうかを検討する。
標準オフザシェルフ畳み込みニューラルネットワーク(CNN)の入力にレノトピックマッピングが組み込まれた
驚くべきことに、レチノトピー的にマッピングされたネットワークは、分類において同等のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:40:20 GMT)
Quantum types: going beyond qubits and quantum gates [0.0] この記事では、高レベルの抽象化の必要性を概説し、Rhymeという開発者フレンドリーなプログラミング言語でそれらをいくつか提案する。
新しい量子型は、ビット、整数、フロート、文字、配列、文字列を含む古典型の拡張である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:59:56 GMT)
Quantum entanglement and Bell inequality violation at colliders [0.0] エンタングルメントは、標準モデルを超える新しい粒子や場を制限するための新しいツールとして提案されている。
このレビューでは、これらの開発を理解するのに必要な定義、ツール、基礎的な結果について紹介する。
我々は、量子ビット系と量子ビット系の両方、すなわちスピン1/半とスピン1粒子を含む最終状態の結果に関する詳細な議論を含む。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:21:44 GMT)
Quantum algorithms for scientific computing [0.0] ハイパフォーマンスコンピューティングに最も影響を与えるであろう分野には、量子システムのシミュレーション、最適化、機械学習などがある。
現代の古典的技術に対する控えめな量子増強でさえ、気象予報、工学、航空宇宙、薬物設計、持続可能な開発のための「グリーン」材料の設計といった分野において、はるかに大きな影響を及ぼすことになる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:01:10 GMT)
Qualitatively altered driven Dicke superradiance in extended systems due to infinitesimal perturbations [0.0] パラメータ化駆動によって誘導される興味深い量子相を持つディック模型は、キャビティにおいて集中的に研究されている。
我々は1次元導波管に結合した超伝導量子ビットを拡張系としてシミュレートし、4種類の摂動を理論的に検討した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:35:15 GMT)
Persistence kernels for classification: A comparative study [0.0] 本研究の目的は、様々な分類問題に適用される異なる永続カーネルの比較研究である。
5つの異なるカーネルを導入し、各データセットの分類性能を比較した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:16:31 GMT)
Passive error correction with a qubit-oscillator system in noisy environment [0.0] 本研究では, クビット・オシレータ結合強度を調整することにより, キャット・クビットを定常状態に安定化させることができることを示す。
本研究では,強い対称性を持つクビットオシレータ系における散逸相の理解を深め,それらを受動誤差補正に活用する方法を舗装する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:02:42 GMT)
Order Matters in Hallucination: Reasoning Order as Benchmark and Reflexive Prompting for Large-Language-Models [0.0] 大規模言語モデル(LLM)は、その誕生以来、様々な学術分野や産業分野にまたがって大きな注目を集めてきた。
LLMはしばしば「ハロシン化問題」に悩まされるが、出力は文法的にも論理的にも一貫性があり、事実の正確性に欠ける。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:34:32 GMT)
Optimizing Pulse Shapes of an Echoed Conditional Displacement Gate in a Superconducting Bosonic System [0.0] ECDゲートの標準構成において,ゲート時間に対する上限が低いことを示す。
本研究では, パルス整形法を用いて, 実験制約の組を考慮し, ECDゲートのパルス形状を最適化する手法を提案する。
我々は,標準構成で使用されるプリミティブの非オーバーラップ制約を緩和するか,最適制御法を用いて,CDゲートの総ゲート時間を$beta$の小さい値で削減できることを実証した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:49:09 GMT)
Optimizing Portfolio with Two-Sided Transactions and Lending: A Reinforcement Learning Framework [0.0] 本研究では,リスクの高い環境に適した強化学習に基づくポートフォリオ管理モデルを提案する。
マルチヘッドアテンションを持つ畳み込みニューラルネットワークを用いたソフトアクタ・クリティカル(SAC)エージェントを用いてモデルを実装した。
市場のボラティリティ(変動性)が変化する2つの16カ月間にわたってテストされたこのモデルは、ベンチマークを著しく上回った。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 23:36:58 GMT)
Opening the Black Box: predicting the trainability of deep neural networks with reconstruction entropy [0.0] 本稿では,ディープフィードフォワードニューラルネットワークのパラメータ空間におけるトレーニング可能な状態を予測する手法を提案する。
MNISTとCIFAR10の両方のデータセットに対して、トレーニングの1つのエポックが、ディープフィードフォワードネットワークのトレーニング可能性を予測するのに十分であることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:08:42 GMT)
On the use of neurosymbolic AI for defending against cyber attacks [0.0] 我々は,ニューロシンボリックAIを用いたコネクショナリズムとシンボリックAIの組み合わせについて論じる。
今日、AIを使用する際の課題のセットを特定し、ニューロシンボリックなユースケースのセットを提案する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:14:06 GMT)
On expected signatures and signature cumulants in semimartingale models [0.0] シグネチャと期待シグネチャの概念は、データサイエンス、特にシーケンシャルなデータ分析において不可欠である。
log-transform (expected signatures) は log-signatures (signature cumulants)
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:16:21 GMT)
On Building Myopic MPC Policies using Supervised Learning [0.0] 本稿では,教師付き学習を用いて最適値関数をオフラインで学習する代替戦略について考察する。
これは、非常に短い予測地平線を持つミオピックMPCのコスト・ツー・ゴー関数として使用できる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 08:26:28 GMT)
On "Consistent Quantization of Nearly Singular Superconducting Circuits" [0.0] 超伝導回路の量子化に関するRymarzとDiVincenzoによる分析は、それらの一般的な結論を正当化するには不十分である。
いくつかの相違点の1つの源は、ジョセフソン接合の存在下での拡張変数とコンパクト変数の間の長年にわたる論争である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:56:40 GMT)
Nonclassical signatures of photon-phonon antibunching in a multifield driven optomechanical cavity [0.0] フォトンフォノンのアンチバンチは、オプトメカニカルキャビティ系における古典的不等式に違反する可能性がある。
2つの弱いプローブ場によってシステムが駆動されるとき、単一光子-フォノン励起の量子相関を解析する。
この発見は、最適条件下でのサブポアソン信号の生成に重要であり、ハイブリッドシステムにも応用できる可能性がある。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:38:59 GMT)
New Field Theories with Foliation Structure and Subdimensional Particles from Godbillon-Vey Invariant [0.0] 葉付き多様体の数学的不変量であるゴッドビロン・ヴェイ不変量(Godbillon-Vey invariant)を動機とするBF型理論を提案する。
我々の理論は、移動性の制約と亜集中的な基底状態の退化を明示的に保証する、より高度な形態の対称性を包含する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:04:38 GMT)
Mapping "Brain Terrain" Regions on Mars using Deep Learning [0.0] 臨界領域のセットは、火星の斜視の周期的な変化に反応して、比較的最近に氷が噴出するサイクルを見た可能性がある。
本研究では、畳み込みニューラルネットワークを用いて「ブラインコーラル」地形を含む表面領域を検出する。
火星探査機マーズ・リコネッサンス・オービター(Mars Reconnaissance Orbiter)の大型画像(100-1000メガピクセル)を使って、これらの地形を1ピクセルあたり数十センチ近い解像度で探索する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:50:59 GMT)
MUSE: Multi-Knowledge Passing on the Edges, Boosting Knowledge Graph Completion [0.0] Knowledge Graph Completionは、(ヘッドエンティティ)-[リレーション]-(テールエンティティ)三重項の不足情報を予測することを目的としています。
本稿では,3次元の埋め込み空間を学習する知識認識推論モデル MUSE を提案する。
実験の結果,MUSEは4つの公開データセットにおいて,他のベースラインよりも有意に優れていた。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:10:02 GMT)
Longitudinal coupling between electrically driven spin-qubits and a resonator [0.0] 電磁界によって周期的に駆動されマイクロ波共振器に結合されるゼロ磁場における量子ドットに閉じ込められたスピン量子ビットについて検討する。
Floquetスピンキュービットと共振器との間の横方向結合と縦方向結合は、駆動周波数を変化させることで選択的に活性化できる。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 21:35:02 GMT)
Light-matter interactions in the vacuum of ultra-strongly coupled systems [0.0] 超強結合系の真空状態の特異な性質が基本的な光-物質相互作用プロセスにどのように影響するかを考察する。
この非伝統的な電磁環境では、追加のエミッタは、もはや裸の空洞光子に結合するのではなく、超強結合から生じる偏光子モードに結合する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:40:12 GMT)
Legal Minds, Algorithmic Decisions: How LLMs Apply Constitutional Principles in Complex Scenarios [0.0] GPT-4は一貫して、憲法の進歩的な解釈と密接に一致している。
本実験は, GPT-4の進行的法的解釈を優先する傾向を明らかにした。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:43:18 GMT)
Interventional Causal Structure Discovery over Graphical Models with Convergence and Optimality Guarantees [0.0] 因果構造学習のための二段階最適化(Bloom)フレームワークを開発した。
ブルームは、介入データと観測データの両方から因果構造発見を理論的に支援するだけでなく、効率的な因果構造発見アルゴリズムを目指す。
合成と実世界の両方のデータセットの実験を通して、ブルームは他の主要な学習アルゴリズムを著しく上回っている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:22:50 GMT)
Instability of the engineered dark state in two-band fermions under number-conserving dissipative dynamics [0.0] 関連する量子多体状態は、散逸プロトコルによって生成および制御することができる。
数保存散逸プロトコルは、非自明な位相を安定化できるため、特に魅力的である。
我々は、暗黒状態の安定化のための信頼できる普遍的ツールとして、数保存型散逸プロトコルが有用でないことを示した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:28:44 GMT)
Impacts of floating-point non-associativity on reproducibility for HPC and deep learning applications [0.0] 浮動小数点非連想性(FPNA)による並列プログラムのラン・バイ・ランの変動はアルゴリズムに大きな影響を与えることが知られている。
本稿では,並列プログラミングモデルにおけるFPNAの統計的特性について検討する。
我々は、最近追加されたPyTorchフレームワークにおける決定論的オプションについて、GPUデプロイメントのコンテキスト内で検討する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 16:07:37 GMT)
Graph Neural Networks as Ordering Heuristics for Parallel Graph Coloring [0.0] グラフニューラルネットワークに基づく順序付けを導入し、品質と性能の両方において、既存の強欲な順序よりも優れていることを示す。
実験結果から, 2層GNNモデルでは, カラー化品質を両立させながら, 最多次目(LF)と最少次目(SL)の順間の実行時間を達成できることがわかった。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:21:08 GMT)
Gate Operations for Superconducting Qubits and Non-Markovianity [0.0] 広帯域ノイズ源が存在する場合の単一量子力学の包括的画像を示す。
オオミックから1/fvarepsilon$-likeのサブオーミックな振る舞いまでの熱貯水池は、超伝導量子ビットの現実的なシナリオを模倣すると考えられている。
リタードフィードバックと長距離クビット-貯留層相関の関係を定量的に示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 22:08:15 GMT)
From text to multimodal: a survey of adversarial example generation in question answering systems [0.0] 本稿では,質問回答(QA)分野における敵の事例生成手法を包括的にレビューすることを目的とする。
系統分類による手法について検討し、包括的かつ構造化されたレビューを提供する。
本論文は,敵対的質問生成の今後の展望を考察し,潜在的研究の方向性を明らかにする。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:17:51 GMT)
Exploring Non-Markovianity in Ergodic Channels: Introducing Ergotropy as a Measure [0.0] 特異な不動点を持つ量子演算の一般集合を特徴づける。
これらの量子エルゴードチャネルは量子エルゴードチャネルと呼ばれる。
固定点が受動状態である場合、与えられた瞬間にエルゴトロピー減少チャネルであることが判明する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 10:57:19 GMT)
Evaluating the capability of large language models to personalize science texts for diverse middle-school-age learners [0.0] GPT-4は、トレーニングセッション中に選択した選択に基づいて、学生の学習嗜好をプロファイルするために使用された。
実験グループでは,GPT-4を用いて,学生の予測プロファイルに適合する科学テキストの書き直しを行い,制御グループでは,学習嗜好に反する文章の書き直しを行った。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 17:53:35 GMT)
Ergotropy, bound energy and entanglement in 1D long range Kitaev model [0.0] この関係は、1D Kitaevモデルと、$alpha$のパワーローとして距離で崩壊するペアリング項を用いて、共形対称性が破れる領域で検証する。
線形性は$alpha$の中間値に対して持続することを示す。
長距離ペアリングの存在は、仕事、すなわちエルゴトロピーのためにより多くのエネルギーを抽出するのに役立つ。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:36:50 GMT)
Entanglement and Bell inequality violation in $B\to \it{ΦΦ}$ decays [0.0] 我々は,現在のLHCbデータにより,5$sigma$閾値を超える有意な値で,絡み合いやベル不等式違反にアクセスできることを示す。
このことは、B$中間子崩壊の原因となる強い相互作用と電気弱相互作用が、高エネルギー現象の絡み合いと量子力学の性質の源として作用することを示している。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 11:46:06 GMT)
Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX [0.0] 本研究では,AIに基づく天気予報モデルの診断にアンサンブルデータ同化を用いた手法を提案する。
AIベースのモデルであるClimaXを用いた実験では、AIベースの天気予報モデルに対して、アンサンブルデータ同化が安定して周期化されることが実証された。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 05:34:48 GMT)
Emotion Classification from Multi-Channel EEG Signals Using HiSTN: A Hierarchical Graph-based Spatial-Temporal Approach [0.0] 本研究では,感情分類のためのパラメータ係数ネットワークを提案する。
このネットワークには、ボトムアップからさまざまな抽象化レベルで構築されたグラフ階層が組み込まれている。
平均F1スコアは96.82%(原子価)、95.62%(原子価)である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 12:32:12 GMT)
Emergent equilibrium and quantum criticality in a two-photon dissipative oscillator [0.0] 2光子駆動と2光子発散を持つ量子発振器の発散相転移について検討した。
非摂動的量子ゆらぎの理論を構築し、半古典近似を超える。
我々は、量子臨界領域の説明を提供し、数値シミュレーションと非常によく一致しているように見える臨界指数を得る。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 15:00:05 GMT)
Demonstration of teleportation across a quantum network code [0.0] 本稿では,特にノイズの多い中間規模量子デバイスに適したプロトコルであるMQNCについて検討する。
特に, MQNCを最先端の超伝導プロセッサに適応させる技術を開発し, その後, 量子情報のテレポーテーションに成功した。
実演におけるテレポーテーションは、ブロッホ球の極冠からの量子ビットを考慮し、古典的な方法で達成できる以上の忠実度で起こることが示されている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 09:25:39 GMT)
Currents in non-equilibrium steady states of open inhomogeneous $XX$-spin chains [0.0] 不均一な$XX$-スピン鎖の非平衡定常状態におけるスピンおよび熱電流について検討した。
浴槽間の温度差を小さくするために、鎖のミラー対称性を破る不均一性は熱伝導率とスピン伝導率の両方を著しく減少させることを示した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 02:21:22 GMT)
Controlling Markovianity with Chiral Giant Atoms [0.0] 巨大原子物理学の目印は、自己コヒーレントフィードバックの形での非マルコフ的特徴である。
結合の位相を調整することで、巨大原子が正反対のマルコフ状態に入ることを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 20:35:07 GMT)
Communicate to Play: Pragmatic Reasoning for Efficient Cross-Cultural Communication in Codenames [0.0] 我々は,共通分野における異文化間差異を解決するために,異文化間コミュニケーションのための合理的音声法(RSA+C3)を開発した。
提案手法は,異なる文化のシミュレーションプレイヤー間の協調性を向上することを示す。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:02:18 GMT)
Classical shadows with symmetries [0.0] 古典的シャドウ(CS)は、ランダムな測定と古典的な後処理に基づいて量子状態の多くの特性を推定する強力な方法として登場した。
ここでは、未知の状態や観測可能な状態の対称性の観点から、そのような知識が提供される場合について考察する。
特に、PI量子トモグラフィーの分野で得られた結果に基づいて、浅いPI-CSプロトコルを開発し研究する。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 18:08:11 GMT)
Bound states in the continuum induced via local symmetries in complex structures [0.0] 連続体(BIC)における境界状態は、伝播波と離散周波数に対応する空間的局所波との間のスペクトル分離を仮定する従来の知恵を無視する。
理論的には、BICは異なる機構、すなわち、大域対称性を含まない複素系の一部に場濃度を強制する局所対称性に依存している。
複雑な波動系におけるBICを実現する代替手段は、高いQ$モードを必要とする非線形相互作用のセンシング、ラシング、強化といった応用に有用である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 00:54:46 GMT)
Benchmark Computations of Nearly Degenerate Singlet and Triplet states of N-heterocyclic Chromophores : II. Density-based Methods [0.0] LR-TDDFT と$Delta$SCF の両方に対して最小絶対誤差 (MAE) を持つ関数セットを提案する。
本研究は3種類のシクラジン系分子テンプレートの広範な研究に基づいている。
DFTの文脈における正確な交換、スピン汚染、スピン分極の役割は、我々の研究の最前線に来ている。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:47:38 GMT)
Analysis of quantum Krylov algorithms with errors [0.0] この研究は、リアルタイム進化に基づく量子クリロフアルゴリズムの漸近的誤り解析を提供する。
得られた基底状態エネルギー推定値の上限と下限を証明し、上限の誤差は入力誤差率で線形である。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 14:14:42 GMT)
AIris: An AI-powered Wearable Assistive Device for the Visually Impaired [0.0] AIを利用したウェアラブルデバイスであるAIrisを導入し、視覚障害者に環境認識とインタラクション機能を提供する。
我々は,実環境下で効果的に動作する機能プロトタイプシステムを開発した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 19:54:14 GMT)
A Pipeline for Data-Driven Learning of Topological Features with Applications to Protein Stability Prediction [0.0] 生体分子データの解釈可能なトポロジ的特徴を学習するためのデータ駆動手法を提案する。
我々は、自動学習された構造的特徴を利用するモデルと、サブジェクト・マッター・エキスパート(SME)によって決定された大規模生物物理学的特徴に基づいて訓練されたモデルとを比較した。
本モデルでは,タンパク質構造のトポロジ的特徴のみに基づいて,SMEモデルの性能の92%~99%を平均精度スコアで達成した。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 03:52:27 GMT)
A Geometric Nash Approach in Tuning the Learning Rate in Q-Learning Algorithm [0.0] 我々は、アルファパラメータを最適化し、学習効率と安定性を向上させるための体系的な枠組みを確立する。
その結果,学習速度とベクトルT(学習の各エピソードの時間ステップ)とR(各エピソードの報酬ベクトル)の角度の関係が示唆された。
ベクトル T と R と Nash Equilibrium の間の角二部ベクトルの概念は、探索と探索のトレードオフによる損失を最小限に抑えるために$alpha$を推定する洞察を与える。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 07:39:04 GMT)
A GNN Model with Adaptive Weights for Session-Based Recommendation Systems [0.0] セッションベースレコメンデーション(SBR)で使用できる新しいアプローチを提案する。
本稿では,グラフニューラルネットワーク(GNN)ベクトルに適用した適応重み付け機構を提案する。
アイテムは、重み付けメカニズムの結果、各セッション内で様々な重要性の度合いが割り当てられます。
論文参考訳(メタデータ) (Fri, 9 Aug 2024 13:13:43 GMT)