Chain of Code: Reasoning with a Language Model-Augmented Code Emulator [115.2] 我々は、LMコード駆動推論を改善するシンプルながら驚くほど効果的な拡張であるChain of Codeを提案する。
キーとなるアイデアは、プログラム内のセマンティックなサブタスクを、インタープリタが明示的にキャッチできるフレキシブルな擬似コードとしてフォーマットすることを、LMに促すことである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:27:56 GMT)
Video Understanding with Large Language Models: A Survey [97.3] 言語・マルチモーダルタスクにおける大規模言語モデル(LLM)の顕著な機能を考えると,近年の映像理解の進歩について概観する。
Vid-LLMの創発的能力は驚くほど進歩しており、特にオープンな多粒性推論能力がある。
本調査は,Vid-LLMのタスク,データセット,ベンチマーク,評価方法論に関する総合的研究である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:25:20 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [96.0] 人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である
MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。
本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 01:59:21 GMT)
Knowledge Mechanisms in Large Language Models: A Survey and Perspective [88.5] 本稿では,知識利用と進化を含む新しい分類法から知識メカニズムの解析をレビューする。
LLMが学んだ知識、パラメトリック知識の脆弱性の理由、そして解決が難しい潜在的な暗黒知識(仮説)について論じる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:15:59 GMT)
A Survey of Large Language Models in Medicine: Progress, Application, and Challenge [85.1] 大規模言語モデル (LLM) は、人間の言語を理解し、生成する能力のために大きな注目を集めている。
本総説は,医学におけるLSMの開発と展開について概説することを目的としている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:16:30 GMT)
Not All Pairs are Equal: Hierarchical Learning for Average-Precision-Oriented Video Retrieval [80.1] 平均精度(AP)は、関連ビデオのランキングを上位リストで評価する。
最近のビデオ検索手法は、全てのサンプル対を等しく扱うペアワイズ損失を利用する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:52:04 GMT)
MMInstruct: A High-Quality Multi-Modal Instruction Tuning Dataset with Extensive Diversity [80.0] 高品質で多様な視覚指導訓練データセットMMInstructを構築し、24ドメインの973K命令で構成されている。
提案する命令生成エンジンは,手作業のコストで半自動,低コスト,マルチドメインの命令生成を可能にする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:55:22 GMT)
MINI-SEQUENCE TRANSFORMER: Optimizing Intermediate Memory for Long Sequences Training [78.9] ミニシーケンス変換器(Mini-Sequence Transformer, MsT)は、非常に長いシーケンスを持つ高速かつ高精度なLLMトレーニング手法である。
MsTは入力シーケンスを分割し、中間メモリ使用量を減らすためにミニシーケンスを反復的に処理する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 01:52:30 GMT)
Benchmarks as Microscopes: A Call for Model Metrology [76.6] 現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:52:12 GMT)
DGE: Direct Gaussian 3D Editing by Consistent Multi-view Editing [72.5] オープンな言語命令に基づいて3Dオブジェクトやシーンを編集する際の問題点を考察する。
この問題に対する一般的なアプローチは、3D編集プロセスをガイドするために2Dイメージジェネレータまたはエディタを使用することである。
このプロセスは、コストのかかる3D表現の反復的な更新を必要とするため、しばしば非効率である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:11:07 GMT)
Conditioned Language Policy: A General Framework for Steerable Multi-Objective Finetuning [72.5] 本稿では,多目的言語モデルを微調整するためのフレームワークである条件付き言語ポリシー(CLP)を提案する。
マルチタスクトレーニングとパラメータ効率の微調整のテクニックに基づいて、CLPは推論時に競合する目的を効果的にトレードオフするステアブルモデルを学ぶことができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:13:38 GMT)
Building Machines that Learn and Think with People [72.4] 我々は、協調認知の科学が、本当に思考パートナーと呼ばれることのできるエンジニアシステムにどのように機能するかを示す。
我々は、人間とAIの思考パートナーが協力し、人間と互換性のある思考パートナーシップのためのデシダータを提案できる、協力的思考のいくつかのモードを配置した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:42:45 GMT)
SIGMA:Sinkhorn-Guided Masked Video Modeling [69.3] SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:04:09 GMT)
Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.1] 本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。
私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:32:09 GMT)
CBGBench: Fill in the Blank of Protein-Molecule Complex Binding Graph [66.1] CBGBenchは構造ベースドラッグデザイン(SBDD)のベンチマークである
既存のメソッドを属性に基づいて分類することで、CBGBenchは様々な最先端メソッドを実装している。
我々は,これらのモデルを薬物設計に不可欠なタスクに適応させてきた。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:22:37 GMT)
Domain-Adaptive 2D Human Pose Estimation via Dual Teachers in Extremely Low-Light Conditions [65.0] 低照度ポーズ推定の最近の研究は、トレーニングのために地上の真実とペアの明るい画像と低照度画像を使用する必要がある。
我々の主な新規性は、2つの補完的な教員ネットワークを活用して、より信頼性の高い擬似ラベルを生成することである。
本手法は最新技術(SOTA)法に対して6.8%(2.4 AP)の改善を達成した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:09:14 GMT)
EAG: Extract and Generate Multi-way Aligned Corpus for Complete Multi-lingual Neural Machine Translation [63.9] EAG(Extract and Generate)は,バイリンガルデータから大規模かつ高品質なマルチウェイアライメントコーパスを構築するための2段階のアプローチである。
まず、異なる言語対から、非常に類似したソースやターゲット文を持つバイリンガルな例をペアリングして、候補に整列した例を抽出する。
次に、よく訓練された生成モデルを用いて、候補から最終的な整列例を生成する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:22:23 GMT)
MeLo: Low-rank Adaptation is Better than Fine-tuning for Medical Image Diagnosis [63.6] ヴィジュアルトランスフォーマー(ViT)は、医療画像のコミュニティにとってずっと大きく、アクセスしにくくなっている。
MeLo(医療画像低ランク適応)は、リソース要求の微調整の代わりに低ランク適応を採用する。
提案手法は,4つの異なる医用画像データセット上で,完全に微調整されたVTモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:39:53 GMT)
Multi-Sentence Grounding for Long-term Instructional Video [63.3] 大規模インストラクショナルデータセットを記述するための,自動でスケーラブルなパイプラインを確立することを目的としている。
複数の記述ステップを監督する高品質なビデオテキストデータセット、HowToStepを構築した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:17:29 GMT)
Boosting Reward Model with Preference-Conditional Multi-Aspect Synthetic Data Generation [63.0] RMBoostは、新しい合成選好データ生成パラダイムである。
優先ペアが意図的に構築されているため、ラベリングノイズを低減する。
これは4つの異なる報酬モデルのパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:21:55 GMT)
Beyond Memorization: The Challenge of Random Memory Access in Language Models [56.5] 生成言語モデル(LM)がそのメモリに逐次的またはランダムにアクセスできるかどうかを検討する。
本手法により, LMのランダムメモリアクセス性能が向上することがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:29:00 GMT)
Some consequences of Sica's approach to Bell's inequalities [55.2] ルイ・シカ(Louis Sica)は、ベルの不等式は、あるステーションで観測された結果の時系列が、他のステーションの設定が変更されても変化しないという仮説から導いた。
本稿では,Sicaのアプローチを非理想的効率と実時間構造に拡張する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:39:00 GMT)
Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning [53.6] 大規模言語モデル(LLM)は多くの自然言語タスクにおいて印象的な能力を示している。
LLMは多段階推論を行う際にエラー、幻覚、矛盾する文を生成する傾向がある。
本稿では,LLMの復号化過程を検討計画で導くためのフレームワークであるQ*を紹介する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:01:49 GMT)
Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget [53.3] 大規模T2I拡散変圧器モデルの低コスト化を実証する。
我々は16億のパラメータスパーストランスをわずか1890ドルの経済的コストで訓練し、ゼロショット世代で12.7 FIDを達成する。
我々は、マイクロ予算での大規模拡散モデルのトレーニングをさらに民主化するために、エンドツーエンドのトレーニングパイプラインをリリースすることを目指している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:23:28 GMT)
CLIP-Guided Networks for Transferable Targeted Attacks [52.3] トランスファー可能な敵攻撃は、ブラックボックスのシナリオで敵が特定した予測を出力するモデルを誤解させることを目的としている。
textitsingle-target 生成攻撃は、高い転送可能な摂動を生成するために、各ターゲットクラスのジェネレータを訓練する。
textbfCLIP-guided textbfGenerative textbfNetwork with textbfCross-attention module (CGNC) to enhance multi-target attack。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:41:57 GMT)
A Survey on 3D Gaussian Splatting [52.0] 3D Gaussian splatting (GS) は、明示的なラディアンス場とコンピュータグラフィックスの領域において、トランスフォーメーション技術として登場した。
本稿では,3D GSの領域における最近の発展と重要な貢献について,初めて体系的に概説する。
前例のないレンダリング速度を実現することで、3D GSは、仮想現実からインタラクティブメディアなど、数多くのアプリケーションを開くことができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:13:49 GMT)
Learning Multi-modal Representations by Watching Hundreds of Surgical Video Lectures [51.8] 外科的コンピュータビジョンの最近の進歩は、言語意味論に欠ける視覚のみのモデルによって推進されている。
本稿では,eラーニングプラットフォームからの手術ビデオ講義を活用し,効果的な視覚情報と言語監督信号を提供する。
テキスト書き起こしのための複数自動音声認識システムを用いて,手術固有の言語課題に対処する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:12:10 GMT)
SlowFast-LLaVA: A Strong Training-Free Baseline for Video Large Language Models [51.7] 本研究では,空間的セマンティクスと長時間の時間的文脈を協調的にキャプチャできる学習自由ビデオ大言語モデル(LLM)を提案する。
これは、ビデオLLMの入力の2ストリームSlowFast設計を用いて実現される。
実験の結果, SF-LLaVAは, 既存のトレーニング不要の手法よりも広い範囲の映像タスクにおいて優れていた。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:58:04 GMT)
Robust Mixture Learning when Outliers Overwhelm Small Groups [51.5] 敵が任意の外れ値を加える場合、適切に分離された混合の手段を推定する問題について検討する。
本稿では,各混合平均値に対して,最小のリストサイズオーバーヘッドで順序-最適誤差を保証するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:51:05 GMT)
Double Deep Learning-based Event Data Coding and Classification [45.8] イベントカメラは、"イベント"と呼ばれる、画素ごとの非同期の明るさ変化をキャプチャする機能を持つ
本稿では、イベントのポイントクラウドベースの表現を用いて、イベントデータ符号化と分類の両方のための新しいダブルディープラーニングベースのアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:45:55 GMT)
Supercharging Federated Learning with Flower and NVIDIA FLARE [44.5] FlowerやNVIDIA FLAREといったオープンソースシステムは近年開発されている。
両フレームワークの初期の統合について述べ、FLエコシステム全体をスーパーチャージするためにどのように連携できるかを示します。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:01:48 GMT)
A Closer Look at GAN Priors: Exploiting Intermediate Features for Enhanced Model Inversion Attacks [44.0] Model Inversion (MI)攻撃は、出力情報を利用して、リリースされたモデルからプライバシーに敏感なトレーニングデータを再構築することを目的としている。
GAN(Generative Adversarial Network)の最近の進歩は、MI攻撃の性能向上に大きく貢献している。
本稿では,GAN構造を分解し,中間ブロック間の特徴を利用する中間特徴拡張生成モデル変換(IF-GMI)を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:58:19 GMT)
J-CHAT: Japanese Large-scale Spoken Dialogue Corpus for Spoken Dialogue Language Modeling [43.9] 音声対話は人間とAIの相互作用において重要な役割を担い、対話指向音声言語モデル(SLM)を必要とする
ヒッカ品質の音声生成を確実にするためには、データはWild内のデータのように自然に必要であり、ノイズを除去して音響的にクリーンでなければならない。
本研究では,人間-AI対話のための日本語コーパス(J-CHAT)という,大規模音声対話コーパスの構築とリリースによって,このギャップに対処する。
本稿では、コーパス構築のための言語に依存しない手法を提案し、J-CHATで訓練されたSLMを用いた対話生成実験について述べる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:46:50 GMT)
Scaling CS1 Support with Compiler-Integrated Conversational AI [43.8] DCC Sidekickは、教育プログラムエラー説明を生成することで、既存のLLMベースのC/C++コンパイラを強化するWebベースのAIツールである。
959名の学生が11,222人のDCC Sidekickセッションに従事し、7週間で17,982件の誤りを報告した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:53:55 GMT)
Importance Sampling-Guided Meta-Training for Intelligent Agents in Highly Interactive Environments [43.1] 本研究では,高度にインタラクティブな運転シナリオをナビゲートするためのトレーニング分布を最適化するために,ガイド付きメタRLと重要サンプリング(IS)を統合した新しいトレーニングフレームワークを提案する。
現実世界のデータセットから自然な分布を推定することにより、このフレームワークは、共通および極端な駆動シナリオ間のバランスのとれたフォーカスを保証する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:57:12 GMT)
Accelerating Pre-training of Multimodal LLMs via Chain-of-Sight [42.8] Chain-of-Sightはマルチモーダル大規模言語モデル(MLLM)の事前学習を加速する視覚言語ブリッジモジュールである。
提案手法では,様々な空間スケールで視覚的詳細をキャプチャする視覚的リサンプラーを用いている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:33:49 GMT)
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability [42.5] 本稿では,高忠実度かつ多目的な制御性を有する一般化可能な運転世界モデルであるVistaを提案する。
本稿では,移動インスタンスと構造情報の学習を促進するために,新たな2つの損失を提案する。
動作制御性には,高レベルな意図から低レベルな操作に至るまで,多種多様な制御が組み込まれている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 01:20:07 GMT)
Efficient4D: Fast Dynamic 3D Object Generation from a Single-view Video [42.1] 本稿では,効率的な4Dオブジェクト生成フレームワークであるEfficient4Dを提案する。
異なるカメラビューの下で高品質な時空一貫性の画像を生成し、ラベル付きデータとして使用する。
合成ビデオと実ビデオの両方の実験によると、Efficient4Dのスピードは10倍に向上している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:14:11 GMT)
SoccerRAG: Multimodal Soccer Information Retrieval via Natural Queries [42.1] SoccerRAGはRetrieval Augmented Generation(RAG)とLarge Language Models(LLM)のパワーを活用するために設計された革新的なフレームワークである。
マルチモーダルデータセットを利用することで、動的クエリと自動データバリデーションをサポートする。
評価の結果,従来の検索システムに比較して,複雑なクエリを効果的に処理できることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:42:44 GMT)
Demo: Soccer Information Retrieval via Natural Queries using SoccerRAG [42.1] SoccerRAGはRetrieval Augmented Generation(RAG)とLarge Language Models(LLM)のパワーを活用するために設計された革新的なフレームワークである。
マルチモーダルデータセットを利用することで、動的クエリと自動データバリデーションをサポートする。
コア機能を取り巻くChainlitフレームワークに基づいた,インタラクティブなユーザインターフェース(UI)を新たに提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:44:20 GMT)
LongVideoBench: A Benchmark for Long-context Interleaved Video-Language Understanding [41.9] LongVideoBenchは質問に答えるベンチマークで、最大1時間までビデオ言語によるインターリーブされたインプットを特徴としている。
私たちのベンチマークには、さまざまなテーマにまたがるサブタイトルを持つ3,763種類のウェブコレクトビデオが含まれています。
我々は、推論を参照する新しいビデオ質問応答タスクを定式化する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:00:55 GMT)
MSSPlace: Multi-Sensor Place Recognition with Visual and Text Semantics [41.9] マルチカメラのセットアップを活用し,マルチモーダル位置認識のための多様なデータソースを統合することの影響について検討する。
提案手法は,複数のカメラ,LiDAR点雲,セマンティックセグメンテーションマスク,テキストアノテーションなどの画像を用いて,総合的な位置記述子を生成する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:24:56 GMT)
One Size Fits All for Semantic Shifts: Adaptive Prompt Tuning for Continual Learning [41.4] 本研究では,緩やかな変化と急激な変化が混在する度合いのセマンティックシフトに対応する適応的プロンプト手法を提案する。
AdaPromptCLは、プロンプトグループを動的に管理するアサイン・アンド・リファインなセマンティックグルーピングメカニズムを採用している。
実験の結果、AdaPromptCLは既存のプロンプト法を最大21.3%上回った。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:11:28 GMT)
Psychometric Alignment: Capturing Human Knowledge Distributions via Language Models [41.3] 言語モデル(LM)は、人口の振る舞いを正確に模倣することで意思決定を導くシナリオにおいて、人間のような反応をシミュレートするためにますます使われる。
本研究では,人間の知識分布の程度を計測する指標である「心理学的アライメント」を導入する。
人格に基づくプロンプトを用いることでアライメントが向上するが, LMとヒトの集団の間には重大な不一致が生じる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:02:59 GMT)
Chatbot-Based Ontology Interaction Using Large Language Models and Domain-Specific Standards [41.2] 大規模言語モデル(LLM)は、SPARQLクエリ生成を強化するために使用される。
システムはユーザーの問い合わせを正確なSPARQLクエリに変換する。
確立されたドメイン固有の標準からの追加情報がインターフェースに統合される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:58:36 GMT)
FMDNN: A Fuzzy-guided Multi-granular Deep Neural Network for Histopathological Image Classification [40.9] ファジィ誘導多粒性ディープニューラルネットワーク(FMDNN)を提案する。
病理学者の多粒性診断アプローチに触発され, 粗さ, 培地, 微粒度における細胞構造の特徴抽出を行った。
ファジィ誘導型クロスアテンションモジュールは、普遍的なファジィ特徴を多粒性特徴へ導く。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 00:46:15 GMT)
Cinemo: Consistent and Controllable Image Animation with Motion Diffusion Models [40.5] 我々は、より優れたモーション制御性を実現するための、新しいイメージアニメーションアプローチであるCinemoを紹介する。
我々は,Cinemoのトレーニングと推論段階における3つの効果的な戦略を提案し,その目標を達成する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:00:03 GMT)
Refining Corpora from a Model Calibration Perspective for Chinese Spelling Correction [40.1] チャイニーズ・スペルリング・コーパス(CSC)は通常、大規模な高品質コーパスを欠いている。
2つのデータ拡張手法が広く採用されている: (1) 混乱セットのガイダンス付きtextitRandom Replacement と (2) 文字誤用をシミュレートする textitOCR/ASR ベースジェネレーション。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:26:35 GMT)
A New Theoretical Perspective on Data Heterogeneity in Federated Optimization [39.8] 連邦学習(FL)において、データ不均一性は、既存の理論解析が収束率について悲観的である主な理由である。
特に多くのFLアルゴリズムでは、局所的な更新数が大きくなると収束率が劇的に増加する。
本稿では,理論的理解と実践的パフォーマンスのギャップを,新たな視点からの理論的分析を提供することによって埋めることを目的とする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:52:58 GMT)
WayEx: Waypoint Exploration using a Single Demonstration [39.7] WayExは、複雑な目標条件のロボットタスクを単一のデモから学習する新しい方法だ。
本手法は従来の強化学習法と比較してトレーニング時間を50%短縮する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:59:46 GMT)
Explore the LiDAR-Camera Dynamic Adjustment Fusion for 3D Object Detection [38.8] カメラとLiDARは、正確で堅牢な自動運転システムの情報センサーとして機能する。
これらのセンサーは、しばしば異質な性質を示し、分布のモダリティギャップをもたらす。
モーダル分布の整合と効果的なモーダル表現の学習を目的とした動的調整技術を導入する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:42:15 GMT)
LLaST: Improved End-to-end Speech Translation System Leveraged by Large Language Models [38.6] LLaSTは、高性能な大規模言語モデルに基づく音声テキスト翻訳システムを構築するためのフレームワークである。
我々のアプローチには、LLMベースの音声翻訳アーキテクチャ設計、ASR強化トレーニング、多言語データ拡張、二重LoRA最適化が含まれる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:42:00 GMT)
Concept-Based Interpretable Reinforcement Learning with Limited to No Human Labels [38.1] 本稿では,RLアルゴリズムが概念ベースのポリシーを効率的に学習することのできる,新しい学習手法を提案する。
我々のアルゴリズムであるlicORICEは、概念学習とRLトレーニングをインターリーブし、概念アンサンブルを使用して、ラベル付けのための情報的データポイントを積極的に選択する。
licORICEは,3つの環境において,手動ラベリングの取り組みを500以上のコンセプトラベルに減らすかを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:46:33 GMT)
Graph Signal Processing for Cross-Domain Recommendation [37.9] クロスドメインレコメンデーション(CDR)は、高密度ドメインからのユーザ-イテムインタラクションを活用して、データ空間とコールドスタート問題を緩和することにより、従来のレコメンデーションシステムを拡張する。
既存のCDR手法の多くは、重複するユーザの割合と、ソースドメインとターゲットドメインの固有の相違に敏感である。
GSPに基づく統一CDRフレームワークであるCGSPを提案し、ターゲットのみの類似性とソースブリッジの類似性を柔軟に組み合わせて構築されたクロスドメイン類似性グラフを利用する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:07:03 GMT)
Schema-Driven Information Extraction from Heterogeneous Tables [37.5] 本稿では、機械学習論文、化学文献、材料科学雑誌、ウェブページの4つの分野のテーブルからなるベンチマークを示す。
我々の実験は、タスク固有のパイプラインやラベルを必要とせずに、驚くほど競争力のあるパフォーマンスが達成できることを示した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:22:08 GMT)
SS-SFR: Synthetic Scenes Spatial Frequency Response on Virtual KITTI and Degraded Automotive Simulations for Object Detection [37.1] 自動車シミュレーションにおける画像シャープネスに対するガウスのぼかしのバリエーションの適用効果について検討する。
画像のシャープネス(MTF50)は平均0.245cy/pxから0.119cy/pxに低下するが、物体検出性能は0.58%の範囲でほぼ安定であることがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:03:29 GMT)
Developing a Reliable, General-Purpose Hallucination Detection and Mitigation Service: Insights and Lessons Learned [36.2] 大型言語モデル(LLM)における幻覚の発見と修正を目的とした信頼性の高い高速生産システムを提案する。
我々のシステムは、名前付きエンティティ認識(NER)、自然言語推論(NLI)、スパンベース検出(SBD)を含む。
フレームワークの中核となる要素を詳述し、応答時間、可用性、パフォーマンスメトリクスに関連する最重要課題を過小評価します。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:48:30 GMT)
A Benchmark Study of Deep-RL Methods for Maximum Coverage Problems over Graphs [36.1] MCPとIMの5種類のDeep-RL法の有効性と有効性について検討した。
その結果,様々なシナリオにおいて,Lazy GreedyアルゴリズムはMPPのDeep-RL法を常に上回っていることがわかった。
IMの場合、理論上IMMやOPIMのような健全なアルゴリズムは、ほとんどのシナリオでDeep-RL法よりも優れている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:03:26 GMT)
A Human-Inspired Reading Agent with Gist Memory of Very Long Contexts [35.7] 本実験では,有効文脈長を最大20倍に向上させるエージェントシステムであるReadAgentを提案する。
人間が長い文書を対話的に読む方法に触発され、簡単なプロンプトシステムとしてReadAgentを実装した。
本稿では,検索手法を用いてベースラインに対するReadAgentの評価を行い,元の長コンテキストを用いて,gistメモリを用いて評価する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:33:51 GMT)
Under-confidence Backdoors Are Resilient and Stealthy Backdoors [35.6] バックドア攻撃は、被害者モデルが事前に設計されたバックドアで注入された任意の入力に対して設計された出力を生成することを目的としている。
高攻撃成功率を達成するため、既存の攻撃手法のほとんどは、汚染されたサンプルのラベルをターゲットクラスに変更している。
この慣行は、しばしば被害者モデルをバックドアに過度に適合させ、攻撃は出力制御に非常に効果的であるが、人間の検査や自動防御アルゴリズムによって容易に識別できる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:45:24 GMT)
Pre-Training and Prompting for Few-Shot Node Classification on Text-Attributed Graphs [35.4] テキスト分散グラフ(英: Text-attributed graph、TAG)は、生のテキストに関連付けられた各ノードを持つ、現実世界の重要なグラフ構造化データの一種である。
TAGでは、従来の数発のノード分類手法が、事前処理されたノード機能で直接トレーニングを行う。
P2TAGは、グラフ事前学習とプロンプトを備えたTAG上の少数ショットノード分類のためのフレームワークである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:24:21 GMT)
Predicting the Best of N Visual Trackers [34.9] すべてのトラッキング属性とデータセットの中で最高のパフォーマーは、シングルトラッカーが依然として存在しない。
このギャップを埋めるために、BofNメタトラッカーと呼ばれる"Nトラッカーのベスト"を予測する。
また、フレームレベルのBofNメタトラッカーを導入し、定期的に時間間隔で最高のパフォーマーを予測する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:17:09 GMT)
The Rlign Algorithm for Enhanced Electrocardiogram Analysis through R-Peak Alignment for Explainable Classification and Clustering [34.9] 我々は,サポートベクタマシンや主成分分析などの浅層学習技術をECG信号処理に再導入することを目指している。
そこで我々は,ECG信号を完全に構造化されたフォーマットに効果的に再構成する変換を開発し,評価した。
我々のアプローチは、特に限られたトレーニングデータを扱う場合、CNNよりも浅い機械学習手法に顕著な優位性を示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:34:47 GMT)
Is user feedback always informative? Retrieval Latent Defending for Semi-Supervised Domain Adaptation without Source Data [34.6] 本稿では,現実のアプリケーションで容易に利用できるユーザフィードバックを用いて,ソースモデルをターゲット環境に適用することを目的とする。
負バイアスフィードバック(NBF)と呼ばれる新しい概念を用いて、この現象を解析する。
スケーラブルな適応アプローチであるRetrieval Latent Defendingを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:15:41 GMT)
SemiSFL: Split Federated Learning on Unlabeled and Non-IID Data [34.5] フェデレートラーニング(FL)は、複数のクライアントがネットワークエッジでプライベートデータ上で機械学習モデルを協調的にトレーニングできるようにするためのものだ。
クラスタリング正規化を取り入れて,ラベルなしおよび非IIDクライアントデータでSFLを実行する,Semi-supervised SFLシステムを提案する。
本システムは,訓練時間の3.8倍の高速化を実現し,目標精度を達成しつつ通信コストを約70.3%削減し,非IIDシナリオで最大5.8%の精度向上を実現する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:18:38 GMT)
Poisoning with A Pill: Circumventing Detection in Federated Learning [33.9] 本稿では,FLにおける検出に対する既存のFL中毒攻撃の有効性とステルス性を高めるために,汎用的かつ攻撃に依存しない拡張手法を提案する。
具体的には、FLトレーニング中に、戦略的にピルを構築、生成、注入する3段階の方法論を用いており、それに従ってピル構築、ピル中毒およびピル注入と命名されている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:34:47 GMT)
The Ontoverse: Democratising Access to Knowledge Graph-based Data Through a Cartographic Interface [33.9] 我々は地理的視覚化と階層的に構造化されたドメイン知識に依存したデータナビゲーションにユニークなアプローチを開発した。
提案手法は自然言語処理技術を用いて,基礎となるデータから名前付きエンティティを抽出し,関連する意味領域参照やナビゲーション構造に対して正規化する。
これにより、エンドユーザは、ニーズに関連するエンティティを識別し、広範なグラフ分析にアクセスできるようになる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:29:25 GMT)
Vision-Based Power Line Cables and Pylons Detection for Low Flying Aircrafts [33.6] 電力線ケーブルとパイロンを共同で検出する深層学習手法を開発した。
我々は,現代的畳み込み型アーキテクチャとトランスファーラーニング,カービリナー構造記述に適応した損失関数を組み合わせた。
オンボードシステムに統合し、飛行中に動作させ、実験により、従来の遠隔ケーブル検出方法よりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:20:59 GMT)
All rivers run into the sea: Unified Modality Brain-like Emotional Central Mechanism [32.7] UMBEnetは脳に似た統合型モーダル感情処理ネットワークである。
UMBEnetの基本設計は、プロンプトプールとスパースフィーチャーフュージョン(SFF)モジュールで固有のプロンプトを融合するデュアルストリーム(DS)構造である。
Dynamic Facial Expression Recognition (DFER)フィールドにおける最大のベンチマークデータセットの実験では、UMBEnetは現在の最先端メソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:26:31 GMT)
Diffusion Model is a Good Pose Estimator from 3D RF-Vision [32.7] 無線周波数ビジョン(RF-vision)からのヒューマンポーズ推定(HPE)は、RF信号を用いて人間のセンシングを行う。
mmWaveレーダーは有望なRFビジョンセンサーとして登場し、RF信号を処理してレーダー点雲を提供する。
本研究は,ノイズレーダデータに適した新しい拡散型ポーズ推定器mmDiffを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:27:30 GMT)
In Search of Quantum Advantage: Estimating the Number of Shots in Quantum Kernel Methods [30.6] 本稿では,カーネル値の所望の精度を推定する手法を開発し,回路実行回数に変換する。
我々は、量子カーネル法は、機械学習のパフォーマンスの観点からだけでなく、リソース消費の文脈からも考慮すべきである、と強調する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:29:35 GMT)
The Shadow of Fraud: The Emerging Danger of AI-powered Social Engineering and its Possible Cure [30.4] 社会工学(SE)攻撃は個人と組織双方にとって重大な脅威である。
人工知能(AI)の進歩は、よりパーソナライズされ説得力のある攻撃を可能にすることによって、これらの脅威を強化する可能性がある。
本研究は、SE攻撃機構を分類し、その進化を分析し、これらの脅威を測定する方法を探る。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:37:31 GMT)
Mobius: A High Efficient Spatial-Temporal Parallel Training Paradigm for Text-to-Video Generation Task [29.7] 多くの研究者がテキスト・トゥ・ビデオ(T2V)生成タスクに力を注いでいる。
本稿では,T2Vタスクのための高効率な時空間並列訓練パラダイム Mobius を提案する。
Mobiusは24%のGPUメモリと12%のトレーニング時間を節約し、T2Vの微調整タスクを大幅に改善する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:51:07 GMT)
Face-voice Association in Multilingual Environments (FAME) Challenge 2024 Evaluation Plan [29.2] フェース・ボイス・アソシエーション・イン・マルチ言語環境(FAME)チャレンジ2024は,多言語シナリオのユニークな条件下でのフェース・ボイス・アソシエーションの探求に焦点を当てている。
本報告では、FAME Challengeの課題、データセット、ベースライン、タスクの詳細について説明する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:43:12 GMT)
Reconstructing Training Data From Real World Models Trained with Transfer Learning [29.0] 本稿では,高解像度画像上で訓練されたモデルに対して,現実的な設定でデータ再構成を可能にする新しい手法を提案する。
本手法は実世界のシナリオに対してarXiv:2206.07758の再構成方式を適用する。
そこで本研究では,数千の候補からの良好な復元を識別するためのクラスタリングに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:59:10 GMT)
Unlocking the Potential: Benchmarking Large Language Models in Water Engineering and Research [29.0] この研究は、様々な水工学および研究課題にまたがる大規模言語モデルの貢献を初めて評価した。
我々は,水工学と研究に関連する973の課題を,「汚水処理」「環境復元」「水処理と分布の低下」「衛生」「嫌気性消化」に分類した。
これらの課題に対して、7つのLCM(GPT-4, GPT-3.5, Gemini, GLM-4, ERNIE, QWEN, Llama3)の性能評価を行った。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:32:22 GMT)
On the Federated Learning Framework for Cooperative Perception [28.7] フェデレーション学習は、コネクテッドおよび自律走行車間の認識、意思決定、計画において、データのプライバシ保護と協調的な拡張を可能にすることで、有望なソリューションを提供する。
本研究では,FedDWAアルゴリズム(Federated dynamic weighted aggregate, FedDWA)と呼ばれる,CPのための特殊な統合学習フレームワークを提案する。
このフレームワークは、動的クライアント重み付けをモデル収束の直接化に利用し、KLD(Kullback-Leibler divergence)を利用して非独立的かつ同一に分散された(Non-IID)データとアンバランスなデータの有害な影響を対処する新しい損失関数を統合する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:11:20 GMT)
The Dark Side of NFTs: A Large-Scale Empirical Study of Wash Trading [28.2] 我々は,2,701,883 NFTから8,717,031の転送イベントと3,830,141のセールイベントを分析した。
NFTの3種類の洗剤取引を識別し,識別アルゴリズムを提案する。
また,マーケットプレース設計,収益性,NFTプロジェクト設計,支払トークン,ユーザ行動,NTTエコシステムといった6つの側面からの洞察も提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:08:04 GMT)
Decentralized Entropic Optimal Transport for Distributed Distribution Comparison [28.1] 本稿では,通信効率とプライバシ保護を両立させる分散型エントロピー最適輸送(DEOT)手法を提案する。
特に,DOT距離を2倍に最適化するミニバッチランダム化ブロック座標降下法を設計する。
提案手法は,エントロピックなGromov-Wasserstein距離にも適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:06:22 GMT)
A Survey on Federated Analytics: Taxonomy, Enabling Techniques, Applications and Open Issues [28.1] フェデレーション分析(FA)は、生データを集中することなく、多様なデータ所有者間で協調的なデータ分析をサポートする新興技術である。
FAの産業・アカデミックへの応用は広く行われているが、FAにおける既存の研究成果の総合的な調査は特に欠落している。
この調査は、新たなFA技術に関する総合的な理解を提供し、プライバシ保護による分散データ処理の継続的な進化を促進することを目的としている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:52:46 GMT)
A Simple and Optimal Policy Design with Safety against Heavy-Tailed Risk for Stochastic Bandits [27.1] マルチアームバンディット問題について検討し,期待された後悔に対する最悪のケース最適性と,後悔の分布に対する軽微なリスクの両方を享受する新しいポリシーを設計する。
経営的な観点から、我々の新しい政策設計は、より良い尾の分布をもたらし、祝福された政策よりも好まれることがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:45:09 GMT)
3D-GOI: 3D GAN Omni-Inversion for Multifaceted and Multi-object Editing [26.7] 複数オブジェクト上のアフィン情報の多面的編集を可能にする3D編集フレームワークである3D-GOIを提案する。
3D-GOIは、有名な3D GANであるGIRAFFEによって制御される属性コードの多さを反転させることで、複雑な編集機能を実現する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:19:23 GMT)
Perceptions of Linguistic Uncertainty by Language Models and Humans [26.7] 「おそらく」や「非常にありそうにない」といった不確かさの表現は、人間の言語に広まる。
言語モデルが不確実性の言語表現を数値応答にどうマッピングするかを検討する。
10モデル中8モデルで不確実性表現を確率的応答に人間的な方法でマッピングできることが判明した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:26:12 GMT)
Explaining Decisions in ML Models: a Parameterized Complexity Analysis [26.4] 本稿では,機械学習(ML)モデルにおける説明問題のパラメータ化複雑性に関する理論的検討を行う。
一般的なブラックボックスの知覚とは対照的に、我々は透明な内部機構を持つモデルに焦点を当てている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:37:48 GMT)
MedIAnomaly: A comparative study of anomaly detection in medical images [26.3] 異常検出(AD)は、期待される正常なパターンから逸脱する異常なサンプルを検出することを目的としている。
医療用AD法は多岐にわたるが, 公平かつ包括的評価の欠如が指摘されている。
本稿では,比較を統一したベンチマークを構築した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:24:52 GMT)
WebRPG: Automatic Web Rendering Parameters Generation for Visual Presentation [25.0] ウェブレンダリングパラメータ生成(WebRPG, Web Rendering Parameters Generation)はHTMLコードに基づくWebページの視覚的表示の自動生成を目的とした新しいタスクである。
VAEを利用して多数の要素やレンダリングパラメータを管理するベースラインモデルと、HTMLから本質的なセマンティックおよび階層的な情報をキャプチャするためのカスタムHTML埋め込みを提示する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:35:43 GMT)
Empowering Agile-Based Generative Software Development through Human-AI Teamwork [24.7] 我々は、人間-AIチームワークによるアジャイルベースの生成ソフトウェア開発であるAgileGenを提案する。
メモリプールメカニズムは、ユーザの意思決定シナリオを収集し、それらを新しいユーザに推奨するために使用される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:54:44 GMT)
Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models [24.6] 下流視覚質問応答(VQA)における表現学習に関する実証的研究を行った。
我々はOCモデルと代替アプローチの利点とトレードオフを徹底的に検討する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:26:08 GMT)
Local Occupancy-Enhanced Object Grasping with Multiple Triplanar Projection [24.0] 本稿では,一般的な物体をロボットでつかむという課題に対処する。
提案したモデルはまず、シーン内で最も可能性の高いいくつかの把握ポイントを提案する。
各グリップポイントの周囲に、モジュールはその近傍にある任意のボクセルが空か、ある物体に占有されているかを推測するように設計されている。
モデルはさらに、局所占有力向上した物体形状情報を利用して、6-DoFグリップポーズを推定する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:22:28 GMT)
UF-HOBI at "Discharge Me!": A Hybrid Solution for Discharge Summary Generation Through Prompt-based Tuning of GatorTronGPT Models [22.0] 本稿では,BioNLP 2024 Shared Task における "Discharge Me!" Challenge への参加の一環として,放電サマリーセクションを生成するハイブリッドソリューションを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:02:45 GMT)
Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning [21.9] 視覚強化学習に適した一般化可能なフレームワークであるtextbfManiwhereを提案する。
実験の結果,Maniwhereは既存の最先端手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:29:02 GMT)
FDiff-Fusion:Denoising diffusion fusion network based on fuzzy learning for 3D medical image segmentation [21.9] 3次元医用画像分割のためのファジィ学習に基づく拡散融合ネットワーク(FDiff-Fusion)を提案する。
従来のU-Netネットワークにデノナイズ拡散モデルを統合することにより、入力された医用画像からリッチなセマンティック情報を効果的に抽出することができる。
その結果、FDiff-Fusionは2つのデータセット上でDiceスコアとHD95距離を大幅に改善することがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:27:01 GMT)
Semantic Diversity-aware Prototype-based Learning for Unbiased Scene Graph Generation [21.8] シーングラフ生成(SGG)データセットでは、各対象物対に1つの述語をアノテートする。
既存のSGGモデルは、各ペアについてのみ述語を予測できるように訓練されている。
この結果、SGGモデルは述語に存在するかもしれない意味的多様性を見落としてしまう。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:53:46 GMT)
RepCodec: A Speech Representation Codec for Speech Tokenization [21.6] RepCodecは意味的音声トークン化のための新しい表現である。
RepCodecは、音声認識と生成の両方において広く使われているk-meansクラスタリング手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:53:44 GMT)
$\forall$uto$\exists$val: Autonomous Assessment of LLMs in Formal Synthesis and Interpretation Tasks [21.1] 本稿では,形式構文を自然言語に翻訳する際のLLM評価のスケールアップ手法を提案する。
我々は、文脈自由文法(CFG)を用いて、その場で配布外のデータセットを生成する。
我々はまた、このパラダイムの実現可能性と拡張性を示すために、複数のSOTAクローズドおよびオープンソースLCMの評価を行う。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 00:41:38 GMT)
Learning at a Glance: Towards Interpretable Data-limited Continual Semantic Segmentation via Semantic-Invariance Modelling [21.1] インクリメンタルラーニング(IL)に基づく連続意味セグメンテーション(CSS)は、人間のようなセグメンテーションモデルを開発する上で大きな取り組みである。
現在のCSSアプローチでは、古い知識の保存と新しい知識の学習のトレードオフに直面する。
我々は、CSSの効率的で堅牢で人間らしい、解釈可能なアプローチであるLearning at a Glance (LAG)を提示する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:17:52 GMT)
Fundamental Limits of Prompt Compression: A Rate-Distortion Framework for Black-Box Language Models [21.0] 大規模言語モデル(LLM)の即時圧縮問題について定式化する。
ブラックボックスモデルのハードプロンプトを生成するトークンレベルのプロンプト圧縮手法を統合するためのフレームワークを提案する。
本稿では,現在の高速圧縮法の性能と最適戦略との間に大きなギャップがあることを述べる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:40:13 GMT)
TokenPacker: Efficient Visual Projector for Multimodal LLM [20.9] ビジュアルプロジェクタは、ビジュアルエンコーダとLarge Language Model(LLM)の間に必須のブリッジとして機能する。
本稿では,密集した特徴を注入して凝縮した視覚トークンを生成するために,粗く細かなスキームを取り入れた新しいビジュアルプロジェクタを提案する。
我々のアプローチでは、ビジュアルトークンを75%89%圧縮し、多様なベンチマークで同等またはさらに優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:55:46 GMT)
Iterative Ensemble Training with Anti-Gradient Control for Mitigating Memorization in Diffusion Models [20.6] 拡散モデルは、新規で高品質なサンプルを生成できることで知られている。
最近のメモリ緩和手法は、クロスモーダル生成タスクにおけるテキストモダリティ問題にのみ焦点をあてるか、あるいはデータ拡張戦略を利用するかのどちらかである。
本稿では,視覚的モダリティの観点からの拡散モデルのための新しいトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:19:30 GMT)
The Diversity Bonus: Learning from Dissimilar Distributed Clients in Personalized Federated Learning [20.3] そこで我々は,各クライアントが多種多様なデータ分布を持つクライアントから学習できるDiversiFedを提案する。
DiversiFedは異種クライアントの恩恵を受けることができ、したがって最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:24:45 GMT)
LLMExplainer: Large Language Model based Bayesian Inference for Graph Explanation Generation [20.2] 最近の研究は、複数の教師なし学習モデルを通してグラフニューラルネットワーク(GNN)の解釈可能性を提供することを目指している。
データセットが不足しているため、現在の手法ではバイアスの学習が困難になる。
学習バイアス問題を回避するため,GNN説明ネットワークにLarge Language Model (LLM) を知識として組み込む。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:36:38 GMT)
Empowering Embodied Visual Tracking with Visual Foundation Models and Offline RL [19.8] 身体的視覚追跡は、エンボディードエージェントにとって不可欠で挑戦的なスキルである。
既存の手法では、非効率なトレーニングや一般化の欠如に悩まされている。
視覚基盤モデルとオフライン強化学習を組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:13:32 GMT)
EVD4UAV: An Altitude-Sensitive Benchmark to Evade Vehicle Detection in UAV [19.1] 無人航空機(UAV)の撮影画像における車両検出は、航空写真やリモートセンシングに広く応用されている。
近年の研究では、物体に対向パッチを加えることで、よく訓練されたディープニューラルネットワークベースの物体検出器を騙すことが示されている。
UAVにおける車両検出を回避するための高度感度ベンチマークとしてEVD4UAVという新しいデータセットを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:02:35 GMT)
Adversarial Style Augmentation via Large Language Model for Robust Fake News Detection [19.0] 本研究は, 偽ニュース検知器の訓練を行うために, 対向型拡張AdStyleを提案する。
我々のモデルの主要なメカニズムは、LLMを慎重に使用して、多種多様なスタイル変換攻撃プロンプトを自動生成することである。
実験により、我々の拡張戦略は、フェイクニュースベンチマークデータセットでテストした場合の堅牢性と検出性能を改善することが示された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:56:44 GMT)
Exploring and Addressing Reward Confusion in Offline Preference Learning [18.9] 報酬モデルのトレーニングデータにおけるすっきりとした相関は、人間からの強化学習が望ましい目標を特定し、望ましくない行動を引き起こすのを防ぐことができる。
本稿では、特にオフラインデータに急激な相関が存在する場合、オフラインRLHFは、混乱に報いる可能性があることを示す。
本研究では,グローバルな選好連鎖を構築しながら,嗜好の推移性を活用することで,報酬の混乱を著しく低減する手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:03:36 GMT)
LDConv: Linear deformable convolution for improving convolutional neural networks [18.8] Linear Deformable Convolution (LDConv) は、ネットワーク性能を改善するために畳み込み操作を置き換えることができる、プラグアンドプレイの畳み込み操作である。
LDConvは、標準畳み込みと変形可能なConvのパラメータ数の成長傾向を線形成長に補正する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:46:46 GMT)
Uncertainty-aware transfer across tasks using hybrid model-based successor feature reinforcement learning [18.8] 各アクションの値の不確実性は、カルマンフィルタ(KF)ベースの多重モデル適応推定によって近似される。
我々のアルゴリズムは、異なる遷移力学の知識を一般化し、スクラッチから始めるよりもはるかに少ないサンプルで下流タスクを学習し、既存のアプローチより優れています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:47:09 GMT)
HaloQuest: A Visual Hallucination Dataset for Advancing Multimodal Reasoning [18.8] この研究は、マルチモーダル幻覚の様々な側面を捉える新しい視覚的質問応答データセットであるHaloQuestを紹介した。
現在のモデルはHaloQuestと競合し、すべてのオープンソースVLMは36%の精度で達成されている。
HaloQuestの微調整は、標準的な推論タスクのパフォーマンスを維持しながら幻覚率を大幅に低下させる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:49:51 GMT)
WTS: A Pedestrian-Centric Traffic Video Dataset for Fine-grained Spatial-Temporal Understanding [18.5] 我々はWTSデータセットを導入し、車両と歩行者の両方の詳細な振る舞いを、数百の交通シナリオにおける1.2万以上のビデオイベントにわたって強調した。
WTSは、車両とインフラの協調環境における車両エゴと固定オーバーヘッドカメラからの多様な視点を統合している。
また、歩行者関連トラヒックビデオ5Kのアノテーションをプロビデントしています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:29:22 GMT)
CLIP with Generative Latent Replay: a Strong Baseline for Incremental Learning [17.6] VLMを適応させながら忘れを緩和する新しい手法であるインクリメンタル・プロンプトラーニングのための連続的生成訓練を提案する。
ゼロショット能力を改善しつつ、新しいタスクに適応する上でのフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:51:28 GMT)
How to Shrink Confidence Sets for Many Equivalent Discrete Distributions? [17.5] 機械学習問題における置換等価性を利用する。
信頼集合のサイズは$O/sqrtn_k)$と$O/max_kin K n_k)$で縮小することを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:19:19 GMT)
Unsupervised Robust Cross-Lingual Entity Alignment via Joint Modeling of Entity and Relation Texts [17.5] 言語間エンティティアライメント(EA)は、異なる言語間での複数の知識グラフ(KG)の統合を可能にする。
既存の手法は、主に教師付きであり、ラベル付きエンティティペアを得る際の課題に直面している。
ERAlignは教師なしで堅牢な言語間EAフレームワークである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:25:48 GMT)
Dynamic Identity-Guided Attention Network for Visible-Infrared Person Re-identification [17.3] Visible-infrared person re-identification (VI-ReID) は、可視光と赤外線の同一性を持つ人物をマッチングすることを目的としている。
既存の方法は一般的に、画像や特徴レベルでのクロスモーダルな違いを橋渡ししようとする。
我々は、動的ID誘導型注意ネットワーク(DIAN)を導入し、アイデンティティ誘導型およびモダリティ一貫性のある埋め込みをマイニングする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:23:26 GMT)
An updated review on cross-correlation of m-sequences [17.2] 有限フィールド上の最大長列(m系列)は、原始特性を持つ線形フィードバックレジスタによって生成される。
過去50年間に、同時代のm系列間の相互相関が集中的に研究されてきた。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 22:14:53 GMT)
6DGS: 6D Pose Estimation from a Single Image and a 3D Gaussian Splatting Model [17.2] シーンを表す3Dガウス・スティング(3DGS)モデルから,ターゲットRGB画像のカメラポーズを推定する6DGSを提案する。
6DGSは、分析バイシンセシス法で典型的な反復的なプロセスを避ける。
実際のシーンでは、平均回転精度を12%改善し、翻訳精度を22%向上させることができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:55:46 GMT)
Walking in Others' Shoes: How Perspective-Taking Guides Large Language Models in Reducing Toxicity and Bias [16.9] 社会心理学の原則に触発されて, LLMに多様な人間の視点を取り入れ, 反応を自己制御させる, textscPeT という新しい戦略を提案する。
2つの商用LCMと3つのオープンソースLCMに対して厳密な評価およびアブレーション研究を行い、より有害な応答を生み出す上でのtextscPeT の優位性を明らかにした。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:25:01 GMT)
Score Normalization for Demographic Fairness in Face Recognition [16.4] 有名なサンプル中心スコア正規化技術であるZ-normとT-normは、高セキュリティ動作点の公平性を向上しない。
標準Z/Tノルムを拡張し、正規化における人口統計情報を統合する。
本手法は,5つの最先端の顔認識ネットワークの全体的な公正性を改善する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:59:10 GMT)
SAM2CLIP2SAM: Vision Language Model for Segmentation of 3D CT Scans for Covid-19 Detection [16.2] 本稿では,任意のモデルや手法に統合可能な画像の効果的セグメンテーションのための新しいアプローチを提案する。
私たちのアプローチには、CTスキャンをセグメント化する視覚言語モデルの組み合わせが含まれています。
提案手法をCTスキャンのセグメンテーションに用いた場合の性能向上を示す2つのCovid-19アノテートデータベースに対して実験を行った。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:31:18 GMT)
Rapid Switching and Multi-Adapter Fusion via Sparse High Rank Adapters [16.2] 本稿では,標準モデルの重量の1-2%を直接微調整し,その他をそのまま残すSparse High Rank Adapters (SHiRA)を提案する。
この高分散性は、推論オーバーヘッドを発生させることなく、融合モードで直接切り替えることを可能にし、マルチアダプタ融合時の概念損失を著しく低減する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 22:46:36 GMT)
Secure Inference for Vertically Partitioned Data Using Multiparty Homomorphic Encryption [15.9] 本稿では,単一サーバノードと複数のクライアントノードを含む分散環境でのセキュアな推論プロトコルを提案する。
深層学習モデルがサーバノードにある間、観測されたデータベクトルは複数のクライアントノードに分割されていると仮定する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:17:43 GMT)
Towards Open-World Object-based Anomaly Detection via Self-Supervised Outlier Synthesis [15.7] この研究は、オープンワールドオブジェクト検出器とOoD検出器を仮想外周で活用することでギャップを埋めることを目的としている。
提案手法では,オブジェクト検出アーキテクチャ全体を拡張して,クラスラベルに依存することなく,異常に認識された特徴表現を学習する。
提案手法は,オブジェクトレベルの異常検出における最先端性能を確立し,自然画像の平均リコールスコアを5.4%以上向上させる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:16:38 GMT)
LLMmap: Fingerprinting For Large Language Models [15.7] LLM 統合アプリケーションを対象とした第1世代の指紋認証攻撃 LLMmap を紹介する。
わずか8つの相互作用で、LLMmapは95%以上の精度でLSMを正確に識別できる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:59:45 GMT)
Sparse Prior Is Not All You Need: When Differential Directionality Meets Saliency Coherence for Infrared Small Target Detection [15.6] 本研究では,Sparse Differential Directionality prior (SDD)フレームワークを提案する。
我々は、ターゲットの異なる方向特性を活用して、それらを背景と区別する。
さらに、サリエンシ・コヒーレンス・ストラテジーにより、目標検出性をさらに強化する。
近似交互最小化法(PAM)アルゴリズムは,提案したモデルを効率的に解く。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:32:43 GMT)
Key-Point-Driven Mathematical Reasoning Distillation of Large Language Model [15.5] KPDD(Key-Point-Driven Mathematical Reasoning Distillation)を提案する。
KPDDは、問題解決プロセスを3段階に分割することで、SLMの推論性能を向上させる。
実験により、KPDD-CoTは推論能力を大幅に向上し、KPDD-PoTは数学的推論タスクにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:26:23 GMT)
MoRSE: Bridging the Gap in Cybersecurity Expertise with Retrieval Augmented Generation [15.0] MoRSEは、サイバーセキュリティに関する包括的で完全な知識を提供することを目指している。
MoRSEは従来のRAGと異なり、並列レトリバーを使用してセマンティック関連情報を検索する。
MoRSEは知識ベースへのリアルタイムアップデートの恩恵を受けており、トレーニングをリトレーニングすることなく、継続的な知識の充実を可能にする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:53:27 GMT)
Attention Is All You Need But You Don't Need All Of It For Inference of Large Language Models [15.0] ドライパー注意層を落とせば、性能はわずかに低下するが、最高のスピードアップにつながる。
また、後者の層以外の層をスキップすることは、注意層をスキップする以外は、より多くの層をスキップする性能を低下させる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:09:05 GMT)
Robustness of Speech Separation Models for Similar-pitch Speakers [14.9] 単一チャンネル音声分離は,マルチスピーカ環境における音声認識システムを強化する上で重要な課題である。
本稿では,話者間のピッチ差が最小限である場合における最先端ニューラルネットワークモデルのロバスト性について検討する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:55:08 GMT)
A Solution toward Transparent and Practical AI Regulation: Privacy Nutrition Labels for Open-source Generative AI-based Applications [14.0] 本稿では、規制駆動型GAIプライバシーラベルを提案し、これらのラベルを自動生成する新しいフレームワークであるRepo2Labelを紹介する。
ユーザ調査は,提案したGAIプライバシーラベルフォーマットの共通支持を示す。
Repo2Labelは、ベンチマークデータセットに基づいて精度0.81、リコール0.88、F1スコア0.84を達成している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:24:13 GMT)
Probing Fine-Grained Action Understanding and Cross-View Generalization of Foundation Models [14.0] ファンデーションモデル(FM)は、広いデータセットでトレーニングされた大規模なニューラルネットワークである。
ビデオにおける人間の活動認識は、異なるアーキテクチャ間の競争によって駆動されるFMによって進歩している。
本稿では,視線変化が人体活動認識の微粒化における異なるFMに与える影響を実験的に評価する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:59:57 GMT)
A Multimodal Knowledge-enhanced Whole-slide Pathology Foundation Model [14.0] スライド画像全体のH&E診断と関連する病理報告とRNA-Seqデータからなる最大マルチモーダルデータセットをキュレートした。
そこで,本論文では,病的FMにマルチモーダルな知識を注入する新パラダイムを提案する。
提案したパラダイムはCPathの事前トレーニングのワークフローに革命をもたらす。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:09:27 GMT)
MODRL-TA:A Multi-Objective Deep Reinforcement Learning Framework for Traffic Allocation in E-Commerce Search [13.9] 本稿では、多目的Q-ラーニング(MOQ)と、クロスエントロピー法(CEM)に基づく決定融合アルゴリズム(DFM)と、プログレッシブデータ拡張システム(PDA)からなる多目的深層強化学習フレームワークを提案する。
実世界のオンラインeコマースシステムの実験は、MODRL-TAの大幅な改善を実証している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:40:27 GMT)
Large Language Models Powered Context-aware Motion Prediction [13.9] 我々はLarge Language Models (LLMs) を用いて、動き予測タスクのグローバルトラフィックコンテキスト理解を強化する。
LLMに関連するコストを考慮すると、コスト効率のよいデプロイメント戦略を提案する。
我々の研究は、LLMの交通シーンの理解と自動運転の動作予測性能を高めるための貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:11:29 GMT)
Exploring connections of spectral analysis and transfer learning in medical imaging [13.8] 自然画像と医用画像で事前学習したモデル間での学習優先順位の顕著な相違について検討した。
モデルの学習優先度がアーティファクトのパワースペクトル密度と一致した場合、そのアーティファクトに過度に適合する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:04:25 GMT)
Enhancing Cognitive Workload Classification Using Integrated LSTM Layers and CNNs for fNIRS Data Analysis [13.7] 本稿では、ディープラーニングモデルにおける畳み込みニューラルネットワーク(CNN)の有効性に対する長期記憶層の影響について検討する。
LSTMレイヤを統合することで、モデルがfNIRSデータ内の時間的依存関係をキャプチャし、認知状態をより包括的に理解することが可能になる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:28:34 GMT)
Two Stacks Are Better Than One: A Comparison of Language Modeling and Translation as Multilingual Pretraining Objectives [13.6] プレトレーニング言語モデル(PLM)は優れたパフォーマンスを示し、NLPコミュニティの注目を集めている。
本稿では,制御された方法論環境における多言語事前学習目標の比較を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:16:30 GMT)
Enhancing Transferability of Targeted Adversarial Examples: A Self-Universal Perspective [13.6] ブラックボックスディープニューラルネットワーク(DNN)に対するトランスファーベースの敵攻撃は、未ターゲットの攻撃よりもはるかに難しいことが証明されている。
生成方法である現在のSOTAの印象的な転送性は、大量の追加データを必要とするコストと、ターゲットラベルごとに時間のかかるトレーニングが伴う。
私たちは、この目標を追求する際の入力変換の大きな可能性を明らかにする、自己普遍的な視点を提供します。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:51:28 GMT)
Imposter.AI: Adversarial Attacks with Hidden Intentions towards Aligned Large Language Models [13.2] 本研究では,大規模言語モデルから有害情報を抽出するために,人間の会話戦略を活かした攻撃機構を明らかにする。
明示的な悪意のある応答をターゲットとする従来の手法とは異なり、我々のアプローチは応答で提供される情報の性質を深く掘り下げている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:04:29 GMT)
Attention Beats Linear for Fast Implicit Neural Representation Generation [13.2] 本稿では,局所的注意層(LAL)と大域的表現ベクトルからなる注意型局所INR(ANR)を提案する。
インスタンス固有の表現とインスタンスに依存しないANRパラメータにより、ターゲット信号は連続関数として十分に再構成される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:52:18 GMT)
360VFI: A Dataset and Benchmark for Omnidirectional Video Frame Interpolation [13.1] 我々は,Omnidirectional Video Frame Interpolationのためのベンチマークデータセットである360VFIを紹介する。
本稿では,全方向ビデオの歪みをネットワークに導入し,歪みを変調する実用的な実装を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:50:55 GMT)
Targeted Latent Adversarial Training Improves Robustness to Persistent Harmful Behaviors in LLMs [13.0] 大きな言語モデル(LLM)は、しばしば望ましくない方法で振る舞うように、明示的に微調整されないようにすることができる。
レッドチーム、モデル編集、解釈可能性に関する最近の研究は、この課題が(逆境的な)微調整が望ましくない能力を排除するのではなく、いかに抑制するかに起因していることを示唆している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:19:14 GMT)
Enhancement of 3D Gaussian Splatting using Raw Mesh for Photorealistic Recreation of Architectures [13.0] 本研究では,3次元ガウスモデルを用いて建物の基本形状を抽出する手法を提案する。
この調査は,建築設計分野における3次元再構築技術の有効性を向上する新たな可能性を開くものである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:29:38 GMT)
A Semi-Supervised Approach for Power System Event Identification [12.9] 本稿では,既存の事象識別手法を強化するために,未ラベルの事象識別サンプルを組み込むことの有効性を評価するための,新しい半教師付きフレームワークを提案する。
提案手法は,合成事象PMUデータのモーダル解析から抽出した物理的解釈可能な特徴を用いた事象の特徴付けである。
我々は,データ生成,特徴抽出,限定ラベル付きイベント識別という3つの側面からなる包括的イベント識別パッケージを開発し,公開している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:01:37 GMT)
Do Large Language Models Have Compositional Ability? An Investigation into Limitations and Scalability [12.3] 大規模言語モデル(LLM)は多くのAI問題に対する強力なツールとして登場した。
また、ICL(In-context Learning)機能も備えている。
どのように複合タスクにアプローチするかは、オープンな質問であり、ほとんど理解されていない。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:22:34 GMT)
Counter Turing Test ($CT^2$): Investigating AI-Generated Text Detection for Hindi -- Ranking LLMs based on Hindi AI Detectability Index ($ADI_{hi}$) [11.7] AI生成テキストは、すでに研究で注目を集めているトピックとして現れている。
ヒンディー語におけるAI-Generated Text Detection (AGTD) について報告する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:00:23 GMT)
AICircuit: A Multi-Level Dataset and Benchmark for AI-Driven Analog Integrated Circuit Design [10.4] 本稿では,アナログ回路設計における機械学習アルゴリズムの開発と評価のためのベンチマークであるAICircuitを提案する。
回路設計における機械学習のパワーを支える大きな障害は、汎用的で多様なデータセットが利用できることである。
設計仕様から所望の回路パラメータへのマッピング学習におけるMLアルゴリズムの可能性を明らかにする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:32:16 GMT)
Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video [10.3] 本稿では,セミデカップリング型時間的知識蒸留を用いて,高品質なクラスアクティベーションマップ(CAM)の予測を行うために,VDST-Net(Video Spatio-Temporal Disment Networks)を導入している。
提案するフレームワークは,一般的な参照データセットや,オブジェクトが平均60%未満の注釈付きフレームに存在する,より困難な手術用ビデオデータセット上で有効であることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:52:32 GMT)
Generalizing Denoising to Non-Equilibrium Structures Improves Equivariant Force Fields [10.3] 本稿では,非平衡構造(DeNS)を補助的タスクとして活用し,トレーニングデータの活用と性能向上を提案する。
DeNSを用いたトレーニングでは,まず3次元座標にノイズを加え,そのノイズを予測することで3次元構造を破損させた。
OC20,OC22,MD17データセット上で,DeNSを用いた同変ネットワークのトレーニングの有効性を検討した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:22:09 GMT)
LabObf: A Label Protection Scheme for Vertical Federated Learning Through Label Obfuscation [10.2] Split Neural Networkは、プライバシー保護の特性から業界で人気がある。
悪意のある参加者は、アップロードされた埋め込みからラベル情報を推測するかもしれない。
本稿では,各整数値ラベルを複数の実数値ソフトラベルにランダムにマッピングする,LabObf'と呼ばれる新しいラベル難読化防衛戦略を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:25:54 GMT)
RoadPainter: Points Are Ideal Navigators for Topology transformER [10.2] トポロジ推論は、道路シーンの正確な理解を提供することを目的としており、自律システムは安全かつ効率的なルートを特定できる。
多視点画像を用いた車線中心線のトポロジの検出と推論のための革新的なアプローチであるRoadPainterを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:23:35 GMT)
Diffusion Model Based Resource Allocation Strategy in Ultra-Reliable Wireless Networked Control Systems [10.2] 拡散モデルは、複雑なデータ分散をキャプチャするその能力を活用することによって、生成AIで大いに利用されている。
本稿では,無線ネットワーク制御システムのための新しい拡散モデルに基づく資源配分手法を提案する。
提案手法は,従来提案されていたDeep Reinforcement Learning (DRL) ベースの手法よりも高い性能を示し,全消費電力に関する最適性能を示した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:44:57 GMT)
Sharp Convergence Rates for Matching Pursuit [10.1] 目的関数を辞書から$f_n$ of $n$要素で近似するために,マッチング追従の限界,あるいは純粋欲求アルゴリズムについて検討する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:54:38 GMT)
Differentiable Product Quantization for Memory Efficient Camera Relocalization [10.0] 我々は,記述子量子化-復号化を行う軽量シーン固有オートエンコーダネットワークをエンドツーエンドの微分可能な方法で訓練する。
その結果,1MBのローカルディスクリプタメモリでは,提案したネットワークとマップ圧縮の相乗的組み合わせが最高の性能を発揮することがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:05:58 GMT)
ALLaM: Large Language Models for Arabic and English [9.9] アラビア語技術(ALT)のエコシステムを支える一連の大規模言語モデルであるアラビア大言語モデル(ALaM: Arabic Large Language Model)を提示する。
我々の自己回帰デコーダのみのアーキテクチャモデルは、語彙拡張と事前訓練による第二言語習得が、原語(英語)で破滅的な忘れをすることなく、新しい言語(アラビア語)へのモデルを操る方法を示している。
人間の嗜好と広範囲なアライメントは,品質アライメントの低い大規模モデルと比較して言語モデルの性能を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:35:17 GMT)
EcoFollower: An Environment-Friendly Car Following Model Considering Fuel Consumption [9.4] 本研究では,自動車追従シナリオにおける燃料消費を最適化するために強化学習(RL)を用いて開発された新しいエコカー追従モデルであるEcoFollowerを紹介する。
このモデルは燃料消費を大幅に削減し、実際の運転シナリオと比較して10.42%削減した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:48:37 GMT)
Explorative Imitation Learning: A Path Signature Approach for Continuous Environments [9.4] CILO(Continuous Imitation Learning from Observation)は、模倣学習を2つの重要な特徴で強化する新しい方法である。
CILO探索は、より多様な状態遷移を可能にし、専門家のトラジェクトリを少なくし、トレーニングのイテレーションを少なくする。
すべての環境において、すべての模倣学習手法の全体的なパフォーマンスが最も優れており、2つの環境において専門家よりも優れています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:32:50 GMT)
Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers [9.1] ディープラーニングモデルの意思決定は、知覚できない摂動に敏感である。
敵攻撃を使用してインスタンス単位でモデルの脆弱性を評価することは、リアルタイムのデプロイメントシナリオには計算集約的であり、適さない。
本稿では,脆弱な試料の効率的な検出のためのマージン整合性の概念を紹介する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:52:19 GMT)
SocialQuotes: Learning Contextual Roles of Social Media Quotes on the Web [9.1] 我々は、ソーシャルメディアの埋め込みを引用に例え、ページコンテキストを構造化された自然言語信号として形式化し、ページコンテキスト内の引用に対する役割の分類を識別する。
われわれはSocialQuotesをリリースした。SocialQuotesは3200万以上のソーシャル引用と8.3kのクラウドソースによる引用アノテーションからなるCommon Crawlから構築された新しいデータセットだ。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:21:01 GMT)
Semantic Communication for Cooperative Multi-Task Processing over Wireless Networks [8.8] 一つの観察から複数の意味論的解釈を可能にする「意味源」の概念を導入する。
通信チャネルを考慮したエンドツーエンド最適化問題を定式化した。
この結果から,協調型マルチタスキングが必ずしも有用であるとは限らないことが示唆された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:30:21 GMT)
Beyond Boundaries: efficient Projected Entangled Pair States methods for periodic quantum systems [8.8] 射影絡み合ったペア状態(PEPS)は、2次元量子多体系を探索するための強力なツールとして認識されている。
我々は,PEPSを開放境界条件 (OBC) に重畳して周期境界条件 (PBC) を扱う戦略を開発した。
このアプローチは、それらの変換不変性とハイゼンベルクモデルに対するベンチマークと$J$-J$モデルを維持しながら、そのようなシステムの計算複雑性を著しく低減する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:37:29 GMT)
Link Polarity Prediction from Sparse and Noisy Labels via Multiscale Social Balance [8.6] 署名付きグラフニューラルネットワーク(SGNN)は,最近,署名付きネットワーク上での学習タスクに有効なツールとして注目されている。
これらのタスクの1つは、ネットワーク構造やその他の利用可能な極性から、この情報が欠落しているリンクの極性を予測することである。
本研究では,リンクの極性予測を改善するために,新しい社会バランスの概念を基盤として,半教師付き学習フレームワークを考案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:02:28 GMT)
Utilizing probabilistic entanglement between sensors in quantum networks [8.6] 量子ネットワークの最も有望な応用の1つは、絡み合い支援センシングである。
この研究は、いつ、どのように絡み合うか、いつ保存するか、いつ蒸留する必要があるかを概説している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:12:30 GMT)
Pavement Fatigue Crack Detection and Severity Classification Based on Convolutional Neural Network [8.2] 疲労き裂、またはアリゲーターき裂( alligator cracking)はアスファルト舗装の一般的な苦難の1つである。
2つの目的を達成できる新しい深層畳み込みニューラルネットワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:56:03 GMT)
An Empirical Study of Retrieval Augmented Generation with Chain-of-Thought [8.2] 本稿では,RAFT(Retrieval Augmented Fine-Tuning)法の有効性について述べる。
RAFT法を複数のデータセットにまたがって評価し,その性能を様々な推論タスクで解析した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:55:14 GMT)
A Survey on Video Prediction: From Deterministic to Generative Approaches [8.1] コンピュータビジョンの基本課題である映像予測は、モデルが既存の映像コンテンツに基づいて将来のフレームのシーケンスを生成することを可能にすることを目的としている。
我々は、この分野で最も広く使われているデータセットとアルゴリズムを含む、歴史と現代の両方を包括的に調査する。
本稿では,ビデオ予測アルゴリズムの性質に着目した新しい分類法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:18:26 GMT)
Cascaded two-stage feature clustering and selection via separability and consistency in fuzzy decision systems [8.0] 特徴選択は、計算複雑性を減らし、モデルパフォーマンスを改善し、オーバーフィッティングのリスクを軽減することができるため、機械学習において重要なテクニックである。
本稿では,ファジィ決定システムのための2段階特徴クラスタリングと選択アルゴリズムを提案する。
提案アルゴリズムの有効性を18の公開データセットと現実世界の統合失調症データセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:44:32 GMT)
Multi-label Image Classification using Adaptive Graph Convolutional Networks: from a Single Domain to Multiple Domains [8.0] 本稿では,マルチラベル画像分類のための適応的なグラフベースアプローチを提案する。
注意に基づくメカニズムと類似性保存戦略を統合することで実現される。
提案するフレームワークは,複数のドメインに拡張し,対戦型トレーニングスキームを用いて拡張する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:16:26 GMT)
Word Closure-Based Metamorphic Testing for Machine Translation [8.0] 本稿では,既存の機械翻訳システム(MTS)MT手法の限界に対処するため,単語クロージャに基づく出力比較手法を提案する。
本手法は, 精度の向上とリコールにより, 既存の不正識別の精度を著しく向上させる。
また、翻訳エラーのF1スコアを35.9%向上させるのに役立つ。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:17:09 GMT)
RADA: Robust and Accurate Feature Learning with Domain Adaptation [7.9] 本稿では、2つの重要な要素を組み込んだ多層機能集約ネットワークを導入し、堅牢で正確な特徴の学習を容易にする。
提案手法は,画像マッチング,カメラポーズ推定,視覚的ローカライゼーションタスクにおいて優れた結果が得られる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:49:58 GMT)
Iterative approach to reconstructing neural disparity fields from light-field data [7.8] 本研究では,シーンの相違を暗黙的に連続的に表現するニューラル・ディパリティ・フィールド(NDF)を提案する。
NDFは3次元シーンにおける相違点のシームレスかつ高精度な特徴付けを可能にする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:06:06 GMT)
LiNR: Model Based Neural Retrieval on GPUs at LinkedIn [7.8] LiNRはLinkedInの大規模GPUベースの検索システムである。
大規模なインデックスに対して,フルスキャンと効率的なフィルタリングを取り入れたシステム拡張について述べる。
我々は、LiNRが業界初のLive-updated model-based search indexの1つであると考えている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:33:25 GMT)
Breaking the Global North Stereotype: A Global South-centric Benchmark Dataset for Auditing and Mitigating Biases in Facial Recognition Systems [7.8] 本研究では,世界8カ国の男女6,579名からなる顔データセットを提案する。
データセットの50%以上がグローバル・サウス諸国の個人であり、人口統計学的に多様である。
敵対的監査と堅牢なモデルトレーニングを支援するため、各画像は4つの敵的変種を持ち、合計4万枚以上の画像がある。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:22:04 GMT)
Query-OPT: Optimizing Inference of Large Language Models via Multi-Query Instructions in Meeting Summarization [7.7] 我々は,同一の入力コンテキストに対するクエリを1つのプロンプトで組み合わせて,繰り返し呼び出しを最小限に抑える方法が,要約の達成に有効かどうかを検討する。
予測フォーマットでの応答生成における100%の信頼性は、通常、特定のクローズドソース LLM に制限される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:53:32 GMT)
A Survey on Continual Semantic Segmentation: Theory, Challenge, Method and Application [7.6] 継続的学習は、漸進的学習または生涯学習としても知られ、ディープラーニングとAIシステムの最前線にある。
本稿では,連続的セマンティックセグメンテーション(CSS)について概説する。
現在のCSSモデルを、データ再生とデータフリーセットを含む2つのメインブランチに分類し、分類する。
また、多様なアプリケーションシナリオと開発傾向を持つ4つのCSS特長も導入しています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:04:04 GMT)
S3E: A Large-scale Multimodal Dataset for Collaborative SLAM [7.5] 拡張型マルチモーダルデータセットであるS3Eを紹介する。
S3Eは4つの異なる共同軌道パラダイムを横断する無人地上車両群によって捕獲され、13の屋外および5つの屋内シーケンスを含んでいる。
これらのシーケンスは、360度LiDAR点雲、高分解能ステレオ画像、高周波慣性測定ユニット(IMU)、UWB(Ultra-wideband)の相対観測を含む、細心の同期と空間的に校正されたデータストリームを特徴としている。
我々のデータセットは、スケール、シーンの多様性、データの複雑度に関する過去の取り組みを上回るだけでなく、協調的なSLAM方法論と個別のSLAM方法論の徹底的な分析とベンチマークも提供しています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 00:31:30 GMT)
SpotDiffusion: A Fast Approach For Seamless Panorama Generation Over Time [7.5] 生成モデルを用いて高解像度画像を生成する新しい手法を提案する。
提案手法は,時間とともに重なりのないデノベーションウィンドウをシフトさせ,一段階のシームが次回修正されるようにする。
提案手法は計算効率の向上や推論時間の高速化など,いくつかの重要な利点を提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:44:35 GMT)
PDiscoFormer: Relaxing Part Discovery Constraints with Vision Transformers [7.5] 自己教師型DINOv2 ViTのような事前学習型トランスフォーマーベース視覚モデルにより制約緩和が可能となることを示す。
特に、任意の大きさの複数の接続されたコンポーネントを利用できる全変動(TV)が、以前の作業よりも大幅に優れていたことが判明した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:41:39 GMT)
General-Purpose Retrieval-Enhanced Medical Prediction Model Using Near-Infinite History [7.4] 検索強化医療予測モデル(REMed)
REMedは、基本的に無制限の医療イベントを評価し、関連するイベントを選択し、予測する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:01:54 GMT)
YOLO-pdd: A Novel Multi-scale PCB Defect Detection Method Using Deep Representations with Sequential Images [7.4] 本稿では,CNNに基づくPCB欠陥検出のための高精度で堅牢でリアルタイムなエンドツーエンド手法を提案する。
本稿では, YOLOv5とマルチスケールモジュールを組み合わせた階層的残差接続手法を提案する。
大規模PCBデータセットの実験では、既存の手法と比較して精度、リコール、F1スコアが大幅に改善された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:08:22 GMT)
Weights Shuffling for Improving DPSGD in Transformer-based Models [7.4] 本研究は,DPSGD(differially-Private Gradient Descent)における革新的なシャッフル機構を導入し,非シャッフルケースと同じプライバシ保証で大規模モデルの実用性を向上する。
順列化は理論上はDPSGDのプライバシー保証を改善するが、シャッフルモデル上での正確なプライバシー損失の追跡は特に困難である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:41:59 GMT)
MAPLE: Multilingual Evaluation of Parameter Efficient Finetuning of Large Language Models [7.3] ファインチューニングは、膨大なリソースと計算を必要とせずに、言語モデルの性能を向上させることができる。
LLama-2-7B モデルと Mistral-7B モデルを2つの合成多言語命令チューニングデータセット上で微調整し、モデル性能に与える影響を判定する。
小型のオープンソースモデルのPEFTは、これらのモデルとより大きなモデルの間のギャップを埋めることがあるが、英語のパフォーマンスは打撃を受ける可能性がある。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:13:54 GMT)
FAIntbench: A Holistic and Precise Benchmark for Bias Evaluation in Text-to-Image Models [7.3] FAIntbenchは、テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスの総合的かつ正確なベンチマークである。
我々はFAIntbenchを7種類の大規模T2Iモデルの評価に適用し,人間による評価を行った。
その結果, FAIntbenchが種々のバイアスの同定に有効であった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:38:07 GMT)
On the Automated Processing of User Feedback [7.2] ユーザフィードバックは、要件エンジニアリング、ユーザインターフェース設計、ソフトウェアエンジニアリングにとって、ますます重要な情報ソースとなります。
フィードバックの可能性を最大限に活用するためには、解決すべき主な課題が2つあります。
ベンダーは大量のフィードバックデータに対処しなければならない。
第二に、ベンダーはさまざまなフィードバックの質に対処しなければならない。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:13:13 GMT)
ShortcutsBench: A Large-Scale Real-world Benchmark for API-based Agents [7.2] 我々は、APIベースのエージェントの包括的な評価のための大規模なベンチマークであるtextscShortcutsBenchを紹介する。
textscShortcutsBenchには、Apple Inc.のオペレーティングシステムから多くの真のAPIが含まれている。
評価の結果,APIの選択やパラメータの充足,システムやユーザからの必要な情報要求など,複雑なクエリを扱う上での重大な制限が明らかになった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:57:58 GMT)
MidiCaps: A large-scale MIDI dataset with text captions [6.8] 本研究の目的は,LLMとシンボリック音楽を組み合わせることで,テキストキャプションを付加した最初の大規模MIDIデータセットを提示することである。
近年のキャプション技術の発展に触発されて,テキスト記述付き168kのMIDIファイルをキュレートしたデータセットを提示する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:34:46 GMT)
SLVideo: A Sign Language Video Moment Retrieval Framework [6.8] SLVideoは手話ビデオのためのビデオモーメント検索ソフトウェアである。
ビデオフレームから手と顔のサインの埋め込み表現を抽出する。
ユーザーはテキストクエリで特定の手話ビデオセグメントを検索できる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:29:36 GMT)
Empirical Capacity Model for Self-Attention Neural Networks [6.7] 数十億のパラメータを持つ可能性のある大規模なトランスフォーマーモデルは、理論上、コンテンツを記憶する大きな能力を持っている。
本稿では,一般的なトレーニングアルゴリズムと合成トレーニングデータを用いて得られたモデルのメモリ容量に着目した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:02:15 GMT)
On the Matrix Form of the Quaternion Fourier Transform and Quaternion Convolution [6.6] フーリエ変換および畳み込み演算の四元数版行列形式について検討する。
四元数(英語版)は強力な表現単位を提供するが、それらは四元数乗算の非可換性から最も遠ざかるそれらの使用の困難に関係している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:29:58 GMT)
NeuralLabeling: A versatile toolset for labeling vision datasets using Neural Radiance Fields [6.5] 我々は、バウンディングボックスまたはメッシュを使用して3DシーンにアノテートするためのラベリングアプローチとツールセットであるNeuralLabelingを紹介する。
皿洗い機に置かれた透明な物体を83.3%の精度で把握するロボットアプリケーションにNeuralLabelingを組み込む方法を示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 01:39:19 GMT)
Enhancing GPU-acceleration in the Python-based Simulations of Chemistry Framework [6.4] 我々は、既存のオープンソースGPU4PySCFプロジェクトへの産業利害関係者として、当社の貢献を説明します。
我々は、密度汎関数理論(DFT)を含む他のPySCF機能にGPUアクセラレーションを統合した。
GPU4PySCFは32コアのCPUノード上で30倍のスピードアップを実現し、ほとんどのDFTタスクで約90%のコスト削減を実現している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:02:34 GMT)
GraphScale: A Framework to Enable Machine Learning over Billion-node Graphs [6.4] 本研究では,大規模グラフデータを分散的に保存・処理するための,教師付き学習と教師なし学習の両方のための統一的なフレームワークを提案する。
私たちの設計における重要な洞察は、データを保存する労働者とトレーニングを行う労働者の分離です。
実験の結果,GraphScaleはGNNとノード埋め込みの両方の分散トレーニングにおいて,最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:09:36 GMT)
Context-Aware Indoor Point Cloud Object Generation through User Instructions [6.4] 本稿では,その周辺環境とシームレスに統合された点雲オブジェクトを生成することができる,新しいエンドツーエンドのマルチモーダルディープニューラルネットワークを提案する。
我々のモデルは、これまで見えなかったオブジェクトレイアウトで新しい環境を作成できるようにすることで、シーン修正に革命をもたらす。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:52:46 GMT)
Honeybee: Decentralized Peer Sampling with Verifiable Random Walks for Blockchain Data Sharding [6.1] シャーディングを実装する上で重要な課題は、ブロックのデータ全体がネットワークで利用可能かどうかを検証することである。
本稿では,ランダムノードを用いた提案ノードに対するプリミティブサンプリングアルゴリズムを提案する。
我々は,Honeybeeによって得られる品質が,最先端のサンプリングアルゴリズムと比較して有意に優れていることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 22:33:07 GMT)
FUTURE-AI: Guiding Principles and Consensus Recommendations for Trustworthy Artificial Intelligence in Medical Imaging [6.1] Future-AIフレームワークは、医療におけるAIの信頼性、安全性、採用を促進するための原則を導いてくれる。
我々は、Future-AIの一般的な医療原則を、医療画像コミュニティのニーズに合わせて、簡潔で具体的なAI実装ガイドに変換する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:39:53 GMT)
Semantic Constraint Inference for Web Form Test Generation [6.1] 我々は、Webフォームの自動テスト生成のためのFormNexusと呼ばれる革新的なアプローチを導入する。
FormNexusは、個々のフォーム要素とそれらの関係から意味的な洞察を導き出すことを強調している。
GPT-4と組み合わされたFormNexusは,フォームサブミッション状態において89%のカバレッジを実現していることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:58:51 GMT)
On Feasibility of Intent Obfuscating Attacks [5.9] 対象検出器の逆例生成に意図難読化を導入することを提案する。
別の重複しないオブジェクトを摂動してターゲットオブジェクトを妨害することで、攻撃者は意図したターゲットを隠す。
対象物体の信頼度や摂動物体の大きさなど,意図的難読化攻撃を特徴付ける成功要因を解析する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:13:22 GMT)
Optimizing Circuit Reusing and its Application in Randomized Benchmarking [5.8] 量子学習タスクは、ランダムにサンプリングされた量子回路を利用して未知のシステムを特徴づける。
回路再利用 (circuit reusing) と呼ばれる効率的な手法では、各回路を複数回実行することで、新しい回路を実装するよりもコストを削減できる。
本研究では,所定の実験コストに対する測定結果の分散を最小化する最適再利用パラメータについて検討する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:18:12 GMT)
Regression under demographic parity constraints via unlabeled post-processing [5.8] 本稿では,人口統計値に合致する予測を生成する汎用ポストプロセッシングアルゴリズムを提案する。
我々は凸関数の勾配ノルムを正確に制御する必要がある。
提案アルゴリズムは有限サンプル解析と後処理バウンダリによって裏付けられ, 実験結果から理論的知見が得られた。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:11:58 GMT)
Can Large Language Models Write Good Property-Based Tests? [5.7] プロパティベースのテスト(PBT)は、現実世界のソフトウェアではいまだにあまり使われていない。
2つのプロンプト手法を用いて,近代言語モデルを用いてPSTを自動的に合成する。
最適なモデルとプロンプトアプローチにより,有効かつ健全なPBTを平均2.4サンプルで合成できることが判明した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 01:28:38 GMT)
Examining Inequality in Park Quality for Promoting Health Across 35 Global Cities [5.6] 特定の公園スペースと健康を育むための要素の容量は、まだ過小評価されていない。
このギャップに対処するために,公園における健康増進活動の6つのカテゴリからなる分類法を提案する。
公園空間と要素を特定の健康増進活動と結び付けるレキシコンを確立することにより、35の都市における公園の容量を推計し、健康増進を図る。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:20:30 GMT)
U-learning for Prediction Inference via Combinatory Multi-Subsampling: With Applications to LASSO and Neural Networks [5.6] エピジェネティックな老化時計は、DNAメチル化パターンを調べることによって、個人の生物学的年齢を推定する上で重要な役割を担っている。
アンサンブル予測のためのマルチサブラーニングによる新しいUサンプリング手法を提案する。
より具体的には、一般化されたU統計学の枠組みにおけるアンサンブル推定器を概念化する。
提案手法はLassoとDeep Neural Network(DNN)の2つの一般的な予測アルゴリズムに適用し,広範囲な数値研究による推論の有効性を示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 00:03:51 GMT)
DStruct2Design: Data and Benchmarks for Data Structure Driven Generative Floor Plan Design [5.6] フロアプラン生成のデータ構造定式化のための新しいデータセットを構築した。
部分的あるいは完全な制約が与えられたフロアプラン生成の課題について検討する。
数値制約を考慮したフロアプラン生成問題に対するフロアプランデータ構造LLMの適用可能性を示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:27:55 GMT)
Decentralized Personalized Federated Learning based on a Conditional Sparse-to-Sparser Scheme [5.5] 分散連邦学習(DFL)は、その堅牢性と集中的調整の回避によって人気を博している。
本稿では, DA-DPFL という新しいテクスチャパース・ツー・スパーサー・トレーニング手法を提案する。
実験の結果, DA-DPFLはDFLのベースラインの精度を大幅に上回り, エネルギーコストの最大5ドル削減を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:58:05 GMT)
Revisiting Score Function Estimators for $k$-Subset Sampling [5.5] 離散フーリエ変換を用いて,$k$-subset分布のスコア関数を効率的に計算する方法を示す。
得られた推定器は、正確なサンプルと偏りのない勾配推定の両方を提供する。
特徴選択の実験は、仮定が弱いにもかかわらず、現在の手法と競合する結果を示している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:26:39 GMT)
GFE-Mamba: Mamba-based AD Multi-modal Progression Assessment via Generative Feature Extraction from MCI [5.4] アルツハイマー病(英語: Alzheimer's Disease、AD)は、軽度認知障害(MCI)から進行する可逆性神経変性疾患である。
生成特徴抽出(GFE)に基づく分類器GFE-Mambaを紹介する。
評価尺度、MRI、PETのデータを統合し、より深いマルチモーダル融合を可能にする。
GFE-MambaモデルがMCIからADへの変換予測に有効であることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:22:33 GMT)
Text-to-Battery Recipe: A language modeling-based protocol for automatic battery recipe extraction and retrieval [5.3] 本稿では,エンド・ツー・エンドのバッテリレシピの自動抽出のための言語モデリングベースのプロトコルであるText-to-Battery Recipe (T2BR)を提案する。
提案プロトコルは,バッテリ材料文献のレビューを著しく加速し,バッテリ設計・開発におけるイノベーションを触媒する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:15:02 GMT)
Hierarchical accompanying and inhibiting patterns on the spatial arrangement of taxis' local hotspots [5.3] 本研究は,中国武漢市と北京市において,タクシーの軌跡データを用いて,微粒な局部ホットスポットの空間配置を定量的に検討した。
人気のホットスポットは一般的にあまり人気のないホットスポットに囲まれているが、人気のあるホットスポットが多い地域では人気が低いホットスポットの存在を妨げている。
両方のパターンに触発されて、これらの関係を記述するためにKNNベースのモデルが開発され、最もポピュラーでないホットスポットの空間分布を再現することに成功した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:13:45 GMT)
Enhancing Quantum Machine Learning: The Power of Non-Linear Optical Reproducing Kernels [5.3] KerrカーネルはデータをKerrコヒーレント状態の位相と振幅にエンコードする。
本稿では,Kerrコヒーレント状態を用いた特徴空間を提案する。
月から乳がん診断まで,さまざまなデータセットを分析した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:33:24 GMT)
Lower bound for simulation cost of open quantum systems: Lipschitz continuity approach [5.2] 量子マルコフ半群の広いクラスをシミュレートするための下界を計算するための一般的な枠組みを提案する。
我々のフレームワークは、ユニタリおよび非ユニタリ量子力学の両方に適用できる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:57:41 GMT)
Increasing the Robustness of Model Predictions to Missing Sensors in Earth Observation [5.1] 入力センサドロップアウト(ISensD)とアンサンブルセンサ不変(ESensI)という,マルチセンサシナリオに適した2つの新しい手法について検討した。
これらの手法は, モデル予測の頑健さを, センサの欠如に対して効果的に向上させることを示した。
アンサンブル・マルチセンサー・モデルはセンサの欠如に対して最も頑丈であることが観察された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:58:29 GMT)
PAV: Personalized Head Avatar from Unstructured Video Collection [5.1] 任意の視点と表情下での人間の顔合成のためのPAV(Personalized Head Avatar)を提案する。
動的に変形可能なニューラルラジアンス場(NeRF)を学習する手法を提案する。
視覚的レンダリング品質の観点から,PAVがベースライン法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 23:34:46 GMT)
CAD-Prompted Generative Models: A Pathway to Feasible and Novel Engineering Designs [4.8] 本稿では,実現可能なCAD画像の生成を促すことによって,設計の実現可能性を向上させる手法を提案する。
その結果、CAD画像のプロンプトは、Stable Diffusion 2.1のようなテキストから画像への変換に有効であることが示されている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:49:45 GMT)
LLM experiments with simulation: Large Language Model Multi-Agent System for Simulation Model Parametrization in Digital Twins [4.8] 本稿では,大規模言語モデル(LLM)を適用し,デジタル双生児におけるシミュレーションモデルのパラメトリゼーションを自動化する新しいフレームワークを提案する。
提案手法は,LLMの知識を取り入れたシミュレーションモデルのユーザビリティを向上させる。
このシステムは、ユーザのフレンドリさを高め、人間のユーザの認知負荷を軽減する可能性がある。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:03:48 GMT)
FSboard: Over 3 million characters of ASL fingerspelling collected via smartphones [4.7] 本稿では,モバイルテキスト入力のユースケースにおいて,米国手話指スペルデータセットであるFSboardについて述べる。
FSboardは長さ300万文字、持続時間250時間で、これまでで最大10倍の速度で指で文字を認識できるデータセットである。
ByT5-Smallに30HzのMediaPipeのホロスティックなランドマークを刻み込み、ユニークなフレーズとシグナを持つテストセットで11.1%の文字誤り率(CER)を達成する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:20:22 GMT)
On shallow planning under partial observability [4.7] 本研究は,マルコフ決定過程の構造パラメータの偏差トレードオフに対する割引係数の影響について検討する。
この結果は,特に部分観測可能性の下では,より短い計画的地平が有用である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:34:07 GMT)
Reversing Unknown Quantum Processes via Virtual Combs for Channels with Limited Information [4.7] 仮想コムはユニタリ操作を逆転させ、スロット番号とサンプリングオーバーヘッドの間のトレードオフを調べることができることを示す。
また、仮想コムはユニタリ操作を普遍的に反転させ、スロット番号とサンプリングオーバーヘッドの間のトレードオフを調査できることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:51:28 GMT)
Test-Time Low Rank Adaptation via Confidence Maximization for Zero-Shot Generalization of Vision-Language Models [4.7] 本稿では,大規模視覚言語モデル(VLM)のゼロショット一般化のための高速チューニングの代替として,テスト時間低ランク適応(TTL)を提案する。
TTLは、予測信頼度を最大化することにより、変圧器の注意重みを更新するテスト時間効率適応手法を提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:59:19 GMT)
Reducing Texture Bias of Deep Neural Networks via Edge Enhancing Diffusion [4.6] セマンティックセグメンテーションにおけるCNNのテクスチャバイアスについて検討する。
我々は、テクスチャバイアスを減らすために、テクスチャの少ない前処理画像にCNNを訓練する。
我々はCNNの強いテクスチャ依存性と変換器の適度なテクスチャ依存性を観察する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:42:25 GMT)
Model editing for distribution shifts in uranium oxide morphological analysis [4.5] 我々はウラン鉱石濃縮(UOC)の合成条件を分類するために訓練された深層学習モデルを考える。
この領域に共通する分布シフトへの一般化を改善するために,モデル編集が特に有効であることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:06:51 GMT)
Prompting for products: Investigating design space exploration strategies for text-to-image generative models [4.5] 本研究は, 実用性, 斬新, 美的な製品イメージの獲得に成功するデザイン空間探索戦略を実証的に検討する。
重要な発見は、モノ対マルチ基準と、特定の設計目標を達成するためのプロンプトのゴールオリエンテーションが、時間とプロンプトの長さで重要な役割を担っていることを明らかにする。
この研究は、グローバル編集における実現可能性と新規性のためのマルチクリテリアプロンプトの使用の優先順位付けを推奨し、一方、局所編集ではモノクリテリアプロンプトを推奨している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:42:04 GMT)
Spin-orbit coupling mediated photon-like resonance for a single atom trapped in a symmetric double well [4.5] 我々は、スピン軌道結合原子のエネルギー準位間の共鳴遷移を誘導するために、ラマンレーザー強度のコヒーレント周期変調を含む手法を用いる。
このような光子共鳴は、局所状態から2つの井戸間の原子ラビ振動への移行を誘導する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:02:11 GMT)
OMoS-QA: A Dataset for Cross-Lingual Extractive Question Answering in a German Migration Context [4.4] OMoS-QAは、信頼できる文書と手動の注釈付き回答とを組み合わせた、ドイツ語と英語の質問のデータセットである。
質問はオープンソースの大言語モデル(LLM)で自動的に生成され、回答文は群衆労働者によって選択される。
回答文の選択には高精度で低中間のリコールがあり、これは誤解を招くユーザーを避けるための好都合なトレードオフである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:40:17 GMT)
SPVLoc: Semantic Panoramic Viewport Matching for 6D Camera Localization in Unseen Environments [4.3] SPVLocは、クエリ画像の6Dカメラポーズを正確に決定するグローバル屋内ローカライズ手法である。
本手法では、視点カメラのビューポートをローカライズするために、新しいマッチング手法を用いる。
技術手法と比較して位置決め精度が優れており、カメラのポーズの自由度も高いと推定される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:26:57 GMT)
Making LLMs Work for Enterprise Data Tasks [4.2] 大規模言語モデル(LLM)は、プライベートデータエコシステムにおけるエンタープライズデータベーステーブルについてほとんど知らない。
LLMのパフォーマンスはトレーニングデータと結びついているので、エンタープライズデータベースの管理と分析タスクを改善する上で、いかに有用かが重要な疑問である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:16:59 GMT)
RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection [4.2] 本研究では,自由なビュー,不均一な照度,ぼやけたコレクションを備えたロバスト異常検出データセットを提案する。
RADは、ワーキングプラットフォーム上の異物を異常として識別することを目的としている。
RADを用いた非教師ありゼロショット法11点の評価と解析を行った。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:38:36 GMT)
The Contribution of XAI for the Safe Development and Certification of AI: An Expert-Based Analysis [4.1] 機械学習モデルのブラックボックスの性質は、複雑な技術システムの認証に対する従来のアプローチの使用を制限する。
潜在的な解決策として、このブラックボックスに関する洞察を与える方法が考えられる。
XAIメソッドは安全なAI開発に役立つが、認証は技術システムに関する包括的で正確な情報に依存しているため、その影響は限定されると予想されている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:08:21 GMT)
AdaptEval: Evaluating Large Language Models on Domain Adaptation for Text Summarization [4.1] 本研究では,多言語モデル(LLM)のドメイン適応能力について,各ドメイン間の要約タスクで評価する。
本稿では、最初のドメイン適応評価スイートであるAdaptEvalを紹介する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:47:08 GMT)
Evaluation of Reinforcement Learning for Autonomous Penetration Testing using A3C, Q-learning and DQN [4.0] ネットワーク攻撃シミュレータ(NASim)は、3つの事前定義されたセキュリティシナリオを解決するために強化学習エージェントを訓練するための環境として使用された。
Q-learning、DQN、A3Cといったアルゴリズムが使われ、A3Cはすべてのシナリオを解き、一般化を実現した。
トレーニングは比較的小さなシナリオで実施され, エージェントの状態と動作空間は小さいが, RLエージェントによる浸透試験を成功させることができた。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:17:29 GMT)
MoXIchecker: An Extensible Model Checker for MoXI [3.9] MoXIは2024年に導入された新しい中間検証言語である。
我々はMoXI検証タスクを直接解決する最初のモデルチェッカーであるMoXIcheckerを紹介する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:26:04 GMT)
Unsupervised Mastoidectomy for Cochlear CT Mesh Reconstruction Using Highly Noisy Data [3.9] 術中CTスキャンのみでマストイドの容積を合成する方法を提案する。
術式別では, 口径70.0%, 口径70.0%の乳頭切除術を施行した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:47:29 GMT)
MSegRNN:Enhanced SegRNN Model with Mamba for Long-Term Time Series Forecasting [3.9] 本研究では,微調整された単一層マンバ構造を用いて情報を前処理するSegRNNの変種を紹介する。
暗黙のセグメンテーションと残留構造をモデルエンコーディングセクションに組み込んで、固有のデータ反復サイクルをさらに削減する。
この変種はMSegRNNと呼ばれ、Mamba構造を用いて有用な情報を選択し、変換シーケンスを生成する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:26:41 GMT)
Investigating Benefits and Limitations of Migrating to a Micro-Frontends Architecture [3.8] 本研究では,実世界のアプリケーションをマイクロフロントエンドアーキテクチャに移行する際のメリットと限界について検討する。
主なメリットは、テクノロジ選択の柔軟性の向上、開発チームのスケーラビリティ、テクノロジの段階的なマイグレーションなどだ。
しかし、アーキテクチャの複雑さが増したことで、開発者の間で懸念が高まった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:47:05 GMT)
Uhlmann quench and geometric dynamic quantum phase transition of mixed states [3.8] 混合量子状態のクエンチダイナミクスに幾何学的位相を組み込むフォーマリズムを導入する。
ウルマン・クエンチ(Uhlmann quench)は、混合状態における量子力学と幾何学的過程の間の相互作用を研究する方法である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:49:36 GMT)
AI-Driven Fast and Early Detection of IoT Botnet Threats: A Comprehensive Network Traffic Analysis Approach [3.8] 本研究は,IoTネットワークトラフィックを総合的に分析する手法を提案する。
ネットワークトラフィックを表現し、良質なIoTトラフィックパターンを特徴付ける上で重要な、幅広いネットワーク機能について検討している。
IoT-23データセットによる広範な実験を通じて、さまざまな操作やボットの種類に対応するボットネットトラフィックの検出が可能であることを実証した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:54:40 GMT)
AIDE: Antithetical, Intent-based, and Diverse Example-Based Explanations [3.7] AIDEは意図に基づく、不透明で複雑なモデルに対する多様な説明を提供するためのアプローチである。
AIDEは、正しい解釈、間違った調査、曖昧な予測の3つのタイプを区別する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:33:12 GMT)
EfficientCD: A New Strategy For Change Detection Based With Bi-temporal Layers Exchanged [3.4] 本稿では,リモートセンシング画像変化検出のためのEfficientCDという新しいディープラーニングフレームワークを提案する。
このフレームワークは機能抽出のバックボーンネットワークとしてEfficientNetを使用している。
EfficientCDは4つのリモートセンシングデータセットで実験的に検証されている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:11:50 GMT)
Score matching for bridges without time-reversals [3.1] スコアマッチング手法を用いてブリッジ拡散過程を学習するための新しいアルゴリズムを提案する。
本手法は,前処理のダイナミクスを逆転させ,これを用いてスコア関数を学習することに依存する。
従来の方法とは対照的に、我々はスコア項 $nabla_x log p(t, x; T, y)$, for given $t, Y$ を直接学習する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:13:13 GMT)
Robust personalized pricing under uncertainty of purchase probabilities [2.9] 予測された購入確率の不確実性を考慮したパーソナライズ価格のロバストな最適化モデルを提案する。
また、線形探索と組み合わせたラグランジアン分解アルゴリズムを開発し、大規模最適化問題に対する高品質な解を効率的に見つける。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:36:19 GMT)
From Black Boxes to Conversations: Incorporating XAI in a Conversational Agent [2.9] 社会科学の研究は、説明は人間と人間の説明と同様、会話的であるべきだと述べている。
エージェントの標準設計を用いて,XAIを対話エージェントに組み込む方法を示す。
我々は、品質管理されたパラフレーズによって拡張されたXAI質問銀行を構築し、ユーザの情報ニーズを理解する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:10:34 GMT)
Machine-learning-based particle identification with missing data [2.9] 本研究では,CERNにおけるALICE実験の範囲内での粒子同定(PID)の新たな手法を提案する。
提案手法は,全粒子種に対して選択された試料のPID純度と効率を向上する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:33:25 GMT)
Off-the-grid prediction and testing for linear combination of translated features [2.8] 付加的なガウス雑音過程で信号(離散あるいは連続)が観測されるモデルを考える。
我々は,スケールパラメータが変化する可能性を考慮して,オフ・ザ・グリッド推定器の過去の予測結果を拡張した。
本稿では,観測信号の特徴が与えられた有限集合に属するか否かを検証する手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:36:19 GMT)
Tree-Based versus Hybrid Graphical-Textual Model Editors: An Empirical Study of Testing Specifications [2.7] ツリーベースのモデルエディタとハイブリッドなグラフィカルテキストモデルエディタは、ドメインモデルを編集する際の利点と制限がある。
データは木ベースのモデルエディタに階層的に表示されるが、ハイブリッドなグラフィカルテキストモデルエディタは高レベルのドメイン概念をグラフィカルにキャプチャする。
ハイブリッド表記が優れているというシステムモデラーの暗黙の仮定を評価するため,22名の参加者を対象に実験を行った。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:59:33 GMT)
Future-Proofing Mobile Networks: A Digital Twin Approach to Multi-Signal Management [2.5] デジタルツイン(DT)は、将来の無線ネットワークにおいて重要な技術となることが期待されている。
我々のフレームワークは多様なデータソースを統合し、ネットワーク性能と環境センシングに関するリアルタイムで総合的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 10:13:46 GMT)
Deep Learning for Economists [2.4] ディープラーニングは、大規模で非構造化のテキストや画像データセットから構造化情報をインプットする強力な方法を提供する。
このレビューでは、分類器、回帰モデル、生成AI、埋め込みモデルなど、ディープニューラルネットワークについて紹介する。
適切な方法を使用する場合、ディープラーニングモデルはチューニングが安く、数百万から数十億のデータポイントに関わる問題に十分対応できる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:53:18 GMT)
PLayerTV: Advanced Player Tracking and Identification for Automatic Soccer Highlight Clips [2.4] PlayerTVは、サッカービデオの自動プレーヤー追跡と識別に最先端のAI技術を活用する革新的なフレームワークである。
オブジェクトの検出と追跡、光学文字認識(OCR)、色解析を統合することで、PlayerTVはプレイヤー固有のハイライトクリップの生成を容易にする。
ノルウェーのエリテセリエンリーグのデータセットでテストしたコアパイプラインの評価から得られた予備的な結果は、PlayerTVがチームや選手を正確にかつ効率的に識別できることを示唆している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 22:27:57 GMT)
Generating Sample-Based Musical Instruments Using Neural Audio Codec Language Models [2.4] サンプルベース楽器の自動生成のためのニューラルオーディオ言語モデルを提案する。
提案手法は,88キーのスペクトル,速度,テキスト/オーディオの埋め込みを併用した音声合成フレームワークを拡張した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:59:58 GMT)
Thoughts on Learning Human and Programming Languages [2.3] これはJeff氏が最初のUS-RSEカンファレンス(US-RSE'23)で行った講演に基づいている。
Dan氏はカンファレンスでJeff氏と議論し、この議論は非同期であり、このコラムは議論の記録である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:01:05 GMT)
ElectionRumors2022: A Dataset of Election Rumors on Twitter During the 2022 US Midterms [2.3] 我々は、中間選挙期間中にオンラインに広まった135の異なる噂に対応する1億81100万件のTwitter投稿のデータセットを提示、分析した。
我々はまた、アリゾナの選挙に関する3つの異なる噂、特に2022年の選挙噂の顕著な焦点について、混同分析を行いました。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:02:26 GMT)
A Neurosymbolic Framework for Bias Correction in CNNs [2.2] 我々は、訓練されたCNNにおいて、バイアス補正のためのNeSyBiCorと呼ばれるニューロシンボリックフレームワークを導入する。
そこで本研究では,PlacesデータセットのクラスサブセットでトレーニングしたCNNのバイアスの修正に成功した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:16:25 GMT)
Decoding BACnet Packets: A Large Language Model Approach for Packet Interpretation [2.2] セキュリティオペレーションセンター(SOC)のアナリストは、ネットワークの活動やセキュリティインシデントを監視し、解釈し、対処する。
従来の監視ツールや技術は、ICS固有のコミュニケーションの性質と意図を明確に理解するのに苦労することが多い。
大規模言語モデル(LLM)を利用したソフトウェアソリューションを提案する。
このソフトウェアは、ネットワークアクティビティの明確で一貫性があり、理解しやすい要約を提供しており、SOCアナリストは制御システムの現在の状態をよりよく評価することができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:15:49 GMT)
Using Explainable AI for EEG-based Reduced Montage Neonatal Seizure Detection [2.2] 新生児発作検出のゴールドスタンダードは、現在連続したビデオEEGモニタリングに依存している。
脳波モンタージュを低減した新生児発作検出プロセスを自動化するための新しい説明可能な深層学習モデルを提案する。
提案したモデルは、それぞれ曲線下面積(AUC)とリコールにおける8.31%と42.86%の絶対的な改善を達成している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:57:42 GMT)
Versioned Analysis of Software Quality Indicators and Self-admitted Technical Debt in Ethereum Smart Contracts with Ethstractor [2.1] 本稿では、バージョン管理されたスマートコントラクトのデータセットを収集する最初のスマートコントラクト収集ツールであるEthstractorを提案する。
収集されたデータセットは、スマートコントラクトの脆弱性の指標として、コードメトリクスの信頼性を評価するために使用される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:27:29 GMT)
Geometric Analysis of Unconstrained Feature Models with $d=K$ [2.0] 2つの人気の制約のない特徴モデルが厳密なサドル関数であり、すべての臨界点が大域的最小点か、負の曲率で退避できる厳密なサドル点であることを示す。
主要な発見は、前回の記事における制約のない特徴モデルに関する予想を確定的に裏付けるものである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:09:46 GMT)
IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution [2.0] 本稿では,CFATモデルをIG-CFATと呼ばれる改良型GANモデルに拡張する。
IG-CFATはセマンティック・アウェア・ディスクリミネーターを組み込んで細部をより正確に再構築する。
提案手法は,GANを用いた超解像モデルにおける従来の損失関数にウェーブレット損失を加え,より効率的に高周波の詳細を復元する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:50:09 GMT)
Wisdom of the Silicon Crowd: LLM Ensemble Prediction Capabilities Rival Human Crowd Accuracy [2.0] 我々は12大言語モデル(LLM)の群集からなるアンサンブルアプローチを使用する。
我々は,31の2進数質問に対するLLM予測を,3ヶ月の予測トーナメントにおける人的予測者の群集の予測と比較した。
両モデルの予測精度は、中央値の人間の予測を情報として暴露することで得られる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:50:27 GMT)
Quasi-classical Trajectory Calculations on a Two-state Potential Energy Surface Including Nonadiabatic Coupling Terms as Friction for D+ + H2 Collisions [2.0] D++H2衝突の摩擦項としての非断熱結合項を含む2状態ab初期ポテンシャルエネルギー表面のダイナミクスを実行する。
結果として生じるダイナミクスは、非反応性電荷移動、反応性非電荷移動および反応性電荷移動過程を正しく説明する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:48:51 GMT)
A Survey of AI Reliance [1.6] この文献の現在の欠点には、AI依存への不明確な影響、外部の妥当性の欠如、信頼度を測定するための矛盾したアプローチ、時間による依存度の変化を無視することなどがある。
結論として,AI依存研究のガイドとなる形態的ボックスを提示する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:34:58 GMT)
Inferring turbulent velocity and temperature fields and their statistics from Lagrangian velocity measurements using physics-informed Kolmogorov-Arnold Networks [1.6] 実験乱流速度データから隠れた温度場を推定するためのAIVT法を提案する。
具体的には、AIVTは物理インフォームされたコルモゴロフ・アルノルドネットワーク(ニューラルネットワークではない)に基づいており、複合損失関数の最適化によって訓練されている。
乱流の直接数値シミュレーション (DNS) に匹敵する忠実度でスパース実験データから連続的, 即時的な速度場と温度場を再構成し, 推定できることを実証した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:30:21 GMT)
Integrated Mode-Hop-Free Tunable Lasers at 780 nm for Chip-Scale Classical and Quantum Photonic Applications [1.5] ヘテロジニアスガリウム-オンシリコン窒化物(GaAs-on-SiN)プラットフォームにおける連続波長可変レーザー
レーザーは780nm付近の遠赤外放射スペクトルに放出され、20nmのチューニング範囲、6kHzの固有線幅、40dBのサイドモード抑制比を持つ。
提案された統合レーザーは、可視領域における古典的および量子的応用の幅広いスペクトルを約束する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:33:34 GMT)
Complexity of geometrically local stoquastic Hamiltonians [1.5] 局所ハミルトニアン問題のQMA完全性は、ハミルトニアン複雑性の分野の画期的な結果である。
2次元および1次元の幾何学的局所的な類似物は、高いクディット次元を持つMAハードのままであることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:27:25 GMT)
HandDGP: Camera-Space Hand Mesh Prediction with Differentiable Global Positioning [1.5] 本稿では,2D-3D対応問題に対処するエンドツーエンドソリューションを提案する。
このソリューションは、新しい差別化可能なグローバル位置決めモジュールを通じて、カメラ空間出力からネットワークの他の部分へのバックプロパゲーションを可能にする。
いくつかのベースラインと最先端のアプローチに対する評価において、我々のフレームワークの有効性を検証する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:59:01 GMT)
Data driven weather forecasts trained and initialised directly from observations [1.4] Skilful Machine Learned weather forecasts has challenged our approach to numerical weather prediction。
データ駆動システムは、過去の気象の長い歴史記録から学ぶことによって、将来の天気を予測するために訓練されている。
そこで我々は,ニューラルネットワークをトレーニングし,過去の観測から将来の天気を予測する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:23:26 GMT)
Polynomial decompositions with invariance and positivity inspired by tensors [1.4] このフレームワークは、特に量子多体系において、テンソル分解のために最近導入された。
我々は、構造、近似、実数に対する決定不可能性の不変分解を定義する。
私たちの仕事は、足場をテンソルで均等な足場に置き、このフレームワークを他の製品構造に拡張する扉を開くことで、足場に新たな光を当てます。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:28:16 GMT)
ImPress: Securing DRAM Against Data-Disturbance Errors via Implicit Row-Press Mitigation [1.4] DRAM細胞はDDE(Data-Disturbance Errors)に感受性がある
Rowhammerは、行が繰り返しアクティベートされたときに発生するよく知られたDDE脆弱性である。
Row-Press(RP)は、行を長時間開いているときに発生する新しいDDE脆弱性である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:20:14 GMT)
Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.3] 本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。
我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。
シミュレーションおよび実データ実験により本手法を実証する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:00:13 GMT)
Towards Complex Ontology Alignment using Large Language Models [1.3] オントロジーアライメント(オントロジーアライメント)は、異なるラベルとコンテンツ間の関係を検出するWebにおける重要なプロセスである。
近年のLarge Language Models (LLMs) の進歩は,工学的実践の強化に新たな機会をもたらす。
本稿では,LLM技術の複雑なアライメント問題への取り組みについて検討する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:07:33 GMT)
Harnessing Quantum Support Vector Machines for Cross-Domain Classification of Quantum States [1.3] クロスドメイン分類は、絡み合いと分離性パラダイムの解釈に使用される。
2ビット混合状態の効率的分類を,絡み合ったクラスと分離可能なクラスに分類する。
本研究は,量子状態の分類のための量子支援ベクトルマシンの可能性を示すものである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:06:22 GMT)
Optimal Defender Strategies for CAGE-2 using Causal Modeling and Tree Search [1.3] 本稿では,CAGE-2の形式的(因果的)モデルと,証明可能な最適なディフェンダー戦略を生成する手法を提案する。
C-POMCPは、有効性に関して最先端の性能を達成し、最も近い競合手法よりも計算時間で2桁効率が良い。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:08:31 GMT)
A Survey of Explainable Artificial Intelligence (XAI) in Financial Time Series Forecasting [1.3] eXplainable AI(XAI)の分野は、AIモデルをより理解しやすくすることを目指している。
本稿では、金融時系列を予測するXAIアプローチを分類する。
金融におけるXAIの現在の役割を包括的に把握している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:06:19 GMT)
Personality Analysis for Social Media Users using Arabic language and its Effect on Sentiment Analysis [1.3] 本研究は、Twitter上でのアラビア語の使用と性格特性と感情分析への影響の相関について検討した。
本研究では、プロフィール活動から抽出した情報と、ツイートの内容に基づいて、ユーザの性格特性を示す。
その結果,人格がソーシャルメディアの感情に影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:27:20 GMT)
Inequalities in Computational Thinking Among Incoming Students in an STEM Chilean University [1.3] 本稿では、チリの大学に入学する学生の計算思考能力の特徴を、STEMの規律に強く焦点をあてて紹介する。
この研究は500以上の回答に基づいて、性別、学校の種類(プライベートかノーか)、および事前のプログラミング知識における計算思考における有意な不平等の証拠を提供する。
同様の状況に直面した国で、学生がSTEMの学位を取得するための、より公平な分野を作るための、今後の研究努力と定式化戦略を啓蒙することができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:51:15 GMT)
IWISDM: Assessing instruction following in multimodal models at scale [1.2] 我々は,視覚言語タスクの無制限な配列を生成するために,指示された仮想VISual Decision Making (iWISDM)環境を紹介する。
iWISDMを用いて,様々な複雑性レベルにわたる視覚課題に追従する命令の3つの異なるベンチマークをコンパイルした。
本研究は,既存のマルチモーダルモデルと創発的マルチモーダルモデルの両方の命令順守性を評価するための頑健なベンチマークとしてiWISDMを確立した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 03:25:19 GMT)
Beyond Size and Class Balance: Alpha as a New Dataset Quality Metric for Deep Learning [1.2] 我々は、シャノンエントロピーのようなよく知られた量を一般化する、生態学で開発された多様性尺度の包括的枠組みを導入する。
超音波、X線、CT、病理画像を表す7つの医学データセットから数千のサブセットを解析した結果、最高の相関関係はサイズやクラスバランスではないことがわかった。
本稿では,医用画像における深層学習の性能向上のための新しい手法として,$A$を最大化することを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:28:51 GMT)
Advancing TTP Analysis: Harnessing the Power of Large Language Models with Retrieval Augmented Generation [1.2] 大規模言語モデル(LLM)が、サイバーセキュリティなどの重要なドメインに対して正確な応答を提供するために、効率的かつ適切な方法でどのように使用できるかは、不明である。
この研究は、デコーダのみのLLMに対するエンコーダのみのLLM(Retrieval Augmented Generation, RAG)に対する教師付き微調整(SFT)の使用について研究し、比較する。
本研究では,RAGを用いたデコーダのみのLLMが,SFTを用いたエンコーダのみのモデルよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:51:05 GMT)
A Decentralised Digital Token Architecture for Public Transport [1.2] 本研究の目的は,プライバシ向上型デジタルトークン管理サービスの公共交通機関への適用の可能性を確立することにある。
概念実証実装が開発され、Goodell と Aste が提案した設計に基づいている。
デモされたスループットとレイテンシは、システムが現在使用されているソリューションと競合できることを示している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:40:40 GMT)
DropKAN: Regularizing KANs by masking post-activations [1.2] コルモゴロフ・アルノルドネットワーク(KAN)における活性化関数重みの共適応を防止する正規化手法を提案する。
DropKanは、Kansグラフ内のポストアクティベーションの一部をランダムにマスキングし、保持されたポストアクティベーションをスケールアップする。
その結果,DropKANは標準のDropout with Kansよりも優れた代替手段であり,kansの一般化性能を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:12:39 GMT)
Investigating the Indirect Object Identification circuit in Mamba [1.2] 我々は,マンバ前技法をマンバに適用し,間接物体識別(IOI)タスクに責任を持つ回路を部分的にリバースエンジニアリングする。
コントリビューションは,回路ベースの機械的解釈可能性ツールがMambaアーキテクチャに有効であることを示す最初の証拠を提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:13:58 GMT)
Uncertainty Quantification and Propagation in Surrogate-based Bayesian Inference [1.1] 代理モデルはより複雑なシミュレーションモデルに対する概念近似である。
代理体の不確かさを定量化し、伝播することは、通常、特別な分析ケースに限られる。
本稿では,測定データを用いた代理モデルを用いたベイズ推定の3つの手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:37:44 GMT)
Appearance-Based Loop Closure Detection for Online Large-Scale and Long-Term Operation [1.1] 外見に基づくローカライゼーションとマッピングでは、ループクロージャ検出(ループクロージャ検出)は、現在の観測が以前に訪れた場所や新しい場所から来ている場合、その検出に使用されるプロセスである。
本稿では,大規模・長期運用におけるオンラインループ閉鎖検出手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 00:13:00 GMT)
Towards Effective Collaboration between Software Engineers and Data Scientists developing Machine Learning-Enabled Systems [1.1] 機械学習(ML)対応システムの開発には、いくつかの社会的および技術的な課題が含まれている。
本稿は,これらのシステム構築における2つの重要なアクター – ソフトウェアエンジニアとデータサイエンティスト – のコラボレーションを強化する方法を理解することを目的としている。
我々の研究は、これらのアクター間のコラボレーションが、ML対応システムを効果的に開発する上で重要であることを発見した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:35:18 GMT)
Can GPT-4 learn to analyze moves in research article abstracts? [1.1] 我々は、自然言語のプロンプトを用いてアノテーションプロセスを自動化するため、GPT-4の余裕を生かしている。
8ショットのプロンプトは2つを用いた場合よりも有効であり、可変性の領域を示す例を含めることで、単一の文で複数の動きを認識できるGPT-4の能力を高めることが確認された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:14:27 GMT)
A Diffusion Model for Simulation Ready Coronary Anatomy with Morpho-skeletal Control [1.1] 仮想的介入研究のために,潜在拡散モデルを用いて冠状動脈解剖学をカスタムに合成する方法を検討する。
われわれのフレームワークは、冠動脈解剖学を制御可能な方法で生成・編集することを可能にし、デバイス設計者が機械的洞察を導き出すことを可能にする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:44:06 GMT)
MINT: Securely Mitigating Rowhammer with a Minimalist In-DRAM Tracker [1.0] 本稿では,Rowhammer(RH)を緩和するセキュアな低コストインDRAMトラッカーについて検討する。
既存の低コストのDRAMトラッカーは、銀行当たり数百から数千のエントリの非現実的なオーバーヘッドを必要とする。
単一エントリでセキュアな緩和を実現するミニマリストIn-DRAMトラッカー(MINT)を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:29:56 GMT)
A Multi-Level Corroborative Approach for Verification and Validation of Autonomous Robotic Swarms [1.0] 本稿では,自律型ロボット群を形式的に検証し,検証するための総合的マルチレベルモデリング手法を提案する。
検証に用いた我々の形式的マクロモデルでは,実際のシミュレーションから得られたデータによって特徴付けられる。
我々の研究は、実際のロボットを含む実験的な検証とフォーマルな検証を組み合わせる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:40:05 GMT)
Enhanced quantum emission from a topological Floquet resonance [1.0] 絡み合いは量子情報技術において貴重な資源である。
非磁性および異常なフロケ絶縁体によって達成された絡み合った光子対の生成について述べる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:36:50 GMT)
Industrial Practices of Requirements Engineering for ML-Enabled Systems in Brazil [0.9] ブラジルの企業の41%は、ある程度機械学習(ML)を使用している。
しかし、ML問題仕様の非現実的な顧客期待とあいまいさが報告されている。
本研究は,ブラジルにおけるML対応システム開発における要件工学の適用性を検討することを目的とする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:25:27 GMT)
Wallcamera: Reinventing the Wheel? [0.9] We show that the key insights behind the Wallcamera is that the prototype of differential imaging forensics (DIF)。
DIFは、写真家の個人識別可能な情報の回復を含む、多くの法医学に応用されている。
Wallcameraの実際のイノベーションは、DIFが示したよりも細かい粒度でアクティビティ認識を達成することです。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:46:27 GMT)
LLM4ED: Large Language Models for Automatic Equation Discovery [0.9] 我々は、自然言語に基づくプロンプトを利用して、データから支配方程式を自動的にマイニングする大規模言語モデルをガイドする新しいフレームワークを導入する。
具体的には、まずLLMの生成能力を利用して、文字列形式で様々な方程式を生成し、次に観測に基づいて生成された方程式を評価する。
実験は偏微分方程式と常微分方程式の両方で広範囲に行われる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:13:18 GMT)
Dynamical System Identification, Model Selection and Model Uncertainty Quantification by Bayesian Inference [0.8] 本研究では,時系列データから動的システム同定を行うためのMAPフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:51:59 GMT)
Socially Integrated Navigation: A Social Acting Robot with Deep Reinforcement Learning [0.8] 移動ロボットは様々な混み合った状況で大規模に使われており、私たちの社会の一部になっている。
個人を考慮した移動ロボットの社会的に許容されるナビゲーション行動は、スケーラブルなアプリケーションと人間の受容にとって必須の要件である。
本稿では,ロボットの社会行動が適応的であり,人間との相互作用から生じる,社会統合型ナビゲーション手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:48:50 GMT)
Multimodal Explainability via Latent Shift applied to COVID-19 stratification [0.8] 本稿では,モダリティの再構築とサンプル分類を共同で学習するディープアーキテクチャを提案する。
AIforCOVIDデータセットを使用して、COVID-19パンデミックの文脈でのアプローチを検証する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:02:58 GMT)
Code Linting using Language Models [0.8] コードリンタは高品質なソフトウェアシステムの開発において重要な役割を担います。
それらの利点にもかかわらず、コードリンタは言語固有のもので、特定のタイプの問題に焦点を合わせており、偽陽性になりがちである。
本稿では,大規模言語モデルを用いて,より汎用的なコードlinterを開発できるかどうかについて検討する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:01:10 GMT)
Predictive Coding Networks and Inference Learning: Tutorial and Survey [0.8] 予測符号化ネットワーク(PCN)は、予測符号化の神経科学的な枠組みに基づいている。
バックプロパゲーション(BP)で訓練された従来のニューラルネットワークとは異なり、PCNは推論学習(IL)を利用する。
本質的に確率的(グラフィック的)潜在変数モデルとして、PCNは教師付き学習と教師なし(生成的)モデリングの両方に汎用的なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:56:46 GMT)
Controlling nonlocality of bipartite qubit states via quantum channels [0.7] これはベルの非局所性条件を満たす2量子循環状態に対応するキュービットチャネルに焦点を当てている。
この研究は、量子チャネルの興味深い幾何学的性質を明らかにし、量子非局所性の分野に寄与する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:21:26 GMT)
Multimodal Input Aids a Bayesian Model of Phonetic Learning [0.7] 本稿では,既存の音声コーパスのための高品質な音声合成ビデオを作成する方法を提案する。
我々の学習モデルは、オーディオ視覚入力の訓練と試験の両方を行うと、音素識別電池の8.1%の相対的な改善が達成される。
視覚情報は特にノイズの多いオーディオ環境において有益である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:00:11 GMT)
Restarts subject to approximate sharpness: A parameter-free and optimal scheme for first-order methods [0.7] シャープネス(Sharpness)は、目的関数の準最適性によってミニマからの距離を束縛する連続最適化における仮定である。
シャープネスは、通常不明な問題固有の定数を伴い、再起動スキームは通常収束率を減少させる。
対象関数の誤差に未知の定数摂動を組み込んだシャープネスの一般化である近似シャープネスの仮定を考察する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:29:18 GMT)
Personalization of Dataset Retrieval Results using a Metadata-based Data Valuation Method [0.6] アイルランドのナショナル・マッピング・エージェンシーにおいて,データセット検索のための新しいデータ評価手法を提案する。
メタデータとユーザの好みを利用して、各データセットの個人価値を推定する。
データセットの利害関係者のランキングに対して、データバリューベースのランキングを検証しました。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:13:07 GMT)
Sustainable broadcasting in Blockchain Network with Reinforcement Learning [0.6] 推定では、Bitcoinの二酸化炭素排出量は年間平均6600万トンから2600万トンと見積もられている。
ブロックチェーンネットワークにおけるブロックブロードキャスト方式を改善する強化学習に基づく効率的な手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:24:08 GMT)
Learning deep illumination-robust features from multispectral filter array images [0.5] マルチスペクトル(MS)スナップショットカメラは、1枚のショットで複数のスペクトルバンドをキャプチャし、各ピクセルが1つのチャネル値しか持たない生画像を生成する。
完全定義MS画像のトレーニングは、特にディープニューラルネットワーク(DNN)を用いて、計算集約的に行うことができる
本稿では,原画像から識別・照度特性を学習するための独自のアプローチを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:35:41 GMT)
Artificial Intelligence-based Decision Support Systems for Precision and Digital Health [0.5] 我々は、AIによって提供される機会、具体的には強化学習から現在のヘルスケアのトレンドまでについて論じる。
我々は適応的な介入の分野に焦点を当てる。
この記事は匿名レビューを受けており、"Frontiers of Statistics and Data Science"の巻の書籍章として意図されている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:39:34 GMT)
Towards diffusion models for large-scale sea-ice modelling [0.4] データ空間におけるガウス分布を検閲して、潜伏拡散モデルを海氷物理学に調整し、モデル化された変数の物理的境界に従うデータを生成する。
我々の潜伏拡散モデルは、データ空間で訓練された拡散モデルと同様のスコアに達するが、潜伏写像によって生成されたフィールドは滑らかである。
大規模地球系モデリングでは、スムース化の重要な障壁を解決することができる場合、遅延拡散モデルはデータ空間の拡散に比べて多くの利点を持つ。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:35:36 GMT)
No-cloning theorem for 2WQC and postselection [0.4] 2方向量子コンピュータ (2WQC) は標準1WQCの拡張提案である。
元の証明を拡張して、この定理がまだ 2WQC とポストセレクションに対して成り立つことを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:35:47 GMT)
Piecemeal Quantum Telescope: Exponential Precision with Super Robustness and Efficiency [0.4] ビット・バイ・ビット・イテレーションによる駒型量子望遠鏡。
統計的誤差に対する耐障害性は、恒星の角を検出するために少数の入射単光子しか要求しない。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:04:04 GMT)
Dark Side Augmentation: Generating Diverse Night Examples for Metric Learning [0.4] 我々は、GANベースの合成画像生成装置を訓練し、利用可能な日中の画像例を夜間画像に変換する。
提案手法は,標準の東京24時間7日の検索ベンチマークにおいて,最先端の結果よりも改善されている。
これは、昼と夜の画像に一致する画像のペアを訓練する必要がない。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:21:31 GMT)
Multicell-Fold: geometric learning in folding multicellular life [0.3] 細胞群が特定の構造にどのように折り畳むかは、生物がどのように形成されるかを定義する生物学の中心的な問題である。
マルチセルの折り畳みや胚発生を予測できる幾何学的深層学習モデルを提案する。
我々は,4次元形態素配列アライメントの解釈と局所的な細胞再構成の予測という,2つの重要な課題を達成するために,我々のモデルをうまく利用した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:59:15 GMT)
Pauli path simulations of noisy quantum circuits beyond average case [0.3] 深さ$n$ qubitsのランダム量子回路では、パウリパス法を用いて出力状態からのサンプリングを効率よく行うことができる。
我々は、Tゲートであるゲートの分数とノイズ率の相似性について十分な条件を導出し、ノイズがより速い速度で導入された場合、シミュレーションは古典的に容易になることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:58:37 GMT)
Einstein-Podolsky-Rosen-Bohm experiments: a discrete data driven approach [0.3] 実験データから数学的モデルへの一方通行橋の構築は、議論を避けるための別の方法であると考える。
まず、アインシュタイン-ポドルスキー-ローゼン-ボーム実験により得られた4つの相関の値に制約を与えるベル型不等式を新たに証明する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:33:52 GMT)
Can foreign exchange rates violate Bell inequalities? [0.3] 経験的データによるベル型不等式の違反は、宇宙が数学的モデルの規則に従って作用していると信じない限り、何の意味も持たない。
モデル自由不等式による経験データの解析は、経験データによるベル型不等式違反は、宇宙が数学的モデルの規則に従って機能していると信じない限り、何の意味も持たないという結論を導いた。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:48:39 GMT)
MLRegTest: A Benchmark for the Machine Learning of Regular Languages [0.3] 本稿では,MLRegTestと呼ばれるシーケンス分類に基づく機械学習システムのための新しいベンチマークを提案する。
これには1,800の正規言語からのトレーニング、開発、テストセットが含まれている。
異なる形式言語は、異なる種類の長距離依存を表す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 00:40:17 GMT)
Lieb-Robinson bounds in the continuum via localized frames [0.3] 連続体における相互作用するフェルミオンのダイナミクスについて検討する。
まず、局所相互作用の一般クラスに有効であるリーブ・ロビンソン境界を証明する。
次に、(フラクタル)量子ホール効果に関連する物理的状況に目を向ける。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:29:06 GMT)
An instructional lab apparatus for quantum experiments with single nitrogen-vacancy centers in diamond [0.1] ダイヤモンド中における窒素空孔(NV)中心の量子実験を行う実験装置を提案する。
我々は,NV中心の基礎物理を解説し,この装置で実施できる可能性実験の例を示す。
ここで説明する装置は、学生が典型的な実験コースの1学期以内で、実験的な制御とデータ分析ソフトウェアをスクラッチから作成することを可能にする。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:10:59 GMT)
Coca4ai: checking energy behaviors on AI data centers [0.1] 本稿では,データセンター全体の規模でのエネルギー挙動の簡易かつ軽量なモニタリングという概念の実証について述べる。
結果は、効率性の観点から興味深い可能性があり、ユーザーエンゲージメントを生み出すための議論を提供することを示している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:33:10 GMT)
Modeling and Harmonic Balance Analysis of Parametric Amplifiers for Qubit Read-out [0.1] 超伝導ジョセフソン接合の組み合わせに基づく非線形インダクタを商用回路シミュレータでモデル化する方法を示す。
また、増幅器性能の信頼性予測にハーモニックバランス(HB)がどのように使用されるかを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:13:39 GMT)
Enhancing Cell Instance Segmentation in Scanning Electron Microscopy Images via a Deep Contour Closing Operator [0.0] そこで本研究では,SEM画像のインスタンスベースセルセグメンテーションを改善するために,境界線を精製するAI駆動方式を提案する。
CNN COp-Netは、細胞輪郭のギャップに対処するために導入され、不十分な情報や欠落した情報のある領域で効果的に満たされる。
PDX肝芽腫組織からのプライベートSEM画像と公開画像データセットの両方を用いて,細胞境界の精度を高めるためのアプローチの有効性を示した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:32:06 GMT)
g-factor symmetry and topology in semiconductor band states [0.0] テンソルは、応用磁場に対するクラマーズ縮退状態の反応を決定する。
シリコン,ゲルマニウム,フッ化ガリウムにおいて,$bfg_L+bfg_S$の新しい対称性とトポロジー特性を示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:23:12 GMT)
Who Shares Fake News? Uncovering Insights from Social Media Users' Post Histories [0.0] 本稿では,ソーシャルメディア利用者の投稿履歴が,偽ニュース共有の研究にあまり使われていないことを提案する。
偽ニュースの共有者を識別し、最も偽ニュースを共有する可能性が最も高いものを予測し、介入を構築するための有望な構成物を特定する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:46:59 GMT)
Virtual Reality and Augmented Reality Security: A Reconnaissance and Vulnerability Assessment Approach [0.0] 様々な業界が、生産性とユーザエクスペリエンスを向上させるために、VR(Virtual Reality)とAR(Augmented Reality)テクノロジーを広く採用している。
この体系的な文献レビューは、ARおよびVR技術で使用されるデバイスを特定し、関連する脆弱性を特定することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:51:59 GMT)
Universality of the thermodynamics of a quantum-mechanically radiating black hole departing from thermality [0.0] マチュールとメフタは2023年の重力研究財団エッセイコンクールで3位を獲得した。
彼らは、ECOが事象の地平線を持つか否かにかかわらず、任意の極小物体(ECO)が同じBH熱力学特性を持つ必要があることを示した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:22:01 GMT)
Unipa-GPT: Large Language Models for university-oriented QA in Italian [0.0] Unipa-GPTは、パレルモ大学で学士課程と修士課程を選択する学生を支援するために開発された。
実験では,RAG(Retrieval Augmented Generation)アプローチと微調整を併用してシステムを開発した。
Unipa-GPTのアーキテクチャ全体を示し、RAGと微調整システムを比較し、その性能に関する簡単な議論を報告する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:22:30 GMT)
Turing's Test, a Beautiful Thought Experiment [0.0] チューリング試験とその価値に関する主張と疑問が復活した。
もしAIが量子物理学なら、現在までに数匹の"Schr"odinger's"猫が殺されただろう。
本稿では, チューリングの1950年版に関するいくつかのオープンな疑問に対して, 新たな考古学的根拠を含む, 豊富な証拠を提示する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:29:32 GMT)
Transformer-based Capacity Prediction for Lithium-ion Batteries with Data Augmentation [0.0] リチウムイオン電池は、輸送、電子機器、クリーンエネルギー貯蔵の技術の進歩に欠かせない。
キャパシティを推定する現在の方法は、キー変数の長期的な時間的依存関係を適切に説明できない。
本研究では,電池データにおける長期パターンと短期パターンの両方を考慮した変圧器ベースの電池容量予測モデルを構築した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:21:40 GMT)
Towards an Engineering Discipline for Resilient Cyber-Physical Systems [0.0] レジリエンスという用語は、正しいサービスを提供しながら予期せぬ入力に対処する能力を指す。
私の論文は、レジリエントなサイバー物理システムのためのエンジニアリングの分野を開拓することを目的としています。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:50:01 GMT)
Towards Relational Quantum Field Theory [0.0] 我々は、正の作用素値測度(量子フレーム)に対する作用素値関数(量子場)に対する一般積分理論を開発する。
不定時間性の形式は、関係フレームバンドルの文脈における量子状態から生じる。
これは一般相対論的および量子物理学の原理を整合する問題に関する新しい視点を提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:24:34 GMT)
TokenSHAP: Interpreting Large Language Models with Monte Carlo Shapley Value Estimation [0.0] TokenSHAPは、大規模言語モデルを解釈する新しい方法である。
これは、協調ゲーム理論から自然言語処理へのシェープリー値の適応である。
トークンの重要性を解釈可能で定量的に測定する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:59:07 GMT)
Time correlations in atmospheric quantum channels [0.0] リモートパーティ間での量子情報の効率的な転送は、大気チャネル上での量子通信にとって重要な課題である。
チャネル透過率のランダム変動は、その実践上の大きな障害要因である。
本研究では,異なるタイミングでチャネル透過率の相関について検討し,二つの伝送プロトコルに着目した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:13:47 GMT)
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis [0.0] メンタルヘルス介入における会話型人工知能(CAI)の展開の増加は、認知バイアスの是正と人間とAIの相互作用に対する影響の認識において、その効果を評価する必要がある。
本研究の目的は、認知バイアスの同定と修正およびユーザインタラクションへの影響認識における汎用言語モデル(GPT-3.5, GPT-4, Gemini Pro)に対する治療用チャットボットの有効性を評価することである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:38:16 GMT)
The Development of a Comprehensive Spanish Dictionary for Phonetic and Lexical Tagging in Socio-phonetic Research (ESPADA) [0.0] スペイン語の方言の変種の大部分で使用可能な、スペイン語の包括的な発音辞書(ESPADA)の作成について紹介する。
ESPADAは16か国の単語を表わす628,000以上のエントリを持つ最も完全な辞書である。
これは、スペイン語の社会音声学の枠組みにおける方言研究を強化する完全なオープンソースツールを社会音声学研究者に提供することを目的としている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:51:33 GMT)
Suppression of noise in separation estimation of optical sources with spatial-mode demultiplexing [0.0] 空間モード分解による超解像は急速に劣化する。
本稿では,騒音の破壊的影響を抑制するための公式な手順を提案する。
これにより、変位演算子によって生成される特別な種類のノイズに対する超解像の回復が可能となる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:06:37 GMT)
Supporting the Digital Autonomy of Elders Through LLM Assistance [0.0] 我々は、デジタルディビジョンによって分離された高齢者がデジタル自律性を安全に達成するのを助けるための、単純だが未解決のアイデアを提案し、試行する。
LLMは、デジタルディビジョンによって分離された高齢者がデジタル自律性を安全に達成できるよう、必要な支援を提供することができるだろうか?
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:01:45 GMT)
Stronger Entanglement Criteria Based on Quantum Fisher Information [0.0] 局所正規直交可観測(LOO)と対称情報完備正作用素値測度(SIC-POVM)の2つのクラスを考える。
SIC-POVMはエンタングルメント検出においてLOOよりも優れており、量子情報処理におけるSIC-POVMの一般的な優位性を示唆している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:41:52 GMT)
Speed-accuracy trade-off for the diffusion models: Wisdom from nonequilibrium thermodynamics and optimal transport [0.0] 拡散モデルと呼ばれる生成モデルとフォッカー・プランク方程式の非平衡熱力学の関連について論じる。
拡散モデルにおけるデータ生成の速度と精度のトレードオフ関係である拡散モデルの速度-精度トレードオフを導出する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:19:24 GMT)
Sparks of Quantum Advantage and Rapid Retraining in Machine Learning [0.0] 我々はAdiabatic quantum computer を利用してKolmogorov-Arnold Networks を最適化する。
トレーニングサンプルの数とは無関係に、固定サイズのソリューションスペースを作成します。
私たちのアプローチは、古典よりも速いトレーニング時間を通じて、量子的優位性を生み出します。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:55:44 GMT)
Self-Ordering, Cooling and Lasing in an Ensemble of Clock Atoms [0.0] アクティブ原子時計は、典型的なフィードバックベースの光学原子時計よりも短期的な安定性と熱ゆらぎに対する堅牢性を提供すると予測されている。
光共振器内のクロック原子の逆駆動アンサンブルにおける空間自己組織化とキャビティからのコヒーレント発光について検討した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:54:03 GMT)
Secure quantum-enhanced measurements on a network of sensors [0.0] サードパーティーのセキュアな量子リモートセンシング(SQRS)プロトコルは、盗聴者に対するセキュリティを保証するリモートロケーションでの量子強調測定を可能にする。
このアイデアは、ひとつのパーティが絡み合った状態を使用して、異なるノードのパラメータの関数を直接測定できるノードのネットワークにまで拡張することができる。
ここでは,任意の大きさのネットワーク上で量子強度の測定精度とセキュリティを達成するために,絡み合った状態と分離可能な状態の両方を利用するハイブリッドプロトコルにおいて,この問題が克服可能であることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:40:41 GMT)
Retrieval Augmented Deep Anomaly Detection for Tabular Data [0.0] 研究は、このギャップに対処するために、検索強化モデルを導入した。
本稿では,変圧器モデルを用いてテクスチャ正規サンプルのマスク特徴を再構成する再構成手法を提案する。
31データセットのベンチマークでの実験では、この再構成に基づく異常検出手法をサンプルサンプル依存で拡張することで、検索モジュールによるパフォーマンスが大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:23:02 GMT)
Problems in AI, their roots in philosophy, and implications for science and society [0.0] AI技術とその利用の哲学的側面にもっと注意を払わなければならない。
この欠陥は一般的に、知識の成長に関する哲学的誤解と結びついていると論じられている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:38:54 GMT)
Perturbation theory for nonlinear Schrodinger equations [0.0] このパワー系列は、非線形項の強度を表すパラメータが閾値よりも絶対値が低いときに収束することが証明される。
これは非線形シュロディンガー方程式に対する定常解を与える。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:40:59 GMT)
Optimization of breeding program design through stochastic simulation with evolutionary algorithms [0.0] 本研究では,カーネルレグレッションの概念に基づく最適化フレームワークを提案する。
鍵となる考え方は、育種プログラムの潜在的なパラメータ化のセットを検討し、シミュレーションに基づいてそれらの性能を評価し、これらの出力を使用して新しいパラメータ化を導出することである。
進化的アルゴリズムはSnakemakeパイプラインで実装され、大規模分散コンピューティングプラットフォームでの効率的なスケーリングを可能にした。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:10:20 GMT)
Optimization complexity and resource minimization of emitter-based photonic graph state generation protocols [0.0] フォトニックグラフ状態は、測定と融合に基づく量子コンピューティング、量子ネットワーク、センシングに重要である。
我々は局所的にエンタングゲートの数を最小化し、中程度の大きさのランダムグラフに対する単純スキームと比較して75$%まで削減する。
任意の大きさのリピータグラフ状態の未符号化および符号化を行うために最適なエミッションオーダと回路が見つかる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:29:52 GMT)
Optimal Layout Synthesis for Deep Quantum Circuits on NISQ Processors with 100+ Qubits [0.0] スケーラブルなレイアウト合成は、NISQプロセッサにとって非常に重要である。
本稿では,1つのSWAPとCNOTのグループを各ステップで適用する並列計画に基づくSAT符号化を提案する。
初めて、8, 14, 16量子ビット回路を最大17個のSWAPを持つ54, 80, 127量子ビットプラットフォームに最適にマッピングできる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:00:02 GMT)
On Strong Bounds for Trotter and Zeno Product Formulas with Bosonic Applications [0.0] バナッハ空間上の強作用素位相において量的境界が証明できる仮定について議論する。
我々は、オルンシュタイン・ウレンベック半群や多光子駆動散逸を含む自然ボソニックな例を提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:07:51 GMT)
Non-relativistic tachyons: a new representation of the Galilei group [0.0] 我々はガリレイ群の一貫した非標準表現に到達する。
対応する量子(および古典)理論は、その基本となる相対論的理論と共通している。
新しい表現によって記述されるタキオンオブジェクトは、標準的な意味ではローカライズできない。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:26:40 GMT)
Non-Hermitian Origin of Wannier Localizability and Detachable Topological Boundary States [0.0] 非エルミート境界状態を分離可能な位相境界状態とみなす。
固有非エルミート位相が必然性スペクトルフローをもたらすことを示す。
この接続と$K$-理論に基づいて、ワニエローカライザビリティと分離可能な位相境界状態の分類を完成させる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:25:40 GMT)
Multiparty Spohn's theorem for a combination of local Markovian and non-Markovian quantum dynamics [0.0] 我々はマルコフ熱浴と非マルコフ熱浴の組み合わせに局所的に連結された2つ以上の量子系に対するゴリーニ・コサコフスキー・スダルシャン・リンドブラッドのようなマスター方程式を得る。
マルコフ熱浴と非マルコフ熱浴を混合した複数の量子系を包含するように拡張する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 21:28:54 GMT)
Modelling brain connectomes networks: Solv is a worthy competitor to hyperbolic geometry! [0.0] 我々は、Euclidean、Spherical、Hyperbolic、Solv、Nil、および製品ジオメトリにコネクトームを埋め込むことができるSimulating Annealingに基づく埋め込みアルゴリズムを提案する。
以上の結果から,3次元双曲型埋め込みは多くの場合,最良の結果をもたらすが,Solv埋め込みは合理的に機能することが示唆された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 22:36:04 GMT)
Meta-Learning and representation learner: A short theoretical note [0.0] メタ学習は機械学習のサブフィールドであり、目標は様々なタスクから学習できるモデルとアルゴリズムを開発することである。
特定のタスクを学習することに焦点を当てた従来の機械学習手法とは異なり、メタラーニングは、過去のタスクからの経験を活用して将来の学習を強化することを目的としている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:45:22 GMT)
Memory in quantum processes with indefinite time direction and causal order [0.0] 時間方向と因果順序が不確定な量子過程における動的メモリ効果の出現について検討する。
量子時間反転も量子スイッチも、考慮された位相共変チャネルのメモリを誘導できないことを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:35:39 GMT)
Leveraging Large Language Models to Geolocate Linguistic Variations in Social Media Posts [0.0] 大きな言語モデル(LLM)を活用することで、イタリア語で書かれたツイートをジオローカライズするという課題に対処する。
我々のアプローチは、これらの地理的局在化の側面を同時に予測するために、訓練済みのLLMを微調整することである。
この研究は、バーティノロ国際スプリングスクール2024のLarge Language Modelsコースの一部として実施されている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:54:35 GMT)
Landauer principle and the second law in a relativistic communication scenario [0.0] ランダウアーの原理と熱力学の第二法則は相対論的コミュニケーションタスクに適用される。
我々は、ボブがそもそもその情報を得るために費やさなければならないエネルギーの限界を確立する。
この境界は時空計量と通信チャネルの性質の関数である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:56:35 GMT)
InLUT3D: Challenging real indoor dataset for point cloud analysis [0.0] 本稿では,屋内環境におけるシーン理解の分野を推し進めるための総合的なリソースであるInLUT3Dポイントクラウドデータセットを紹介する。
このデータセットは、高解像度レーザーベースの点雲と手動ラベリングを特徴とするロドス工科大学のW7学部ビル内の様々な空間をカバーしている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:56:31 GMT)
Improving probabilistic forecasts of extreme wind speeds by training statistical post-processing models with weighted scoring rules [0.0] 閾値重み付き連続ランク確率スコア(twCRPS)を用いたトレーニングは、後処理モデルの極端なイベント性能を向上させる。
極端事象の確率論的予測の性能が向上し,分布物体の予測性能が低下する分布体テールトレードオフが発見された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:07:52 GMT)
Impacts of Anthropomorphizing Large Language Models in Learning Environments [0.0] 大きな言語モデル(LLM)は、学習環境において、学習仲間として、あるいは家庭教師として、教育をサポートするために、ますます使われている。
本研究の目的は,学習環境におけるLLMの人為的形態化が教育理論に与える影響について考察することである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:28:54 GMT)
Image Synthesis with Graph Conditioning: CLIP-Guided Diffusion Models for Scene Graphs [0.0] シーングラフから画像を生成する新しい手法を提案する。
トレーニング済みのテキスト・ツー・イメージ拡散モデルとCLIPガイダンスを利用して、グラフ知識を画像に変換する。
実験により,本手法は標準ベンチマークにおける既存手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 07:38:19 GMT)
ILiAD: An Interactive Corpus for Linguistic Annotated Data from Twitter Posts [0.0] 英語のTwitter投稿から言語コーパスの開発と展開について述べる。
主な目標は、言語分析のための完全な注釈付き英語コーパスを作ることであった。
形態や構文に関する情報に加えて,トークン化やレムマ,n-gramなどのNLP機能も含んでいます。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:48:04 GMT)
High-Fidelity Electron Spin Gates in a Scalable Diamond Quantum Register [0.0] 我々は、ダイヤモンド中のNVスピン間の絡み合いゲートを堅牢で容易に実装する。
環境条件下では,F=(96.0 pm 2.5)=%のレコードゲート忠実度を示す。
我々の支配的誤差の同定は、誤差補正しきい値を超えたNV-NVゲートへの道を開く。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:47:33 GMT)
Ground state of a mixture of SU($3$) fermions and scalar bosons [0.0] 一次元のスカラーボソンとSU($3$)フェルミオンからなる系を探索する。
局所的な種内相互作用と種間相互作用のみを考慮すると、この系はボース・フェルミ・ハバード・ハミルトンによって記述される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:00:02 GMT)
Fast computation of 2-isogenies in dimension 4 and cryptographic applications [0.0] 次元 $ggeq 1$ のアーベル多様体とレベル $n=2$ のtheta-coordinates の間の 2$-isogenies の連鎖を計算するアルゴリズムを提案する。
開始曲線の自己準同型環が、ラップトップ上で数秒以内に未知である場合には、SIDHに対して完全なキーリカバリ攻撃を実行することができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:19:20 GMT)
Fast and Effective Weight Update for Pruned Large Language Models [0.0] 大きな言語モデル(LLMs)のプルーニングは、その巨大なサイズのため、難しい作業である。
最近のアプローチでは、微調整を完全に無視するか、レイヤワイド更新を試みた。
乗算器の交互方向法に基づく切削層に対する高速かつ効率的な重み更新アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:34:04 GMT)
FAIR evaluation of ten widely used chemical datasets: Lessons learned and recommendations [0.0] この文書は、北米とヨーロッパ(EU)市場で見つかった(有害な)物質に関するデータを拡散するデータベースに焦点を当てている。
目標は、これらの物質に関する公開データのFAIRnessを分析することである。
手動と自動の2つの補完的なアプローチを実装している。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:26:41 GMT)
Extracting Structured Insights from Financial News: An Augmented LLM Driven Approach [0.0] 本稿では,Large Language Models(LLMs)を活用した財務情報処理手法を提案する。
本稿では,関連企業チッカーを生のニュース記事コンテンツから抽出し,企業レベルで感情分析を行い,要約を生成するシステムを提案する。
当社は、ニュース記事から詳細な企業ごとの感情分析を提供し、市場参加者に利用可能な情報の深みを高めた最初のデータ提供者です。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:47:31 GMT)
Extensive Long-Range Entanglement at Finite Temperatures from a Nonequilibrium Bias [0.0] 一般電荷およびエネルギー保存不純物を含む一次元格子上の自由フェルミオンの絡み合い特性について検討する。
これらの測定値は,各サブシステム間の重なり合いと,他方のミラー画像との重なり合いによって線形にスケールすることを示す。
負性率とR'enyi版の相互情報の単純な比例関係は、0温度で保持することが観察されるが、有限温度で分解される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 19:31:17 GMT)
Estimating Probability Densities with Transformer and Denoising Diffusion [0.0] 本研究では,トランスフォーマー上の拡散ヘッドを用いた確率モデルのトレーニングにより,確率密度の推定が妥当であることを示す。
当社のTransformer+Denoising Diffusionモデルについて、天文学的な観測と、銀河内の恒星のラベル測定の大規模なデータセットでトレーニングすることで説明します。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:10:41 GMT)
Entanglement in quenched extended Su-Schrieffer-Heeger model with anomalous dynamical quantum phase transitions [0.0] 焼成拡大Su-Schrieffer-Heeger(SSH)モデルにおける動的量子相転移(DQPT)について検討した。
臨界モータの数が前焼成相と後焼成相の巻成数差を超える異常DQPTが観察される。
平衡モデルの位相を2つのクラスに分類し、この2つのクラス内および横断的なクエンチを含む絡み合いの時間的進化の特徴的な特徴を同定した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 02:35:34 GMT)
Entanglement Generation and Stabilization by Coherent Collisions [0.0] 反復電子による繰り返し衝突は、2つのリモートスピン量子ビットを絡み合った状態に散逸的に駆動することができる。
どちらのクビットとのコヒーレントスピン交換は絡み合いの発生を促進する。
我々のモデルは単一電子源を用いて実験的に実装できる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:12:28 GMT)
Enhancing Mass Customization Manufacturing: Multiobjective Metaheuristic Algorithms for flow shop Production in Smart Industry [0.0] 本研究は,工場生産計画における必要な適応に焦点を当てたものである。
フローホップに対処するための効率的な進化的アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:13:23 GMT)
Early Recognition of Parkinson's Disease Through Acoustic Analysis and Machine Learning [0.0] パーキンソン病(英: Parkinson's Disease、PD)は、音声を含む運動機能と非運動機能の両方に大きな影響を及ぼす進行性神経変性疾患である。
本稿では,音声データを用いたPD認識手法の総合的なレビューを行い,機械学習とデータ駆動アプローチの進歩を強調した。
ロジスティック回帰、SVM、ニューラルネットワークなど、さまざまな分類アルゴリズムが検討されている。
以上の結果から,特定の音響特性と高度な機械学習技術は,PDと健常者の間で効果的に区別できることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 23:24:02 GMT)
Dynamics of Ideological Biases of Social Media Users [0.0] オンラインプラットフォーム全体の世論グループの進化は,世論を抱きたいという欲求に支えられていることを示す。
われわれはTwitterとParlerという2つのソーシャルメディアに焦点を当て、ユーザーの政治的偏見を追跡した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 16:08:22 GMT)
Dressed to Gamble: How Poker Drives the Dynamics of Wearables and Visits on Decentraland's Social Virtual World [0.0] Decentralandはブロックチェーンベースのソーシャルバーチャルワールドで、コミュニティが所有するクリエイティブなスペースだと言われている。
ユーザーは、アバターをカスタマイズするためのウェアラブル、仮想衣料品を作成して公開することができる。
Decentral Games(DG)は、世界で有名なカジノを2つ所有する単一のプロジェクトだが、これまでで最大のウェアラブル製品だ。
そこで本研究では,DGとICEポーカーが分散ウェアラブルの全体的ダイナミクスや世界訪問にどのように影響するかを総合的に調査する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:37:53 GMT)
Dirac Theory as a Relativistic Flow [0.0] 電荷ポテンシャル流の流体力学ラグランジアンからシュル・オーディンガー方程式を導出する方法を示す。
量子的振る舞いは、古典ラグランジアンに追加されたフィッシャー情報項に由来する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 12:38:21 GMT)
Development of Multistage Machine Learning Classifier using Decision Trees and Boosting Algorithms over Darknet Network Traffic [0.0] 本研究では,ネットワークトラフィック分類のためのロバストな解を提案する。
AdaBoostやGradient Boostingといったブースティングアルゴリズムを決定木と組み合わせることで,ネットワークトラフィック分類のための堅牢なソリューションを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:10:26 GMT)
Container Morphisms for Composable Interactive Systems [0.0] 私は依存型を使ってリクエスト/レスポンスが一致することを保証し、このアイデアがコンテナのより広いコンテキストとそれらの射にどのように適合するかを示しています。
コンテナのカテゴリとそのモノノイド製品を使って、関数型プログラミングを模倣するコンテナ上のモナドを定義し、Kleeneスターを使って、同じシステムでステートフルなプロトコルを記述します。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 23:42:43 GMT)
Concurrent VQE for Simulating Excited States of the Schwinger Model [0.0] 本研究では, 同時変動量子固有解法(cVQE)のシュウィンガーモデルの励起状態の計算への応用について検討する。
本研究は,1,2,3個のアシラリー量子ビットを持つ最小2,4,8個の固有状態を,背景電界の消滅と消滅の両方のために効率的に取得する方法を示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 13:42:02 GMT)
Comprehensive Study on Performance Evaluation and Optimization of Model Compression: Bridging Traditional Deep Learning and Large Language Models [0.0] 世界中のコネクテッドデバイスの数の増加は、計算能力の低いローカルデバイスに容易に展開できる圧縮モデルを保証する。
画像分類,オブジェクト検出,言語モデル,生成モデルに基づく問題文に使用される一般的なディープラーニングモデルに対して,量子化とプルーニングの両方を実装した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:20:53 GMT)
Comprehensive Overview of Reward Engineering and Shaping in Advancing Reinforcement Learning Applications [0.0] 本稿では,強化学習アルゴリズムの効率性と有効性を高めるために,報酬工学と報酬形成の重要性を強調する。
強化学習の大幅な進歩にもかかわらず、いくつかの制限が続いた。
主要な課題の1つは、多くの現実世界のシナリオにおける報酬のまばらで遅れた性質である。
実世界の環境を正確にモデル化することの複雑さと強化学習アルゴリズムの計算要求は、依然としてかなりの障害である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:28:12 GMT)
Comparing Algorithms for Loading Classical Datasets into Quantum Memory [0.0] 古典的データセットを量子メモリにロードするアルゴリズムを比較した。
5つの属性に基づく状態準備アルゴリズムの評価を行った。
また、視覚的に3つの指標(回路深度、キュービット数、古典ランタイム)を比較する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:43:18 GMT)
Clustering of conditional mutual information and quantum Markov structure at arbitrary temperatures [0.0] 最近の研究では、単純な二部相関関数によって特徴づけられるエキゾチックな量子相が明らかにされている。
これらの相では、三部構造相関から生じる長距離の絡み合いが中心的な役割を果たす。
また, 低温でも, 広範囲に分布する三部体の絡み合いは, 長距離体制では生じないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:20:47 GMT)
Closed-form expressions for smeared bi-distributions of a massless scalar field: non-perturbative and asymptotic results in relativistic quantum information [0.0] 時空領域の量子場と相互作用する局所量子系について検討する。
ガウス時空領域で相互作用するプローブによって得られる絡み合いを見つける。
2つの隙間のない検出器の場合を再検討し、相互作用領域間に2つのスミアドウェイ信号が存在する場合、検出器が絡み合うことができることを示す。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:09:22 GMT)
Classification and reconstruction for single-pixel imaging with classical and quantum neural networks [0.0] 本研究では,ハダマール基底パターンを用いた1画素イメージング実験を行った。
これらの測定値に基づいて画像の分類と再構成を行うアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 09:56:07 GMT)
Capacity of entanglement and volume law [0.0] 絡み合いの容量 エントロピーが広範囲になる 一定の設定では 容積法に従う
我々は,この量の体積法スケーリングに関する解析的および数値的な証拠を,異なる設定で提示する。
本研究は,モデルに対する一貫したホログラフィック双対の存在について,本研究の結果のいくつかの意味について論じる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:10:06 GMT)
Automated Road Safety: Enhancing Sign and Surface Damage Detection with AI [0.0] 近年のAIの進歩により,道路面や道路標識の異常を検知できる高度監視システムの開発が可能となった。
本稿では,高度深層学習技術を用いた交通標識と道路表面損傷の検出・分類による道路安全向上のための革新的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 06:22:36 GMT)
An Exponential Mixing Condition for Quantum Channels [0.0] 量子チャネルのマルコフ・ドブルシン定数がゼロを超えると指数混合挙動を示すことが証明される。
また、ユニタリ作用素の有限群に付随する混合ユニタリチャネル群のエルゴード性も解析する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 20:18:44 GMT)
An Experimental Study on the Rashomon Effect of Balancing Methods in Imbalanced Classification [0.0] 本稿では,ラショモン効果を用いた予測多重度に及ぼすバランス法の影響について検討する。
データ中心のAIにおける盲点モデル選択は、ほぼ同じ精度のモデルのセットからリスクが高いため、非常に重要です。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:25:39 GMT)
An Ad-hoc graph node vector embedding algorithm for general knowledge graphs using Kinetica-Graph [0.0] 本稿では,知識グラフ表現から一般的なグラフノードの埋め込みを生成する方法について論じる。
埋め込み空間は、局所親和性とリモート構造関連性の両方を模倣するいくつかのサブ機能から構成される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:43:10 GMT)
Algebraic quantum field theory: objectives, methods, and results [0.0] 代数量子場理論は相対論的量子物理学の一般的な数学的枠組みである。
その枠組みでは、粒子の任意の配置上の真空から熱平衡状態や非平衡状態まで、理論の全体状態空間がカバーされている。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 11:27:35 GMT)
Affordance Labeling and Exploration: A Manifold-Based Approach [0.0] 本研究は,対象分類データセットに基づいて訓練された既存ネットワークを用いて,対象物価の探索に焦点をあてる。
訓練済みのネットワークを使用して、特別な層を必要とせず、手頃なラベルを識別する。
サブスペースクラスタリングおよび多様体曲率法は、アベイランスラベルの認識において明確な視点を提供するために試験される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 08:46:20 GMT)
Adaptive Extensions of Unbiased Risk Estimators for Unsupervised Magnetic Resonance Image Denoising [0.0] ディープニューラルネットワーク(DNN)のイメージデノナイジングへの応用は、従来のデノナイジング手法に挑戦している。
本稿では,ガウスノイズとポアソンノイズの関連したMRIデータに対して,これらの手法を包括的に評価する。
我々の主な貢献は、SURE、eSURE、特に医療画像のためのePUREフレームワークの効果的適応と実装である。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:04:21 GMT)
AI for Handball: predicting and explaining the 2024 Olympic Games tournament with Deep Learning and Large Language Models [0.0] 深層学習モデルを用いて,2024年オリンピックのハンドボールトーナメントの結果を予測する。
このモデルは、説明可能なAI(xAI)技術と組み合わせて、各マッチの結果に影響を及ぼす主要な要因に関する洞察力のある情報を抽出することができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 18:54:06 GMT)
A spatiotemporal deep learning framework for prediction of crack dynamics in heterogeneous solids: efficient mapping of concrete microstructures to its fracture properties [0.0] 深層学習フレームワークは, コンクリートメソ構造中のフラクチャーの2次元フルフィールド予測を行うことができる。
メソ構造の平均応力-ひずみ曲線を予測できる畳み込みニューラルネットワークを開発した。
UNetモデリングフレームワークは、スキップ接続を持つエンコーダ-デコーダセクションで構成され、ディープラーニングサロゲートモデルとして使用される。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 14:28:46 GMT)
A simple and fast C++ thread pool implementation capable of running task graphs [0.0] 筆者らは,タスクグラフの実行が可能な,シンプルで高速なC++スレッドプールの実装を提案する。
実装はGitHubで公開されており、https://github.com/dpuyda/scheduling.comを参照してほしい。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:18:26 GMT)
A novel translationally invariant supersymmetric chain with inverse-square interactions: partition function, thermodynamics and criticality [0.0] 我々は、ルート系に直接関連しない長距離相互作用を持つ翻訳不変su$(m|n)$スピン鎖の新しい族を導入する。
我々はこれらのモデルの対称性を研究し、この種のシステムのボソン-フェルミオン双対性特性の存在を確立した。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:25:57 GMT)
A frame-bundle formulation of quantum reference frames: from superposition of perspectives to superposition of geometries [0.0] 我々は、量子参照フレーム(QRF)のコアアイデアの完全な幾何学的定式化を可能にする。
QRFは、各時空点における観測者の時間と空間に対する認識について不確実性を符号化する。
QRFは局所的に、セクション全体ではなくイベントのベースに振幅をもたらすことができる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:21:38 GMT)
A backgate for enhanced tunability of holes in planar germanium [0.0] 平面半導体ヘテロ構造は多用途デバイス設計を提供し、スケーラブルな量子コンピューティングの候補として有望である。
平面系は、閉じ込めポテンシャルの形状が密度に直接関係しているという事実によって依然として制限されている。
平面ゲルマニウムヘテロ構造に対するバックゲートの実装を成功させる。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 15:29:17 GMT)
A Network Analysis Approach to Conlang Research Literature [0.0] 本稿では,コンラング研究に関する文献を総合的に理解することを目的としている。
1927年から2022年までの2300以上の学術出版物を分析したところ、エスペラントは最も文書化されたコンラングであることがわかった。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 04:40:45 GMT)
A Nanomechanical Atomic Force Qubit [0.0] 原子間力を用いたシリコンナノメカニカル量子ビットの実現について提案する。
提案したqubitは60MHzで動作し、シングルフォノンレベルのアンハーモニシティは5MHzである。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 05:30:44 GMT)
A Mechanism for Optimizing Media Recommender Systems [0.0] メディアソースがコスト関数におけるオーバーリーチの影響を考慮すると、最適な解決策が得られます。
各消費者に最適な分布を生成するための実用的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 22 Jul 2024 17:20:14 GMT)