Image-Guided Outdoor LiDAR Perception Quality Assessment for Autonomous Driving [107.7] 本研究では,屋外自動運転環境を対象とした画像誘導点雲質評価アルゴリズムを提案する。
IGO-PQA生成アルゴリズムは、単一フレームのLiDARベースのポイントクラウドに対して、全体的な品質スコアを生成する。
第2のコンポーネントは、非参照アウトドアポイントクラウド品質評価のためのトランスフォーマーベースのIGO-PQA回帰アルゴリズムである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:16:14 GMT)
LLMs Assist NLP Researchers: Critique Paper (Meta-)Reviewing [106.5] 大規模言語モデル(LLM)は、様々な生成タスクにおいて顕著な汎用性を示している。
本研究は,NLP研究者を支援するLLMの話題に焦点を当てる。
私たちの知る限りでは、このような包括的な分析を提供するのはこれが初めてです。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:04:38 GMT)
Contextual Dynamic Pricing with Strategic Buyers [94.0] 戦略的買い手によるコンテキスト動的価格問題について検討する。
売り手は買い手の真の特徴を観察せず、買い手の戦略行動に応じて操作された特徴を観察する。
本稿では,販売者の累積収益を最大化するために,購入者の戦略的行動をオンライン学習に取り入れた戦略的動的価格政策を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:25:54 GMT)
AI Risk Categorization Decoded (AIR 2024): From Government Regulations to Corporate Policies [88.3] 我々は4階層の分類に分類された314のユニークなリスクカテゴリを特定した。
最高レベルでは、この分類はシステム・アンド・オペレーショナル・リスク、コンテンツ・セーフティ・リスク、社会的なリスク、法と権利のリスクを含む。
我々は、セクター間の情報共有と、生成型AIモデルとシステムのリスク軽減におけるベストプラクティスの推進を通じて、AIの安全性を向上することを目指している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:13:05 GMT)
From Distributional to Overton Pluralism: Investigating Large Language Model Alignment [83.0] 適応後の応答多様性の低下を以前報告した再検査を行った。
分析の結果,応答の多様性の明らかな低下は,品質管理と情報集約によって大きく説明できることがわかった。
発見は、現在のアライメント技術はキャプチャーされるが、アシスタントライクなベースLLM動作の有用なサブセットを拡張するものではないことを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:32:33 GMT)
AAformer: Auto-Aligned Transformer for Person Re-Identification [82.5] トランスアーキテクチャにおけるアライメント方式を初めて導入する。
本研究では,人体と非人体の両方をパッチレベルで自動的に検出する自動整列トランス (AAformer) を提案する。
AAformerは、部分アライメントを自己アテンションに統合し、出力[PART]を直接検索する機能として使用することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:08:21 GMT)
Not All Preference Pairs Are Created Equal: A Recipe for Annotation-Efficient Iterative Preference Learning [81.7] 反復的な選好学習には、オンラインの注釈付き選好ラベルが必要である。
コスト効率のよいアノテーションに対する応答対を選択するための戦略について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:49:16 GMT)
MaPa: Text-driven Photorealistic Material Painting for 3D Shapes [80.7] 本稿では,テキスト記述から3次元メッシュの材料を作成することを目的とする。
テクスチャマップを合成する既存の方法とは異なり、我々はセグメントワイドな手続き的な材料グラフを生成することを提案する。
我々のフレームワークは高品質なレンダリングをサポートし、編集にかなりの柔軟性を提供します。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:44:52 GMT)
Large Multimodal Model Compression via Efficient Pruning and Distillation at AntGroup [79.0] 本稿では,当社独自のLLMであるAntGMMに対して,新しいマルチステージ圧縮戦略を提案する。
当社のアプローチはレイテンシを大幅に削減し,700msから90msに削減した。
圧縮モデルでは,AntGMMの直接配置と比較して,年間約7500万kWhの電力消費量削減が期待できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:53:28 GMT)
Following Length Constraints in Instructions [76.9] 所望の長さ制約を含む命令を用いて,推論時に制御可能なモデルをトレーニングする方法を示す。
このようなモデルは、GPT4、Llama 3、Mixtralといった標準命令よりも優れている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:29:52 GMT)
Unlocking Anticipatory Text Generation: A Constrained Approach for Large Language Models Decoding [75.1] 大規模言語モデル(LLM)は、テキスト生成の強力な能力を示している。
毒性や幻覚などの望ましくない行動が現れることがある。
将来制約付き生成問題としてテキスト生成の形式化を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:01:24 GMT)
Controlling Moments with Kernel Stein Discrepancies [74.8] Kernel Steindisrepancies (KSD) は分布近似の品質を測定する。
まず、弱収束制御に使用される標準KSDがモーメント収束制御に失敗することを示す。
次に、代替拡散KSDがモーメントと弱収束の両方を制御できる十分な条件を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:16:17 GMT)
Efficient Document Ranking with Learnable Late Interactions [73.4] クロスエンコーダ(CE)とデュアルエンコーダ(DE)モデルは,情報検索におけるクエリドキュメント関連性の2つの基本的なアプローチである。
関連性を予測するため、CEモデルは共同クエリドキュメントの埋め込みを使用し、DEモデルは分解クエリとドキュメントの埋め込みを維持している。
近年、DEM構造と軽量スコアラを用いて、より好ましいレイテンシ品質のトレードオフを実現するために、遅延相互作用モデルが提案されている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:50:48 GMT)
Mind the Graph When Balancing Data for Fairness or Robustness [73.0] データバランシングのためのトレーニングディストリビューションの条件を定義し、公正またはロバストなモデルに導く。
その結果、多くの場合、バランスの取れた分布は、望ましくない依存関係を選択的に除去することには対応しないことがわかった。
その結果,データバランシングを行う前に因果グラフを考慮に入れることの重要性を強調した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:16:19 GMT)
Representation Surgery: Theory and Practice of Affine Steering [72.6] 言語モデルは、しばしば好ましくない振る舞いを示す。
モデルが望ましくない振る舞いを示すのを防ぐための自然な(そして一般的な)アプローチの1つは、モデルの表現を操ることである。
本稿では, ステアリング機能の形式的および経験的特性について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:00:08 GMT)
Superposed Decoding: Multiple Generations from a Single Autoregressive Inference Pass [72.1] Superposed Decodingは、1つの自己回帰推論パスのコストで$k$のドラフトを生成する新しい復号アルゴリズムである。
我々の実験によると、Superposed Decodingの$k$ドラフトは、少なくとも一貫性があり、現実的である。
Nucleus Smpling と Greedy Decoding はそれぞれ。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:49:45 GMT)
Distributed Training of Large Graph Neural Networks with Variable Communication Rates [71.7] 大きなグラフ上でグラフニューラルネットワーク(GNN)をトレーニングすることは、大きなメモリとコンピューティング要件のために、ユニークな課題を提示する。
グラフを複数のマシンに分割する分散GNNトレーニングは、大きなグラフ上でGNNをトレーニングするための一般的なアプローチである。
本稿では,学習モデルの精度を損なうことなく,分散GNNトレーニングにおける通信量を削減するための可変圧縮方式を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:57:38 GMT)
Leave No Document Behind: Benchmarking Long-Context LLMs with Extended Multi-Doc QA [71.0] 長いコンテキストモデリング能力は広く注目を集めており、超コンテキストウィンドウを持つLarge Language Models (LLMs) の出現につながっている。
拡張多文書質問応答(QA)によって現実的なシナリオに整合する新しい長文ベンチマークであるLoongを提案する。
Loong氏は、Spotlight Locating, Comparison, Clustering, Chain of Reasoningという、コンテキスト長の4つのタスクを紹介している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:42:56 GMT)
DARG: Dynamic Evaluation of Large Language Models via Adaptive Reasoning Graph [70.8] 本稿では,適応推論グラフ展開(DARG)によるLCMの動的評価を導入し,複雑性と多様性を制御した現在のベンチマークを動的に拡張する。
具体的には、まず現在のベンチマークでデータポイントの推論グラフを抽出し、それから推論グラフを摂動させて新しいテストデータを生成する。
このような新しく生成されたテストサンプルは、元のベンチマークと同様の言語的多様性を維持しながら、複雑さのレベルが異なる可能性がある。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:27:53 GMT)
Joint Admission Control and Resource Allocation of Virtual Network Embedding via Hierarchical Deep Reinforcement Learning [69.0] 本稿では,仮想ネットワークの埋め込みにおいて,入出力制御と資源配分を併用して学習する深層強化学習手法を提案する。
HRL-ACRAは,受入率と長期平均収益の両面で,最先端のベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:42:30 GMT)
A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.5] State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。
軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。
本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:45:00 GMT)
Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.5] クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:49:35 GMT)
A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models [65.4] 本研究は,textbfDistribution-textbf Preserving (DiP)ウォーターマークの重要性に焦点をあてる。
現在の戦略とは対照的に,提案したDiPmarkは透かし中に元のトークン分布を同時に保存する。
言語モデルAPIにアクセスせずに検出可能で(アクセス可能)、トークンの適度な変更に対して確実に堅牢である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:08:17 GMT)
Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.2] Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。
1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。
これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:20:44 GMT)
LaTable: Towards Large Tabular Models [64.0] タブラル生成基盤モデルは、異なるデータセットの不均一な特徴空間のために構築が困難である。
LaTableは、これらの課題に対処し、異なるデータセットでトレーニング可能な、新しい拡散モデルである。
LaTableは、分散生成のベースラインよりも優れており、微調整されたLaTableは、より少ないサンプルで分散データセットをより良く生成できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:03:50 GMT)
Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models [62.8] 我々は、LLaVA-1.5ベースのMathV360Kで微調整されたモデルであるMath-LLaVAを紹介する。
この手法はLLaVA-1.5のマルチモーダル数学的推論能力を著しく改善する。
Math-LLaVAは、MMMUベンチマークで大幅に改善された一般化性を示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:43:21 GMT)
Director3D: Real-world Camera Trajectory and 3D Scene Generation from Text [62.0] 実世界の3Dシーンと適応カメラトラジェクトリの両方を生成するように設計された,堅牢なオープンワールドテキスト・ツー・3D生成フレームワークであるDirector3Dを紹介する。
Director3Dは既存の手法よりも優れており、実世界の3D生成において優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:42:51 GMT)
High-Dimension Human Value Representation in Large Language Models [60.3] 大規模言語モデル(LLM)における人的価値分布の高次元表現であるUniVaRを提案する。
我々は,UniVaRが,異なるLLMに埋め込まれた人間の値と異なる言語源との分布を比較する強力なツールであることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:23:00 GMT)
LLMs Are Few-Shot In-Context Low-Resource Language Learners [59.7] In-context Learning (ICL) は、大規模言語モデル(LLM)に、表現不足の言語で多様なタスクを実行する権限を与える。
ICLとその言語間変動(X-ICL)を25の低リソース言語と7の比較的高リソース言語で検討した。
本研究は,LLMの低リソース理解品質向上における文脈内情報の重要性を論じる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:54:23 GMT)
Video Occupancy Models [59.2] Video Occupancy Model (VOC) は、コンパクトな潜在空間で動作する。
従来の潜在空間世界モデルとは異なり、VOCは1ステップで将来の状態の割引分布を直接予測する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:57:38 GMT)
MT-Bench-101: A Fine-Grained Benchmark for Evaluating Large Language Models in Multi-Turn Dialogues [58.3] MT-Bench-101は,マルチターン対話におけるLarge Language Models (LLMs) の細粒度化能力を評価するために設計された。
1388のタスクで4208のターンが1388のマルチターン対話にまたがる3階層の階層的能力分類を構築した。
次に,MT-Bench-101に基づく21のLLMを評価し,能力とタスクの観点から総合的な分析を行った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:38:41 GMT)
SyncNoise: Geometrically Consistent Noise Prediction for Text-based 3D Scene Editing [58.2] 高忠実度3Dシーン編集のための新しい幾何誘導型マルチビュー一貫したノイズ編集手法SyncNoiseを提案する。
SyncNoiseは2次元拡散モデルで複数のビューを同期的に編集し、幾何的に一貫した多視点ノイズ予測を行う。
本手法は,特に複雑なテクスチャを持つシーンにおいて,テキストの指示に配慮した高品質な3D編集結果を実現する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:17:35 GMT)
CaLMQA: Exploring culturally specific long-form question answering across 23 languages [58.2] CaLMQAは23の言語にまたがる2.6Kの複雑な質問の集合である。
私たちのデータセットには、コミュニティWebフォーラムから自然に収集された質問と、ネイティブスピーカーによって書かれた質問の両方が含まれています。
我々は,新しいメトリクス CaLMScore を用いて,オープンソースモデルとクローズドソースモデル間の自動評価を行う。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:45:26 GMT)
SpeechX: Neural Codec Language Model as a Versatile Speech Transformer [57.8] SpeechX は、ゼロショット TTS と様々な音声変換タスクが可能な汎用音声生成モデルである。
実験結果から, ゼロショットTS, ノイズ抑制, ターゲット話者抽出, 音声除去, 背景雑音の有無による音声編集など, 各種タスクにおけるSpeechXの有効性が示された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:38:28 GMT)
Quantifying AI Psychology: A Psychometrics Benchmark for Large Language Models [57.5] 大きな言語モデル(LLM)は例外的なタスク解決能力を示しており、人間に似た役割を担っている。
本稿では,LLMにおける心理学的次元を調査するための枠組みとして,心理学的識別,評価データセットのキュレーション,結果検証による評価について述べる。
本研究では,個性,価値観,感情,心の理論,モチベーション,知性の6つの心理学的側面を網羅した総合的心理測定ベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:09:08 GMT)
Evaluating $n$-Gram Novelty of Language Models Using Rusty-DAWG [57.1] 本研究では,現代のLMがトレーニングデータから$n$-gramを生成できる範囲について検討する。
我々は,ゲノムデータのインデックス化にインスパイアされた新しい検索ツールであるRusty-DAWGを開発した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:02:40 GMT)
XCube: Large-Scale 3D Generative Modeling using Sparse Voxel Hierarchies [56.5] 任意の属性を持つ高分解能スパース3Dボクセルグリッドのための新しい生成モデルであるXCubeを提案する。
高精細度オブジェクトを生成することに加え、ユーザガイド編集、単一スキャンからのシーン補完、テキスト・トゥ・3Dといった様々なタスクを解くために、我々のモデルが利用できることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:01:54 GMT)
Embodied Question Answering via Multi-LLM Systems [55.6] EQA(Embodied Question Answering)は,ユーザの質問に答える環境を探索するエージェントが関与する重要な問題である。
本研究では,複数の大規模言語モデル(LLM)をベースとしたエージェントが家庭環境に関する質問に独立して答えるマルチエージェントフレームワークとして,EQAを考察する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:50:09 GMT)
Make Some Noise: Unlocking Language Model Parallel Inference Capability through Noisy Training [54.6] 大規模言語モデルの教師付き微調整段階の代替として,Make Some Noise (MSN) トレーニングフレームワークを提案する。
トレーニング方法は、単にモデルの入力にいくつかのノイズを導入して、認知タスクを学習する。
一般領域とコード領域の両方の実験では、MSNはモデル性能を損なうことなく2.3-2.7倍の速度で推論できることを示した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:25:39 GMT)
Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.2] 近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:08:29 GMT)
ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [54.0] 我々は、エンドツーエンドのクロスモーダル検索のための先駆的なジェネリッククロスモーダル rEtrieval framework (ACE) を提案する。
ACEは、クロスモーダル検索における最先端のパフォーマンスを達成し、Recall@1の強いベースラインを平均15.27%上回る。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:47:04 GMT)
MoE-CT: A Novel Approach For Large Language Models Training With Resistance To Catastrophic Forgetting [53.8] ベースモデルの学習を多言語拡張プロセスから分離する新しいMoE-CTアーキテクチャを提案する。
我々の設計では、元のLLMパラメータを凍結し、高リソース言語のパフォーマンスを保護しますが、様々な言語データセットに基づいてトレーニングされたMoEモジュールは、低リソース言語の習熟度を向上します。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:03:45 GMT)
Measuring quantum relative entropy with finite-size effect [53.6] 相対エントロピー$D(rho|sigma)$を$sigma$が知られているときに推定する。
我々の推定器は次元$d$が固定されたときにCram'er-Rao型境界に達する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:07:20 GMT)
Large Language Models are Interpretable Learners [53.6] 本稿では,Large Language Models(LLM)とシンボルプログラムの組み合わせによって,表現性と解釈可能性のギャップを埋めることができることを示す。
自然言語プロンプトを持つ事前訓練されたLLMは、生の入力を自然言語の概念に変換することができる解釈可能な膨大なモジュールセットを提供する。
LSPが学んだ知識は自然言語の記述と記号規則の組み合わせであり、人間(解釈可能)や他のLLMに容易に転送できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:18:15 GMT)
MLLM as Video Narrator: Mitigating Modality Imbalance in Video Moment Retrieval [53.4] Video Moment Retrieval (VMR) は、自然言語クエリが与えられた未トリミング長ビデオ内の特定の時間セグメントをローカライズすることを目的としている。
既存の方法は、しばしば不十分なトレーニングアノテーションに悩まされる。つまり、文は通常、単語の多様性が制限された前景の顕著なビデオ内容のごく一部と一致する。
この本質的なモダリティの不均衡は、視覚情報のかなりの部分がテキストと一致しないまま残されている。
本研究では,MLLMをビデオナレーターとして用いて,ビデオのテキスト記述を多用し,モダリティの不均衡を緩和し,時間的局所化を促進させる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:39:43 GMT)
Beyond Silence: Bias Analysis through Loss and Asymmetric Approach in Audio Anti-Spoofing [53.3] アンチスプーフィング検出研究の最近のトレンドは、目に見えない攻撃をまたいで一般化するモデルの能力を改善することを目指している。
近年の研究では、沈黙の分布は2つのクラスによって異なることが指摘されており、これはショートカットとして機能する。
損失分析と非対称手法を用いて、従来の攻撃に焦点を当てた結果指向の評価から遠ざかる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:24:12 GMT)
Text-to-Image Rectified Flow as Plug-and-Play Priors [52.6] 整流流は、ソースからターゲット分布への線形進行を強制する新しい生成モデルのクラスである。
補正フローアプローチが生成品質と効率を上回り,推論ステップを少なくすることを示した。
また,画像のインバージョンや編集における競合性能も示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:04:29 GMT)
Towards Probing Speech-Specific Risks in Large Multimodal Models: A Taxonomy, Benchmark, and Insights [50.9] 本研究は,8つのリスクカテゴリーを敵意(悪意的皮肉と脅し),悪意的模倣(年齢,性別,民族),ステレオタイプ的バイアス(年齢,性別,民族)を対象とする音声特異的リスク分類法を提案する。
分類に基づいて,これらのリスクのカテゴリを検出するために,現在のLMM能力を評価するための小規模データセットを作成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:08:45 GMT)
Automatically Adaptive Conformal Risk Control [50.0] 本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:29:32 GMT)
Improving Grammatical Error Correction via Contextual Data Augmentation [49.7] 本研究では,文脈拡張に基づく合成データ構築手法を提案する。
具体的には、ルールベースの置換とモデルベースの生成を組み合わせる。
また,合成データにおけるノイズラベルの効果を軽減するために,レザベリングに基づくデータクリーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:49:56 GMT)
Aligning Large Language Models by On-Policy Self-Judgment [49.3] 大規模言語モデルと人間の嗜好を整合させる既存のアプローチは、オンライン学習のために別々の報酬モデル(RM)を必要とするトレードオフに直面しています。
本稿では,オンライン学習を行う新たなアライメントフレームワークSELF-JUDGEを提案する。
また, さらなる評価を行なわずに, サンプリング自体がさらなる性能向上に寄与することを示した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:39:52 GMT)
Knowledge Crosswords: Geometric Knowledge Reasoning with Large Language Models [49.2] 構造化された事実制約に縛られた不完全な知識ネットワークからなるベンチマークである知識クロスワードを提案する。
幾何学的知識推論の新しい設定は、既存の原子/線形マルチホップQAを超える新しいLM能力を必要とする。
我々は,既存のLLMと知識クロスワードのアプローチを評価するために,広範囲な実験を行っている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:25:41 GMT)
MSRS: Training Multimodal Speech Recognition Models from Scratch with Sparse Mask Optimization [49.0] MSRSは、RS3ベンチマークで21.1%と0.9%のWERでVSRとAVSRの競争結果を達成し、トレーニング時間を少なくとも2倍に短縮した。
我々は、他のスパースアプローチを探索し、MSRSだけが、消失する勾配によって影響を受ける重量を暗黙的に隠蔽することで、スクラッチからトレーニングできることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:00:43 GMT)
FedBiOT: LLM Local Fine-tuning in Federated Learning without Full Model [48.3] 大規模言語モデル(LLM)は、適切なデータで微調整した後、多くのドメイン固有のタスクで素晴らしいパフォーマンスを示す。
多くのドメイン固有のデータは、プライベートに複数の所有者に分散される。
我々は,フェデレート学習のための資源効率の高いLLM微調整手法であるFedBiOTを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:45:47 GMT)
Tree-based variational inference for Poisson log-normal models [47.8] 階層木は、しばしば近接基準に基づいてエンティティを組織するために使用される。
現在のカウントデータモデルは、この構造化情報を利用していない。
本稿では,PLNモデルの拡張としてPLN-Treeモデルを導入し,階層的カウントデータをモデル化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:24:35 GMT)
Find Parent then Label Children: A Two-stage Taxonomy Completion Method with Pre-trained Language Model [46.0] 分類の完備化のために,ATTEMPTと呼ばれる2段階の手法を提案する。
親ノードを見つけて子ノードをラベル付けすることで,新しい概念を正しい位置に挿入する。
我々は、ハイパーニム/ハイポニミー認識のための事前訓練された言語モデルを利用する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:25:02 GMT)
Q-DiT: Accurate Post-Training Quantization for Diffusion Transformers [45.8] 後トレーニング量子化(PTQ)は、モデルサイズを圧縮し、事前トレーニングされたモデルの推論を高速化し、モデルの再トレーニングをなくし、有望なソリューションを提供する。
We have observed the existing PTQ framework designed for both ViT and conventional Diffusion model fall into biased Quantization and result result great performance degradation。
重みとアクティベーションの入力チャネル間の実質的な分散を管理するための微粒な量子化、量子化の粒度を最適化し冗長性を緩和する自動探索戦略、タイムステップ間でのアクティベーション変化を捉える動的アクティベーション量子化の3つの手法をシームレスに統合するQ-DiTを考案した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:57:27 GMT)
Burst Image Super-Resolution with Base Frame Selection [45.0] 非一様露光によるバーストショットを用いて現実の現実的なシナリオに直面することを検討する。
非一様シナリオに対するフレーム選択ネットワーク(FSN)を提案する。
このネットワークは、計算コストの低いプラグイン・アンド・プレイ方式で既存の超解像法にシームレスに統合される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:16:25 GMT)
Equivalence of dynamics of disordered quantum ensembles and semi-infinite lattices [45.0] 我々は、乱れた量子系の集合の正確なダイナミクスを半無限格子に沿って伝播する単一粒子のダイナミックスにマッピングするフォーマリズムを開発する。
この写像は、アンサンブルを平均化する際のコヒーレンスの損失に関する幾何学的解釈を提供し、単一のシミュレーションで混乱したアンサンブル全体の正確なダイナミクスの計算を可能にする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:13:38 GMT)
GLAD: Improving Latent Graph Generative Modeling with Simple Quantization [44.9] 本稿では,単純かつ効果的な離散潜在グラフ拡散生成モデルを提案する。
我々のモデル、すなわちGLADは、既存の潜伏アプローチの欠点を克服するだけでなく、グラフ空間に適用される拡散法に固有の問題を緩和する。
分子ベンチマークデータセット上で生成モデルを検証し、最先端のベースラインと比較して競合性能を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:01:57 GMT)
SynDARin: Synthesising Datasets for Automated Reasoning in Low-Resource Languages [44.9] 質問回答データセットは、コレクションと手動アノテーションのコストと難しさのため、英語以外の言語では不十分である。
低リソース言語向けQAデータセットの生成と検証を行う方法である$textbfS$yn$textbfDAR$inを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:48:41 GMT)
Domain Adaptation based Object Detection for Autonomous Driving in Foggy and Rainy Weather [44.7] ドメインギャップのため、晴れた天候下で訓練された検出モデルは、霧や雨の条件下ではうまく機能しない可能性がある。
霧や雨の天候下での領域ギャップを埋め、オブジェクト検出の性能を向上させるため、ドメイン適応型オブジェクト検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:16:41 GMT)
Generative Modelling of Structurally Constrained Graphs [44.3] ConStructは,平面性や非巡回性といった特定の特性をハードコントラストグラフ拡散モデルに組み込むことのできる,新しいフレームワークである。
我々のアプローチは、サンプルグラフがグラフの領域内にあることを保証し、前と逆の両方の過程において、軌道全体を通して指定された性質を検証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:54:32 GMT)
Enabling Regional Explainability by Automatic and Model-agnostic Rule Extraction [44.2] ルール抽出は、疾患の診断、疾患の進行予測、薬物発見などの分野に大きく貢献する可能性がある。
既存のメソッドは、全体のパフォーマンスを最大化するために、マイナークラスのルールのパフォーマンスを損なう。
本稿では,特定のサブグループからルールを抽出するモデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:47:50 GMT)
Direct Multi-Turn Preference Optimization for Language Agents [44.0] エージェントタスクに対するLLM(Large Language Models)の適用は、言語エージェントの開発において重要である。
直接選好最適化(DPO)は、複合誤差の緩和によるこの適応のための有望な手法である。
DPOをマルチターンタスクに適用することは、パーティション関数をキャンセルできないため、課題を提起する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:44:24 GMT)
Entropy-Based Decoding for Retrieval-Augmented Large Language Models [43.9] 外部知識を抽出した大規模言語モデルの拡張は、生成した応答の事実的正確性を改善するのに有効であることが証明されている。
本稿では,この問題を緩和するために,エントロピーを考慮した新しい学習自由復号法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:59:38 GMT)
Depth-Driven Geometric Prompt Learning for Laparoscopic Liver Landmark Detection [43.6] 肝臓の解剖学的ランドマークは、2D-3Dアライメントの重要なマーカーである。
腹腔鏡下肝所見の検出を容易にするため,L3Dと呼ばれる新しいデータセットを収集した。
本稿では,D2GPLandという深度駆動型幾何学的プロンプト学習ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:02:11 GMT)
Efficient 3D Molecular Generation with Flow Matching and Scale Optimal Transport [43.6] SemlaはスケーラブルなE(3)等価メッセージパッシングアーキテクチャである。
SemlaFlowはフローマッチングとスケールの最適トランスポートを使ってトレーニングされている。
本モデルでは,100個のサンプリングステップのみを用いて,ベンチマークデータセットの最先端結果を生成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:42:09 GMT)
CausalScore: An Automatic Reference-Free Metric for Assessing Response Relevance in Open-Domain Dialogue Systems [43.5] 本稿では,対話履歴と応答の因果的強度を測定することで応答の関連性を評価する,CausalScoreと呼ばれる新しい指標を提案する。
実験の結果,CausalScoreは人間の判断と整合し,既存の最先端指標を大きく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:08:16 GMT)
Self-Constructed Context Decompilation with Fined-grained Alignment Enhancement [43.3] 逆コンパイルは、ソースコードが利用できない場合、コンパイルされたコードをハイレベルなプログラミング言語に変換する。
本稿では,デコンパイル性能を向上させる2つの手法を提案する。
我々は,Decompile-Evalベンチマークで約7.35%の再現性向上を実現し,55.03%の最先端性能を新たに確立した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:37:53 GMT)
BMIKE-53: Investigating Cross-Lingual Knowledge Editing with In-Context Learning [43.1] 知識編集(KE)は、大規模言語モデルの知識を更新するための有効なソリューションとして登場した。
3種類のKEタスクタイプにわたる53の多言語における言語間KE評価のためのBMIKE-53ベンチマークを提案する。
本評価では,信頼性,汎用性,局所性,可搬性の観点から,言語間知識伝達に着目した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:48:56 GMT)
GradCheck: Analyzing classifier guidance gradients for conditional diffusion sampling [42.5] 分類器からの勾配、特にノイズの多い画像で訓練されていないものは、しばしば不安定である。
本研究では、ロバストな分類器と非ロバストな分類器を比較した勾配解析を行い、複数の勾配安定化手法について検討した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:23:25 GMT)
Do they mean 'us'? Interpreting Referring Expressions in Intergroup Bias [42.4] 本稿では,NFLチームのファンダム専門フォーラムの英語スポーツコメントに対するタグ付けタスクとしてグループ間バイアスをモデル化する。
私たちは、反対の視点(ゲームのチーム)から600万以上のゲームタイムコメントのユニークなデータセットをキュレートします。
専門家と群衆のアノテーションは、暗黙的かつ明示的な参照表現のタグ付けを通じてバイアスをモデル化することを正当化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:47:53 GMT)
This Paper Had the Smartest Reviewers -- Flattery Detection Utilising an Audio-Textual Transformer-Based Approach [42.3] フラタリー(英: Flattery)は、人間のコミュニケーションにおいて重要な側面であり、社会的結合を促進し、知覚を形作り、戦略的賞賛と賞賛を通じて行動に影響を与える。
そこで本研究では,20時間の音声と学習機械学習モデルを用いて,フラットな自動検出を行う新しい音声テキストデータセットを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:57:02 GMT)
Gradient Coding with Iterative Block Leverage Score Sampling [42.2] 変換したデータのサンプリングサブセットに対応するために,$ell$-subspace埋め込みのためのレバレッジスコアサンプリングスケッチを一般化する。
これを用いて、一階法に対する近似符号付き計算手法を導出する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:15:13 GMT)
Aligning Diffusion Models with Noise-Conditioned Perception [42.0] 拡散モデルは通常、ピクセルまたはVAE空間で最適化されるが、人間の知覚とうまく一致しない。
本稿では,これらの問題に対処するために,拡散モデルのU-Net埋め込み空間における知覚的目的を用いることを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:21:50 GMT)
A Numerical Proof of Shell Model Turbulence Closure [41.9] 本稿では, 統計誤差, ユーレリアおよびラグランジアン構造関数, エネルギーカスケードの断続統計を定量的に再現するディープリカレントニューラルネットワークに基づく閉包を提案する。
本研究は,3次元ナビエ-ストークス乱流に対する類似した手法の開発を奨励するものである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:40:14 GMT)
LINSCAN -- A Linearity Based Clustering Algorithm [41.9] DBSCANとOPTICSは、データ構造に関する仮定がほとんどない領域のポイントのクラスタを識別するための強力なアルゴリズムである。
我々は,既存の手法の発見と分離が困難な線形クラスタを探すために設計された新しいアルゴリズムであるLINSCANを導入する。
我々は,LINSCANを地震データに適用して,交差する断層を含む活断層を識別し,その方向を決定する方法を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:58:37 GMT)
"Seeing the Big through the Small": Can LLMs Approximate Human Judgment Distributions on NLI from a Few Explanations? [41.6] 大規模言語モデル (LLMs) は評価器 (LLM judges'') として使われることが多いが、結果はまちまちである。
本研究は,少数の専門家ラベルと説明を用いて,LLMを用いてHJDを近似することを提案する。
実験の結果,LLMのHJDを明示的なラベルなしで近似する能力は,いくつかの説明が著しく向上していることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:42:17 GMT)
AudioBench: A Universal Benchmark for Audio Large Language Models [41.5] 我々は、オーディオ大言語モデル(AudioLLMs)を評価するために設計された新しいベンチマークであるAudioBenchを紹介する。
AudioBenchは、音声理解、音声解釈、音声シーン理解に焦点を当て、8つの異なるタスクと26の慎重に選択された、または新しく訓練されたデータセットを含んでいる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:27:06 GMT)
Measuring and Benchmarking Large Language Models' Capabilities to Generate Persuasive Language [41.1] 本研究では,Large Language Models (LLM) の説得的テキスト生成能力について検討する。
我々は、短いテキストとLLMで書き直されたテキストからなるペアからなる新しいデータセットPersuasive-Pairsを構築した。
テキストペア間の説得的言語スコアを予測するために,回帰モデルをトレーニングするために使用できることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:40:47 GMT)
Disentangled Motion Modeling for Video Frame Interpolation [40.8] ビデオフレーム(VFI)は、既存のフレーム間の中間フレームを合成し、視覚的滑らかさと品質を高めることを目的としている。
中間動作モデリングに着目して視覚的品質を高めるVFIの拡散に基づく手法であるDistangled Motion Modeling (MoMo)を導入する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:50:20 GMT)
Videogenic: Identifying Highlight Moments in Videos with Professional Photographs as a Prior [40.3] ビデオジェニック(Videogenic)は、さまざまなドメインに対して、ドメイン固有のハイライトビデオを作成する技術である。
人間の評価研究において、CLIPに基づく検索と組み合わせた高品質な写真収集が、ビデオハイライトを見つけるための優れた先行候補となることを示す。
本研究は,映像編集者がより軽量な作業負荷,タスク完了時間短縮,ユーザビリティ向上を図り,映像編集支援にビデオジェネレータが有用であることを示すものである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:20:06 GMT)
VideoMap: Supporting Video Editing Exploration, Brainstorming, and Prototyping in the Latent Space [40.3] VideoMap(ビデオマップ)は、ビデオ編集インタフェースで、潜在空間に投影されたビデオフレームで動作する。
地図にインスパイアされたナビゲーション要素による直感的なナビゲーションをサポートし、異なる潜在空間間の遷移を容易にする。
プロと非プロの両方のユーザーによる調査では、VideoMapが不快な作業を減らすのに役立っていることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:20:45 GMT)
Dual-Space Knowledge Distillation for Large Language Models [39.8] KDのための2つのモデルの出力空間を統一する二空間知識蒸留(DSKD)フレームワークを提案する。
我々のフレームワークは、現在のフレームワークのようなKDの様々な距離関数と互換性があるだけでなく、語彙に関係なく、任意の2つのLLM間のKDもサポートしています。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:25:15 GMT)
Analysis of learning a flow-based generative model from limited sample complexity [39.8] 本研究では,2層オートエンコーダによりパラメータ化されたフローベース生成モデルの学習課題について,高次元ガウス混合系のサンプルとして検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:32:20 GMT)
Negative electrohydrostatic pressure between superconducting bodies [39.6] 我々は、平面超伝導体間の負の(魅力的な)圧力を予測する。
結果として生じる表面エネルギーは、ハートリー・フォック理論によって予測されるものよりもよく一致している。
このモデルは、Bardeen-Cooper-Schrieffer と Ginzburg-Landau 理論のバルク制限を回避している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:38:16 GMT)
Advanced Model Consistency Restoration with Higher-Order Short-Cut Rules [39.6] 我々は、同期中に、より複雑なSC規則をオンザフライで計算する手法を開発した。
これらの高階のSCルールは、複数の変更を1ステップで処理しなければならない場合に、より複雑なシナリオに対処することができます。
評価により、高次SCルールのオンザフライでの計算のオーバーヘッドは許容可能であり、時には全体的な性能も向上することが示された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:11:01 GMT)
OPT-Tree: Speculative Decoding with Adaptive Draft Tree Structure [39.1] 投機的復号には、複数のトークンを1ステップで生成できるようにする"ドラフトと検証"機構が使用されている。
既存の手法は主に固定されたドラフト構造を採用しており、異なる状況に適応できない。
我々は適応的でスケーラブルなドラフトツリーを構築するアルゴリズムであるOPT-Treeを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:45:53 GMT)
Structured Unrestricted-Rank Matrices for Parameter Efficient Fine-tuning [38.8] 構造化非制限ランク行列(SURM)に基づく効率的なパラメータ微調整(PEFT)のためのフレームワークを提案する。
SURMは、LoRAの低ランク行列を置換しながら、様々な画像分類タスクにおいて5-7%の精度向上を実現している。
また、GLUEベンチマークでは、アダプタのパラメータ数を最大12倍に削減する(ほぼ品質が低下する)。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:26:05 GMT)
WAVE: Weight Template for Adaptive Initialization of Variable-sized Models [38.0] WAVEは、様々な深さと幅のモデルを初期化する際に、最先端の性能を達成する。
WAVEは、一連のデータセット間で最も効率的な知識伝達を同時に達成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:43:33 GMT)
Algorithmic Fault Tolerance for Fast Quantum Computing [37.4] 本研究では,幅広い種類の量子コードに対して,一定の時間オーバーヘッドでフォールトトレラントな論理演算を実行できることを示す。
理想的な測定結果分布からの偏差をコード距離で指数関数的に小さくできることを示す。
我々の研究は、フォールトトレランスの理論に新たな光を当て、実用的なフォールトトレラント量子計算の時空間コストを桁違いに削減する可能性がある。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:43:25 GMT)
Mamba24/8D: Enhancing Global Interaction in Point Clouds via State Space Model [37.4] 私たちは、ポイントクラウドドメインにSSMベースのアーキテクチャであるMambaを紹介します。
本稿では,線形複雑性下でのグローバルモデリング能力の強いMamba24/8Dを提案する。
Mamba24/8Dは、複数の3Dポイントクラウドセグメンテーションタスクにおける技術結果の状態を取得する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:23:53 GMT)
ODIN: A Single Model for 2D and 3D Segmentation [34.6] ODINは、2D RGBイメージと3Dポイントクラウドのセグメンテーションとラベル付けを行うモデルである。
ScanNet200、Matterport3D、AI2THOR 3Dセグメンテーションベンチマーク上での最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:21:17 GMT)
The Use of AI-Robotic Systems for Scientific Discovery [34.5] この章では、科学哲学におけるロボット科学者の基礎をいくつか探求する。
科学的手法は能動的学習と類似していると論じる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:33:01 GMT)
End-to-End Autonomous Driving without Costly Modularization and 3D Manual Annotation [34.1] 視覚に基づくエンドツーエンド自動運転(E2EAD)のためのUADを提案する。
私たちのモチベーションは、現在のE2EADモデルが依然として典型的な駆動スタックのモジュラーアーキテクチャを模倣していることに起因しています。
我々のUADは、NUScenesにおける平均衝突速度において、UniADに対して38.7%の相対的な改善を達成し、CARLAのCown05 Longベンチマークの駆動スコアにおいて、VADを41.32ポイント上回っている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:12:52 GMT)
Retrieval-style In-Context Learning for Few-shot Hierarchical Text Classification [34.1] 大規模な言語モデル(LLM)を備えた最初のICLベースのフレームワークを,数ショットのHTC向けに紹介する。
検索データベースを利用して、関連する実演を識別し、多層階層ラベルを管理するための反復的なポリシーを用いる。
数ショットのHTCで最先端の成果が得られます。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:19:41 GMT)
TRIP: Trainable Region-of-Interest Prediction for Hardware-Efficient Neuromorphic Processing on Event-based Vision [33.8] Trainable Region-of-Interest Prediction (TRIP) は、ニューロモルフィックプロセッサ上でのイベントベースの視覚処理のためのフレームワークである。
TRIPはスパースイベント固有の低情報密度を利用してROI予測のオーバーヘッドを削減する。
我々の解法は、最先端の計算よりも46倍少ない精度で計算する必要がある。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:04:51 GMT)
Semantic Deep Hiding for Robust Unlearnable Examples [33.7] 深層学習モデルを誤解させ、データを不正な探索から防ぐために、未学習例が提案されている。
本稿では,高次特徴に富んだセマンティック画像を適応的に隠蔽するDeep Hiding方式を提案する。
提案手法は学習不可能な事例に対して顕著なロバスト性を示し,その有効性を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:05:42 GMT)
Point Tree Transformer for Point Cloud Registration [33.0] ポイントクラウド登録は、コンピュータビジョンとロボティクスの分野における基本的なタスクである。
本稿では,局所的特徴とグローバルな特徴を効率的に抽出する,ポイントクラウド登録のためのトランスフォーマーベースの新しいアプローチを提案する。
本手法は最先端の手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:14:26 GMT)
Identifying Nonstationary Causal Structures with High-Order Markov Switching Models [32.9] 時系列における因果発見は急速に発展し、気候科学や神経科学など様々な分野に応用されている。
この研究では、状態依存因果構造を通して非定常性に対処する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:38:27 GMT)
R4: Reinforced Retriever-Reorder-Responder for Retrieval-Augmented Large Language Models [32.6] Retrieval-augmented large language model (LLMs) は、情報検索システムによって取得された関連コンテンツを利用して正しい応答を生成する。
既存のレトリバー・サプライヤ・メソッドは、テキスト生成タスクを実行するために LLM のプロンプトに関連文書を追加するのが一般的である。
検索拡張LDMのための文書順序付けを学習するための新しいパイプライン"Reinforced Retriever-Reorder-Responder"を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:24:01 GMT)
Optimizing Speculative Decoding for Serving Large Language Models Using Goodput [32.5] 投機的復号化は、大規模言語モデルにおいて最も効果的な手法の1つである。
要求毎に最適な投機期間を決定するための動的フレームワークであるSmartSpecを開発した。
SmartSpecは、非投機的復号化ベースラインに比べて平均要求遅延を最大3.2倍まで減少させる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:53:16 GMT)
Towards Open-set Camera 3D Object Detection [32.4] OS-Det3D (Open-set Camera 3D Object Detection) は、カメラ3D検出器が既知の物体と未知の物体の両方を識別する能力を高めるための2段階の訓練フレームワークである。
提案する3Dオブジェクト探索ネットワーク(ODN3D)は,3Dボックスの位置やスケールといった幾何学的手法を用いて,特に訓練されている。
未知のオブジェクトを識別する際の精度を高めるために,JOSモジュールを導入する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:58:34 GMT)
EON-1: A Brain-Inspired Processor for Near-Sensor Extreme Edge Online Feature Extraction [32.3] EON-1は脳にインスパイアされた、極端端端のオンライン特徴抽出のためのプロセッサである。
学習に要するエネルギーオーバーヘッドは1%に過ぎず,他のSoTAソリューションと比較した場合のオーバーヘッドは極端に低い。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:23:41 GMT)
Accelerating Clinical Evidence Synthesis with Large Language Models [32.3] 医療システムレビューを行うための生成AIベースのパイプラインであるTrialMindを紹介する。
大規模な言語モデル(LLM)を使用してパイプラインの各コンポーネントを駆動し、エラーを最小限に抑えるために人間の専門家の監視を取り入れます。
その結果,TrialMindは文献レビュープロセスを大幅に改善することがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:41:52 GMT)
Unlocking Continual Learning Abilities in Language Models [32.2] 言語モデル(LM)は優れた性能と一般化能力を示す。
MIGUはリハーサルフリーでタスクラベルなしの手法であり、LMの線形層において大きな出力でのみモデルパラメータを更新する。
MIGUは、連続的な微調整と連続的な事前トレーニング設定にまたがって、最先端またはオンパーのパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:24:06 GMT)
Practical Membership Inference Attacks against Fine-tuned Large Language Models via Self-prompt Calibration [32.2] メンバーシップ推論攻撃(MIA)は、対象のデータレコードがモデルトレーニングに使用されたかどうかを推測することを目的としている。
自己校正確率変動(SPV-MIA)に基づくメンバーシップ推論攻撃を提案する。
具体的には、LLMの記憶はトレーニングプロセス中に必然的に必要であり、オーバーフィッティング前に発生するので、より信頼性の高いメンバーシップ信号を導入する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:36:02 GMT)
A Probabilistic Fluctuation based Membership Inference Attack for Diffusion Models [32.2] メンバーシップ推論攻撃(MIA)は、機械学習モデルのトレーニングセットに、モデルをクエリすることでレコードが存在するかどうかを特定する。
PFAMI(Probabilistic Fluctuation Assessing Membership Inference Attack)を提案する。
PFAMIは最高のベースラインと比較して攻撃成功率(ASR)を約27.9%向上させることができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:34:46 GMT)
Temporal-Channel Modeling in Multi-head Self-Attention for Synthetic Speech Detection [31.8] 本稿では,MHSAの時間チャネル依存性を捉える能力を高めるために,時間チャネルモデリング(TCM)モジュールを提案する。
0.03Mの追加パラメータだけで、TCMモジュールはEERの9.25%で最先端のシステムより優れている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:50:43 GMT)
DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models [31.6] 視覚言語モデル(VLM)を活用した自律運転システムDriveVLMを紹介する。
DriveVLMは、シーン記述、シーン分析、階層計画のための推論モジュールのユニークな組み合わせを統合している。
本稿では,DriveVLMの強みを従来の自律走行パイプラインと相乗化するハイブリッドシステムであるDriveVLM-Dualを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:55:35 GMT)
Double Momentum Method for Lower-Level Constrained Bilevel Optimization [31.3] 再帰的仮定を使わずに,非滑らかな暗黙関数定理を応用したLCBOの新しい過次関数を提案する。
さらに,2重モーメント法と適応ステップサイズ法に基づいて,テキスト入力ループのシングルタイムスケール反復アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:05:22 GMT)
Real-Time Remote Control via VR over Limited Wireless Connectivity [31.1] この研究は、限られた無線接続上での人間とロボットの相互作用を強化するソリューションを導入している。
目標は、バーチャルリアリティー(VR)インターフェースを通じてロボットを遠隔操作することで、接続が失われる場合に、スムーズな自律モードへの移行を保証することだ。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:45:50 GMT)
The FineWeb Datasets: Decanting the Web for the Finest Text Data at Scale [31.0] FineWebは96 Common Crawlスナップショットから派生した15トリリオンのトークンデータセットである。
FineWeb-Eduは、FineWebからフィルタリングされた教育用テキストの1.3トリリオントークンコレクションである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:50:56 GMT)
Sound Tagging in Infant-centric Home Soundscapes [30.8] 本研究では,家庭内における幼児中心音環境における大規模事前学習モデルの性能について検討する。
この結果から,収集したデータセットと公開データセットを組み合わせることで,F1スコアを増大させることで,モデルを微調整できることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 00:15:54 GMT)
Advancing Question Answering on Handwritten Documents: A State-of-the-Art Recognition-Based Model for HW-SQuAD [30.6] 本稿では,HW-SQuADデータセットとBenthamQAデータセットの先行技術を改善する新しい認識ベースアプローチを提案する。
本モデルでは,モデルレベルでのトランスフォーマーに基づく文書検索とアンサンブル手法を導入し,エクサクマッチスコアを82.02%,92.55%とした。
コードとトレーニングされたモデルは、この重要な自然言語領域における将来の研究を促進するために公開されます。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:18:50 GMT)
Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding [30.5] 自動音声キャプション(英: Automated Audio Casting, AAC)は、自然言語で音声を記述するための音声からテキストへのタスクである。
大規模言語モデル(LLM)の最近の進歩は、AACを改善する可能性を広げている。
提案手法は,DCASE 2023 Task 6Aの勝者よりも優れた33.0 SPIDEr-FLスコアを得る。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:07:36 GMT)
Encourage or Inhibit Monosemanticity? Revisit Monosemanticity from a Feature Decorrelation Perspective [30.3] 単意味ニューロンは単一の概念と特定の概念に特化しており、ニューロンと概念の間に1対1の相関関係を形成する。
単調性探索の広範な研究にもかかわらず、単調性がモデル能力に有益か有害かは定かではない。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:51:08 GMT)
CoSafe: Evaluating Large Language Model Safety in Multi-Turn Dialogue Coreference [29.6] この研究は,大規模言語モデル(LLM)におけるマルチターン対話コアの安全性を初めて研究したものである。
私たちは14のカテゴリで1,400の質問のデータセットを作成しました。
LLaMA2-Chat-7bモデルでは56%、Mistral-7B-Instructモデルでは13.9%であった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:13:02 GMT)
Geometric Median (GM) Matching for Robust Data Pruning [29.5] データプルーニングは、大規模なデータハングリーモデルのトレーニングに伴う膨大な計算コストを軽減するために不可欠である。
本研究では,部分集合の平均値が(潜在的に)ノイズデータセットの中央値に近似するように,$k$-subsetを求めるGeometric ($gm$) Matchingを提案する。
一般的なディープラーニングベンチマークによる実験によると、$gm$ Matchingは、従来よりも一貫してパフォーマンスが向上している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 00:02:01 GMT)
ECLIPSE: Expunging Clean-label Indiscriminate Poisons via Sparse Diffusion Purification [29.3] クリーンラベルの無差別な中毒攻撃は、正しくラベル付けされた訓練画像に目に見えない摂動を加える。
ECLIPSEという,より普遍的で実用的で堅牢な防衛手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:07:15 GMT)
SimsChat: A Customisable Persona-Driven Role-Playing Agent [29.2] 大きな言語モデル(LLM)は、人間の指示を理解し、高品質なテキストを生成する能力を持っている。
実世界のキャラクターをシミュレートするためにLLMを利用するCustomisable Conversation Agent Frameworkを導入する。
我々は、自由にカスタマイズ可能なロールプレイングエージェントであるSimsChatを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:44:17 GMT)
Panacea: A foundation model for clinical trial search, summarization, design, and recruitment [29.1] パナセアという臨床試験基盤モデルを提案する。
Panaceaは、トライアル検索、トライアル要約、トライアルデザイン、患者と臨床のマッチングなど、複数のタスクを扱うように設計されている。
793,279のトライアル文書と1,113,207のトライアル関連科学論文からなる、TrialAlignという大規模なデータセットも収集しました。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:29:25 GMT)
Self-assessment, Exhibition, and Recognition: a Review of Personality in Large Language Models [29.1] 本稿では,現在の研究を,自己評価,展示,認識という3つの研究課題に分類して総合的なレビューを行う。
本稿は,大規模言語モデルにおける人格に関する最新の文献を包括的に調査した初めての論文である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:08:44 GMT)
Vox-UDA: Voxel-wise Unsupervised Domain Adaptation for Cryo-Electron Subtomogram Segmentation with Denoised Pseudo Labeling [29.1] 本稿では,Vox-UDAと呼ばれるVoxel-wise unsupervised domain adapt approachをCreo-ETサブトモグラムセグメンテーションに導入する。
Vox-UDAは、ノイズ生成モジュールを組み込んで、ソースデータセットのターゲットのようなノイズをシミュレートし、クロスノイズレベルを適応させる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 00:16:57 GMT)
Maze Discovery using Multiple Robots via Federated Learning [29.0] 本研究は,LiDARセンサ搭載ロボットを用いた迷路発見に応用したフェデレートラーニング(FL)のユースケースを提案する。
ここでのゴールは、不規則な形をした壁で作られた2つの異なる正方形の迷路内の格子領域の形状を正確に識別するための分類モデルを訓練することである。
この問題は、1つの迷路のみを探索するロボット間でFLフレームワークを採用することで解決される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:34:11 GMT)
Temporal Prototype-Aware Learning for Active Voltage Control on Power Distribution Networks [28.6] 電力配電ネットワーク(PDN)のアクティブ電圧制御(AVC)は、電力系統の効率と信頼性を確保するために電圧レベルを安定化することを目的としている。
短時間の訓練軌跡下での時間適応的依存関係を学習するために,TPAと略される新しい時間的プロトタイプ認識学習法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:07:00 GMT)
Can We Trust the Performance Evaluation of Uncertainty Estimation Methods in Text Summarization? [28.3] 4次元にわたる31個のNLGメトリクスを包含した包括的UE-TSベンチマークを導入する。
このベンチマークは、3つのデータセット上で2つの大きな言語モデルと1つの事前訓練された言語モデルの不確実性推定能力を評価する。
また,本ベンチマークにおける14種類の共通不確実性評価手法の性能評価を行った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:41:17 GMT)
Empowering Interdisciplinary Insights with Dynamic Graph Embedding Trajectories [28.2] DyGETVizは動的グラフ(DG)を効果的に視覚化するための新しいフレームワーク
これらのグラフ内のマイクロレベルとマクロレベルの構造シフトをキャプチャし、複雑で大規模な動的グラフを表現する堅牢な方法を提供する。
DyGETVizの適用範囲は、民族学、疫学、金融学、遺伝学、言語学、コミュニケーション研究、社会学、国際関係など、多岐にわたる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:44:53 GMT)
Hyperbolic Knowledge Transfer in Cross-Domain Recommendation System [28.0] CDR(Cross-Domain Recommendation)は、異なるドメインからの知識を活用して、ターゲットのレコメンデーションドメインにおけるデータ空間の問題を軽減する。
現在のほとんどのメソッドはユークリッド空間のユーザやアイテムを表していますが、これは長い尾の分散データを扱うには理想的ではありません。
我々は,各ドメインのユニークな特徴を捉えるために,Hyperbolic Contrastive Learning (HCTS)と呼ばれる新しいフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:35:02 GMT)
Leveraging Parameter-Efficient Transfer Learning for Multi-Lingual Text-to-Speech Adaptation [27.8] 異なる言語は異なる音声システムを持ち、その韻律的特徴が異なるため、テキスト音声モデルの開発は困難である。
本稿では,多言語音声合成のためのTTSアーキテクチャを用いて,アダプタやハイパーネットワークなどのパラメータ効率変換学習(PETL)手法を統合することを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:50:54 GMT)
Instruct, Not Assist: LLM-based Multi-Turn Planning and Hierarchical Questioning for Socratic Code Debugging [27.7] ソクラテス質問は効果的な教育戦略であり、批判的思考と問題解決を奨励する。
TreeInstructは、学生が個別にエラーを特定し、解決するのを助けるために、探索的な質問をする。
学生の概念的・統語的知識を推定し、その反応と現在の知識状態に基づいて質問ツリーを動的に構築する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:17:41 GMT)
S$^3$HQA: A Three-Stage Approach for Multi-hop Text-Table Hybrid Question Answering [27.7] 既存のモデルは、主にいくつかの欠陥があるレトリバー・リーダー・フレームワークを採用している。
本稿では3段階のTextTableQAフレームワークS3HQAを提案する。
完全なデータセットでトレーニングすると、私たちのアプローチはすべてのベースラインメソッドを上回り、HybridQAのリーダボードにランクインします。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:53:44 GMT)
Evaluating Fairness in Large Vision-Language Models Across Diverse Demographic Attributes and Prompts [27.7] いくつかの主流視覚言語モデル(LVLM)における両眼的公正性について実験的に検討する。
パブリックフェアネスベンチマークデータセット(例えば、FACET)に基づいて、センシティブな属性間でのパフォーマンス格差を監査する。
視覚的理解の強化にもかかわらず、オープンソースのLVLMとクローズドソースのLVLMは、異なるインストラクションプロンプトと人口統計特性にまたがるフェアネスの問題を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:11:39 GMT)
Do Large Language Models Rank Fairly? An Empirical Study on the Fairness of LLMs as Rankers [27.7] 本稿では,TREC Fair Ranking データセットを用いて,Large Language Models (LLMs) の評価実験を行った。
本稿では, 歴史的に検索結果に乏しい, 性別や地理的位置などの二項保護属性の表現に焦点を当てる。
我々の分析は、これらのLCMがこれらの属性に関連するクエリやドキュメントをどのように扱うのかを考察し、ランキングアルゴリズムのバイアスを明らかにすることを目的としている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:54:16 GMT)
Universal Prompt Optimizer for Safe Text-to-Image Generation [27.3] ブラックボックスシナリオにおける安全なT2I(POSI)生成のための最初の普遍的プロンプトを提案する。
提案手法は,不適切な画像を生成する際の様々なT2Iモデルの可能性を効果的に低減することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:56:40 GMT)
Leveraging LLMs for Dialogue Quality Measurement [27.0] 大規模言語モデル(LLM)は、NLPタスク全体で堅牢なゼロショットと少数ショットの機能を提供する。
モデルサイズ,文脈内例,選択手法などの操作要因を考察し,CoT推論とラベル抽出手法について検討する。
この結果から,適切な微調整と十分な推論能力を有するLCMを自動対話評価に活用できることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:19:47 GMT)
Pseudo Labelling for Enhanced Masked Autoencoders [27.0] クラストークンとデータトークンの両方に擬似ラベリングを統合することで,Masked Autoencoders (MAE) の性能を向上させる手法を提案する。
この戦略では、クラスタ割り当てを擬似ラベルとして使用して、ネットワーク内のインスタンスレベルの識別を促進する。
擬似ラベリングを補助タスクとして組み込むことで,ImageNet-1Kなどの下流タスクに顕著な改善が見られた。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:41:45 GMT)
Investigating Self-Supervised Methods for Label-Efficient Learning [27.0] 低撮影能力のためのコントラスト学習、クラスタリング、マスク付き画像モデリングなど、さまざまな自己教師付きプレテキストタスクについて検討する。
マスク画像モデリングとクラスタリングの両方をプリテキストタスクとして含むフレームワークを導入する。
実規模データセット上でモデルをテストした場合,マルチクラス分類,マルチラベル分類,セマンティックセマンティックセグメンテーションにおける性能向上を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:56:03 GMT)
NerfBaselines: Consistent and Reproducible Evaluation of Novel View Synthesis Methods [26.8] 本稿では,様々な手法のインストールを簡単にするNeuralBaselinesというフレームワークを提案する。
各種手法の評価プロトコルの微妙な違いが,不整合性評価指標に繋がることが示唆された。
アクセシビリティをさらに向上するために、一般的なメソッドを標準ベンチマークで比較するWebプラットフォームをリリースする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:58:47 GMT)
Reward Steering with Evolutionary Heuristics for Decoding-time Alignment [26.7] 報酬モデルガイダンスによる復号時間アライメントは、推論時間の増加を犠牲にして問題を解決する。
これを改善するために、これらの2つの側面を分離し、進化的な方法で実装します。
実証的な証拠は、この戦略が多くの選好最適化や復号時間アライメントアプローチより優れていることを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:55:03 GMT)
Adam-mini: Use Fewer Learning Rates To Gain More [26.0] Adam-miniは、メモリフットプリントを45%から50%削減したAdamWよりも、オンパーまたは優れたパフォーマンスを実現している。
我々は,Adam-miniが,事前学習,教師付き微調整,RLHFのために125Mから7Bの様々な言語モデルでAdamWと同等以上の性能を示すことを確認した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:45:06 GMT)
Point-SAM: Promptable 3D Segmentation Model for Point Clouds [26.0] 本稿では,点雲に着目した3次元プロンプト可能なセグメンテーションモデル(Point-SAM)を提案する。
提案手法では,SAMを3次元領域に拡張するトランスフォーマー方式を用いる。
本モデルは,室内および屋外のベンチマークにおいて,最先端のモデルよりも優れる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:28:03 GMT)
X-ray Made Simple: Radiology Report Generation and Evaluation with Layman's Terms [25.9] ラジオロジーレポート生成(RRG)は多モード生成モデルの進歩によって大きな進歩を遂げた。
既存の語彙ベースのメトリクス(例えばBLEU)によるRRGのハイパフォーマンスは、単なるミラージュ(mirage)である。
我々は、レイマンの用語ベースのデータセット、評価およびトレーニングフレームワークであるRRGフレームワークを提案することによって、この問題に意図せずにアプローチする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:52:01 GMT)
CharED: Character-wise Ensemble Decoding for Large Language Models [25.0] 本稿では,複数の大規模言語モデルから出力を"出力する"ことを目的とした推論時アンサンブルアルゴリズムを提案する。
提案モデルでは,語彙,トークン化,モデルサイズに関わらず,複数のLLMの補完的強度を組み合わせることができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:35:07 GMT)
Beyond Text-to-SQL for IoT Defense: A Comprehensive Framework for Querying and Classifying IoT Threats [24.6] 本研究では,10,985対のテキスト・ツー・IoTと239,398行のネットワークトラフィックからなる新しいテキスト・ツー・IoTデータセットを提案する。
以上の結果から,データの検索と推測を行う共同トレーニングにより,テキスト・トゥ・IoT全体のパフォーマンスが向上することが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:14:35 GMT)
LEDITS++: Limitless Image Editing using Text-to-Image Models [24.6] LEDITS++は効率的で汎用的で正確なテキスト画像操作技術である。
数段の拡散ステップで高忠実度な結果が得られる。
複数の同時編集をサポートし、アーキテクチャに依存しない。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:33:57 GMT)
Grass: Compute Efficient Low-Memory LLM Training with Structured Sparse Gradients [24.6] 大規模言語モデル(LLM)のトレーニングと微調整は、しばしば限られたGPUメモリによってボトルネックとなる。
グラス(GRAdient Stuctured Sparsification,GRAdient Stuctured Sparsification,GRAdient Stuctured Sparsification)は、スパースプロジェクションを利用して勾配を構造化されたスパース更新に変換する新しい手法である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:50:32 GMT)
X-ray2CTPA: Generating 3D CTPA scans from 2D X-ray conditioning [24.2] 胸部X線または胸部X線撮影(CXR)はCTスキャンと比較して限られた画像撮影を可能にする。
CTスキャンはCXRよりもコストが高く、放射線被曝も大きく、アクセス性も低い。
本研究では,2次元低コントラスト分解能X線入力から3次元高コントラストおよび空間分解能Aスキャンへのクロスモーダル変換について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:47:07 GMT)
DE-COP: Detecting Copyrighted Content in Language Models Training Data [24.2] 著作権のあるコンテンツの一部がトレーニングに含まれているかどうかを判定する手法であるDE-COPを提案する。
BookTectionは165冊の書籍から抜粋を抽出したベンチマークで、モデルによるトレーニングの切り離しの後に作成します。
実験の結果、DE-COPは検出性能が9.6%向上した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:33:41 GMT)
MoESD: Mixture of Experts Stable Diffusion to Mitigate Gender Bias [23.1] このバイアスはすでにモデルのテキストエンコーダに存在していることを示す。
性別バイアスを軽減するため,BiAs (Bias Adapters) を用いたMOESD (Mixture of Experts Stable Diffusion) を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:59:31 GMT)
FASA: a Flexible and Automatic Speech Aligner for Extracting High-quality Aligned Children Speech Data [22.9] そこで我々は,高品質な子どもの音声データを抽出するフレキシブルかつ自動的な音声整列器として,新しい強制調整ツールFASAを提案する。
CHILDESデータセットでの使用例を示し、FASAが人間のアノテーションよりも13.6$times$でデータ品質を改善することを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:37:16 GMT)
Rapid and Accurate Diagnosis of Acute Aortic Syndrome using Non-contrast CT: A Large-scale, Retrospective, Multi-center and AI-based Study [22.9] 胸部痛症状は、急性大動脈症候群(AAS)が壊滅性心血管疾患であり、死亡率が高い救急部(EDs)で多い。
EDの現在のトリアージの実践は、AAS患者の最大半数が、当初診断に失敗したり、他の急性胸痛の症状があるとして誤診されたりする可能性がある。
非コントラストCTを用いた人工知能モデル(DeepAAS)を開発した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:17:22 GMT)
Enhancing Global Sensitivity and Uncertainty Quantification in Medical Image Reconstruction with Monte Carlo Arbitrary-Masked Mamba [22.9] 本稿では,共同医用画像再構成と不確実性推定のためのウェーブレット分解を用いたArbitrary-Masked MambaベースのモデルであるMambaMIRを紹介する。
新しいArbitrary Scan Masking (ASM) 機構は冗長な情報を「マスクアウト」し、さらなる不確実性推定のためにランダム性を導入する。
テクスチャのさらなる保存と知覚品質の向上のために,我々はMambaMIRへのウェーブレット変換を採用し,その変形を生成的逆数ネットワーク(MambaMIR-GAN)に基づいて探索する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:01:09 GMT)
CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph [22.8] 大規模な言語モデルは、幻覚や事実的不正確なコンテンツを生成するという妥当性にもかかわらず、疑問に答えるアプリケーションにとって不可欠なものとなっている。
我々は,QAシナリオにおけるLLMの限界に対処するため,知識グラフを活用するコラボレーティブ拡張フレームワークであるCogMGを紹介した。
本手法の有効性をエージェント・フレームワーク内における教師付き微調整LDMを用いて実証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:37:12 GMT)
MedCare: Advancing Medical LLMs through Decoupling Clinical Alignment and Knowledge Aggregation [22.6] 大規模言語モデル(LLM)は、特に医学分野で価値のある自然言語理解と生成の進歩を示す。
従来のアプローチでは後者のタスクを無視するか、少数のタスクに集中していたため、一般化が失われる。
このパイプラインは、ナレッジアグリゲータとノイズアグリゲータを使用して、最初の段階で多様な知識を符号化し、有害情報をフィルタリングする。
MedCare (1.8B, 7B, 14B) の様々なモデルサイズは、いずれも類似のモデルサイズを持つ既存のモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:05:56 GMT)
EXTRACT: Efficient Policy Learning by Extracting Transferrable Robot Skills from Offline Data [22.5] ほとんどの強化学習(RL)手法は、低レベルな行動空間上の最適ポリシーの学習に重点を置いている。
これらの手法はトレーニング環境ではうまく機能するが、新しいタスクに移行する柔軟性に欠ける。
我々は,従来の作業よりも短時間で新しいタスクを学習できる,スパースでイメージベースのロボット操作環境の実験を通じて実演する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:50:03 GMT)
Recite, Reconstruct, Recollect: Memorization in LMs as a Multifaceted Phenomenon [22.3] 我々は記憶を分類学に分解する:高度に複製された配列のリサイクリング、本質的に予測可能なシーケンスの再構築、そしてどちらもないシーケンスのリコール。
依存関係を解析し, 予測モデルの重みを検査することにより, 異なる要因が, 分類学的カテゴリーによって異なる記憶可能性に影響を与えることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:32:16 GMT)
Distance Recomputator and Topology Reconstructor for Graph Neural Networks [22.2] グラフニューラルネットワーク(GNN)の強化を目的とした距離再計算手法とトポロジー再構成手法を導入する。
Distance Recomputatorは動的符号化方式を用いてノード距離を動的に補正し、ノード表現の精度と適応性を向上させる。
トポロジー再構成器は、計算された「類似性距離」に基づいて局所グラフ構造を調整し、学習結果を改善するためにネットワーク構成を最適化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:12:51 GMT)
Pretrained deep models outperform GBDTs in Learning-To-Rank under label scarcity [22.1] DLローカは、教師なし事前学習を利用して、ラベルのないデータを活用できることが示される。
パブリックデータセットとプロプライエタリデータセットの両方に対する広範な実験では、事前トレーニング済みのDLランクラが、ランキングメトリクスにおいてGBDTランクラを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:41:56 GMT)
Embedding Ontologies via Incorporating Extensional and Intensional Knowledge [22.1] オントロジーはドメイン内の豊富な知識を含み、拡張的知識と強迫的知識という2つのカテゴリに分けられる。
既存のオントロジの埋め込みアプローチは、拡張的知識と集約的知識の両方を同時に考慮することができない。
本研究では,拡張空間と拡張空間という2つの空間におけるオントロジーを表現することで,EIKE(Extensional and Intensional Knowledge Embedding)を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:08:41 GMT)
Mitigate the Gap: Investigating Approaches for Improving Cross-Modal Alignment in CLIP [22.1] コントラスト言語-画像事前学習は、ゼロショット分類とクロスモーダル視覚言語タスクにおいて顕著に改善されている。
幾何学的な観点から、CLIP埋め込み空間は明らかにモダリティギャップを持つ。
本稿では,AlignCLIPが組込みのクロスモーダルアライメントにおいて顕著な拡張を実現していることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:24:02 GMT)
MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation [22.0] 本研究では,マンバをベースとした医用画像再構成モデルであるMambaMIRと,そのジェネレーティブ・アドバーサリアル・ネットワーク・モデルであるMambaMIR-GANを紹介する。
提案したMambaMIRは,線形複雑性,大域受容場,動的重み付けなどの利点を元のMambaモデルから継承する。
高速MRIやSVCTなどの様々な医用画像再構成タスクで行った実験により,MambaMIRとMambaMIR-GANは,最先端の手法と比較して,同等あるいは優れた再建結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:04:56 GMT)
Scalp Diagnostic System With Label-Free Segmentation and Training-Free Image Translation [21.8] ScalpVisionは,頭皮疾患とアロペシアの包括的診断のためのAI駆動型システムである。
有効ヘアセグメンテーションは、従来のヘアマスクラベルが存在しない場合に、擬似画像ラベル対と革新的プロンプト法を用いて達成される。
以上の結果から,ScalpVisionは各種の頭皮疾患やアロペシアの診断に有効であり,皮膚科的治療に有用である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:42:29 GMT)
SKD-TSTSAN: Three-Stream Temporal-Shift Attention Network Based on Self-Knowledge Distillation for Micro-Expression Recognition [21.7] マイクロ圧縮認識(MER)は、犯罪分析や心理療法など、多くの分野で重要である。
本稿では,自己知識蒸留(SKD-TSTSAN)に基づく3ストリーム時間シフトアテンションネットワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:22:22 GMT)
Embedded Silicon-Organic Integrated Neuromorphic System [21.6] 我々は、ハードウェアにおける脳の動作原理と材料をシミュレートし、脳にインスパイアされたインテリジェンス技術を開発するためにAIを使用するという概念を提案する。
我々はシリコンをベースとしたField-Programmable Gate Arrayのシミュレーションニューロンを用いた有機人工シナプスを構築した。
次に、解釈されたニューラルネットワークに基づいて生物学的ニューラルネットワークモデルを構築する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:35:21 GMT)
Forget but Recall: Incremental Latent Rectification in Continual Learning [21.6] 変化するデータストリームを継続的に学習する本質的な能力は、ディープニューラルネットワーク(DNN)のデシプラタムである
既存の継続学習アプローチは、リプレイの模範を保ち、学習を規則化し、あるいは新しいタスクに専用容量を割り当てる。
本稿では,Incrmental Latent Rectification (ILR) と呼ばれる,漸進学習のための未探索CL方向について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:57:47 GMT)
A Three-Pronged Approach to Cross-Lingual Adaptation with Multilingual LLMs [21.5] ICLと微調整の3つの言語間移動法について検討した。
LLMにおける支配的な言語を介して、追加の監視信号を追加することで、改善がもたらされることが分かりました。
ターゲット言語を単語の並べ替えに適応させることは、ICLでは有益であるが、その影響は微調整によって減少する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:53:46 GMT)
Fairpriori: Improving Biased Subgroup Discovery for Deep Neural Network Fairness [21.4] 本稿では,新しいバイアス付きサブグループ発見法であるFairprioriを紹介する。
このアルゴリズムは、交差点バイアスの効率的かつ効率的な調査を容易にするために、頻繁なアイテムセット生成アルゴリズムを組み込んでいる。
フェアプリオリは交叉バイアスを特定する際に優れた効果と効率を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 00:15:13 GMT)
Script-Agnostic Language Identification [21.2] コンカニ語、カシミリ語、パンジャービ語などの現代語は、複数の文字で同期的に書かれている。
いくつかの異なる実験手法を用いて,スクリプトに依存しない表現の学習を提案する。
単語レベルのスクリプトランダム化と複数のスクリプトで書かれた言語への露出は、下流のスクリプトに依存しない言語識別に非常に有用である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:23:42 GMT)
LIPE: Learning Personalized Identity Prior for Non-rigid Image Editing [20.9] LIPEは、2段階のフレームワークであり、同じ主題の画像の限られたセットを利用して生成モデルをカスタマイズするように設計されている。
LIPEは、同じ対象の限られた画像集合を用いて生成モデルをカスタマイズする2段階のフレームワークであり、その後、非厳密な画像編集のために学習済みのモデルを用いる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:56:16 GMT)
Variable Layer-Wise Quantization: A Simple and Effective Approach to Quantize LLMs [20.7] 本稿では,大規模言語モデル(LLM)の異なる層を異なるビットレベルで定量化する,シンプルな変数量子化手法を提案する。
具体的には、最も重要な層を高いビット精度に量子化し、低いビットに対して重要でない層を定量化する。
重要度に応じて異なる層を異なるビットで定量化すると、より圧縮されたモデルサイズで性能低下が最小となることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:37:15 GMT)
TemPrompt: Multi-Task Prompt Learning for Temporal Relation Extraction in RAG-based Crowdsourcing Systems [20.7] 時間的関係抽出(TRE)は、出来事や行動の進化を把握し、関連するタスクのワークフローを形成することを目的としている。
本稿では,TRE(TemPrompt)のためのマルチタスク・プロンプト学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:13:15 GMT)
MindSpore Quantum: A User-Friendly, High-Performance, and AI-Compatible Quantum Computing Framework [20.6] 我々は、ノイズの多い中間スケール量子(NISQ)アルゴリズムに重点を置いた、先駆的なハイブリッド量子古典フレームワークであるMindSpore Quantumを紹介する。
コアフレームワークに加えて,量子コンピューティングアクセラレーションエンジンQuPackを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:28:40 GMT)
Machine Unlearning Fails to Remove Data Poisoning Attacks [20.5] データ削除要求に従うことに加えて、未学習の手法の潜在的な応用として、有毒なデータに対するトレーニングの効果を除去することが挙げられる。
実験により,既存のアンラーニング手法は,多くの評価設定において有効であることが実証されているが,データ中毒の影響を除去することはできなかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:05:29 GMT)
Generalized Graph Prompt: Toward a Unification of Pre-Training and Downstream Tasks on Graphs [20.4] GraphPromptは、グラフに関する新しい事前トレーニングおよびプロンプトフレームワークである。
トレーニング済みタスクとダウンストリームタスクを共通タスクテンプレートに統合する。
また、学習可能なプロンプトを使用して、トレーニング済みモデルから最も関連性の高い知識を見つけるために、下流タスクを支援する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:53:57 GMT)
A Text is Worth Several Tokens: Text Embedding from LLMs Secretly Aligns Well with The Key Tokens [20.4] テキストを埋め込みモデルに入力すると、得られたテキストの埋め込みは入力テキストのキートークンと一致します。
この現象は普遍的であり,モデルアーキテクチャ,トレーニング戦略,埋め込み手法の影響を受けないことを示す。
最初のプリンシパルコンポーネントを調整することで、テキストの埋め込みをキートークンと整列することができます。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:55:12 GMT)
Test-Time Generative Augmentation for Medical Image Segmentation [20.1] 本稿では,テスト期間中の医用画像のセグメンテーションを強化する新しい手法を提案する。
入力テスト画像に手作り変換や関数を使う代わりに、先進的なドメインファインチューニング生成モデル(GM)の利用を提唱する。
医用画像分割作業におけるTTGAの有効性と有用性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:53:01 GMT)
Toward Universal Medical Image Registration via Sharpness-Aware Meta-Continual Learning [19.9] ユニバーサル医療画像登録は、幅広い臨床関連タスクを同時に行うことを目的としている。
本稿では,連続的な学習手法を提案することによって,逐次学習シナリオにおける普遍的な3次元医用画像登録の目標を達成するための最初の試みを示す。
脳MRI,腹部CT,肺CT,腹部MRI-CT画像ペアなど,連続的な学習環境下での4つのデータセットに対する本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:15:48 GMT)
Mitigating Hallucination in Fictional Character Role-Play [19.7] 我々は、架空のキャラクターロールプレイにおける幻覚の評価と緩和に焦点を当てる。
本稿では,知識の影響を調節して幻覚を緩和するロールプレイング手法であるRoleFactを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:56:33 GMT)
Multi-Modal Conformal Prediction Regions with Simple Structures by Optimizing Convex Shape Templates [19.5] コンフォーマル予測は、高い確率で有効な機械学習モデルの予測領域を生成する統計ツールである。
共形予測アルゴリズムの重要な構成要素は、モデルの予測が未知の基底真理値とどのように異なるかを定量化するエンフノン整合スコア関数である。
キャリブレーションデータよりもパラメータ化されたエンフシェープテンプレート関数を最適化し,最小体積の予測領域を生成する非整合スコア関数を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:10:41 GMT)
Improving Robustness of LLM-based Speech Synthesis by Learning Monotonic Alignment [19.5] 大規模言語モデル (LLM) に基づくテキスト音声合成システム (TTS) は, 大規模音声データセットの処理や, 新しい話者に対する自然な音声生成において, 顕著な能力を示した。
しかし、LLMベースのTSモデルは、生成した出力が繰り返し単語、欠落した単語、不一致した音声を含むことができるため、堅牢ではない。
エンコーダ・デコーダ・トランスフォーマーモデルを用いてこれらの課題を検証し、与えられたテキストに対する音声トークンの予測訓練において、そのようなモデルにおける特定のクロスアテンションヘッドが暗黙的にテキストと音声アライメントを学習することを確認する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:18:52 GMT)
Local-to-Global Cross-Modal Attention-Aware Fusion for HSI-X Semantic Segmentation [19.5] HSI-X分類のためのローカル・グローバル・クロスモーダル・アテンション・アウェア・フュージョン(LoGoCAF)フレームワークを提案する。
LoGoCAFは、HSIとXのモダリティから情報を学ぶために、ピクセルからピクセルまでのセマンティックセマンティックセマンティックセマンティクスアーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:12:20 GMT)
Benchmarking Large Language Models on Answering and Explaining Challenging Medical Questions [19.4] JAMAクリニカルチャレンジとメドブルレットという2つの新しいデータセットを構築した。
JAMAクリニカルチャレンジは、挑戦的な臨床ケースに基づく質問から成り、メドブルレットはシミュレートされた臨床質問から成り立っている。
各種のプロンプトを用いて2つのデータセット上で7つのLSMを評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:17:09 GMT)
Discrete Diffusion Language Model for Long Text Summarization [19.3] 本稿では,トランスフォーマーのバックボーンが長いシーケンスを効果的に扱えるような,セマンティック・アウェア・ノーミング・プロセスを提案する。
提案手法は,Gigaword,CNN/DailyMail,Arxivの3つのベンチマーク要約データセットに対して,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:55:22 GMT)
GraphSnapShot: Graph Machine Learning Acceleration with Fast Storage and Retrieval [19.2] GraphSnapShotは、グラフ学習のための高速キャッシュ、ストレージ、検索、計算のためのフレームワークである。
ロスレスグラフMLトレーニングでは、最大30%のトレーニングアクセラレーションと73%のメモリ削減を実現することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:00:32 GMT)
BlockLLM: Memory-Efficient Adaptation of LLMs by Selecting and Optimizing the Right Coordinate Blocks [19.0] BlockLLMはブロック座標降下にインスパイアされたアプローチである。
微調整と事前訓練の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:45:12 GMT)
BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity [19.0] BIOSCAN-5Mは、500万以上の昆虫の標本のマルチモーダル情報を含む包括的データセットである。
マルチモーダルデータ型が分類とクラスタリングの精度に与える影響を示すための3つのベンチマーク実験を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:00:48 GMT)
GLoRe: When, Where, and How to Improve LLM Reasoning via Global and Local Refinements [18.9] 最先端の言語モデルは、数学、科学、あるいはコーディングタスクに関する驚くべき推論の洗練能力を示すことができる。
しかし、最高のモデルでさえ、外部からのフィードバックを使わずに、Textitwhenと洗練すべき場所を特定するのに苦労している。
我々は、最適ポリシーの今後の報奨を近似するために、合成データのみに基づいて訓練されたステップワイズORMを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:14:10 GMT)
MedCalc-Bench: Evaluating Large Language Models for Medical Calculations [18.9] 医学における大規模言語モデル(LLM)を評価するための現在のベンチマークは、主にドメイン知識と記述的推論を含む質問応答に焦点を当てている。
我々は,LSMの医療計算能力を評価することを目的とした,第一種データセットであるMedCalc-Benchを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:45:49 GMT)
SpecExec: Massively Parallel Speculative Decoding for Interactive LLM Inference on Consumer Devices [18.8] SpecExecは単純な並列デコード方式で、LLMファミリ向けのターゲットモデルイテレーション毎に最大20個のトークンを生成することができる。
我々は,RAMオフロードが4~6トークン/秒,量子化が4ビット,あるいは16ビット重みが2~3トークン/秒の一般GPU上で50B以上のパラメータLLMを推定した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:35:06 GMT)
InterVLS: Interactive Model Understanding and Improvement with Vision-Language Surrogates [18.8] ディープラーニングモデルは重要なアプリケーションで広く使われており、事前デプロイモデルの理解と改善の必要性を強調している。
視覚的な概念ベースのメソッドは、この目的のためにますます使われてきているが、(1)ほとんどの概念は解釈可能性に欠け、(2)既存のメソッドはモデル知識を必要とし、しばしば実行時に利用できない。
本稿では,テキストに整合した概念を発見し,モデルに依存しない線形サロゲートによる影響を測定することによって,モデル理解を容易にするInterVLSを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:37:48 GMT)
InFiConD: Interactive No-code Fine-tuning with Concept-based Knowledge Distillation [18.8] 本稿では,知識蒸留プロセスの実装に視覚的概念を活用する新しいフレームワークであるInFiConDを提案する。
本研究では,概念コーパスからテキストに沿った視覚概念を抽出し,新しい知識蒸留パイプラインを構築する。
InFiConDのインタフェースは、ユーザインタフェース内で概念の影響を直接操作することで、対話的に学生モデルを微調整することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:56:45 GMT)
D2LLM: Decomposed and Distilled Large Language Models for Semantic Search [18.6] D2LLMs-Decomposed and Distilled LLMs for semantic search。
クロスエンコーダを効率的なバイエンコーダに分解し,マルチヘッド・アテンションとインタラクション・エミュレーション・モジュールによるポーリングと統合する。
実験の結果,D2LLMは3つのタスクにまたがるすべての指標において,主要なベースラインを5つ超えていることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:03:04 GMT)
ALPBench: A Benchmark for Active Learning Pipelines on Tabular Data [18.6] ラベル付きデータの予算額のみが手に入るような環境では、アクティブラーニングはラベル付けすべき最も情報性の高いデータポイントを選択するためのクエリ戦略を考案しようとする。
活発な学習文献において,このようなクエリ戦略が提案され,比較されている。
コミュニティは、異なるクエリ戦略のパフォーマンスを比較するための標準ベンチマークをまだ持っていない。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:14:14 GMT)
Self-Supervised Embeddings for Detecting Individual Symptoms of Depression [18.4] 世界の数百万人に影響を及ぼす精神疾患であるうつ病は、信頼できるアセスメントシステムを必要としている。
我々は、自己教師付き学習(SSL)ベースの音声モデルを利用して、このタスクで頻繁に遭遇する小さなデータセットをよりよく活用する。
抑うつ症状を効果的に識別するためのマルチタスク学習の重要性を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:35:37 GMT)
Comprehensive Evaluation of Large Language Models for Topic Modeling [18.3] トピックモデリングのための大規模言語モデル(LLM)を定量的に評価する。
LLMは幻覚の少ないコヒーレントで多様なトピックを識別できるが、文書の一部だけに着目してショートカットを行う可能性がある。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:42:53 GMT)
Retrieval-Augmented Code Generation for Situated Action Generation: A Case Study on Minecraft [18.3] Minecraft Collaborative Building Taskでは、2人のプレーヤーが協力する。 アーキテクト(A)がビルダー(B)に指示を与え、3Dブロックを使って特定の構造を組み立てる。
本研究では,大規模言語モデル (LLM) を用いて,ビルダが行う動作の順序を予測する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:43:24 GMT)
Robustly Optimized Deep Feature Decoupling Network for Fatty Liver Diseases Detection [18.2] 現在の医用画像分類の取り組みは主に、より高い平均性能を目指しています。
大量のデータをサポートせずに、深層学習は脂肪肝のきめ細かい分類の課題に直面している。
本稿では,機能分離と適応的対人訓練を組み合わせた革新的なディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:50:09 GMT)
EDEN: Empathetic Dialogues for English learning [18.2] 学生の情熱と忍耐は、言語学習の成功に結びついている。
最近の研究は、学生が英語の教師をより支援的だと認識するにつれて、彼らの満足度が向上していることを証明している。
本実験は,適応的共感フィードバックを用いることで,学生の満足度の増加を予測できる感情支援が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:36:16 GMT)
What Do the Circuits Mean? A Knowledge Edit View [18.0] GPT2-XLモデルにおいて,多様なテキスト分類データセットを用いて回路を抽出する。
以上の結果から,これらの回路はエンティティ知識を含むが,知識編集において補完回路よりも新しい知識に抵抗することが示唆された。
その結果、回路の60%は、注意や正規化ではなく、層モジュールで構成されていることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:09:53 GMT)
How Well Can Knowledge Edit Methods Edit Perplexing Knowledge? [18.0] 本研究では,「複雑度」の異なる知識を取り入れた知識編集手法の能力について検討する。
新たな知識の「複雑さ」と12シナリオの編集効率との間に有意な負の相関関係が認められた。
知識階層が編集結果に与える影響のさらなる調査は、より階層的な水準にある知識が、いくつかのシナリオにおいて変更することがより困難であることを示唆している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:41:02 GMT)
Inherent Challenges of Post-Hoc Membership Inference for Large Language Models [18.0] 大規模言語モデル(LLM)は、しばしば大量の未公開データに基づいて訓練され、ポストホックなメンバーシップ推論攻撃(MIA)の開発を動機付けている。
我々は、収集されたメンバーと非メンバーのデータセット間の潜在的分布シフトによるポストホックMIA評価における固有の課題を同定する。
本稿では,ポストホックデータ収集における回帰不連続性設計(RDD)アプローチを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:12:07 GMT)
Transformer Normalisation Layers and the Independence of Semantic Subspaces [18.0] 我々は意味的部分空間を、注意分布を完全に決定できる潜在表現の任意の独立部分空間とみなす。
最先端の変圧器が使用する正規化層の配置であるPre-Normは,この能力に反することを示す。
標準値が$lesssim$10%で人工的に摂動されるとき、1%の回路崩壊率を観測する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:16:38 GMT)
Discrete Multimodal Transformers with a Pretrained Large Language Model for Mixed-Supervision Speech Processing [17.9] DMLM(Decoder-only Discrete Multimodal Language Model)を提案する。
DMLMは、複数のタスク(ASR、T2S、S2TTなど)とモダリティ(テキスト、音声、ビジョン)に柔軟に適用できる。
その結果,DMLMは複数のタスクやデータセットにまたがって,教師なしと教師なしのトレーニングの組み合わせによって大きなメリットがあることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:44:00 GMT)
CAT: Interpretable Concept-based Taylor Additive Models [17.7] 一般化付加モデル(GAM)は、機能レベルでディープニューラルネットワーク(DNN)を説明することができる。
GAMは多数のモデルパラメータを必要とし、オーバーフィットする傾向があり、トレーニングやスケールが困難になる。
我々は、このプロセスに対して、新しい解釈可能な概念bAsed Taylor加法モデルであるCATを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:43:15 GMT)
PAFT: A Parallel Training Paradigm for Effective LLM Fine-Tuning [17.7] 大規模言語モデル(LLM)は、多様な自然言語処理(NLP)タスクにおいて顕著な能力を示している。
LLMは通常、制御された微調整(SFT)を行い、その後、下流のアプリケーションで使用できるように調整する。
本稿では,PLMファインチューニングのための新しいPArallelトレーニングパラダイムであるPAFTを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:11:37 GMT)
FSBI: Deepfakes Detection with Frequency Enhanced Self-Blended Images [17.7] 本稿では、ディープフェイク検出のための周波数強調自己ブレンド画像手法を提案する。
提案手法はFF++とCeleb-DFデータセットで評価されている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:12:20 GMT)
When Large Language Models Meet Optical Networks: Paving the Way for Automation [17.5] 物理層をインテリジェントに制御し,アプリケーション層との相互作用を効果的に行うことを目的として,LLMを利用した光ネットワークのフレームワークを提案する。
提案手法は,ネットワークアラーム解析とネットワーク性能最適化の2つの典型的なタスクで検証される。
良好な応答精度と2,400個のテスト状況のセマティックな類似性は、光ネットワークにおけるLLMの大きな可能性を示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:23:00 GMT)
MIRReS: Multi-bounce Inverse Rendering using Reservoir Sampling [17.4] 本稿では,新しい2段階逆レンダリングフレームワークであるMIRReSを紹介する。
提案手法は, ステージ1で明示的な幾何(三角形メッシュ)を抽出し, より現実的な物理ベースの逆レンダリングモデルを導入する。
本手法は,自己陰影や内部反射を含む間接照明を効果的に推定する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:19:14 GMT)
Probing many-body Bell correlation depth with superconducting qubits [17.3] 本稿では,量子多体系における非局所性を示す,真のマルチパーティイトベル相関の実験的証明について報告する。
特にベル相関の証人としてエネルギーを使用し、しきい値の階層にまたがる多体系のエネルギーを変動的に減少させる。
提案手法は, 量子デバイス間の絡み合いを超越した, より微細なベンチマークを提供する, マルチパーティタイトベル相関の作成と証明に有効なアプローチを確立した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:00:00 GMT)
Deep Frequency-Aware Functional Maps for Robust Shape Matching [17.3] 本稿では、Deep Frequency-Aware Functional Mapと呼ばれる、教師なし学習に基づく新しいフレームワークを提案する。
まずスペクトルフィルタ演算子保存という一般制約を導入し,所望の関数写像を計算した。
次に,提案した制約を損失関数として直接利用して,関数写像,点写像,フィルタ関数を同時に監視する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:13:58 GMT)
Large Language Models in Healthcare: A Comprehensive Benchmark [17.2] 診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
実世界の実践に近い6つの新しいデータセットと複雑な臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:23:22 GMT)
VarBench: Robust Language Model Benchmarking Through Dynamic Variable Perturbation [16.9] 本稿では,ベンチマークをバリビライズし,動的に言語モデルを評価することを提案する。
具体的には、各テストケースから変数を抽出し、各変数の値範囲を定義する。
それぞれの評価のために、これらの値から新しい値をサンプリングし、ユニークなテストケースを作成します。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:13:53 GMT)
Human-Object Interaction from Human-Level Instructions [16.7] 対象動作,全体動作,指動作を人体レベルで同時に合成できる最初の完全システムを提案する。
実験では,高レベルプランナが多目的物体の現実的相互作用を合成する上で,高レベルな目標レイアウトの生成に有効であることを実証した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:46:28 GMT)
Einstein-Podolsky-Rosen steering paradox "2=1'' for $N$ qubits [16.7] EPRパラドックスは、量子力学の局所的な現実的な説明がないことを強調している。
純粋な状態条件と測定条件の両方を満たす限り、この矛盾は任意の$N$-qubit状態に対して成り立つことを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:28:26 GMT)
ID-Animator: Zero-Shot Identity-Preserving Human Video Generation [16.4] ID-アニメーター(ID-Animator)は、単一の参照顔画像からパーソナライズされたビデオを生成する、ゼロショットのヒューマンビデオ生成アプローチである。
本手法は,アニメーションフや各種コミュニティバックボーンモデルのような,トレーニング済みのT2Vモデルと互換性が高い。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:57:27 GMT)
Sequential Model for Predicting Patient Adherence in Subcutaneous Immunotherapy for Allergic Rhinitis [16.4] 本研究は, 逐次逐次変量モデル(SLVM)と長短期記憶(LSTM)の2つのモデルを開発し, 解析する。
SLACモデルの予測付着精度は60%から72%であり、LSTMモデルでは66%から84%であり、時間ステップによって異なる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:01:58 GMT)
LLMs Are Zero-Shot Context-Aware Simultaneous Translators [16.3] 大きな言語モデル(LLM)が注目されているのは、その汎用性と幅広い言語タスクにおける強力なパフォーマンスのおかげでである。
ここでは,オープンソースのLLMが同時機械翻訳(SiMT)タスクにおいて,最先端のベースラインと同等以上の性能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:45:19 GMT)
PiPar: Pipeline Parallelism for Collaborative Machine Learning [16.1] 協調機械学習(CML)技術は、複数のモバイルデバイスとサーバにまたがるディープラーニングモデルをトレーニングするために提案されている。
CML技術は、デバイスからの生データをサーバと共有するのではなく、各デバイスでトレーニングされたローカルモデルとしてプライバシ保存される。
低資源利用の主要因として,シーケンシャルな計算と通信により,サーバやデバイス上でのアイドリングリソースを同定する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:17:27 GMT)
Towards Zero-Shot Text-To-Speech for Arabic Dialects [16.1] ZS-TTS (Zero-shot Multi-Speaker text-to-speech) システムは英語に進歩しているが、リソース不足のためまだ遅れている。
まず、既存のデータセットを音声合成のニーズに合わせて適応させることにより、アラビア語のこのギャップに対処する。
アラビア語の方言識別モデルを用いて、予め定義された方言ラベルが多言語環境でのZS-TTSモデルの改善に与える影響を探索する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:18:21 GMT)
Quantification of Entanglement and Coherence with Purity Detection [16.0] 絡み合いとコヒーレンス(英語版)は量子システムの基本的な性質であり、近い将来の量子技術に電力を供給することを約束する。
ここでは,操作上有用な絡み合いとコヒーレンスに対する定量的な境界を示す。
我々の研究は、大規模量子情報処理を効果的に検証する手段を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:21:34 GMT)
Annotating FrameNet via Structure-Conditioned Language Generation [15.9] 本稿では、過剰な生成とフィルタのアプローチに従って、新しいフレーム文の注釈付き文を生成するフレームワークを提案する。
以上の結果から,リッチで明示的な意味情報に対する条件付けは,人間の受容度が高い世代を生み出す傾向が示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:54:19 GMT)
A New Perspective on Shampoo's Preconditioner [15.8] 2階最適化アルゴリズムであるShampooは最近、機械学習コミュニティからの注目を集めている。
我々は、これらの行列の $textit$ Kronecker 積近似と Shampoo による近似との明示的で斬新な接続を提供する。
さまざまなデータセットで、最適なKronecker製品近似に近いことを実証的に実証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:34:51 GMT)
Highly Constrained Coded Aperture Imaging Systems Design Via a Knowledge Distillation Approach [15.7] 本稿では,高度に物理的に制約されたCOIシステムの設計のための知識蒸留(KD)フレームワークを提案する。
単色・マルチスペクトル画像再構成のためのバイナリ符号化開口単画素カメラを用いて,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:03:48 GMT)
Learning Decentralized Multi-Biped Control for Payload Transport [15.3] 我々は、車輪をキャリヤに取り付けられた複数の二足歩行ロボットに置き換える多足歩行ロボットキャリアについて検討する。
私たちの主な貢献は、このようなシステムのための分散コントローラの設計です。
実世界への移動を支援するシミュレーションにおいて,制御器を訓練するための強化学習手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:08:44 GMT)
Unified Auto-Encoding with Masked Diffusion [15.3] 我々はUMD(Unified Masked Diffusion)と呼ばれる,統合された自己監督的目標を提案する。
UMDは、パッチベースとノイズベースの破損テクニックを1つの自動エンコーディングフレームワークに組み合わせている。
下流の生成および表現学習タスクにおいて、高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:24:34 GMT)
CTBench: A Comprehensive Benchmark for Evaluating Language Model Capabilities in Clinical Trial Design [15.2] CTBenchは、臨床研究設計を支援するために言語モデル(LM)を評価するベンチマークとして導入された。
このデータセットは、2つのデータセットで構成されている: "CT-Repo" は、臨床試験.govから得られた1,690の臨床試験のベースライン特徴を含み、"CT-Pub"は、関連する出版物から集められたより包括的なベースライン特徴を持つ100の試験のサブセットである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:52:48 GMT)
Medical Image Segmentation Using Directional Window Attention [15.1] 医用画像セグメンテーションのための階層型エンコーダデコーダアーキテクチャであるDwinFormerを紹介する。
DwinFormerは、入力特徴マップの水平方向、垂直方向、深度方向に沿って、ローカルおよびグローバルな情報をキャプチャする。
挑戦的な3DMulti-organデータセットとCell HMSデータセットに関する実験は、DwinFormerのメリットを実証しています。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:15:56 GMT)
Towards Optimal Trade-offs in Knowledge Distillation for CNNs and Vision Transformers at the Edge [15.1] 我々は、CNNとViTアーキテクチャのKDプロセスの比較分析を行う。
学生モデルのサイズが精度と推論速度に与える影響について検討する。
第3に,高解像度画像の精度,メモリフットプリント,計算負荷に対する効果を検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:15:02 GMT)
Multi-property Steering of Large Language Models with Dynamic Activation Composition [15.0] アクティベーションステアリング法は,モデルの中間表現を加法的に介入することで,言語モデル生成の条件付けに有効であることが示された。
我々は、様々な活性化ステアリング戦略を総合的に評価し、世代を通して堅牢な影響を確実にするために最適なパラメータの性質に依存している点を強調した。
マルチプロパティステアリング実験により,コンディショニングが生成に与える影響を最小限に抑えつつ,高コンディショニングの維持に成功していることが示された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:00:42 GMT)
Arboretum: A Large Multimodal Dataset Enabling AI for Biodiversity [14.9] このデータセットには136万の画像が含まれており、既存のデータセットの規模を桁違いに越えている。
このデータセットは、鳥類(Aves)、クモ/ティックス/ミツ(Arachnida)、昆虫(usha)、植物(Plantae)、菌類/ムルーム(Fungi)、カタツムリ(Mollusca)、ヘビ/昆虫(Reptilia)から様々な種の画像言語対のデータを含む。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:09:54 GMT)
Dynamic Scheduling for Vehicle-to-Vehicle Communications Enhanced Federated Learning [14.9] 車両連系学習(VFL)は、連結車両のエッジトレーニングに応用されている。
VFLトレーニング性能を最適化するために最適化問題を定式化する。
本稿では,V2Vを拡張した動的スケジューリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:15:53 GMT)
Improving Arithmetic Reasoning Ability of Large Language Models through Relation Tuples, Verification and Dynamic Feedback [14.9] 本稿では,大規模言語モデルの推論ステップを表現するために,半構造化形式を提案する。
具体的には、人間だけでなく、マシンフレンドリで、自然言語よりも容易に検証できる関係を使います。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:21:00 GMT)
HGTDP-DTA: Hybrid Graph-Transformer with Dynamic Prompt for Drug-Target Binding Affinity Prediction [14.9] 薬物標的結合親和性(DTA)は薬物スクリーニングの重要な基準である。
本研究では,HGTDP-DTAと呼ばれる新しいDTA予測手法を提案する。
本手法は,各薬物・標的ペアに対してコンテキスト特異的なプロンプトを生成し,ユニークな相互作用を捕捉するモデルの能力を高める。
Davis と KIBA の2つの広く使われている公開データセットの実験により、HGTDP-DTA は予測性能と一般化能力の両方において最先端のDTA予測手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:33:33 GMT)
OmAgent: A Multi-modal Agent Framework for Complex Video Understanding with Task Divide-and-Conquer [14.5] 広範なビデオの処理は、膨大なデータと処理要求のために大きな課題をもたらします。
我々はOmAgentを開発し、特定のクエリの関連ビデオフレームを効率的に保存し、検索する。
自律推論が可能なDivide-and-Conquer Loopを備えている。
より高度な自律性と堅牢なツールコールシステムを備えており、さらに複雑なタスクを達成できます。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:43:41 GMT)
Towards Building an End-to-End Multilingual Automatic Lyrics Transcription Model [14.4] 利用可能なデータセットを用いた多言語ALTシステムの構築を目指している。
英語のALTに有効であることが証明されたアーキテクチャにヒントを得て,これらの手法を多言語シナリオに適用する。
単言語モデルと比較して,多言語モデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:02:32 GMT)
A Comprehensive Solution to Connect Speech Encoder and Large Language Model for ASR [14.4] 近年,音声認識のための言語エンコーダを大規模言語モデル (LLM) に接続する手法が提案されている。
しかし、微調整オプションの制限、音声テキストアライメントを強制するメカニズムの欠如、挿入エラーの増大など、いくつかの制限が続く。
本稿では,これらの課題に対処するための包括的解決策を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:35:50 GMT)
FAIIR: Building Toward A Conversational AI Agent Assistant for Youth Mental Health Service Provision [14.2] FAIIR(Frontline Assistant: Issue Identification and Recommendation)を開発した。
主な目的は、CRの認知的負担を軽減し、課題識別の精度を高め、会話後の管理作業を効率化することである。
その結果,FAIIRの平均AUCROCは94%,サンプル平均F1スコアは64%,サンプル平均リコールスコアは81%であった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:18:14 GMT)
Learning Point Spread Function Invertibility Assessment for Image Deconvolution [14.1] ニューラルネットワークを用いて任意のPSFの可逆性を学習するために非線形アプローチを用いるメトリクスを提案する。
マッピングされたPSFとユニットインパルスとの差は、DLネットワークによるインバージョンの成功率が高いことを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:35:10 GMT)
Overcoming the Paradox of Certified Training with Gaussian Smoothing [14.1] 敵の例に対して高い精度でニューラルネットワークを訓練することは、未解決の問題である。
ガウスロス平滑化が両問題を緩和できることを理論的に示す。
この結果から,強靭なニューラルネットワークのトレーニングにおいて,ガウスロス平滑化が期待できることが明らかとなった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:46:24 GMT)
Predicting the Big Five Personality Traits in Chinese Counselling Dialogues Using Large Language Models [14.0] 本研究では,ラージ言語モデル(LLM)がカウンセリング対話から直接,ビッグファイブの性格特性を予測できるかどうかを検証した。
本フレームワークは,カウンセリングセッションにおけるLLMの条件付けにロールプレイとアンケートに基づくプロンプトを適用した。
我々のモデルは130.95%の改善を実現し、現在最先端のQwen1.5-110Bを36.94%上回った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:30:55 GMT)
CuDA2: An approach for Incorporating Traitor Agents into Cooperative Multi-Agent Systems [13.8] CMARLシステムに反抗剤を注入する新しい手法を提案する。
TMDPでは、裏切り者は被害者エージェントと同じMARLアルゴリズムを用いて訓練され、その報酬機能は被害者エージェントの報酬の負として設定される。
CuDA2は、特定の被害者エージェントのポリシーに対する攻撃の効率性と攻撃性を高める。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:59:31 GMT)
Empirical Bayes for Dynamic Bayesian Networks Using Generalized Variational Inference [13.8] 本研究では,動的ベイズネットワークを学習するための経験的ベイズアプローチを実演する。
構造と重みのいくつかの点推定から始めることで、データ駆動モデルを使用して不確実性を定量化することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:34:51 GMT)
In value-based deep reinforcement learning, a pruned network is a good network [13.8] 段階的等級プルーニングにより,パラメータの有効性を最大化できることを示す。
この結果、従来のネットワークよりも劇的なパフォーマンス向上をもたらすネットワークが生まれる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:10:06 GMT)
DK-SLAM: Monocular Visual SLAM with Deep Keypoint Learning, Tracking and Loop-Closing [13.5] 公開されているデータセットに対する実験的評価は、DK-SLAMが従来のSLAMシステムと学習ベースのSLAMシステムより優れていることを示している。
本システムでは,キーポイント抽出ネットワークの学習を最適化するために,モデル非依存メタラーニング(MAML)戦略を採用している。
累積的な位置決め誤差を軽減するため、DK-SLAMはループ閉鎖検出にバイナリ機能を利用する新しいオンライン学習モジュールを組み込んだ。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:15:03 GMT)
FrenchToxicityPrompts: a Large Benchmark for Evaluating and Mitigating Toxicity in French Texts [13.5] 大規模言語モデル(LLM)はますます普及しているが、バイアス、有害、有害な言語を生み出す傾向にある。
自然発生のフランスプロンプト50Kのデータセットである FrenchToxicityPrompts を作成した。
LLMの4つの主要なオープンソースファミリから14の異なるモデルを評価し,その毒性を評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:02:11 GMT)
Distribution Learnability and Robustness [13.5] 確率分布のクラスが実現可能な学習可能性を示すことは,その学習可能性を示すものではない。
続いて、分散クラスの学習性を阻害するデータ破損の種類について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:09:54 GMT)
Fundamental Bounds on Online Strategic Classification [13.4] 戦略設定において,決定論的アルゴリズムが$o(Delta)$の誤りを達成できないことを示す。
また、これを非依存の設定に拡張し、$Delta$乗法後悔のアルゴリズムを得る。
我々は,不愉快な,適応的な両敵に対して,サブ線形後悔境界を実現するランダム化アルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:06:33 GMT)
Retrieval Augmented Instruction Tuning for Open NER with Large Language Models [13.3] オープンネームエンティティ認識(NER)の課題に焦点をあてて,IE用検索強化教育チューニング(RA-IT)について検討する。
各トレーニングサンプルに対して、トレーニングデータセットから意味論的に類似したサンプルをコンテキストとして検索し、元の命令の入力にプリペイトする。
実験により, RA-ITの有効性は, 様々なデータサイズ, 英語と中国語のシナリオで検証された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:24:50 GMT)
MAGIC: Meta-Ability Guided Interactive Chain-of-Distillation for Effective-and-Efficient Vision-and-Language Navigation [13.3] 本稿では,軽量な学生モデルを得るために,メタ能力誘導型対話型チェインオブ蒸留(MAGIC)法を提案する。
私たちの最小のモデルであるMAGIC-Sは、教師のサイズが5%(11M)しかなく、同じトレーニングデータの下で過去の方法よりも優れています。
我々の最大のモデルであるMAGIC-Lは、以前の最先端モデルを上回る5.84%のSPL、3.18%のSRである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:33:41 GMT)
A Large-scale Investigation of Semantically Incompatible APIs behind Compatibility Issues in Android Apps [13.2] Android Open Source Project(AOSP)において、互換性のないAPIを大規模に発見する。
非互換なAPI,特にセマンティックな変更を検出するための統合フレームワークを提案する。
提案手法は,バージョン4からバージョン33までの互換性のない5,481のAPIを検出する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:12:37 GMT)
Exploring Test-Time Adaptation for Object Detection in Continually Changing Environments [13.2] 連続的テスト時間適応(CTTA)は、継続的に変化するターゲットドメインから引き出されたデータに対して、徐々にソース学習されたモデルを適応させる、有望な手法として登場した。
我々はCTTAシナリオにおける検出モデルの性能向上を目的としたCTAODを提案する。
CTAODが既存手法よりも優れている対象検出のための4つのCTTAタスクに対するアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:16:47 GMT)
ARES: Alternating Reinforcement Learning and Supervised Fine-Tuning for Enhanced Multi-Modal Chain-of-Thought Reasoning Through Diverse AI Feedback [13.2] 強化学習(RL)と教師付きファインチューニング(SFT)を交互に行う2段階アルゴリズムARESを提案する。
第一に、我々は教師に、各文が問題の解決にどれだけ貢献するかを、CoT(Chain-of-Thought)で得点するように要求する。
次に,教師にRL後の誤った推論の修正を依頼する。補正フィードバックにより,SFTによるRL微調整モデルを安定化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:20:11 GMT)
Greedy equivalence search for nonparametric graphical models [13.2] GESは、有向非巡回グラフ(DAG)モデルの構造を一貫して推定することが知られている。
しかし、一般的な非パラメトリックDAGモデルをカバーする一般的な理論は欠落している。
ここでは、マルコフ分解の滑らかさ条件を満たすDAGモデルの一般族に対するグリーディ同値探索の整合性を確立する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:31:32 GMT)
On the consistency of hyper-parameter selection in value-based deep reinforcement learning [13.1] 本稿では,値に基づく深層強化学習エージェントのハイパーパラメータ選択の信頼性に着目した実証的研究を行う。
我々の研究は、どのハイパーパラメーターがチューニングに最も重要かを確立するのに役立ち、どのチューニングが異なるトレーニング体制間で一貫性を持ち続けるかを明らかにするのに役立ちます。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:06:09 GMT)
Expansive Synthesis: Generating Large-Scale Datasets from Minimal Samples [13.1] 本稿では,最小限のサンプルから高忠実度データセットを生成する革新的な拡張合成モデルを提案する。
生成したデータセットの分類器をトレーニングし,より大規模でオリジナルなデータセットでトレーニングされたパフォーマンストリバーサを比較して,拡張的合成を検証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:59:02 GMT)
Performative Debias with Fair-exposure Optimization Driven by Strategic Agents in Recommender Systems [12.9] 本稿では,戦略エージェントによって駆動される公正露光最適化を用いた動的設定における再ランク付け手法を提案する。
共同目標は、テールアイテムの視認性を高めながらレコメンデーションのパフォーマンスを確保することである。
提案手法の有効性と優位性を実証し,特にテールアイテムの可能性を明らかにするために検討した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:41:50 GMT)
I Don't Know You, But I Can Catch You: Real-Time Defense against Diverse Adversarial Patches for Object Detectors [12.8] 我々は,高い一般化,堅牢性,効率性を備えた,敵パッチ検出の革新的なモデルである textitNutNet を提案する。
本手法は, HA と AA の既存手法よりも 2.4 倍, 4.7 倍高い平均防御性能を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:11:46 GMT)
Disce aut Deficere: Evaluating LLMs Proficiency on the INVALSI Italian Benchmark [12.7] 大規模言語モデル(LLM)を英語以外の言語で評価することは、その言語的汎用性、文化的妥当性、そして多様なグローバルな文脈における適用性を保証するために不可欠である。
InVALSIテストは、イタリア全土の教育能力を測定するために設計された、確立された評価セットである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:20:08 GMT)
When does Self-Prediction help? Understanding Auxiliary Tasks in Reinforcement Learning [12.7] 強化学習における観察再構成や潜時自己予測などの補助学習タスクが表現学習問題に与える影響について検討する。
本稿では,注意散逸や観察機能の存在下での観察再構成,潜時自己予測,およびTD学習の学習力学に関する理論的解析を行う。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:06:57 GMT)
Fast and Uncertainty-Aware SVBRDF Recovery from Multi-View Capture using Frequency Domain Analysis [12.5] 本稿では,信号処理の観点からの取得プロセスについて考察する。
物体表面の材料特性を数秒で推定する。
次に、利用可能なデータに基づいて、推定の不確かさを定量化し、事前または追加サンプルが必要な領域を強調します。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:59:06 GMT)
Towards Federated Low-Rank Adaptation with Rank-Heterogeneous Communication [12.5] 低ランク適応 (LoRA) の実証的性能は, ランク不均一性に関して非常に不安定であることがわかった。
この不安定性の根本原因は、従来の連合LoRAフレームワークで採用されているゼロパディングベースのアグリゲーション戦略である。
我々は、高品質なデータセットを持つクライアントからの情報をよりよく活用する、レプリケーションベースの新しいパディング戦略を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:49:33 GMT)
Detecting Frames in News Headlines and Lead Images in U.S. Gun Violence Coverage [12.5] 新聞記事のフレームを識別するために,リード画像と文脈情報をテキストと組み合わせることの価値について検討する。
米国における銃暴力に関する最初のマルチモーダルニュースフレーミングデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:56:47 GMT)
Generative AI Systems: A Systems-based Perspective on Generative AI [12.4] 大規模言語モデル(LLM)は、自然言語を用いた機械との通信を可能にすることで、AIシステムに革命をもたらした。
ジェネレーティブAI(GenAI)の最近の進歩は、マルチモーダルシステムとしてLLMを使うことに大きな期待を示している。
本稿では,ジェネレーティブAIシステムにおける新たな研究の方向性を探求し,述べることを目的とする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:51:47 GMT)
Consensus Learning with Deep Sets for Essential Matrix Estimation [12.4] 本稿では,Deep Setsに基づくよりシンプルなネットワークアーキテクチャを提案する。
提案手法は,不整点一致を同定し,不整点一致の変位雑音をモデル化する。
重み付きDLTモジュールはこれらの予測を使って必須行列を回帰する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:37:09 GMT)
Latent Optimal Paths by Gumbel Propagation for Variational Bayesian Dynamic Programming [12.2] 本稿では,Gumbel分布の特性を用いて,Gibs分布とメッセージパスアルゴリズムの等価性を示す。
本稿では,構造化されたスパース最適経路を潜在変数としてキャプチャするBDP-VAEを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:13:38 GMT)
Facial Identity Anonymization via Intrinsic and Extrinsic Attention Distraction [12.1] 本研究は,本質的および外生的アイデンティティの注意をそらすことによって,新たな顔の匿名化手法を提案する。
当社のアプローチでは,顔の外観や形状を柔軟かつ直感的に操作することで,多様な結果が得られる。
ユーザに対して、パーソナライズされた匿名化の実行を指示するためにも使用できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:07:55 GMT)
DeepSense-V2V: A Vehicle-to-Vehicle Multi-Modal Sensing, Localization, and Communications Dataset [12.0] 本研究は、mmWave車両間通信を研究するための、最初の大規模マルチモーダルデータセットを示す。
このデータセットには、日夜120kmの都市間および農村部で運転する車両が含まれており、最高速度は時速100kmである。
トラックから自転車まで、あらゆる画像から100万件以上の物体が検出されました。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:43:49 GMT)
Minimal Interaction Edge Tuning: A New Paradigm for Visual Adaptation [11.7] 我々は、エッジチューニングと呼ばれる新しいビジュアル適応パラダイムを探求し、大規模な事前訓練されたモデルを、強力なクラウドサーバ上で動作するスタンドアロンの機能抽出器として扱う。
この微調整は、少ない計算資源を必要とする小さなネットワークを持つエッジデバイス上で実行される。
そこで本研究では,事前学習したモデルから得られた中間的特徴の総和が最小限の情報伝達と高適応性を有することを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:54:39 GMT)
Truthful Aggregation of LLMs with an Application to Online Advertising [11.6] 大規模言語モデル(LLM)は、オンラインプラットフォームのサービスに統合されている。
これにより、LLM生成コンテンツから収益を生み出すことが、オンライン広告における次の大きな課題となる。
LLM微調整なしで動作可能な,この問題に対するオークション機構を導入する。
当社のメカニズムは,計算オーバーヘッドの少ない広告主の価値とプラットフォーム収益を著しく向上させることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:31:31 GMT)
Cavity Modified Oscillating Bound States with a $Λ$-type giant emitter in a linear waveguide [11.5] 3レベル巨大原子(3GA)、真空状態の導波路、単一モードキャビティからなるシステムについて検討した。
導波路内の3GAとその放射場を長時間にわたって解析した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:07:24 GMT)
Tell Me Where You Are: Multimodal LLMs Meet Place Recognition [11.4] 視覚的位置認識(VPR)にマルチモーダル大言語モデル(MLLM)を導入する。
我々のキーとなる設計は、視覚に基づく検索を用いて複数の候補を提案し、言語に基づく推論を利用して最終決定のために各候補を慎重に検査することである。
3つのデータセットから得られた結果から,VFMの汎用的視覚特徴とMLLMの推論能力の統合が,すでに有効な位置認識ソリューションを提供していることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:59:46 GMT)
T-MAC: CPU Renaissance via Table Lookup for Low-Bit LLM Deployment on Edge [11.3] 本稿では, CPU 上での低ビット LLM (ウェイト量子化 LLM) 推論を効率的に行う革新的なルックアップテーブル T-MAC を提案する。
T-MACは不等化せずにmpGEMMを直接サポートし、同時に乗算を排除し、必要な加算を減らす。
低ビットLlamaモデルとBitNetモデルで評価したところ、T-MACはスループットを最大4倍に向上し、エネルギー消費を70%削減した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:38:38 GMT)
A Data-Centric Approach To Generate Faithful and High Quality Patient Summaries with Large Language Models [11.2] 幻覚のないデータの微調整は、Llama 2の要約毎の幻覚を2.60から1.55に効果的に減少させる。
一般的なメトリクスは、忠実さや品質とよく相関しないことがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:02:10 GMT)
Can independent Metropolis beat crude Monte Carlo? [11.1] 独立メトロポリス推定器がKL の発散の下で別の密度$q$に十分近い場合、提案密度$q$で$pi$からサンプルを得る。
提案手法は,KLの目標との偏差が低減されるように,提案密度に適応する適応型独立メトロポリスアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:38:53 GMT)
TRAWL: Tensor Reduced and Approximated Weights for Large Language Models [11.1] 大規模言語モデル(LLM)は人工知能を変革し、最近の進歩を触媒し、環境と計算のかなりの負担を課している。
本稿では,テンソル分解によるLLMの最適化手法であるTRAWLを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:01:32 GMT)
The ALCHEmist: Automated Labeling 500x CHEaper Than LLM Data Annotators [11.1] 大規模な事前訓練されたモデルは、アノテータとして使用することができ、クラウドワーカーを置き換えたり拡張したりするのに役立ちます。
最上位モデルを採用する場合、APIコールに数千ドルを支払わなければならない場合が多い。
事前訓練されたモデルからラベルを直接クエリする代わりに、ラベルを生成するプログラムを生成するようにモデルをタスクする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:58:26 GMT)
Multimodal Cross-Task Interaction for Survival Analysis in Whole Slide Pathological Images [11.0] 病理像とゲノムプロファイルを利用した生存予測は、癌解析と予後においてますます重要である。
既存のマルチモーダル手法は、補完的な情報を統合するためのアライメント戦略に依存していることが多い。
本稿では,サブタイプ分類と生存分析タスクの因果関係を明らかにするために,MCTI(Multimodal Cross-Task Interaction)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:18:35 GMT)
A Survey on Safe Multi-Modal Learning System [10.9] マルチモーダル学習システム(MMLS)は、様々なモーダル入力から情報を処理し統合する能力で注目を集めている。
安全に関する体系的な研究が欠如していることは、この分野の進歩にとって重要な障壁である。
MMLSの安全性を体系的に分類し評価する最初の分類法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:42:43 GMT)
DiffusionPDE: Generative PDE-Solving Under Partial Observation [10.9] 生成拡散モデルを用いて偏微分方程式(PDE)を解くための一般的な枠組みを提案する。
そこで本研究では, 学習した生成先行が, 部分観察下において, 広範囲のPDEを正確に解くための多元的枠組みに導かれることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:48:24 GMT)
Sequential Editing for Lifelong Training of Speech Recognition Models [10.8] 新しいドメインリスクにのみ焦点をあてた微調整(CF)
ASRシステムにおける新しい領域を継続的に学習するための新しい手法としてシーケンスモデル編集を提案する。
本研究は,最大15%の単語誤り率削減(WERR)を微調整ベースライン上で実現し,CommonVoice English Multi-accent データセット上での他のLLL手法よりも優れた効率性を示した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:52:09 GMT)
CT-Bound: Robust Boundary Detection From Noisy Images Via Hybrid Convolution and Transformer Neural Networks [10.6] 我々は,畳み込みとトランスフォーマーのハイブリッドニューラルネットワークを用いて,非常にノイズの多い画像に対して,頑健で高速な境界検出手法であるCT-Boundを提案する。
局所的な検出では、各画像パッチの境界構造を予測するために畳み込みアーキテクチャを使用する。
次に、フィードフォワードトランスフォーマーアーキテクチャを用いて、各パッチの境界構造をグローバルに洗練し、エッジマップとスムーズなカラーマップを同時に生成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:56:21 GMT)
Online Calibrated and Conformal Prediction Improves Bayesian Optimization [10.5] 本稿では,モデルに基づく意思決定やベイズ最適化における不確実性について検討する。
しかし、キャリブレーションの維持は、データが定常的ではなく、我々の行動に依存する場合、困難である。
我々は、オンライン学習に基づく簡単なアルゴリズムを用いて、非i.d.データのキャリブレーションを確実に維持することを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:14:27 GMT)
Image Distillation for Safe Data Sharing in Histopathology [10.4] 病理組織学は、臨床医が正確な診断を行い、疾患の予後を判断し、適切な治療戦略を立案するのに役立つ。
深層学習技術が医療分野で成功していることが証明されるにつれ、主な課題はデータ可用性の制限とデータ共有とプライバシに関する懸念である。
私たちは、制約なしに共有できる必須情報をカプセル化する小さな合成データセットを作成します。
我々は,潜在拡散モデルを訓練し,少数の可読性合成画像を用いた新しい蒸留合成データセットを構築した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:28:48 GMT)
Graph Image Prior for Unsupervised Dynamic Cardiac Cine MRI Reconstruction [10.3] グラフ画像優先(GIP)と呼ばれる動的MRI表現のための新しい手法を提案する。
GIPは2段階生成ネットワークを新しいモデリング手法に採用し、まず独立したCNNを用いて各フレームのイメージ構造を復元する。
グラフ畳み込みネットワークは特徴融合と画像生成に利用される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:45:53 GMT)
The Best Arm Evades: Near-optimal Multi-pass Streaming Lower Bounds for Pure Exploration in Multi-armed Bandits [10.3] 我々は、$O(fracnDelta2)$の最適なサンプル複雑さを利用するサブ線形メモリを持つストリーミングアルゴリズムは、$Omega(fraclog (1/Delta)log (1/Delta)$ passを必要とすることを示した。
この結果は,[ICML'21] の$O(log(frac1Delta))$-passアルゴリズムと一致し, [ICML'21] は$O(1)$メモリしか使用せず, Assadi と Wang が提案したオープンな質問に答える。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:20:06 GMT)
Laminator: Verifiable ML Property Cards using Hardware-assisted Attestations [10.3] 悪意のあるモデルプロバイダは、MLプロパティカードに偽情報を含めることができ、MLプロパティカードの必要性を高めることができる。
実証者(例えば、モデル提供者)が、訓練中に異なるMLプロパティを証明し、検証者(例えば、監査者)に推論する技術メカニズムを用いて、それらを実現する方法を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:36:53 GMT)
DITTO: Dual and Integrated Latent Topologies for Implicit 3D Reconstruction [10.2] ノイズやスパース点の雲から暗黙的な3次元再構成を行うために,新しいDITTO(Double and Integrated Latent Topologies)を提案する。
DITTOは二重潜在エンコーダと統合暗黙デコーダから構成される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:31:12 GMT)
Regularization and Optimal Multiclass Learning [10.2] この研究は、経験的リスク最小化が失敗する最も単純な設定における正規化の役割を特徴づけることである。
ワンインクルージョングラフ(OIG)を用いて、試行錯誤アルゴリズムの原理に相応しい最適な学習アルゴリズムを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:42:18 GMT)
Efficient, Multimodal, and Derivative-Free Bayesian Inference With Fisher-Rao Gradient Flows [10.2] 正規化定数を含む確率分布の効率的な近似サンプリングについて検討した。
具体的には,科学技術応用における大規模逆問題に対するベイズ推定における問題クラスに着目する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:07:22 GMT)
Can Large Language Models Understand DL-Lite Ontologies? An Empirical Study [10.1] 大規模モデル(LLM)は、幅広いタスクを解く上で大きな成果を上げている。
我々は、記述論理(DL-Lite)を理解するLLMの能力を実証的に分析する。
LLMは概念と役割の形式的構文とモデル理論的意味論を理解する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:16:34 GMT)
PatentEval: Understanding Errors in Patent Generation [10.0] 本稿では,機械が生成する特許文書において,2つの異なるタスクを評価するために特別に設計された包括的エラータイプポロジーを紹介する。
我々はまた,この文脈で言語モデルを体系的に評価するためのベンチマークであるPatentEvalを開発した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:23:03 GMT)
LKM-UNet: Large Kernel Vision Mamba UNet for Medical Image Segmentation [9.9] 本稿では,医療画像分割のためのLKM-U-shape Network(LKM-UNet)を提案する。
LKM-UNetの際立った特徴は、小さなカーネルベースのCNNやトランスフォーマーに比べて、局所的な空間モデリングに優れた大きなMambaカーネルの利用である。
包括的実験は、大規模なマンバ核を用いて大きな受容場を実現することの実現可能性と有効性を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:37:26 GMT)
Why Line Search when you can Plane Search? SO-Friendly Neural Networks allow Per-Iteration Optimization of Learning and Momentum Rates for Every Layer [9.8] 我々は、実際に使用されるいくつかのモデルを含む、SOフレンドリーなニューラルネットワークのクラスを紹介する。
ステップサイズを設定するために正確な行探索を行う場合、固定学習を使用する場合と同じコストがかかる。
同じコストで、各ステップでの学習率と運動量率を設定するために、プレーン検索が使用できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:06:40 GMT)
Enhancing Tool Retrieval with Iterative Feedback from Large Language Models [9.6] 大規模言語モデル(LLM)は、コンテキスト内学習や微調整を通じて、ある程度のツールを効果的に扱うことができる。
現実のシナリオでは、ツールの数は一般的に広範囲で不規則に更新され、専用のツール検索コンポーネントの必要性を強調している。
本稿では,大規模言語モデルからの反復的なフィードバックでツール検索を強化することを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:12:01 GMT)
Preserving Node Distinctness in Graph Autoencoders via Similarity Distillation [9.4] グラフオートエンコーダ(GAE)は、平均二乗誤差(MSE)のような距離ベースの基準に依存して入力グラフを再構築する。
単一の再構築基準にのみ依存すると 再建されたグラフの 特徴が失われる可能性がある
我々は,再構成されたグラフにおいて,必要な相違性を維持するための簡易かつ効果的な戦略を開発した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:54:35 GMT)
Benchmarking Mental State Representations in Language Models [9.3] モデルの内部的な精神状態の表現に関する研究は依然として限られている。
最近の研究は、LMが自分自身や他人の信念を表現できることを示すのに、プローブを用いている。
モデルサイズが異なる様々なLMタイプを用いた広範囲なベンチマークを報告する。
我々は,素早い変化が心的タスクの理論における探索的パフォーマンスにどのように影響するかを初めて研究する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:51:06 GMT)
DKPROMPT: Domain Knowledge Prompting Vision-Language Models for Open-World Planning [9.3] 視覚言語モデル(VLM)はロボットのタスク計画問題に適用されている。
DKPROMPTは、オープンワールドにおける古典的計画のためのPDDLにおけるドメイン知識の利用を促すVLMを自動化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:49:47 GMT)
Nakamoto Consensus under Bounded Processing Capacity [9.2] 従来の有界遅延モデルとは対照的に、中本氏の私的攻撃はもはや最悪の攻撃ではないことを示す。
本稿では, ブランキングNC (BlaNC) と呼ぶPoS NCの変種について述べる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:16:28 GMT)
Deep Pulse-Signal Magnification for remote Heart Rate Estimation in Compressed Videos [9.1] 本稿では,ビデオ圧縮がr推定に与える影響に対処する新しい手法を提案する。
利用可能な2つのデータセットに対する徹底的な評価により、我々のモデルを検証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:53:21 GMT)
Experimental virtual distillation of entanglement and coherence [9.0] 2次元状態から4次元の最大重畳状態の仮想蒸留を示す。
また,ノイズの多いEPRペアの単一コピーにのみ作用する操作を伴うエンタングルメントの仮想蒸留を実証した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:21:48 GMT)
MR-Scout: Automated Synthesis of Metamorphic Relations from Existing Test Cases [9.0] オープンソースソフトウェアプロジェクトのテストケースからMRを自動的に合成するMR-Scoutを提案する。
符号化されたMRの97%以上は、自動テストケース生成に高品質である。
我々の質的研究は、コード化されたMRの55.76%から76.92%が開発者にとって容易に理解可能であることを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:42:13 GMT)
Expert Q-learning: Deep Reinforcement Learning with Coarse State Values from Offline Expert Examples [8.9] エキスパートQラーニングは、Dueling Q-learningにインスパイアされ、半教師付き学習を強化学習に組み込むことを目的としている。
オフラインの専門家は、3つの離散値を使用して、粗い方法で状態の値を評価する。
以上の結果から,エキスパートQ-ラーニングは本当に有用であり,過大評価バイアスに耐性があることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:08:34 GMT)
CDQuant: Accurate Post-training Weight Quantization of Large Pre-trained Models using Greedy Coordinate Descent [8.9] 大規模言語モデル(LLM)は、最近、様々な言語タスクで顕著なパフォーマンスを示した。
ポストトレーニング量子化(PTQ)法である最近のGPTQアルゴリズムは,LLMの圧縮に極めて有効であることが証明されている。
我々は、GPTQの単純でスケーラブルな代替品であるCDQuantを導入し、性能を改善した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:29:14 GMT)
LABOR-LLM: Language-Based Occupational Representations with Large Language Models [8.9] 本稿では,CAREER ファンデーションモデルの微調整を微調整 LLM に置き換える方法を検討する。
細調整されたLLMモデル予測は、市販のLLMモデルやCAREERよりも、様々な労働者サブ集団のキャリアトラジェクトリを代表していることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:07:18 GMT)
Minimax Optimal Estimation of Stability Under Distribution Shift [8.9] 分散シフト中のシステムの安定性を解析する。
安定性尺度は、より直感的な量、許容される性能劣化のレベルで定義される。
ミニマックス収束速度の特性は, 高い性能劣化に対する安定性の評価が統計的コストをもたらすことを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:21:54 GMT)
Navigating High-Degree Heterogeneity: Federated Learning in Aerial and Space Networks [8.8] フェデレーション学習は、ドローン、気球、衛星を介してアクセス可能な巨大なプライベートエッジデータとコンピューティング能力を利用することによって、空と宇宙ネットワーク内のネットワークとデータプライバシの課題に対する魅力的な解決策を提供する。
本研究では,ASNに基づくフェデレーション学習のパフォーマンスを低下させるクラス不均衡に対する不均一性の影響について検討した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:57:26 GMT)
Research on Education Big Data for Students Academic Performance Analysis based on Machine Learning [8.6] 本研究では,Long Short-Term Memory Network(LSTM)に基づく機械学習モデルを用いて,教育用ビッグデータの詳細な分析を行った。
LSTMモデルは時系列データを効率的に処理し、学生の学習活動における時間依存的・長期的傾向を捉えることができる。
このアプローチは、生徒の進歩、エンゲージメント、その他の行動パターンを分析してパーソナライズされた教育を支援するのに特に有用である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:19:22 GMT)
A Dual-Channel Particle Swarm Optimization Algorithm Based on Adaptive Balance Search [8.5] 適応バランス探索(DCPSO-ABS)に基づく二重チャネルPSOアルゴリズムを提案する。
提案アルゴリズムは,選択した最先端アルゴリズムよりも高い一般化性能を有することを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:43:52 GMT)
Efficient Characterizations of Multiphoton States with an Ultra-thin Optical Device [8.5] 一つの準曲面光学デバイスは、多光子絡み状態のより効率的なキャラクタリゼーションを可能にすることを示す。
複数光子エンタングルメントの再構成における顕著な利点として, 測定値の低減, 高精度化, 実験的不完全性に対する堅牢性などを挙げる。
本研究は,多光子エンタングルメントの効率的なキャラクタリゼーションのための集積光学デバイスとしてメタ曲面の実現可能性を明らかにし,超薄型光デバイスを用いたスケーラブルフォトニック量子技術に光を当てる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:21:26 GMT)
CUTS: A Deep Learning and Topological Framework for Multigranular Unsupervised Medical Image Segmentation [8.3] 医用画像セグメンテーションのための教師なしディープラーニングフレームワークCUTSを提案する。
各画像に対して、画像内コントラスト学習と局所パッチ再構成による埋め込みマップを生成する。
CUTSは、様々な粒度の特徴をハイライトする粗い粒度のセグメンテーションを連続的に生成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:35:36 GMT)
Telecom Language Models: Must They Be Large? [7.8] 多くのタスクにおいて、より大きな言語に匹敵するパフォーマンスを示す小さな言語モデル。
Phi-2 はコンパクトだが強力なモデルであり、効率的な小言語モデルの新たな波を実証している。
本稿では,Phi-2の通信領域に関する本質的な理解を包括的に評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:28:43 GMT)
Using joint angles based on the international biomechanical standards for human action recognition and related tasks [7.8] キーポイントデータを一意にポーズを記述するジョイントアングルに変換する方法を示す。
我々は,キーポイントデータの関節角表現が機械学習応用に適していることを実験的に実証した。
人為的なデータ表現としての関節角の使用は、人間の専門家との解釈可能性や対話が重要であるアプリケーションにおいて特に有望である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:23:58 GMT)
Distillation Enhanced Time Series Forecasting Network with Momentum Contrastive Learning [7.4] 長周期時系列予測のための革新的蒸留強化フレームワークであるDE-TSMCLを提案する。
具体的には、タイムスタンプをマスクするかどうかを適応的に学習する学習可能なデータ拡張機構を設計する。
そこで本研究では,時系列のサンプル間および時間内相関を探索するために,モーメントを更新したコントラスト学習タスクを提案する。
複数のタスクからモデル損失を発生させることで、下流予測タスクの効果的な表現を学習することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:34:38 GMT)
Leveraging Reinforcement Learning in Red Teaming for Advanced Ransomware Attack Simulations [7.4] 本稿では,ランサムウェア攻撃のシミュレーションに強化学習(RL)を利用する新しい手法を提案する。
実世界のネットワークを模倣するシミュレーション環境でRLエージェントを訓練することにより、効果的な攻撃戦略を迅速に学習することができる。
152ホストのサンプルネットワークの実験結果から,提案手法の有効性が確認された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:16:40 GMT)
Deciphering the Definition of Adversarial Robustness for post-hoc OOD Detectors [7.3] 現実世界のシナリオでディープラーニングモデルを安全にデプロイするには、アウト・オブ・ディストリビューション(OOD)インプットが重要です。
ポストホック検出器の数は急速に増加しており、訓練済みの分類器を自然分布シフトから保護する選択肢を示している。
本稿では,16個のポストホック検出器の複数の回避攻撃に対する対角的堅牢性について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:21:17 GMT)
Expected Grad-CAM: Towards gradient faithfulness [7.2] 勾配重み付きCAMアプローチは依然としてバニラ勾配に依存している。
本研究は飽和度と感度問題に対処する勾配重み付きCAM増強法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:10:15 GMT)
DMF-Net: Image-Guided Point Cloud Completion with Dual-Channel Modality Fusion and Shape-Aware Upsampling Transformer [7.2] 本稿では,画像誘導点雲補完のための新しいデュアルチャネルモダリティ融合ネットワークを提案する。
第1段階では、DMF-Netは部分点雲と対応する画像を入力として取り出して粗い点雲を復元する。
第2段階では、粗い点雲が2回、形状を意識したアップサンプリング変圧器でアップサンプリングされ、密度の高い完全点雲が得られる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:08:19 GMT)
Learning Low-dimensional Latent Dynamics from High-dimensional Observations: Non-asymptotics and Lower Bounds [7.2] 我々は,低次元潜在変数を持つ線形時間不変モデル(LTI)の学習に焦点をあてるが,高次元観測は行わない。
我々は,観測者の列空間のような高次元の特徴を復元し,データを低次元に埋め込み,低次元モデルパラメータを学習するアルゴリズムを提案する。
その後、メタデータセットからLTIシステムの学習を容易にするエンド・ツー・エンドのアルゴリズムが提案される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:28:29 GMT)
On the correlation between Architectural Smells and Static Analysis Warnings [7.1] 我々は,静的解析警告(SAW)とアーキテクチャの臭い(AS)の関係を理解することを目指しており,開発者やメンテナがSAWに取り組み,ASメソッドを併用する傾向にある。
785 SAWはSAT, Checkstyle, Findbugs, PMD, SonarQube, ARCANツールで検出された4つのアーキテクチャの臭いによって検出された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:13:28 GMT)
Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.1] EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。
我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:26:33 GMT)
Non-Hermitian tearing by dissipation [7.0] 非エルミート系を散逸下で研究し、実効的な 2*2 ハミルトニアンを k-空間に与える。
エネルギーバンドが虚線ギャップを示すことが判明した。
この結果は、トポロジカル量子状態における非エルミート物理学の制御を探求するための理論的アプローチを提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:05:06 GMT)
Enhancing Explainability of Knowledge Learning Paths: Causal Knowledge Networks [6.8] 本稿では,因果知識ネットワークを構築する手法を提案する。
また,Human-Centric eXplainable AI in Educationを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:59:20 GMT)
Insights into the Lottery Ticket Hypothesis and Iterative Magnitude Pruning [6.7] そこで本研究では,反復的等級切削工程の様々な段階で得られた溶液の体積/幾何学および損失景観特性について検討した。
抽選券仮説によって提案された特定の初期化が、一般化(および訓練)性能においてよりうまく機能する傾向にある理由を説明する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:14:12 GMT)
AI Tool Use and Adoption in Software Development by Individuals and Organizations: A Grounded Theory Study [6.7] 調査対象者は26名, 調査対象者は395名であった。
我々は,2つの個別の動機,4つの個別の課題,3つの組織的動機,3つの組織的課題,3つのインターリーブされた関係を同定した。
3つのインターリーブされた関係は、モチベーションが実践者を引き寄せてAIツールの使用を拡大し、実践者がAIツールの使用から遠ざけるというプッシュプルな振る舞いをする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:18:56 GMT)
Masked Generative Extractor for Synergistic Representation and 3D Generation of Point Clouds [6.7] Masked Generative (MAGE) は生成モデルと表現学習の相乗効果を実証した。
我々は,この概念をクラウドデータに拡張するためのポイントMAGEを提案する。
形状分類タスクにおいて、Point-MAGEはModelNet40データセットで94.2%、ScanObjectNNデータセットで92.9%の精度を達成した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:57:03 GMT)
What type of inference is planning? [6.7] すべての一般的な推論は、変分問題におけるエントロピー項の異なる重み付けに対応することを示す。
我々は、マルコフ決定過程において近似的な計画を実行することができるループ的信念伝達の類推を開発する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:05:31 GMT)
TabVFL: Improving Latent Representation in Vertical Federated Learning [6.6] TabVFLは、参加者のジョイント機能を使って潜在表現学習を改善するために設計された分散フレームワークである。
本稿では,参加者の協調的特徴を用いた潜在表現学習の改善を目的とした分散フレームワークTabVFLを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:46:30 GMT)
Leveraging Large Language Models for Software Model Completion: Results from Industrial and Public Datasets [6.6] 検索拡張生成によるモデル補完のための大規模言語モデルの可能性を評価する。
大規模な言語モデルは、ソフトウェアモデルの進化をサポートするための有望な技術であることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:43:20 GMT)
Deep Learning for Multi-Label Learning: A Comprehensive Survey [6.6] マルチラベル学習は、単一の入力データポイントから複数のラベルを予測することを目的とした、急速に成長する研究分野である。
MLCでは、高次元データを扱うこと、ラベルの相関に対処すること、部分的なラベルを扱うことが含まれる。
近年,MDCにおけるこれらの課題をより効果的に解決するために,ディープラーニング(DL)技術の採用が顕著に増加していることが報告されている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:20:40 GMT)
Two Simple Proofs of Müller's Theorem [6.5] ミュラーの定理はアルゴリズム情報理論と物理学の交わりにおける最も重要な結果である。
古典的な情報源の量的な情報は、使用する物理モデルに不変である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:05:14 GMT)
SurgeMOD: Translating image-space tissue motions into vision-based surgical forces [6.4] 最小侵襲ロボット手術における視覚に基づく力推定の新しい手法を提案する。
呼吸や心臓循環といった自然なプロセスによって生じる内部運動を用いて、周波数領域の運動の空間的基盤を推測する。
本研究では,シリコーンファントムおよび前バイブオ実験において,点接触力を確実に推定できることを実証した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:46:21 GMT)
Towards Unbiased Calibration using Meta-Regularization [6.4] 2つのコンポーネントを持つメタ正則化により、より良い校正モデルを学ぶことを提案する。
ニューラルネットワークを3つのコンピュータビジョンデータセット上で改善し、偏りのないキャリブレーションに正規化するための提案手法の有効性を評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:00:05 GMT)
CEST-KAN: Kolmogorov-Arnold Networks for CEST MRI Data Analysis [6.4] 本研究では,CEST MRIデータ解析(CEST-KAN)におけるKAN(Kolmogorov-Arnold Network)の有用性について検討した。
マルチ層パーセプトロン(MLP)とKANモデルの性能評価を行った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:28:09 GMT)
Harnessing Large Language Models as Post-hoc Correctors [6.3] 任意の機械学習モデルの予測に対する修正を提案するために,LLMがポストホックな修正器として機能することを示す。
我々は、データセットのラベル情報と、検証データセット上のMLモデルの予測を組み込むことで、文脈知識データベースを構築する。
テキスト解析と分子予測に関する実験結果から, モデルの性能が最大39%向上することが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:26:19 GMT)
NormTab: Improving Symbolic Reasoning in LLMs Through Tabular Data Normalization [6.3] 我々は,Webテーブルの正規化によるLarge Language Models(LLMs)のシンボリック推論性能の向上を目的としたフレームワークであるNormTabを紹介した。
表データのシンボリック推論を支援するために, LLMを用いてテーブル正規化を1回1回1回前処理ステップとして検討する。
WikiTableQuestion や TabFact などの Web テーブルデータセットを用いた実験により,NormTab の活用がシンボル推論性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:40:03 GMT)
Information Geometry of Wasserstein Statistics on Shapes and Affine Deformations [6.2] 我々は,アフィン変形統計モデルのためのLiとZhao(2023)の枠組みにおけるワッサーシュタイン幾何学の特性について検討した。
楕円対称アフィン変形モデルの場合,ワッサースタイン推定器がモーメント推定器であることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:35:06 GMT)
Constructing structured tensor priors for Bayesian inverse problems [6.2] 我々は、解が構造テンソルであるという信念を符号化するガウス先行を特徴づける。
本稿では,新しいカーネル関数を設計し,効率的に計算する方法を示す。
すべてのアプリケーションはJuliaのリアクティブPlutoノートブックとして実装されている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:40:34 GMT)
Learning to Rank for Maps at Airbnb [6.1] 本稿では,ユーザが検索結果とどのように相互作用するかの数学的基礎を改訂することにより,地図のランキングを再構築する方法について述べる。
私たちの旅は、機械学習アルゴリズムを設計する際の当然の仮定が、すべてのユーザーインターフェイスに等しく適用されないことを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:49:19 GMT)
Straight-Through meets Sparse Recovery: the Support Exploration Algorithm [6.1] 本稿では,スパーシリティを促進する新しいアルゴリズムであるSEA(Support Exploration Algorithm)を導入し,その性能を回復支援問題において解析する。
SEAは最先端技術よりも多くのサポートを探求し、実験において優れたパフォーマンスを実現している。
回復の十分な条件は同等だが、スパースサポートリカバリにおける最先端の条件よりも厳密である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:42:54 GMT)
SegHist: A General Segmentation-based Framework for Chinese Historical Document Text Line Detection [6.1] テキスト行検出は、歴史的文書分析において重要な課題である。
歴史的文書テキスト検出のための一般的な枠組み(セグヒスト)を提案する。
一般的に使われているDB++とSegHistフレームワークを統合することで、DB-SegHistを開発する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:37:22 GMT)
Semi-supervised classification of dental conditions in panoramic radiographs using large language model and instance segmentation: A real-world dataset evaluation [6.0] 13種類の歯科疾患をパノラマX線写真で分類するための半教師付き学習フレームワークが提案されている。
このソリューションは、ジュニアスペシャリストに匹敵する精度のレベルを示した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:56:12 GMT)
Sharing tripartite nonlocality sequentially using only projective measurements [5.8] 射影測定と古典的ランダム性のみを用いた三部構造非局所性の共有について検討する。
偏りの測定値を用いることで、標準三部作非局所性を共有するシーケンシャルオブザーバの数が増加しないことがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:42:17 GMT)
Fast gradient-free activation maximization for neurons in spiking neural networks [5.8] このようなループのための効率的な設計のフレームワークを提案する。
トレーニング中の人工ニューロンの最適刺激の変化を追跡する。
この洗練された最適刺激の形成は、分類精度の増大と関連している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:08:56 GMT)
Beyond Demographics: Aligning Role-playing LLM-based Agents Using Human Belief Networks [5.8] 人間の調査から得られたデータを用いて,2つの重複しない潜在因子をロードする18のトピックを含む信念ネットワークを推定した。
次に, LLMをベースとしたエージェントを1つのトピックに対する意見付きでシードし, 残りのテストトピックと対応する人的データとのアライメントについて, その表現された意見のアライメントを評価した。
人口統計情報のみに基づくロールプレイングはLLMと人的意見の一致はしなかったが、エージェントを単一の信念でシードすることで、ネットワーク外のトピックではなく、信念ネットワークに関連するトピックのアライメントを大幅に改善した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:37:29 GMT)
MatText: Do Language Models Need More than Text & Scale for Materials Modeling? [5.6] MatTextは、モデリング材料における言語モデルのパフォーマンスを体系的に評価するために設計されたベンチマークツールとデータセットのスイートである。
MatTextは、材料科学の文脈で言語モデルのパフォーマンスをトレーニングし、ベンチマークするための重要なツールを提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:45:07 GMT)
Local primordial non-Gaussianity from the large-scale clustering of photometric DESI luminous red galaxies [5.5] 我々は、Dark Energy Spectroscopic Instruments(DESI)による局所原始非ガウス性パラメータ$fnl$を制約するために、光赤銀河の角度クラスタリングを用いる。
このサンプルは1200万以上の目標からなり、空の14,000平方度をカバーし、赤方偏移は0.2 z 1.35$である。
我々は, 銀河の絶滅, 調査深度, 天体観測を系統的誤りの主な原因とみなし, 大規模での非宇宙的余剰クラスタリングを緩和するために線形回帰と人工ニューラルネットワークを用いる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:39:44 GMT)
A Moonshot for AI Oracles in the Sciences [5.5] 本稿では,革命的数学的理論を正確に生成するために必要な条件を提案する。
近年のAIの進歩は、機械による提案された必要な条件を満たすことは可能かもしれないことを示唆している。
また,機械理論の発展を促進するために,数学的理論の知性の定義を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:15:57 GMT)
On the Contents and Utility of IoT Cybersecurity Guidelines [5.5] 私たちは142のIoTサイバーセキュリティガイドラインを収集し、25のガイドラインで飽和するまでレコメンデーションのためにそれらをサンプルします。
結果として得られた958のユニークなレコメンデーションから、基礎的理論のコーディング原理に従って、階層的な分類法を反復的に開発する。
我々は、各レコメンデーションの行動可能性と特異性を評価し、CVEに対するレコメンデーションと、それらが防止できるニュースにおけるセキュリティ障害とを一致させる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:24:40 GMT)
Privacy Preserving Reinforcement Learning for Population Processes [5.4] 本稿では,人口プロセス上で動作する強化学習(RL)アルゴリズムにおけるプライバシ保護の問題について考察する。
個人のデータは複数のインタラクションにまたがって収集することができ、そのプライバシは常に保護されなければならない。
我々は,集団プロセスにおける個人的RLアルゴリズムに対して,適切なプライバシ・ユーティリティのトレードオフが可能であることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:41:26 GMT)
Solution to a class of multistate Landau-Zener model beyond integrability conditions [5.4] 本研究では,積分性条件や標準手法では解けない多状態ランダウ・ツェナーモデルについて検討する。
パラメータ選択に対する遷移確率のほぼ正確な解析式を求める。
このモデルは、結合が時間的に線形に変化するSu-Schrieffer-Heeger鎖を記述することができることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:01:08 GMT)
OTCE: Hybrid SSM and Attention with Cross Domain Mixture of Experts to construct Observer-Thinker-Conceiver-Expresser [5.4] 我々は、より生体模倣的なアイデアを持つ新しいアーキテクチャ、Observer-Thinker-Conceiver-Expresser (OTCE)を提案する。
OTCEは、有名な中規模のオープンソース言語モデルと、小規模の言語モデリングタスクで競合することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:20:14 GMT)
Contrastive General Graph Matching with Adaptive Augmentation Sampling [5.3] グラフマッチング(GCGM)のための新しいグラフ中心コントラストフレームワークを提案する。
GCGMは、コントラスト学習のための膨大なグラフ拡張を、副次的な情報を必要としない形で実現している。
当社のGCGMは、さまざまなデータセットにわたる最先端の自己管理手法を超越しています。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:08:03 GMT)
Detecting Misuse of Security APIs: A Systematic Review [5.3] セキュリティアプリケーションプログラミングインターフェース(API)は、ソフトウェアセキュリティの確保に不可欠である。
彼らの誤用は脆弱性を導入し、深刻なデータ漏洩と重大な財務損失につながる可能性がある。
本研究は,セキュリティAPIの誤用検出に関する文献を精査し,この重要な領域を包括的に理解する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:01:49 GMT)
Accelerating Look-ahead in Bayesian Optimization: Multilevel Monte Carlo is All you Need [5.3] マルチレベルモンテカルロ(MLCBOC)は標準MC収束率を達成することができる。
理論的研究は、2段階および3段階のルックアヘッド獲得関数の近似改善に焦点を当てている。
本研究は数値的に検証し,いくつかのベンチマーク例でBOに対するCBOCの利点を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:11:33 GMT)
SUM: Saliency Unification through Mamba for Visual Attention Modeling [5.3] 視覚アテンションモデリングは、マーケティング、マルチメディア、ロボット工学といったアプリケーションにおいて重要な役割を果たす。
従来のサリエンシ予測モデル、特にCNNやTransformersをベースとしたモデルは、大規模な注釈付きデータセットを活用することで、顕著な成功を収めている。
本稿では,Mamba と U-Net を併用した,効率の良い長距離依存性モデリング手法であるMamba (SUM) によるSaliency Unificationを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:54:07 GMT)
A Comparative Analysis of Hybrid-Quantum Classical Neural Networks [5.2] 本稿では、画像分類のための異なるハイブリッド量子古典機械学習アルゴリズム間の広範な比較分析を行う。
この精度に基づくハイブリッドモデルの性能比較により、回路の量子層数と量子ビット数の変化との相関関係におけるハイブリッド量子古典収束の理解が得られる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:00:05 GMT)
Learning to Ask Informative Questions: Enhancing LLMs with Preference Optimization and Expected Information Gain [5.2] 大型言語モデル (LLM) は、しばしば情報的質問を生成するのによく機能する。
そこで本研究では,20種類のゲーム対話におけるLLM生成質問の情報性向上手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:44:01 GMT)
Zero-Shot Long-Form Video Understanding through Screenplay [5.2] MM-Screenplayerはマルチモーダル認識機能を備えた高度なビデオ理解システムである。
MM-ScreenplayerはCVPR'2024のLong-form VidEo Understanding (LOVEU) Track 1 Challengeで最高スコア87.5%を獲得した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:42:26 GMT)
Diverse Part Synthesis for 3D Shape Creation [5.2] 部分ベース表現の形で3次元形状にニューラルネットワークを使用する手法は、ここ数年で導入されている。
現在の方法では、個々の形状部品をユーザの好みに応じて容易に再生することはできない。
ユーザが個別の部品に対して多種多様な提案を生成できるようにする技術について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:33:31 GMT)
Learning with Noisy Labels through Learnable Weighting and Centroid Similarity [5.2] ノイズラベルは、医学診断や自律運転などの領域で一般的である。
本稿では,雑音ラベルの存在下で機械学習モデルを訓練するための新しい手法を提案する。
以上の結果から,本手法は既存の最先端技術よりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:36:33 GMT)
Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration [5.1] 都市化は前例のない速度で進行し、環境と人間の幸福に悪影響を及ぼす。
深層学習に基づく手法は,光衛星画像対による都市変化検出の有望な成果を得た。
本稿では,衛星画像時系列の連続した画像対の変化を識別する連続都市変化検出手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:53:57 GMT)
BricksRL: A Platform for Democratizing Robotics and Reinforcement Learning Research and Education with LEGO [5.1] 我々は、強化学習研究と教育のためのロボットへのアクセスを民主化するためのプラットフォームであるBricksRLを紹介する。
BricksRLは、強化学習エージェントのためのTorchRLライブラリと対話することで、現実世界でのカスタムLEGOロボットの作成、設計、訓練を容易にする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:17:44 GMT)
Studying the Impact of Quantum-Specific Hyperparameters on Hybrid Quantum-Classical Neural Networks [5.0] ハイブリッド量子古典ニューラルネットワーク(HQNN)は、古典的な機械学習の強みと量子コンピューティング能力を組み合わせた、有望なソリューションである。
本稿では,PennyLaneフレームワーク上に実装された画像分類タスクのHQNNモデルに対して,これらのバリエーションが与える影響について検討する。
我々は,HQNNモデルの直感的および直感的学習パターンを制御された量子摂動の粒度レベル内で明らかにし,精度とトレーニング時間との相関関係の健全な基盤を構築することを目的としている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:51:21 GMT)
Re-examination of the role of displacement and photon catalysis operation in continuous variable measurement device-independent quantum key distribution [4.9] 連続可変量子鍵分布(CVMDIQKD)におけるm$- Photon触媒による2モード圧縮コヒーレント(mPCTMSC)状態の利点について検討する。
CV-MDQKDのゼロ光子触媒による2モード真空状態と比較すると, 0PCTMSC状態は劣ることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:16:15 GMT)
Securing Voice Authentication Applications Against Targeted Data Poisoning [4.9] 現実的な攻撃シナリオを考慮した実世界のデータセットを用いた拡張フレームワークを提案する。
その結果,提案手法はロバストであり,データセットのごく一部に毒を盛った場合でも正確な認証が可能であることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:52:37 GMT)
Domain Adaptation of Echocardiography Segmentation Via Reinforcement Learning [4.9] 我々はRL4Segを紹介した。RL4Segは革新的な強化学習フレームワークで、ターゲットドメインに専門的な注釈付きデータセットを組み込む必要がなくなる。
RL4Segは1万枚の未診断2D心エコー画像のターゲットデータセットを用いて、ターゲットドメインから220名の専門家検証対象のサブセットに対して99%の解剖学的妥当性を達成している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:26:39 GMT)
Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.8] 我々は、羅生門分割集合(RPS)と呼ばれる別の視点を開発する。
RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。
提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:17:43 GMT)
Protecting the 'Stop Using My Data' Right through Blockchain-assisted Evidence Generation [4.8] この研究は、買収後のデータを正しく違反しないようにするための最初のエビデンス生成フレームワークを開発することを目的としている。
当社は、最初のブロックチェーン支援システムを設計し、実装しました。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:32:37 GMT)
Essentially Sharp Estimates on the Entropy Regularization Error in Discrete Discounted Markov Decision Processes [4.7] エントロピー規則化自然ポリシー勾配法では,既存の線形保証の改善の2乗根において,全体の誤差が指数関数的に減少することを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:26:49 GMT)
Cloaked Classifiers: Pseudonymization Strategies on Sensitive Classification Tasks [4.7] 本稿では,データ保護と堅牢なプライバシ保護のバランスについて検討する。
我々は,多言語急進化データセットを手動で偽名化する手法を共有し,元のデータに匹敵する性能を確保する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:30:25 GMT)
Efficient and Robust Parameter Optimization of the Unitary Coupled-Cluster Ansatz [4.6] 本稿では、量子コンピュータ上でのユニタリ結合クラスタ・アンサッツのパラメータ最適化のために、近似パラボラ(SOAP)を用いた逐次最適化を提案する。
分子システムに関する数値的なベンチマークでは、SOAPはより高速な収束とノイズに対する堅牢性を達成することが示されている。
SOAPは、2量子ビットモデルシステムを用いた超伝導量子コンピュータの実験によりさらに検証される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:46:50 GMT)
Towards Efficient and Scalable Training of Differentially Private Deep Learning [4.5] 微分プライベート勾配降下(DP-SGD)は、差分プライバシ(DP)の下で機械学習モデルを訓練するための標準アルゴリズムである。
DP-SGDの大きな欠点は、以前の研究が包括的に研究したユーティリティの低下である。
本研究では,DP下でのディープラーニングモデルの学習における計算コストの定量化と,コスト削減を目的としたベンチマーク手法について,総合的な実証的研究を行った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:04:58 GMT)
An Empirical Study on the Characteristics of Bias upon Context Length Variation for Bangla [4.5] バングラで本質的な性別バイアス測定のためのデータセットを作成する。
既存のバイアス測定手法をバングラに適用するために必要な適応について論じる。
文脈長変動がバイアス測定に及ぼす影響について検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:49:11 GMT)
Jigsaw: Supporting Designers to Prototype Multimodal Applications by Chaining AI Foundation Models [4.4] Jigsawは、基礎モデルを表現するメタファーとしてパズルピースを使用するプロトタイプシステムである。
設計者は、互換性のあるパズルを組み立てることで、様々なモダリティで異なる基礎モデル機能を組み合わせることができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:50:34 GMT)
Computational-Statistical Gaps for Improper Learning in Sparse Linear Regression [4.4] 疎線形回帰の効率的な学習アルゴリズムは, 負のスパイクを持つスパースPCA問題を解くのに有効であることを示す。
我々は,低次および統計的クエリの低い境界を減らしたスパース問題に対して補う。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:50:33 GMT)
Metrics for Dataset Demographic Bias: A Case Study on Facial Expression Recognition [4.3] 人口統計バイアスの最も顕著な種類は、データセットにおける人口統計群の表現における統計的不均衡である。
我々はこれらの指標を分類するための分類法を開発し、適切な指標を選択するための実践的なガイドを提供する。
この論文は、データセットバイアスを緩和し、AIモデルの公正性と正確性を改善するために、AIと関連する分野の研究者に貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:02:25 GMT)
Light-weight End-to-End Graph Interest Network for CTR Prediction in E-commerce Search [4.3] 本稿では,ユーザの検索関心を効果的にマイニングするために,ライトウェイト・エンド・エンド・エンド・グラフ・関心ネットワーク (EGIN) という新しいアプローチを提案する。
提案するEGINは,問合せ項目のヘテロジニアスグラフ,軽量グラフサンプリング,多目的ネットワークという3つの部分から構成される。
提案したEGINの有効性を実証するため,公立および工業用両方のデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:31:04 GMT)
Listening to the Noise: Blind Denoising with Gibbs Diffusion [4.3] 雑音分布の族に先立って信号のマッピングを訓練した条件拡散モデルからサンプリングステップを交互に行うギブスアルゴリズムを開発した。
我々の理論的分析は潜在的な落とし穴を強調し、診断利用をガイドし、ギブス定常分布の誤差を定量化する。
本研究では,1)未知の振幅とスペクトル指数を持つ有色雑音を含む自然画像の視覚的復調,2)宇宙論の問題について述べる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:43:54 GMT)
Environment-Mediated Long-Ranged Correlations in Many-Body System [4.3] 我々は最近開発された最小拡張状態空間(QD-MESS)を用いた量子散逸法を用いて,有限サイズIsing型スピンチェーンにおける貯水池誘導長間隔時間に対処する。
オーミックスペクトル密度とサブオーミックスペクトル密度との熱相関は、有限温度からゼロ温度までの量子時間進化をシミュレートする。
熱ゆらぎ、量子ゆらぎ、反強磁性相互作用の競合は、動的相の豊富なパターンを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:51:49 GMT)
Unbiasing on the Fly: Explanation-Guided Human Oversight of Machine Learning System Decisions [4.2] 本稿では,デプロイされたMLシステムにおいて,オンザフライトラッキングと識別の補正のための新しいフレームワークを提案する。
このフレームワークは、MLシステムによる予測を継続的に監視し、差別的な結果をフラグ付けする。
このHuman-in-the-loopアプローチは、レビュアーがMLシステム決定を受け入れたり、無効にしたりすることを可能にする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:40:55 GMT)
Soundify: Matching Sound Effects to Video [4.2] 本稿では,映像と音声のマッチングを支援するシステムSoundifyについて述べる。
ビデオが与えられたら、Soundifyは一致した音を特定し、ビデオに音を同期させ、パンニングとボリュームを動的に調整して空間オーディオを作成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:28:04 GMT)
Towards LLM-Powered Ambient Sensor Based Multi-Person Human Activity Recognition [4.2] HAR(Human Activity Recognition)は、在宅医療、高齢者介護、ホームセキュリティなどの分野における中心的な問題の一つである。
本稿では,大規模言語モデルに基づくLAHARというシステムフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:41:34 GMT)
MDHA: Multi-Scale Deformable Transformer with Hybrid Anchors for Multi-View 3D Object Detection [4.2] MDHAは3Dオブジェクト検出のための新しいスパースクエリベースのフレームワークである。
マルチビュー・マルチスケール入力からのハイブリッドアンカーを用いて適応的な3D出力提案を構築する。
46.4%のmAPと55.0%のNDSをResNet101バックボーンで達成している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:46:39 GMT)
Who Plays First? Optimizing the Order of Play in Stackelberg Games with Many Robots [4.1] Branch and Play (B&P) は、社会的に最適な遊びの順序とスタックルバーグ均衡に収束する効率的かつ正確なアルゴリズムである。
本稿では,B&Pによる航空交通管制,群れ形成,輸送車両の配車における実用性を実証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:55:44 GMT)
MgNO: Efficient Parameterization of Linear Operators via Multigrid [4.1] 我々はMgNOを導入し、ニューロン間の有界線形作用素をパラメータ化するために多重格子構造を利用する。
MgNOは、他のCNNベースのモデルと比べてトレーニングの容易さが優れている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:39:52 GMT)
Principal Component Clustering for Semantic Segmentation in Synthetic Data Generation [4.1] 本稿では,潜在拡散モデルを用いてセマンティックセグメンテーションのための合成データセットを生成する手法について概説する。
弊社のアプローチでは、セグメンテーションデータに特化して訓練された追加モデルの必要性を排除している。
安定拡散による出力画像のみを用いてマスク改質ステップを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:28:53 GMT)
Early learning of the optimal constant solution in neural networks and humans [4.0] 対象関数の学習は、ネットワークが最適定数解(OCS)を学習する初期段階に先立って行われることを示す。
我々は、バイアス項がなくてもOCSの学習が出現し、入力データの一般的な相関によって等価に駆動されることを示す。
我々の研究は、OCSを教師付き誤り訂正学習における普遍的な学習原則として示唆している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:12:52 GMT)
Less can be more: representational vs. stereotypical gender bias in facial expression recognition [4.0] 機械学習モデルは、トレーニングデータからバイアスを継承し、差別的または不正確な予測につながる。
本稿では、データセットから機械学習モデルへの人口統計バイアスの伝播について検討する。
ジェンダーの人口構成に焦点をあて、表現とステレオタイプという2種類の偏見を分析した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:26:49 GMT)
MPCODER: Multi-user Personalized Code Generator with Explicit and Implicit Style Representation Learning [3.9] 複数のユーザ向けにパーソナライズされたコードを生成するためにMPCoder(Multi-user Personalized Code Generator)を提案する。
コーディングスタイルの特徴をよりよく学習するために、明示的なコーディングスタイル残差学習を用いて、構文コードスタイル標準をキャプチャする。
我々は、異なるユーザの暗黙的特徴表現をよりよく区別するために、マルチユーザスタイルのアダプタを訓練する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:45:28 GMT)
Shortcut to adiabaticity improvement of STIRAP based qubit rotation [3.9] STIRAPの断熱に対するショートカット法は断熱過程の高速化を図っている。
拡張短絡法と断熱法は, ダイアバティック政権におけるクビット回転の忠実度を向上させるのに有効であることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:13:36 GMT)
Towards Hypermedia Environments for Adaptive Coordination in Industrial Automation [3.7] 電気機械システムは、相互接続されたコンポーネントのネットワークを介して物理的プロセスを管理する。
私たちは、システムのセマンティック記述を処理する自律的なソフトウェアエージェントを使用して、調整要件と制約を決定します。
エージェントは互いに対話し、分散された協調された方法でシステムを制御します。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:21:52 GMT)
Variationist: Exploring Multifaceted Variation and Bias in Written Language Data [3.7] 言語データの探索と理解は、人間の言語を扱うあらゆる分野において、基本的な段階である。
しかし現時点では、言語の変化とバイアスをシームレスに検査し視覚化する、統一的でカスタマイズ可能なツールが欠如している。
本稿では、このギャップを埋める高度にモジュラーで記述的でタスクに依存しないツールである「変分主義」を紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:41:07 GMT)
Fusion of the Power from Citations: Enhance your Influence by Integrating Information from References [3.6] 本研究は,ある論文が学者の影響力を高めることができるか否かを判断するために,予測問題を定式化することを目的とする。
この研究にこの枠組みを適用することで、研究者は自分の論文が将来の影響力を高めることができるかどうかを特定できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:29:18 GMT)
Performance Comparison of Deep RL Algorithms for Mixed Traffic Cooperative Lane-Changing [3.5] 車線変更は、交通環境の複雑なダイナミクスと高い不確実性のため、コネクテッドおよび自動走行車(CAV)にとって難しいシナリオである。
本研究では,HV(Human-driven Vehicle)の不確かさと,HVとCAVの微視的相互作用を両立させることにより,現在のCLCMT機構を強化する。
4つのDRLアルゴリズムの性能比較により,DDPG,TD3,SAC,PPOアルゴリズムが交通環境の不確実性に対処可能であることが示された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:49:25 GMT)
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale [3.4] 大規模言語モデル (LLM) を評価するベンチマーク RES-Q を開発した。
我々は,Qurrent OS上に構築されたリポジトリ編集システムにおける言語エージェントとして,最先端のLLMを評価した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:04:23 GMT)
Towards Compositional Interpretability for XAI [3.4] 本稿では,カテゴリ理論に基づくAIモデルとその解釈可能性の定義手法を提案する。
我々は、幅広いAIモデルを構成モデルと比較する。
標準の'本質的に解釈可能な'モデルを作るものは、最も明確に図式化されます。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:27:03 GMT)
Figuring out Figures: Using Textual References to Caption Scientific Figures [3.4] フィギュアキャプションを自動的に生成する以前の作業は、ほとんど失敗し、単一層LSTMを使うことがデフォルトになっている。
我々の研究では、Hsuらによって計算されたSciCapデータセットを使用し、CLIP+GPT-2エンコーダデコーダモデルの変種を用いて、画像上に条件付きキャプションを生成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:49:21 GMT)
Native Design Bias: Studying the Impact of English Nativeness on Language Model Performance [3.3] 大規模言語モデル(LLM)は、大規模コーパスで事前訓練中に取得した情報を提供することに優れる。
本研究では,LLM応答の質がユーザの人口分布によって異なるかを検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:04:21 GMT)
Data curation via joint example selection further accelerates multimodal learning [3.3] サンプルを個別に選択するよりも,データのバッチを共同で選択することが学習に有効であることを示す。
このようなバッチを選択するための単純かつトラクタブルなアルゴリズムを導出し、個別に優先順位付けされたデータポイントを超えてトレーニングを著しく加速する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:52:37 GMT)
Generalizability of experimental studies [3.3] 実験研究は機械学習(ML)研究の基盤となっている。
一般的なが、しばしば暗黙的な仮定は、研究の結果は研究そのものを超えて一般化されるというものである。
概念の重要性にもかかわらず、一般化可能性を測定するという問題は未解決のままである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:49:07 GMT)
Interpreting Attention Layer Outputs with Sparse Autoencoders [3.2] モデルアクティベーションを解釈可能なコンポーネントに分解することは、機械的解釈可能性において鍵となるオープンな問題である。
この作業では、注意層出力でSAEをトレーニングし、ここでもSAEがスパースで解釈可能な分解を見つけることを示す。
Sparse Autoencodersは、研究者が以前の作業よりも詳細にモデル動作を説明するのに役立つツールであることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:43:13 GMT)
UHD-IQA Benchmark Database: Pushing the Boundaries of Blind Photo Quality Assessment [2.9] 固定幅3840ピクセルの6073 UHD-1 (4K)画像からなる画像品質評価データセットを提案する。
私たちの作品は、高い技術品質の高度に美的な写真に焦点を当てており、文学のギャップを埋めています。
データセットには、クラウドソーシング調査を通じて得られた知覚的品質評価が注釈付けされている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:30:31 GMT)
Superconductivity induced by strong electron-exciton coupling in doped atomically thin semiconductor heterostructures [2.8] 原子状薄膜半導体における超伝導を誘導する機構について検討する。
トリオンの強いカップリング物理を考慮すると、有効電子-励起子相互作用は強い周波数と運動量に依存することが分かる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:34:22 GMT)
Interband and intraband transitions, as well as charge mobility in driven two-band model with electron phonon coupling [2.7] 駆動2バンドモデルにおいて、外部周期駆動がバンド間およびバンド間遷移および電荷移動に与える影響について検討する。
その結果,周期駆動はバンド間遷移を抑えつつバンド間遷移を促進できることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:02:01 GMT)
Decoding general error correcting codes and the role of complementarity [2.7] 本稿では,Calderbank-Shor-Stean符号の復号回路を一般のQECCに簡単に拡張可能であることを示す。
次に, ブラックホール情報パラドックスの玩具モデルにおいて, 復号回路のパワーを実証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 00:51:14 GMT)
DEM: A Method for Certifying Deep Neural Network Classifier Outputs in Aerospace [2.6] 航空宇宙分野におけるソフトウェア開発は、厳格で高品質な標準に固執する必要がある。
深層学習革命の恩恵を航空宇宙システムに与える方法は不明である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:35:13 GMT)
Resource-Optimized Grouping Shadow for Efficient Energy Estimation [2.6] 本稿では,新たな重なり合うグループ化戦略と凸最適化による推定誤差を最小化することにより,測定資源を最適に割り当てるリソース・ド・グルーピング・シャドー(ROGS)アルゴリズムを提案する。
数値実験により, ROGS は, 量子コンピュータ上での回路のコンパイル・実行に要するコスト要因に対処するため, 従来手法に比べて, 精度の高い推定精度の確保に要する量子回路を著しく少なくすることを示した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:37:35 GMT)
Optimal spanning tree reconstruction in symbolic regression [2.6] モデルは原始関数の重ね合わせである。
提案アルゴリズムは, 加重色グラフからスパンニング木を再構成する。
本稿では,Steiner 木木アルゴリズムを応用した新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:22:13 GMT)
Modeling Emotions and Ethics with Large Language Models [2.5] まず、8つの基本的感情をモデル化し、対立するペアとして提示し、これらの感情を再解釈し表現するために協調的なLLMを用いる。
我々の焦点は、人間のフィードバックによる新しい自己教師付き学習アルゴリズムによって導かれる、LSMに潜伏する倫理的次元を埋め込むことにまで及んでいる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 04:36:08 GMT)
A Simple Finite-Time Analysis of TD Learning with Linear Function Approximation [2.4] マルコフサンプリングの下で線形関数近似を用いたTD学習の有限時間収束について検討する。
提案アルゴリズムでは,プロジェクションステップを実際に実行することなく,プロジェクションに基づく解析の単純さを維持することができることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:18:09 GMT)
Unmasking the Imposters: In-Domain Detection of Human vs. Machine-Generated Tweets [2.4] 4つの大規模言語モデル(LLM)の生成能力を調べるために,Twitterデータセットを用いた方法論を提案する。
3つのオープンソースLCMの7Bおよび8Bパラメータベースインストラクションモデルを評価し、さらなる微調整および「アンセンサード」バージョンの影響を検証した。
その結果,ドメイン内微調整を付加した「アンセンソルド」モデルでは,自動検出法の有効性が劇的に低下することがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:49:17 GMT)
Learning Dynamic Bayesian Networks from Data: Foundations, First Principles and Numerical Comparisons [2.4] データから動的ベイズネットワーク(DBN)を学習する基礎について紹介する。
一般化の形式と、特定の変数分布に対する共通型DBNの集合について述べる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:28:17 GMT)
Benchmarking Deep Learning Models on NVIDIA Jetson Nano for Real-Time Systems: An Empirical Investigation [2.4] この研究は、複雑なディープラーニングモデルの最適化を実証的に研究し、組み込みデバイス上で機能を分析する。
画像分類と映像行動検出のための推論速度の観点から最適化されたモデルの有効性を評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:34:52 GMT)
The Tree of Diffusion Life: Evolutionary Embeddings to Understand the Generation Process of Diffusion Models [2.4] Tree of Diffusion Life (TDL) は拡散モデルの生成過程におけるデータの進化を理解する方法である。
TDLは、様々な反復のインスタンスを通して拡散モデルの生成空間をサンプリングし、画像エンコーダを使用してこれらのサンプルから意味的意味を抽出する。
これは、高次元の関係を保ちながら反復を明示的に符号化する新しい進化的埋め込みアルゴリズムを採用している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:05:26 GMT)
Succinct quantum testers for closeness and $k$-wise uniformity of probability distributions [2.3] 確率分布の近さ特性と$k$-wise均一性をテストする基本的な問題に対する潜在的な量子スピードアップについて検討する。
我々は、$ell1$-および$ell2$-closenessテストの量子クエリ複雑性が$O(sqrtn/varepsilon)$と$O(sqrtnk/varepsilon)$であることを示す。
クエリ複雑性を$O(sqrtnk/varepsilon)で表した最初の量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:43:09 GMT)
Multi-objective Binary Differential Approach with Parameter Tuning for Discovering Business Process Models: MoD-ProM [2.3] 本稿では,プロセス発見のための多目的フレームワークにおけるバイナリ微分進化手法について考察する。
提案手法により生成されたプロセスモデルは、最先端のアルゴリズムで生成されたプロセスよりも優れているか、少なくとも優れていることが示されている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:53:55 GMT)
Graph-Augmented LLMs for Personalized Health Insights: A Case Study in Sleep Analysis [2.3] 大規模言語モデル(LLM)は、インタラクティブなヘルスアドバイスを提供する上で、有望であることを示している。
Retrieval-Augmented Generation (RAG) やファインチューニングのような従来の手法は、複雑で多次元で時間的に関係のあるデータを完全に活用できないことが多い。
本稿では,健康意識のパーソナライズと明確性を高めるために,グラフ拡張LDMフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:17:40 GMT)
The Balanced-Pairwise-Affinities Feature Transform [2.3] BPA機能変換は、入力項目のセットの機能をアップグレードして、下流のマッチングや関連するタスクのグループ化を容易にするように設計されている。
特定の min- Cost-max-flow の分数マッチング問題は、効率的、微分可能、同変、パラメータレス、確率論的に解釈可能な変換をもたらす。
経験的には、この変換はその使用において非常に効果的で柔軟性があり、様々なタスクやトレーニングスキームにおいて挿入されるネットワークを継続的に改善する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:28:05 GMT)
Camera Model Identification Using Audio and Visual Content from Videos [2.3] 本稿では,音声,視覚的コンテンツ,あるいはそれらの融合を用いてデバイスを識別できるフレームワークを提案する。
提案フレームワークは,音声や視覚的コンテンツを独立して使用する場合に,有望な分類性能を示す。
将来の研究は、融合プロセスを改善し、両モードの分類性能を継続的に改善する可能性がある。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:56:21 GMT)
TALEC: Teach Your LLM to Evaluate in Specific Domain with In-house Criteria by Criteria Division and Zero-shot Plus Few-shot [2.2] 本稿では,モデルに基づく評価手法 TALEC を提案する。
ユーザは自分の評価基準を柔軟に設定でき、インコンテキストラーニング(ICL)を使って審査員にこれらの評価基準を教えることができる。
TALECは人間の嗜好を正確に反映する強力な能力を示し、人間の判断と80%以上の相関を達成している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:02:42 GMT)
Smart Casual Verification of CCF's Distributed Consensus and Consistency Protocols [2.2] Confidential Consortium Framework(CCF)は、信頼できる信頼性のあるクラウドアプリケーションを開発するためのオープンソースプラットフォームである。
CCFはMicrosoftのAzure Confidential Ledgerサービスを動かしている。
本稿では、CCFの新しい分散プロトコルの正当性を検証するために、スマートカジュアル検証を適用した経験を報告する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:49:54 GMT)
Video Inpainting Localization with Contrastive Learning [2.1] ディープ・インペイントは通常、偽ビデオを作成するための重要なオブジェクトを削除する悪質な操作として使用される。
コントロアシブラーニング(ViLocal)を用いた簡易かつ効果的な映像塗装手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:15:54 GMT)
European Space Agency Benchmark for Anomaly Detection in Satellite Telemetry [2.1] 欧州宇宙機関の衛星テレメトリにおける異常検出ベンチマーク(ESA-ADB)は、この領域に新しい標準を確立することを目的としている。
新たに導入されたESA異常データセットには、3つのESAミッションからの注釈付き実生活テレメトリが含まれている。
新しい階層的評価パイプラインで評価された典型的な異常検出アルゴリズムの結果は、演算子のニーズに対処するために新しいアプローチが必要であることを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:23:37 GMT)
LLM-ARC: Enhancing LLMs with an Automated Reasoning Critic [2.1] LLM-ARCは,Large Language Models (LLM) の論理的推論能力を高めるために設計された,ニューロシンボリックなフレームワークである。
LLM-ARC は Actor-Critic 方式を採用しており、LLM アクターは宣言論理プログラムと意味的正当性テストを生成し、Automated Reasoning Critic はコードを評価し、テストを実行し、反復的洗練のためのテスト失敗に対するフィードバックを提供する。
実験では,LLMのみのベースラインよりも大幅に改善され,論理的テスト生成と反復的自己精製の重要性が強調された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:52:15 GMT)
Solving Hard Mizar Problems with Instantiation and Strategy Invention [2.0] 複数のATP法とAI法を用いて,これまでATP未承認であったMizar/MPTP問題の3000以上を証明した。
この方法では、これまで未解決だった14163のハード・ミザー問題の3021(21.3%)が解決された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:47:13 GMT)
Dynamical photon-photon interaction mediated by a quantum emitter [2.0] 単一光子は量子科学と技術の主要なプラットフォームを構成する。
量子フォトニクスの主な課題は、どのように高度な絡み合った資源状態と効率的な光物質界面を生成するかである。
我々は、単一光子波束間の量子非線形相互作用を実現するために、単一量子エミッタとナノフォトニック導波路との効率的でコヒーレントな結合を利用する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:55:13 GMT)
A Critical Analysis of the Theoretical Framework of the Extreme Learning Machine [2.0] ELM学習アルゴリズムに反例を与える2つの主要な文とデータセットの証明を論じる。
我々は、いくつかの理論的ケースにおいて、EMMの効率を正当化する基礎の代替的なステートメントを提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:06:07 GMT)
BayTTA: Uncertainty-aware medical image classification with optimized test-time augmentation using Bayesian model averaging [1.9] 本稿では,Bayesian-based TTA (Bayesian-based TTA) と呼ばれる,TTAを最適化するための新しいフレームワークを提案する。
まず、TTAによって生成された入力データの様々なバリエーションに関連するモデルリストを生成する。
次に,BMAを用いて,それぞれの後部確率で重み付けされたモデル予測を組み合わせる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:24:06 GMT)
Federated Dynamical Low-Rank Training with Global Loss Convergence Guarantees [1.9] ネットワーク重みのグローバルな低ランク基底は、小さな係数行列でのクライアントトレーニングを可能にする。
一貫した大域的低ランク基底は、分散補正スキームを導入し、大域的損失降下と収束を証明できる。
クライアントの計算コストと通信コストを最大1桁削減し,グローバルな精度への影響を最小限に抑える。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:51:08 GMT)
ViANLI: Adversarial Natural Language Inference for Vietnamese [1.9] 敵NLIデータセットをNLP研究コミュニティに導入し,その名称をViANLIとした。
このデータセットには、10K以上の前提-仮説ペアが含まれている。
テストセットで最も強力なモデルの精度は48.4%にしか達しなかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:58:19 GMT)
Classification with neural networks with quadratic decision functions [1.9] 本稿では,2次決定関数を持つニューラルネットワークの分類への応用について検討する。
特に、手書き桁の分類のためのMNISTデータセット上で、アルゴリズムを検証、比較する。
実装は,それぞれ,ソフトウェアフローとKerasのニューラルネットワーク構造に基づいて行うことができることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:37:40 GMT)
Locally Differentially Private Distributed Online Learning with Guaranteed Optimality [1.8] 本稿では,分散オンライン学習における差分プライバシーと学習精度を両立させる手法を提案する。
予想される即時後悔の減少を確実にする一方で、このアプローチは有限累積プライバシー予算を同時に確保することができる。
私たちの知る限りでは、このアルゴリズムは厳密な局所的な差分プライバシーと学習精度の両方を確実にする最初のアルゴリズムです。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:07:24 GMT)
Experimental distillation of tripartite quantum steering with an optimal local filtering operation [1.8] マルチパーティタイト アインシュタイン-ポドルスキー-ローゼン(EPR) ステアリングは、非文字化検証器の存在下でのマルチパーティタイト絡みを認めている。
3ビット一般化グリーンバーガー・ホーネ・ザイリンガー状態のコピーから真のトリパルタイトEPRステアリングを蒸留できる局所濾過法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:21:42 GMT)
Modeling the Sacred: Considerations when Using Religious Texts in Natural Language Processing [1.8] 宗教的な文章は文化的に重要な価値の表現である。
機械学習モデルは、トレーニングデータにエンコードされた文化的価値を再現する確率を持っている。
本稿は,NLPによるこのようなテキストの使用が,モデルバイアスを超えた考察を提起するものであることを論じる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:02:16 GMT)
Using Large Language Models in Public Transit Systems, San Antonio as a case study [1.8] 本研究ではサンアントニオの公共交通システムにおける大規模言語モデルの影響について検討する。
この研究は、ルート計画の強化、待ち時間削減、パーソナライズされた旅行支援の提供におけるLLMの変革の可能性を強調している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:32:56 GMT)
Detection of Synthetic Face Images: Accuracy, Robustness, Generalization [1.8] 合成画像と実画像の分離において,特定の画像生成装置で訓練した簡単なモデルでほぼ完璧な精度が得られることがわかった。
このモデルは敵の攻撃に弱いことが判明し、目に見えない発電機には一般化されなかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:34:50 GMT)
Towards Synthesizing Twelve-Lead Electrocardiograms from Two Asynchronous Leads [1.7] 12誘導心電図を用いて心臓病の診断を行った。
様々なウェアラブルデバイスは、Wieldy機器を使わずにECGへの即時アクセスを可能にしている。
本稿では,2つの非同期リードから10リードへのECG合成の深部生成モデルを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:46:15 GMT)
CoSMo: a Framework to Instantiate Conditioned Process Simulation Models [1.6] 本稿では,ユーザの制約やアプリオリ知識の他の性質に基づいて,CoSMo(Conditioned Process Simulation Models)の発見に適した,新しいリカレントニューラルネットワークを提案する。
このアーキテクチャは、宣言型ルールを学習フェーズに組み込むことで、特定の制約に従うイベントログのシミュレーションを容易にする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:44:31 GMT)
Fine-grained Prompt Tuning: A Parameter and Memory Efficient Transfer Learning Method for High-resolution Medical Image Classification [1.6] きめ細かいPrompt Tuning(FPT)は、訓練済みのモデルを下流のタスクに転送するコスト効率の良い方法である。
FPTは他のPETL法と比較してメモリ消費を大幅に削減する。
FPTは, サイズ, モダリティ, 複雑さの異なる4つの医療データセットで評価した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:15:54 GMT)
Modularity Based Community Detection in Hypergraphs [1.5] ハイパーグラフモジュラリティ関数h-Louvainを用いたスケーラブルなコミュニティ検出アルゴリズムを提案する。
これは、ハイパーグラフの文脈における古典的なルーヴァンアルゴリズムの適応である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:49:56 GMT)
Dark Transformer: A Video Transformer for Action Recognition in the Dark [1.5] 本稿では,低照度環境における行動認識のためのビデオトランスフォーマーを用いた新しいアプローチを提案する。
Dark Transformerleveragesは、クロスドメインのアクション認識を強化するために、クロスドメイン設定におけるビデオの自己アテンションメカニズムを提供する。
ベンチマークアクション認識データセット上での最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:25:12 GMT)
Enabling Large Language Models to Perform Power System Simulations with Previously Unseen Tools: A Case of Daline [1.4] この研究は、パワーシステムと大規模言語モデルの両方から専門知識を統合するモジュラーフレームワークを提案する。
GPT-4oのシミュレーション符号化精度は0%から96.07%に向上し、ChatGPT-4oのウェブインタフェースの33.8%の精度を上回っている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:05:26 GMT)
How Good Is It? Evaluating the Efficacy of Common versus Domain-Specific Prompts on Foundational Large Language Models [1.4] 本研究は,サイバーセキュリティ,医療,金融など多種多様な分野にわたる言語モデル(LLM)を評価する。
その結果,モデルサイズと推論に用いるプロンプトの種類は応答長と品質に大きく影響した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:52:31 GMT)
On the numerical reliability of nonsmooth autodiff: a MaxPool case study [1.4] 本稿では,非滑らかなMaxPool演算を含むニューラルネットワークにおける自動微分(AD)の信頼性について考察する。
最大プール関数に対する非滑らかなヤコビアンの異なる選択が16ビットと32ビットの精度に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:55:16 GMT)
Optimization of Autonomous Driving Image Detection Based on RFAConv and Triplet Attention [1.3] 本稿では, YOLOv8モデルの拡張のための総合的アプローチを提案する。
C2f_RFAConvモジュールは、機能の抽出効率を高めるために元のモジュールを置き換える。
Triplet Attentionメカニズムは、ターゲット検出の強化のための特徴焦点を強化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:59:33 GMT)
Neural Optimization with Adaptive Heuristics for Intelligent Marketing System [1.3] 本稿では,AIシステムのマーケティングのための一般的なフレームワークとして,適応ヒューリスティックス(Noah)フレームワークを用いたニューラル最適化を提案する。
Noahは2B(to-business)と2C(to-consumer)の両方の製品と、所有チャンネルと有償チャネルを考慮に入れた、マーケティング最適化のための最初の一般的なフレームワークである。
我々は、予測、最適化、適応的なオーディエンスを含むNoahフレームワークの重要なモジュールを説明し、入札とコンテンツ最適化の例を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 22:52:43 GMT)
Visualize and Paint GAN Activations [1.3] これらのモデルの内部動作をよりよく理解し、無条件で訓練されたGANで構造を描くことを目的として、GANの生成した構造と、それらが隠れた層内での活性化とどのように相関するかを考察する。
これにより、生成された画像をより制御し、トレーニングデータにそのようなセグメンテーションを必要としないセグメンテーションマップからセグメンテーションを生成することができます。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:05:11 GMT)
iWISDM: Assessing instruction following in multimodal models at scale [1.2] 我々は,視覚言語タスクの無制限な配列を生成するために,指示された仮想VISual Decision Making (iWISDM)環境を紹介する。
iWISDMを用いて,様々な複雑性レベルにわたる視覚課題に追従する命令の3つの異なるベンチマークをコンパイルした。
本研究は,既存のマルチモーダルモデルと創発的マルチモーダルモデルの両方の命令順守性を評価するための頑健なベンチマークとしてiWISDMを確立した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:12:01 GMT)
Explainable Online Unsupervised Anomaly Detection for Cyber-Physical Systems via Causal Discovery from Time Series [1.2] ニューラルネットワークによるディープラーニングに基づく最先端のアプローチは、異常認識において優れたパフォーマンスを達成する。
本手法はトレーニング効率が向上し,最先端のニューラルネットワークアーキテクチャの精度に優れることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:10:46 GMT)
DocParseNet: Advanced Semantic Segmentation and OCR Embeddings for Efficient Scanned Document Annotation [1.2] DocParseNetは、ディープラーニングとマルチモーダル学習を組み合わせて、テキストとビジュアルデータの両方を処理する。
従来のモデルよりも大幅に優れており、検証ではmIoUスコアが49.12、テストセットでは49.78である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:32:31 GMT)
Advancing dermatological diagnosis: Development of a hyperspectral dermatoscope for enhanced skin imaging [1.1] 本稿では,ヒト皮膚分析に適した近縁型ハイパースペクトル皮膚内視鏡(Hyperscope)の開発について紹介する。
15人と160人の皮膚画像から得られた予備的な結果は、様々な皮膚状態を特定し、特徴付けるためのハイパースコープの可能性を示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:49:54 GMT)
Efficient Quantum Circuits for Non-Unitary and Unitary Diagonal Operators with Space-Time-Accuracy trade-offs [1.1] ユニタリおよび非ユニタリ対角作用素は量子アルゴリズムの基本的な構成要素である。
本稿では,一元対角演算子と非単元対角演算子を効率よく調整可能な量子回路で実装する一般手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:15:43 GMT)
Accelerating Electronic Stopping Power Predictions by 10 Million Times with a Combination of Time-Dependent Density Functional Theory and Machine Learning [1.0] 物質中の粒子放射がエネルギーを放出する速度を知ることは、原子炉、医療、半導体、量子材料を設計する上で鍵となる。
我々は,時間依存密度汎関数理論と機械学習を組み合わせることで,スーパーコンピュータ上での時間のみの新しい材料評価時間を短縮する手法を確立した。
このアプローチでは、TDDFTを使用して電子的な停止コントリビューションを計算し、最初の原則からいくつかの方向のパワーを停止し、マシンラーニングを使用して他の方向へのインターポーラを、コア時間の1000万倍のコストで実行します。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:09:23 GMT)
YAQQ: Yet Another Quantum Quantizer -- Design Space Exploration of Quantum Gate Sets using Novelty Search [1.0] 本稿では,量子処理ユニットと制御プロトコルのネイティブゲートに基づく比較解析を行うソフトウェアツールを提案する。
開発されたソフトウェアYAQQ(Yet Another Quantum Quantizer)は、最適化された量子ゲートセットの発見を可能にする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:55:35 GMT)
Automatic infant 2D pose estimation from videos: comparing seven deep neural network methods [1.0] この作業は、乳幼児の体位に関するビデオ(AlphaPose, DeepLabCut/DeeperCut, Detectron2, HRNet, MediaPipe/BlazePose, OpenPose, ViTPose)をテストし、比較する。
驚いたことに、DeepLabCutとMediaPipeを除くすべてのメソッドは、さらなる微調整なしで競争性能を保ち、ViTPoseは最高性能である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:58:53 GMT)
Mask-Guided Attention U-Net for Enhanced Neonatal Brain Extraction and Image Preprocessing [1.0] マスク誘導型アテンションニューラルネットワークMGA-Netについて紹介する。
他の構造から脳を抽出し、高品質な脳画像の再構築を目的としている。
今回提案したMGA-Netを,様々な臨床設定と新生児年齢群から得られた多様なデータセットで広範囲に検証した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:48:18 GMT)
Compositional Models for Estimating Causal Effects [0.9] 構造系における個々の治療効果を推定するための構成的アプローチについて検討する。
このアプローチでは、モジュールアーキテクチャを使用して、各コンポーネントの潜在的な成果をモデル化する。
我々は因果推論における構成的アプローチの新たな利点を発見した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:56:17 GMT)
Quantum-Inspired Fluid Simulation of 2D Turbulence with GPU Acceleration [0.9] 本研究では,速度を行列積状態とするNavier-Stokes方程式の解法について検討する。
我々の適応はシミュレーションを最大12.1倍スピードアップさせる。
このアルゴリズムは乱流状態の直接数値シミュレーションに対して潜在的に有利であることがわかった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:31:20 GMT)
A Cost-Efficient FPGA Implementation of Tiny Transformer Model using Neural ODE [0.8] 本稿では,12.1$times$パラメータ削減のためにResNetの代わりにNeural ODEをバックボーンとして使用する軽量ハイブリッドモデルを提案する。
STL10データセットでは、提案されたモデルは、ResNet50に匹敵する80.15%のトップ1精度を達成する。
提案したFPGA実装は、バックボーンとMHSA部品の34.01$times$スピードアップを達成し、ソフトウェアの前処理と後処理を考慮すると、全体的な9.85$times$スピードアップを達成する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:49:31 GMT)
A Matrix Product State Model for Simultaneous Classification and Generation [0.8] 量子機械学習(Quantum Machine Learning, QML)は、量子コンピューティングの原理と機械学習の技法を融合させる、急速に拡大する分野である。
本稿では,MPSが分類器と生成器の両方として機能する新しい行列積状態(MPS)モデルを提案する。
我々のコントリビューションは、生成タスクのためのテンソルネットワークメソッドのメカニズムに関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:23:36 GMT)
Towards Task-Compatible Compressible Representations [0.8] マルチタスクで学習可能な圧縮において、あるタスクで学習した表現が別のタスクの速度歪み性能に肯定的な寄与をしない問題について検討する。
学習可能なスケーラブルコーディングでは、この共有表現を学習する際に入力再構成にも報いることで、入力再構成のためのサイド情報の利用が増加した。
我々はCOCO 2017のオブジェクト検出とCityscapesデータセットの深さ推定のために訓練された表現を用いて実験を行い、画像再構成とセマンティックセグメンテーションタスクを支援する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:02:12 GMT)
Quantum correlation of Hawking radiations for mass-superposed BTZ black holes [0.8] ウンルー・デウィット検出器モデルを用いた最近の研究により、ブラックホール質量重畳の量子的シグネチャが明らかになった。
本稿では,等時密度密度相関関数を用いて,BTZブラックホールの質量重畳を再検討する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:23:49 GMT)
Aligning Programming Language and Natural Language: Exploring Design Choices in Multi-Modal Transformer-Based Embedding for Bug Localization [0.8] バグローカライゼーション(バグローカライゼーション)とは、プログラミング言語のソースコードファイルの識別である。
本研究は,14種類の異なる埋め込みモデルを評価し,様々な設計選択の効果について考察した。
以上の結果から,プレトレーニング戦略が組込みの質に大きく影響していることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:01:39 GMT)
Confabulation: The Surprising Value of Large Language Model Hallucinations [0.7] ナラティビティを認知的資源として活用するために,LLMのコミュニケーションの計測可能な意味的特性は,人間の正当性を反映している,と我々は主張する。
この発見は、通常、非難の否定的な理解の中で緊張を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:37:19 GMT)
Diffusion-based Adversarial Purification for Intrusion Detection [0.7] 不正な摂動はMLモデルを誤解させ、攻撃者が検出を回避したり、誤った警告をトリガーしたりすることを可能にする。
敵の浄化は、特に有望な結果を示す拡散モデルによって、説得力のある解決策として現れてきた。
本稿では,ネットワーク侵入検出における逆例の浄化における拡散モデルの有効性を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:48:28 GMT)
A near-term quantum algorithm for solving linear systems of equations based on the Woodbury identity [0.6] 本稿では,不規則高原や局所最適解などの問題を回避し,方程式の線形系を解くための量子アルゴリズムについて述べる。
このアルゴリズムは、他の(容易に可逆な)行列の低ランクな修正である行列の逆を解析的に記述するウッドベリー恒等式に基づいている。
我々は、IBMのオークランド量子コンピュータを用いて、2%の誤差で1600万以上の方程式を解いたシステムの内部積を推定する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:16:54 GMT)
Sampling Strategies in Bayesian Inversion: A Study of RTO and Langevin Methods [0.5] 本稿では,逆問題に対する2種類のサンプリング手法について検討する。
本稿では,2つのアプローチの主な概念的,理論的相違点を強調し,実践的な観点から比較する。
サンプリング手法の選択が再現の質に重大な影響を及ぼし,RTO法がパラメータの選択に対してより堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:36:21 GMT)
Is the Valence Bond Solid state in $J_1$-$J_2$ Square Lattice Heisenberg Model Plaquette or Columnar? [0.5] J$-$J$正方格子ハイゼンベルクモデルにおけるバレンスボンド固相について検討する。
我々は,VBS相をPVBS型と同定し,VBS相に自発的な回転対称性の破れがないことを示す。
本研究は、二次元量子多体系の研究におけるFAMPSの能力を強調した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:39:28 GMT)
An Embedded Diachronic Sense Change Model with a Case Study from Ancient Greek [0.4] 本稿では,単語埋め込みを言語と組み合わせ,優れたモデル性能を提供する組込みモデルであるEDiSCを紹介する。
EDiSCは、精度の向上、地道回復、不確実性定量化を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:13:12 GMT)
Brain Tumor Classification using Vision Transformer with Selective Cross-Attention Mechanism and Feature Calibration [0.4] 我々は,クロスアテンション融合モジュールの性能向上のための2つの新しいメカニズムを紹介する: 特徴メカニズム(FCM)と選択的クロスアテンション(SCA)である。
FCMは異なるブランチの機能を校正して互換性を高め、SCAは最も有益な機能に選択的に対応します。
提案手法は脳腫瘍の分類における他の最先端手法よりも優れており,精度と効率が向上している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:58:56 GMT)
A benchmark for 2D foetal brain ultrasound analysis [0.4] 妊娠20週目に得られた104個の2D脳超音波画像について報告する。
この画像は、興味のある構造から脳の発達を分析することまで、目印となる点を強調するために注釈付けされている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 03:34:54 GMT)
Entity Augmentation for Efficient Classification of Vertically Partitioned Data with Limited Overlap [0.3] Vertical Federated Learning(VFL)は、垂直に分割されたデータから学習するための機械学習パラダイムである。
本稿では,カテゴリー的タスクにおける整合性や整合性の必要性を解消する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:20:10 GMT)
Efficient Quantum Algorithm for Filtering Product States [0.3] 目標エネルギーで小さなエネルギー分散を持つ状態を効率的に準備する量子アルゴリズムを導入する。
我々のアルゴリズムは、量子シミュレーターにおける多くの身体系の有限エネルギー状態を研究する方法を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:31:14 GMT)
Vision Controlled Sensorized Prosthetic Hand [0.3] 本稿では, 自然手の性能, 機能, 外観, 快適性を再現することを目的とした, 視覚対応義手について述べる。
設計目標は、ほとんどトレーニングを必要とせず、ユーザフレンドリーなインターフェースを備えた、アクセス可能な代替手段を作ることだった。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:44:04 GMT)
High-Performance Hybrid Algorithm for Minimum Sum-of-Squares Clustering of Infinitely Tall Data [0.3] 本稿では,Infinitely Tall Data (MSSC-ITD) の最小二乗クラスタリングという,クラスタリング問題の新しい定式化を提案する。
現代の高性能コンピューティング技術を利用することで、HPClustは、有効性、計算効率、拡張性といった主要なクラスタリング指標を強化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:49:06 GMT)
Dual-isometric Projected Entangled Pair States [0.3] 本稿では,2つの等尺条件を組み込んだプロジェクト・エンタングルド・ペア・ステート(PEPS)を提案する。
この新たなクラスは、一般的な局所可観測関数と特定の2点相関関数の効率的な計算を容易にする。
我々は、このクラスが普遍量子計算を符号化し、位相的から自明な順序への遷移を表現できることを解析的に実証した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:10:47 GMT)
ET tu, CLIP? Addressing Common Object Errors for Unseen Environments [0.3] ALFREDタスクにおけるモデル一般化を強化するために、事前訓練されたCLIPエンコーダを使用する簡単な方法を提案する。
CLIPがビジュアルエンコーダを置き換える以前の文献とは対照的に、補助オブジェクト検出の目的を通じて追加モジュールとしてCLIPを使用することを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:35:13 GMT)
Application of Liquid Rank Reputation System for Twitter Trend Analysis on Bitcoin [0.2] 本稿では,ユーザ評価に基づく「流動的民主主義」アプローチを取り入れた,Twitter上のBitcoinトレンドの分析モデルを提案する。
評価システムに基づくTwitterの感情分析モデルを使用して、Bitcoinの価格変更と取引量への影響を判断する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:35:25 GMT)
Embedded event based object detection with spiking neural network [0.2] 本研究では,SPiking Low-power Event-based ArchiTectureアクセラレータを応用した,組み込み型ニューロモルフィックテストベンチを提案する。
このテストベンチを使用して、最先端のSNNソリューションをロードし、専用ハードウェア上でネットワークをデプロイする際のパフォーマンス損失を推定し、ニューロモルフィックハードウェア上で実際のイベントベースのODを実行する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:02:01 GMT)
MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions [0.1] 神経ネットワークに基づくシステムの臨床実践への統合は、ドメインの一般化と堅牢性に関連する課題によって制限される。
我々は、12のデータセットと9つの画像モダリティをカバーするMedMNIST+コレクションに基づくベンチマークデータセットであるMedMNIST-Cを作成し、オープンソース化した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:20:39 GMT)
Polynomial Equivalence of Complexity Geometries [0.1] 本稿では、量子計算複雑性の幅広い定義の同値性を証明する。
ユニタリ群における右不変測度について検討する。
量子回路と同じ計算能力を持つ測定値の同値類を列挙する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:15:31 GMT)
Efficiently improving the performance of noisy quantum computers [0.0] 我々は、"Noiseless Output Extrapolation"と"Pauli Error Cancellation"という2つの効率的なエラー軽減プロトコルを開発し、実験的に検証する。
我々は、構造化回路とランダム回路の両方の性能を著しく改善し、未緩和出力よりも最大86%の変動距離を改良した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:10:02 GMT)
TSynD: Targeted Synthetic Data Generation for Enhanced Medical Image Classification [0.0] この研究は、生成モデルを誘導し、高い不確実性でデータを合成することを目的としている。
最適化プロセスによりオートエンコーダの特徴空間を変更する。
我々は,複数の分類タスクに対するテスト時間データ拡張と敵攻撃に対する堅牢性を向上させる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:38:46 GMT)
XAMI -- A Benchmark Dataset for Artefact Detection in XMM-Newton Optical Images [0.0] 我々は,XMM-Newton宇宙望遠鏡の光学モニタリングカメラから,異なる種類の人工物を示す画像のデータセットを提示する。
自動ML手法のトレーニングに使用するアーティファクトで,1000枚の画像のサンプルを手書きした。
我々は、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのモデルの両方からの知識を組み合わせたハイブリッドアプローチを採用する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:14:15 GMT)
Wigner Analysis of Particle Dynamics and Decoherence in Wide Nonharmonic Potentials [0.0] 非調和ポテンシャルにおける粒子の1次元運動の時間発展を概ね記述したウィグナー関数の解析式を導出する。
その結果,古典物理学と量子物理学の相互作用と非線形力学におけるデコヒーレンスの影響が解明された。
この分析結果は、大粒子のマクロ量子状態を生成するために非線形力学を用いて提案を設計し、最適化し、理解するのに役立つ。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:36:05 GMT)
WRDScore: New Metric for Evaluation of Natural Language Generation Models [0.0] 仮定に頼らずに精度とリコールを計測する新しい指標を提案する。
予測シーケンスと参照シーケンスの直接重複を測定することは、これらの微妙さを捉えることはできない。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:41:43 GMT)
Variational simulation of $d$-level systems on qubit-based quantum simulators [0.0] 自然界の多くの系は本質的に$d$レベルであり、より高いスピン、ボソン、振動モード、電子が含まれる。
量子シミュレータ上で$d$レベルのシステムをシミュレートするためには、$d$レベルのシステムをqubitベースにマッピングするために符号化法が必要である。
ヒルベルト空間の非正規状態に対処する体系的手法を開発する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:08:53 GMT)
VR-based Blockchain-enabled Data Visualization Framework For Manufacturing Industry [0.0] 本研究は、VRと統合されたブロックチェーンベースのデータ視覚化フレームワークを提案し、製造の洞察を得る。
提案システムは,VR環境にユーザを没入させることで,理解,分析,意思決定のプロセスを強化することを目的としている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:25:09 GMT)
Using a Feedback-Based Quantum Algorithm to Analyze the Critical Properties of the ANNNI Model Without Classical Optimization [0.0] フィードバック型量子アルゴリズム(FALQON)を用いた異方性Next-Nearest-Neighbor Ising(ANNNI)モデルの臨界特性について検討する。
このアプローチにより、古典的な最適化手法に頼ることなく、基底状態と励起状態の両方を計算することができる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:58:03 GMT)
Univariate Skeleton Prediction in Multivariate Systems Using Transformers [0.0] 本稿では,各変数がシステムの応答にどのように影響するかを説明することを目的とした,一変量シンボリックスケルトンを生成する説明可能なニューラルSR法を提案する。
実験により,本手法は基礎となる機能に適合する骨格表現を学習し,GPベースと2つのニューラルSR法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:07:06 GMT)
Unifying methods for optimal control in non-Markovian quantum systems via process tensors [0.0] 非マルコフ開系をシミュレートする複数の方法があり、環境を多くのアクティブな自由度に効果的に還元する。
ここでは、これらの手法のいくつかを行列積演算の形でプロセステンソルの項で表現できることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:09:41 GMT)
Treatment of Statistical Estimation Problems in Randomized Smoothing for Adversarial Robustness [0.0] ランダムな平滑化のための統計的推定問題について検討し,計算負担の有無を確かめる。
本稿では,標準手法と同じ統計的保証を享受する信頼度系列を用いた推定手法を提案する。
厳密な認証を行うために,Clopper-Pearson信頼区間のランダム化版を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:00:55 GMT)
Transforming Software Development: Evaluating the Efficiency and Challenges of GitHub Copilot in Real-World Projects [0.0] GitHub CopilotはAIによるコーディングアシスタントだ。
本研究では、GitHub Copilotを使用する際の効率向上、改善の領域、新たな課題について評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:51:21 GMT)
Transformer-based Named Entity Recognition with Combined Data Representation [0.0] 本研究は,1つの文,複数の文,および1ベクトルあたりの文脈に注意を払って結合された文をそれぞれ使用する単一,合併,文脈を含むデータ表現戦略について検討した。
分析によると、単一の戦略でトレーニングモデルを実行すると、異なるデータ表現のパフォーマンスが低下する可能性がある。
この制限に対処するために、モデル安定性と適応性を改善するために3つの戦略全てを利用する統合トレーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:41:16 GMT)
The impact of different unravelings in a monitored system of free fermions [0.0] 2つの異なるランダム測定プロトコル(アンラベリング)によって記述されたデファス化中の自由フェルミオン連鎖を考える。
量子軌道上の測定作用素の分布には分岐がある。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:11:32 GMT)
The State-Action-Reward-State-Action Algorithm in Spatial Prisoner's Dilemma Game [0.0] 強化学習は進化ゲーム理論の研究に適したフレームワークを提供する。
我々は、進化ゲーム理論における個人のための意思決定メカニズムとして、ステート・アクション・リワード・ステート・アクション・アルゴリズムを用いる。
我々は,SARSAが協力率に与える影響を,報酬の変動とネットワーク内の協調作業者や欠陥者の分布を分析して評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:21:35 GMT)
The SUPER excitation of quantum emitters is a multi-photon process [0.0] 量子エミッタ集団スキームの跳躍により、2つの赤みがかったレーザーパルスを用いて、量子エミッタの励起状態をほぼ均一な忠実度で生成することができる。
本研究は,SUPER方式の予期せぬ物理的解釈と,単一エミッタと複数フィールドモード間の非線形相互作用を明らかにするものである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:28:02 GMT)
The Gross-Pitaevskii equation for a infinite square-well with a delta-function barrier [0.0] 非相互作用ハミルトニアンの対称性を持つ解と非対称解を求める。
非対称状態に対する変分近似と近似的な数値的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:51:49 GMT)
Synthesizing and multiplexing autonomous quantum coherences [0.0] 本研究では,スピン系から量子コヒーレンスを合成・多重化する手法について検討する。
複数ボソニック浴のスピン-ボソン結合パラメータにおいて, 量子コヒーレンスを非摂動的に非摂動的に合成し, 次回の実証-原理実験のために増加・多重化することを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:24:24 GMT)
Spin torque driven electron paramagnetic resonance of a single spin in a pentacene molecule [0.0] 高周波スピン偏極電流による単一スピンのコヒーレント駆動を実証する。
電子常磁性共鳴の励起により、スピントルクによる単一スピンの動的制御を確立した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:03:43 GMT)
Specific language impairment (SLI) detection pipeline from transcriptions of spontaneous narratives [0.0] 特定の言語障害(SLI)はコミュニケーションに影響を及ぼし、理解と表現の両方に影響を及ぼす疾患である。
本研究は,1063回のインタビューから得られた自発物語の書き起こしを用いて,子どものSLIを効果的に検出することに焦点を当てた。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:22:57 GMT)
SincVAE: a New Approach to Improve Anomaly Detection on EEG Data Using SincNet and Variational Autoencoder [0.0] 本研究では,脳波データからてんかん発作を検出するための半教師付きアプローチを提案する。
以上の結果から,SncVAEは脳波データにおける発作検出を改善し,早期発作の早期発見と術後経過のモニタリングが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:21:01 GMT)
Silicon Photomultipliers for Detection of Photon Bunching Signatures [0.0] 光の束はSiPMを用いて初めて観測された。
括弧は97hsのデータを用いて7.3sigma$で観測された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:34:24 GMT)
SigKAN: Signature-Weighted Kolmogorov-Arnold Networks for Time Series [0.0] 学習可能な経路シグネチャとコルモゴロフ・アルノルドネットワーク(KAN)を用いた多変量関数近似の新たな手法を提案する。
学習可能な経路シグネチャを用いて、kansが取得した値を重み付けすることで、これらのネットワークの学習能力を向上し、パスの重要な幾何学的特徴を捉える。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:58:39 GMT)
Scoreformer: A Surrogate Model For Large-Scale Prediction of Docking Scores [0.0] 分子ドッキングスコアを正確に予測するために設計された新しいグラフトランスフォーマモデルであるScoreFormerを提案する。
ScoreFormerはドッキングスコア予測の競争性能を達成し、既存のモデルに比べて1.65倍の推論時間削減を実現している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:25:08 GMT)
Scientific Machine Learning Based Reduced-Order Models for Plasma Turbulence Simulations [0.0] 本稿では, プラズマ乱流シミュレーションのための非侵入型科学機械学習 (SciML) 削減次数モデル (ROM) の構築に焦点をあてる。
我々は、演算子推論(OpInf)を用いて、そのようなシミュレーションデータから低コストな物理ベースのROMを構築することを提案する。
核融合研究のより広い文脈において、これは非侵入性SciML ROMが数値研究を劇的に加速する可能性があることを示している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:30:28 GMT)
Schrödinger cats coupled with cavities losses: the effect of finite and structured reservoirs [0.0] 量子ドットにおける電磁モードとエキシトンとのカップリングによって生じるナノキャビティ内での「シュル」オーディンガー猫の生成について議論する。
生成物そのものよりも、ナノキャビティのボゾン状態に対する環境の影響に焦点を当てる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:33:02 GMT)
Revisiting Active Learning in the Era of Vision Foundation Models [0.0] ファンデーションビジョンまたはビジョン言語モデルは、大きなラベルなしまたはノイズの多いデータに基づいて訓練される。
これらは、ラベル付け効率を最大化することを目的としたアクティブラーニング(AL)に自然に適合する。
基礎モデルが有効ALの3つの重要な構成要素にどのように影響するかを評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:43:06 GMT)
Relativistic Effects on Entangled Single-Electron Traps [0.0] 相対論的状態においては、荷電粒子間の相互作用はポストクーロン補正によって影響を受ける。
静的および動的状態に存在する量子エンタングルメントの挙動を考察する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:00:01 GMT)
Realizing triality and $p$-ality by lattice twisted gauging in (1+1)d quantum spin systems [0.0] ツイストガウス法則作用素を定義し、格子上の有限群のツイストガウイングを実装する。
SPTアンタングルを最初に適用し,その後に未操作のガウイングを行う2段階の手順と等価であることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:33:28 GMT)
RAGBench: Explainable Benchmark for Retrieval-Augmented Generation Systems [0.0] Retrieval-Augmented Generation (RAG)は、ユーザ向けチャットアプリケーションにおけるドメイン固有の知識の標準的なアーキテクチャパターンとなっている。
RAGBenchは、100kのサンプルからなる、最初の包括的な大規模RAGベンチマークデータセットである。
TRACe評価フレームワークは、すべてのRAGドメインに適用可能な説明可能かつ実行可能なRAG評価指標のセットである。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:23:15 GMT)
Querying Labeled Time Series Data with Scenario Programs [0.0] 本稿では,実世界のラベル付き時系列データ項目とシミュレーションシナリオとの一致を形式的に定義する。
自動運転車の領域を超えてスケーラブルなマッチングを実現するための定義とアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:15:27 GMT)
Probing the effects of broken symmetries in machine learning [0.0] 我々は,非対称モデルがデータから対称性を学習できることを示す。
我々は、対称性の破れによって、直接的または間接的に影響を受けやすい物理的観測物に特に焦点を合わせ、モデルが補間的でバルクな状態で使用されるとき、無視可能な結果を見つける。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:34:09 GMT)
Probing Yu-Shiba-Rusinov state via quantum noise and $Δ_T$ noise [0.0] スピン偏極型$Delta_T$ノイズは、YSR境界状態のプローブとしての$Delta_T$ノイズよりも優れたツールであることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:23:31 GMT)
Probabilistic Approach for Detection of High-Frequency Periodic Signals using an Event Camera [0.0] イベントカメラを用いた高周波数画素サイズの周期信号検出のための非同期イベント駆動アルゴリズムを提案する。
新しいパラダイムを満たすために開発されたこのアルゴリズムは、確率の未処理理論問題と関係があることが判明した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:41:39 GMT)
Phase transition of a continuous-time quantum walk on the half line [0.0] 量子ウォークは数学においてランダムウォークの量子アナログと呼ばれる。
本稿では,半直線上の連続時間量子ウォークについて検討し,その限界定理の発見に挑戦する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:49:20 GMT)
Perfectly Spherical Bloch Hyper-spheres from Quantum Matrix Geometry [0.0] 先行する量子スピン系と電荷単極系の間の類似を爆発させ、任意の次元で$itexact$球面対称性を持つブロッホ超球面を構築する。
ブロッホ超球面の幾何学は、高次元ファジィ球面の量子ナムブ幾何学と完全に等しい。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:11:36 GMT)
Perfect state transfer on Cayley graphs over a non-abelian group of order $8n$ [0.0] ケイリーグラフ上の完全状態移動の存在を$textCay(V_8n, S)$とする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:54:39 GMT)
Percolation renormalization group analysis of confinement in $\mathbb{Z}_2$ lattice gauge theories [0.0] パーコレーション確率を閉じ込め順序パラメータとして用いた$mathbbZ$ LGTに対する実空間再正規化群定式化を開発する。
我々の手法は、物質と量子ゆらぎを含む$mathZ$ LGTの将来の分析研究を可能にする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:51:44 GMT)
Nonclassical Light in a Three-Waveguide Coupler with Second-Order Nonlinearity [0.0] 本研究では,位相空間法とハイゼンベルク法に基づく解析摂動法という,よく知られた2つの手法を用いて研究を行った。
鍵設計パラメータの効果は, 双方向と対向伝搬の両方に対して解析される。
量子ベース技術の新たな時代において、提案システムは非線形カプラを非古典的光発生に活用するための新たな道を開く。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:32:23 GMT)
Non-Unitary Quantum Many-Body Dynamics using the Faber Polynomial Method [0.0] 数値的な手法は、非単体進化の下での量子多体系の非伝統的な力学を探索するにはまだ不足している。
我々はファワーを使って非エルミート系の力学とリンドブラッド力学の量子ジャンプの両方を数値的にシミュレートする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:15:28 GMT)
Negativity as a resource for memory reduction in stochastic process modeling [0.0] 正準確率を許容する隠れマルコフモデルの仮説的一般化を考える。
衝突エントロピー測度の下では、そのようなモデルの最小メモリは余剰エントロピーを等しくすることができることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:42:15 GMT)
Measurement induced criticality in quasiperiodic modulated random hybrid circuits [0.0] 測定誘起相転移(MIPT)におけるクエンチド準周期変調(QP)変調による1次元ハイブリッド量子回路の研究
本稿では,ラッキー境界の飽和に整合した相関長指数と,アクティベーション指数$psi cong beta$の動的スケーリングを含む,関連する臨界特性を数値的に決定する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:08:39 GMT)
Markovianity and non-Markovianity of Particle Bath with Dirac Dispersion Relation [0.0] 本研究では, ギャップ$m$とエネルギーカットオフ$L$のエネルギースペクトルを特徴とする環境中での単一ディラック粒子の自然放出について検討した。
その結果、スペクトルカットオフ$L$のような高エネルギー構造が、短時間の非指数崩壊を駆動する上で重要な役割を担っていることが明らかとなった。
驚いたことに、エネルギーカットオフ$L$が無限でエネルギーギャップ$m$がゼロである極限において、質量を持たないディラック粒子の崩壊ダイナミクスはマルコフ的挙動を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:18:38 GMT)
Mapping the Past: Geographically Linking an Early 20th Century Swedish Encyclopedia with Wikidata [0.0] 私たちは、38巻と182,000以上の記事からなる『textitUggleupplagan』という第2版に焦点を当てた。
項目の約22%が場所であることがわかった。
この論文は、ファミルイェボクのテクストにおける地理的情報の選択と表現に光を当て、歴史的・社会的視点に関する洞察を与えている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:34:00 GMT)
Low-Crosstalk, Silicon-Fabricated Optical Waveguides for Laser Delivery to Matter Qubits [0.0] CMOSファウントリーにより作製された窒化ケイ素(Si3N4)光導波路を用いて,8個のイオン鎖を捕捉したバリウムイオンに対処した。
チップ設計に組み込まれたクロストーク緩和技術は、測定された光学界を少なくとも50.8 (1.3) dB削減する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:50:52 GMT)
Leveraging Synthetic Audio Data for End-to-End Low-Resource Speech Translation [0.0] 本稿では,国際音声言語翻訳会議(IWSLT 2024)へのシステム提出について述べる。
我々はWhisperに基づくエンドツーエンドシステムを構築し、音声のバックトランスレーションやノイズ拡張など、多くのデータ拡張手法を採用した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:26:41 GMT)
Learning parameter dependence for Fourier-based option pricing with tensor trains [0.0] 本稿では,FTベースのオプション価格で現れる関数に近似したテンソルトレインを,テンソル学習アルゴリズムにより構築する価格法を提案する。
ベンチマークテストとして,様々な揮発性の値と現在の資産価格に対するマルチアセットオプションの価格設定を行う。
提案手法は, 最大11個の資産を含む試験ケースにおいて, モンテカルロシミュレーションを計算複雑性の観点から105ドルのパスで比較または上回る性能を示した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:02:44 GMT)
Knowledge Distillation in Automated Annotation: Supervised Text Classification with LLM-Generated Training Labels [0.0] 大規模言語モデル(LLMs)のサロゲート学習ラベルによる人為的なトレーニングデータの拡張や置き換えの可能性を評価する。
我々は,最近のCSS記事から英語テキスト分類データセットの新たなコーパスをハイインパクトジャーナルに採用している。
各タスクについて,GPT-4ラベルを用いて微調整した教師付き分類器と,人間のアノテーションで微調整した分類器と,数ショットのインコンテキスト学習によるGPT-4とMistral-7Bのラベルを比較した。
以上の結果から, LLMラベルを微調整した教師付き分類モデルは, 人間のラベルを微調整したモデルと相容れないことが示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:20:25 GMT)
KANQAS: Kolmogorov Arnold Network for Quantum Architecture Search [0.0] 量子アーキテクチャサーチ(QAS)は、量子回路の最適化と自動設計のための有望な方向である。
QASの最近の技術は、深層Qネットワークのような強化学習からの機械学習ベースのアプローチに焦点を当てている。
本研究では,量子アーキテクチャ探索問題におけるkanの実用性を評価する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:17:01 GMT)
Investigating writing style as a contributor to gender gaps in science and technology [0.0] 文章のスタイルは性別によって大きく異なり、女性はより関連性のある特徴を用いている。
より関連性の高い論文や特許も女性によって引用される傾向にある。
以上の結果から, 科学的テキストは人格を欠くものではないことが示唆され, 評価のバイアスに寄与する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 21:25:07 GMT)
Inducing Riesz and orthonormal bases in $L^2$ via composition operators [0.0] 解析を微分可能写像に制限すると、与えられた形式のすべてのリース基底はバイ・リプシッツ写像によって誘導される。
近似理論におけるこれらの結果の意味を論じる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:07:01 GMT)
Improving Realized LGD Approximation: A Novel Framework with XGBoost for Handling Missing Cash-Flow Data [0.0] キャッシュフローデータに依存しないXGBoostモデルを構築し,LGD推定の精度を向上させる。
我々の研究の新たな側面は、デルタの卓越したアプローチの詳細な探索と、キャッシュフローデータへの限られたアクセス条件に対処するための方法論である。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:41:09 GMT)
Improving Execution Concurrency in Partial-Order Plans via Block-Substitution [0.0] 部分順序計画 (Partial-Order Plan, POP) は2つのアクションを相互に順序付けせずに実現し、異なるシーケンスでのアクション実行の柔軟性を提供する。
この研究は、POPを並列計画に変換する非並行制約の条件を定式化する。
本アルゴリズムでは,ブロック内のコヒーレントな動作をカプセル化することにより,POPの順序付けを排除し,置換の候補部分計画としてブロックを利用する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 23:36:13 GMT)
Hybrid Classical-Quantum Simulation of MaxCut using QAOA-in-QAOA [0.0] そこで本研究では,MaxCut問題のスケーラブルな解に対するQAOA2法の実装について述べる。
The limit of the Goemans-Williamson (GW) algorithm as a purely classical alternative to QAOA。
最大33量子ビットの大規模シミュレーションの結果は、ある場合におけるQAOAの利点と実装の効率性を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:02:31 GMT)
Hot-Distance: Combining One-Hot and Signed Distance Embeddings for Segmentation [0.0] 機械学習モデルは、それらが適合するデータに匹敵するだけである。
本稿では,符号付き境界距離予測の強度とワンホット符号化の柔軟性を組み込んだ新しいセグメンテーションターゲットであるHot-Distanceを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 20:56:41 GMT)
Harmonic oscillator system in topologically charged Eddington-inspired Born-Infeld gravity space-time and Wu-Yang magnetic monopole [0.0] 本研究では、位相的に荷電したボルン=インフェルド重力時空の枠組みにおける高調波発振器(HO)系の量子力学について検討する。
我々は,Wu-Yang磁気モノポール(WYMM)を量子系に組み込み,修正重力,トポロジカル電荷,WYMMがHO量子力学系に与える影響を分析する。
本研究は,従来の量子機械的HOモデルと比較して,HO系の挙動に有意な差が認められた。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:19:13 GMT)
Giant caloric effects in spin chain materials [0.0] エントロピーに巨星が飛び込み、カロリー効果によって引き起こされる温度が初期温度に弱いことが示されている。
この効果は、新しい量子デバイス(量子コンピュータにおける量子ビットのシステムのような)の冷却に利用できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:52:59 GMT)
Generating Music with Structure Using Self-Similarity as Attention [0.0] 本稿では,ユーザが提供する自己相似性を従来の時間ステップに応用した新しいアプローチを用いたアテンション層を提案する。
そこで我々はSING(Simisity Incentivized Generator)システムでこれを実証した。
我々は新しい変数法を用いてMAESTROデータセット上でSINGを訓練し、その性能を注意機構なしで同じモデルと比較する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 18:26:07 GMT)
From Text to Test: AI-Generated Control Software for Materials Science Instruments [0.0] 大規模言語モデル(LLM)は、化学と材料科学の風景を変えつつある。
ここでは、Keithley 2400電気源測定ユニットのためのPythonベースの制御モジュールの迅速な展開を実演する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 11:34:15 GMT)
Fast Ground State to Ground State Separation of Small Ion Crystals [0.0] 捕捉されたイオンの線形結晶を異なるサブセットに迅速に分離することは、捕捉されたイオン量子コンピューティングアーキテクチャを実現するために重要である。
我々は,同種結晶と混合種結晶のより小さな部分集合への分離を記述するのに使用できる一般的な理論的枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:36:19 GMT)
Extreme Learning Machines for Fast Training of Click-Through Rate Prediction Models [0.0] Extreme Learning Machines (ELM)は、ニューラルネットワークにおける従来の勾配に基づく学習の高速な代替手段を提供する。
クリックスルーレート(CTR)予測におけるEMMの適用について検討する。
我々は,CTRタスクの性能向上のために,埋め込み層により拡張されたEMMベースのモデルを提案する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:50:00 GMT)
Evaluating ML-Based Anomaly Detection Across Datasets of Varied Integrity: A Case Study [0.0] そこで我々は,NFStreamを用いて処理したCICIDS-2017データセットの2つの改良版を紹介した。
我々の研究は、元のCICIDS-2017、改良されたWTMC-2021とCRiSIS-2022、およびNFStream生成データセットに対するランダムフォレスト(RF)アルゴリズムのパフォーマンスを対照的にしている。
RFモデルは、基礎となるデータセットの品質に関わらず、一貫した高性能なメトリクスを達成し、例外的な堅牢性を示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:27:26 GMT)
Estimate of the time required to perform a nonadiabatic holonomic quantum computation [0.0] 非断熱ホロノミック量子計算は、断熱ホロノミックゲートに匹敵する堅牢性を持つ量子論理ゲートを実装する方法として提案されているが、実行時間が短い。
非線形ホロノミック量子計算の先駆的な論文で提案された普遍的なホロノミックゲートの実装手順は、等ホロノミック不等式を飽和させ、したがって時間的最適であることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:03:51 GMT)
Epistemic Horizons From Deterministic Laws: Lessons From a Nomic Toy Theory [0.0] 本研究では, トイ理論が相容れない測定値を持ち, 物理的システムの完全状態を知ることができないことを示す。
被検体と対象物の分離性の観点から測定の不確かさを考察する。
この研究は、(完全な)量子論のようなさらなる研究を招待する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:23:49 GMT)
Enhancing LLM-Based Human-Robot Interaction with Nuances for Diversity Awareness [0.0] 本稿では,大規模言語モデル(LLM)の機能を活用した多様性を考慮した自律会話システムを提案する。
このシステムは、背景、性格、年齢、性別、文化といった要因を考慮して、多様な人口や個人に適応する。
システムの性能を評価するため,制御と実環境の両方の実験を行い,幅広い性能指標を測定した。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:15:36 GMT)
Enhancing Active Learning for Sentinel 2 Imagery through Contrastive Learning and Uncertainty Estimation [0.0] 本稿では,衛星画像解析におけるラベル効率の向上を目的とした新しい手法を提案する。
提案手法は,モンテカルロ・ドロップアウトによる不確実性推定とともに,コントラスト学習を利用する。
本研究は,提案手法が他のいくつかの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:40:35 GMT)
Eluding Zeno effect via dephasing and detuning [0.0] 中間状態の集団の頻繁な観察が初期状態から最終状態への移行を妨げないゼノ効果の変種を解析する。
ゼノ効果は、量子進化の干渉を適切に変化させることで動的に調整する位相シフトや変形によって解明される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:25:17 GMT)
Eliminating the Second-Order Time Dependence from the Time Dependent Schrödinger Equation Using Recursive Fourier Transforms [0.0] 時間依存型Schr"odinger方程式を記述するための戦略が開発されている。
エネルギー分布は、1階と2階の標準理論の例で計算される。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 19:21:39 GMT)
Efficient generation of broadband photon pairs in shallow-etched lithium niobate nanowaveguide [0.0] ナノフォトニックチップ上でのブロードバンド自発的ダウンコンバージョン(SPDC)を実現するために、浅いエッチングされた周期的なニオブ酸リチウム導波路。
高輝度11.7GHz/mW、帯域幅22THzの光子対発生を5.7mmのPPLN導波路で実証する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:21:55 GMT)
Efficient classical algorithm for simulating boson sampling with inhomogeneous partial distinguishability [0.0] ボソンサンプリングの古典的シミュレーション理論を,光子対間の不明瞭性の程度が異なる場合に拡張する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:17:27 GMT)
ELIZA Reinterpreted: The world's first chatbot was not intended as a chatbot at all [0.0] ELIZAは1960年代初頭にJoseph Wezenbaumによって書かれた。
ELIZAは、AIの技術史における中心的なスレッドの一部の交差から生まれた。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:41:40 GMT)
Does locality plus perfect correlation imply determinism? [0.0] 1964年にジョン・ベルが発表した論文は、量子力学が局所的に隠された変数と相容れないという最初の実証を行った。
本稿では, 簡単な例と厳密な結果を通じて, 議論に明瞭さをもたらすことを目的とする。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:37:54 GMT)
Dirac Brackets $\leftrightarrow$ Lindblad Equation: A Correspondence [0.0] ゴリニ-コサコフスキー-スダルシャン-リンドラー方程式によって支配される開量子系の時間発展を研究する。
同様に、古典的に制約された力学系における物理可観測体の時間発展は、リウヴィル方程式の一般化によって制御される。
我々は、リンドブラッド作用素を制約に接続する上記の状況の間の興味深いが正確な古典量子対応を導出する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:05:00 GMT)
Development of a digital tool for monitoring the behaviour of pre-weaned calves using accelerometer neck-collars [0.0] 30頭の乳牛がネックコラーに取り付けられた3D加速度計を2ヶ月間装備し、同時に撮影された。
この行動には注釈が付され、27.4時間の観測が加速度計のデータと一致した。
2つの機械学習モデルは、子牛の80%のデータを使って調整された。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:11:22 GMT)
Delving into the Utilisation of ChatGPT in Scientific Publications in Astronomy [0.0] この結果から,ChatGPTは学術テキストを生成する際に人間よりも多用され,100万記事が検索されることがわかった。
2024年、ChatGPTが好む単語のリストを特定し、これらの単語が制御グループに対して統計的に有意な増加を示した。
これらの結果は、天文学論文の執筆においてこれらのモデルが広く採用されていることを示唆している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:15:10 GMT)
Deep learning-based brain segmentation model performance validation with clinical radiotherapy CT [0.0] 本研究はCT(Computed Tomography)におけるSynthSegのロバスト脳セグメンテーションモデルを検証する。
The Freesurfer Imaging SuiteのコンポーネントであるSynthSegモデルを用いて、CTとMRIから脳のセグメンテーションを得た。
総合的なQCスコアに基づいてCTの性能はMRIより低いが,QCベースの閾値設定では低品質なセグメンテーションを除外できる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:56:30 GMT)
Covariant quantum field theory of tachyons [0.0] 量子化されたタキオン場に関する3つの大きな誤解は、ヒルベルト空間が小さすぎるローレンツ群を誤って表現した結果であることが示されている。
我々は、これらの問題を全て排除するタキオン場の適切な量子化を可能にする、明示的に共変のフレームワークを確立する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:16:00 GMT)
Correlators of Worldline Proper Length [0.0] 木レベルでのワールドライン固有長のワールドライン質量計算相関関数について,オンシェル作用の導関数を導出する。
長さ2点関数を計算し、相関経路のゆらぎからそれを求める。
We extract AdS worldline observables from local CFT correlator as computeed by Witten diagrams。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 01:21:48 GMT)
Cooperative decay of an ensemble of atoms in a one-dimensional chain with a single excitation [0.0] 原子-原子相互作用グリーン関数の固有値問題なしで自然に超放射と準放射が生じる。
協調崩壊速度は、系の有効非エルミート・ハミルトニアンの期待値の想像上の部分と解釈できる。
格子定数dと原子番号Nの関数として、協調減衰率の簡単な近似式を得る。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 07:53:20 GMT)
Conventional Quantum Theory Does Not Support A Coherent Relational Account [0.0] 従来の量子理論では「測定」を定義できないため、観測者間での相違が頻繁に主張されていることに対する反例をレビューする。
このような矛盾から生じる最近の実験の意味を考察し、成功していないと結論づける。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:35:32 GMT)
Constraints on local processes [0.0] 局所的な操作や古典的なコミュニケーションにおいて単調なマルチパーティの絡み合い尺度を定量化するファミリを構築する。
これらの測度を用いて、局所量子演算と古典的通信を用いて与えられた状態を別の状態に変換する成功確率を束縛する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:33:45 GMT)
Communication Complexity of Graph Isomorphism, Coloring, and Distance Games [0.0] 最適な条件下では,完全非署名戦略が通信複雑性を崩壊させることを示す。
意外なことに、非シグナリング戦略は、古典的および量子的戦略と比較して、新しいゲームにとってより微妙な区別を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 15:14:39 GMT)
Coherent and dissipative dynamics at quantum phase transitions [0.0] プレゼンテーションは閉多体系によって開発された量子遷移に関する問題に限られる。
我々は、臨界モードと様々な散逸メカニズムの非自明な相互作用を引き起こす物理的条件に焦点を当てる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:17:49 GMT)
Bath-induced interactions and transient dynamics in open quantum systems at strong coupling: Effective Hamiltonian approach [0.0] 我々は、システムバス構成の力学を理解するために、実効ハミルトニアン理論と呼ばれる最近開発された手法を用いる。
写像ステップと切り離しの組み合わせにより、実効的なハミルトン理論は強いカップリングのシグネチャに関する解析的な洞察を与える。
我々は, 前者は過渡平衡力学における非マルコフ的特徴を見落としているが, 非摂動型浴生成結合を正しく捉えていることを示す。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 16:53:45 GMT)
Autonomous Prompt Engineering in Large Language Models [0.0] 本研究は, GPT-4が自律的に迅速な工学的手法を適用可能なAutomatic Prompt Engineering Toolbox(APET)を紹介する。
APETはGPT-4にプロンプトを動的に最適化する権限を与え、Word Sortingのようなタスクを大幅に改善する。
この研究はAI開発における大きな飛躍であり、自律型AIシステムにおける将来のイノベーションのための堅牢なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 10:14:44 GMT)
Automatic speech recognition for the Nepali language using CNN, bidirectional LSTM and ResNet [0.0] 本稿ではネパール語音声をテキストに書き起こす自動音声認識(ASR)のためのエンドツーエンドディープラーニングモデルを提案する。
モデルはOpenSLR(audio, text)データセットでトレーニングされ、テストされた。
文字誤り率(CER)は17.06パーセントに達している。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 12:14:01 GMT)
Art-ificial Intelligence: The Effect of AI Disclosure on Evaluations of Creative Content [0.0] 創造的コンテンツ作成におけるAIの利用に関する情報開示は、そのようなコンテンツの人間による評価に影響を及ぼすことを示す。
我々はこの結果を解釈し、AI生成コンテンツに対する反応が、コンテンツが明らかに「人間」と見なされる場合、負である可能性を示唆する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 14:44:50 GMT)
Approximation Theory of Tree Tensor Networks: Tensorized Multivariate Functions [0.0] 目的関数の任意の滑らか度順序に対して、TN が $h$-uniform と $h$-adaptive 近似を最適に複製できることが示される。
TNは、問題のある特定のクラスに適応することなく、(ほぼ)多くの関数クラスを最適に近似する能力を持っている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:24:52 GMT)
Annealing-based approach to solving partial differential equations [0.0] 提案アルゴリズムは,Isingマシンを用いて変数数を増大させることなく,任意の精度で固有ベクトルの計算を可能にする。
この手法と理論解析を用いて解決した簡単な例は、適切なパラメータ設定のためのガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 08:30:00 GMT)
Accurately Classifying Out-Of-Distribution Data in Facial Recognition [0.0] 現実のシナリオは通常、トレーニングディストリビューションのデータとは異なる、目に見えないデータを特徴付けます。
この問題は、未表現のグループからのデータが、トレーニングデータの均等な割合を表現せずにテストデータに現れるという社会正義の問題で最も多い。
ニューラルネットワークの性能は、分布外データの複数のデータセットで同時にトレーニングされたときに、分布外データの顔画像を改善することができるか?
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:20:06 GMT)
Accelerated creation of NOON states with ultracold atoms via counterdiabatic driving [0.0] 量子制御プロトコルは、2つのモードでN個の超低温ボゾン原子を持つNOON状態を生成するために提案される。
この状態は、最初に全てのボソンが配置され、他の2つのモードと対称に結合された第3モードを用いて作成することができる。
この第3モードのエネルギーを他のモードのエネルギーレベルに調整することで、NOON状態の断熱的な生成が可能になる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 13:32:42 GMT)
AI for the prediction of early stages of Alzheimer's disease from neuroimaging biomarkers -- A narrative review of a growing field [0.0] 構造MRIとPET画像を用いた単一モダリティ研究はADの分類において高い精度を示している。
複数のニューロイメージング技術とバイオマーカーを統合するマルチモダリティ研究は、性能と堅牢性を改善した。
課題は、データの標準化、モデル解釈可能性、一般化可能性、臨床統合、倫理的考察にある。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 09:22:53 GMT)
A unifying separability criterion based on extended correlation tensor [0.0] 絡み合いは古典的量子区切り線への探求を言い換えるので、基本的には不合理である。
相関テンソルに基づく分離性のための実践可能な基準を導入・定式化する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 02:36:28 GMT)
A review of unsupervised learning in astronomy [0.0] このレビューでは、一般的な教師なし学習手法を要約し、天文学における過去、現在、そして将来の用途について概観する。
教師なし学習は、知識を抽出できる方法でデータセットの情報内容を整理することを目的としている。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 06:57:47 GMT)
A Temporal Stochastic Bias Correction using a Machine Learning Attention model [0.0] バイアス補正(BC)法は、時間的バイアスを調整するのに苦労する。
BCメソッドは、主に連続した時間ポイント間の依存を無視します。
これにより、このような気候統計に関する信頼性の高い影響研究がより困難になる。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 17:03:22 GMT)
A Recursive Encoding for Cuneiform Signs [0.0] 本稿では,コンピュータが処理可能な方法でストロークの配列を表現した,符号の「再帰的符号化」を提案する。
一連の新しいアルゴリズムは、生徒に特別な部品でサインを探す新しい方法を提供し、サインやタブレットを電子的にレンダリングする新しい方法を提供する。
論文参考訳(メタデータ) (Tue, 25 Jun 2024 05:18:12 GMT)