Theoretical guarantees on the best-of-n alignment policy [110.2] 基本方針と最良$n$ポリシーのKL分散は、$log (n) - (n-1)/n.$と等しいことを示す。
KLの発散に対する新しい推定器を提案し、いくつかの例を通して厳密な近似を与えることを実証的に示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:39:13 GMT)
From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations [107.9] 音声を聴くと、顔、体、手を含む個人に対して、ジェスチャー動作の可能性を複数出力する。
ジェスチャーにおいて重要なニュアンスを表現できる高光写実性アバターを用いて生成した動きを可視化する。
実験により,本モデルが適切な多様なジェスチャーを生成することを示し,拡散法とVQ法の両方に優れることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:55:16 GMT)
Follow Your Pose: Pose-Guided Text-to-Video Generation using Pose-Free
Videos [107.7] 本研究では、ポーズ制御可能なキャラクタビデオを得るために、データセット(ポーズペアとポーズフリービデオ)と事前訓練されたテキスト・ツー・イメージ(T2I)モデルを利用する。
具体的には、第1段階では、キーポイントと画像のペアのみが制御可能なテキストと画像の生成にのみ使用される。
第2段階では、学習可能な時間的自己アテンションと修正されたクロスフレーム自己アテンションブロックを追加することで、ポーズのないビデオデータセットを介して、上記のネットワークの動きを微調整する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:10:12 GMT)
Credible Teacher for Semi-Supervised Object Detection in Open Scene [106.3] Open Scene Semi-Supervised Object Detection (O-SSOD)では、ラベル付きデータはラベル付きデータで観測されていない未知のオブジェクトを含む可能性がある。
より不確実性が、偽ラベルのローカライズと分類精度の低下につながるため、主に自己学習に依存する現在の手法には有害である。
我々は,不確実な擬似ラベルがモデルに誤解をもたらすのを防ぐための,エンドツーエンドのフレームワークであるCredible Teacherを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:33:49 GMT)
Manipulating Trajectory Prediction with Backdoors [94.2] 軌道予測に影響を及ぼす可能性のある4つのトリガを記述し,検討した。
モデルの性能は良好だが、バックドアには弱い。
バックドアに対する防御範囲を評価する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:52:24 GMT)
Align Your Gaussians: Text-to-4D with Dynamic 3D Gaussians and Composed
Diffusion Models [94.1] 我々は、探索されていないテキストから4D設定に焦点をあて、動的にアニメーションされた3Dオブジェクトを合成する。
4次元オブジェクト最適化において,テキスト・ツー・イメージ,テキスト・ツー・ビデオ,および3次元認識型多視点拡散モデルを組み合わせてフィードバックを提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:40:56 GMT)
Moonshot: Towards Controllable Video Generation and Editing with
Multimodal Conditions [94.0] Moonshotは、画像とテキストのマルチモーダル入力を同時に処理する新しいビデオ生成モデルである。
モデルは、パーソナライズされたビデオ生成、画像アニメーション、ビデオ編集など、様々な生成アプリケーションに容易に再利用できる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:43:47 GMT)
Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex
and Professional Sports [90.8] スポーツビデオQAタスク用に特別に設計された最初のデータセットであるSports-QAを紹介する。
Sports-QAデータセットには、説明、時系列、因果関係、反事実条件など、さまざまな種類の質問が含まれている。
質問応答のための時間的情報の特定の尺度に自動的にフォーカスできる新しいオートフォーカス変換器(AFT)を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:22:34 GMT)
Instruct-Imagen: Image Generation with Multi-modal Instruction [90.0] Instruct-imagenは、不均一な画像生成タスクに取り組み、目に見えないタスクを一般化するモデルである。
画像生成のための*multi-modal instruction*を導入する。
画像生成データセットの人間による評価では、インストラクション・イメージはドメイン内の以前のタスク固有のモデルと一致するか、超えている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:31:58 GMT)
A Survey of Text Watermarking in the Era of Large Language Models [84.9] テキスト透かしアルゴリズムは、テキストコンテンツの著作権保護において重要な役割を果たす。
近年の大規模言語モデル(LLM)の発展は,テキスト透かし技術の進歩に新たな機会をもたらしている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:29:43 GMT)
DialCLIP: Empowering CLIP as Multi-Modal Dialog Retriever [83.3] マルチモーダルダイアログ検索のためのパラメータ効率の高いプロンプトチューニング手法であるDialCLIPを提案する。
提案手法では,事前学習された視覚言語モデルCLIP内のプロンプトに抽出された文脈特徴を学習するためのマルチモーダルコンテキスト生成手法を提案する。
様々なタイプの検索を容易にするために,CLIP出力からマルチモーダル表現空間へのマッピングを学習するために,複数の専門家を設計する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:13:29 GMT)
Step length measurement in the wild using FMCW radar [81.9] 住宅用レーダを用いたステップ長測定システムを提案する。
健常成人35名を対象に, 臨床環境の評価を行い, その妥当性を確認した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:23:30 GMT)
Frequency Domain Modality-invariant Feature Learning for
Visible-infrared Person Re-Identification [79.9] 本稿では、周波数領域から見たモダリティの相違を低減するために、新しい周波数領域モダリティ不変特徴学習フレームワーク(FDMNet)を提案する。
我々のフレームワークでは、インスタンス適応振幅フィルタ(IAF)とPhrase-Preserving Normalization(PPNorm)という、2つの新しいモジュールを導入している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:11:27 GMT)
Towards Robust Semantic Segmentation against Patch-based Attack via
Attention Refinement [73.3] 我々は,アテンション機構がパッチベースの敵攻撃に弱いことを観察した。
本稿では,意味的セグメンテーションモデルの堅牢性を改善するために,ロバスト注意機構(RAM)を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:58:35 GMT)
Can AI Be as Creative as Humans? [71.0] AIの創造的潜在能力の研究は、その開発と応用に欠かせないものとなる。
本稿では,Relative Creativityという新しい概念を導入することにより,創造性の定義と評価の複雑さに対処する。
創造性を普遍的に定義しようとするのではなく、AIが仮説的人間の創造能力にマッチできるかどうかに焦点を移す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:49:12 GMT)
Regressor-Segmenter Mutual Prompt Learning for Crowd Counting [70.5] 本稿では,アノテーションの差によるバイアスや不正確性を解決するために,相互学習(mPrompt)を提案する。
実験により、mPromptは平均誤差(MAE)を著しく減少させることが示された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:35:21 GMT)
The Security and Privacy of Mobile Edge Computing: An Artificial Intelligence Perspective [64.4] Mobile Edge Computing (MEC)は、クラウドコンピューティングと情報技術(IT)サービスをネットワークのエッジで配信できるようにする新しいコンピューティングパラダイムである。
本稿では,人工知能(AI)の観点からMECのセキュリティとプライバシに関する調査を行う。
新たなセキュリティとプライバシの問題に加えて、AIの観点からの潜在的なソリューションにも重点を置いています。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:47:22 GMT)
Towards Multi-Objective High-Dimensional Feature Selection via
Evolutionary Multitasking [63.9] 本稿では,高次元特徴選択問題,すなわちMO-FSEMTのための新しいEMTフレームワークを開発する。
タスク固有の知識伝達機構は、各タスクの利点情報を活用するように設計され、高品質なソリューションの発見と効果的な伝達を可能にする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:34:39 GMT)
Detours for Navigating Instructional Videos [63.5] We propose VidDetours, a video-lang approach that learn to retrieve the target temporal segments from a large repository of how-to's。
本稿では,ビデオ検索と質問応答の最良の方法に比べて,モデルが大幅に改善し,リコール率が35%を超えることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:38:56 GMT)
Answering from Sure to Uncertain: Uncertainty-Aware Curriculum Learning
for Video Question Answering [63.1] 不確実性を考慮したカリキュラム学習(CL)の概念を導入する。
ここで不確実性は、困難を動的に調整するための指針となる。
実際に、我々は、ビデオQAモデルを我々のフレームワークにシームレスに統合し、包括的な実験を行う。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:29:34 GMT)
Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.4] マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:00:34 GMT)
A Vision Check-up for Language Models [61.9] テキストのモデルを用いて、予備的な視覚表現学習システムをどのように訓練するかを示す。
自己教師付き視覚表現学習の実験は、自然画像のセマンティックアセスメントを行うことができる視覚モデルを訓練する可能性を強調している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:09:33 GMT)
FullLoRA-AT: Efficiently Boosting the Robustness of Pretrained Vision
Transformers [61.5] Vision Transformer (ViT) モデルは、様々なコンピュータビジョンタスクにおいて徐々に主流になりつつある。
既存の大きなモデルは、トレーニング中のパフォーマンスを優先する傾向があり、ロバストさを無視する可能性がある。
従来のLoRAモジュールよりも前に学習可能なレイヤ正規化を取り入れた新しいLNLoRAモジュールを開発した。
本稿では,学習可能なLNLoRAモジュールをViTモデルの主要コンポーネントに組み込むことにより,FullLoRA-ATフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:08:39 GMT)
Towards Truly Zero-shot Compositional Visual Reasoning with LLMs as
Programmers [61.4] 最大のモデルでさえ、構成的推論、一般化、きめ細かい空間的および時間的推論、数え上げに苦しむ。
コントローラとしての大きな言語モデル(LLM)による視覚的推論は、原則として、タスクを分解し、一連の(視覚的な)ツールを編成することでサブタスクを解決することで、これらの制限に対処することができる。
本稿では,空間的・時間的に抽象的なルーチンを導入し,少数のラベル付き例を利用してコンテキスト内サンプルを自動的に生成することにより,これらの問題を緩和するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:48:47 GMT)
Bridging the Gap Between Target Networks and Functional Regularization [61.1] 関数空間における凸正規化器であり、容易に調整できる明示的な関数正規化を提案する。
提案手法の収束を理論的・実験的に解析し,より理論的に根ざした機能正規化アプローチでターゲットネットワークを置き換えることにより,サンプリング効率と性能が向上することが実証された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:02:21 GMT)
GMMFormer: Gaussian-Mixture-Model Based Transformer for Efficient
Partially Relevant Video Retrieval [59.5] テキストクエリーが与えられた場合、部分関連ビデオ検索(PRVR)はデータベースに関連する瞬間を含むビデオを探し出そうとする。
本稿では,GMMFormerを提案する。GMMFormerはガウス・ミクチャーモデルに基づくトランスフォーマーで,クリップ表現を暗黙的にモデル化する。
3つの大規模ビデオデータセットの実験は、GMMFormerの優位性と効率を実証している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:40:15 GMT)
A Computation and Communication Efficient Method for Distributed
Nonconvex Problems in the Partial Participation Setting [58.6] 本稿では, 分散低減, 部分的参加, 圧縮通信の3つの重要な要素を含む新しい手法を提案する。
本手法は, 部分的参加環境において, 最適オラクル複雑性と最先端通信複雑性を有することを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:21:38 GMT)
Learning Prompt with Distribution-Based Feature Replay for Few-Shot
Class-Incremental Learning [58.4] 分散型特徴再現(LP-DiF)を用いた学習プロンプト(Learning Prompt)という,シンプルで効果的なフレームワークを提案する。
新しいセッションでは,学習可能なプロンプトが古い知識を忘れないようにするため,擬似機能的リプレイ手法を提案する。
新しいセッションに進むと、古いクラスのディストリビューションと現在のセッションのトレーニングイメージを組み合わせて擬似フィーチャーをサンプリングして、プロンプトを最適化する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:59:17 GMT)
LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry [57.0] 本稿では,LEAP(Long-term Effective Any Point Tracking)モジュールについて述べる。
LEAPは、動的トラック推定のために、視覚的、トラック間、時間的キューと慎重に選択されたアンカーを革新的に組み合わせている。
これらの特徴に基づき,強靭な視力計測システムLEAP-VOを開発した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:57:27 GMT)
Retrieval-Augmented Egocentric Video Captioning [56.0] EgoInstructor(エゴインストラクタ)は、意味的に関連する第三者の指導ビデオを自動的に検索する、検索拡張マルチモーダルキャプションモデルである。
我々は、エゴセントリックでエゴセントリックなビデオ機能を引き寄せる新しいEgoExoNCE損失で、クロスビュー検索モジュールをトレーニングする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:08:23 GMT)
Unlocking the Potential of Large Language Models for Explainable
Recommendations [55.3] 説明ジェネレータを最近登場した大規模言語モデル(LLM)に置き換える影響は、まだ不明である。
本研究では,シンプルで効果的な2段階説明可能なレコメンデーションフレームワークであるLLMXRecを提案する。
いくつかの重要な微調整技術を採用することで、制御可能で流動的な説明が十分に生成できる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:06:51 GMT)
An Improved Baseline for Reasoning Segmentation with Large Language
Model [54.9] 既存のLISAモデルの更新であるLISA++を導入し、基本アーキテクチャをそのまま維持しながらコア機能の改善に重点を置いている。
インスタンスセグメンテーション機能が追加され、既存のマルチリージョンセグメンテーションとともに、より詳細なシーン分析が提供される。
これらの改善は、構造的変化やデータソースを追加することなく、セグメンテーションと会話スキルを強化することを目的とした、ジェネリックセグメンテーションデータセットの既存のサンプルをキュレートすることで達成される。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:08:12 GMT)
Detecting Gravitationally Interacting Dark Matter with Quantum
Interference [51.4] 我々は、高感度重力による量子位相シフトを用いて、そのような粒子を直接検出する理論的な可能性を示す。
特に、ジョセフソン接合を利用したプロトコルを考える。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:09:12 GMT)
Which Syntactic Capabilities Are Statistically Learned by Masked
Language Models for Code? [51.3] 精度に基づく測定に依存することで、モデルの能力が過大評価される可能性があることを強調する。
これらの問題に対処するために,SyntaxEval in Syntactic Capabilitiesというテクニックを導入する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:44:02 GMT)
Will 6G be Semantic Communications? Opportunities and Challenges from
Task Oriented and Secure Communications to Integrated Sensing [49.8] 本稿では,マルチタスク学習を統合した次世代(NextG)ネットワークにおけるタスク指向およびセマンティックコミュニケーションの機会と課題について検討する。
我々は、送信側の専用エンコーダと受信側の複数のタスク固有のデコーダを表すディープニューラルネットワークを用いる。
トレーニングとテストの段階において、敵対的攻撃に起因する潜在的な脆弱性を精査する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:01:20 GMT)
ECCV Caption: Correcting False Negatives by Collecting
Machine-and-Human-verified Image-Caption Associations for MS-COCO [47.6] 我々は,機械および人体アノテータに欠落した関連情報を供給することによって,拡張COCOバリデーション(ECCV)キャプションデータセットを構築した。
我々のデータセットは、元のMS-COCOと比較して、x3.6の正のイメージ・ツー・キャプション・アソシエーションとx8.5のキャプション・ツー・イメージ・アソシエーションを提供する。
その結果,COCO 1K R@K,COCO 5K R@K,CxC R@1などの既存のベンチマークは相関が強く,ECCV mAP@Rに移行するとランキングが変化することがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:30:54 GMT)
Enhancing Generalization of Invisible Facial Privacy Cloak via Gradient
Accumulation [46.8] 通常のユーザのすべてのイメージに対して,新たなタイプの対向的プライバシクローク(クラスユニバーサル)を適用することができる。
本稿では,複数の小バッチ勾配を1段階の反復勾配に集約し,勾配安定性を高め,量子化演算を減少させるグラディエント累積法を提案する。
実験の結果,提案手法はブラックボックスの顔認識モデルに対して,プライバシ・コモンズ・データセット上で高い性能を示すことがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:00:32 GMT)
Inversion-by-Inversion: Exemplar-based Sketch-to-Photo Synthesis via
Stochastic Differential Equations without Training [46.8] Exemplar-based sketch-to-photo synthesisでは、スケッチに基づいて写真リアルな画像を生成することができる。
スケッチ画像から色とテクスチャで写実的な画像を生成することは、拡散モデルでは依然として困難である。
Inversion-by-Inversionという2段階の手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:36:11 GMT)
Unsupervised Object-Centric Learning from Multiple Unspecified
Viewpoints [45.9] 我々は、監督を使わずに、複数の特定されていない視点から構成シーン表現を学習する新しい問題を考える。
本稿では,潜在表現を視点に依存しない部分と視点に依存しない部分とに分離し,この問題を解決するための深層生成モデルを提案する。
いくつかの特別に設計された合成データセットの実験により、提案手法は複数の特定されていない視点から効果的に学習できることが示されている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:09:25 GMT)
LORE++: Logical Location Regression Network for Table Structure
Recognition with Pre-training [45.8] 表構造認識(TSR)は、画像中のテーブルを機械で理解可能な形式に抽出することを目的としている。
我々は、論理的位置回帰問題としてTSRをモデル化し、LOREと呼ばれる新しいTSRフレームワークを提案する。
提案するLOREは概念的にシンプルで、訓練が容易で、TSRの他のパラダイムよりも正確です。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:14:55 GMT)
A Comprehensive Study of Governance Issues in Decentralized Finance
Applications [45.0] 本稿では,DeFiアプリケーションにおけるガバナンス問題に関する総合的研究について述べる。
私たちは17のWeb3セキュリティ企業から4,446の監査レポートを収集し、構築しています。
スマートコントラクトコードとDeFiホワイトペーパーの相違は、これらのガバナンス問題において中心的な役割を果たす。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:55:52 GMT)
LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry [44.6] LaDeは、業界から数百万のパッケージを備えた、最初の公開ラストマイルデリバリデータセットである。
実際の運用期間は6ヶ月で、21kクーリエの10万パッケージが対象だ。
LaDeには3つの特徴がある。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:16:30 GMT)
The Neuron as a Direct Data-Driven Controller [43.8] 本研究は、ニューロンを最適フィードバックコントローラとして概念化し、予測を最適化する現在の規範モデルを拡張する。
我々は、ニューロンを生物学的に実現可能なコントローラとしてモデル化し、ループダイナミクスを暗黙的に識別し、潜伏状態を推測し、制御を最適化する。
我々のモデルは、従来の、フィードフォワード、即時応答のマカロック-ピッツ-ローゼンブラットニューロンから大きく離れており、ニューラルネットワークを構築するための、新しく生物学的にインフォームドされた基本ユニットを提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:24:10 GMT)
WordArt Designer API: User-Driven Artistic Typography Synthesis with
Large Language Models on ModelScope [43.7] 本稿では,ModelScope上のLarge Language Models(LLMs)を利用したユーザ主導のアートタイポグラフィ合成のための新しいフレームワークであるWordArt Designer APIを紹介する。
我々は,非専門職に対する芸術的タイポグラフィーを簡素化する上で,従来の定型テンプレートに代わる動的で適応的で,計算的に効率的な代替手段を提供することによって,課題に対処する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:06:02 GMT)
Tailor: Size Recommendations for High-End Fashion Marketplaces [42.0] 本稿では,暗黙的な(Add2Bag)と明示的な(ReturnReason)ユーザ信号を統合する新しいシーケンス分類手法を提案する。
1つはLSTMを用いてユーザ信号を符号化し、もう1つはアテンション機構を利用する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:58:03 GMT)
Retraining-free Model Quantization via One-Shot Weight-Coupling Learning [41.3] 混合精度量子化(MPQ)は、層に不均一なビット幅を割り当てることで、モデルを効果的に圧縮することを提唱する。
MPQは典型的には、探索訓練された2段階のプロセスに編成される。
本稿では,混合精度モデル圧縮のためのワンショットトレーニング探索パラダイムを考案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:26:57 GMT)
LMBot: Distilling Graph Knowledge into Language Model for Graph-less
Deployment in Twitter Bot Detection [41.0] グラフニューラルネットワーク(GNN)の知識を言語モデル(LM)に抽出する新しいボット検出フレームワークLMBotを提案する。
グラフベースのデータセットでは、LMの出力はGNNの入力機能を提供し、ボットの検出と知識の抽出を反復的かつ相互に強化するプロセスでLMに戻すことができる。
実験の結果,LMBotは4つのTwitterボット検出ベンチマークで最先端のパフォーマンスを実現していることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:00:00 GMT)
Harmonizing Covariance and Expressiveness for Deep Hamiltonian
Regression in Crystalline Material Research: a Hybrid Cascaded Regression
Framework [40.2] 本稿では,2段階の回帰段階を持つハイブリッドフレームワークを提案する。
第1段階は理論的に保証された3次元原子系の対称性特性をモデル化する共変ニューラルネットワークであり、理論的に共変特性をもたらす。
第2段階は非線形3Dグラフトランスフォーマーネットワークで駆動され、ハミルトンの微細な予測として第1段階の出力を洗練する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:17:26 GMT)
Computational Discovery of Microstructured Composites with Optimal
Stiffness-Toughness Trade-Offs [39.4] 硬さと硬さの対立は、工学材料設計における根本的な問題である。
物理実験,数値シミュレーション,人工ニューラルネットワークを統合した一般化可能なパイプラインを導入し,両課題に対処する。
本手法は, 固体力学以外の様々な研究領域において, 計算設計の青写真を提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:20:46 GMT)
Minimum Coverage Sets for Training Robust Ad Hoc Teamwork Agents [39.2] 既存のAd Hoc Teamwork(AHT)メソッドは、さまざまなチームメイトポリシーを持つエージェントをトレーニングすることで、この問題に対処する。
我々は、AHTトレーニングに使用されるチームメイトポリシーのセットを生成するL-BRDivアルゴリズムを導入し、エージェントがMCSのポリシーをエミュレートすることを奨励する。
実験により,L-BRDivは2人共役の幅広い問題において,最先端の手法よりも堅牢なAHTエージェントを生成することを示した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:05:25 GMT)
Dataset Difficulty and the Role of Inductive Bias [37.7] 「サンプル難易度スコア」はデータセットの例のランク付けや分類に使用される。
さまざまなランニングとモデルアーキテクチャで異なるスコアの定式化を比較する。
スコアは、モデルの個々の実行よりもうるさく、単一概念の難易度に強く相関し、高感度から非感度、特定のモデルアーキテクチャの帰納バイアスまで幅広い例を明らかにします。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:19:51 GMT)
Glance and Focus: Memory Prompting for Multi-Event Video Question
Answering [36.0] VideoQAは、人間の日常行動を理解するエージェントの能力を評価する重要なツールとして登場した。
人間は一連のエピソード記憶をアンカーとして使い、推論のための質問に関連する重要な瞬間を素早く見つけることで、簡単に対処できる。
この効果的な推論戦略を模倣するGlance-Focusモデルを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:51:16 GMT)
Diff-PCR: Diffusion-Based Correspondence Searching in Doubly Stochastic
Matrix Space for Point Cloud Registration [35.8] 最先端の手法では、ソリューションを洗練させるためにRAFTのような反復的な更新が採用されている。
本稿では,最適マッチング行列の探索を予測するために,Denoising Diffusion Modelを利用する新しい手法を提案する。
提案手法は,オンラインバックボーンやホワイトノイズによって提供される任意の初期マッチング行列から検索を開始することで,柔軟性を提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:42:22 GMT)
Lookup Table meets Local Laplacian Filter: Pyramid Reconstruction
Network for Tone Mapping [35.5] 本稿では, 閉形式ラプラシアンピラミッドの分解と復元を利用して, グローバルおよびローカル演算子を統合する新しい戦略について検討する。
周波数情報の特徴を利用して低周波画像のトーンを操作するために,画像適応型3D LUTを用いた。
また、局所ラプラシアフィルタを用いて、高周波成分のエッジ詳細を適応的に洗練する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:44:30 GMT)
SPEED: Speculative Pipelined Execution for Efficient Decoding [35.5] 本稿では,現在のトークンと並行して複数の将来トークンを投機的に実行することで,推論効率を向上させるSPEEDを提案する。
パラメータ共有を使用するTransformerデコーダでは、並列に実行されるトークンのメモリ操作を償却することができる。
モデル精度に対する遅延低減の観点から,本手法の有効性を実証し,パラメータ共有によるより深いデコーダのトレーニングを最小限のランタイムオーバーヘッドで行う方法を示した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:32:43 GMT)
STAF: 3D Human Mesh Recovery from Video with Spatio-Temporal Alignment
Fusion [35.4] 既存のモデルは、通常、空間的・時間的情報を無視し、メッシュや画像の不一致や時間的不連続につながる可能性がある。
ビデオベースのモデルとして、注意に基づくテンポラルコヒーレンス融合モジュールによる人間の動きからのコヒーレンスヒントを利用する。
さらに,モデルが対象のフレームだけでなく,入力シーケンス全体に集中できるように,平均プールモジュール(APM)を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:07:14 GMT)
Topological Data Analysis for Neural Network Analysis: A Comprehensive
Survey [35.3] このサーベイは、ニューラルネットワーク分析におけるトポロジカルデータ分析(TDA)の適用を包括的に調査する。
我々は、TDAを用いて、データとニューラルネットワークから位相情報を得るための様々な戦略について議論する。
深層学習の実践的意義を考察し、特に敵対的検出やモデル選択といった分野に焦点を当てる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:58:21 GMT)
Towards Modeling Uncertainties of Self-explaining Neural Networks via
Conformal Prediction [34.9] 本稿では,自己説明型ニューラルネットワークのための新しい不確実性モデリングフレームワークを提案する。
生成した説明に対して,分布自由な不確実性モデリング性能を示す。
また、最終的な予測のために効率的で効果的な予測セットを生成することにも長けている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:51:49 GMT)
SVGDreamer: Text Guided SVG Generation with Diffusion Model [33.7] SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。
VPSDアプローチは、彩度の過飽和、ベクトルプリミティブの過度な平滑化、限られた結果の多様性といった課題に取り組む。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:40:49 GMT)
A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO
and Toxicity [33.2] 本稿では、一般的なアルゴリズム、直接選好最適化(DPO)、および毒性を減少させるメカニズムについて検討する。
具体的には,まず,事前学習した言語モデルであるGPT2-mediumにおいて毒性がどのように表現され,引き起こされるかを検討する。
得られたモデルが有毒な出力を回避しているかを調べ、事前学習から得られた能力は排除されず、むしろ回避される。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:26:15 GMT)
Multilingual Instruction Tuning With Just a Pinch of Multilinguality [33.2] 多くの言語が単言語チューニングから命令追従機能を他の言語に移行していることを示す。
複数の言語において、多言語混合に調整されたモデルが同等または優れた性能を示すことが観察された。
この結果から,多言語命令調整モデルの構築は,ごく少数の多言語命令応答で行うことが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:48:10 GMT)
Improving Human Sequential Decision-Making with Reinforcement Learning [33.0] トレースデータから"ベストプラクティス"を抽出できる新しい機械学習アルゴリズムを設計する。
我々のアルゴリズムは、労働者の行動と最適な政策によって取られた行動のギャップを最もうまく埋めるヒントを選択する。
実験の結果,提案アルゴリズムが生成したチップは人体の性能を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:20:42 GMT)
The Rank-Reduced Kalman Filter: Approximate Dynamical-Low-Rank Filtering
In High Dimensions [32.3] 低ランク行列の低ランク近似を伝播する新しい近似フィルタリング・平滑化法を提案する。
提案手法は, 計算複雑性を(カルマンフィルタの場合) 立方体から, 最悪ケースにおける状態空間サイズにおけるエンフクトラティックに還元する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:48:07 GMT)
On the hardness of learning under symmetries [32.0] 勾配勾配勾配を用いた同変ニューラルネットワークの学習問題について検討する。
対称性による帰納バイアスにもかかわらず、実際には勾配降下を通じて同変ニューラルネットワークで表される関数の完全なクラスを学習することは難しいままである。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:24:18 GMT)
A unified recipe for deriving (time-uniform) PAC-Bayes bounds [31.9] PAC-ベイジアン一般化境界を導出するための統一的枠組みを提案する。
私たちの境界は任意の時効値(すなわち、時間ユニフォーム)であり、すべての停止時間を保持することを意味する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:32:00 GMT)
One-Step Late Fusion Multi-view Clustering with Compressed Subspace [31.7] 圧縮部分空間を用いたワンステップレイトフュージョンマルチビュークラスタリング(OS-LFMVC-CS)という統合フレームワークを提案する。
コンセンサス部分空間を用いて分割行列を整列し、分割融合を最適化し、融合分割行列を用いて離散ラベルの学習を指導する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:18:30 GMT)
Incentivizing Massive Unknown Workers for Budget-Limited Crowdsensing:
From Off-Line and On-Line Perspectives [31.2] オフラインのコンテキスト認識型CMABベースのインセンティブ(CACI)機構を提案する。
また、このアイデアを、未知の労働者がシステムに参加または離脱するオンライン設定に拡張する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:53:30 GMT)
EPA: Neural Collapse Inspired Robust Out-of-Distribution Detector [30.7] アウト・オブ・ディストリビューション(OOD)検出は、ニューラルネットワークのセキュリティを確保する上で重要な役割を果たす。
我々はEntropy-enhanced principal Angle(EPA)という新しい$mathcalNC$-inspired OODスコアリング関数を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:25:18 GMT)
HOI4D: A 4D Egocentric Dataset for Category-Level Human-Object
Interaction [29.6] そこで本研究では,リッチアノテーションを用いた大規模4DエゴセントリックデータセットHOI4Dを提案する。
HoI4Dは、4人の参加者が収集した4000を超える2.4M RGB-Dエゴセントリックなビデオフレームで構成され、610の異なる室内室の16のカテゴリから800の異なるオブジェクトインスタンスと相互作用する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:31:13 GMT)
CRA-PCN: Point Cloud Completion with Intra- and Inter-level
Cross-Resolution Transformers [29.4] 局所的な注意機構を持つクロスレゾリューションアグリゲーションを効率的に行うクロスレゾリューショントランスを提案する。
我々は2種類のクロス・リゾリューション・トランスフォーマーを1つのアップサンプリングブロックに統合して点生成を行い、粗い方法でCRA-PCNを構築し、完全な形状を漸進的に予測する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:57:39 GMT)
Summary of the DISPLACE Challenge 2023 -- DIarization of SPeaker and
LAnguage in Conversational Environments [28.6] 複数の言語が小さな地理的近傍で話される多言語社会では、非公式な会話は言語が混在することが多い。
既存の音声技術は、音声データが複数の言語や話者との多様性に富んでいるような会話から情報を抽出するのに非効率である可能性がある。
DISPLACEチャレンジは、この挑戦的な状況下で話者と言語ダイアリゼーション技術の評価とベンチマークを行うためのオープンコールを構成する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:57:32 GMT)
A quatum inspired neural network for geometric modeling [28.3] 本稿では,MPSベースのメッセージパッシング戦略を提案する。
本手法は,多体関係を効果的にモデル化し,平均場近似を抑える。
これは幾何学的GNNに固有の標準メッセージパッシングおよびレイヤ集約モジュールをシームレスに置き換える。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:59:35 GMT)
Accurate and Fast Compressed Video Captioning [28.2] 既存のビデオキャプションアプローチでは、デコードされたビデオから最初にビデオフレームをサンプリングし、その後のプロセスを実行する必要がある。
圧縮領域の異なる視点からビデオキャプションについて検討し、既存のパイプラインに対してマルチフォールドの利点をもたらす。
本稿では,ビデオキャプションの圧縮領域において,ビデオキャプションの圧縮領域から学習可能な,シンプルで効果的なエンドツーエンド変換器を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:29:03 GMT)
Optimal cross-learning for contextual bandits with unknown context
distributions [28.1] 本稿では,バルセイロ等のクロスラーニング環境において,文脈的包括的アルゴリズムを設計する際の問題点について考察する。
コンテクスト数によらずに$widetildeO(sqrtTK)$というほぼ厳密な(対数的要因まで)後悔境界を持つ効率的なアルゴリズムを提供する。
アルゴリズムのコアとなるのは,複数のエポックにまたがるアルゴリズムの実行をコーディネートする新しい手法である。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:02:13 GMT)
Differentiable Quantum Architecture Search For Job Shop Scheduling
Problem [28.0] ジョブショップスケジューリング問題(JSSP)は,産業アプリケーションにおいて重要な役割を担っている。
優れた回路アーキテクチャを見つけるには、タスク特化と時間を要する。
JSSP-DQASは手動設計の回路よりもはるかに優れたノイズ耐性回路アーキテクチャを自動で見つけることができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:02:37 GMT)
Fact-checking based fake news detection: a review [27.0] 本論文は,事実に基づく偽ニュース検出の課題定義と課題を体系的に解説する。
本稿では,アルゴリズムの原理に基づく既存の検出手法について要約する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:47:02 GMT)
Incorporating Geo-Diverse Knowledge into Prompting for Increased
Geographical Robustness in Object Recognition [27.0] 対象カテゴリの地理固有の記述的知識は、堅牢性を高めるために活用できることを示す。
そこで本稿では,ソフトプロンプトが未確認対象の地理集合に一般化することを保証するために,地理知識の正規化手法を提案する。
ヨーロッパからのデータでのみ訓練されたモデルから一般化したDolarStreetは、アフリカからの国では+2.8、最も厳しいクラスでは+4.6である。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:11:16 GMT)
Understanding the Effects of RLHF on LLM Generalisation and Diversity [26.6] 人間のフィードバック(RLHF)からの強化学習によって微調整された大規模言語モデル(LLM)は、これまで最も広くデプロイされたAIモデルの一部で使用されている。
プロセスの各段階が2つの重要な特性、すなわちアウト・オブ・ディストリビューション(OOD)の一般化と出力の多様性にどのように影響するかを解析する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:58:42 GMT)
Signal Processing in the Retina: Interpretable Graph Classifier to
Predict Ganglion Cell Responses [26.4] そこで我々は,視覚刺激に応答してガングリオン細胞の発火を予測できるグラフベース分類器を学習した。
我々の枠組みは、解釈を必要とする前兆的特徴を持つ他の生物学的システムに適用できる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:15:22 GMT)
M3D: Dataset Condensation by Minimizing Maximum Mean Discrepancy [26.2] 最先端の訓練(SOTA)の深層モデルは、しばしば膨大なデータを必要とするため、かなりの訓練と保存コストがかかる。
データセットの凝縮は、オリジナルの大規模データセットから必須情報を保存する小さな合成集合を学ぶために開発された。
本稿では,最大平均離散度を最小化することにより,データセットの凝縮を最小化するためのM3Dという新しいDMベースの手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:43:33 GMT)
Pontryagin Neural Operator for Solving Parametric General-Sum
Differential Games [25.8] パラメトリックな状態制約を持つゲームにおいて、既存の最先端(SOTA)よりも優れた安全性を有するポントリャーギンモードニューラル演算子を提案する。
私たちの重要な貢献は、前方と後方のコストトロールアウトの相違について定義されたコストト損失の導入です。
コストトダイナミクスの不連続性は、手動で教師付きデータを必要とすることなく、効果的に不連続値の学習を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:15:32 GMT)
S3Net: Innovating Stereo Matching and Semantic Segmentation with a
Single-Branch Semantic Stereo Network in Satellite Epipolar Imagery [25.4] この研究は、セマンティックセグメンテーションとステレオマッチングを革新的に組み合わせたS3Net(Single-branch Semantic Stereo Network)というソリューションを導入している。
提案手法は,これらの2つのタスク間の本質的なリンクを識別し,活用することにより,意味情報のより正確な理解と相違性推定を実現する。
本モデルでは,セマンティックセグメンテーションにおけるmIoUを61.38から67.39に改善し,D1エラーと平均終点誤差(EPE)をそれぞれ10.051から9.579,1.439から1.403に削減する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:37:33 GMT)
EmotionGesture: Audio-Driven Diverse Emotional Co-Speech 3D Gesture
Generation [24.5] EmotionGestureは、オーディオから、鮮明で多様な感情的な3Dジェスチャーを合成するための新しいフレームワークである。
我々のフレームワークは最先端の3Dジェスチャーよりも優れており、鮮明で多様な感情的な3Dジェスチャーを実現している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:55:36 GMT)
Hyperbolic Graph Diffusion Model [24.0] 双曲グラフ拡散モデル(HGDM)と呼ばれる新しいグラフ生成法を提案する。
HGDMは、ノードを連続した双曲埋め込みにエンコードするオートエンコーダと、双曲潜在空間で動作するDMで構成される。
実験により、HGDMはグラフおよび分子生成ベンチマークにおいて、高度に階層的な構造を持つグラフ生成の品質を48%向上させることで、より良い性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:22:21 GMT)
Free Lunch for Federated Remote Sensing Target Fine-Grained
Classification: A Parameter-Efficient Framework [23.9] 本稿では、PRFLと呼ばれるフェデレートラーニングに基づく新しいプライバシー保護TFGCフレームワークを提案する。
4つの公開データセットを活用することにより,従来のTFGCタスクにおけるPRFLの有効性を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:45:00 GMT)
PressureVision++: Estimating Fingertip Pressure from Diverse RGB Images [23.9] ディープモデルは、単一のRGB画像に基づいて手圧力を推定できる。
本稿では,RGBカメラと協力的参加者のみを用いて,多様なデータをキャプチャ可能な新しいアプローチを提案する。
pressureVision++ の混合現実への応用を実演し、毎日の表面をタッチに敏感なインターフェースとして利用できるようにする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:59:57 GMT)
Test-Time Personalization with Meta Prompt for Gaze Estimation [23.0] 自然言語処理(NLP)の最近の進歩からインスピレーションを得て、テスト時間に無数のパラメータ"prompts"を更新する。
我々は、その更新が目標に合致することを確実にするために、プロンプトをメタ学習することを提案する。
実験の結果,メタ学習プロンプトは単純な対称性の損失でも効果的に適応できることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:02:35 GMT)
Disorder-induced topological pumping on a superconducting quantum
processor [22.4] チューレスポンピング(Thouless pumping)は、断熱的循環進化中に励起される量子化された電荷を表す。
41量子ビット超伝導量子プロセッサを用いて,断熱ポンプのサイクルを実現するFloquetエンジニアリング技術を開発した。
障害の存在下でのThouless pumpingを観察し、障害の強度が増加するにつれてその分解を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:57:54 GMT)
Cross-target Stance Detection by Exploiting Target Analytical
Perspectives [22.3] 目標位置検出(CTSD)は,目標位置からのアノテートデータを利用することで,目標位置の姿勢を推定する重要なタスクである。
CTSDにおける重要なアプローチの1つは、複数のターゲット間の知識ギャップを埋めるために、ドメイン不変の特徴を抽出することである。
本稿では,解析的視点をブリッジとして用いたCTSDのためのMPPTモデルを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:28:55 GMT)
Large Language Models Relearn Removed Concepts [21.7] モデルにおける概念再学習を、再訓練中のプルーニングニューロンにおける概念の正当性と類似性を追跡することによって評価する。
以上の結果から, モデルでは, 先進的な概念を以前の階層に移動させ, プリードされた概念を類似した意味を持つ素性ニューロンに再配置することで, 高速に性能を回復できることが判明した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:15:57 GMT)
CodeFuse-Query: A Data-Centric Static Code Analysis System for
Large-Scale Organizations [21.7] CodeFuse-Queryは、コード解析をデータ計算タスクとして再定義する。
システムは毎日100億行以上のコードをスキャンし、300以上のタスクをサポートする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:56:39 GMT)
De-Hallucinator: Iterative Grounding for LLM-Based Code Completion [21.4] 公開ソースコードのデータセットに基づいてトレーニングされた大言語モデル(LLM)は、コード補完において新たな最先端の方法を確立した。
本稿では, LLMに基づくコード補完手法であるDe-Hallucinatorを提案する。
De-Hallucinatorは、カーソル前のコードだけでモデルをクエリするのに比べて、4つの最先端のLLMで予測されたコードを改善する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:09:43 GMT)
GPT-4V(ision) is a Generalist Web Agent, if Grounded [20.9] GPT-4Vは,テキストプランを手作業でWebサイト上で動作させると,ライブWebサイトのタスクの50%を完了できることを示す。
これは GPT-4 のようなテキストのみの LLM や、Web エージェント用に微調整されたより小さなモデルよりも大幅に優れている。
本稿では,Web上での視覚的理解と行動の統合にLMMの力を利用する汎用WebエージェントであるSEEACTを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:33:09 GMT)
FuRPE: Learning Full-body Reconstruction from Part Experts [20.7] 本稿では,高品質な擬似ラベルを導き出すために,パートエキスパートと巧妙な擬似接地木選択方式を用いたフレームワークFuRPEを紹介する。
これらのラベルは、我々のアプローチの中心であり、利用可能なデータから効率的に学習する能力を持つ。
本稿では,FuRPEを用いて2段階と完全畳み込み1段階のフルボディ再構築ネットワークを訓練する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:26:10 GMT)
Pre-trained Recommender Systems: A Causal Debiasing Perspective [20.4] 本研究では,異なるドメインから抽出した汎用ユーザ・イテムインタラクションデータをトレーニングすることで,ユニバーサルインタラクションパターンをキャプチャする汎用レコメンデータを開発する。
実験により,提案モデルにより,ゼロショットと少数ショットの学習環境での推薦性能が大幅に向上する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 22:33:05 GMT)
Multimodal self-supervised learning for lesion localization [20.3] そこで本研究では,局所的な意味的アライメントのための基本単位として,テキストレポートから全文を抽出する手法を提案する。
本手法は胸部X線画像と対応するテキストレポートを組み合わせることで,グローバルレベルとローカルレベルの両方でコントラスト学習を行う。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:33:48 GMT)
MLIP: Medical Language-Image Pre-training with Masked Local
Representation Learning [20.3] 既存のコントラスト言語画像事前学習は、豊富な画像とテキストのペアをマッチングすることで、共同表現を学習することを目的としている。
本稿では,限られた画像テキストの医療データをより効率的に活用する医用言語-画像事前学習フレームワークを提案する。
評価の結果、MLIPはゼロ/フェーショット分類や少数ショット分割タスクにおいて、従来よりも大きなマージンで性能が向上していることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:54:13 GMT)
Enhancing the medical foundation model with multi-scale and
cross-modality feature learning [20.3] 本稿では,医療基盤モデルの性能向上のために,マルチスケールおよびクロスモダリティ情報を効果的に活用する手法を提案する。
本研究では,6つのオープンソースデータセットに対する提案手法の有効性について検討した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:22:54 GMT)
MLPs Compass: What is learned when MLPs are combined with PLMs? [20.0] 堅牢な構造キャプチャ機能を実現するマルチレイヤ・パーセプトロン(MLP)モジュールは、グラフニューラルネットワーク(GNN)よりも優れています。
本稿は,PLMの言語情報取得能力が向上するかどうかを定量化することを目的とする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:06:01 GMT)
GPS-SSL: Guided Positive Sampling to Inject Prior Into Self-Supervised
Learning [19.8] 我々は,自己監視学習(SSL)の正のサンプル選択に事前知識を注入するために,自己監視学習(GPS-SSL)をガイドする。
GPS-SSLは、SimCLRやBYOLなどのSSLメソッドに適用できる。
強力なDAを使用する場合であっても、GPS-SSLは未調査領域のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:39:06 GMT)
Conflicts, Villains, Resolutions: Towards models of Narrative Media
Framing [19.6] 我々は、物語の要素を明示的に捉えたコミュニケーション科学から、広く使われているフレーミングの概念化を再考する。
我々は、複雑なアノテーションタスクをより単純なバイナリー質問に分解する効果的なアノテーションパラダイムを適用します。
教師付きおよび半教師付きアプローチによるフレームの自動マルチラベル予測について検討する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:56:20 GMT)
Quantum Key Leasing for PKE and FHE with a Classical Lessor [19.1] 安全な鍵リースの問題は、取り消し可能暗号(revocable cryptography)としても知られる。
この問題は、量子情報の不可避な性質を活用することを目的としている。
我々は、(古典的な)公開鍵・同型暗号方式の復号鍵をリースするために、セキュアな鍵リース方式を構築した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:02:13 GMT)
Retrieval-Augmented Generation for Large Language Models: A Survey [19.1] 大きな言語モデル(LLM)は重要な能力を示すが、幻覚、時代遅れの知識、不透明で追跡不能な推論プロセスといった課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:04:40 GMT)
SCALA: Sparsification-based Contrastive Learning for Anomaly Detection
on Attributed Networks [19.1] 属性付きネットワーク上の異常検出は、他の多数ノードと大きく異なる振る舞いを持つノードを見つけることを目的としている。
本稿では,ネットワークの埋め込み品質向上を目的とした,属性付きネットワーク上での異常検出のための新しいコントラスト学習フレームワークである textbfSCALA を提案する。
5つのベンチマーク実世界のデータセットで大規模な実験が行われ、結果はSCALAがすべてのベースライン手法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:51:18 GMT)
Brain-Conditional Multimodal Synthesis: A Survey and Taxonomy [18.1] マルチモーダル合成技術の鍵となるのは、異なるモーダル間のマッピング関係を確立することである。
ブライアン条件多重モーダル合成(Brian-conditional multimodal synthesis)とは、脳の信号を知覚経験に復号することである。
この調査は、AIGC-Brainと呼ばれる、AIGCベースのBrain-conditional Multimodal Synthesisの出現する分野を包括的に調査する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:50:27 GMT)
Recourse under Model Multiplicity via Argumentative Ensembling
(Technical Report) [17.4] 我々は、recourse-aware ensembling と命名し、その解決方法が満足すべきいくつかの望ましい性質を同定する。
理論的および実験的に、議論的アンサンブルは既存の手法に欠けている性質を満足し、トレードオフは最小のWrt精度であることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:02:24 GMT)
Deep Automated Mechanism Design for Integrating Ad Auction and
Allocation in Feed [17.4] 電子商取引プラットフォームは通常、ユーザのページビュー要求に応じて、いくつかのオーガニックアイテムと広告が混在した順序付きリストを提示する。
広告割当が広告及び有機品の表示位置を決定する間、広告オークションは、どの広告が表示され、対応する支払いが決定される。
これまでの研究では、しばしば2つの段階のうちの1つ、すなわち2段階の問題に焦点が当てられていた。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:27:39 GMT)
Bayesian posterior approximation with stochastic ensembles [16.9] ベイジアン後部を近似するために,ニューラルネットワークのアンサンブルを導入する。
我々はモンテカルロのドロップアウト、DropConnect、および新しい非パラメトリック版のドロップアウトに基づいてアンサンブルを実装している。
両方のタスクに対して、ハミルトンモンテカルロシミュレーションに対して後部の品質を直接テストする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:22:46 GMT)
MedSumm: A Multimodal Approach to Summarizing Code-Mixed Hindi-English
Clinical Queries [16.1] 本稿では,Multimodal Medical Codemixed Question Summarization MMCQSデータセットを紹介する。
このデータセットは、ヒンディー語と英語の混成医療クエリと視覚支援を組み合わせたものだ。
データセット、コード、トレーニング済みのモデルを公開します。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:58:25 GMT)
Synthetic Data in AI: Challenges, Applications, and Ethical Implications [16.0] 本稿では,合成データの多面的側面について考察する。
これらのデータセットが持つ可能性のある課題と潜在的なバイアスを強調します。
また、合成データセットに関連する倫理的考察と法的意味についても批判的に論じている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:03:30 GMT)
Utilizing Neural Transducers for Two-Stage Text-to-Speech via Semantic
Token Prediction [15.7] 本稿では,ニューラルトランスデューサを中心とした新しいテキスト音声合成(TTS)フレームワークを提案する。
提案手法では,TSパイプライン全体をセマンティックレベルのシーケンス・ツー・シーケンス・モデリング(seq2seq)ときめ細かな音響モデルステージに分割する。
ゼロショット適応型TS実験の結果,音声品質と話者類似度の観点から,モデルがベースラインを超えていることが判明した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:03:36 GMT)
GOAT-Bench: Safety Insights to Large Multimodal Models through
Meme-Based Social Abuse [15.6] 我々は、暗黙のヘイトスピーチ、性差別、サイバーいじめなどのテーマをカプセル化した6K以上の様々なミームからなる包括的なミームベンチマークGOAT-Benchを紹介した。
我々はLMMがヘイトフルネス、軽蔑、攻撃性、皮肉、有害なコンテンツを正確に評価する能力について検討した。
LMMの幅広い実験により、現在のモデルは安全意識に欠けており、様々な形態の暗黙的虐待に敏感であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:28:55 GMT)
Revisiting Zero-Shot Abstractive Summarization in the Era of Large
Language Models from the Perspective of Position Bias [15.5] 位置バイアスを測定することにより,Large Language Models (LLMs) におけるゼロショット抽象要約を特徴付ける。
位置バイアスは入力テキストの特定の部分からの情報を不当に優先するモデルの傾向を捉え、望ましくない振る舞いをもたらす。
その結果,ゼロショット要約タスクにおけるモデルの性能と位置バイアスに関する新たな洞察と議論につながった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:38:40 GMT)
AID-DTI: Accelerating High-fidelity Diffusion Tensor Imaging with
Detail-Preserving Model-based Deep Learning [15.5] 本稿では,6つの測定値のみで高速かつ正確なDTIを実現するための新しい手法であるAID-DTI(Accelerating hIgh fiDelity Diffusion Imaging)を提案する。
AID-DTIは、新しく設計されたSingular Value Decomposition (SVD)ベースの正規化器を備えており、ネットワークトレーニング中にノイズを抑えながら、細部を効果的に捉えることができる。
HCP(Human Connectome Project)データによる実験結果から,提案手法は細粒度でDTIパラメータマップを推定し,定量的かつ定性的に3つの最先端手法を上回ることを示した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:54:48 GMT)
Generalization Error Curves for Analytic Spectral Algorithms under
Power-law Decay [15.1] 本稿では,カーネル勾配勾配法における一般化誤差曲線の完全な特徴付けを行う。
ニューラル・タンジェント・カーネル理論により、これらの結果は広義のニューラルネットワークを訓練する際の一般化行動の理解を大幅に改善する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:00:50 GMT)
Wasserstein Nonnegative Tensor Factorization with Manifold
Regularization [14.8] ワッサーシュタイン多様体非負テンソル分解(WMNTF)を導入する。
我々は、計量としてワッサーシュタイン距離(すなわちアースモーバー距離または最適輸送距離)を使用し、潜在因子にグラフ正規化子を加える。
実験により,提案手法の有効性を他のNMF法やNTF法と比較した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:20:27 GMT)
Improved Bandits in Many-to-one Matching Markets with Incentive
Compatibility [14.2] 両面のマッチング市場は、そのリッチな応用のために、文献で広く研究されている。
本稿では,インセンティブの整合性を確保しつつ,多国間市場における後悔感を高めることを目的とする。
我々は、オンラインDA(ODA)アルゴリズムを考案し、この設定に対して$O(NKlog T/Delta2)$ player-pessimal stable regret boundを定めている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:45:35 GMT)
A Novel Paradigm for Neural Computation: X-Net with Learnable Neurons
and Adaptable Structure [14.0] 本研究では,X-Netと呼ばれる新しいニューラルネットワークを提案する。
設計した代替バックプロパゲーション機構を利用することで、X-Netは適切なアクティベーション関数を動的に選択する。
モデルサイズを削減し、表現力を向上させるという点で、X-Netの2つの利点を実証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:52:18 GMT)
IoT in the Era of Generative AI: Vision and Challenges [13.9] 私たちは、Generative AIがモノのインターネットにもたらすメリットに関するビジョンと見解を共有しています。
IoT関連領域におけるジェネレーティブAIの最も重要な応用について論じる。
高いリソース要求を含む、最も重要な課題のいくつかを特定します。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:08:57 GMT)
NODEC: Neural ODE For Optimal Control of Unknown Dynamical Systems [13.7] NODECは未知の力学系を制御するための新しいフレームワークである。
動的モデリングとコントローラのトレーニングを結合したニューラルODEモデルで組み合わせる。
我々は,未知の力学系の最適制御を学習するためのNODECの有効性とデータ効率を実証した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:05:17 GMT)
On Time-Indexing as Inductive Bias in Deep RL for Sequential
Manipulation Tasks [13.7] 操作ポリシーは、複雑な操作タスクを達成するために、様々なスキルのセットを学ぶ必要があることが多い。
標準的なディープポリシー学習アルゴリズムは、1つの出力ヘッドを持つディープニューラルネットワークとしてポリシーをモデル化することが多い。
本稿では,一定期間に異なるアクションヘッドを順次実行するポリシーアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 22:05:48 GMT)
aMUSEd: An Open MUSE Reproduction [13.6] MUSEに基づくテキスト・ツー・イメージ生成のためのオープンソース軽量マスク画像モデル(MIM)を提案する。
我々はMIMがテキスト・ツー・イメージ生成の主流である潜時拡散に比べて探索不足であると考えている。
256x256と512x512の解像度で画像を直接生成する2つのモデルのチェックポイントをリリースする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:10:07 GMT)
Transformer RGBT Tracking with Spatio-Temporal Multimodal Tokens [13.6] 静的テンプレートからのマルチモーダルトークンと,ターゲットの外観変化を処理するマルチモーダル検索トランスフォーマーを組み合わせた,新しいTransformer-Tトラッキング手法を提案する。
我々のモジュールはトランスネットワークに挿入され,共同特徴抽出,検索テンプレートマッチング,時間的相互作用を継承する。
3つのRGBTベンチマークデータセットの実験により、提案手法は、他の最先端追跡アルゴリズムと比較して、競合性能を維持していることが示された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:16:38 GMT)
A Two-Stage Multimodal Emotion Recognition Model Based on Graph
Contrastive Learning [13.2] グラフコントラスト学習(TS-GCL)に基づく2段階感情認識モデルを提案する。
TS-GCL は IEMOCAP と MELD のデータセットに対して,従来の手法に比べて優れた性能を示した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:58:31 GMT)
Simultaneous q-Space Sampling Optimization and Reconstruction for Fast
and High-fidelity Diffusion Magnetic Resonance Imaging [13.0] 我々は,q空間サンプリング最適化と再構成の同時フレームワークであるSSORを提案する。
我々は、球面調和関数の連続表現と再構成ネットワークを用いて、q空間サンプルのサブセットを共同で最適化する。
拡散磁気共鳴イメージング(dMRI)のユニークな特性を,$l1$-normと全変分正規化を適用して,q領域と画像領域の両方に集積する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:47:20 GMT)
Social Media Ready Caption Generation for Brands [13.0] 我々は、画像やブランドの個性に合わせて、魅力的なソーシャルメディアキャプションを作成する際に、ブランドが支援するパイプラインソリューションを提案する。
最初の部分は画像キャプションモデルで、ブランドがオンラインに投稿したいイメージを取り込み、平易な英語キャプションを与えます。
第2部は、生成されたキャプションとターゲットブランドのパーソナリティとを取り込み、キャッチーなパーソナリティ対応のソーシャルメディアキャプションを出力する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:27:01 GMT)
Context-Aware Interaction Network for RGB-T Semantic Segmentation [12.9] RGB-Tセマンティックセグメンテーションは自律走行シーン理解の鍵となる手法である。
補助的なタスクとグローバルなコンテキストを活用するためのコンテキスト認識インタラクションネットワーク(CAINet)を提案する。
提案したCAINetは、ベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:49:29 GMT)
LLM4TS: Aligning Pre-Trained LLMs as Data-Efficient Time-Series
Forecasters [12.9] 事前学習された大言語モデル(LLM)を用いた時系列予測のためのフレームワークを提案する。
LLM4TSは、時系列データのニュアンスにLLMを合わせるための2段階の微調整戦略と、時系列予測タスクに特化して設計された予測微調整段階から構成される。
我々のフレームワークは、事前訓練されたLLM内に多段階の時間データを統合し、時間固有の情報を解釈する能力を向上する新しい2段階集約手法を特徴としている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:24:57 GMT)
SCLIP: Rethinking Self-Attention for Dense Vision-Language Inference [12.9] セマンティックセグメンテーションにおけるコントラッシブ言語イメージ事前学習の可能性を高める。
自己注意を再考することで、CLIPは密集した予測タスクに適応できることがわかった。
従来のCLIPビジョンエンコーダの自己保持ブロックをCSAモジュールで置き換える。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:15:50 GMT)
CityPulse: Fine-Grained Assessment of Urban Change with Street View Time
Series [12.6] 都市変革は、個人と地域社会の両方に大きな社会的影響を及ぼす。
本研究では,大規模に構築された環境における物理的変化を効果的に捉えるために,エンドツーエンドの変更検出モデルを提案する。
我々のアプローチは既存のデータセットを補完し、都市の変化をきめ細やかに正確に評価する可能性がある。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:13:31 GMT)
A User-centered Security Evaluation of Copilot [12.4] 私たちはGitHubのCopilotを評価し、コードのセキュリティに関する長所と短所をよりよく理解しています。
Copilotへのアクセスは,難しい問題に対処する上で,よりセキュアなソリューションであることに気付きました。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 23:38:36 GMT)
FMGS: Foundation Model Embedded 3D Gaussian Splatting for Holistic 3D
Scene Understanding [11.9] 本稿では,基礎モデルの視覚言語埋め込みを3次元ガウススプラッティングに組み込んだalgfull(algname)を提案する。
本研究では,視覚・言語・3次元シーン表現の交わりについて検討し,制御されていない現実世界環境におけるシーン理解の強化の道を開く。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:39:02 GMT)
SkateboardAI: The Coolest Video Action Recognition for Skateboarding [11.9] 原文(投稿日:2019/05/19)へのリンク 私たちは、原生のビデオデータセット“SkateboardAI”を野生で最初にキュレートしました。
我々は、異なるトリックを正確に認識するために、多様なユニモーダルおよびマルチモーダルなビデオアクション認識アプローチを実装した。
我々の目標は、最もクールなスケートボード競技のための優れたAIスポーツレフェリーを作ることです。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:09:50 GMT)
In the Name of Fairness: Assessing the Bias in Clinical Record
De-identification [11.8] 本研究は, 大規模実験分析により, 臨床ノートに記載された名前の非識別システムのバイアスについて検討した。
以上の結果から,ほとんどの手法では,人口分布の大部分が統計的に有意な性能差があることが判明した。
特定されたギャップを緩和するために,臨床状況と多様な名前の微調整による簡易かつ方法に依存しない解法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:00:15 GMT)
Hallucinations in Neural Automatic Speech Recognition: Identifying
Errors and Hallucinatory Models [11.5] 幻覚は、ソースの発声とは意味的に無関係であるが、それでも流動的でコヒーレントである。
単語誤り率などの一般的なメトリクスは、幻覚モデルと非幻覚モデルとを区別できないことを示す。
本研究は,幻覚を識別する枠組みを考案し,その意味的関係と基礎的真理と流布との関係を解析する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:56:56 GMT)
Adversarial Representation Learning for Robust Privacy Preservation in
Audio [11.4] 音響イベント検出システムは、ユーザーまたはその周辺に関する機密情報を不注意に明らかにすることができる。
本稿では,音声記録の表現を学習するための新しい逆学習法を提案する。
提案手法は,プライバシ対策を伴わないベースライン手法と,事前の逆行訓練法とを併用して評価する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:51:05 GMT)
Zero-shot Active Learning Using Self Supervised Learning [11.3] 我々は,反復的なプロセスを必要としないモデル非依存の新たなアクティブラーニング手法を提案する。
アクティブラーニングの課題に自己指導型学習機能を活用することを目的としている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:49:07 GMT)
Collaborative Perception for Connected and Autonomous Driving:
Challenges, Possible Solutions and Opportunities [10.7] コネクテッド・自動運転車(CAV)との協調的な認識は、これらの制限を克服するための有望な解決策である。
本稿では、まず、データ共有の非同期性、データボリューム、エラーの対応など、協調的な知覚の課題を識別する。
本稿では,チャネル認識型協調認識フレームワークである通信効率と遅延問題に対処する手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:33:14 GMT)
Distilling Temporal Knowledge with Masked Feature Reconstruction for 3D
Object Detection [10.6] 本稿では,教師検出器から長期記憶を取得するための時間知識ディファイラであるTempDistillerを提案する。
機能教師に適用される自己注意操作を通じて、長期的時間的知識を統合することで、再構築対象を定式化する。
提案手法の有効性を nuScenes ベンチマークで検証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:23:49 GMT)
Evaluating Fairness in Self-supervised and Supervised Models for
Sequential Data [10.6] 自己教師型学習(SSL)は,大規模モデルのデファクトトレーニングパラダイムとなっている。
本研究では,事前学習と微調整が公正性に及ぼす影響について検討する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:31:43 GMT)
Proposal of detecting topological transition of quantum braiding in
three-fold degenerate eigen subspace [10.6] 量子状態のブレイディング演算は、トポロジカル量子計算を実現する大きな可能性のために、かなりの注目を集めている。
3次元固有部分空間は、最小の物理系である4レベルハミルトニアンで退化可能であることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:13:08 GMT)
View Distribution Alignment with Progressive Adversarial Learning for
UAV Visual Geo-Localization [10.4] 無人航空機(UAV)の視覚的ジオローカライゼーションは、異なるビュー、すなわちUAVビューと衛星ビューから取得した同じ地理的ターゲットの画像とマッチングすることを目的としている。
以前の作業では、UAVや衛星が撮影した画像を共有特徴空間にマッピングし、位置に依存した特徴を学習するための分類フレームワークを使用していた。
本稿では,2つのビューの分布アライメントを導入し,共通空間における距離を短縮する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:58:09 GMT)
Practical Guidelines for the Selection and Evaluation of NLP Techniques
in RE [10.4] 自然言語処理(NLP)が要求自動化の基礎になった。
本書では,NLP技術の選択に関するガイドラインと,要求工学の文脈における評価について述べる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:24:35 GMT)
Maximal steady-state entanglement in autonomous quantum thermal machines [10.3] 我々は3つの対相互作用量子ビットからなる自律量子熱機械を考案し、そのうち2つは局所的に古典的な貯水池に結合する。
マシンは、タイムコヒーレントな制御、外部駆動、量子バスエンジニアリングを必要としないため、自律的に動作します。
この非平衡系は、2つの量子ビット間の最大絡み合い状態、あるいは実際には、系の暗黒状態として現れる任意の所望の純2量子絡み合い状態を決定論的に生成できることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:01:22 GMT)
Few-shot Adaptation of Multi-modal Foundation Models: A Survey [10.3] CLIPのようなマルチモーダル(ヴィジュアル言語)モデルは、従来の教師付き事前訓練モデルを置き換える。
医療画像やリモートセンシングのような細かな領域では、マルチモーダル基盤モデルの性能が望まれることが多い。
マルチモーダルモデルのための数ショット適応法における研究の進歩を紹介し,分析する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:19:14 GMT)
Lightweight Adaptive Feature De-drifting for Compressed Image
Classification [10.3] 高品質な画像で訓練された高レベルの視覚モデルは、圧縮された画像を扱う際に性能劣化に悩まされる。
ビジュアルアーティファクトを扱うために、さまざまな学習ベースのJPEGアーティファクト除去手法が提案されている。
本稿では,プレトレーニング済み画像分類モデルの性能向上を図るために,新しい軽量AFDモジュールを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:03:44 GMT)
PLLaMa: An Open-source Large Language Model for Plant Science [10.0] 本稿ではLLaMa-2から進化した大規模言語モデルを提案する。
植物科学に関する150万以上の記事を含む包括的なデータベースで拡張されています。
植物と農業に関する特定のデータセットを含む最初の試験では、aMaが植物科学に関連するトピックの理解を大幅に改善することが示された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:06:26 GMT)
Mining Temporal Attack Patterns from Cyberthreat Intelligence Reports [9.6] サイバー攻撃から守るには、高いレベルの敵行動を実行する必要がある。
我々はChronoCTIを提案する。ChronoCTIはサイバー脅威インテリジェンス(CTI)レポートから時間的攻撃パターンをマイニングするためのパイプラインである。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:53:22 GMT)
An Invariant Information Geometric Method for High-Dimensional Online
Optimization [9.5] 本稿では,対応するフレームワークから派生した,完全な不変性指向進化戦略アルゴリズムを提案する。
ベイズ最適化と進化戦略における主要なアルゴリズムに対してSynCMAをベンチマークする。
あらゆるシナリオにおいて、SynCMAはサンプル効率において他のアルゴリズムよりも優れた能力を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:06:26 GMT)
Adversarial Machine Learning-Enabled Anonymization of OpenWiFi Data [9.5] 匿名化によるデータのプライバシと保護は、他のデータの使用が期待される前にネットワークオペレータやデータ所有者にとって重要な問題である。
オープンWiFiネットワークは、データ所有者が持つ知識に関係なく、トラフィックへのアクセスや知識を得ようとする敵に対して脆弱である。
CTGANは合成データを生成する。これは実際のデータとして偽装するが、実際のデータの隠れた急性情報を促進する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:59:03 GMT)
Do DL models and training environments have an impact on energy
consumption? [9.4] 本研究の目的は,グリーンなコンピュータビジョンモデルのトレーニングにおいて,モデルアーキテクチャとトレーニング環境が与える影響を分析することである。
適切なモデルアーキテクチャとトレーニング環境を選択することで、エネルギー消費を劇的に削減できることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:20:31 GMT)
From Pixel to Slide image: Polarization Modality-based Pathological
Diagnosis Using Representation Learning [9.3] 病理組織学的には、甲状腺腫瘍は不適切な検体採取による診断上の課題となる。
甲状腺腫瘍の鑑別のための画素レベルのアノテーションとスライスレベルのアノテーションを統合するために,表現学習を用いた3段階モデルを構築した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:01:09 GMT)
Robust Quantum Gates against Correlated Noise in Integrated Quantum
Chips [9.3] 超伝導量子回路におけるロバスト量子ゲートの実験的実現について報告する。
我々の研究は、ノイズ耐性複素量子回路を実現するための汎用的なツールボックスを提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:12:35 GMT)
TrAISformer -- A Transformer Network with Sparse Augmented Data
Representation and Cross Entropy Loss for AIS-based Vessel Trajectory
Prediction [9.3] 船舶軌道予測は多くの海洋アプリケーションやサービスにおいて重要な役割を担っている。
AISデータを用いた血管軌跡の予測は、現代の機械学習技術においても困難である。
我々は、AISデータの離散的高次元表現と、異質性や多様性に明示的に対処するために設計された新しい損失関数を導入する。
TrAISformerは10海里から10時間以内の平均予測性能で最先端の手法を大幅に上回っている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:22:51 GMT)
DGDNN: Decoupled Graph Diffusion Neural Network for Stock Movement
Prediction [8.8] 本稿では,これらの問題に対処するための知識のない新しいグラフ学習手法を提案する。
まず,信号処理の観点から,エントロピー駆動エッジ生成による動的ストックグラフの自動構築を行う。
最後に, 特徴的階層内特徴を捉えるために, 分離表現学習方式を採用する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:36:27 GMT)
Quantum Bayes Classifiers and Their Application in Image Classification [8.6] 量子ベイズ分類器(QBC)の構築と、素性QBCと3つの半素性QBC(SN-QBC)の設計について検討する。
局所特徴抽出法を用いて,画像から限られた数の特徴を抽出し,計算複雑性を低減する。
我々は、これらのQBCをMindQuantum量子プラットフォーム上でシミュレートし、MNISTおよびFashion-MNISTデータセット上でテストする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:40:01 GMT)
Deshadow-Anything: When Segment Anything Model Meets Zero-shot shadow
removal [8.6] 画像シャドー除去を実現するために,大規模データセットの一般化を考慮したDeshadow-Anythingを開発した。
拡散モデルは画像の端やテクスチャに沿って拡散し、画像の詳細を保存しながら影を取り除くのに役立つ。
シャドウ除去タスクの実験では、これらの手法が画像復元性能を効果的に向上できることが示されている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:01:09 GMT)
Specific Emitter Identification Based on Joint Variational Mode Decomposition [8.0] 特定のエミッタ識別(SEI)技術は、自己組織化ネットワークやスペクトル管理などのデバイス管理シナリオにおいて重要である。
非線形および非定常電磁信号に対して、SEIはしばしば、異なるデバイス指紋を効果的に特徴付けるために、信号を分解するために変分モード分解(VMD)を用いる。
本稿では,マルチフレーム信号に対して同時にモーダル分解を実装し,VMDの改良版であるJVMDアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:19:32 GMT)
AstroLLaMA-Chat: Scaling AstroLLaMA with Conversational and Diverse
Datasets [7.9] 天文学に着目した質問応答におけるLLM性能向上の可能性について検討する。
専門的なトピック理解における顕著な改善を天文学コーパスのキュレートセットを用いて達成する。
AstroLLaMAの拡張として、ドメイン固有の会話データセット上で7B LLaMAモデルを微調整し、チャット対応のAstroLLaMAをコミュニティ利用向けにリリースする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:47:02 GMT)
Prototypical Information Bottlenecking and Disentangling for Multimodal
Cancer Survival Prediction [7.8] マルチモーダル学習は癌生存予測に大きく貢献する。
マルチモーダルデータにおける大規模な冗長性は、識別的かつコンパクトな情報を抽出することを防ぐ。
本稿では,新しいフレームワークであるプロトタイプ型インフォメーション・ブートネックとディペンタングを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:39:36 GMT)
Lon-ea at SemEval-2023 Task 11: A Comparison of Activation Functions for
Soft and Hard Label Prediction [7.8] 深層ニューラルネットワークモデルの出力層における異なる活性化関数の影響について検討する。
目標は、ソフトラベルを予測することで、不一致の量を定量化することです。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:33:57 GMT)
A Comprehensive Survey of Hallucination Mitigation Techniques in Large
Language Models [7.7] 大きな言語モデル(LLM)は、人間のようなテキストを書く能力の進歩を続けている。
重要な課題は、事実に見えるが根拠のないコンテンツを生み出すことを幻覚させる傾向にある。
本稿では,LLMにおける幻覚を緩和するために開発された32以上の技術について調査する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:13:00 GMT)
GLIDE-RL: Grounded Language Instruction through DEmonstration in RL [7.7] 自然言語を基盤とした効率的な強化学習(RL)エージェントの訓練は、長年にわたる課題である。
本稿では,教師-教師-学生のカリキュラム学習フレームワークを導入した新しいアルゴリズム,GLIDE-RL(GLIDE-RL)を提案する。
この多エージェントフレームワークでは、教師と学生エージェントは、生徒の現在のスキルレベルに基づいて同時に学習する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:32:13 GMT)
Parallel Algorithms Align with Neural Execution [7.5] しかし並列アルゴリズムは計算能力を最大限に活用できるため、実行すべきレイヤは少ない。
このことは、CLRSフレームワーク上のシーケンシャルなコンポーネントに対して、検索、ソート、および強力な接続されたコンポーネントの並列実装を比較する際に観察されるように、トレーニング時間を劇的に短縮します。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:34:37 GMT)
On Memorization and Privacy Risks of Sharpness Aware Minimization [7.5] シャープネス認識最小化(SAM)によって達成される一般化ゲインは、非定型データポイントに対して特に顕著である。
この洞察はSAMに関連する高いプライバシーリスクを明らかにするのに役立ち、徹底的な経験的評価を通じて検証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:23:26 GMT)
Multi-modal Learning with Missing Modality in Predicting Axillary Lymph
Node Metastasis [7.2] 多モードデータ、全スライド画像(WSI)および臨床情報により、軸索リンパ節転移の診断におけるディープラーニングモデルの性能を向上させることができる。
マルチモーダル分岐と単一モーダル分岐からなる双方向蒸留フレームワークを提案する。
提案手法は,AUCが0.861,AUCが0.842,AUCが80%,AUCが0.842,AUCが0.842となっている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:59:48 GMT)
HEOM-QUICK2: a general-purpose simulator for fermionic many-body open
quantum systems -- An Update [7.0] HEOM-QUICK2はフェルミオン多体OQSの汎用シミュレータである。
定常状態のより効率的な解法、非マルコフメモリのより正確な処理、長期散逸ダイナミクスの数値安定性の改善などが特徴である。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:44:46 GMT)
Investigating the Suitability of Concept Drift Detection for Detecting
Leakages in Water Distribution Networks [7.0] 漏れは、水の損失と汚染リスクの増加を引き起こすため、水分配ネットワークにおいて大きなリスクである。
水分配網の複雑な力学のために漏れ検知は難しい課題である。
機械学習の観点からは、リークはコンセプトドリフトとしてモデル化できる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:12:04 GMT)
Extracting double-quantum coherence in two-dimensional electronic
spectroscopy under pump-probe geometry [7.0] Farrell と Zanni は2次元赤外分光法でパルス列を置換した 2Q 信号を検出した。
2Qと0Qのコヒーレンスを位相サイクリング法と因果強制法を用いて異なるスペクトルに分離することを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:11:53 GMT)
A full circuit-based quantum algorithm for excited-states in quantum
chemistry [7.0] 量子化学ハミルトニアンの励起状態スペクトルを得るための非変分完全回路に基づく量子アルゴリズムを提案する。
従来の古典量子ハイブリッド変分アルゴリズムと比較して,本手法は古典的最適化プロセスを排除している。
このアルゴリズムは、フォールトトレラント量子コンピュータ上の様々なハミルトンスペクトル決定問題に広く適用することができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:31:58 GMT)
Evaluating Large Language Models in Semantic Parsing for Conversational
Question Answering over Knowledge Graphs [6.9] 本稿では,この課題に対して事前訓練を受けていない大規模言語モデルの性能を評価する。
その結果,大規模言語モデルでは対話からグラフクエリを生成することができることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:28:33 GMT)
Token Propagation Controller for Efficient Vision Transformer [6.3] ビジョントランス (ViT) は様々なコンピュータビジョンタスクにおいて有望な結果を得た。
この課題に対処するために、段階的なトークン削減を採用する以前のアプローチでは、ひとつのレイヤにおけるトークンの冗長性は、以下のすべてのレイヤにおける冗長性を意味すると仮定されている。
本稿では、2つの異なるトークン分布を組み込んだ新しいトークン伝搬制御器(TPC)を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:10:33 GMT)
Hyperfine-enhanced gyroscope based on solid-state spins [6.1] 電子核スピン系に基づく固体プラットフォームは回転センシングの魅力的な候補である。
ホスト材料に内在的に結合したスピンを含む2スピンシステムに基づくジャイロプロトコルを提案する。
この結果により、遅い回転の正確な測定と基礎物理学の探索が可能となった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:51:45 GMT)
Quality and Quantity of Machine Translation References for Automated
Metrics [6.0] 高品質な参照は、セグメントレベルの人間とのより良い計量相関をもたらす。
異なる品質のベンダーからの参照は混在し、メートル法の成功を改善することができる。
これらの発見は、特定の予算の下で参照を作成する必要がある場合、共有タスクの評価者によって利用することができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:01:49 GMT)
Navigating Uncertainty: Optimizing API Dependency for Hallucination
Reduction in Closed-Book Question Answering [5.9] 大きな言語モデル(LLM)は知識を蓄積し、回復することができるが、幻覚を起こす傾向がある。
直接回答できるのか、外部ツールをリクエストする必要があるのかを自己推定できる新しいLCMを提案する。
我々のモデルは、既知のクエリの78.2%ドルに対して直接回答を提供し、未知のクエリの77.2%ドルを検索する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:12:42 GMT)
The Power of Training: How Different Neural Network Setups Influence the
Energy Demand [5.9] 本研究は,機械学習学習体制と学習パラダイムの変動が,対応するエネルギー消費に与える影響について検討する。
この研究の目的は、一般的なトレーニングパラメータとプロセスのエネルギー効果に対する認識を作ることである。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:44:17 GMT)
Modality Exchange Network for Retinogeniculate Visual Pathway
Segmentation [5.7] マルチモーダル磁気共鳴(MR)イメージング情報を有効利用してRGVPセグメンテーションを強化する新しいモダリティ交換ネットワーク(ME-Net)を提案する。
具体的には、T1重み付きMR画像と分画異方性MR画像とのモダリティ情報を交換するためのチャネルと空間混合アテンションモジュールを設計する。
実験の結果,RGVPセグメンテーション性能は既存の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:41:57 GMT)
LESEN: Label-Efficient deep learning for Multi-parametric MRI-based
Visual Pathway Segmentation [5.7] ラベル効率のよい自己認識型深層学習法(LESEN)を提案する。
LESENは教師なしと教師なしの損失を取り入れ、生徒と教師のモデルが相互に学習できるようにする。
ヒトコネクトームプロジェクト(HCP)のデータセットを用いた実験により,本手法の優れた性能が示された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:22:13 GMT)
ULF: Unsupervised Labeling Function Correction using Cross-Validation
for Weak Supervision [5.6] 弱監督(WS)は手動データラベリングの代案として費用対効果がある。
教師なしラベル付け関数修正のための新しいアルゴリズムULFを導入する。
ULFは、この割り当てを信頼性の高いクロスバリデーションサンプルに再推定することで、クラスへのLFの割り当てを洗練します。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:52:22 GMT)
CoSS: Co-optimizing Sensor and Sampling Rate for Data-Efficient AI in
Human Activity Recognition [5.5] ニューラルネットワークの最近の進歩は、複数の時系列センサーを用いた人間の活動認識を大幅に改善した。
高周波サンプリングレートの多数のセンサを用いることで結果が向上するが、多くの場合、データ非効率性とANNの不要な拡張につながる。
本稿では,HARタスクにおけるデータ効率向上のための実用的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 22:04:40 GMT)
Single-photon scattering in giant-atom waveguide systems with chiral
coupling [5.5] 複数の接続点における1次元導波路に熱力学的に結合した巨大原子の単一光子散乱スペクトルについて検討した。
伝送スペクトルは典型的には非ゼロ最小の反ローレンツ的ラインシェープを持つことを示す。
完全な非相互光子散乱は、内部原子の自然放出と導波路の冷間外崩壊との相互作用によって達成できる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:54:27 GMT)
Disentangled (Un)Controllable Features [5.4] 本稿では,遅延特徴を制御可能かつ制御不能なパーティションに分解できる新しいアプローチを提案する。
本研究では、手続き的に生成された迷路環境の分布において、独立制御可能な潜伏分割における計画アルゴリズムの解釈が可能であることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:20:41 GMT)
Beyond Regrets: Geometric Metrics for Bayesian Optimization [5.3] 一般に、ベイズ最適化の性能は、即時、単純、累積的な後悔といった後悔に基づく指標によって評価される。
我々は4つの新しい幾何学的指標、すなわち精度、リコール、平均等級、平均距離を提案する。
提案手法がベイズ最適化アルゴリズムのより説得力のある解釈と理解を、異なる視点から得ることを実証的に検証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:59:52 GMT)
De-Confusing Pseudo-Labels in Source-Free Domain Adaptation [5.3] ソースフリードメイン適応(SFDA)は、ソースドメインから未ラベルのターゲットドメインに学習した知識を転送することを目的としている。
擬似ラベルのノイズ遷移行列を学習し、各クラスのラベルの破損を捉え、基礎となる真のラベル分布を学習する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:07:11 GMT)
Emulated nuclear spin gyroscope with $^{15}$NV centers in diamond [5.3] 固体プラットフォームの核スピンは、長いコヒーレンス時間のために回転センサーを構築することを約束している。
ここでは、より単純なエネルギー構造と核四極子項の消滅による、ジャイロスコープの構築にNV中心の窒素-15核スピンを用いる。
我々はさらに、NV電子スピンのみを制御することに基づく堅牢なコヒーレンス保護プロトコルを開発し、15倍の遅延時間改善を実現する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:55:39 GMT)
Act as You Learn: Adaptive Decision-Making in Non-Stationary Markov
Decision Processes [5.3] textitAdaptive Monte Carlo Tree Search (ADA-MCTS) という検索アルゴリズムを提案する。
エージェントは時間とともに環境の更新されたダイナミクスを学習し、そのエージェントが学習する時、すなわち、そのエージェントが知識が更新された状態空間の領域にいる場合、悲観的にならないことを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:19:54 GMT)
The Best Time for an Update: Risk-Sensitive Minimization of Age-Based
Metrics [5.2] 送信されたデータ品質を定量化する方法は、情報時代(AoI)、情報検索時代(QAoI)、不正確な情報時代(AoII)である。
我々は,これらのメトリクスを,送信機がプロセスを監視して受信機にステータス更新を送信するポイント・ツー・ポイント無線通信システムとして検討する。
不安定なシステム状態などの合併症を引き起こす高年齢計量値の固有のリスクのため,リスク状態という新しい概念を導入する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:02:40 GMT)
Applications of machine learning and IoT for Outdoor Air Pollution
Monitoring and Prediction: A Systematic Literature Review [5.2] 世界保健機関(WHO)によると、大気汚染は毎年700万人が死亡している。
屋外空気は、低、中、高所得国に影響を及ぼす主要な環境健康問題である。
過去数年間、研究コミュニティは、屋外大気汚染予測のためのIoT対応機械学習アプリケーションを調査してきた。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:36:33 GMT)
VGA: Vision and Graph Fused Attention Network for Rumor Detection [4.9] 本稿では,ポスト間の伝搬構造を利用するために,新しいVGA(Vision and Graph Fused Attention Network)を提案する。
3つのデータセットに対して広範な実験を行い、VGAがマルチモーダルな噂を効果的に検出し、最先端の手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:24:02 GMT)
SpyroPose: SE(3) Pyramids for Object Pose Distribution Estimation [4.8] 本稿では,SE(3)に基づくポーズ分布推定手法を提案する。
階層格子,ピラミッドを用いて,訓練中に効率よく重要度を抽出し,推論時のピラミッドのスパース評価を行う。
提案手法は,SO(3)の最先端手法よりも優れており,その知識を最大限活用するために,SE(3)のポーズ分布推定に関する最初の定量的結果を提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:12:33 GMT)
DiffYOLO: Object Detection for Anti-Noise via YOLO and Diffusion Models [4.8] 本稿では,DiffYOLO と呼ばれる YOLO モデルに適用可能なフレームワークを提案する。
具体的には,拡散確率モデルから特徴写像を抽出し,よく訓練されたモデルを強化する。
その結果、このフレームワークはノイズの多いデータセットのパフォーマンスを証明できるだけでなく、高品質なテストデータセットにおける検出結果も証明できることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:35:35 GMT)
Memory Gym: Towards Endless Tasks to Benchmark Memory Capabilities of
Agents [4.8] Memory GymはMortar Mayhem、Mystery Path、Searing Spotlightsという2D部分的に観測可能な環境のスイートを提供する。
これらの環境は、意思決定エージェントのメモリ能力をベンチマークするために設計されている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:53:35 GMT)
Learning with Noisy Labels by Adaptive Gradient-Based Outlier Removal [4.7] 本稿では,Adaptive GRAdient-based outlier removal を用いて,雑音のあるラベルで学習する新しい手法 AGRAを提案する。
本手法は,サンプルの集合勾配と個々のサンプル勾配を比較して,対応するサンプルがモデルに役立つかどうかを動的に決定する。
いくつかのデータセットに対する広範囲な評価はAGRAの有効性を示している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:47:56 GMT)
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long
Documents [4.7] Jina Embeddings 2は、最大8192トークンを収容できるオープンソースのテキスト埋め込みモデルである。
Jina Embeddings 2は、様々な埋め込み関連タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:26:41 GMT)
Diffusion Model with Perceptual Loss [4.7] 平均二乗誤差損失で訓練された拡散モデルは非現実的なサンプルを生成する傾向がある。
分類者なし指導の有効性は、暗黙的な知覚誘導の一形態である事からもたらされる。
そこで本研究では,より現実的なサンプルを生成可能な拡散モデルを実現するための,新たな自己知覚的目標を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:12:30 GMT)
Validation of Composite Systems by Discrepancy Propagation [4.6] 本稿では,複合システムによる分布差度測定の限界を伝搬するバリデーション手法を提案する。
提案手法は, 種々の現実的効果を示す複合システムに対して有効かつ有用な境界を導出することを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:10:50 GMT)
How to avoid machine learning pitfalls: a guide for academic researchers [4.2] この文書は、機械学習の使用時に発生するよくある誤りを概説している。
もともとは研究学生向けに書かれたもので、学術研究の中で特に問題となる問題に焦点を当てている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:35:30 GMT)
DDN-SLAM: Real-time Dense Dynamic Neural Implicit SLAM with Joint
Semantic Encoding [4.1] DDN-SLAMは動的シーン用に設計されたリアルタイムの高密度ニューラル暗黙のセマンティックSLAMシステムである。
本手法は動的シーンと静的シーンの両方において最先端の手法より優れている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 05:42:17 GMT)
The Brain Tumor Segmentation (BraTS) Challenge 2023: Focus on Pediatrics
(CBTN-CONNECT-DIPGR-ASNR-MICCAI BraTS-PEDs) [4.1] 中枢神経系の小児腫瘍は、小児におけるがん関連死の最も一般的な原因である。
小児の高次グリオーマの生存率は20%未満である。
BraTS-PEDs 2023チャレンジは、小児脳グリオーマのためのボリュームセグメンテーションアルゴリズムの開発に焦点を当てている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:41:04 GMT)
Lower Difficulty and Better Robustness: A Bregman Divergence Perspective
for Adversarial Training [4.1] 本研究では, 対人訓練(AT)において得られる対人強靭性を, 最適化の難しさを軽減して改善することを検討した。
以上の知見にインスパイアされたFAITとMERの2つの手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:00:28 GMT)
Asymmetric mode-pairing quantum key distribution [4.1] モードペアリング量子鍵分布(MP-QKD)は、大域的な位相ロックを必要とせずに、繰り返し無段の速度伝達限界を超えることができる。
MP-QKDは2つのチャネルで同一の通信距離を必要とする。
理想的なパルス強度を計算して鍵レートを向上させるために,様々なシナリオに適応する最適パルス強度法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:06:29 GMT)
On the selection and effectiveness of pseudo-absences for species
distribution modeling with deep learning [3.9] 種分布モデリングは、環境条件と種の発生との関係を理解するための汎用的なツールである。
この制限を克服するため、一般的なアプローチは、負のサンプルとして指定された特定の地理的位置である擬似存在を用いることである。
本稿では,これらの課題を多種ニューラルネットワークのトレーニングに擬似存在を統合することで効果的に対処できることを実証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:06:30 GMT)
Navigating Data Heterogeneity in Federated Learning A Semi-Supervised
Federated Object Detection [3.7] フェデレートラーニング(FL)は、分散データソース間でモデルをトレーニングするための強力なフレームワークとして登場した。
特に自動運転のようなアプリケーションでは、高品質なラベルや、IID以外のクライアントデータに制限がある。
クライアントがラベル付きデータを持っている間、ラベル付きデータがサーバにのみ存在するシナリオ用に設計された、先駆的なSSFODフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:03:58 GMT)
Patterns of Persistence and Diffusibility across World's Languages [3.7] コレキシフィケーション(Colexification)とは、複数の意味を伝えるために単一の語彙形式を用いる類似性の一種である。
我々は,言語間の類似性の言語的原因について,比較と音韻学で明らかにした。
我々は,1,966言語を対象とした意味,系譜,音韻,地理データを組み込んだ大規模グラフを構築した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:05:38 GMT)
Observation of the Magnonic Dicke Superradiant Phase Transition [3.6] テラヘルツとギガヘルツの磁気分光実験により、超ラジカル相転移の符号が明らかになった。
Fe$3+$-Er$3+$交換結合における反磁性項の欠如は、no-go定理が適用されないことを保証している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:31:50 GMT)
Observable adjustments in single-index models for regularized
M-estimators [3.5] サンプルサイズが$n$ と dimension$p$ がともに増加するレジームでは、$hatbeta$ と予測値 $Xhatbeta$ の実証分布の振る舞いが以前特徴づけられた。
本稿では、$hatbeta$と$Xhatbeta$の実証分布を記述するために異なる理論を開発する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:41:14 GMT)
A Comprehensive Study of Object Tracking in Low-Light Environments [3.5] 本稿では,ノイズ,色不均衡,低コントラストが自動物体追跡装置に与える影響について検討する。
本稿では,低照度化と低照度化を両立させて追尾性能を向上させる手法を提案する。
実験結果から,低照度合成データセットを用いてトレーニングしたトラッカーは,バニラMixFormerとSiam R-CNNより優れていた。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:59:14 GMT)
Unsupervised Out-of-Distribution Detection by Restoring Lossy Inputs
with Variational Autoencoder [3.5] OOD検出のための新しいVAEベースのスコアであるError Reduction(ER)を提案する。
ERは、トレーニングセットの損失バージョンを入力として、元のセットをターゲットとして、VAEに基づいています。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:21:35 GMT)
A New Frontier of AI: On-Device AI Training and Personalization [3.5] メモリ効率の高いニューラルネットワークトレーニング技術を提供する軽量オンデバイストレーニングフレームワークNNTrainerを提案する。
評価の結果,NNTrainerはメモリ消費を1/20まで削減し,デバイス上でのインテリジェンスサービスを効果的にパーソナライズできることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:32:44 GMT)
DApps Ecosystems: Mapping the Network Structure of Smart Contract
Interactions [3.5] 分散アプリケーション(dApps)は、従来の集中型システムを破壊する可能性について注目を集めている。
分散化がアーキテクチャ的にどのように実装されているかを示し、共通の開発パターンと異常を識別する。
モジュラーな自己充足型契約と複雑な関数相互作用の網によって特徴付けられる一貫したネットワーク構造を見いだす。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:48:54 GMT)
Periodically Driven Open Quantum Systems: Spectral Properties and
Non-Equilibrium Steady States [3.4] 我々は、コヒーレントな時間周期駆動の存在下でのリンドブラッドマスター方程式について議論する。
Floquet-Lindblad方程式によって記述される任意の物理系は、少なくとも1つの非平衡定常状態を持つ必要があることを証明している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:34:33 GMT)
Attackers reveal their arsenal: An investigation of adversarial techniques in CTI reports [3.3] この研究は、サイバーセキュリティの実践者たちに、敵がサイバー攻撃をどう形成するかを知らせることを目的としている。
我々は,MITRE ATT&CKでカタログ化された594個の対位法を用いている。
我々は、文書化されたテクニックの37.3%を占める19の一般的なテクニックを同定する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:16:40 GMT)
Entanglement structure and information protection in noisy hybrid
quantum circuits [3.3] このレターは、量子ノイズと測定誘起相転移の間の相互作用の深い理解に寄与する。
また、量子計算におけるマルコフノイズと非マルコフノイズの影響を理解するための新しい視点を提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:54:51 GMT)
Open system approach to Neutrino oscillations in a quantum walk
framework [3.1] オープン量子系の観点からニュートリノ振動をシミュレーションする問題について検討する。
還元コイン状態の力学とニュートリノ現象学の関連性を確立する。
また,同じ枠組みにおける異なるフレーバー間の絡み合いの尺度として線形エントロピーの挙動について検討した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:35:26 GMT)
Harnessing Transparent Learning Analytics for Individualized Support
through Auto-detection of Engagement in Face-to-Face Collaborative Learning [3.0] 本稿では,共同作業における学生の個人参加を自動的に検出する透過的アプローチを提案する。
提案手法は,学生の個人的関与を反映し,異なる協調学習課題を持つ生徒を識別する指標として利用することができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:20:28 GMT)
Using AI/ML to Find and Remediate Enterprise Secrets in Code & Document
Sharing Platforms [2.9] 1) AIを活用して、コード内のシークレットを正確に検出し、フラグアップし、人気のあるドキュメント共有プラットフォーム上でフラグアップする。
検出性能に優れた2つのベースラインAIモデルを導入し、コード中のシークレットを更新するための自動メカニズムを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:15:25 GMT)
A Generative AI Assistant to Accelerate Cloud Migration [2.9] Cloud Migration LLMは、移行のパラメータを指定するユーザからの入力を受け入れ、アーキテクチャ図でマイグレーション戦略を出力する。
ユーザ調査によると、移行LLMは、経験の浅いユーザによる適切なクラウド移行プロファイルの発見を支援すると同時に、手作業によるアプローチの複雑さを回避することができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:13:24 GMT)
Model Averaging and Double Machine Learning [2.9] 我々はDDMLに2つの新しいスタック手法を導入する: ショートスタックはクロスフィットのステップを悪用し、プールスタックはクロスフィットのフォールドに対して共通スタックの重みを強制する。
そこで本研究では,DDMLのスタック化は,1つの事前選択学習者に基づく一般的な代替手法よりも,部分的に未知の機能形式に対して堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:38:13 GMT)
Real-Time Human Fall Detection using a Lightweight Pose Estimation
Technique [2.7] ポーズ推定を用いた軽量で高速な人間の転倒検知システムを提案する。
提案手法は, 基本カメラを内蔵した低消費電力デバイス上で, リアルタイムに動作可能である。
すべての計算はローカルで処理できるので、問題のプライバシに問題はない。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:39:58 GMT)
Profiling the carbon footprint of performance bugs [2.7] グリーン情報とコミュニケーション技術は、持続可能な環境に優しい計算分野を生み出すパラダイムである。
本稿では,最近までこれほど深く研究されたことがなかったパフォーマンスバグの問題点について考察する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:15:00 GMT)
SCUNet++: Swin-UNet and CNN Bottleneck Hybrid Architecture with
Multi-Fusion Dense Skip Connection for Pulmonary Embolism CT Image
Segmentation [2.7] 肺塞栓症 (PE) は右室肥大と重症症例の不全につながる肺疾患である。
従来のPE検出は、画像技術の限界により臨床実践における課題を呈する。
SCUNet++ (Swin Conv UNet++) と呼ばれる自動PEセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:14:07 GMT)
Few-shot Image Generation via Information Transfer from the Built
Geodesic Surface [2.6] 構築地表面からの情報伝達法(ITBGS)を提案する。
FAGSモジュールでは、トレーニングデータセットからPre-Shape Spaceにイメージ機能を投影することで、擬似ソースドメインが生成される。
提案手法は,多種多様なセマンティックなデータセットにまたがって,最適な,あるいは同等な結果が得られることを実証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:57:09 GMT)
Intelligent Condition Monitoring of Industrial Plants: An Overview of
Methodologies and Uncertainty Management Strategies [2.6] 本稿では, 産業プラントの知的状態モニタリングと故障検出, 診断方法の概要について述べる。
最もポピュラーで最先端のディープラーニング(DL)と機械学習(ML)アルゴリズムは、産業プラントの状態監視、故障検出、診断のためのアルゴリズムである。
テネシー・イーストマン・プロセス(TEP)を利用したアルゴリズムの精度と仕様の比較を行った。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:35:03 GMT)
Integral fluctuation theorems and trace-preserving map [2.5] 完全正の写像で生成関数を書き換え、積分FTがこれらの写像のトレース保存性によって決定されることを示す。
本稿では、変動散逸定理の一般化の研究に役立つであろうマルチタイムプロセスの関数生成について、簡潔に論じる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:43:17 GMT)
VitalLens: Take A Vital Selfie [2.3] VitalLensは、自撮りビデオからバイタルサインをリアルタイムで推定するアプリだ。
それは、多様なビデオと生理学的センサーデータのデータセットに基づいて訓練されたコンピュータビジョンモデルを使用する。
平均絶対誤差は心拍数推定では0.71 bpm、呼吸速度推定では0.76 bpmである。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:21:03 GMT)
DIRA: Dynamic Domain Incremental Regularised Adaptation [2.2] ディープニューラルネットワーク(DNN)の動的動作領域適応のための動的インクリメンタル正規化適応(DIRA)を導入する。
DIRAは、ターゲットドメインからのサンプルをいくつか使用して再トレーニングする場合、忘れることの問題を改善し、パフォーマンスが大幅に向上する。
本手法は,分布変化に対するロバスト性の評価を目的とした,画像分類ベンチマークの改善を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:13:25 GMT)
SYNTA: A novel approach for deep learning-based image analysis in muscle
histopathology using photo-realistic synthetic data [2.2] 我々は,合成,フォトリアリスティック,高度に複雑なバイオメディカルイメージをトレーニングデータとして生成するための新しいアプローチとして,Synta(synthetic data)を紹介した。
手動のアノテーションを必要とせずに、以前に見つからなかった実世界のデータに対して、堅牢で専門家レベルのセグメンテーションタスクを実行することが可能であることを実証した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:18:44 GMT)
A Transformer-Based Adaptive Semantic Aggregation Method for UAV Visual
Geo-Localization [2.1] 本稿では,無人航空機(UAV)の視覚的ジオローカライゼーションの課題について述べる。
部分レベルの表現は、画像の詳細をキャプチャし、シーンの意味情報を理解するのに役立つため、UAVの視覚的ジオローカライゼーションには、パートマッチングが不可欠である。
画像中の最も代表的な意味論として部品を考慮に入れた変換器に基づく適応的意味的アグリゲーション手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:58:52 GMT)
Representation Learning of Multivariate Time Series using Attention and
Adversarial Training [2.1] 変換器をベースとしたオートエンコーダを提案し, 逆方向のトレーニングスキームを用いて, 人工時系列信号を生成する。
その結果,生成した信号は畳み込みネットワークを用いた場合よりも,模範的データセットとの類似性が高いことがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:32:46 GMT)
Kernel-U-Net: Hierarchical and Symmetrical Framework for Multivariate
Time Series Forecasting [2.0] 近年のU-Netベースの手法は,実世界のデータセットの予測において優れた性能を示した。
本稿では,ネットワークの各層で入力シーケンスをスライスに分割し,カーネルを用いて計算する,対称的で階層的なKernel-U-Netを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:49:51 GMT)
Locally Differentially Private Embedding Models in Distributed Fraud
Prevention Systems [2.0] プライバシの観点から設計され,最近のPETs Prize Challengesで授与された不正防止のための協調的なディープラーニングフレームワークを提案する。
各種トランザクションシーケンスの潜時埋め込み表現とローカル差分プライバシを利用して、外部にホストされた不正や異常検出モデルを安全に通知するデータリリース機構を構築する。
我々は,大規模決済ネットワークが寄贈した2つの分散データセットへのコントリビューションを評価し,他のアプリケーションドメインでの公開作業に類似したユーティリティ・プライバシ・トレードオフとともに,一般的な推論時攻撃に対するロバスト性を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:04:18 GMT)
Synthetic dataset of ID and Travel Document [1.9] 本稿では,SIDTDと呼ばれる,IDおよび旅行用文書の合成データセットを提案する。
SIDTDデータセットは、偽ID文書検出システムのトレーニングと評価を支援するために作成されている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:06:28 GMT)
LinFlo-Net: A two-stage deep learning method to generate simulation
ready meshes of the heart [1.9] 患者画像データから人間の心臓のコンピュータモデルを自動的に生成する深層学習モデルを提案する。
我々のフレームワークはメッシュの自己貫通を最小化するために設計されており、これは通常は小さな距離で分離された表面メッシュを変形する際に発生する。
我々のモデルは、最先端の手法に匹敵する精度を示しながら、自己切断のないメッシュを生成する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:57:42 GMT)
Generalized Quantum Stein's Lemma: Redeeming Second Law of Resource
Theories [1.9] 量子情報理論における基本的な問題は、量子情報処理のリソースの変換可能性を表す類似の第2法則を定式化できるかどうかである。
2008年に有望な定式化が提案され、量子リソース変換性は量子情報処理における他の基本的なタスクの変種を最適な性能で特徴づけられる。
2023年、一般化された量子シュタインの補題の既存の証明に論理的ギャップが発見され、そのような定式化が可能かどうかが再び疑問を投げかけられた。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:00:00 GMT)
Large Language Model Capabilities in Perioperative Risk Prediction and
Prognostication [1.9] GPT-4 Turboは、患者の臨床ノートと手順の説明を用いて、リスク階層化を行い、術後の予後を予測できる。
少ないショットとチェーンのプロンプトによって、いくつかのタスクの予測パフォーマンスが向上する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:41:27 GMT)
Physio: An LLM-Based Physiotherapy Advisor [1.7] 身体リハビリテーションのためのチャットベースのアプリケーションであるPhyloを提示する。
これらの特徴を組み合わせることで、Phyloは生成モデルのパワーを言語処理に活用することができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:42:13 GMT)
Approximating Numerical Flux by Fourier Neural Operators for the
Hyperbolic Conservation Laws [1.7] 提案手法は,従来の手法と比較することにより,数値スキームとFNOの両方の利点を有することを示す。
提案手法は,特に,分布外サンプルの時間的連続予測と一般化能力を有する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:16:25 GMT)
Synthetically enhanced sensitivity using higher-order exceptional point
and coherent perfect absorption [1.7] センサは先進的な装置において重要な役割を担い、その感度を向上させるために絶えず追求されている。
例外点 (EP) として知られる非エルミート系の最近の特異点は、この目標に対して多くの注目を集めている。
2つのイットリウム鉄ガーネット球とマイクロ波キャビティからなる擬エルミタンキャビティマグノニクスシステムを用いて合成強化されたセンサを実現する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:31:18 GMT)
HawkRover: An Autonomous mmWave Vehicular Communication Testbed with
Multi-sensor Fusion and Deep Learning [1.7] 接続された自動走行車(CAV)は、私たちの日常生活を変えるための変革的な技術になっています。
現在、ミリ波(mmWave)バンドは有望なCAV接続ソリューションとして認識されている。
高いデータレートを提供できるが、その実現には、mWave信号の伝搬やモビリティ管理の際の高減衰など、多くの課題に直面している。
本研究は,mmWave信号と他のセンサデータを収集し,車載通信を容易にする自律的かつ低コストなテストベッドを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:38:56 GMT)
Two-Unitary Complex Hadamard Matrices of Order $36$ [1.4] 特定の行列から派生した2単位の複素アダマール行列(CHM)の族が36ドルの大きさで構成されている。
この軌道のすべての行列は部分転位と再シャッフルの操作の後に一元的に残る。
これはオイラー問題の量子版に対する新しい解を提供し、グラエコ・ラテン四角形6のそれぞれの体は36ドルの士官の対称重ね合わせを含む。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:10:00 GMT)
Learning Keypoints for Robotic Cloth Manipulation using Synthetic Data [1.3] ほぼ平らな布品にキーポイント検出器を訓練するための合成データパイプラインを提案する。
我々はTシャツ、タオル、ショートパンツの両方の検出器を訓練し、平均精度は64.3%である。
実世界のデータの微調整により、パフォーマンスは74.2%向上した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:16:38 GMT)
Quantum state engineering by steering in the presence of errors [1.3] 計測に基づく状態工学プロトコルのクラスについて検討する。
このプロトコルは, システム-検出器結合パラメータの誤った選択に対して, 完全に堅牢であることを示す。
また、古典的な期待値と、乗法的白色雑音を持つハミルトン指数の時間順序作用素との可換性を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:14:53 GMT)
SIGNeRF: Scene Integrated Generation for Neural Radiance Fields [1.2] 高速かつ制御可能なNeRFシーン編集とシーン統合オブジェクト生成のための新しいアプローチを提案する。
新しい生成的更新戦略により、反復的な最適化を必要とせずに、編集された画像全体の3D一貫性が保証される。
画像拡散モデルの奥行き条件付け機構を利用して,編集の空間的位置を細かく制御する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:46:43 GMT)
AIGCBench: Comprehensive Evaluation of Image-to-Video Content Generated
by AI [1.1] 本稿では,様々なビデオ生成タスクを評価するために設計された,包括的でスケーラブルなベンチマークであるAIGCBenchを紹介する。
等価条件下で異なる最先端アルゴリズムを評価する可変かつオープンドメインの画像テキストデータセットを使用する。
我々は、リッチテキストプロンプトを作成するために、新しいテキストコンバインダーとGPT-4を使用し、高度なテキスト・ツー・イメージモデルを用いて画像を生成する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 10:08:40 GMT)
Simulating Field Theories with Quantum Computers [1.0] 我々は,様々な量子処理ユニットで発生する誤りの原因を特定し,計算の規模を拡大する上での課題について議論する。
本稿では,様々なプラットフォーム上で得られたベンチマーク結果と,コヒーレントかつ非コヒーレントなノイズに対処するための様々な誤差軽減手法を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 20:07:31 GMT)
Understanding engagement with platform safety technology for reducing
exposure to online harms [1.0] オンライン被害の経験は広く、回答者の67%がオンラインの有害コンテンツだと認識している。
安全技術の利用は高く、80%以上の人が少なくとも1つを使っている。
以前はオンラインの害を目の当たりにしていた人々は、安全ツールを使う傾向が高く、エンゲージメントへの"難しい方法を学ぶ"道のりを示唆している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:50:43 GMT)
Natural Language Processing and Multimodal Stock Price Prediction [0.9] 本稿では,従来の生通貨価値の活用とは対照的に,株価変動をトレーニングデータとして活用する。
パーセンテージの変化の選択は、価格変動の重要性に関する文脈をモデルに提供することを目的としている。
この研究は、株価トレンドを予測するために、特別なBERT自然言語処理モデルを用いている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:21:30 GMT)
What's the Magic Word? A Control Theory of LLM Prompting [0.8] 出力トークン列の到達可能な集合である$R_y(mathbf x_0)$について検討する。
正しい次のWikitextトークンのシークエンス$mathbf x_0$は、$kleq 10$トークンのプロンプトで97%以上到達可能である。
また、LLM自体が見積もっているように、上位75のトークンは少なくとも85%の時間で、$kleq 10$トークンのプロンプトで到達可能であることも確認しています。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:38:36 GMT)
Incremental FastPitch: Chunk-based High Quality Text to Speech [0.7] Incrmental FastPitchは高品質なメルチャンクをインクリメンタルに生成できる新しいFastPitch変種である。
実験の結果,提案手法は並列FastPitchに匹敵する音声品質が得られることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:17:35 GMT)
A Latent Dirichlet Allocation (LDA) Semantic Text Analytics Approach to
Explore Topical Features in Charity Crowdfunding Campaigns [0.6] 本研究では、LDA(Latent Dirichlet Allocation)を用いて、チャリティキャンペーンのテキスト記述から潜在テーマを抽出する、革新的テキスト分析フレームワークを提案する。
この研究は4つの異なるテーマを探求し、それぞれ2つのキャンペーンとインセンティブの説明を行った。
この研究はランダムフォレストを用いて、主題的パラメータと数値的パラメータの両方を用いてキャンペーンの成功を予測することに成功した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:17:46 GMT)
Concurrent Brainstorming & Hypothesis Satisfying: An Iterative Framework
for Enhanced Retrieval-Augmented Generation (R2CBR3H-SR) [0.5] 本研究では,革新的かつ反復的な検索拡張生成システムを提案する。
本手法は,ベクトル空間駆動型再分類機構と同時ブレーンストーミングを統合し,関連性の高い文書の検索を高速化する。
本研究は、知識集約型アプリケーションにおける資源効率の高い情報抽出と抽象化のための新しいベンチマークを定め、知的検索システムにおける最先端を推し進めるものである。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:01:44 GMT)
Predicting challenge moments from students' discourse: A comparison of
GPT-4 to two traditional natural language processing approaches [0.4] 本研究では,3つの異なる自然言語処理モデルを活用する可能性について検討する。
専門知識ルールベースモデル,教師付き機械学習モデル,言語モデル(LLM)について検討した。
その結果,教師付きMLとLLMのアプローチは両タスクとも良好に動作したことがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:54:30 GMT)
On super quantum discord for high-dimensional bipartite state [0.4] 我々は、高次元の2部量子状態に対して、位相減衰チャネルの有無にかかわらず、超量子不一致の効果的な境界を与える。
スーパーバージョンは常に2次元の場合のように通常の量子不協和よりも大きいことが分かる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:13:08 GMT)
Shadow Blade: A tool to interact with attack vectors [0.3] 本稿では,攻撃ベクトルとの対話を支援するツールであるShadow Bladeを提案する。
HackTheBoxはオンラインのサイバーセキュリティ訓練プラットホームで、プロが仮想マシンを探索するための安全でコントロールされた環境を提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:56:17 GMT)
Prediction of good reaction coordinates and future evolution of MD
trajectories using Regularized Sparse Autoencoders: A novel deep learning
approach [0.3] 我々は、エネルギーベースモデルである正規化スパースオートエンコーダを用いて、重要な反応座標のセットを発見した。
反応座標の発見とともに、我々のモデルは分子動力学(MD)軌道の進化を予測する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:38:09 GMT)
CardiGraphormer: Unveiling the Power of Self-Supervised Learning in
Revolutionizing Drug Discovery [0.3] CardiGraphormer は Graphormer と Cardinality Preserving Attention の新たな組み合わせである。
SSLは強力な分子表現を学習し、GNNを用いて分子指紋を抽出する。
CardiGraphormerの薬物発見と薬物相互作用への応用は、非常に大きい。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:43:35 GMT)
Local Adaptive Clustering Based Image Matching for Automatic Visual
Identification [0.3] 本稿では,リアルタイム自動機器ラベル付けを実装した視覚支援型識別システムを提案する。
システムはORBアルゴリズムをデプロイし、画像の特徴を抽出し、GMSアルゴリズムで不正確なマッチング点を除去する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:54:31 GMT)
Quantum Carleman Linearization of the Lattice Boltzmann Equation with
Boundary Conditions [0.3] 格子ボルツマン法(LBM)は流体流動をシミュレーションする効率的なアルゴリズムとして広く認識されている。
Bhatnagar Gross と Krook 平衡関数を用いて、格子ボルツマン方程式の量子カールマン線形化の定式化を記述する。
提案アルゴリズムの精度は, 矩形プリズムを過ぎる流れをシミュレートし, 流体流速と一致させることによって実証される。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:09:58 GMT)
Vietnamese Poem Generation & The Prospect Of Cross-Language Poem-To-Poem
Translation [0.0] 本研究では,大規模言語モデルを用いて,自然言語のプロンプトからベトナム語の詩を生成することを提案する。
GPT-3のバベッジ版は、ベトナム詩の「ルーク・バット」ジャンルに特化して0.8のカスタム評価スコアを達成している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:54:14 GMT)
Twirling Operations to Produce Energy Eigenstates of a Hamiltonian by
Classically Emulated Quantum Simulation [0.0] 離散固有値を持つハミルトニアンのエネルギー固有状態を生成するための簡単な手順を提案する。
我々は、エネルギー固有状態と他のエネルギー固有状態とを分離するために、アンシラ量子ビットと量子エンタングルメントを用いる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:46:09 GMT)
Towards a Foundation Purchasing Model: Pretrained Generative
Autoregression on Transaction Sequences [0.0] 本稿では,金融取引の文脈的埋め込みを得るための生成事前学習手法を提案する。
さらに,510億の取引を含む180の発行銀行のデータコーパスを用いて,埋め込みモデルの大規模事前学習を行う。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:32:48 GMT)
The Gauge Picture of Quantum Dynamics [0.0] 局所性は、波動関数振幅が局所運動方程式に従わないという意味で、シュル「オーディンガー」(Schr"odinger) 図において明らかでない。
局所性は、量子力学の大域的ユニタリ不変性を局所ゲージ不変量に"ゲージ"することにより、運動方程式において明示的に達成できることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:20:23 GMT)
The Art of Deception: Robust Backdoor Attack using Dynamic Stacking of
Triggers [0.0] 近年の研究では、聴覚バックドアが特定の変更を開始メカニズムとして用いる可能性があることが判明している。
DynamicTriggerは動的バックドアアタックを実行するための方法論として紹介されている。
動的音源トリガーによる変動信号のサンプリング率と話者の身元をマスキングすることにより、音声認識システムを欺くことができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:31:59 GMT)
Task and Explanation Network [0.0] 私たちは、AIはタスクだけでなく、なぜそのタスクが達成されたのかを説明した上で、タスクをしなければならないと論じています。
本稿では,タスク補完と説明を完全に統合した,タスク・アンド・説明ネットワーク(TENet)の基本フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:11:59 GMT)
Tale of Tilted Washboards of Potential Energy [0.0] 汚れた洗面板電位はポテンシャルエネルギーの周期関数であり、そのグラフは衣服を洗うための傾斜した洗面板のプロファイルを思い出させる。
古典力学、量子物理学、光学における洗面板ポテンシャルの事例を考察する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:18:18 GMT)
Superselection-Resolved Entanglement in Lattice Gauge Theories: A Tensor
Network Approach [0.0] 本稿では,LGTシステムにおける超選択解絡の挙動について検討する。
スーパーセレクション解決エンタングルメントの先頭項は、パーティションのコーナー数、すなわちコーナー法エンタングルメントに依存する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:03:04 GMT)
Spectral determinant of the two-photon quantum Rabi model [0.0] 陳らによって2012年に提案されたG関数のみが、崩壊点へのアプローチを指示する明確な極構造を示すことを示す。
この関数はモデルの$mathbbZ_4$対称性を厳密に用い、その零点が完全正則スペクトルに対応することを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:55:59 GMT)
Sparse Quantum State Preparation for Strongly Correlated Systems [0.0] 原理として、指数関数的にスケールする多電子波関数を線形にスケールする量子ビットレジスタに符号化することは、従来の量子化学法の限界を克服するための有望な解決策を提供する。
基底状態量子アルゴリズムが実用的であるためには、量子ビットの初期化が要求される基底状態の高品質な近似に必須である。
量子状態準備(QSP)は、古典的な計算から得られる近似固有状態の生成を可能にするが、量子情報のオラクルとして頻繁に扱われる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:34:27 GMT)
Single-shot characterization of photon indistinguishability with
dielectric metasurfaces [0.0] 光子の区別不可能性を特徴づけることは、量子フォトニクスにおいて重要な課題である。
我々は、再構成可能な要素を使わずに、静的な誘電体準曲面格子を開発する。
我々は、98.4%以上の忠実度を持つ時間領域における光子の識別不可能性を実験的に定量化した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:18:48 GMT)
Semisupervised Anomaly Detection using Support Vector Regression with
Quantum Kernel [0.0] 異常検出(AD)は、他のデータから何らかの方法で逸脱する観測や事象を特定することである。
本稿では,量子カーネルによる支持ベクトル回帰(SVR)の再構成損失に基づく半教師付きADへのアプローチを提案する。
量子カーネルを用いたSVRモデルは、RBFカーネルや他のすべてのモデルよりも優れた性能を示し、全てのデータセットに対して最高平均AUCを達成する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:26:44 GMT)
Sample-efficient estimation of entanglement entropy through supervised
learning [0.0] 我々は,ネットワーク推定の不確実性の推定に特に焦点をあてた。
基準線法が正しい推定値を与えるのに失敗するサンプルサイズ体制における収束を観察する。
量子シミュレーション実験において,本手法のさらなる応用として,非単体進化のための量子相互情報を推定する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:12:51 GMT)
Relativistically invariant encoding of quantum information revisited [0.0] 任意のローレンツ変換に対して不変な量子情報の符号化に関する問題を詳細に解析する。
いわゆるペアワイズヘリシティを利用する不変符号化のための新しいスキームを提案する。
また, 一定運動量を持つ状態に基づいて, 通常の大質量粒子と無質量粒子の新しいスキームを導入する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:29:21 GMT)
Relational Quantum Mechanics with Cross-Perspective Links Postulate: an
Internally Inconsistent Scheme [0.0] クロスパースペクティブリンクと呼ばれる新たなRQM修正の文脈における相対的事実の状況について論じる。
クロスパースペクティブリンク公理を持つRQMは内部的に矛盾しない隠れ変数理論であることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:47:19 GMT)
Ravnest: Decentralized Asynchronous Training on Heterogeneous Devices [0.0] Ravnestは、計算ノードをクラスタに効率的に整理することで、分散トレーニングを促進する。
遅延更新を伴うブロック構造最適化問題として,非同期SGD損失関数のフレーム化を行った。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:07:07 GMT)
Randomized SearchRank: A Semiclassical Approach to a Quantum Search
Engine [0.0] 量子検索Rankアルゴリズムは、PageRank量子化に基づく将来の量子検索エンジンにとって有望なツールである。
本稿では,基礎となるSzegedy量子ウォークを半古典的なウォークに置き換えたアルゴリズムの修正を提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:00:23 GMT)
Question-Answering Based Summarization of Electronic Health Records
using Retrieval Augmented Generation [0.0] 本稿では,セマンティック検索,検索拡張生成,質問応答を組み合わせることで,欠点を軽減できる手法を提案する。
我々のアプローチは非常に効率的で、訓練は最小限から不要であり、LLMの「幻覚」問題に苦しむことはない。
要約には繰り返しの内容はなく、特定の質問に対する多様な回答があるため、多様性を保証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:09:34 GMT)
Predicting Angular-Momentum Waves Based on Yang-Mills Equations [0.0] ヤン・ミルズ(YM)理論はマクスウェルの方程式を電磁界を統一するものである。
角-運動量波は、スピン角運動量の振動によって実験で実現されることが望まれる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 01:38:22 GMT)
Post-hoc evaluation of nodes influence in information cascades: the case
of coordinated accounts [0.0] 協調的Inhautentic Behaviour(CIB)は、オンライン談話を活用するための戦術として登場した。
有向木におけるノードのサブセットの影響を評価するための一般的なフレームワークを定義することにより、CIB戦術の有効性を定量化する。
我々は、最適かつ欲求的なポストホック配置戦略を提供する2つのアルゴリズムを設計し、構成の影響を最大化する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:40:46 GMT)
Physical Reservoir Computing Enabled by Solitary Waves and
Biologically-Inspired Nonlinear Transformation of Input Data [0.0] Reservoir Computing (RC) システムはランダム接続を持つ人工ニューラルネットワークの非線形力学特性を用いてカオス時系列を効率的に予測することができる。
本稿では,生体内脳内の非線形過程に着想を得て,入力データの非線形変換にランダム性の影響を代用する物理RCシステムについて実験的に検証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:22:36 GMT)
Performance Evaluation of GPS Trajectory Rasterization Methods [0.0] GPSトラジェクトリは、交通密度の検出、トランスポートモードの検出、マッピングデータに使用される重要なデータソースである。
データサイズが大きくなる一方、この種のデータの効率的な表現は、これらの手法での使用が困難になっている。
本研究では,QGIS,PostGIS+QGISの空間結合関数と,Pythonプログラム言語で符号化された構造化グリッド実装を用いてGPSデータの軌跡化を評価する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 11:25:11 GMT)
OriCon3D: Effective 3D Object Detection using Orientation and Confidence [0.0] 1つの画像から3次元物体を検出するための高度な手法を提案する。
我々は、深層畳み込みニューラルネットワークに基づく3Dオブジェクト重み付け指向回帰パラダイムを用いる。
提案手法は, 3次元オブジェクトのポーズ決定の精度を大幅に向上し, ベースライン法を超越した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:34:30 GMT)
On the hierarchical Bayesian modelling of frequency response functions [0.0] 階層的ベイズモデルは、人口(または親)とドメインレベルの統計分布を同時に学習する。
パラメータ推定値、特にデータが制限されている場合、分散は減少する。
モデリングのアプローチは従来のSHMの文脈でも示されており、単一のヘリコプターブレードが様々な温度で露出している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:38:27 GMT)
On the Expressive Power of Graph Neural Networks [0.0] グラフニューラルネットワーク(GNN)は、社会科学、化学、医学といった分野における様々なタスクを解くことができる。
ディープラーニングをグラフ構造化データに拡張することにより、GNNは、社会科学、化学、医学といった分野におけるさまざまなタスクを解決できる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:54:56 GMT)
Measurement sharpness and disturbance tradeoff [0.0] 与えられた測定に対する測定後の状態はユニークではなく、選択された測定モデルに大きく依存している。
本測定のシャープネスと, 前向きおよび後向き状態空間の平均忠実度との間には,異なるトレードオフ関係があることが示されている。
特に, この測定のシャープネスと, 測定前および測定後状態空間の平均忠実度との間には, 異なるトレードオフ関係があることが示されている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:30:00 GMT)
Mean-Field Assisted Deep Boltzmann Learning with Probabilistic Computers [0.0] 深部および非制限のボルツマンマシンは、毎秒数十億のマルコフチェインモンテカルロサンプルを生成するpコンピュータを用いて訓練可能であることを示す。
pコンピュータアーキテクチャの独自のFPGAエミュレーションでは、毎秒最大45億フリップがかかる。
我々のアルゴリズムは、他のスケーラブルなIsingマシンで使用することができ、その変種は、以前は難易度と思われていたBMの訓練に使用することができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 22:19:57 GMT)
Lattice Boltzmann-Carleman quantum algorithm and circuit for fluid flows
at moderate Reynolds number [0.0] 本稿では,Lattice Boltzmann (LB) 法のカールマン線形化に基づく流体流れの量子計算アルゴリズムを提案する。
少なくとも10から100の中間レイノルズ数に対して、カールマン-LB法は2次に切り替わることに成功した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:26:25 GMT)
LLM-SAP: Large Language Model Situational Awareness Based Planning [0.0] この研究は、大規模言語モデルにおける状況認識に基づく創発的計画能力の評価の先駆者である。
i) 標準化された評価のための新しいベンチマークとメトリクス、(ii) 進捗を加速するためのユニークなデータセット、(iii) 状況に敏感な計画タスクにおいて計画性能を著しく向上させるマルチエージェントスキームの実証に寄与する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:13:50 GMT)
Iterative Mask Filling: An Effective Text Augmentation Method Using
Masked Language Modeling [0.0] 本稿では,変換器を用いたBERTモデルのフィル・マスク機能を利用した新しいテキスト拡張手法を提案する。
本手法では,文中の単語を反復的にマスキングし,言語モデル予測に置き換える。
実験の結果,提案手法は,特にトピック分類データセットにおいて,性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:47:13 GMT)
Investigating Semi-Supervised Learning Algorithms in Text Datasets [0.0] 大きなトレーニングデータセットを使用することで、ニューラルネットワークの一般化能力が向上する。
半教師付き学習(SSL)は、ラベル付きデータが少なく、ラベルなしデータが多い場合に有用である。
本研究では、自己学習、協調学習、三者学習、不一致を伴う三者学習など、拡張を必要としないSSLアルゴリズムを比較した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 17:22:48 GMT)
Intersystem Bell-like States in Classical Polarization Optics [0.0] CHSH-ベル不等式の導出は古典偏光光学の枠組みの中でスケッチされる。
古典国家はこの不平等を犯している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:33:54 GMT)
Interferometry of non-Abelian band singularities and Euler class
topology [0.0] 我々は超低温原子系の非アベリアブレイディング過程と電荷を実験的に探究した。
我々は、運動量空間のある角度でバンド特異点を通って原子を移動させることによって生成できる2つのバンドのコヒーレント重ね合わせを考える。
本研究は,バンドノードの非アベリア電荷を計測し,直接編曲方法の実験的検証を行うための有効な方法である。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:00:01 GMT)
Improved uncertainty quantification for neural networks with Bayesian
last layer [0.0] 不確実性定量化は機械学習において重要な課題である。
本稿では,BLL を用いた NN の対数乗算可能性の再構成を行い,バックプロパゲーションを用いた効率的なトレーニングを実現する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:40:07 GMT)
High-degree magnon blockade with large single-excitation probability [0.0] 量子ビットが交換相互作用を介して$N$ Magnonsに強く結合されるハイブリッドシステムを考える。
高緯度の封鎖以上のことで、単一マグノン状態でかなりの人口を発生させることができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 07:52:16 GMT)
Hierarchical Clustering in ${\Lambda}$CDM Cosmologies via Persistence
Energy [0.0] 我々は、トポロジカルデータ分析による高度な手法を用いて、宇宙ウェブの構造的進化を考察する。
我々のアプローチは、最近の文献から得られた革新的な手法である$Persistence$$Signals$を活用することで、永続化ダイアグラムをベクトル空間に埋め込むのに役立つ。
中心的な発見は、$Persistence$$Energy$とredshift値の相関であり、永続的ホモロジーと宇宙の進化を結び付け、宇宙構造のダイナミクスに関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:36:57 GMT)
Harnessing Artificial Intelligence for Sustainable Agricultural
Development in Africa: Opportunities, Challenges, and Impact [0.0] この研究は、農業におけるAI応用の動的な景観をナビゲートする。
精密農業, 作物モニタリング, 温暖化対策などの機会について検討した。
倫理的考察や政策への影響についても論じる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 23:02:13 GMT)
Generation of complete graph states in a spin-$1/2$ Heisenberg chain
with a globally optimized magnetic field [0.0] 我々は,時間変化磁場を受けるスピン$1/2$ハイゼンベルク$XX$鎖を用いて,多粒子完全グラフ状態を生成する方法を提案する。
我々のスキームは、量子最適制御理論によって促進されるリアルタイム磁場形成と、原子間の最も近い隣り合う相互作用にのみ依存する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:32:35 GMT)
Generalist embedding models are better at short-context clinical
semantic search than specialized embedding models [0.0] ICD-10-CMのコード記述と容易に再現可能な言い換えに基づくデータセットを構築する。
セマンティックサーチタスクにおいて、ジェネラリストまたは臨床領域専門の既存の埋め込みモデルをベンチマークした。
その結果、ジェネラリストモデルは臨床モデルよりも優れており、既存の臨床特化モデルは、それらを混乱させる入力の小さな変化に対してより敏感であることが示唆された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:03:32 GMT)
Fairness Certification for Natural Language Processing and Large
Language Models [0.0] 我々はNLPアプローチの公平性認定に向けた定性的な研究アプローチに従う。
我々は、NLPの6つのフェアネス基準を体系的に考案し、さらに18のサブカテゴリに洗練することができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:17:53 GMT)
Fading memory as inductive bias in residual recurrent networks [0.0] 我々は,リアプノフ指数を適切に定義した残差接続が生じる弱結合残差リカレントネットワーク(WCRNN)を導入する。
ネットワーク表現性の向上をもたらす効果的な帰納バイアスが生じることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:38:02 GMT)
Exploring the Frontiers of LLMs in Psychological Applications: A
Comprehensive Review [0.0] 本稿では,心理学的応用における大規模言語モデル(LLM)のフロンティアについて考察する。
認知・行動学、臨床・カウンセリング、教育・発達学、社会・文化心理学など、心理学の様々な分野におけるLLMの影響について論じる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 03:01:29 GMT)
Exploring Many-body Interactions Through Quantum Fisher Information [0.0] ハミルトニアンが複数の粒子を同時に結合すると、より高速な絡み合い生成、マルチビットゲートの実装、エラー修正の改善につながる。
本研究では,適切な境界の違反を観測することにより,ハミルトニアンに対する多体結合を検出する可能性を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:40:46 GMT)
Evidence-based certification of quantum dimensions [0.0] 離散変数と連続変数の両方に対する一般的な次元認証プロトコルを導入する。
我々は、状態の有効次元を、後続確率が前よりも大きいような最小の次元とみなす。
スペクトル時間および偏光度測定による実験データを用いて、得られた有効次元に対してベイズ的可算誤差バーを正しく割り当てる方法について実証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 06:28:13 GMT)
Entanglement and confinement in lattice gauge theory tensor networks [0.0] 熱力学限界と連続体の両方において、体積の長距離挙動が絡み合い領域の法則を生じさせることを示す。
レニー・エンタングルメント・エントロピーは、他の真の(非局所的な)可観測物と比較して、閉じ込めや分解特性の完全なプローブとして資格がないと論じられている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:00:01 GMT)
Efficient selective attention LSTM for well log curve synthesis [0.0] 本稿では,既存のデータを用いて不足データの予測を行う機械学習手法を提案する。
提案手法は,従来のLong Short-Term Memory(LSTM)ニューラルネットワークに自己注意機構を組み込むことで構築する。
実験により,提案手法は従来の曲線合成法と比較して精度が高いことを示した。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:51:27 GMT)
Efficient Computation of Confidence Sets Using Classification on
Equidistributed Grids [0.0] 経済モデルはモーメント不等式を生成し、真のパラメータのテストを作成するのに使用できる。
真のパラメータの信頼集合(CS)はこれらのテストの反転によって導かれる。
彼らはしばしば解析的な表現を欠き、CSを数値的に取得するためにグリッド探索を必要とする。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:04:14 GMT)
EQ-Bench: An Emotional Intelligence Benchmark for Large Language Models [0.0] EQ-Benchは,Large Language Models(LLMs)における感情知性の側面を評価するために設計された,新しいベンチマークである。
対話における文字の感情状態の強さを予測することによって,複雑な感情を理解するLLMの能力を評価する。
本ベンチマークでは,60問の英語質問を用いて,高い反復性を示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:20:35 GMT)
Does the Hamiltonian determine the tensor product structure and the 3d
space? [0.0] ヒルベルト空間のテンソル積構造がハミルトニアンスペクトルによって一意に決定されることが提案された。
3つ以上の立方体に対して、そのような手法は無限に多くのテンソル積構造を導くことができる。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:49:52 GMT)
Dichroic cavity mode splitting and lifetimes from interactions with a
ferromagnetic metal [0.0] 電磁キャビティの円偏極モードに及ぼす強磁性金属(FM)の影響について検討した。
時間反転対称性の破れがキャビティモードの双対応答に繋がることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:00:01 GMT)
Diabetic Retinopathy Using Gaussian Filter [0.0] 本研究の目的は, 深層学習モデルを用いて糖尿病網膜症の診断過程を改善することである。
最高のパフォーマンスモデルはインセプションV3で、ガウス画像の精度は96%だった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 12:52:42 GMT)
Defining classical and quantum chaos through adiabatic transformations [0.0] 本稿では, 量子システムと古典システムの両方におけるカオスを, 断熱変換を用いて等価に定義する形式主義を提案する。
この複雑性は(適切に正規化された)忠実度感受性によって定量化される。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:00:00 GMT)
Deep learning the Hurst parameter of linear fractional processes and
assessing its reliability [0.0] この研究は、分数的ブラウン運動(fBm)、分数的オルンシュタイン-ウレンベック過程(fOU)、線形分数的安定運動(lfsm)の3種類のプロセスに焦点を当てている。
この作業では、fBmとfOUのための広範なデータセットを高速に生成し、LSTMネットワークを大量のデータを実行可能な時間でトレーニングする。
LSTMはfBm法やfOU法では従来の統計手法よりも優れているが、lfsm法では精度が限られている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 15:42:45 GMT)
Data protection psychology using game theory [0.0] この研究は、個人がデータ保護の実践をどのように認識し、相互作用するかを研究することを目的としている。
この研究は、個人の意識とデータ保護対策の理解に影響を与える心理的要因を研究するためのゲーム理論的アプローチを採用している。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 13:07:30 GMT)
DDPM based X-ray Image Synthesizer [0.0] 本稿では, 拡散確率モデル(DDPM)とUNetアーキテクチャを組み合わせたX線画像合成手法を提案する。
本手法では,Kaggleから得られた3000以上の肺炎X線画像を用いて訓練を行った。
その結果, 平均二乗誤差(MSE)が低い実写画像の生成に成功し, 提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:35:58 GMT)
Chemical Reaction Dynamics under Vibrational Strong Coupling [0.0] 光学キャビティ内の化学反応のダイナミクスをシミュレートするために,古典的,半古典的,量子力学的手法を用いる。
最近の実験では、エネルギーの外部入力を伴わない反応速度と平衡定数の顕著な変化が観察されている。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 16:32:23 GMT)
Can optimal collective measurements outperform individual measurements
for non-orthogonal QKD signals? [0.0] 最適量子測度の理論が、受信側で利用可能な最大情報をどのように決定するかを考える。
演算子代数に基づくフレームワークと特異値分解から得られる一般結果を用いる。
我々は、最適なフォン・ノイマン測度が一意に定義され、POVMよりも高い情報ゲインを提供すると結論付けた。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 08:34:55 GMT)
Can increasing the size and flexibility of a molecule reduce
decoherence? [0.0] プロジェナルアナログにおける炭素骨格の拡張は脱コヒーレンスを遅くし、電荷移動の期間を延長する。
分子のイオン化によって生じる電子状態のコヒーレント重ね合わせは、電子密度の超高速なダイナミクスを引き起こす。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 22:46:40 GMT)
Can We Generate Realistic Hands Only Using Convolution? [0.0] 画像生成モデルは、人間の手や指にあるような複雑な幾何学的特徴を再現できません。
本稿では,この問題を幾何的能力の畳み込み層を拡大することにより緩和する方法について述べる。
GANと変分オートエンコーダ(VAE)が生成する手・顔画像の品質を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 19:27:20 GMT)
Automation of Smart Homes with Multiple Rule Sources [0.0] 様々なソースからルールを管理するには、構造化された手続き、関連する方針、指定された権限が必要である。
提案手法とシステム実装では,ルール管理プロセス,ルール管理者,ドメイン固有のルール言語を導入している。
このシステムは、住民を観察し、行動パターンを検出し、システムへの推奨として提示されるルールを導出する学習プロセスを提供する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 14:40:05 GMT)
Architectural Design for Secure Smart Contract Development [0.0] ブロックチェーンインフラストラクチャに対するいくつかの攻撃により、数百万ドルが失われ、機密情報が漏洩した。
一般的なソフトウェア脆弱性とブロックチェーンインフラストラクチャに対する攻撃を特定します。
スマートコントラクトを活用した将来のシステムにおいて,より強力なセキュリティ標準を保証するためのモデルを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 18:59:17 GMT)
AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed
and Low Tolerance [0.0] Per-IMage Overlap(PIMO)は、AUROCとAUPROの欠点に対処する新しいメトリクスである。
画像ごとのリコールの測定は、計算を単純化し、ノイズの多いアノテーションに対してより堅牢である。
実験の結果,PIMOは実用的優位性があり,性能の見識に乏しいことがわかった。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 21:24:44 GMT)
AIRI: Predicting Retention Indices and their Uncertainties using
Artificial Intelligence [0.0] 我々は、標準セミポーラカラムの構造からRI値を予測するためのディープニューラルネットワークの利用について検討する。
ネットワークの精度のため、NIST EI-MSスペクトルライブラリのRI値を予測するために使用された。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 02:22:39 GMT)
A systematic study of the role of dissipative environment in regulating
entanglement and exciton delocalization in the Fenna-Matthews-Olson complex [0.0] 自然光ハーベストティングシステムFenna-Matthews-Olsonにおける大域的絡み合いとコヒーレンス長のダイナミクスについて検討する。
絡み合いは、主にシステムと環境間の相互作用の強さによって引き起こされる。
コヒーレンス長は非マルコビアン性に敏感でない。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:10:22 GMT)
A long-distance quantum-capable internet testbed [0.0] 我々は,量子メモリ間の量子通信に,ソフトウェア定義と時間知覚ネットワークの原則を併用した,量子可能なインターネットプロトタイプの実装を提案する。
距離158kmで分離した2つの独立量子メモリで生成したテレコム光子の高可視性Hong-Ou-Mandel干渉による基本長距離量子ネットワークサービスを実証する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 04:25:55 GMT)
A Review of Findings from Neuroscience and Cognitive Psychology as
Possible Inspiration for the Path to Artificial General Intelligence [0.0] 本論は,神経科学と認知心理学の手法を検討することによって,人工知能の探求に貢献することを目的とする。
深層学習モデルによって達成された印象的な進歩にもかかわらず、抽象的推論と因果的理解にはまだ欠点がある。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:46:36 GMT)
A First Look at Information Highlighting in Stack Overflow Answers [0.0] ニューラルネットワークアーキテクチャを用いてハイライトコンテンツを自動的に推奨する手法を開発した。
推薦モデルのトレーニングには、フォーマットの種類毎にCNNとBERTモデルを選択します。
自動コードコンテンツハイライトのためのトレーニングされたモデルは、0.73のリコールとF1スコアの0.71を達成し、他のフォーマットのトレーニングされたモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 00:13:52 GMT)
A Cybersecurity Risk Analysis Framework for Systems with Artificial
Intelligence Components [0.0] 欧州連合人工知能法、NIST人工知能リスク管理フレームワーク、および関連する規範の導入は、人工知能コンポーネントを持つシステムを評価するために、新しいリスク分析アプローチをよりよく理解し実装することを要求する。
本稿では,このようなシステムの評価を支援するサイバーセキュリティリスク分析フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 3 Jan 2024 09:06:39 GMT)