MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct [148.4] 我々は,新しいマルチモーダル命令データ進化フレームワークであるMMEvolを提案する。
MMEvolは、きめ細かい知覚、認知的推論、相互作用の進化の洗練された組み合わせによって、データ品質を反復的に改善する。
提案手法は,9つのタスクにおいて,最先端モデルに比べて有意に少ない精度でSOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:32:08 GMT)
Large Language Model Based Generative Error Correction: A Challenge and Baselines forSpeech Recognition, Speaker Tagging, and Emotion Recognition [110.8] 生成音声の書き起こし誤り訂正(GenSEC)の課題について紹介する。
この課題は、(i)ASR後の転写補正、(ii)話者タグ付け、(iii)感情認識という、3つのASR後の言語モデリングタスクを含む。
本稿では,ベースライン評価から得られた知見と,今後の評価設計における教訓について論じる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:32:49 GMT)
Sarah Frank-Wolfe: Methods for Constrained Optimization with Best Rates and Practical Features [65.6] Frank-Wolfe (FW) 法は、構造化制約による最適化問題の解法として一般的な手法である。
有限サム勾配の最小化のためのアルゴリズムの2つの新しい変種を示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:17:47 GMT)
RethinkMCTS: Refining Erroneous Thoughts in Monte Carlo Tree Search for Code Generation [65.5] 本稿では,モンテカルロ木探索(MCTS)アルゴリズムを用いて,コードを生成する前に思考レベルの探索を行うRethinkMCTSを紹介する。
我々は,検索中の誤った思考を洗練させるために,微動コード実行フィードバックからの言語フィードバックを構築した。
RethinkMCTSは従来の検索ベースおよびフィードバックベースのコード生成ベースラインよりも優れていることを実証する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 02:07:28 GMT)
One-Shot Safety Alignment for Large Language Models via Optimal Dualization [64.5] 本稿では,制約付きアライメントを等価な非制約アライメント問題に還元する双対化の観点を提案する。
我々は、閉形式を持つ滑らかで凸な双対函数を事前に最適化する。
我々の戦略は、モデルベースと嗜好ベースのシナリオにおける2つの実用的なアルゴリズムに導かれる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 17:42:20 GMT)
Proximal Ranking Policy Optimization for Practical Safety in Counterfactual Learning to Rank [64.4] 本稿では,ユーザ行動に関する仮定を伴わずにデプロイの安全性を提供する,PRPO (proximal ranking Policy Optimization) という新しいアプローチを提案する。
PRPOは、安全なランキングモデルとは相容れないランキング行動を学ぶためのインセンティブを取り除きます。
実験の結果,PRPOは既存の安全逆性評価手法よりも高い性能を示すことがわかった。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 22:22:27 GMT)
TG-LLaVA: Text Guided LLaVA via Learnable Latent Embeddings [61.9] 視覚言語モデル(VLM)を最適化するためのテキストガイド付きLLaVA(TG-LLaVA)を提案する。
学習可能な潜伏埋め込みをブリッジとして使用し、テキスト命令を分析し、視覚エンコーダに解析結果をガイダンスとして付加する。
テキストのガイダンスによって、視覚エンコーダは、人間が質問を考えるとき、画像の最も関連性の高い部分に集中する方法と同様に、テキスト関連の特徴を抽出することができる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 00:38:34 GMT)
Reasoning Paths with Reference Objects Elicit Quantitative Spatial Reasoning in Large Vision-Language Models [61.9] 定量的空間的推論のために設計された5つのカテゴリに271の質問があるベンチマークQ-Spatial Benchを導入する。
本課題における最先端の視覚言語モデル(VLM)の性能について検討する。
本研究では,参照オブジェクトを視覚的手がかりとして,VLMが量的空間的疑問に答えることを奨励するゼロショットプロンプト技術であるSpatialPromptを開発した。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:45:42 GMT)
HuatuoGPT-II, One-stage Training for Medical Adaption of LLMs [61.4] HuatuoGPT-IIは、いくつかのベンチマークで、中国の医学領域における最先端のパフォーマンスを示している。
さらに、ChatGPTやGPT-4といったプロプライエタリなモデルよりも、特に中国伝統医学において優れています。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 08:41:01 GMT)
A Survey of Foundation Models for Music Understanding [60.8] この研究は、AI技術と音楽理解の交差に関する初期のレビューの1つである。
音楽理解能力に関して,近年の大規模音楽基盤モデルについて検討,分析,検証を行った。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 03:34:14 GMT)
DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Autonomous Driving [55.5] 我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesデータセットで行った実験は、DiFSDの優れた計画性能と優れた効率を示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:55:24 GMT)
Finetuning CLIP to Reason about Pairwise Differences [52.0] 本稿では,CLIPのような視覚言語モデルの学習手法を提案する。
我々はまず,ある属性による画像のランク付け能力を大幅に向上させることを実証した。
また、得られる埋め込みは埋め込み空間においてより大きな幾何学的性質に従うことを示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:02:14 GMT)
SlowFast-LLaVA: A Strong Training-Free Baseline for Video Large Language Models [51.7] 本研究では,空間的セマンティクスと長時間の時間的コンテキストを協調的にキャプチャできる学習自由ビデオ大言語モデル(LLM)を提案する。
これは、ビデオLLMの入力の2ストリームSlowFast設計を用いて、サンプルフレームの特徴を効果的に集約することで実現される。
実験の結果, SF-LLaVAは, 既存のトレーニング不要の手法よりも広い範囲の映像タスクにおいて優れていた。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 05:00:18 GMT)
PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.5] 医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 10:32:46 GMT)
GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.8] フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:36:01 GMT)
From Experts to the Public: Governing Multimodal Language Models in Politically Sensitive Video Analysis [48.1] 本稿では,大規模言語モデル(MM-LLM)の個人的および集団的検討を通じて,ガバナンスについて検討する。
筆者らは,まず10人のジャーナリストにインタビューを行い,専門家によるビデオ解釈のベースライン理解を確立した。第2に,包括的.AIを用いた議論に携わる一般市民114名を対象にした。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 03:17:38 GMT)
Are Large Language Models Really Good Logical Reasoners? A Comprehensive Evaluation and Beyond [46.8] 大規模言語モデル(LLM)は、自然言語処理(NLP)における注目すべき革新として登場した。
本論文では,このギャップを埋め,包括的に評価することを目的としている。
評価の包括性を考慮すると、3つの早期代表型LSMと4つのトレンド型LSMを含む。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:49:32 GMT)
SparX: A Sparse Cross-Layer Connection Mechanism for Hierarchical Vision Mamba and Transformer Networks [45.7] 本稿では,マンバをベースとした視覚バックボーンネットワークのための効率的な層間特徴集約機構を提案する。
ヒト視覚系における網膜ガングリオン細胞(RGC)にインスパイアされ、SparXと呼ばれる新しいスパース層間結合機構を提案する。
我々の新しい接続機構は、様々な視覚タスクにおいて優れた性能と一般化能力を持つ。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:46:18 GMT)
GP-GPT: Large Language Model for Gene-Phenotype Mapping [44.1] GP-GPTは、遺伝的・フェノタイプ知識表現とゲノム関連解析のための最初の専門的な大規模言語モデルである。
我々のモデルは、ゲノム学、遺伝学、科学出版物において3000,000以上の用語からなる包括的コーパスで2段階にわたって微調整されている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:56:20 GMT)
Deep Learning Based 3D Segmentation: A Survey [42.4] 3Dセグメンテーションは、自律運転とロボット工学の応用でコンピュータビジョンの根幹的で難しい問題である。
近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。
本稿では,ディープラーニングに基づく3Dセグメンテーション技術の最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:05:42 GMT)
Layout Agnostic Scene Text Image Synthesis with Diffusion Models [42.4] SceneTextGenは、事前に定義されたレイアウトステージの必要性を回避するために特別に設計された、拡散ベースの新しいモデルである。
SceneTextGenの新規性は、3つの重要なコンポーネントを統合している: 詳細なタイポグラフィ特性をキャプチャする文字レベルエンコーダと、不要なテキスト生成とマイナーな文字不正確な問題に対処する文字レベルインスタンスセグメンテーションモデルと、ワードレベルスポッティングモデルである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 21:46:02 GMT)
HaluEval-Wild: Evaluating Hallucinations of Language Models in the Wild [41.9] 幻覚は、臨界領域における大きな言語モデル(LLM)の信頼性に重大な課題をもたらす。
野生におけるLSM幻覚を評価するために特別に設計された最初のベンチマークであるHaluEval-Wildを紹介する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 05:37:56 GMT)
A Survey on Diffusion Models for Recommender Systems [36.5] 本稿では,拡散モデルに関する最初の総合的な調査について紹介する。
DMは、堅牢な生成能力のため、レコメンデーターシステムのための有望なソリューションとして現れてきた。
我々の分類学は、複雑なデータ分布を捉える際の拡散モデルのユニークな強みを強調している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:29:18 GMT)
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis [36.3] CoD(Chain-of-Diagnosis)は、診断過程を医師の思考過程を反映した診断連鎖に変換する。
CoDは、意思決定における透明性を確保するために、病気の信頼性分布を出力する。
診断GPTは9604の疾患を診断することができる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 08:43:17 GMT)
DreamMover: Leveraging the Prior of Diffusion Models for Image Interpolation with Large Motion [35.6] 本研究では,大きな動きを持つ画像対から中間画像を生成する問題について検討する。
大きな動きのため、中間的な意味情報は入力画像に欠落する可能性がある。
3つの主要コンポーネントを持つ新しいイメージフレームワークであるDreamMoverを提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 04:09:12 GMT)
Towards Multi-view Graph Anomaly Detection with Similarity-Guided Contrastive Clustering [35.2] グラフ上の異常検出は多くの実世界のアプリケーションにおいて重要な役割を果たす。
類似性誘導型コントラスト損失により正規化されたオートエンコーダベースのクラスタリングフレームワークを提案し,異常ノードを検出する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:41:59 GMT)
TextureDiffusion: Target Prompt Disentangled Editing for Various Texture Transfer [32.5] 各種テクスチャ転送に適用可能なチューニング不要な画像編集手法であるTextureDiffusionを提案する。
自己アテンションのクエリ機能と残留ブロックの機能は、入力画像の構造を保存するために使用される。
背景を維持するために、自己注意結果と中間潜伏者をブレンドする編集ローカライゼーション手法を導入する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 04:34:38 GMT)
Pathformer: Multi-scale Transformers with Adaptive Pathways for Time Series Forecasting [31.5] 適応経路を持つマルチスケールトランスであるPathformerを提案する。
時間分解能と時間距離を統合してマルチスケールモデリングを行う。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 04:57:36 GMT)
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale [30.0] 私たちは13万の医療用VQAサンプルでPubMedVisionデータセットを作成します。
PubMedVisionを用いて34Bの医療MLLM HuatuoGPT-Visionを訓練し、医療マルチモーダルシナリオにおいて優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:25:49 GMT)
BEnDEM:A Boltzmann Sampler Based on Bootstrapped Denoising Energy Matching [29.5] ボルツマン分布からサンプリングしたデータの代わりにエネルギー関数を与えられたニューラルサンプリングを学習する。
ノイズデータのエネルギーを学習することにより,拡散型サンプル装置 ENERGYBASE-D DENOISING ENERGY MATCHING を提案する。
2次元ガウス混合モデル(GMM)と4粒子二重埋設ポテンシャル(DW-4)によるEnDEMとBEnDEMの評価を行った。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:41:30 GMT)
Exploiting Priors from 3D Diffusion Models for RGB-Based One-Shot View Planning [24.4] 本稿では,拡散モデルの強力な3次元生成能力を先行として活用したワンショットビュー計画手法を提案する。
シミュレーションと実環境における実験により, オブジェクト再構成の品質と移動コストのバランスが良好であることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:34:34 GMT)
Pre-Training for 3D Hand Pose Estimation with Contrastive Learning on Large-Scale Hand Images in the Wild [24.2] 我々は,ハンドCLRと呼ばれる3次元手ポーズ推定器の事前学習に適した,手動画像に基づくコントラスト学習フレームワークを提案する。
実験により,データ拡張を伴う単一画像から正のペアを生成する従来のコントラスト学習手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 12:45:15 GMT)
The 2nd FutureDial Challenge: Dialog Systems with Retrieval Augmented Generation (FutureDial-RAG) [23.8] この課題は、3000近い高品質なダイアログを備えた実際の顧客サービスデータセットであるMobileCS2データセットの上に構築されている。
本稿では,知識検索のためのトラック1と応答生成のためのトラック2という2つのタスクを定義する。
我々は,2つのトラックのベースラインシステムを構築し,そのシステムが正確な検索を行い,情報的かつ一貫性のある応答を生成できるかどうかを計測する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:03:59 GMT)
Multiple Rotation Averaging with Constrained Reweighting Deep Matrix Factorization [22.5] コンピュータビジョンとロボティクス領域では、複数の回転平均化が重要な役割を果たす。
本稿では,データパターンを学習方法でマイニングするための効率的な回転平均化手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:50:27 GMT)
Fine-tuning Pre-trained Language Models for Few-shot Intent Detection: Supervised Pre-training and Isotropization [21.9] 等方性に向けて特徴空間を規則化し,教師付き事前学習を改善することを提案する。
本研究の主目的は,アイソトロピゼーションによる教師付き事前学習の正規化を約束し,撮影意図検出の性能向上を図ることである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:11:57 GMT)
Nebula: Efficient, Private and Accurate Histogram Estimation [21.5] 本稿では,クライアント間で分散したデータの個人的ヒストグラムの差分推定システムであるNebulaを提案する。
Nebulaは、クライアントがデータをローカルにサブサンプルし、エンコードすることで、信頼できないサーバが、差分プライバシー保証を満たすためのアグリゲーションしきい値を満たすデータ値のみを学ぶことができる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:55:18 GMT)
Revisit Few-shot Intent Classification with PLMs: Direct Fine-tuning vs. Continual Pre-training [21.0] 少量のラベル付きデータのみを使用して、基礎となる意図に基づいて発話を分類するために、深層学習モデルを訓練する。
この課題に対するPLMの過度な適合問題は、予想されるほど深刻ではないため、継続事前学習は必須ではない可能性がある。
限られた利用可能なデータの利用を最大化するために,コンテキスト拡張法を提案し,逐次自己蒸留を利用して性能を向上させる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:07:55 GMT)
Estimating Wage Disparities Using Foundation Models [20.7] 我々は、男女賃金格差を解消するために、全労働史から賃金を予測するために設計された、カスタム構築のファンデーションモデルを使用している。
我々のモデルは単純なモデルよりもキャリア履歴の豊かな表現を捉え、賃金をより正確に予測する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 23:22:21 GMT)
Understanding Simplicity Bias towards Compositional Mappings via Learning Dynamics [20.7] 異なる視点から構成写像の特異性について検討する。
この性質は、そのような写像を持つモデルがうまく一般化できる理由を説明する。
単純性バイアスは通常、勾配降下によるニューラルネットワークトレーニングの本質的な特性を示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 06:37:12 GMT)
Vision-Language Meets the Skeleton: Progressively Distillation with Cross-Modal Knowledge for 3D Action Representation Learning [20.3] スケルトンに基づく行動表現学習は、骨格配列を符号化することで人間の行動を理解し理解することを目的としている。
クロスモーダル・コントラッシブ・ラーニングに基づく新しいスケルトンベースのトレーニング・フレームワークを提案する。
提案手法は,従来の手法より優れ,最先端の結果が得られる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 03:32:03 GMT)
PersonaMark: Personalized LLM watermarking for model protection and user attribution [20.3] テキスト透かしは、AIが生成したテキストの検出とモデル保護の問題に対する有望な解決策として浮上している。
本稿では,文書構造を透かし情報の隠蔽媒体として利用する新しいテキスト透かし手法であるペルソナマークを提案する。
提案手法は,モデルの振舞いを最小限に抑えながら性能を保ち,透かし情報のあいまいな挿入を可能にし,強力な透かし認識能力を示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:10:01 GMT)
COSCO: A Sharpness-Aware Training Framework for Few-shot Multivariate Time Series Classification [19.6] シャープネス認識最小化(SAM)最適化とプロトタイプ損失関数からなる新しい学習フレームワークCOSCOを提案する。
本研究では,提案手法が既存のベースライン法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:41:55 GMT)
AACessTalk: Fostering Communication between Minimally Verbal Autistic Children and Parents with Contextual Guidance and Card Recommendation [17.3] タブレットベースのAI通信システムであるAACessTalkについて述べる。
MVAの子供と親との有意義な交換を促進する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:23:07 GMT)
Underwater Image Enhancement via Dehazing and Color Restoration [17.3] 既存の水中画像強調法は、ヘイズとカラーキャストを統一的な劣化過程として扱う。
水中画像の品質を向上させるために,視覚トランス (ViT) ベースのネットワーク (WaterFormer と呼ぶ) を提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:58:20 GMT)
MesonGS: Post-training Compression of 3D Gaussians via Efficient Attribute Transformation [16.7] 3D Gaussian Splattingは、新規なビュー合成において優れた品質と速度を示す。
3D Gaussianの巨大なファイルサイズは、トランスミッションとストレージの課題を提示している。
MesonGSは、競争力のある品質を維持しながら、3Dガウシアンを著しく削減する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:58:20 GMT)
SegMamba: Long-range Sequential Modeling Mamba For 3D Medical Image Segmentation [16.5] 我々は,新しい3次元医用画像textbfSegmentation textbfMambaモデルであるSegMambaを紹介した。
SegMambaは、状態空間モデルの観点から、全ボリューム特徴モデリングに優れています。
BraTS2023データセットの実験では、SegMambaの有効性と効率が示されている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:26:45 GMT)
EditBoard: Towards A Comprehensive Evaluation Benchmark for Text-based Video Editing Models [16.0] テキストベースのビデオ編集は有望な分野として現れ、テキストプロンプトに基づいたビデオの正確な修正を可能にしている。
既存の評価は限定的で一貫性がなく、通常、全体的なパフォーマンスを単一のスコアで要約する。
テキストベースのビデオ編集モデルの総合評価ベンチマークであるEditBoardを提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 08:43:18 GMT)
ExploreSelf: Fostering User-driven Exploration and Reflection on Personal Challenges with Adaptive Guidance by Large Language Models [15.9] We present ExploreSelf, a LLM-driven application designed to empower users to control their reflective journey。
以上の結果から,参加者は指導的支援と行動の自由のバランスに重きを置いていることがわかった。
本研究は, ユーザエンパワーメントを効果的に促進するLCM駆動型ツールの設計の意義を考察する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 08:25:24 GMT)
Unsupervised Hyperspectral and Multispectral Image Blind Fusion Based on Deep Tucker Decomposition Network with Spatial-Spectral Manifold Learning [15.9] タッカー分解と空間スペクトル多様体学習(DTDNML)に基づくハイパースペクトル・マルチスペクトル画像の教師なしブラインド融合法を提案する。
本手法は,様々なリモートセンシングデータセット上でのハイパースペクトルとマルチスペクトル融合の精度と効率を向上させる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 08:58:26 GMT)
One-Shot Learning for Pose-Guided Person Image Synthesis in the Wild [15.4] 現在のPGPIS(Pose-Guided Person Image Synthesis)法は、大量のラベル付き三重項データに大きく依存し、ジェネレータを教師付きで訓練する。
OnePoseTransは高品質なポーズ転送結果を生成し、最先端のデータ駆動方式よりも高い安定性を提供する。
テストケース毎に、OnePoseTransはNVIDIA V100 GPUで約48秒でモデルをカスタマイズする。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 02:42:25 GMT)
ValueCompass: A Framework of Fundamental Values for Human-AI Alignment [15.4] 本稿では,心理学的理論と体系的レビューに基づく基本的価値の枠組みであるバリューを紹介する。
本研究では,人間と言語モデル(LM)の価値アライメントを測定するために,実世界の4つのヴィグネットに価値を適用した。
以下に示すのは、人間とLMの危険な相違を明らかにすることであり、例えば、LMは人間によってほとんど意見が一致しない「自己のゴール」のような価値観と一致している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 02:13:03 GMT)
A Simpler Alternative to Variational Regularized Counterfactual Risk Minimization [15.3] 本稿では,f$-GAN に基づく下界ではなく,f-divergence の直接近似を最小化することで,f-divergence 最適化の新たな選択肢を提案する。
実験の結果,$f$-GANを用いた分散の最小化は期待通りには機能しないことがわかった。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:39:22 GMT)
From Challenges and Pitfalls to Recommendations and Opportunities: Implementing Federated Learning in Healthcare [15.2] フェデレートラーニングは、複数のセンターで大規模なヘルスケア研究とコラボレーションを可能にする大きな可能性を秘めている。
近年の多くの研究は、医療におけるフェデレートラーニングに基づく手法を提案または活用しているが、どちらの方法が潜在的な臨床的有用性を持っているかは定かではない。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:11:07 GMT)
Mining Path Association Rules in Large Property Graphs (with Appendix) [15.1] アソシエーション・ルール・マイニングはアイテムセットやサブストラクチャにおける規則的なパターンをうまく発見する。
パス・アソシエーション・ルール・マイニング(PARM)の問題点について紹介する。
我々は,探索空間を効果的に創り出すために,対単調性特性を利用した効率的でスケーラブルなアルゴリズムPIONEERを開発した。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:54:08 GMT)
SITSMamba for Crop Classification based on Satellite Image Time Series [14.7] リモートセンシング時系列データに基づく作物分類のための衛星画像時系列マンバ(SITSMamba)手法を提案する。
SITSからのより豊かな時間情報を活用するために、異なるタスクに使用するデコーダの2つのブランチを設計する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:34:15 GMT)
Extract and Diffuse: Latent Integration for Improved Diffusion-based Speech and Vocal Enhancement [14.1] 拡散に基づく生成モデルは、近年、発声と発声の強化において顕著な成果を上げている。
識別モデルによって生成される潜在表現を統合して音声と音声の強調を改善する新しいスコアベース拡散モデルであるEx-Diffを提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:25:08 GMT)
E-Commerce Inpainting with Mask Guidance in Controlnet for Reducing Overcompletion [13.7] 本稿では,拡散モデル生成におけるコア痛点,すなわちオーバーコンプリートを系統的に解析し,対処する。
本手法は実用化において有望な成果を上げており,本分野でのインスピレーションとなる技術レポートとして機能することを願っている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 10:10:13 GMT)
A Hypothesis on Black Swan in Unchanging Environments [13.3] 黒い白鳥の出来事は、非常に高いリスクをもたらす統計的に稀な出来事である。
まず,黒白鳥イベントを慎重に分類し,空間的な黒白鳥イベントに着目し,数学的に黒白鳥イベントの定義を定式化する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 21:08:44 GMT)
ELMI: Interactive and Intelligent Sign Language Translation of Lyrics for Song Signing [10.0] ELMIでは、リアルタイムでシンクされた歌詞のハイライトとミュージックビデオのスニペットを使って、グロースを1行ずつ編集できる。
ユーザーは大きな言語モデル駆動AIとチャットして、意味、光沢、動機付け、タイミングについて議論することもできる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:01:00 GMT)
Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization [9.2] 本研究は,テキスト・ツー・イメージモデルのアライメントパラダイムにおける逆Kulback-Leibler分散を$f$-divergenceに拡張することに焦点を当てる。
本研究では,異なる分散制約下で,画像テキストアライメント性能,人的価値アライメント性能,世代多様性性能の総合評価を行う。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:46:03 GMT)
Privacy Requirements and Realities of Digital Public Goods [9.1] デジタル・パブリック・グッズ(DPG)は、国連(UN)の持続可能な開発目標に対応するためのオープンソースデジタル製品である。
DPGは機密データを処理できるため、国連はDPGのファーストオーダー要件としてユーザプライバシを確立している。
DPGのプライバシーリスクは、現在一部がDPG標準によって管理されている。
本研究は、適切なプライバシー保護を確保するため、現行のDMG標準の有効性について検討する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 01:48:06 GMT)
VGG-Tex: A Vivid Geometry-Guided Facial Texture Estimation Model for High Fidelity Monocular 3D Face Reconstruction [8.2] VGG-Texは、高忠実度モノクロ3D顔再構成用に設計された新しいモデルである。
このアプローチの核心は、二次元紫外線テクスチャ推定の結果を高めるために、3Dパラメトリック先行値を活用することである。
本手法はテクスチャ再構築性能を既存の最先端手法と比較して大幅に向上させる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:10:31 GMT)
From Width-Based Model Checking to Width-Based Automated Theorem Proving [8.1] 本稿では,ワイドベースモデルチェックアルゴリズムをグラフ理論の妥当性を検証できるアルゴリズムに変換するための一般的なフレームワークを提案する。
我々のフレームワークはモジュラーであり、木幅や斜め幅を含むグラフのいくつかのよく研究された幅測度に対して適用することができる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:28:05 GMT)
Reducing Events to Augment Log-based Anomaly Detection Models: An Empirical Study [8.1] 異常検出の文脈におけるログイベントの自動削減のための効率的な手法であるLogCleanerを提案する。
実験の結果は、異常検出におけるログイベントの70%以上を削減し、モデルの推論速度を約300%高速化するLogCleanerの能力を強調している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 02:32:30 GMT)
AlpaPICO: Extraction of PICO Frames from Clinical Trial Documents Using LLMs [8.1] 近年,臨床治験報告の発行が急増しており,体系的レビューの実施が困難になっている。
臨床試験から人口、介入、比較、アウトカム(PICO)を自動的に抽出することは、体系的レビューを手作業で精査する伝統的な時間的プロセスを軽減することができる。
本研究では, LLMの事前学習期間中に収集されたLarge Language Models (LLMs) の事前学習知識を用いてICL戦略を採用し, PICO関連用語を自動的に抽出する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 11:53:24 GMT)
Rail-only: A Low-Cost High-Performance Network for Training LLMs with Trillion Parameters [7.3] 本稿では,大規模言語モデル(LLM)をハイパースケールでトレーニングするための,低コストなネットワークアーキテクチャを提案する。
この設計をRailオンリーネットワークと名付け,ネットワークコストを38%から77%削減しながら,同じトレーニング性能を実現することを示す。
私たちのアーキテクチャは、全トラフィックに対して8.2%から11.2%の完了時間オーバーヘッドしか持たない、全対全通信を備えたMixture-of-Expert(MoE)モデルもサポートしています。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 23:04:30 GMT)
Dreaming is All You Need [6.7] 本研究では,探索と精度のバランスをとるために,SleepNetとDreamNetという2つの新しいディープラーニングモデルを紹介する。
SleepNetは、事前訓練されたエンコーダモデルを使用して教師あり学習と教師なし睡眠のステージをシームレスに統合する。
DreamNetは、隠れた状態を再構築するために完全なエンコーダ・デコーダフレームワークを使用しており、人間の"ドレーミング"プロセスを模倣している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 12:17:03 GMT)
Reliable Multi-View Learning with Conformal Prediction for Aortic Stenosis Classification in Echocardiography [6.5] 得られた画像は、しばしば3次元解剖学の2次元断面であり、重要な解剖学的詳細を欠いている可能性がある。
トレーニングセット内の弱い情報入力に不確実性を導入するデータ中心の手法であるRe-Training for Uncertainty (RT4U)を提案する。
共形予測技術と組み合わせると、RT4Uは、基底真理クラスを含むことが保証される適応的な大きさの予測セットを高精度に得ることができる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 10:06:06 GMT)
Veridical Data Science for Medical Foundation Models [6.5] 新しい基礎モデル(FM)は、データサイエンスの文化的変化をもたらした。
大量の非構造化データに基づいて事前訓練されたFMは、様々な臨床タスクや質問に適応することができる。
この新しいワークフローは、Veridical Data Scienceの原則に挑戦する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:44:38 GMT)
Conformal Off-Policy Prediction for Multi-Agent Systems [6.3] オフポリシィ予測(OPP)は、安全クリティカルシステムのデータ駆動分析における最重要課題である。
マルチエージェントシステムに関わるOPP問題を解くための最初の共形予測手法であるMA-COPPを紹介する。
MA-COPPの重要な貢献は、エージェント軌道の出力空間の列挙や徹底的な探索を避けることである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 17:03:26 GMT)
Generating Synthetic Free-text Medical Records with Low Re-identification Risk using Masked Language Modeling [6.2] Masked Language Modeling (MLM) を用いた合成自由テキスト医療記録を生成するシステムを提案する。
本システムは,重要な多様性を導入し,再識別リスクを最小限に抑えつつ,記録の重要な情報を保存するように設計されている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 19:11:01 GMT)
Comparison of Large Language Models for Generating Contextually Relevant Questions [6.1] GPT-3.5、Llama 2-Chat 13B、T5 XXLは、微調整なしで大学のスライドテキストから質問を生成する能力を比較する。
その結果, GPT-3.5 と Llama 2-Chat 13B は T5 XXL よりも小さなマージン, 特に明瞭度と質問応答アライメントで優れていた。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:23:10 GMT)
Causal Inference with Large Language Model: A Survey [5.7] 因果推論は医学や経済学といった様々な分野において重要な課題となっている。
自然言語処理(NLP)の最近の進歩は、従来の因果推論タスクに有望な機会をもたらした。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:43:11 GMT)
A Survey of Out-of-distribution Generalization for Graph Machine Learning from a Causal View [5.7] グラフ機械学習(GML)は、幅広いタスクでうまく適用されている。
GMLは、アウト・オブ・ディストリビューション(OOD)データを一般化する上で大きな課題に直面している。
近年の進歩は、これらの一般化の課題を克服する上で、因果関係によるアプローチの重要な役割を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 20:41:18 GMT)
Style Transfer: From Stitching to Neural Networks [5.5] 本稿では,画像処理における2つのスタイル転送手法を比較した。
従来の方法では、既存の画像から小さなパッチを縫い合わせることで、新しい画像を合成する。また、セグメンテーションネットワークを使用して、前景オブジェクトを分離し、背景のみにスタイル転送を適用する、現代的な機械学習ベースのアプローチである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 20:50:43 GMT)
Entity-Aware Self-Attention and Contextualized GCN for Enhanced Relation Extraction in Long Sentences [5.5] 本稿では,入力文の構文構造とシーケンスの意味的文脈を効率的に組み込んだ,エンティティを意識した自己意図型GCN(ESC-GCN)を提案する。
本モデルでは,既存の依存性ベースモデルやシーケンスベースモデルと比較して,パフォーマンスの向上を実現している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 10:50:51 GMT)
RandALO: Out-of-sample risk estimation in no time flat [5.2] クロスバリデーション(CV)は、リスク推定のデファクトスタンダードとして機能するが、計算コスト(リーブ・ワン・アウト・CV)に対して高いバイアス(K$fold CV)の取引が不十分である。
本稿では,高次元におけるリスクの一貫した推定器であるとともに,計算コストも$K$-fold CVよりも低いランダム化された約1回のリスク推定器を提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:10:03 GMT)
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models [5.2] TSELMは、離散トークンと言語モデルを活用する新しいターゲット話者抽出ネットワークである。
我々は,TSELMが音声品質の優れた結果と,音声の可聴性に匹敵する結果が得られることを示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 02:19:17 GMT)
Steering Conversational Large Language Models for Long Emotional Support Conversations [5.0] 我々はLlama-2とLlama-3のモデルスイートのステアビリティに着目し、相互作用を通してこれらの戦略を維持する能力について検討する。
これを評価するために、注意マップを通して、モデルが引き起こした戦略への固執を定量化する戦略関連注意尺度(SRA)を導入する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:58:45 GMT)
Measuring Recency Bias In Sequential Recommendation Systems [4.8] シーケンシャルレコメンデーションシステムにおける頻度バイアス(Recency bias)とは、ユーザセッション内の最近の項目に過度に重きを置くことを指す。
このバイアスは、レコメンデーションのセレンディピティーを低下させ、システムの長期的関心を捉える能力を妨げます。
本論文は,リレーレンシバイアスの定量化に特化して設計された,単純かつ効果的な新しい計量法を提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:02:50 GMT)
The Optimality of (Accelerated) SGD for High-Dimensional Quadratic Optimization [4.7] 勾配降下(SGD)は機械学習、特にニューラルネットワークトレーニングにおいて広く使われているアルゴリズムである。
正準2次最適化や線形回帰のSGDに関する最近の研究は、適切な高次元設定で十分に一般化できることを示している。
本稿では,ステップサイズスケジュールと運動量指数の2つの基本成分を持つSGDについて検討する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:20:03 GMT)
LongGenBench: Benchmarking Long-Form Generation in Long Context LLMs [4.5] ロングフォームテキスト生成は、設計提案やクリエイティブな文章作成といったアプリケーションには不可欠である。
新しいロングフォームテキスト評価ベンチマークであるLongGenBenchは、生成されたロングテキストシーケンス内の特定のイベントを識別するモデルの能力をテストする。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:40:01 GMT)
KAN v.s. MLP for Offline Reinforcement Learning [4.4] Kolmogorov-Arnold Networks (KAN)は、機械学習における新たなニューラルネットワークアーキテクチャである。
本稿では,オフライン強化学習のためのアクターおよび批評家ネットワークへのkanの組み入れについて検討する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:52:44 GMT)
Decentralized Learning in General-sum Markov Games [3.9] 我々はマルコフ近電位関数を導入し、MNPFがアクター批判に基づく分散学習ダイナミクスのNash平衡の収束解析において中心的な役割を果たすことを示す。
本研究は,マルチエージェントシステムにおける分散学習の分析に新たな視点を与え,実世界の相互作用の複雑さに対処する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 17:22:48 GMT)
Thesis proposal: Are We Losing Textual Diversity to Natural Language Processing? [3.8] ニューラルネットワーク翻訳で使用されるアルゴリズムは、ほとんどの入力タイプに有益であるが、非典型的テキストの処理に有害な帰納的バイアスを持つかどうかを問う。
我々は,NMTシステムがこのようなテキストの多様性を維持するのに苦戦しているかどうかを調べるために,一連の実験を行った。
我々の最終的な目標は、出力の統計特性の分布に一様性を課さない代替手段を開発することである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 01:06:07 GMT)
PROSE-FD: A Multimodal PDE Foundation Model for Learning Multiple Operators for Forecasting Fluid Dynamics [3.8] 不均一な2次元物理系の同時予測のためのゼロショット多モードPDE基礎モデルを提案する。
これらの系は浅い水方程式と、圧縮不可能で圧縮不能な流れを持つナビエ・ストークス方程式を含む。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:20:15 GMT)
Federated Learning in Adversarial Environments: Testbed Design and Poisoning Resilience in Cybersecurity [3.3] 本稿では,フェデレートラーニング(FL)テストベッドの設計と実装に焦点を当て,サイバーセキュリティへの応用に焦点を当てた。
Flowerフレームワークを使用して構築されたテストベッドは、さまざまなFLフレームワークの実験を容易にし、そのパフォーマンス、スケーラビリティ、統合の容易さを評価します。
モデルとデータの整合性の両方をターゲットにした総合的な中毒検査は、敵の条件下でのシステムの堅牢性を評価する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 17:04:25 GMT)
Recent advances in deep learning and language models for studying the microbiome [3.3] 深層学習と言語モデルのマイクロバイオームおよびメダゲノミクスデータ解析への応用について概説する。
タンパク質/ゲノム言語モデリングとその微生物研究への貢献について概説する。
また,新しいビロミクス言語モデリング,生合成遺伝子クラスタの予測,メタゲノミクス研究のための知識統合などの応用についても論じる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:32:31 GMT)
A Note on the Convergence of Denoising Diffusion Probabilistic Models [3.2] 拡散モデルにより得られたデータ生成分布と分布との間のワッサーシュタイン距離の定量的上限を導出する。
この分野でのこれまでの研究とは異なり、我々の結果は学習したスコア関数を仮定しない。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 20:53:05 GMT)
Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports [2.9] この研究は、2つのデータセットを利用していた:7,294の放射線診断報告は、BT-RADS(Brain tumor Reporting and Data System)スコアに注釈付けされ、2,154の病理診断報告は、isocitrate dehydrogenase(IDH)変異のステータスに注釈付けされた。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:21:45 GMT)
A Comprehensive Methodological Survey of Human Activity Recognition Across Divers Data Modalities [2.9] 人間活動認識(HAR)システムは、人間の行動を理解し、それぞれの行動にラベルを割り当てることを目的としている。
HARは、RGB画像やビデオ、スケルトン、深度、赤外線、ポイントクラウド、イベントストリーム、オーディオ、アクセラレーション、レーダー信号など、さまざまなデータモダリティを利用することができる。
本稿は,2014年から2024年までのHARの最新の進歩に関する包括的調査である。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 10:04:44 GMT)
Optimizing the Songwriting Process: Genre-Based Lyric Generation Using Deep Learning Models [2.7] 本プロジェクトは,ディープラーニング技術を用いて,従来の曲の書き起こしプロセスを簡素化することを目的としている。
我々は、歌詞を個々の詩にパースするためにトークンを用いた独自の前処理フォーマットを開発した。
その結果, ベースラインモデルでは高いリコール(ROUGE)が得られたが, どちらのモデルにも類似の精度(BLEU)が得られた。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 21:32:46 GMT)
Detection Made Easy: Potentials of Large Language Models for Solidity Vulnerabilities [2.6] 本稿では,大規模言語モデル (LLM) の使用状況と,そのソリティにおけるTop Ten脆弱性の検出能力について,包括的に検討する。
このデータセットは、ベンチマークを使用して、GPT-3.5 TurboやGPT-4o Miniといったクローズドソースモデルとともに、CodeLlama、Llama2、CodeT5、FalconといったオープンソースのLLMのパフォーマンスを比較します。
以上の結果から,SmartVDはオープンソースモデルよりも優れており,GPT-3.5やGPといったクローズドソースベースモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:16:58 GMT)
Time-Series Forecasting and Sequence Learning Using Memristor-based Reservoir System [2.6] 我々は,効率的な時間的データ処理とオンライン学習を兼ね備えたmemristorベースのエコー状態ネットワークアクセラレータを開発した。
提案した設計は、負荷エネルギー消費と気象条件の予測など、実世界のタスクを含む様々なデータセットを用いてベンチマークされる。
このシステムはデバイス故障に対して10%以下で合理的な堅牢性を示すことが観察された。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:10:57 GMT)
Enhancing Lesion Segmentation in PET/CT Imaging with Deep Learning and Advanced Data Preprocessing Techniques [2.5] 本研究は,PET/CT画像における病変セグメンテーションの深層学習を用いた。
我々の方法論的アプローチは、モデルの堅牢性と一般化性を保証するために、ロバストな前処理とデータ拡張技術を含む。
本研究はPET/CT画像における前処理および拡張戦略の標準化に寄与することを目的としている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:27:34 GMT)
Automated Lesion Segmentation in Whole-Body PET/CT in a multitracer setting [2.5] 本研究は,マルチトラックPET画像の自動セグメンテーションワークフローの性能を評価することに焦点を当てた。
これらの知見は、診断や患者固有の治療計画の強化に重要な洞察を与えるものと期待されている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 15:32:29 GMT)
Machine learning assisted screening of metal binary alloys for anode materials [2.2] 本研究では,合金陽極材料の発見と最適化を高速化するための機械学習支援戦略を提案する。
我々はMPとAFLOWデータベースから膨大なデータセットをコンパイルし、何万もの合金組成と特性を包含した。
実験データと比較し, 合金陽極の電位および比容量を精度良く予測した。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 01:56:09 GMT)
Using the Empirical Attainment Function for Analyzing Single-objective Black-box Optimization Algorithms [2.1] 実験的達成関数(EAF)は,対象とするECDFに対していくつかの利点がある。
EAFは、関数毎の品質目標を定義する必要はなく、パフォーマンスの違いをより正確に捉え、追加の要約統計を使用することを可能にしている。
EAFのアクセシビリティを容易にするため、IOHanalyzerプラットフォームにモジュールを統合して計算する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 06:28:35 GMT)
OpenSU3D: Open World 3D Scene Understanding using Foundation Models [2.1] オープンセット, インスタンスレベルの3次元シーン表現を構築するための, 新規でスケーラブルなアプローチを提案する。
既存の方法は、事前に構築された3Dシーンと、ポイント単位の機能ベクトル学習によるスケーラビリティの問題を必要とする。
ゼロショット一般化機能を示すScanNetとReplicaのデータセットから,複数のシーンに対する提案手法の評価を行った。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 20:14:42 GMT)
Rethinking KenLM: Good and Bad Model Ensembles for Efficient Text Quality Filtering in Large Web Corpora [2.1] 我々は、2つの対照的なKenLM(GoodとBad KenLM)を利用するアンサンブルアプローチを提案する。
実験の結果,提案手法は高品質なコンテンツを保存しながら,ノイズを著しく低減することがわかった。
このことから,本手法は資源制約環境における計算オーバーヘッドを最小限に抑えた実用的な手法である可能性が示唆された。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 05:27:56 GMT)
HJ-sampler: A Bayesian sampler for inverse problems of a stochastic process by leveraging Hamilton-Jacobi PDEs and score-based generative models [1.9] 本稿では,ブラウン運動文脈におけるコールホップ変換(Cole-Hopf transform)と呼ばれるログ変換に基づく。
本稿では,HJ-sampler という新しいアルゴリズムを開発し,与えられた終端観測による微分方程式の逆問題に対する推論を行う。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 05:30:54 GMT)
Security Testbed for Preempting Attacks against Supercomputing Infrastructure [1.9] 本稿では,National Center for Supercomputing Applicationsにおけるスーパーコンピュータのライブトラフィックに埋め込まれたセキュリティテストベッドについて述べる。
目的は、ペタスケールのスーパーコンピュータで攻撃プリエンプション、すなわちシステムの妥協とデータ漏洩を実証することである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 03:42:47 GMT)
Extrapolative ML Models for Copolymers [1.9] 機械学習モデルは、材料特性の予測に徐々に使われてきた。
これらのモデルは本質的に補間的であり、物質の既知の特性範囲外の候補を探索するための有効性は未解決である。
本稿では,MLモデルの外挿能力,トレーニングデータセットのサイズと範囲,学習アプローチとの関係について検討する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 11:02:01 GMT)
Shannon entropy in quasiparticle states of quantum chains [1.9] 自由ボゾン鎖およびフェルミオン鎖の準粒子励起状態におけるシャノンエントロピーとそのサブシステムおよびサブシステムシャノン相互情報について検討する。
単一粒子および二重粒子状態に対しては、スケーリング限界における自由ボゾン鎖とフェルミオン鎖の様々な解析式を導出する。
また, ボゾン系, フェルミオン系およびXXX系における三重粒子および四重粒子状態のシャノンエントロピーと相互情報の数値計算を行った。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:06:30 GMT)
Machine Learning for Analyzing Atomic Force Microscopy (AFM) Images Generated from Polymer Blends [1.8] 高分子膜から得られた原子間力顕微鏡画像内の領域を特定するために,教師なし学習技術を用いた新しい機械学習ワークフローを提案する。
このワークフローの目的は、2種類のポリマードメインの空間的位置を手動の介入をほとんど行わずに同定することである。
上記の課題に適用可能なコンピュータビジョンや信号処理など,他の分野で使用されている既存手法について概観する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 23:42:16 GMT)
Loneliness Forecasting Using Multi-modal Wearable and Mobile Sensing in Everyday Settings [1.7] 本研究では、スマートリングや時計などのウェアラブルデバイスを用いて、孤独の初期の生理的指標を監視する。
スマートフォンは初期の孤独の兆候を 捉えるために使われています
パーソナライズされたモデルの開発を通じて、7日間の孤独度予測において、顕著な精度 0.82 と F-1 スコア 0.82 を達成した。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:33:02 GMT)
On the Effect of Robot Errors on Human Teaching Dynamics [1.7] ロボットエラーの存在と重大さが、人間の教示力学の3次元にどのように影響するかを考察する。
結果は、人々はロボットにエラーを教えるのにより多くの時間を費やす傾向があることを示している。
対話型学習のための効果的なインタフェースを設計するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 19:02:34 GMT)
Leveraging Open-Source Large Language Models for Native Language Identification [1.6] ネイティブ言語識別(NLI)は、法医学、マーケティング、第二言語習得に応用されている。
本研究では,オープンソース生成型大規模言語モデル(LLM)をNLIに適用する可能性について検討する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 08:14:18 GMT)
COBRA -- COnfidence score Based on shape Regression Analysis for method-independent quality assessment of object pose estimation from single images [1.6] 本稿では,単一画像意味解析に依存するポーズ推定手法の一般的なアルゴリズムを提案する。
このアルゴリズムは、複数のガウス過程を組み合わせた軽量な配置形状表現を用いる。
我々の信頼度尺度は、形状テンプレートへの画素バックプロジェクションの平均混合確率からなる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:47:19 GMT)
Model Selection Through Model Sorting [1.5] ネスト型経験リスク (NER) と呼ばれるモデル順序選択法を提案する。
UCRデータセットでは、NER法はUCRデータセットの分類の複雑さを劇的に減らす。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:43:59 GMT)
Random Walk on Pixel Manifolds for Anomaly Segmentation of Complex Driving Scenes [1.4] 我々はRWPM(Random Walk on Pixel Manifolds)と呼ばれる新しい手法を提案する。
RWPMはランダムウォークを用いて画素間の固有の関係を明らかにし、画素埋め込みを洗練させる。
実験の結果、RWPMは既存の異常セグメンテーション法の性能を一貫して改善していることがわかった。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 00:55:55 GMT)
Learning Two-factor Representation for Magnetic Resonance Image Super-resolution [1.3] 2要素表現に基づくMR画像超解像法を提案する。
具体的には、強度信号を学習可能な基底と係数の線形結合に分解する。
提案手法は最先端の性能を達成し,より優れた視覚的忠実度とロバスト性を実現する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:32:24 GMT)
Language Models Learn Metadata: Political Stance Detection Case Study [1.2] 本稿では,メタデータを政治的スタンス検出タスクに組み込むための最適な方法について検討する。
我々の単純なベースラインは、党員情報のみを用いて、現在の最先端を超越していることが示される。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:57:41 GMT)
Towards understanding evolution of science through language model series [1.0] AnnualBERTは、科学的テキストの時間的進化を捉えるために設計された一連の言語モデルである。
2008年まで発行された170万のarXiv論文の全文をスクラッチから事前訓練したRoBERTaモデルと、年間ベースでarXiv論文の漸進的に訓練されたモデルのコレクションで構成されている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:15:05 GMT)
Wasserstein F-tests for Fréchet regression on Bures-Wasserstein manifolds [1.0] ビュール・ワッサーシュタイン多様体上のフレシェレグレッションが発展する。
非関連性の零仮説のテストが提案されている。
結果は,提案した試験が所望の有意な程度に有意であることを示している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 04:45:46 GMT)
Cyber Risk Assessment for Cyber-Physical Systems: A Review of Methodologies and Recommendations for Improved Assessment Effectiveness [0.8] 本稿では,CPSのサイバーリスク評価への学術的貢献についてレビューする。
評価の有効性を制限するギャップを特定し、サイバーセキュリティインシデントからのリアルタイム学習を推奨する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:21:32 GMT)
A Study on Thermal Quantum Resources and Probabilistic Teleportation in Spin-1/2 Heisenberg XYZ+DM+KSEA Model under Variable Zeeman Splitting [0.8] Dzyaloshinsky-Moriya (DM) と Kaplan--Shekhtman--Entin-Wohlman--Aharony (KSEA) 相互作用を加えたスピン-1/2ハイゼンベルクXYZモデルにおける量子コヒーレンスと量子相関の測定についての研究
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:43:10 GMT)
Leiden-Fusion Partitioning Method for Effective Distributed Training of Graph Embeddings [0.7] 本稿では,最小限の通信量でグラフを大規模に学習するための分割手法Leiden-Fusionを提案する。
我々の手法は、初期連結グラフに対して、各分割が孤立ノードを持たない密連結な部分グラフであることを保証する。
提案手法の有効性を,複数のベンチマークデータセット上で広範囲に評価することで実証する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 22:50:57 GMT)
Automatic Control With Human-Like Reasoning: Exploring Language Model Embodied Air Traffic Agents [0.6] 本稿では,人間の介入なしに航空交通紛争を解決するために,関数呼び出しと学習機能を備えた言語モデルベースエージェントの適用について検討する。
この研究の革新的な部分であるエクスペリエンスライブラリは、エージェントがシミュレーションや言語モデルとの相互作用から学んだ合成知識を格納するベクトルデータベースである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 12:49:05 GMT)
HMAFlow: Learning More Accurate Optical Flow via Hierarchical Motion Field Alignment [0.6] 本稿では,挑戦シーンにおける光学的フロー推定を改善するために,HMAFlowと呼ばれる新しい手法を提案する。
提案モデルは主に,階層型運動場アライメント(HMA)モジュールと相関自己認識(CSA)モジュールの2つのコアコンポーネントから構成される。
実験により,本モデルが他の最先端手法と比較して最高の一般化性能を達成できることが実証された。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 06:37:55 GMT)
Domain and Content Adaptive Convolutions for Cross-Domain Adenocarcinoma Segmentation [0.4] 我々はCOSAS(Cross-Organ and Cross-Scanner Adenocarcinoma)課題に取り組むためのU-Netベースのセグメンテーションフレームワークを提案する。
提案手法は,最終チャレンジテストセットのクロススキャントラックでは0.8020,クロススキャントラックでは0.8527のセグメンテーションスコアを得た。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 17:08:34 GMT)
Exploring Utility in a Real-World Warehouse Optimization Problem: Formulation Based on Quantun Annealers and Preliminary Results [0.4] 本稿では,D-Wave の量子アニーラを用いた暖房最適化問題に対する量子初期化機構を提案する。
このモジュールは、現実世界の産業問題の最適化に特化した既存の古典的ソフトウェアに組み込むように設計されている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 11:58:07 GMT)
Relativistic VQE calculations of molecular electric dipole moments on trapped ion quantum hardware [0.4] 本研究では,従来のコンピュータ上でのBeH分子とRaH分子の永久電気双極子モーメント(PDM)を計算するために,高精度な18量子相対論的VQEシミュレーションを提案する。
本稿では,ZX-Calculusルーチンを保存するための強化学習や因果フロー,エラー軽減,選択後のテクニックなど,さまざまなリソース削減手法を適用する。
我々の12量子回路の2量子ゲート数を99.71%削減し、古典的な評価では2.35%の精度でPDMのトレードオフを行う。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:12:23 GMT)
Spectrum-preserving deformations of integrable spin chains with open boundaries [0.4] 我々は、強い相互作用を持つ量子多体系に対してスペクトルの一部を無傷に残す局所的な変形の族を見つける。
この変形はベーテ・アンザッツ方程式(BAE)を保存するため、アイソ・ベーエ流と呼ばれる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:01:57 GMT)
Spatial Transformer Network YOLO Model for Agricultural Object Detection [0.3] 本稿では,空間変換器ネットワーク(STN)をYOLOに統合し,性能を向上させる手法を提案する。
提案するSTN-YOLOは,画像の重要な領域に着目し,モデルの有効性を高めることを目的としている。
農業オブジェクト検出のためのベンチマークデータセットと、最先端の植物表現型温室施設からの新たなデータセットにSTN-YOLOを適用した。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 21:04:23 GMT)
On the critical finite-size gap scaling for frustration-free Hamiltonians [0.3] フラストレーションフリーハミルトニアンに対する臨界有限サイズギャップスケーリングが逆二乗型であることを証明する。
このことは、連続体極限において共形場理論を生成する能力にさらなる制限を与える。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 10:37:38 GMT)
MARS: Mask Attention Refinement with Sequential Quadtree Nodes for Car Damage Instance Segmentation [0.2] 本稿では,自動車損傷事例分割のためのMARS(Mask Attention Refinement with Sequential quadtree node)を提案する。
実験により、MARSは3つの人気のあるベンチマークにおいて、最先端(SOTA)インスタンスセグメンテーション法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 23:26:01 GMT)
Disentangling Visual Priors: Unsupervised Learning of Scene Interpretations with Compositional Autoencoder [0.2] 本稿では、ドメイン固有言語を用いて、画像形成の先駆的選択を捉えるニューロシンボリックアーキテクチャを提案する。
我々は、その言語でテンプレートプログラムを表現し、畳み込みニューラルネットワークによってシーンから抽出された特徴を用いてパラメータ化を学ぶ。
パラメータ化されたプログラムは、実行されると幾何学的プリミティブを生成し、シーンの内容に対応するようにレンダリングして評価する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 12:47:39 GMT)
Analysis of Centrifugal Clutches in Two-Speed Automatic Transmissions with Deep Learning-Based Engagement Prediction [0.2] 本研究は,様々なクラッチ構成が伝達力学に及ぼす影響を系統的に検討した。
Deep Neural Network(DNN)モデルは、スプリングプリロードや靴の質量といったパラメータを用いてクラッチエンゲージメントを予測する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:57:38 GMT)
Sub-shot noise sensitivity via deformed four-headed kitten states [0.2] 元のコンパス状態は、4つのコヒーレントな状態の重なり合わせによって生成され、異方性サブプランク構造を生成する。
我々は光子加算と減算を同時に適用することにより、このコンパス状態の2つの変種を提案する。
我々の変種はサブプランク構造を示し、変位に対する感度を改善した。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 19:32:49 GMT)
A Benchmark Dataset with Larger Context for Non-Factoid Question Answering over Islamic Text [0.2] 本稿では,Quranic Tafsir と Ahadith の領域内で質問応答を目的とした包括的データセットについて紹介する。
このデータセットは、73,000以上の質問応答ペアからなる堅牢なコレクションで構成されており、この特殊なドメインで報告されている最大のデータセットである。
本稿では,データセットのコントリビューションを強調しながら,その後の人的評価から,既存の自動評価手法の限界に関する批判的な洞察が得られた。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 19:50:00 GMT)
Size and Shape of Fuzzy Spheres from Matrix/Membrane Correspondence [0.1] 横面に投影された地中ファジィ球の大きさと形状の統計値について検討した。
地表面波動関数の数値的および解析的近似により, 予測表面積, 周辺面積, 偏心率, 形状パラメータを推定する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 16:26:48 GMT)
Differentiating and Integrating ZX Diagrams with Applications to Quantum Machine Learning [0.1] 我々は、ZX-計算の枠組み内での微分と積分を実現することにより、ZXを解析的視点に高める。
本稿では,バレンプラトーの解析に量子機械学習を応用し,ZX計算の新しい解析フレームワークを具体的に解説する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:58:20 GMT)
Unveiling Gender Bias in Large Language Models: Using Teacher's Evaluation in Higher Education As an Example [0.0] 本稿では,Large Language Model (LLM) による高等教育環境におけるジェンダーバイアスについて検討する。
Odds Ratio (OR)分析、Word Embedding Association Test (WEAT)、感情分析、文脈分析を含む包括的な分析フレームワークを適用している。
具体的には、女性インストラクターには親しみやすさや支援に関する言葉が頻繁に用いられ、男性インストラクターにはエンターテイメントに関する言葉が主流であった。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:50:33 GMT)
Training Safe Neural Networks with Global SDP Bounds [0.0] 本稿では,半定値プログラミング(SDP)を用いたニューラルネットワークの形式的安全性保証によるトレーニング手法を提案する。
本手法は,大規模かつ高次元な入力領域における安全性の検証に焦点をあて,対向境界に着目した既存手法の限界に対処する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 10:50:22 GMT)
Tracking Virtual Meetings in the Wild: Re-identification in Multi-Participant Virtual Meetings [0.0] 遠隔ビデオ会議の参加者を追跡・再同定するための新しい手法を提案する。
本手法は, YOLOをベースラインとしたトラッキング手法と比較して, 誤差率を平均95%削減する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 19:37:37 GMT)
Towards Kinetic Manipulation of the Latent Space [0.0] 実写RGBカメラフィードから事前学習した畳み込みニューラルネットワーク(CNN)の単純な特徴抽出は、シーンに簡単な変更を加えて潜伏空間を操作するのに非常に役立っていることを示す。
この新しいパラダイムはVisual-Reactive Interpolationと呼ばれ、完全なコードはhttps://github.com/PDillis/stylegan3-fun.orgで見ることができる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 21:24:51 GMT)
Quantum optimization algorithms for CT image segmentation from X-ray data [0.0] 本稿では,2次非制約二元最適化(QUBO)と呼ばれる高度な量子最適化アルゴリズムを用いた新しい手法を提案する。
ラドン変換を用いて、実験的に得られたシングラムと量子化されたセグメンテーションCT画像から得られた量子化されたシングラムとの差を最小限に抑えたX線投影データからのセグメンテーションCT画像の取得を可能にする。
本研究は,実世界のX線データの検証にD-Waveのハイブリッドソルバシステムを利用した。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 11:45:33 GMT)
Quantum cryptographic protocols with dual messaging system via 2D alternate quantum walk of a genuine single-photon entangled state [0.0] 単一光子絡み合った状態(SPES)は、多光子(または多粒子)よりも安全な量子情報の符号化と処理の方法を提供する。
このレターは、生成された真の3方向と非ローカルの2方向のSPESを暗号鍵として使用して、2つの異なるメッセージを同時に安全にエンコードできることを示している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:40:26 GMT)
Predicting building types and functions at transnational scale [0.0] 我々は、EU、ノルウェー、スイス、イギリスにまたがるOpenStreetMap(OSM)ビルディングからなる大規模グラフデータセット上にグラフニューラルネットワーク(GNN)分類器をトレーニングする。
グラフトランスフォーマーモデルは、建物を9つのクラスに分類するときにコーエンのカッパ係数 0.754、住宅と非住宅のクラスに分類するときにコーエンのカッパ係数 0.844 を達成する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 11:02:45 GMT)
On the negative-result experiments in quantum mechanics [0.0] 量子力学(QM)におけるいわゆる負回帰実験(ヌル測定、相互作用のない測定など)についてコメントする。
この種の全ての実験(ヌル測度)は、意図的に偏った検出器を設置し、特定の事象を排除または選択する不適切な測定として理解することができる。
ヌル測度による予測の検証は、最終的にはマイクロシステムとマクロな検出器の相互作用を含む標準の非バイアス測定を必要とする。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:27:02 GMT)
OML-AD: Online Machine Learning for Anomaly Detection in Time Series Data [0.0] オンライン機械学習(OML)に基づく新しい異常検出手法であるOML-ADを提案する。
OML-ADは精度と計算効率の点で最先端のベースライン法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:19:19 GMT)
Models of interacting bosons with exact ground states: a unified approach [0.0] 数保存ボソンに対するフラストレーションフリー''相互作用格子量子ハミルトニアンの無限クラスを定義する。
古典的重みを適切に選択することにより、様々な既知の可解モデルのボソン表現を得る。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 02:20:58 GMT)
Leveraging Large Language Models for Predicting Cost and Duration in Software Engineering Projects [0.0] 本研究では,プロジェクトコスト予測の精度とユーザビリティを高めるために,LLM(Large Language Models)を用いた革新的な手法を提案する。
従来の手法と現代の機械学習技術に対するLLMの有効性について検討する。
本研究の目的は,LLMがより正確な推定を得るだけでなく,複雑な予測モデルに代わるユーザフレンドリな代替手段を提供することを示すことである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 05:35:52 GMT)
LLMs and the Human Condition [0.0] このモデルは、哲学、社会学、コンピュータ科学から、人間の意思決定に関する確立した3つの理論を統合する。
これは、多くの哲学者や、多くの現代のAI研究者によって取られた位置である「反応性システム」として一般的に考えられているものを記述している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:10:55 GMT)
LLM Honeypot: Leveraging Large Language Models as Advanced Interactive Honeypot Systems [0.0] ハニーポット(Honeypot)は、攻撃者を誘惑し、相互作用させるように設計されたデコイシステムである。
我々は,大規模言語モデルを用いて,現実的でインタラクティブなハニーポットシステムを構築するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:41:42 GMT)
Integrating AI's Carbon Footprint into Risk Management Frameworks: Strategies and Tools for Sustainable Compliance in Banking Sector [0.0] 本稿では,AIの炭素フットプリントを銀行セクターのリスク管理フレームワーク(RMF)に統合することを検討する。
近年のAI研究、例えばOpen Mixture-of-Experts (OLMoE)フレームワークは、より効率的でダイナミックなAIモデルを提供する。
これらの技術的例を用いて、この論文は、銀行がAIの炭素フットプリントを特定し、評価し、緩和するための構造化されたアプローチを概説している。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 23:09:27 GMT)
Improving parameters estimation in Gaussian channels using quantum coherence [0.0] 逆問題、すなわち、量子コヒーレンスを資源とするプローブを用いたチャネルパラメータの推定を考える。
チャネルパラメータに関するコヒーレンスの変化率を、コヒーレンス量ではなく、パラメータ推定ゲインを生成することができる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:50:23 GMT)
Gravitational reduction of the wave function through the quantum theory of motion [0.0] 点粒子と物体の両方の量子運動は、量子力と重力力の存在下で研究される。
量子世界から古典世界への遷移の臨界量を特定する。
波動関数の還元時間は、粒子や物体の動力学を用いて定義される。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 08:06:31 GMT)
Early Detection of Network Service Degradation: An Intra-Flow Approach [0.0] 本研究では,早期のフロー特性を利用して,コンピュータネットワークにおけるサービス劣化(SD)を予測する新しい手法を提案する。
我々のアプローチは、ネットワークフローの観測可能な(O)セグメント、特にパケット間時間(PIAT)の分析に焦点を当てている。
我々は,10個の遅延サンプルの最適O/NO分割閾値を推定し,予測精度と資源利用量のバランスをとる。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 19:07:30 GMT)
EEPPR: Event-based Estimation of Periodic Phenomena Rate using Correlation in 3D [0.0] 本稿では,イベントカメラによる周期現象の速度測定手法を提案する。
この手法は周期現象に対して、時間空間との時間差で時間窓内で非常に類似した事象が生成されることを仮定する。
提案手法であるEEPEPは,12の周期現象のデータセットを用いて評価する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:16:47 GMT)
Critic as Lyapunov function (CALF): a model-free, stability-ensuring agent [0.0] この研究は、Crytic As Lyapunov Function(CALF)と呼ばれる新しい強化学習エージェントを提示し、展示する。
CALFはモデルフリーであり、オンライン環境、言い換えれば動的システムの安定化を保証する。
その並行的なアプローチは、主にオフラインまたはモデルベース、例えば、モデル予測制御をエージェントに融合させるもののいずれかである。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 21:27:44 GMT)
Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies [0.0] 本研究では,エンコーダとLarge Language Models(LLMs)を併用した名前付きエンティティ認識手法を比較し,ロシアの職種からスキルを抽出する。
その結果、従来のNERモデル、特にDeepPavlov RuBERT NERは、精度、精度、リコール、推測時間など、様々な指標でLLMを上回ります。
この研究は、自然言語処理(NLP)の分野と労働市場、特に非英語の文脈におけるその応用に寄与する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 05:02:37 GMT)
Bias Begets Bias: The Impact of Biased Embeddings on Diffusion Models [0.0] テキスト・トゥ・イメージ(TTI)システムは、社会的偏見に対する精査が増加している。
組込み空間をTTIモデルのバイアス源として検討する。
CLIPのような偏りのあるマルチモーダル埋め込みは、表現バランスの取れたTTIモデルに対して低いアライメントスコアをもたらす。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 01:09:55 GMT)
Benchmarking LLMs in Political Content Text-Annotation: Proof-of-Concept with Toxicity and Incivility Data [0.0] この記事では,OpenAI の GPT と,多数のオープンソース LLM の政治コンテンツに対するアノテーションタスクの実行能力をベンチマークした。
我々は300万人以上のデジタルインタラクションからなる新しい抗議イベントデータセットを使用した。
われわれは、人間のコーダーがソーシャルメディアの毒性と悪質について注釈を付けた、地味なラベルを含む金の標準を作った。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 14:11:24 GMT)
Bayesian Neural Networks for 2D MRI Segmentation [0.0] 本稿では,MRIセグメンテーションのための不確実性認識モデルであるBA U-Netを紹介する。
BA U-Netは正確で解釈可能な結果を提供し、信頼性の高い病理検査に不可欠である。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 20:36:12 GMT)
Analysis of flexible traffic control method in SDN [0.0] このプロジェクトでは、ネットワークの自律的な決定を可能にする、現代的なタイプの機械学習であるReinforcement Learningを使用している。
このソリューションは、ネットワークのパフォーマンス向上だけでなく、その柔軟性とリアルタイム適応性 - 柔軟なトラフィック制御も目標としている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 18:09:59 GMT)
Abnormal Event Detection In Videos Using Deep Embedding [0.0] 監視ビデオにおける異常事象の検出や異常検出は、現在、起こりうる事象の多様性のために課題となっている。
本稿では、ディープニューラルネットワークの目的を協調的に最適化することを目的とした、ビデオ異常検出のための教師なしアプローチを提案する。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 17:44:51 GMT)
A proposal for a metaphysics of self-subsisting structures. II. Quantum physics [0.0] 本論文は, 共用紙に設定した自己置換構造のメタ物理を非相対論的量子物理学の領域へ拡張するものである。
この議論は、De Broglie-Bohm$N$-bodyシステムのリレーショナル実装を表すPure Shape Dynamicsモデルを中心に展開されている。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 20:41:28 GMT)
A hybrid solution for 2-UAV RAN slicing [0.0] インターネットをドローンでユーザーに配布することも可能だ。
しかし、ユーザーの位置に応じてドローンを配置する必要がある。
インターンシップでは、最適化問題として問題を見ることは依然として有用であることを証明したいと思いました。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:42:31 GMT)
A clustering adaptive Gaussian process regression method: response patterns based real-time prediction for nonlinear solid mechanics problems [0.0] 本研究では, 固体力学における非線形構造応答のリアルタイム予測を目的としたクラスタリング適応ガウス過程回帰(CAG)法を提案する。
これは、小さなサンプルサイズ、高精度、高効率なデータ駆動機械学習手法であり、非線形構造応答パターンを活用する。
提案手法は1秒以内の予測が可能であり,本研究の文脈において,約20サンプルの精度が得られた。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:30:33 GMT)
A Tie-breaking based Local Search Algorithm for Stable Matching Problems [0.0] 不完全リストと結びつき(SMTI)の安定な結婚問題に対するタイブレーキングに基づく局所探索アルゴリズム(TBLS)と病院・居住者間の結びつき(HRT)問題(HRT)を導入する。
TBLSは最も高いマッチングサイズを達成する一方、TBLS-Eは最も低い性平等コストを示す。
どちらのアルゴリズムも、大規模インスタンスの解法において、他の局所探索アルゴリズムよりも高速な計算速度を示す。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 13:36:55 GMT)
A POD-TANN approach for the multiscale modeling of materials and macroelement derivation in geomechanics [0.0] 本稿では,固有直交分解(POD)と熱力学に基づくニューラルネットワーク(TANN)を組み合わせた新しいアプローチを提案する。
この手法はPODを利用して、微視的状態情報からマクロな内部状態変数を抽出する。
このアプローチの有効性は、複雑さを増大させる応用を通じて検証される。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 09:47:29 GMT)
A Novel Framework For Text Detection From Natural Scene Images With Complex Background [0.0] 本稿では,ウェーブレット変換を用いた複雑な背景を持つ画像からテキスト領域を検出する手法を提案する。
このフレームワークは、元の画像をグレースケールでウェーブレット変換し、次にサブバンドフィルタリングする。
論文参考訳(メタデータ) (Sun, 15 Sep 2024 07:12:33 GMT)