Fugu-MT: arxivの論文翻訳(概要)

MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct [148.4]
我々は,新しいマルチモーダル命令データ進化フレームワークであるMMEvolを提案する。 MMEvolは、きめ細かい知覚、認知的推論、相互作用の進化の洗練された組み合わせによって、データ品質を反復的に改善する。提案手法は,9つのタスクにおいて,最先端モデルに比べて有意に少ない精度でSOTA(State-of-the-art)性能を実現する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:32:08 GMT)
Large Language Model Based Generative Error Correction: A Challenge and Baselines forSpeech Recognition, Speaker Tagging, and Emotion Recognition [110.8]
生成音声の書き起こし誤り訂正(GenSEC)の課題について紹介する。この課題は、(i)ASR後の転写補正、(ii)話者タグ付け、(iii)感情認識という、3つのASR後の言語モデリングタスクを含む。本稿では,ベースライン評価から得られた知見と,今後の評価設計における教訓について論じる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:32:49 GMT)
Kernelized Concept Erasure [108.7]
概念消去のための線形ミニマックスゲームのカーネル化を提案する。特定の非線形敵が概念を予測するのを防ぐことができる。しかし、保護は異なる非線形敵に移動しない。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:37:58 GMT)
Pseudo-Labeling Based Practical Semi-Supervised Meta-Training for Few-Shot Learning [93.6]
擬似ラベルベースメタラーニング(PLML)という,シンプルで効果的なメタトレーニングフレームワークを提案する。まず、一般的な半教師付き学習(SSL)を用いて分類器を訓練し、ラベルなしデータの擬似ラベルを得る。ラベル付きおよび擬似ラベル付きデータから数ショットのタスクを構築し、特徴の平滑化と雑音抑圧を伴う新しい微調整法を設計する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:57:43 GMT)
Explore the Hallucination on Low-level Perception for MLLMs [83.1]
低レベルの視覚知覚と理解タスクにおけるMLLMの自己認識性を定義し,評価することを目的としている。低レベルの視覚に対する人間の反応をシミュレートするベンチマーク設定であるQL-Benchを提案する。いくつかのモデルでは、ロバストな低レベル視覚能力を示すが、その自己認識性は比較的未発達である。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:38:29 GMT)
Transformer-based stereo-aware 3D object detection from binocular images [82.9]
両眼3次元物体検出におけるトランスフォーマーのモデル設計について検討する。この目的を達成するために、ステレオ対応の3Dオブジェクト検出器TS3Dを提案する。提案したTS3Dは、KITTIテストセット上で41.29%のモードレートカー検出精度を実現し、各両眼画像対から物体を検出するのに88msを要した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:42:27 GMT)
Knowledge-enhanced Visual-Language Pretraining for Computational Pathology [68.7]
本稿では,公共資源から収集した大規模画像テキストペアを利用した視覚的表現学習の課題について考察する。ヒト32組織から病理診断を必要とする4,718の疾患に対して50,470個の情報属性からなる病理知識ツリーをキュレートする。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:54:52 GMT)
Sarah Frank-Wolfe: Methods for Constrained Optimization with Best Rates and Practical Features [65.6]
Frank-Wolfe (FW) 法は、構造化制約による最適化問題の解法として一般的な手法である。有限サム勾配の最小化のためのアルゴリズムの2つの新しい変種を示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:17:47 GMT)
RethinkMCTS: Refining Erroneous Thoughts in Monte Carlo Tree Search for Code Generation [65.5]
本稿では,モンテカルロ木探索(MCTS)アルゴリズムを用いて,コードを生成する前に思考レベルの探索を行うRethinkMCTSを紹介する。我々は,検索中の誤った思考を洗練させるために,微動コード実行フィードバックからの言語フィードバックを構築した。 RethinkMCTSは従来の検索ベースおよびフィードバックベースのコード生成ベースラインよりも優れていることを実証する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:07:28 GMT)
One-Shot Safety Alignment for Large Language Models via Optimal Dualization [64.5]
本稿では,制約付きアライメントを等価な非制約アライメント問題に還元する双対化の観点を提案する。我々は、閉形式を持つ滑らかで凸な双対函数を事前に最適化する。我々の戦略は、モデルベースと嗜好ベースのシナリオにおける2つの実用的なアルゴリズムに導かれる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:42:20 GMT)
Proximal Ranking Policy Optimization for Practical Safety in Counterfactual Learning to Rank [64.4]
本稿では,ユーザ行動に関する仮定を伴わずにデプロイの安全性を提供する,PRPO (proximal ranking Policy Optimization) という新しいアプローチを提案する。 PRPOは、安全なランキングモデルとは相容れないランキング行動を学ぶためのインセンティブを取り除きます。実験の結果,PRPOは既存の安全逆性評価手法よりも高い性能を示すことがわかった。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 22:22:27 GMT)
MFCLIP: Multi-modal Fine-grained CLIP for Generalizable Diffusion Face Forgery Detection [64.3]
フォトリアリスティック・フェイスジェネレーション手法の急速な発展は、社会やアカデミックにおいて大きな関心を集めている。既存のアプローチは主に画像モダリティを用いて顔の偽造パターンをキャプチャするが、きめ細かいノイズやテキストのような他のモダリティは完全には探索されていない。そこで本研究では,画像ノイズの多点にわたる包括的かつきめ細かなフォージェリートレースをマイニングする,MFCLIP(MF-modal Fine-fine-fine-fine-fine-fine CLIP)モデルを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:08:59 GMT)
RoboSense: Large-scale Dataset and Benchmark for Multi-sensor Low-speed Autonomous Driving [62.6]
大規模マルチセンサーデータセットであるRoboSenseは、ニアフィールドシーン理解を容易にするために構築されている。 RoboSenseには133K以上の同期データと1.4Mの3DバウンディングボックスとIDが含まれている。 270ドル(約2万2000円)と18ドル(約1万2000円)です。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:51:44 GMT)
TG-LLaVA: Text Guided LLaVA via Learnable Latent Embeddings [61.9]
視覚言語モデル(VLM)を最適化するためのテキストガイド付きLLaVA(TG-LLaVA)を提案する。学習可能な潜伏埋め込みをブリッジとして使用し、テキスト命令を分析し、視覚エンコーダに解析結果をガイダンスとして付加する。テキストのガイダンスによって、視覚エンコーダは、人間が質問を考えるとき、画像の最も関連性の高い部分に集中する方法と同様に、テキスト関連の特徴を抽出することができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 00:38:34 GMT)
Reasoning Paths with Reference Objects Elicit Quantitative Spatial Reasoning in Large Vision-Language Models [61.9]
定量的空間的推論のために設計された5つのカテゴリに271の質問があるベンチマークQ-Spatial Benchを導入する。本課題における最先端の視覚言語モデル(VLM)の性能について検討する。本研究では,参照オブジェクトを視覚的手がかりとして,VLMが量的空間的疑問に答えることを奨励するゼロショットプロンプト技術であるSpatialPromptを開発した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:45:42 GMT)
HuatuoGPT-II, One-stage Training for Medical Adaption of LLMs [61.4]
HuatuoGPT-IIは、いくつかのベンチマークで、中国の医学領域における最先端のパフォーマンスを示している。さらに、ChatGPTやGPT-4といったプロプライエタリなモデルよりも、特に中国伝統医学において優れています。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:41:01 GMT)
A Survey of Foundation Models for Music Understanding [60.8]
この研究は、AI技術と音楽理解の交差に関する初期のレビューの1つである。音楽理解能力に関して,近年の大規模音楽基盤モデルについて検討,分析,検証を行った。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 03:34:14 GMT)
DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Autonomous Driving [55.5]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。 nuScenesデータセットで行った実験は、DiFSDの優れた計画性能と優れた効率を示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:55:24 GMT)
Finetuning CLIP to Reason about Pairwise Differences [52.0]
本稿では,CLIPのような視覚言語モデルの学習手法を提案する。我々はまず,ある属性による画像のランク付け能力を大幅に向上させることを実証した。また、得られる埋め込みは埋め込み空間においてより大きな幾何学的性質に従うことを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:02:14 GMT)
SlowFast-LLaVA: A Strong Training-Free Baseline for Video Large Language Models [51.7]
本研究では,空間的セマンティクスと長時間の時間的コンテキストを協調的にキャプチャできる学習自由ビデオ大言語モデル(LLM)を提案する。これは、ビデオLLMの入力の2ストリームSlowFast設計を用いて、サンプルフレームの特徴を効果的に集約することで実現される。実験の結果, SF-LLaVAは, 既存のトレーニング不要の手法よりも広い範囲の映像タスクにおいて優れていた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:00:18 GMT)
PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.5]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。 CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:32:46 GMT)
GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.8]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:36:01 GMT)
Space3D-Bench: Spatial 3D Question Answering Benchmark [49.3]
Space3D-Benchは、Replicaデータセットのシーンに関連する1000の一般的な空間的質問と回答の集合である。本研究では,事前定義された接地真実解に基づいて,自然言語応答を評価評価するシステムを提案する。最後に,基礎モデルの世界理解をリッチな文脈検索と統合したRAG3D-Chatというベースラインを導入する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:51:00 GMT)
From Experts to the Public: Governing Multimodal Language Models in Politically Sensitive Video Analysis [48.1]
本稿では,大規模言語モデル(MM-LLM)の個人的および集団的検討を通じて,ガバナンスについて検討する。筆者らは,まず10人のジャーナリストにインタビューを行い,専門家によるビデオ解釈のベースライン理解を確立した。第2に,包括的.AIを用いた議論に携わる一般市民114名を対象にした。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 03:17:38 GMT)
Are Large Language Models Really Good Logical Reasoners? A Comprehensive Evaluation and Beyond [46.8]
大規模言語モデル(LLM)は、自然言語処理(NLP)における注目すべき革新として登場した。本論文では,このギャップを埋め,包括的に評価することを目的としている。評価の包括性を考慮すると、3つの早期代表型LSMと4つのトレンド型LSMを含む。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:49:32 GMT)
SparX: A Sparse Cross-Layer Connection Mechanism for Hierarchical Vision Mamba and Transformer Networks [45.7]
本稿では,マンバをベースとした視覚バックボーンネットワークのための効率的な層間特徴集約機構を提案する。ヒト視覚系における網膜ガングリオン細胞(RGC)にインスパイアされ、SparXと呼ばれる新しいスパース層間結合機構を提案する。我々の新しい接続機構は、様々な視覚タスクにおいて優れた性能と一般化能力を持つ。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:46:18 GMT)
GP-GPT: Large Language Model for Gene-Phenotype Mapping [44.1]
GP-GPTは、遺伝的・フェノタイプ知識表現とゲノム関連解析のための最初の専門的な大規模言語モデルである。我々のモデルは、ゲノム学、遺伝学、科学出版物において3000,000以上の用語からなる包括的コーパスで2段階にわたって微調整されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:56:20 GMT)
Deep Learning Based 3D Segmentation: A Survey [42.4]
3Dセグメンテーションは、自律運転とロボット工学の応用でコンピュータビジョンの根幹的で難しい問題である。近年、ディープラーニング技術が3Dセグメンテーションタスクの選択ツールとなっている。本稿では,ディープラーニングに基づく3Dセグメンテーション技術の最近の進歩を包括的に調査する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:05:42 GMT)
Layout Agnostic Scene Text Image Synthesis with Diffusion Models [42.4]
SceneTextGenは、事前に定義されたレイアウトステージの必要性を回避するために特別に設計された、拡散ベースの新しいモデルである。 SceneTextGenの新規性は、3つの重要なコンポーネントを統合している: 詳細なタイポグラフィ特性をキャプチャする文字レベルエンコーダと、不要なテキスト生成とマイナーな文字不正確な問題に対処する文字レベルインスタンスセグメンテーションモデルと、ワードレベルスポッティングモデルである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:46:02 GMT)
HaluEval-Wild: Evaluating Hallucinations of Language Models in the Wild [41.9]
幻覚は、臨界領域における大きな言語モデル(LLM)の信頼性に重大な課題をもたらす。野生におけるLSM幻覚を評価するために特別に設計された最初のベンチマークであるHaluEval-Wildを紹介する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:37:56 GMT)
Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards [41.1]
本稿では,人選好に基づく報酬関数のトレードオフを扱うための社会選択言語モデルを提案する。実験により、我々のモデルはより効果的で、整合性があり、バランスの取れた報酬関数を確実に選択できることを示した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:16:38 GMT)
Dynamic Fraud Detection: Integrating Reinforcement Learning into Graph Neural Networks [39.5]
グラフニューラルネットワークは、グラフ構造内の対話的関係を利用することができるディープラーニングモデルの一種である。不正行為は取引のごく一部に過ぎません詐欺師はしばしば行動を偽装する最終予測結果に悪影響を及ぼす可能性がある
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:08:31 GMT)
Formalizing, Normalizing, and Splitting the Energy Network Re-Dispatch for Quantum Annealing [37.8]
断熱量子計算(AQC)は、量子系の基底状態を近似するための確立された方法である。本研究では,エネルギーネットワーク再ディスパッチ問題における課題について検討する。本結果は,オープンソースのエネルギーネットワークシミュレーションのベースラインと比較した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:29:40 GMT)
Learning Transferable Features for Implicit Neural Representations [37.1]
Inlicit Neural representations (INR) は、逆問題やニューラルレンダリングなど、様々な応用で成功している。我々は新しいINRトレーニングフレームワークSTRAINERを導入し、新しい信号にINRを適合させるトランスファー可能な特徴を学習する。我々は,複数の領域内および領域外信号適合タスクおよび逆問題に対するSTRAINERの評価を行った。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 00:53:44 GMT)
A Survey on Diffusion Models for Recommender Systems [36.5]
本稿では,拡散モデルに関する最初の総合的な調査について紹介する。 DMは、堅牢な生成能力のため、レコメンデーターシステムのための有望なソリューションとして現れてきた。我々の分類学は、複雑なデータ分布を捉える際の拡散モデルのユニークな強みを強調している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:29:18 GMT)
CoD, Towards an Interpretable Medical Agent using Chain of Diagnosis [36.3]
CoD(Chain-of-Diagnosis)は、診断過程を医師の思考過程を反映した診断連鎖に変換する。 CoDは、意思決定における透明性を確保するために、病気の信頼性分布を出力する。診断GPTは9604の疾患を診断することができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:43:17 GMT)
RoCOCO: Robustness Benchmark of MS-COCO to Stress-test Image-Text Matching Models [36.2]
我々はMS-COCOテストセットにテキストと画像の新しい変種を作成し、新しいデータを用いて最先端(SOTA)モデルを再評価する。具体的には、単語を置換することでテキストの意味を変更し、視覚的なコンテキストを維持する視覚的に変化した画像を生成する。提案したベンチマークによる評価の結果,多くのSOTAモデルの性能劣化が確認された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:38:21 GMT)
DreamMover: Leveraging the Prior of Diffusion Models for Image Interpolation with Large Motion [35.6]
本研究では,大きな動きを持つ画像対から中間画像を生成する問題について検討する。大きな動きのため、中間的な意味情報は入力画像に欠落する可能性がある。 3つの主要コンポーネントを持つ新しいイメージフレームワークであるDreamMoverを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 04:09:12 GMT)
Towards Multi-view Graph Anomaly Detection with Similarity-Guided Contrastive Clustering [35.2]
グラフ上の異常検出は多くの実世界のアプリケーションにおいて重要な役割を果たす。類似性誘導型コントラスト損失により正規化されたオートエンコーダベースのクラスタリングフレームワークを提案し,異常ノードを検出する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:41:59 GMT)
Template-based Multi-Domain Face Recognition [34.6]
我々は,シングルソース(可視)とマルチターゲット(SWIR,長距離/遠隔,監視,体縫い)の課題に焦点をあてる。実験を通して、ターゲット領域の複雑さが増大するにつれて、優れたテンプレート生成アルゴリズムが重要となることを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:12:52 GMT)
Revisiting Physical-World Adversarial Attack on Traffic Sign Recognition: A Commercial Systems Perspective [34.4]
交通信号認識(TSR)は安全かつ正確な運転自動化に不可欠である。最近の研究により、物理世界の敵攻撃に対するTSRモデルの一般的な脆弱性が明らかになった。商用TSRシステムに対する物理世界の敵攻撃を大規模に測定する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:48:47 GMT)
CoBEV: Elevating Roadside 3D Object Detection with Depth and Height Complementarity [34.0]
我々は、新しいエンドツーエンドのモノクロ3Dオブジェクト検出フレームワークであるComplementary-BEVを開発した。道路カメラを用いたDAIR-V2X-IとRope3Dの公開3次元検出ベンチマークについて広範な実験を行った。カメラモデルのAPスコアが初めてDAIR-V2X-Iで80%に達する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:11:55 GMT)
Effectiveness of Pre-training for Few-shot Intent Classification [33.6]
本報告では,数発の意図分類における事前学習の有効性について検討する。公開データセットからラベル付き発話の小さなセットで、BERTをきめ細やかに調整することは、非常に効果的で効率的である。 IntentBERTは、新規ドメイン上の数ショットの意図分類のために、既存の事前訓練モデルの性能を容易に上回ることができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:28:00 GMT)
Latent Diffusion Models for Controllable RNA Sequence Generation [33.4]
RNAは生物学的プロセスにおける動的で多用途な分子である。我々は、事前訓練されたBERTモデルを用いて、生RNAをトークンレベルで生物学的に意味のある表現にエンコードする。次に、この潜在空間内で連続拡散モデルを開発する。我々は、より高い報酬に最適化されたRNA配列を生成することを目的として、後方拡散過程において勾配に基づくガイダンスを採用する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:04:50 GMT)
TextureDiffusion: Target Prompt Disentangled Editing for Various Texture Transfer [32.5]
各種テクスチャ転送に適用可能なチューニング不要な画像編集手法であるTextureDiffusionを提案する。自己アテンションのクエリ機能と残留ブロックの機能は、入力画像の構造を保存するために使用される。背景を維持するために、自己注意結果と中間潜伏者をブレンドする編集ローカライゼーション手法を導入する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 04:34:38 GMT)
Pathformer: Multi-scale Transformers with Adaptive Pathways for Time Series Forecasting [31.5]
適応経路を持つマルチスケールトランスであるPathformerを提案する。時間分解能と時間距離を統合してマルチスケールモデリングを行う。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 04:57:36 GMT)
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale [30.0]
私たちは13万の医療用VQAサンプルでPubMedVisionデータセットを作成します。 PubMedVisionを用いて34Bの医療MLLM HuatuoGPT-Visionを訓練し、医療マルチモーダルシナリオにおいて優れたパフォーマンスを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:25:49 GMT)
BEnDEM:A Boltzmann Sampler Based on Bootstrapped Denoising Energy Matching [29.5]
ボルツマン分布からサンプリングしたデータの代わりにエネルギー関数を与えられたニューラルサンプリングを学習する。ノイズデータのエネルギーを学習することにより,拡散型サンプル装置 ENERGYBASE-D DENOISING ENERGY MATCHING を提案する。 2次元ガウス混合モデル(GMM)と4粒子二重埋設ポテンシャル(DW-4)によるEnDEMとBEnDEMの評価を行った。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:41:30 GMT)
Enhancing Traffic Object Detection in Variable Illumination with RGB-Event Fusion [29.1]
可変照明下での交通物体検出は,従来のフレームベースカメラのダイナミックレンジの制限による情報損失が原因で困難である。本研究では、イベントストリームからシャープで完全なオブジェクト構造を抽出する新しい構造対応フュージョンネットワーク(SFNet)を提案する。提案するSFNetは,従来のカメラの知覚的境界を克服し,mAP50では8.0%,mAP50:95では5.9%,フレームベースの手法より優れている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 11:47:20 GMT)
Integrating Audio Narrations to Strengthen Domain Generalization in Multimodal First-Person Action Recognition [28.5]
ウェアラブルカメラの普及により、ファーストパーソンの活動認識が急速に伸びている。本稿では,動作,音声,外観機能を統合することにより,ドメインの一般化を改善するフレームワークを提案する。提案手法はARGO1Mデータセット上での最先端のパフォーマンスを実現し,目に見えないシナリオや場所を効果的に一般化する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 04:43:00 GMT)
Enhancing Weakly-Supervised Object Detection on Static Images through (Hallucinated) Motion [28.5]
本研究は,動作情報の統合によるWSOD手法の強化手法を提案する。この方法は、静止画像からの幻覚運動を活用して、画像データセットのWSODを改善する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:32:48 GMT)
Anatomy of Machines for Markowitz: Decision-Focused Learning for Mean-Variance Portfolio Optimization [27.8]
意思決定学習は、予測と最適化を統合して意思決定結果を改善する。 MSEは全ての資産のエラーを等しく扱うが、DFLはどのように異なる資産のエラーを減らせるのか? 本研究は,MVOにおける意思決定を最適化するために,DFLがストックリターン予測モデルをどのように調整するかを検討することを目的とする。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:37:11 GMT)
GRIN: Zero-Shot Metric Depth with Pixel-Level Diffusion [27.4]
本稿では,非構造化トレーニングデータを取り込むための効率的な拡散モデルGRINを提案する。 GRINは,ゼロショット距離単眼深度推定において,スクラッチからトレーニングした場合でも,新たな技術の確立を図っている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:32:04 GMT)
Exploiting Priors from 3D Diffusion Models for RGB-Based One-Shot View Planning [24.4]
本稿では,拡散モデルの強力な3次元生成能力を先行として活用したワンショットビュー計画手法を提案する。シミュレーションと実環境における実験により, オブジェクト再構成の品質と移動コストのバランスが良好であることが示唆された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:34:34 GMT)
Pre-Training for 3D Hand Pose Estimation with Contrastive Learning on Large-Scale Hand Images in the Wild [24.2]
我々は,ハンドCLRと呼ばれる3次元手ポーズ推定器の事前学習に適した,手動画像に基づくコントラスト学習フレームワークを提案する。実験により,データ拡張を伴う単一画像から正のペアを生成する従来のコントラスト学習手法よりも優れた結果が得られた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:45:15 GMT)
Acquiring Pronunciation Knowledge from Transcribed Speech Audio via Multi-task Learning [23.9]
マルチタスク学習(MTL)に基づく追加訓練源として書き起こし音声を利用する方法を提案する。実験の結果, ベースラインMTL法と比較して, MTL法ではPERを2.5%から1.6%に削減できることがわかった。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:00:54 GMT)
GLCONet: Learning Multi-source Perception Representation for Camouflaged Object Detection [23.9]
我々はGLCONetと呼ばれる新しいグローバルローカル協調最適化ネットワークを提案する。本稿では、まず、局所的な詳細とグローバルな長距離関係を同時にモデル化するための協調最適化戦略を設計する。実験により、異なるバックボーンを持つGLCONet法は、画像中の潜在的に重要なピクセルを効果的に活性化できることが示されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:26:17 GMT)
The 2nd FutureDial Challenge: Dialog Systems with Retrieval Augmented Generation (FutureDial-RAG) [23.8]
この課題は、3000近い高品質なダイアログを備えた実際の顧客サービスデータセットであるMobileCS2データセットの上に構築されている。本稿では,知識検索のためのトラック1と応答生成のためのトラック2という2つのタスクを定義する。我々は,2つのトラックのベースラインシステムを構築し,そのシステムが正確な検索を行い,情報的かつ一貫性のある応答を生成できるかどうかを計測する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:03:59 GMT)
Multiple Rotation Averaging with Constrained Reweighting Deep Matrix Factorization [22.5]
コンピュータビジョンとロボティクス領域では、複数の回転平均化が重要な役割を果たす。本稿では,データパターンを学習方法でマイニングするための効率的な回転平均化手法を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:50:27 GMT)
Fine-tuning Pre-trained Language Models for Few-shot Intent Detection: Supervised Pre-training and Isotropization [21.9]
等方性に向けて特徴空間を規則化し,教師付き事前学習を改善することを提案する。本研究の主目的は,アイソトロピゼーションによる教師付き事前学習の正規化を約束し,撮影意図検出の性能向上を図ることである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:11:57 GMT)
Nebula: Efficient, Private and Accurate Histogram Estimation [21.5]
本稿では,クライアント間で分散したデータの個人的ヒストグラムの差分推定システムであるNebulaを提案する。 Nebulaは、クライアントがデータをローカルにサブサンプルし、エンコードすることで、信頼できないサーバが、差分プライバシー保証を満たすためのアグリゲーションしきい値を満たすデータ値のみを学ぶことができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:55:18 GMT)
Revisit Few-shot Intent Classification with PLMs: Direct Fine-tuning vs. Continual Pre-training [21.0]
少量のラベル付きデータのみを使用して、基礎となる意図に基づいて発話を分類するために、深層学習モデルを訓練する。この課題に対するPLMの過度な適合問題は、予想されるほど深刻ではないため、継続事前学習は必須ではない可能性がある。限られた利用可能なデータの利用を最大化するために,コンテキスト拡張法を提案し,逐次自己蒸留を利用して性能を向上させる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:07:55 GMT)
Estimating Wage Disparities Using Foundation Models [20.7]
我々は、男女賃金格差を解消するために、全労働史から賃金を予測するために設計された、カスタム構築のファンデーションモデルを使用している。我々のモデルは単純なモデルよりもキャリア履歴の豊かな表現を捉え、賃金をより正確に予測する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:22:21 GMT)
Understanding Simplicity Bias towards Compositional Mappings via Learning Dynamics [20.7]
異なる視点から構成写像の特異性について検討する。この性質は、そのような写像を持つモデルがうまく一般化できる理由を説明する。単純性バイアスは通常、勾配降下によるニューラルネットワークトレーニングの本質的な特性を示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:37:12 GMT)
Vision-Language Meets the Skeleton: Progressively Distillation with Cross-Modal Knowledge for 3D Action Representation Learning [20.3]
スケルトンに基づく行動表現学習は、骨格配列を符号化することで人間の行動を理解し理解することを目的としている。クロスモーダル・コントラッシブ・ラーニングに基づく新しいスケルトンベースのトレーニング・フレームワークを提案する。提案手法は,従来の手法より優れ,最先端の結果が得られる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 03:32:03 GMT)
PersonaMark: Personalized LLM watermarking for model protection and user attribution [20.3]
テキスト透かしは、AIが生成したテキストの検出とモデル保護の問題に対する有望な解決策として浮上している。本稿では,文書構造を透かし情報の隠蔽媒体として利用する新しいテキスト透かし手法であるペルソナマークを提案する。提案手法は,モデルの振舞いを最小限に抑えながら性能を保ち,透かし情報のあいまいな挿入を可能にし,強力な透かし認識能力を示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:10:01 GMT)
COSCO: A Sharpness-Aware Training Framework for Few-shot Multivariate Time Series Classification [19.6]
シャープネス認識最小化(SAM)最適化とプロトタイプ損失関数からなる新しい学習フレームワークCOSCOを提案する。本研究では,提案手法が既存のベースライン法より優れていることを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:41:55 GMT)
Scaling Continuous Kernels with Sparse Fourier Domain Learning [19.6]
連続カーネル表現の学習において,計算効率,パラメータ効率,スペクトルバイアスの3つの課題に対処する。提案手法は, 連続カーネルの効率的なスケーリングを可能にし, 計算およびメモリ要求を大幅に削減し, ギブス現象を利用してスペクトルバイアスを緩和する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:50:52 GMT)
Towards Single-Lens Controllable Depth-of-Field Imaging via All-in-Focus Aberration Correction and Monocular Depth Estimation [19.3]
コントロール可能なDepth-of-Field(DoF)イメージングは、重くて高価なハイエンドレンズをベースとした素晴らしい視覚効果を一般的に生み出す。この研究は、MOS(Minimalist Optical Systems)の2つの大きな限界に焦点を合わせ、計算方法でシングルレンズ制御可能なDoFイメージングを実現する。 All-in-Focus (AiF) 収差補正と単眼深度推定を併用したDepth-aware Controllable DoF Imaging (DCDI) フレームワークを提案する。 Omni-Lens-Fieldにより推定される深度マップ、復元画像、深度対応PSFマップにより、シングルレンズ制御可能なDoFイメージングが可能となる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:52:16 GMT)
Universal Topology Refinement for Medical Image Segmentation with Polynomial Feature Synthesis [19.2]
医用画像分割法は、しばしばトポロジカルな正当性を無視し、下流の多くのタスクでは利用できない。 1つの選択肢は、トポロジ駆動の損失コンポーネントを含む、そのようなモデルを再訓練することである。本稿では,任意のドメイン固有のセグメンテーションパイプラインと互換性のあるプラグイン・アンド・プレイトポロジ・リファインメント法を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:07:58 GMT)
Quantum continual learning on a programmable superconducting processor [17.8]
量子分類器は,3つの異なるタスクの知識を段階的に学習し,保持することができることを示す。本研究は,複数の逐次タスクに適応可能な量子学習システムを実現するための有効な戦略を確立した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:16:56 GMT)
Convolutional Unscented Kalman Filter for Multi-Object Tracking with Outliers [17.4]
マルチオブジェクトトラッキング(MOT)は、自律運転におけるナビゲーションに不可欠な技術である。近年, トラッキング手法は, 外乱を観測するフィルタリングアルゴリズムに基づいており, トラッキング精度の低下や, オブジェクトの軌跡の喪失さえも生じている。我々は,ConvUKFが外れ値の存在下で有界な追跡誤差を持つことを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:47:34 GMT)
AACessTalk: Fostering Communication between Minimally Verbal Autistic Children and Parents with Contextual Guidance and Card Recommendation [17.3]
タブレットベースのAI通信システムであるAACessTalkについて述べる。 MVAの子供と親との有意義な交換を促進する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:23:07 GMT)
Underwater Image Enhancement via Dehazing and Color Restoration [17.3]
既存の水中画像強調法は、ヘイズとカラーキャストを統一的な劣化過程として扱う。水中画像の品質を向上させるために,視覚トランス (ViT) ベースのネットワーク (WaterFormer と呼ぶ) を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:58:20 GMT)
Minimizing PLM-Based Few-Shot Intent Detectors [17.1]
PLMをベースとしたインテント検出装置のサイズを最小化する手法について検討する。具体的には、データ拡張に大規模言語モデル(LLM)を使用し、知識蒸留に最先端のモデル圧縮法を用い、V-Pruneと呼ばれる語彙解析機構を考案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:45:50 GMT)
MesonGS: Post-training Compression of 3D Gaussians via Efficient Attribute Transformation [16.7]
3D Gaussian Splattingは、新規なビュー合成において優れた品質と速度を示す。 3D Gaussianの巨大なファイルサイズは、トランスミッションとストレージの課題を提示している。 MesonGSは、競争力のある品質を維持しながら、3Dガウシアンを著しく削減する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:58:20 GMT)
SegMamba: Long-range Sequential Modeling Mamba For 3D Medical Image Segmentation [16.5]
我々は,新しい3次元医用画像textbfSegmentation textbfMambaモデルであるSegMambaを紹介した。 SegMambaは、状態空間モデルの観点から、全ボリューム特徴モデリングに優れています。 BraTS2023データセットの実験では、SegMambaの有効性と効率が示されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:26:45 GMT)
BULKHEAD: Secure, Scalable, and Efficient Kernel Compartmentalization with PKS [16.2]
カーネルの区画化は、最小特権原理に従う有望なアプローチである。本稿では,セキュアでスケーラブルで効率的なカーネルコンパートナライズ技術であるBULKHEADを提案する。ロード可能なカーネルモジュールを分割するプロトタイプシステムをLinux v6.1で実装する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 04:11:26 GMT)
EditBoard: Towards A Comprehensive Evaluation Benchmark for Text-based Video Editing Models [16.0]
テキストベースのビデオ編集は有望な分野として現れ、テキストプロンプトに基づいたビデオの正確な修正を可能にしている。既存の評価は限定的で一貫性がなく、通常、全体的なパフォーマンスを単一のスコアで要約する。テキストベースのビデオ編集モデルの総合評価ベンチマークであるEditBoardを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:43:18 GMT)
ExploreSelf: Fostering User-driven Exploration and Reflection on Personal Challenges with Adaptive Guidance by Large Language Models [15.9]
We present ExploreSelf, a LLM-driven application designed to empower users to control their reflective journey。以上の結果から,参加者は指導的支援と行動の自由のバランスに重きを置いていることがわかった。本研究は, ユーザエンパワーメントを効果的に促進するLCM駆動型ツールの設計の意義を考察する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:25:24 GMT)
Unsupervised Hyperspectral and Multispectral Image Blind Fusion Based on Deep Tucker Decomposition Network with Spatial-Spectral Manifold Learning [15.9]
タッカー分解と空間スペクトル多様体学習(DTDNML)に基づくハイパースペクトル・マルチスペクトル画像の教師なしブラインド融合法を提案する。本手法は,様々なリモートセンシングデータセット上でのハイパースペクトルとマルチスペクトル融合の精度と効率を向上させる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:58:26 GMT)
One-Shot Learning for Pose-Guided Person Image Synthesis in the Wild [15.4]
現在のPGPIS(Pose-Guided Person Image Synthesis)法は、大量のラベル付き三重項データに大きく依存し、ジェネレータを教師付きで訓練する。 OnePoseTransは高品質なポーズ転送結果を生成し、最先端のデータ駆動方式よりも高い安定性を提供する。テストケース毎に、OnePoseTransはNVIDIA V100 GPUで約48秒でモデルをカスタマイズする。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:42:25 GMT)
ValueCompass: A Framework of Fundamental Values for Human-AI Alignment [15.4]
本稿では,心理学的理論と体系的レビューに基づく基本的価値の枠組みであるバリューを紹介する。本研究では,人間と言語モデル(LM)の価値アライメントを測定するために,実世界の4つのヴィグネットに価値を適用した。以下に示すのは、人間とLMの危険な相違を明らかにすることであり、例えば、LMは人間によってほとんど意見が一致しない「自己のゴール」のような価値観と一致している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:13:03 GMT)
A Simpler Alternative to Variational Regularized Counterfactual Risk Minimization [15.3]
本稿では,f$-GAN に基づく下界ではなく,f-divergence の直接近似を最小化することで,f-divergence 最適化の新たな選択肢を提案する。実験の結果,$f$-GANを用いた分散の最小化は期待通りには機能しないことがわかった。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:39:22 GMT)
From Challenges and Pitfalls to Recommendations and Opportunities: Implementing Federated Learning in Healthcare [15.2]
フェデレートラーニングは、複数のセンターで大規模なヘルスケア研究とコラボレーションを可能にする大きな可能性を秘めている。近年の多くの研究は、医療におけるフェデレートラーニングに基づく手法を提案または活用しているが、どちらの方法が潜在的な臨床的有用性を持っているかは定かではない。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:11:07 GMT)
Mining Path Association Rules in Large Property Graphs (with Appendix) [15.1]
アソシエーション・ルール・マイニングはアイテムセットやサブストラクチャにおける規則的なパターンをうまく発見する。パス・アソシエーション・ルール・マイニング(PARM)の問題点について紹介する。我々は,探索空間を効果的に創り出すために,対単調性特性を利用した効率的でスケーラブルなアルゴリズムPIONEERを開発した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:54:08 GMT)
LookAhead: Preventing DeFi Attacks via Unveiling Adversarial Contracts [15.1]
分散型金融(DeFi)インシデントは、30億ドルを超える経済的損害をもたらした。現在の検出ツールは、攻撃活動を効果的に識別する上で重大な課題に直面している。本稿では,敵対的契約の特定に焦点をあてた,DeFi攻撃検出のための新たな方向を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:24:34 GMT)
SITSMamba for Crop Classification based on Satellite Image Time Series [14.7]
リモートセンシング時系列データに基づく作物分類のための衛星画像時系列マンバ(SITSMamba)手法を提案する。 SITSからのより豊かな時間情報を活用するために、異なるタスクに使用するデコーダの2つのブランチを設計する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:34:15 GMT)
Extract and Diffuse: Latent Integration for Improved Diffusion-based Speech and Vocal Enhancement [14.1]
拡散に基づく生成モデルは、近年、発声と発声の強化において顕著な成果を上げている。識別モデルによって生成される潜在表現を統合して音声と音声の強調を改善する新しいスコアベース拡散モデルであるEx-Diffを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:25:08 GMT)
E-Commerce Inpainting with Mask Guidance in Controlnet for Reducing Overcompletion [13.7]
本稿では,拡散モデル生成におけるコア痛点,すなわちオーバーコンプリートを系統的に解析し,対処する。本手法は実用化において有望な成果を上げており,本分野でのインスピレーションとなる技術レポートとして機能することを願っている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:10:13 GMT)
Sharp bounds on aggregate expert error [13.5]
我々は、条件に依存しない専門家からバイナリアドバイスを集約するという古典的な問題を再考する。我々の関心事は、最適決定規則の誤り確率である。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 00:27:54 GMT)
A Hypothesis on Black Swan in Unchanging Environments [13.3]
黒い白鳥の出来事は、非常に高いリスクをもたらす統計的に稀な出来事である。まず,黒白鳥イベントを慎重に分類し,空間的な黒白鳥イベントに着目し,数学的に黒白鳥イベントの定義を定式化する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:08:44 GMT)
Resolving Inconsistent Semantics in Multi-Dataset Image Segmentation [13.1]
クラス名とラベル空間固有のクエリの埋め込みを言語ベースで組み込んだ,シンプルで効果的なマルチデータセット学習手法を提案する。本手法は,トレーニングデータセット間の不整合に拘わらず,高い性能を維持している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:18:33 GMT)
Matrix Information Theory for Self-Supervised Learning [12.7]
本稿では,最大エントロピー符号化損失を行列均一性損失として解釈する新しい手法であるMatrix-SSLを紹介する。実験の結果、Matrix-SSLはImageNetデータセットの最先端メソッドよりも優れています。また,行列クロスエントロピー損失を用いた7Bモデルを微調整することにより,表現学習を言語モデリングシステムに導入する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 04:15:20 GMT)
Conditional sampling within generative diffusion models [12.6]
生成拡散モデルにおける条件付きサンプリングに対する既存の計算手法について概説する。共同分布を利用するか、あるいは明示的な可能性を持つ(事前訓練された)境界分布に依存する重要な手法を強調します。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:48:40 GMT)
Enhancing Text Annotation through Rationale-Driven Collaborative Few-Shot Prompting [12.6]
本研究では,自動データアノテータとしての大規模言語モデル(LLM)の可能性について検討する。合理化による複数ショットプロンプト技術を用いて,テキストアノテーションにおけるLLMの性能向上を目指す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:32:21 GMT)
Constructing a Singing Style Caption Dataset [12.5]
多様な属性セットを持つ音声テキストペアデータセットであるS2Capを紹介する。 S2Capは、テキストプロンプトと、幅広い声と音楽の属性を持つオーディオサンプルのペアで構成されている。本稿では,事前学習したオーディオエンコーダの埋め込み空間の同期化に正対類似性学習を利用するCRESCENDOという新しいメカニズムを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:19:24 GMT)
Synergistic Spotting and Recognition of Micro-Expression via Temporal State Transition [12.1]
マイクロ表現の分析には、一般的に2つの主要なタスクがある: 長いビデオでマイクロ表現間隔を見つけることと、これらの間隔に関連する感情を認識することである。従来のディープラーニング手法は主にスライディングウインドウを用いた分類ネットワークに依存していた。本稿では、従来のウィンドウレベルの分類をビデオレベルの回帰に置き換える、状態空間モデルに基づく新しい時間状態遷移アーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:14:19 GMT)
CROSS-JEM: Accurate and Efficient Cross-encoders for Short-text Ranking Tasks [12.0]
トランスフォーマーベースのランキングモデルは、そのようなタスクに対する最先端のアプローチである。 CROSS-JEM(Joint Efficient Modeling)を用いたクロスエンコーダを提案する。 CROSS-JEMは、トランスフォーマーベースのモデルでクエリの複数の項目を共同でスコアすることを可能にする。最先端の精度を実現し、標準のクロスエンコーダよりも4倍低いランクのレイテンシを実現している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:05:35 GMT)
Rewind-to-Delete: Certified Machine Unlearning for Nonconvex Functions [12.0]
機械学習アルゴリズムは、データのプライバシを強制したり、腐敗または時代遅れのデータを削除したり、ユーザの忘れる権利を尊重するために、スクラッチからモデルから効率的にデータを取得することを目的としています。我々のアルゴリズムはブラックボックスであり、未学習の事前考慮なしに、バニラ勾配勾配のモデルに直接適用できる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:58:08 GMT)
Enhancing Data Quality through Self-learning on Imbalanced Financial Risk Data [11.9]
本研究では、既存の金融リスクデータセットを強化するためのデータ前処理手法について検討する。本稿では,(1)マイノリティクラスに特化された合成サンプルを生成すること,(2)バイナリフィードバックを用いてサンプルを精製すること,(3)擬似ラベルを用いた自己学習を行うこと,の3つを紹介する。我々の実験は、より堅牢な金融リスク予測システムを開発する上で重要な要素であるマイノリティ・クラス・キャリブレーションの改善に焦点を当てたTriEnhanceの有効性を明らかにした。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:59:15 GMT)
Can Large Language Models Grasp Event Signals? Exploring Pure Zero-Shot Event-based Recognition [11.6]
この研究は、イベントベースの視覚コンテンツのための大規模言語モデルの理解能力を研究する最初の研究である。 LLMは、CLIPと協調して追加のトレーニングや微調整を行うことなく、イベントベースのオブジェクト認識を実現することができることを示す。具体的には、GPT-4o/4および他の2つのオープンソースLCMが、イベントベースの視覚コンテンツを直接認識する能力を評価する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:43:03 GMT)
Famba-V: Fast Vision Mamba with Cross-Layer Token Fusion [10.9]
MambaとVision Mamba(Vim)モデルは、Transformerアーキテクチャに基づくメソッドの代替としての可能性を示している。この研究は、Vimモデルのトレーニング効率を高めるための層間トークン融合技術であるFast Mamba for Vision (Famba-V)を導入している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:02:26 GMT)
Precise Pick-and-Place using Score-Based Diffusion Networks [10.8]
ロボット操作タスクにおけるピック・アンド・プレイス操作の精度を高めるために、粗い連続ポーズ拡散法。提案手法は,RGB-Dカメラから投影されるトップダウンのRGB画像を利用し,粗いアーキテクチャを採用する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:09:09 GMT)
Improving Statistical Significance in Human Evaluation of Automatic Metrics via Soft Pairwise Accuracy [10.5]
本稿では,Pairwise Accuracy(PA)に基づく新しいメタメトリックを提案する。 SPAは2024年のWMTメートル法共有タスクの公式なシステムレベルメトリックとして選ばれた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 03:25:55 GMT)
A Simple HMM with Self-Supervised Representations for Phone Segmentation [10.3]
我々は,メルスペクトルのピーク検出が,多くの自己監督的アプローチよりも強いベースラインであることを示す。本稿では,電話セグメンテーションの境界における自己教師付き表現と特徴を用いた単純な隠れマルコフモデルを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:44:23 GMT)
Self-supervised Learning for Acoustic Few-Shot Classification [10.2]
我々は、CNNに基づく前処理と状態空間モデル(SSM)に基づく特徴抽出を組み合わせた新しいアーキテクチャを導入、評価する。実際のタスクデータに対するコントラスト学習と,それに続くラベル付きデータによる微調整を用いて,このアーキテクチャを事前学習する。本評価は, 数発の分類問題において, 最先端のアーキテクチャよりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:45:11 GMT)
ELMI: Interactive and Intelligent Sign Language Translation of Lyrics for Song Signing [10.0]
ELMIでは、リアルタイムでシンクされた歌詞のハイライトとミュージックビデオのスニペットを使って、グロースを1行ずつ編集できる。ユーザーは大きな言語モデル駆動AIとチャットして、意味、光沢、動機付け、タイミングについて議論することもできる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:01:00 GMT)
Mallows-DPO: Fine-Tune Your LLM with Preference Dispersions [9.7]
直接選好最適化(DPO)は、人間のフィードバックによる強化学習を改善するための一般的なアプローチとして現れている。 Mallows の選好ランク理論に触発されて,新しいアプローチである Mallows-DPO を開発した。このアプローチの際立った特徴は、人選好のプロンプトへの分散を反映する分散指標である。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:57:04 GMT)
A Classification-by-Retrieval Framework for Few-Shot Anomaly Detection to Detect API Injection Attacks [9.7]
本稿では,2つの主要部品からなる非教師なし数発の異常検出フレームワークを提案する。まず、FastTextの埋め込みに基づいたAPI専用の汎用言語モデルをトレーニングする。次に,近似Nearest Neighborサーチを分類・検索手法として用いた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:31:13 GMT)
Aegis: A Decentralized Expansion Blockchain [9.5]
本稿では,プライマリチェーンの利害関係に基づく拡張チェーンであるAegisについて,バウンドプライマリチェーンの書き込み時間を仮定する。 Aegis は Aegis ブロックからプライマリブロックへの参照を使用して委員会を定義し、プライマリチェーンのチェックポイントで決定を継続し、前回が廃止された場合、プライマリチェーンにリセットして新しい委員会を設置する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:24:15 GMT)
Mismatched: Evaluating the Limits of Image Matching Approaches and Benchmarks [9.4]
2次元画像からの3次元3次元再構成はコンピュータビジョンにおける活発な研究分野である。伝統的にこの作業にはパラメトリック技術が用いられてきた。近年の進歩は、学習ベースの方法にシフトしている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:02:12 GMT)
Learning Rate Optimization for Deep Neural Networks Using Lipschitz Bandits [9.4]
適切に調整された学習率によって、より高速なトレーニングとテストの精度が向上する。本稿では,ニューラルネットワークの学習速度を調整するためのLipschitz bandit-drivenアプローチを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:21:55 GMT)
One Shot is Enough for Sequential Infrared Small Target Segmentation [9.4]
赤外線小ターゲットシーケンスはフレーム間に強い類似性を示し、リッチなコンテキスト情報を含む。本稿では,SAMのゼロショット一般化能力を逐次IRSTSに完全に適応させるワンショット・トレーニングフリーな手法を提案する。実験の結果,現状のIRSTS法に匹敵する性能を達成するためには,本手法では1ショットしか必要としないことがわかった。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:28:01 GMT)
Towards Data-Centric RLHF: Simple Metrics for Preference Dataset Comparison [9.3]
選好データセットを、スケール、ラベルノイズ、情報内容の3つの視点で体系的に研究する。我々の研究は、RLHFのトレーニング効率と反復的なデータ収集を支援する視点を提供することで、アライメントに対するデータ中心のアプローチに向けた第一歩です。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 03:55:03 GMT)
Confidence Estimation for LLM-Based Dialogue State Tracking [9.3]
大規模言語モデル(LLM)に基づく会話型AIシステムでは,モデルの出力に対する信頼度の推定が重要である。オープン・アンド・クローズド・ウェイト LLM に提案するアプローチを含む,手法の徹底的な探索を行う。以上の結果から, 微調整式オープンウェイトLLMはAUC性能が向上し, 信頼性スコアの校正精度が向上することが示唆された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:44:26 GMT)
Generalizing Alignment Paradigm of Text-to-Image Generation with Preferences through $f$-divergence Minimization [9.2]
本研究は,テキスト・ツー・イメージモデルのアライメントパラダイムにおける逆Kulback-Leibler分散を$f$-divergenceに拡張することに焦点を当てる。本研究では,異なる分散制約下で,画像テキストアライメント性能,人的価値アライメント性能,世代多様性性能の総合評価を行う。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:46:03 GMT)
Privacy Requirements and Realities of Digital Public Goods [9.1]
デジタル・パブリック・グッズ(DPG)は、国連(UN)の持続可能な開発目標に対応するためのオープンソースデジタル製品である。 DPGは機密データを処理できるため、国連はDPGのファーストオーダー要件としてユーザプライバシを確立している。 DPGのプライバシーリスクは、現在一部がDPG標準によって管理されている。本研究は、適切なプライバシー保護を確保するため、現行のDMG標準の有効性について検討する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 01:48:06 GMT)
ELSA: Exploiting Layer-wise N:M Sparsity for Vision Transformer Acceleration [8.8]
N:M$ sparsityは、ますます多くのアクセラレーターがサポートする新しいモデル圧縮メソッドである。 ELSA, Exploiting Layer-wise $N:M$ Sparsity for ViTsを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:14:24 GMT)
ContractTinker: LLM-Empowered Vulnerability Repair for Real-World Smart Contracts [8.8]
スマートコントラクトは、特に現実世界の脆弱性に直面している場合、攻撃者によって悪用される可能性がある。このリスクを軽減するため、開発者はプロジェクトのデプロイ前に潜在的な脆弱性を特定するために、サードパーティの監査サービスに依存することが多い。既存のパターンベースの修復ツールは、高レベルのセマンティック理解が欠如しているために、現実世界の脆弱性に対処できないことが多い。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:24:01 GMT)
Bringing motion taxonomies to continuous domains via GPLVM on hyperbolic manifolds [8.4]
人間の動きは、人間の動きと環境との相互作用の仕方を分類する高レベルの階層的抽象化として機能する。本稿では,関連する階層構造を捉えるハイパーボリック埋め込みを用いて分類データをモデル化することを提案する。本モデルでは,既存の分類群や新分類群の未確認データを適切にエンコードし,EuclideanおよびVAEベースの分類群よりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:40:59 GMT)
DARDA: Domain-Aware Real-Time Dynamic Neural Network Adaptation [8.3]
TTA(Test Time Adaptation)は、入力に影響を及ぼす破損やノイズの存在下でのディープニューラルネットワーク(DNN)の性能劣化を軽減するための実用的なソリューションとして登場した。このような問題に対処するためにドメイン対応リアルタイム動的適応(DARDA)を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:49:30 GMT)
VGG-Tex: A Vivid Geometry-Guided Facial Texture Estimation Model for High Fidelity Monocular 3D Face Reconstruction [8.2]
VGG-Texは、高忠実度モノクロ3D顔再構成用に設計された新しいモデルである。このアプローチの核心は、二次元紫外線テクスチャ推定の結果を高めるために、3Dパラメトリック先行値を活用することである。本手法はテクスチャ再構築性能を既存の最先端手法と比較して大幅に向上させる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:10:31 GMT)
From Width-Based Model Checking to Width-Based Automated Theorem Proving [8.1]
本稿では,ワイドベースモデルチェックアルゴリズムをグラフ理論の妥当性を検証できるアルゴリズムに変換するための一般的なフレームワークを提案する。我々のフレームワークはモジュラーであり、木幅や斜め幅を含むグラフのいくつかのよく研究された幅測度に対して適用することができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:28:05 GMT)
Reducing Events to Augment Log-based Anomaly Detection Models: An Empirical Study [8.1]
異常検出の文脈におけるログイベントの自動削減のための効率的な手法であるLogCleanerを提案する。実験の結果は、異常検出におけるログイベントの70%以上を削減し、モデルの推論速度を約300%高速化するLogCleanerの能力を強調している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:32:30 GMT)
AlpaPICO: Extraction of PICO Frames from Clinical Trial Documents Using LLMs [8.1]
近年,臨床治験報告の発行が急増しており,体系的レビューの実施が困難になっている。臨床試験から人口、介入、比較、アウトカム(PICO)を自動的に抽出することは、体系的レビューを手作業で精査する伝統的な時間的プロセスを軽減することができる。本研究では, LLMの事前学習期間中に収集されたLarge Language Models (LLMs) の事前学習知識を用いてICL戦略を採用し, PICO関連用語を自動的に抽出する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 11:53:24 GMT)
NARF24: Estimating Articulated Object Structure for Implicit Rendering [8.0]
本稿では,少数のシーンに共通するニューラルラジアンス場(NeRF)の表現を学習する手法を提案する。この表現は、暗黙の空間部分ローカライゼーションを生成するために、部分ベースのイメージセグメンテーションと組み合わせられる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:06:46 GMT)
Flexible Diffusion Scopes with Parameterized Laplacian for Heterophilic Graph Learning [7.8]
パラメータ化されたラプラシア行列の新たなクラスを提案し、ノード間の拡散距離を制御する柔軟性を確実に提供する。ラプラシアンのパラメータが拡散範囲の柔軟性を実現することを示す。フレキシブルな拡散範囲を持つ2つのGNN、すなわち拡散型グラフ畳み込みネットワーク(PDGCN)とグラフ注意ネットワーク(PD-GAT)を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 22:52:46 GMT)
Rail-only: A Low-Cost High-Performance Network for Training LLMs with Trillion Parameters [7.3]
本稿では,大規模言語モデル(LLM)をハイパースケールでトレーニングするための,低コストなネットワークアーキテクチャを提案する。この設計をRailオンリーネットワークと名付け,ネットワークコストを38%から77%削減しながら,同じトレーニング性能を実現することを示す。私たちのアーキテクチャは、全トラフィックに対して8.2%から11.2%の完了時間オーバーヘッドしか持たない、全対全通信を備えたMixture-of-Expert(MoE)モデルもサポートしています。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:04:30 GMT)
Dreaming is All You Need [6.7]
本研究では,探索と精度のバランスをとるために,SleepNetとDreamNetという2つの新しいディープラーニングモデルを紹介する。 SleepNetは、事前訓練されたエンコーダモデルを使用して教師あり学習と教師なし睡眠のステージをシームレスに統合する。 DreamNetは、隠れた状態を再構築するために完全なエンコーダ・デコーダフレームワークを使用しており、人間の"ドレーミング"プロセスを模倣している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:17:03 GMT)
Reliable Multi-View Learning with Conformal Prediction for Aortic Stenosis Classification in Echocardiography [6.5]
得られた画像は、しばしば3次元解剖学の2次元断面であり、重要な解剖学的詳細を欠いている可能性がある。トレーニングセット内の弱い情報入力に不確実性を導入するデータ中心の手法であるRe-Training for Uncertainty (RT4U)を提案する。共形予測技術と組み合わせると、RT4Uは、基底真理クラスを含むことが保証される適応的な大きさの予測セットを高精度に得ることができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:06:06 GMT)
Veridical Data Science for Medical Foundation Models [6.5]
新しい基礎モデル(FM)は、データサイエンスの文化的変化をもたらした。大量の非構造化データに基づいて事前訓練されたFMは、様々な臨床タスクや質問に適応することができる。この新しいワークフローは、Veridical Data Scienceの原則に挑戦する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:44:38 GMT)
NEVLP: Noise-Robust Framework for Efficient Vision-Language Pre-training [6.3]
本稿では,事前学習の少ない視覚言語事前学習のためのノイズロバストフレームワークを提案する。具体的には、凍結した画像エンコーダと大きな言語モデルとのモダリティギャップを変換器でブリッジする。ノイズ適応学習と概念強化学習の2つの革新的な学習戦略を導入する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 01:54:17 GMT)
Conformal Off-Policy Prediction for Multi-Agent Systems [6.3]
オフポリシィ予測(OPP)は、安全クリティカルシステムのデータ駆動分析における最重要課題である。マルチエージェントシステムに関わるOPP問題を解くための最初の共形予測手法であるMA-COPPを紹介する。 MA-COPPの重要な貢献は、エージェント軌道の出力空間の列挙や徹底的な探索を避けることである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:03:26 GMT)
Generating Synthetic Free-text Medical Records with Low Re-identification Risk using Masked Language Modeling [6.2]
Masked Language Modeling (MLM) を用いた合成自由テキスト医療記録を生成するシステムを提案する。本システムは,重要な多様性を導入し,再識別リスクを最小限に抑えつつ,記録の重要な情報を保存するように設計されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:11:01 GMT)
MindScape Study: Integrating LLM and Behavioral Sensing for Personalized AI-Driven Journaling Experiences [6.1]
MindScapeは受動的に収集された行動パターンを統合することで、AIによるジャーナリングの新しいアプローチを開拓した。この統合は、高度にパーソナライズされ、コンテキスト対応のジャーナリングエクスペリエンスを生み出します。大学生20名を対象に8週間の探索的研究を行い,MindScapeアプリの有効性を実証した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 01:10:46 GMT)
Comparison of Large Language Models for Generating Contextually Relevant Questions [6.1]
GPT-3.5、Llama 2-Chat 13B、T5 XXLは、微調整なしで大学のスライドテキストから質問を生成する能力を比較する。その結果, GPT-3.5 と Llama 2-Chat 13B は T5 XXL よりも小さなマージン, 特に明瞭度と質問応答アライメントで優れていた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:23:10 GMT)
Causal Inference with Large Language Model: A Survey [5.7]
因果推論は医学や経済学といった様々な分野において重要な課題となっている。自然言語処理(NLP)の最近の進歩は、従来の因果推論タスクに有望な機会をもたらした。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:43:11 GMT)
A Survey of Out-of-distribution Generalization for Graph Machine Learning from a Causal View [5.7]
グラフ機械学習(GML)は、幅広いタスクでうまく適用されている。 GMLは、アウト・オブ・ディストリビューション(OOD)データを一般化する上で大きな課題に直面している。近年の進歩は、これらの一般化の課題を克服する上で、因果関係によるアプローチの重要な役割を浮き彫りにしている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:41:18 GMT)
Style Transfer: From Stitching to Neural Networks [5.5]
本稿では,画像処理における2つのスタイル転送手法を比較した。従来の方法では、既存の画像から小さなパッチを縫い合わせることで、新しい画像を合成する。また、セグメンテーションネットワークを使用して、前景オブジェクトを分離し、背景のみにスタイル転送を適用する、現代的な機械学習ベースのアプローチである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:50:43 GMT)
Entity-Aware Self-Attention and Contextualized GCN for Enhanced Relation Extraction in Long Sentences [5.5]
本稿では,入力文の構文構造とシーケンスの意味的文脈を効率的に組み込んだ,エンティティを意識した自己意図型GCN(ESC-GCN)を提案する。本モデルでは,既存の依存性ベースモデルやシーケンスベースモデルと比較して,パフォーマンスの向上を実現している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:50:51 GMT)
YOLO-Stutter: End-to-end Region-Wise Speech Dysfluency Detection [5.4]
YOLO-Stutterは、時間的精度でディファレンシを検出する最初のエンドツーエンド手法である。 VCTK-StutterとVCTK-TTSは、繰り返し、ブロック、欠落、置換、延長といった自然な発声障害をシミュレートする。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:20:19 GMT)
RandALO: Out-of-sample risk estimation in no time flat [5.2]
クロスバリデーション(CV)は、リスク推定のデファクトスタンダードとして機能するが、計算コスト(リーブ・ワン・アウト・CV)に対して高いバイアス(K$fold CV)の取引が不十分である。本稿では,高次元におけるリスクの一貫した推定器であるとともに,計算コストも$K$-fold CVよりも低いランダム化された約1回のリスク推定器を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:10:03 GMT)
TSELM: Target Speaker Extraction using Discrete Tokens and Language Models [5.2]
TSELMは、離散トークンと言語モデルを活用する新しいターゲット話者抽出ネットワークである。我々は,TSELMが音声品質の優れた結果と,音声の可聴性に匹敵する結果が得られることを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:19:17 GMT)
Steering Conversational Large Language Models for Long Emotional Support Conversations [5.0]
我々はLlama-2とLlama-3のモデルスイートのステアビリティに着目し、相互作用を通してこれらの戦略を維持する能力について検討する。これを評価するために、注意マップを通して、モデルが引き起こした戦略への固執を定量化する戦略関連注意尺度(SRA)を導入する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:58:45 GMT)
Measuring Recency Bias In Sequential Recommendation Systems [4.8]
シーケンシャルレコメンデーションシステムにおける頻度バイアス(Recency bias)とは、ユーザセッション内の最近の項目に過度に重きを置くことを指す。このバイアスは、レコメンデーションのセレンディピティーを低下させ、システムの長期的関心を捉える能力を妨げます。本論文は,リレーレンシバイアスの定量化に特化して設計された,単純かつ効果的な新しい計量法を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:02:50 GMT)
The Optimality of (Accelerated) SGD for High-Dimensional Quadratic Optimization [4.7]
勾配降下(SGD)は機械学習、特にニューラルネットワークトレーニングにおいて広く使われているアルゴリズムである。正準2次最適化や線形回帰のSGDに関する最近の研究は、適切な高次元設定で十分に一般化できることを示している。本稿では,ステップサイズスケジュールと運動量指数の2つの基本成分を持つSGDについて検討する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:20:03 GMT)
LongGenBench: Benchmarking Long-Form Generation in Long Context LLMs [4.5]
ロングフォームテキスト生成は、設計提案やクリエイティブな文章作成といったアプリケーションには不可欠である。新しいロングフォームテキスト評価ベンチマークであるLongGenBenchは、生成されたロングテキストシーケンス内の特定のイベントを識別するモデルの能力をテストする。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:40:01 GMT)
KAN v.s. MLP for Offline Reinforcement Learning [4.4]
Kolmogorov-Arnold Networks (KAN)は、機械学習における新たなニューラルネットワークアーキテクチャである。本稿では,オフライン強化学習のためのアクターおよび批評家ネットワークへのkanの組み入れについて検討する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:52:44 GMT)
Privacy-Preserving Hierarchical Model-Distributed Inference [4.3]
本稿では、階層的な設定のためのプライバシ保護機械学習(ML)推論プロトコルの設計に焦点を当てる。私たちの目標は、データとMLモデルの両方にプライバシを提供しながら、ML推論をスピードアップすることにあります。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 22:27:16 GMT)
Exponential Quantum Speedup for Simulation-Based Optimization Applications [4.3]
シミュレーション問題の線形性を特徴とするQuSOのLinQuSOサブクラスに着目した。我々は、LinQuSO問題の大規模な部分群が、そのシミュレーション成分に関して指数的量子スピードアップで解けることを証明した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:54:00 GMT)
Stutter-Solver: End-to-end Multi-lingual Dysfluency Detection [4.1]
Stutter-r: 正確な型と時刻の書き起こしで逆流を検出するエンドツーエンドのフレームワーク。 VCTK-Pro、VCTK-Art、AISHELL3-Proは自然発声障害をシミュレートする。提案手法は, 利用可能なすべてのディフルエンシコーパスに対して, 最先端の性能を実現する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:11:00 GMT)
Decentralized Learning in General-sum Markov Games [3.9]
我々はマルコフ近電位関数を導入し、MNPFがアクター批判に基づく分散学習ダイナミクスのNash平衡の収束解析において中心的な役割を果たすことを示す。本研究は,マルチエージェントシステムにおける分散学習の分析に新たな視点を与え,実世界の相互作用の複雑さに対処する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:22:48 GMT)
Thesis proposal: Are We Losing Textual Diversity to Natural Language Processing? [3.8]
ニューラルネットワーク翻訳で使用されるアルゴリズムは、ほとんどの入力タイプに有益であるが、非典型的テキストの処理に有害な帰納的バイアスを持つかどうかを問う。我々は,NMTシステムがこのようなテキストの多様性を維持するのに苦戦しているかどうかを調べるために,一連の実験を行った。我々の最終的な目標は、出力の統計特性の分布に一様性を課さない代替手段を開発することである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 01:06:07 GMT)
PROSE-FD: A Multimodal PDE Foundation Model for Learning Multiple Operators for Forecasting Fluid Dynamics [3.8]
不均一な2次元物理系の同時予測のためのゼロショット多モードPDE基礎モデルを提案する。これらの系は浅い水方程式と、圧縮不可能で圧縮不能な流れを持つナビエ・ストークス方程式を含む。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:20:15 GMT)
Quantum Margulis Codes [3.3]
最近、LinとPryadkoは量子2ブロック群代数符号を発表した。 2ブロック代数符号を得るためにマルグリスの構成を変更する方法を示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:08:34 GMT)
Federated Learning in Adversarial Environments: Testbed Design and Poisoning Resilience in Cybersecurity [3.3]
本稿では,フェデレートラーニング(FL)テストベッドの設計と実装に焦点を当て,サイバーセキュリティへの応用に焦点を当てた。 Flowerフレームワークを使用して構築されたテストベッドは、さまざまなFLフレームワークの実験を容易にし、そのパフォーマンス、スケーラビリティ、統合の容易さを評価します。モデルとデータの整合性の両方をターゲットにした総合的な中毒検査は、敵の条件下でのシステムの堅牢性を評価する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:04:25 GMT)
Recent advances in deep learning and language models for studying the microbiome [3.3]
深層学習と言語モデルのマイクロバイオームおよびメダゲノミクスデータ解析への応用について概説する。タンパク質/ゲノム言語モデリングとその微生物研究への貢献について概説する。また,新しいビロミクス言語モデリング,生合成遺伝子クラスタの予測,メタゲノミクス研究のための知識統合などの応用についても論じる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:32:31 GMT)
A Note on the Convergence of Denoising Diffusion Probabilistic Models [3.2]
拡散モデルにより得られたデータ生成分布と分布との間のワッサーシュタイン距離の定量的上限を導出する。この分野でのこれまでの研究とは異なり、我々の結果は学習したスコア関数を仮定しない。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:53:05 GMT)
Open-World Test-Time Training: Self-Training with Contrast Learning [2.9]
Open-World Test-Time Training (OWTTT)は、ディープラーニングモデルを未知のドメイン分布に一般化するという課題に対処する。既存のTTメソッドは、強力なout-of-Distribution(OOD)データに直面すると、パフォーマンスを維持するのに苦労することが多い。オープンワールド・ダイナミック・コントラシブ・ラーニング(OWDCL)は,コントラッシブ・ラーニング(コントラスト・ラーニング,コントラスト・ラーニング,コントラスト・ラーニング)を利用して,正のサンプル・ペアを増強する革新的な手法である。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:36:26 GMT)
Language Models and Retrieval Augmented Generation for Automated Structured Data Extraction from Diagnostic Reports [2.9]
この研究は、2つのデータセットを利用していた:7,294の放射線診断報告は、BT-RADS(Brain tumor Reporting and Data System)スコアに注釈付けされ、2,154の病理診断報告は、isocitrate dehydrogenase(IDH)変異のステータスに注釈付けされた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:21:45 GMT)
GFlowNet Pretraining with Inexpensive Rewards [2.9]
A-GFN(Atomic GFlowNets)は、個々の原子をビルディングブロックとして活用し、薬物のような化学空間をより包括的に探索する基礎的な生成モデルである。オフラインな薬物様分子データセットを用いた教師なし事前学習手法を提案する。我々は、目標条件付き微調整プロセスを実装し、A-GFNを適応させて特定の目標特性に最適化する手法をさらに強化する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 11:42:17 GMT)
A Comprehensive Methodological Survey of Human Activity Recognition Across Divers Data Modalities [2.9]
人間活動認識(HAR)システムは、人間の行動を理解し、それぞれの行動にラベルを割り当てることを目的としている。 HARは、RGB画像やビデオ、スケルトン、深度、赤外線、ポイントクラウド、イベントストリーム、オーディオ、アクセラレーション、レーダー信号など、さまざまなデータモダリティを利用することができる。本稿は,2014年から2024年までのHARの最新の進歩に関する包括的調査である。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:04:44 GMT)
Optimizing the Songwriting Process: Genre-Based Lyric Generation Using Deep Learning Models [2.7]
本プロジェクトは,ディープラーニング技術を用いて,従来の曲の書き起こしプロセスを簡素化することを目的としている。我々は、歌詞を個々の詩にパースするためにトークンを用いた独自の前処理フォーマットを開発した。その結果, ベースラインモデルでは高いリコール(ROUGE)が得られたが, どちらのモデルにも類似の精度(BLEU)が得られた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:32:46 GMT)
Detection Made Easy: Potentials of Large Language Models for Solidity Vulnerabilities [2.6]
本稿では,大規模言語モデル (LLM) の使用状況と,そのソリティにおけるTop Ten脆弱性の検出能力について,包括的に検討する。このデータセットは、ベンチマークを使用して、GPT-3.5 TurboやGPT-4o Miniといったクローズドソースモデルとともに、CodeLlama、Llama2、CodeT5、FalconといったオープンソースのLLMのパフォーマンスを比較します。以上の結果から,SmartVDはオープンソースモデルよりも優れており,GPT-3.5やGPといったクローズドソースベースモデルよりも優れていることがわかった。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:16:58 GMT)
Time-Series Forecasting and Sequence Learning Using Memristor-based Reservoir System [2.6]
我々は,効率的な時間的データ処理とオンライン学習を兼ね備えたmemristorベースのエコー状態ネットワークアクセラレータを開発した。提案した設計は、負荷エネルギー消費と気象条件の予測など、実世界のタスクを含む様々なデータセットを用いてベンチマークされる。このシステムはデバイス故障に対して10%以下で合理的な堅牢性を示すことが観察された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:10:57 GMT)
Enhancing Lesion Segmentation in PET/CT Imaging with Deep Learning and Advanced Data Preprocessing Techniques [2.5]
本研究は,PET/CT画像における病変セグメンテーションの深層学習を用いた。我々の方法論的アプローチは、モデルの堅牢性と一般化性を保証するために、ロバストな前処理とデータ拡張技術を含む。本研究はPET/CT画像における前処理および拡張戦略の標準化に寄与することを目的としている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:27:34 GMT)
Automated Lesion Segmentation in Whole-Body PET/CT in a multitracer setting [2.5]
本研究は,マルチトラックPET画像の自動セグメンテーションワークフローの性能を評価することに焦点を当てた。これらの知見は、診断や患者固有の治療計画の強化に重要な洞察を与えるものと期待されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:32:29 GMT)
Machine learning assisted screening of metal binary alloys for anode materials [2.2]
本研究では,合金陽極材料の発見と最適化を高速化するための機械学習支援戦略を提案する。我々はMPとAFLOWデータベースから膨大なデータセットをコンパイルし、何万もの合金組成と特性を包含した。実験データと比較し, 合金陽極の電位および比容量を精度良く予測した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 01:56:09 GMT)
Using the Empirical Attainment Function for Analyzing Single-objective Black-box Optimization Algorithms [2.1]
実験的達成関数(EAF)は,対象とするECDFに対していくつかの利点がある。 EAFは、関数毎の品質目標を定義する必要はなく、パフォーマンスの違いをより正確に捉え、追加の要約統計を使用することを可能にしている。 EAFのアクセシビリティを容易にするため、IOHanalyzerプラットフォームにモジュールを統合して計算する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:28:35 GMT)
OpenSU3D: Open World 3D Scene Understanding using Foundation Models [2.1]
オープンセット, インスタンスレベルの3次元シーン表現を構築するための, 新規でスケーラブルなアプローチを提案する。既存の方法は、事前に構築された3Dシーンと、ポイント単位の機能ベクトル学習によるスケーラビリティの問題を必要とする。ゼロショット一般化機能を示すScanNetとReplicaのデータセットから,複数のシーンに対する提案手法の評価を行った。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:14:42 GMT)
Rethinking KenLM: Good and Bad Model Ensembles for Efficient Text Quality Filtering in Large Web Corpora [2.1]
我々は、2つの対照的なKenLM(GoodとBad KenLM)を利用するアンサンブルアプローチを提案する。実験の結果,提案手法は高品質なコンテンツを保存しながら,ノイズを著しく低減することがわかった。このことから,本手法は資源制約環境における計算オーバーヘッドを最小限に抑えた実用的な手法である可能性が示唆された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:27:56 GMT)
MpoxMamba: A Grouped Mamba-based Lightweight Hybrid Network for Mpox Detection [2.0]
世界保健機関(WHO)は、ムポックスウイルスの感染が世界中で拡大し続けており、国際保健機関(WHO)による国際的懸念の公衆衛生上の緊急事態と宣言している。深層学習モデルに基づく検出システムは、広範囲な展開に適しているため、mpoxの発生を緩和するために不可欠である。効率的なmpox検出のためのMpoxMambaという軽量ハイブリッドアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:52:07 GMT)
HJ-sampler: A Bayesian sampler for inverse problems of a stochastic process by leveraging Hamilton-Jacobi PDEs and score-based generative models [1.9]
本稿では,ブラウン運動文脈におけるコールホップ変換(Cole-Hopf transform)と呼ばれるログ変換に基づく。本稿では,HJ-sampler という新しいアルゴリズムを開発し,与えられた終端観測による微分方程式の逆問題に対する推論を行う。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:30:54 GMT)
Security Testbed for Preempting Attacks against Supercomputing Infrastructure [1.9]
本稿では,National Center for Supercomputing Applicationsにおけるスーパーコンピュータのライブトラフィックに埋め込まれたセキュリティテストベッドについて述べる。目的は、ペタスケールのスーパーコンピュータで攻撃プリエンプション、すなわちシステムの妥協とデータ漏洩を実証することである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 03:42:47 GMT)
Extrapolative ML Models for Copolymers [1.9]
機械学習モデルは、材料特性の予測に徐々に使われてきた。これらのモデルは本質的に補間的であり、物質の既知の特性範囲外の候補を探索するための有効性は未解決である。本稿では,MLモデルの外挿能力,トレーニングデータセットのサイズと範囲,学習アプローチとの関係について検討する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 11:02:01 GMT)
Shannon entropy in quasiparticle states of quantum chains [1.9]
自由ボゾン鎖およびフェルミオン鎖の準粒子励起状態におけるシャノンエントロピーとそのサブシステムおよびサブシステムシャノン相互情報について検討する。単一粒子および二重粒子状態に対しては、スケーリング限界における自由ボゾン鎖とフェルミオン鎖の様々な解析式を導出する。また, ボゾン系, フェルミオン系およびXXX系における三重粒子および四重粒子状態のシャノンエントロピーと相互情報の数値計算を行った。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:06:30 GMT)
Machine Learning for Analyzing Atomic Force Microscopy (AFM) Images Generated from Polymer Blends [1.8]
高分子膜から得られた原子間力顕微鏡画像内の領域を特定するために,教師なし学習技術を用いた新しい機械学習ワークフローを提案する。このワークフローの目的は、2種類のポリマードメインの空間的位置を手動の介入をほとんど行わずに同定することである。上記の課題に適用可能なコンピュータビジョンや信号処理など,他の分野で使用されている既存手法について概観する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:42:16 GMT)
PolyLUT-Add: FPGA-based LUT Inference with Wide Inputs [1.7]
この研究はPolyLUT-Addを導入し、これは精度を向上させるために$A$ PolyLUTサブニューロンを組み合わせることによってニューロンの接続性を高める技術である。我々は,MNIST,Jet Substructure Classification,Network Intrusion Detectionベンチマークに対する実装評価を行い,同様の精度でPolyLUT-AddがLUTの2.0-13.9times$と1.2-1.6times$の遅延低減を実現していることを確認した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:32:18 GMT)
Loneliness Forecasting Using Multi-modal Wearable and Mobile Sensing in Everyday Settings [1.7]
本研究では、スマートリングや時計などのウェアラブルデバイスを用いて、孤独の初期の生理的指標を監視する。スマートフォンは初期の孤独の兆候を捉えるために使われていますパーソナライズされたモデルの開発を通じて、7日間の孤独度予測において、顕著な精度 0.82 と F-1 スコア 0.82 を達成した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:33:02 GMT)
On the Effect of Robot Errors on Human Teaching Dynamics [1.7]
ロボットエラーの存在と重大さが、人間の教示力学の3次元にどのように影響するかを考察する。結果は、人々はロボットにエラーを教えるのにより多くの時間を費やす傾向があることを示している。対話型学習のための効果的なインタフェースを設計するための貴重な洞察を提供する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:02:34 GMT)
Leveraging Open-Source Large Language Models for Native Language Identification [1.6]
ネイティブ言語識別(NLI)は、法医学、マーケティング、第二言語習得に応用されている。本研究では,オープンソース生成型大規模言語モデル(LLM)をNLIに適用する可能性について検討する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:14:18 GMT)
COBRA -- COnfidence score Based on shape Regression Analysis for method-independent quality assessment of object pose estimation from single images [1.6]
本稿では,単一画像意味解析に依存するポーズ推定手法の一般的なアルゴリズムを提案する。このアルゴリズムは、複数のガウス過程を組み合わせた軽量な配置形状表現を用いる。我々の信頼度尺度は、形状テンプレートへの画素バックプロジェクションの平均混合確率からなる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:47:19 GMT)
Model Selection Through Model Sorting [1.5]
ネスト型経験リスク (NER) と呼ばれるモデル順序選択法を提案する。 UCRデータセットでは、NER法はUCRデータセットの分類の複雑さを劇的に減らす。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:43:59 GMT)
Triadic Temporal Exponential Random Graph Models (TTERGM) [1.4]
TERGMは、複雑なネットワークにおけるエッジ形成と除去の時間パターンを推測するために用いられる。我々は,我々のTTERGMモデルが,GitHubのネットワークデータ上でのベンチマーク手法と比較して,精度の向上と精度の向上を実現していることを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 03:16:10 GMT)
Random Walk on Pixel Manifolds for Anomaly Segmentation of Complex Driving Scenes [1.4]
我々はRWPM(Random Walk on Pixel Manifolds)と呼ばれる新しい手法を提案する。 RWPMはランダムウォークを用いて画素間の固有の関係を明らかにし、画素埋め込みを洗練させる。実験の結果、RWPMは既存の異常セグメンテーション法の性能を一貫して改善していることがわかった。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 00:55:55 GMT)
Learning Two-factor Representation for Magnetic Resonance Image Super-resolution [1.3]
2要素表現に基づくMR画像超解像法を提案する。具体的には、強度信号を学習可能な基底と係数の線形結合に分解する。提案手法は最先端の性能を達成し,より優れた視覚的忠実度とロバスト性を実現する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:32:24 GMT)
Language Models Learn Metadata: Political Stance Detection Case Study [1.2]
本稿では,メタデータを政治的スタンス検出タスクに組み込むための最適な方法について検討する。我々の単純なベースラインは、党員情報のみを用いて、現在の最先端を超越していることが示される。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:57:41 GMT)
Towards understanding evolution of science through language model series [1.0]
AnnualBERTは、科学的テキストの時間的進化を捉えるために設計された一連の言語モデルである。 2008年まで発行された170万のarXiv論文の全文をスクラッチから事前訓練したRoBERTaモデルと、年間ベースでarXiv論文の漸進的に訓練されたモデルのコレクションで構成されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:15:05 GMT)
Wasserstein F-tests for Fréchet regression on Bures-Wasserstein manifolds [1.0]
ビュール・ワッサーシュタイン多様体上のフレシェレグレッションが発展する。非関連性の零仮説のテストが提案されている。結果は,提案した試験が所望の有意な程度に有意であることを示している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 04:45:46 GMT)
Cyber Risk Assessment for Cyber-Physical Systems: A Review of Methodologies and Recommendations for Improved Assessment Effectiveness [0.8]
本稿では,CPSのサイバーリスク評価への学術的貢献についてレビューする。評価の有効性を制限するギャップを特定し、サイバーセキュリティインシデントからのリアルタイム学習を推奨する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:21:32 GMT)
A Study on Thermal Quantum Resources and Probabilistic Teleportation in Spin-1/2 Heisenberg XYZ+DM+KSEA Model under Variable Zeeman Splitting [0.8]
Dzyaloshinsky-Moriya (DM) と Kaplan--Shekhtman--Entin-Wohlman--Aharony (KSEA) 相互作用を加えたスピン-1/2ハイゼンベルクXYZモデルにおける量子コヒーレンスと量子相関の測定についての研究
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:43:10 GMT)
Leiden-Fusion Partitioning Method for Effective Distributed Training of Graph Embeddings [0.7]
本稿では,最小限の通信量でグラフを大規模に学習するための分割手法Leiden-Fusionを提案する。我々の手法は、初期連結グラフに対して、各分割が孤立ノードを持たない密連結な部分グラフであることを保証する。提案手法の有効性を,複数のベンチマークデータセット上で広範囲に評価することで実証する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 22:50:57 GMT)
Fine-Tuning Adaptive Stochastic Optimizers: Determining the Optimal Hyperparameter $ε$ via Gradient Magnitude Histogram Analysis [0.7]
我々は、損失の大きさの経験的確率密度関数に基づく新しい枠組みを導入し、これを「緩やかな等級ヒストグラム」と呼ぶ。そこで本稿では, 最適安全のための精密かつ高精度な探索空間を自動推定するために, 勾配等級ヒストグラムを用いた新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:55:03 GMT)
Automatic Control With Human-Like Reasoning: Exploring Language Model Embodied Air Traffic Agents [0.6]
本稿では,人間の介入なしに航空交通紛争を解決するために,関数呼び出しと学習機能を備えた言語モデルベースエージェントの適用について検討する。この研究の革新的な部分であるエクスペリエンスライブラリは、エージェントがシミュレーションや言語モデルとの相互作用から学んだ合成知識を格納するベクトルデータベースである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:49:05 GMT)
HMAFlow: Learning More Accurate Optical Flow via Hierarchical Motion Field Alignment [0.6]
本稿では,挑戦シーンにおける光学的フロー推定を改善するために,HMAFlowと呼ばれる新しい手法を提案する。提案モデルは主に,階層型運動場アライメント(HMA)モジュールと相関自己認識(CSA)モジュールの2つのコアコンポーネントから構成される。実験により,本モデルが他の最先端手法と比較して最高の一般化性能を達成できることが実証された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 06:37:55 GMT)
Domain and Content Adaptive Convolutions for Cross-Domain Adenocarcinoma Segmentation [0.4]
我々はCOSAS(Cross-Organ and Cross-Scanner Adenocarcinoma)課題に取り組むためのU-Netベースのセグメンテーションフレームワークを提案する。提案手法は,最終チャレンジテストセットのクロススキャントラックでは0.8020,クロススキャントラックでは0.8527のセグメンテーションスコアを得た。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:08:34 GMT)
Exploring Utility in a Real-World Warehouse Optimization Problem: Formulation Based on Quantun Annealers and Preliminary Results [0.4]
本稿では,D-Wave の量子アニーラを用いた暖房最適化問題に対する量子初期化機構を提案する。このモジュールは、現実世界の産業問題の最適化に特化した既存の古典的ソフトウェアに組み込むように設計されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 11:58:07 GMT)
Relativistic VQE calculations of molecular electric dipole moments on trapped ion quantum hardware [0.4]
本研究では,従来のコンピュータ上でのBeH分子とRaH分子の永久電気双極子モーメント(PDM)を計算するために,高精度な18量子相対論的VQEシミュレーションを提案する。本稿では,ZX-Calculusルーチンを保存するための強化学習や因果フロー,エラー軽減,選択後のテクニックなど,さまざまなリソース削減手法を適用する。我々の12量子回路の2量子ゲート数を99.71%削減し、古典的な評価では2.35%の精度でPDMのトレードオフを行う。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:12:23 GMT)
Spectrum-preserving deformations of integrable spin chains with open boundaries [0.4]
我々は、強い相互作用を持つ量子多体系に対してスペクトルの一部を無傷に残す局所的な変形の族を見つける。この変形はベーテ・アンザッツ方程式(BAE)を保存するため、アイソ・ベーエ流と呼ばれる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:01:57 GMT)
Spatial Transformer Network YOLO Model for Agricultural Object Detection [0.3]
本稿では,空間変換器ネットワーク(STN)をYOLOに統合し,性能を向上させる手法を提案する。提案するSTN-YOLOは,画像の重要な領域に着目し,モデルの有効性を高めることを目的としている。農業オブジェクト検出のためのベンチマークデータセットと、最先端の植物表現型温室施設からの新たなデータセットにSTN-YOLOを適用した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:04:23 GMT)
On the critical finite-size gap scaling for frustration-free Hamiltonians [0.3]
フラストレーションフリーハミルトニアンに対する臨界有限サイズギャップスケーリングが逆二乗型であることを証明する。このことは、連続体極限において共形場理論を生成する能力にさらなる制限を与える。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:37:38 GMT)
MARS: Mask Attention Refinement with Sequential Quadtree Nodes for Car Damage Instance Segmentation [0.2]
本稿では,自動車損傷事例分割のためのMARS(Mask Attention Refinement with Sequential quadtree node)を提案する。実験により、MARSは3つの人気のあるベンチマークにおいて、最先端(SOTA)インスタンスセグメンテーション法より優れていることが示された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:26:01 GMT)
Disentangling Visual Priors: Unsupervised Learning of Scene Interpretations with Compositional Autoencoder [0.2]
本稿では、ドメイン固有言語を用いて、画像形成の先駆的選択を捉えるニューロシンボリックアーキテクチャを提案する。我々は、その言語でテンプレートプログラムを表現し、畳み込みニューラルネットワークによってシーンから抽出された特徴を用いてパラメータ化を学ぶ。パラメータ化されたプログラムは、実行されると幾何学的プリミティブを生成し、シーンの内容に対応するようにレンダリングして評価する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 12:47:39 GMT)
Analysis of Centrifugal Clutches in Two-Speed Automatic Transmissions with Deep Learning-Based Engagement Prediction [0.2]
本研究は,様々なクラッチ構成が伝達力学に及ぼす影響を系統的に検討した。 Deep Neural Network(DNN)モデルは、スプリングプリロードや靴の質量といったパラメータを用いてクラッチエンゲージメントを予測する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:57:38 GMT)
Sub-shot noise sensitivity via deformed four-headed kitten states [0.2]
元のコンパス状態は、4つのコヒーレントな状態の重なり合わせによって生成され、異方性サブプランク構造を生成する。我々は光子加算と減算を同時に適用することにより、このコンパス状態の2つの変種を提案する。我々の変種はサブプランク構造を示し、変位に対する感度を改善した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:32:49 GMT)
A Benchmark Dataset with Larger Context for Non-Factoid Question Answering over Islamic Text [0.2]
本稿では,Quranic Tafsir と Ahadith の領域内で質問応答を目的とした包括的データセットについて紹介する。このデータセットは、73,000以上の質問応答ペアからなる堅牢なコレクションで構成されており、この特殊なドメインで報告されている最大のデータセットである。本稿では,データセットのコントリビューションを強調しながら,その後の人的評価から,既存の自動評価手法の限界に関する批判的な洞察が得られた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:50:00 GMT)
Size and Shape of Fuzzy Spheres from Matrix/Membrane Correspondence [0.1]
横面に投影された地中ファジィ球の大きさと形状の統計値について検討した。地表面波動関数の数値的および解析的近似により, 予測表面積, 周辺面積, 偏心率, 形状パラメータを推定する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 16:26:48 GMT)
Differentiating and Integrating ZX Diagrams with Applications to Quantum Machine Learning [0.1]
我々は、ZX-計算の枠組み内での微分と積分を実現することにより、ZXを解析的視点に高める。本稿では,バレンプラトーの解析に量子機械学習を応用し,ZX計算の新しい解析フレームワークを具体的に解説する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:58:20 GMT)
Unveiling Gender Bias in Large Language Models: Using Teacher's Evaluation in Higher Education As an Example [0.0]
本稿では,Large Language Model (LLM) による高等教育環境におけるジェンダーバイアスについて検討する。 Odds Ratio (OR)分析、Word Embedding Association Test (WEAT)、感情分析、文脈分析を含む包括的な分析フレームワークを適用している。具体的には、女性インストラクターには親しみやすさや支援に関する言葉が頻繁に用いられ、男性インストラクターにはエンターテイメントに関する言葉が主流であった。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:50:33 GMT)
Training Safe Neural Networks with Global SDP Bounds [0.0]
本稿では,半定値プログラミング(SDP)を用いたニューラルネットワークの形式的安全性保証によるトレーニング手法を提案する。本手法は,大規模かつ高次元な入力領域における安全性の検証に焦点をあて,対向境界に着目した既存手法の限界に対処する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 10:50:22 GMT)
Tracking Virtual Meetings in the Wild: Re-identification in Multi-Participant Virtual Meetings [0.0]
遠隔ビデオ会議の参加者を追跡・再同定するための新しい手法を提案する。本手法は, YOLOをベースラインとしたトラッキング手法と比較して, 誤差率を平均95%削減する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:37:37 GMT)
Towards Kinetic Manipulation of the Latent Space [0.0]
実写RGBカメラフィードから事前学習した畳み込みニューラルネットワーク(CNN)の単純な特徴抽出は、シーンに簡単な変更を加えて潜伏空間を操作するのに非常に役立っていることを示す。この新しいパラダイムはVisual-Reactive Interpolationと呼ばれ、完全なコードはhttps://github.com/PDillis/stylegan3-fun.orgで見ることができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:24:51 GMT)
Temporal Sequencing of Documents [0.0]
文献の集合を時間順に並べる教師なしの方法について概説する。提案手法は,帯域幅推定による単語使用量の漸進的な変化を捉えることに依存する。この教師なしのアプローチは、未処理のドキュメントセットの時間的順序付けを可能にするべきである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 01:16:57 GMT)
Taming the Ransomware Threats: Leveraging Prospect Theory for Rational Payment Decisions [0.0]
本稿では,サイバー攻撃者が身代金の支払いに役立てるために利用する戦術を解明するために,プロスペクト理論を活用した新たなアプローチを採用する。プロスペクト理論とアタック・リカバリ・プランに基づくアルゴリズムを導入し、組織は身代金要求に同意するか、抵抗するかについて情報的な決定をすることができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:20:03 GMT)
Simulating fluid flows with quantum computing [0.0]
我々は,近年の量子コンピューティングの計算パラダイムを用いて流体流れをシミュレートする可能性を探る。この新しいパラダイムの魅力は、古典コンピューティングと比較して、メモリとスピードの指数関数的な優位性である。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:58:13 GMT)
Reducing Optimism Bias in Incomplete Cooperative Games [0.0]
協調ゲームにおける連立価値を明らかにするためのシーケンスの最適化を目的としたフレームワークを提案する。筆者らのコントリビューションは3つある: (i) 個々のプレイヤーの楽観的な連立価値の達成と、より効率的な最適化を促進するための分析的特性について検討し、 (ii) オフライン・オンライン両方の方法で追加連立価値を開示し、このギャップを最小限に抑える方法、 (iii) 実践シナリオにおけるアルゴリズムの性能を実証的に示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 00:29:53 GMT)
REG: Refined Generalized Focal Loss for Road Asset Detection on Thai Highways Using Vision-Based Detection and Segmentation Models [0.0]
本稿では,タイの高速道路における重要道路資産の検出・分断のための新しい枠組みを提案する。提案手法は,最先端の視覚に基づく検出・セグメンテーションモデルに統合され,クラス不均衡と,未表現の道路要素の局所化の課題に効果的に対処する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 22:04:33 GMT)
Quantum-classical hybrid dynamics: coupling mechanisms and diffusive approximation [0.0]
量子古典的ハイブリッド状態に対して完全に正の進化を定義するマルコフのマスター方程式は、常に4つの基本的なカップリング機構によって記述できることを示す。より広範な拡散進化のクラスは、過渡時間後にのみ陽性が与えられるときに得られる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:51:19 GMT)
Quantum optimization algorithms for CT image segmentation from X-ray data [0.0]
本稿では,2次非制約二元最適化(QUBO)と呼ばれる高度な量子最適化アルゴリズムを用いた新しい手法を提案する。ラドン変換を用いて、実験的に得られたシングラムと量子化されたセグメンテーションCT画像から得られた量子化されたシングラムとの差を最小限に抑えたX線投影データからのセグメンテーションCT画像の取得を可能にする。本研究は,実世界のX線データの検証にD-Waveのハイブリッドソルバシステムを利用した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 11:45:33 GMT)
Quantum cryptographic protocols with dual messaging system via 2D alternate quantum walk of a genuine single-photon entangled state [0.0]
単一光子絡み合った状態(SPES)は、多光子(または多粒子)よりも安全な量子情報の符号化と処理の方法を提供する。このレターは、生成された真の3方向と非ローカルの2方向のSPESを暗号鍵として使用して、2つの異なるメッセージを同時に安全にエンコードできることを示している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:40:26 GMT)
Predicting building types and functions at transnational scale [0.0]
我々は、EU、ノルウェー、スイス、イギリスにまたがるOpenStreetMap(OSM)ビルディングからなる大規模グラフデータセット上にグラフニューラルネットワーク(GNN)分類器をトレーニングする。グラフトランスフォーマーモデルは、建物を9つのクラスに分類するときにコーエンのカッパ係数 0.754、住宅と非住宅のクラスに分類するときにコーエンのカッパ係数 0.844 を達成する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 11:02:45 GMT)
On the negative-result experiments in quantum mechanics [0.0]
量子力学(QM)におけるいわゆる負回帰実験(ヌル測定、相互作用のない測定など)についてコメントする。この種の全ての実験(ヌル測度)は、意図的に偏った検出器を設置し、特定の事象を排除または選択する不適切な測定として理解することができる。ヌル測度による予測の検証は、最終的にはマイクロシステムとマクロな検出器の相互作用を含む標準の非バイアス測定を必要とする。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:27:02 GMT)
OML-AD: Online Machine Learning for Anomaly Detection in Time Series Data [0.0]
オンライン機械学習(OML)に基づく新しい異常検出手法であるOML-ADを提案する。 OML-ADは精度と計算効率の点で最先端のベースライン法より優れていることを示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:19:19 GMT)
Models of interacting bosons with exact ground states: a unified approach [0.0]
数保存ボソンに対するフラストレーションフリー''相互作用格子量子ハミルトニアンの無限クラスを定義する。古典的重みを適切に選択することにより、様々な既知の可解モデルのボソン表現を得る。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:20:58 GMT)
Mode hitching in traveling-wave optical parametric amplification [0.0]
本研究は,信号とアイドラービームの古典的横方向ダイナミクスに着目した。固定された分離を維持しながら、ビームが共伝播する傾向を示し、これはヒッチングと呼ばれる現象である。その結果,マルチ空間モード励起光の量子イメージングへの応用が示唆された。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:24:04 GMT)
Mitigating Dimensionality in 2D Rectangle Packing Problem under Reinforcement Learning Schema [0.0]
本稿では,2次元矩形パッキング問題に対する強化学習(RL)の適用について検討する。本研究では,高粒度化を実現する状態空間と行動空間の縮小表現を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:58:48 GMT)
Memory-Augmented Quantum Reservoir Computing [0.0]
本稿では、量子計測の古典的後処理を通じてメモリを実装するハイブリッド量子古典的アプローチを提案する。我々は、完全に連結されたIsingモデルとRydberg原子配列の2つの物理プラットフォーム上でモデルをテストした。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 22:44:09 GMT)
Measurement resolution enhanced coherence for lattice fermions [0.0]
本研究では, 1次元格子中の弱い非相互作用フェルミオンからなる最小多粒子モデルについて検討する。最大32箇所の系に対するこれらのBFSの特性を計算し、測定分解能が適度に低下しても、非自明な定常的絡み合いとコヒーレンスをもたらすことを発見した。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 22:05:13 GMT)
Leveraging Large Language Models for Predicting Cost and Duration in Software Engineering Projects [0.0]
本研究では,プロジェクトコスト予測の精度とユーザビリティを高めるために,LLM(Large Language Models)を用いた革新的な手法を提案する。従来の手法と現代の機械学習技術に対するLLMの有効性について検討する。本研究の目的は,LLMがより正確な推定を得るだけでなく,複雑な予測モデルに代わるユーザフレンドリな代替手段を提供することを示すことである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:35:52 GMT)
LLMs and the Human Condition [0.0]
このモデルは、哲学、社会学、コンピュータ科学から、人間の意思決定に関する確立した3つの理論を統合する。これは、多くの哲学者や、多くの現代のAI研究者によって取られた位置である「反応性システム」として一般的に考えられているものを記述している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:10:55 GMT)
LLM Honeypot: Leveraging Large Language Models as Advanced Interactive Honeypot Systems [0.0]
ハニーポット(Honeypot)は、攻撃者を誘惑し、相互作用させるように設計されたデコイシステムである。我々は,大規模言語モデルを用いて,現実的でインタラクティブなハニーポットシステムを構築するための新しいアプローチを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:41:42 GMT)
Integrating AI's Carbon Footprint into Risk Management Frameworks: Strategies and Tools for Sustainable Compliance in Banking Sector [0.0]
本稿では,AIの炭素フットプリントを銀行セクターのリスク管理フレームワーク(RMF)に統合することを検討する。近年のAI研究、例えばOpen Mixture-of-Experts (OLMoE)フレームワークは、より効率的でダイナミックなAIモデルを提供する。これらの技術的例を用いて、この論文は、銀行がAIの炭素フットプリントを特定し、評価し、緩和するための構造化されたアプローチを概説している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 23:09:27 GMT)
Improving parameters estimation in Gaussian channels using quantum coherence [0.0]
逆問題、すなわち、量子コヒーレンスを資源とするプローブを用いたチャネルパラメータの推定を考える。チャネルパラメータに関するコヒーレンスの変化率を、コヒーレンス量ではなく、パラメータ推定ゲインを生成することができる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:50:23 GMT)
Gravitational reduction of the wave function through the quantum theory of motion [0.0]
点粒子と物体の両方の量子運動は、量子力と重力力の存在下で研究される。量子世界から古典世界への遷移の臨界量を特定する。波動関数の還元時間は、粒子や物体の動力学を用いて定義される。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 08:06:31 GMT)
GLEAN: Generative Learning for Eliminating Adversarial Noise [0.0]
スタイルの模倣攻撃は、知覚できないノイズから厳しい品質劣化まで、人工物を引き起こす可能性がある。様々な種類の摂動をデジタルアートに適用するツールであるGlazeは、スタイルの模倣攻撃を防ぐことに成功している。我々は,GLEAN を用いた I2I 生成ネットワークを提案し,GLEAN 前後のスタイル模倣攻撃の性能評価を行った。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:28:56 GMT)
Exceptional topology in Non-Hermitian Twisted Bilayer Graphene [0.0]
本研究では, 他の層に対してグラフェンがねじれた非エルミチアンTBGの利得と損失について検討した。モワール・ブリルアン・ゾーンの角のK_M$(K'_M$)のみを中心とするディラック・コーンは、非ハーミティティーの存在下で変形したK'$(K'_M$)谷である。これはゲイン・アンド・ロスを持つ単層グラフェンとは違い、ブリルアンゾーンのK$とK'$の角に例外的な点の環が現れる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 02:24:42 GMT)
Exact solution of the isotropic and anisotropic Hamiltonian of two coupled harmonic oscillators [0.0]
我々は、$SU(1,1)$ および $SU(2)$ 群のボソン生成器の観点でそのハミルトニアンを記述する。我々は、元ハミルトニアンを対角化するために3つの傾斜変換を適用するために、$su (1,1)$リー代数の1つのボソンと2つのボソン実現を用いる。これらの変換により、等方的および異方的ケースの正確な解が得られる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:53:42 GMT)
Efficient Hybrid Inference for LLMs: Reward-Based Token Modelling with Selective Cloud Assistance [0.0]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおける例外的な性能で知られている。より小型の言語モデル(SLM)は、より低価格のエッジデバイスにデプロイできるが、より大きなデバイスの性能に匹敵する。本稿では,両モデルの強みを生かした新しいハイブリッド推論手法を提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 15:12:45 GMT)
Early Detection of Network Service Degradation: An Intra-Flow Approach [0.0]
本研究では,早期のフロー特性を利用して,コンピュータネットワークにおけるサービス劣化(SD)を予測する新しい手法を提案する。我々のアプローチは、ネットワークフローの観測可能な(O)セグメント、特にパケット間時間(PIAT)の分析に焦点を当てている。我々は,10個の遅延サンプルの最適O/NO分割閾値を推定し,予測精度と資源利用量のバランスをとる。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 19:07:30 GMT)
EEPPR: Event-based Estimation of Periodic Phenomena Rate using Correlation in 3D [0.0]
本稿では,イベントカメラによる周期現象の速度測定手法を提案する。この手法は周期現象に対して、時間空間との時間差で時間窓内で非常に類似した事象が生成されることを仮定する。提案手法であるEEPEPは,12の周期現象のデータセットを用いて評価する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:16:47 GMT)
Critic as Lyapunov function (CALF): a model-free, stability-ensuring agent [0.0]
この研究は、Crytic As Lyapunov Function(CALF)と呼ばれる新しい強化学習エージェントを提示し、展示する。 CALFはモデルフリーであり、オンライン環境、言い換えれば動的システムの安定化を保証する。その並行的なアプローチは、主にオフラインまたはモデルベース、例えば、モデル予測制御をエージェントに融合させるもののいずれかである。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 21:27:44 GMT)
Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies [0.0]
本研究では,エンコーダとLarge Language Models(LLMs)を併用した名前付きエンティティ認識手法を比較し,ロシアの職種からスキルを抽出する。その結果、従来のNERモデル、特にDeepPavlov RuBERT NERは、精度、精度、リコール、推測時間など、様々な指標でLLMを上回ります。この研究は、自然言語処理(NLP)の分野と労働市場、特に非英語の文脈におけるその応用に寄与する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 05:02:37 GMT)
Bias Begets Bias: The Impact of Biased Embeddings on Diffusion Models [0.0]
テキスト・トゥ・イメージ(TTI)システムは、社会的偏見に対する精査が増加している。組込み空間をTTIモデルのバイアス源として検討する。 CLIPのような偏りのあるマルチモーダル埋め込みは、表現バランスの取れたTTIモデルに対して低いアライメントスコアをもたらす。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 01:09:55 GMT)
Benchmarking LLMs in Political Content Text-Annotation: Proof-of-Concept with Toxicity and Incivility Data [0.0]
この記事では,OpenAI の GPT と,多数のオープンソース LLM の政治コンテンツに対するアノテーションタスクの実行能力をベンチマークした。我々は300万人以上のデジタルインタラクションからなる新しい抗議イベントデータセットを使用した。われわれは、人間のコーダーがソーシャルメディアの毒性と悪質について注釈を付けた、地味なラベルを含む金の標準を作った。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 14:11:24 GMT)
Bayesian Neural Networks for 2D MRI Segmentation [0.0]
本稿では,MRIセグメンテーションのための不確実性認識モデルであるBA U-Netを紹介する。 BA U-Netは正確で解釈可能な結果を提供し、信頼性の高い病理検査に不可欠である。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:36:12 GMT)
Astrometric Binary Classification Via Artificial Neural Networks [0.0]
人工ニューラルネットワーク(ANN)を用いて、星の集合が天文的二元対に属するか否かを自動分類する機械学習(ML)手法を提案する。 ANNは99.3%の精度、0.988の精度、0.991のリコール率、0.999のAUCを高い分類スコアで達成している。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 00:34:30 GMT)
Analysis of flexible traffic control method in SDN [0.0]
このプロジェクトでは、ネットワークの自律的な決定を可能にする、現代的なタイプの機械学習であるReinforcement Learningを使用している。このソリューションは、ネットワークのパフォーマンス向上だけでなく、その柔軟性とリアルタイム適応性 - 柔軟なトラフィック制御も目標としている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 18:09:59 GMT)
Abnormal Event Detection In Videos Using Deep Embedding [0.0]
監視ビデオにおける異常事象の検出や異常検出は、現在、起こりうる事象の多様性のために課題となっている。本稿では、ディープニューラルネットワークの目的を協調的に最適化することを目的とした、ビデオ異常検出のための教師なしアプローチを提案する。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 17:44:51 GMT)
A proposal for a metaphysics of self-subsisting structures. II. Quantum physics [0.0]
本論文は, 共用紙に設定した自己置換構造のメタ物理を非相対論的量子物理学の領域へ拡張するものである。この議論は、De Broglie-Bohm$N$-bodyシステムのリレーショナル実装を表すPure Shape Dynamicsモデルを中心に展開されている。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 20:41:28 GMT)
A hybrid solution for 2-UAV RAN slicing [0.0]
インターネットをドローンでユーザーに配布することも可能だ。しかし、ユーザーの位置に応じてドローンを配置する必要がある。インターンシップでは、最適化問題として問題を見ることは依然として有用であることを証明したいと思いました。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:42:31 GMT)
A clustering adaptive Gaussian process regression method: response patterns based real-time prediction for nonlinear solid mechanics problems [0.0]
本研究では, 固体力学における非線形構造応答のリアルタイム予測を目的としたクラスタリング適応ガウス過程回帰(CAG)法を提案する。これは、小さなサンプルサイズ、高精度、高効率なデータ駆動機械学習手法であり、非線形構造応答パターンを活用する。提案手法は1秒以内の予測が可能であり,本研究の文脈において,約20サンプルの精度が得られた。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:30:33 GMT)
A Tie-breaking based Local Search Algorithm for Stable Matching Problems [0.0]
不完全リストと結びつき(SMTI)の安定な結婚問題に対するタイブレーキングに基づく局所探索アルゴリズム(TBLS)と病院・居住者間の結びつき(HRT)問題(HRT)を導入する。 TBLSは最も高いマッチングサイズを達成する一方、TBLS-Eは最も低い性平等コストを示す。どちらのアルゴリズムも、大規模インスタンスの解法において、他の局所探索アルゴリズムよりも高速な計算速度を示す。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 13:36:55 GMT)
A POD-TANN approach for the multiscale modeling of materials and macroelement derivation in geomechanics [0.0]
本稿では,固有直交分解(POD)と熱力学に基づくニューラルネットワーク(TANN)を組み合わせた新しいアプローチを提案する。この手法はPODを利用して、微視的状態情報からマクロな内部状態変数を抽出する。このアプローチの有効性は、複雑さを増大させる応用を通じて検証される。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 09:47:29 GMT)
A Novel Framework For Text Detection From Natural Scene Images With Complex Background [0.0]
本稿では,ウェーブレット変換を用いた複雑な背景を持つ画像からテキスト領域を検出する手法を提案する。このフレームワークは、元の画像をグレースケールでウェーブレット変換し、次にサブバンドフィルタリングする。
論文参考訳（メタデータ） (Sun, 15 Sep 2024 07:12:33 GMT)