UniRef++: Segment Every Reference Object in Spatial and Temporal Spaces [92.5] 単一のアーキテクチャで4つの参照ベースのオブジェクトセグメンテーションタスクを統合するために、UniRef++を提案する。
統一された設計により、UniRef++は幅広いベンチマークで共同でトレーニングすることができ、実行時に柔軟に複数のタスクを完了させることができる。
提案する UniRef++ は RIS と RVOS の最先端性能を実現し,パラメータ共有ネットワークを用いて FSS と VOS の競合性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:54:11 GMT)
Adversarial Prompt Tuning for Vision-Language Models [90.9] AdvPT(Adversarial Prompt Tuning)は、視覚言語モデル(VLM)における画像エンコーダの対向ロバスト性を高める技術である。
我々は,AdvPTが白箱攻撃や黒箱攻撃に対する抵抗性を向上し,既存の画像処理による防御技術と組み合わせることで相乗効果を示すことを示した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:51:26 GMT)
Robust Stochastically-Descending Unrolled Networks [85.7] Deep Unrolling(ディープ・アンローリング)は、トレーニング可能なニューラルネットワークの層に切り捨てられた反復アルゴリズムをアンロールする、新たな学習最適化手法である。
アンロールネットワークの収束保証と一般化性は、いまだにオープンな理論上の問題であることを示す。
提案した制約の下で訓練されたアンロールアーキテクチャを2つの異なるアプリケーションで数値的に評価する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 18:51:23 GMT)
Make Explicit Calibration Implicit: Calibrate Denoiser Instead of the
Noise Model [83.9] デジタルゲインやカメラセンサーによらず有効であるLED(Lighting Every Darkness)を導入する。
LEDは明示的なノイズモデルのキャリブレーションの必要性を排除し、高速な展開と最小限のデータを必要とする暗黙の微調整プロセスを活用する。
LEDは、センサー工学の利点を生かしながら、ディープラーニングの進歩にもっと注力することを可能にする。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:26:51 GMT)
Efficient Conformal Prediction under Data Heterogeneity [81.5] コンフォーマル予測(CP)は不確実性定量化のための頑健な枠組みである。
非交換性に対処するための既存のアプローチは、最も単純な例を超えて計算不可能なメソッドにつながる。
この研究は、比較的一般的な非交換可能なデータ分布に対して証明可能な信頼セットを生成する、CPに新しい効率的なアプローチを導入する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 20:02:51 GMT)
Three Heads Are Better Than One: Complementary Experts for Long-Tailed
Semi-supervised Learning [79.9] 本稿では,様々なクラス分布をモデル化するComPlementary Experts (CPE) を提案する。
CPEは、CIFAR-10-LT、CIFAR-100-LT、STL-10-LTのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:54:07 GMT)
DI-V2X: Learning Domain-Invariant Representation for
Vehicle-Infrastructure Collaborative 3D Object Detection [78.1] DI-V2Xは、新しい蒸留フレームワークを通じてドメイン不変表現を学習することを目的としている。
DI-V2Xは、ドメイン混合インスタンス拡張(DMA)モジュール、プログレッシブドメイン不変蒸留(PDD)モジュール、ドメイン適応融合(DAF)モジュールの3つの必須成分から構成される。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:40:46 GMT)
A Recipe for Scaling up Text-to-Video Generation with Text-free Videos [72.6] 拡散ベースのテキスト・ツー・ビデオ世代は、過去1年で目覚ましい進歩をみせたが、それでもテキスト・ツー・画像世代には及ばない。
我々はTF-T2Vと呼ばれる新しいテキスト・ビデオ生成フレームワークを考案した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 16:37:39 GMT)
Generative Hierarchical Temporal Transformer for Hand Action Recognition
and Motion Prediction [70.9] 本稿では,手の動き認識と3次元手の動き予測を同時に行う新しいフレームワークを提案する。
フレームワークは複数のデータセットにまたがってトレーニングされ、ポーズとアクションブロックは個別にトレーニングされ、ポーズアクションアノテーションを完全に活用する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:54:53 GMT)
DriveMLM: Aligning Multi-Modal Large Language Models with Behavioral
Planning States for Autonomous Driving [69.8] DriveMLMは、現実的なシミュレータでクローズループの自律運転を実行するためのフレームワークである。
モジュールADシステムの動作計画モジュールをモデル化するために,MLLM (Multi-modal LLM) を用いる。
このモデルは、Apolloのような既存のADシステムでプラグイン・アンド・プレイすることで、クローズループ運転を行うことができる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 15:50:52 GMT)
Rotation Equivariant Proximal Operator for Deep Unfolding Methods in
Image Restoration [68.2] 本稿では, 回転対称性を組み込んだ高精度な回転同変近位ネットワークを提案する。
本研究は, 回転対称性の先行を深く展開する枠組みに効果的に組み込む, 高精度な回転同変近位ネットワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:53:06 GMT)
EcomGPT-CT: Continual Pre-training of E-commerce Large Language Models
with Semi-structured Data [67.8] 大規模コーパスで事前訓練された大規模言語モデル(LLM)は、様々なNLPタスクにおいて顕著な性能を示した。
これらのモデルを特定のドメインに適用しても、ドメイン知識の欠如など、大きな課題が生じる。
我々は、Eコマースドメインを例として用いたLLMのドメイン固有の継続事前学習に焦点を当てた。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:31:47 GMT)
Alleviating Hallucinations of Large Language Models through Induced
Hallucinations [67.4] 大規模言語モデル(LLM)は、不正確な情報や製造された情報を含む応答を生成するために観察されている。
幻覚を緩和するための単純なtextitInduce-then-Contrast Decoding (ICD) 戦略を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:32:49 GMT)
X-Dreamer: Creating High-quality 3D Content by Bridging the Domain Gap
Between Text-to-2D and Text-to-3D Generation [64.1] X-Dreamerは高品質なテキストから3Dコンテンツを作成するための新しいアプローチである。
テキスト対2D合成とテキスト対3D合成のギャップを埋める。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:46:18 GMT)
Sample Complexity for Quadratic Bandits: Hessian Dependent Bounds and
Optimal Algorithms [64.1] 最適なヘッセン依存型サンプルの複雑さを, 初めて厳密に評価した。
ヘシアン非依存のアルゴリズムは、すべてのヘシアンインスタンスに対して最適なサンプル複雑さを普遍的に達成する。
本アルゴリズムにより得られたサンプルの最適複雑さは,重み付き雑音分布においても有効である。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:41:11 GMT)
SAM-guided Graph Cut for 3D Instance Segmentation [63.8] 本稿では,3次元画像情報と多視点画像情報の同時利用による3次元インスタンス分割の課題に対処する。
本稿では,3次元インスタンスセグメンテーションのための2次元セグメンテーションモデルを効果的に活用する新しい3D-to-2Dクエリフレームワークを提案する。
本手法は,ロバストなセグメンテーション性能を実現し,異なるタイプのシーンにまたがる一般化を実現する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:39:29 GMT)
Towards Learning Geometric Eigen-Lengths Crucial for Fitting Tasks [62.9] 低次元であるが決定的な幾何固有長は幾何的タスクの成功を決定することが多い。
人間はそのような重要な幾何学的固有長を共通の意味で具現化してきた。
学習システムに同様の能力が備わっているかは、いまだ不明で未解明のままである。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:41:52 GMT)
HD-Painter: High-Resolution and Prompt-Faithful Text-Guided Image
Inpainting with Diffusion Models [62.5] HD-Painterはトレーニング不要のアプローチで、プロンプトとコヒーレントなスケールで高解像度画像のインペイントを行う。
本稿では,Prompt-Aware Introverted Attention (PAIntA) レイヤについて紹介する。
また,ポストホックサンプリング戦略をDDIMの一般的な形式にシームレスに統合するRASG(Reweighting Attention Score Guidance)機構を導入する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 20:04:02 GMT)
SAMVG: A Multi-stage Image Vectorization Model with the Segment-Anything
Model [59.4] 画像をSVG(Scalable Vector Graphics)にベクトル化する多段階モデルを提案する。
第一に、SAMVGはSegment-Anything Modelによって提供される一般的な画像セグメンテーションを使い、新しいフィルタリング手法を用いて画像全体の最も高密度なセグメンテーションマップを識別する。
次に、SAMVGは欠落したコンポーネントを特定し、SVGにより詳細なコンポーネントを追加する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:16:07 GMT)
Compositional Generalization in Spoken Language Understanding [58.6] 本稿では, (a) 新規スロットの組み合わせと (b) 長さの一般化の2種類の構成性について検討する。
本研究では,我々の合成SLUモデルが最先端のBERT SLUモデルより大幅に優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 21:46:06 GMT)
Learning Real-World Image De-Weathering with Imperfect Supervision [57.7] 既存の現実世界のデヒータリングデータセットは、接地トラス画像と入力された劣化画像の間に、一貫性のない照明、位置、テクスチャを示すことが多い。
我々は、入力劣化画像と可能な限り一貫性のある擬似ラベルを生成するための一貫性ラベルコンストラクタ(CLC)を開発した。
我々は,従来の不完全ラベルと擬似ラベルを組み合わせることで,情報割当戦略による脱ウェザリングモデルを共同で監督する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 02:17:04 GMT)
Translate Meanings, Not Just Words: IdiomKB's Role in Optimizing
Idiomatic Translation with Language Models [57.6] idiomsは非構成的な性質を持ち、Transformerベースのシステムに特別な課題を提起する。
既存の知識ベース(KB)を使ってイディオムを置き換える伝統的な手法は、しばしばスケールとコンテキストの認識を欠いている。
大規模なLMを用いて開発した多言語イディオムKB (IdiomKB) を提案する。
このKBはBLOOMZ (7.1B)、Alpaca (7B)、InstructGPT (6.7B)のようなより小さなモデルによるより良い翻訳を促進する
論文参考訳(メタデータ) (Mon, 25 Dec 2023 02:54:13 GMT)
GSQA: An End-to-End Model for Generative Spoken Question Answering [57.1] 本稿では,システムに抽象的推論を強制するGSQA(Generative Spoken Question Answering)モデルを提案する。
本モデルでは, 抽出QAデータセットにおいて, 従来の抽出モデルよりも3%上回っている。
我々のGSQAモデルは、幅広い質問に一般化する可能性を示し、それによって、抽象的QAの音声質問応答能力をさらに拡張する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 18:43:58 GMT)
Unlocking the Potential of Large Language Models for Explainable
Recommendations [54.7] 説明ジェネレータを最近登場した大規模言語モデル(LLM)に置き換える影響は、まだ不明である。
本研究では,シンプルで効果的な2段階説明可能なレコメンデーションフレームワークであるLLMXRecを提案する。
いくつかの重要な微調整技術を採用することで、制御可能で流動的な説明が十分に生成できる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:09:54 GMT)
Indoor Scene Reconstruction with Fine-Grained Details Using Hybrid
Representation and Normal Prior Enhancement [53.1] 多視点RGB画像からの室内シーンの再構成は、平坦領域とテクスチャレス領域の共存により困難である。
近年の手法では、予測された表面正規化によって支援されたニューラルラジアンス場を利用してシーン形状を復元している。
本研究は, 上記の制限に対処して, 高忠実度表面を細かな詳細で再構築することを目的とする。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:35:19 GMT)
AM-RADIO: Agglomerative Model -- Reduce All Domains Into One [52.0] このアプローチをAM-RADIO(Agglomerative Model -- すべてのドメインを1に還元する)と名付けます。
教師モデルより少なくとも7倍高速な新しいアーキテクチャ(E-RADIO)を開発した。
包括的なベンチマークプロセスでは、ImageNet分類、ADE20kセマンティックセグメンテーション、COCOオブジェクト検出、LLaVa-1.5フレームワークなどの下流タスクをカバーしています。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:41:07 GMT)
Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.7] 業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。
学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。
利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 21:25:55 GMT)
Vulnerability of Machine Learning Approaches Applied in IoT-based Smart Grid: A Review [51.3] 機械学習(ML)は、IoT(Internet-of-Things)ベースのスマートグリッドでの使用頻度が高まっている。
電力信号に注入された逆方向の歪みは システムの正常な制御と操作に大きな影響を及ぼす
安全クリティカルパワーシステムに適用されたMLsgAPPの脆弱性評価を行うことが不可欠である。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:14:20 GMT)
Large Language Models Empowered Autonomous Edge AI for Connected
Intelligence [51.3] エッジ人工知能(Edge AI)は、コネクテッドインテリジェンスを実現するための有望なソリューションである。
この記事では、ユーザのさまざまな要件を満たすために自動的に組織化し、適応し、最適化する、自律的なエッジAIシステムのビジョンを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:25:38 GMT)
Partial Fine-Tuning: A Successor to Full Fine-Tuning for Vision
Transformers [50.2] 部分微調整は、効率と精度を同時に向上できる革新的で有望な方向であることを示す。
部分的な微調整のための適切な層の選択を導くための,新しい微調整角度測定法を提案する。
広範囲のデータセットとモデルに関する包括的な実験は、部分的な微調整の大きな可能性を検証する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:11:34 GMT)
Learning to Augment Distributions for Out-of-Distribution Detection [49.1] アウト・オブ・ディストリビューション (OOD) は、ラベルがイン・ディストリビューション (ID) の場合と区別される。
我々は,OODの分布差を軽減するためにDAL(distributal-Augmented OOD Learning)を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:48:47 GMT)
Set Prediction Guided by Semantic Concepts for Diverse Video Captioning [47.9] 我々は、多種多様なキャプションを意味概念に基づく集合予測問題に定式化する。
モデルが意味的に多様なキャプションを生成することを奨励するために,概念に多様性規則化用語を適用した。
提案モデルでは,妥当性と多様性の両指標を用いて,最先端(SOTA)性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:13:04 GMT)
ProxyCap: Real-time Monocular Full-body Capture in World Space via
Human-Centric Proxy-to-Motion Learning [47.2] 本稿では,世界空間の動きを学習するための人間中心のプロキシ・ツー・モーション学習スキームであるProxyCapを紹介する。
我々のネットワークは人間中心の視点から人間の動きを学ぶように設計されている。
本研究では,世界空間における足場接触を可能とした実時間単眼フルボディキャプチャシステムについて紹介する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:20:36 GMT)
What Makes Good Data for Alignment? A Comprehensive Study of Automatic
Data Selection in Instruction Tuning [46.9] 本稿では、LLaMAモデルとMistralモデルから微調整された一連のモデルであるdeitaについて述べる。
Deitaは6K SFTトレーニングデータサンプルだけで、最先端のオープンソースアライメントモデルと同等、あるいは同等に動作します。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:29:28 GMT)
Faster Rates for Switchback Experiments [46.7] ブロック全体を用いた代替推定器を提案し、同じ仮定で設計に依存しない GATE 推定値に対して$sqrtlog T/T$ を推定できることを驚くほど示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 01:00:58 GMT)
Merging Vision Transformers from Different Tasks and Domains [46.4] この作業は、異なるタスク(オブジェクトカテゴリの異なるデータセット)やドメイン(同じカテゴリの異なるデータセット)でトレーニングされたさまざまなビジョントランスフォーマー(ViT)を1つの統一モデルにマージすることを目的としている。
これまでのモデルマージ作業はCNNまたはNLPモデルに重点を置いており、ViTsのマージ研究は未修正のままである。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:32:28 GMT)
Knowledge Graph Prompting for Multi-Document Question Answering [46.3] 我々は,多文書質問応答(MD-QA)を促す上で,適切なコンテキストを定式化するための知識グラフプロンプティング(KGP)手法を提案する。
グラフ構築のために、パスや文書構造(例えば、ページ/テーブル)を象徴するノードを持つ複数のドキュメントに知識グラフ(KG)を作成する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 17:03:05 GMT)
TACO: Topics in Algorithmic COde generation dataset [46.3] TACOは大規模コード生成データセットであり、アルゴリズムの光学性に重点を置いている。
トレーニングとテストセットには25433と1000のコーディング問題があり、最大155万の多様な解答がある。
各TACO問題には、タスクトピック、アルゴリズム、プログラミングスキル、難易度など、いくつかのきめ細かいラベルが含まれている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:32:25 GMT)
Large Language Models are Not Stable Recommender Systems [45.9] 大規模言語モデル(LLM)における探索的研究の導入と位置バイアスの一貫したパターンの発見について述べる。
本稿では,2段階パイプラインを含むベイズ確率的フレームワークSTELLA(Stable LLM for Recommendation)を提案する。
我々のフレームワークは、既存のパターン情報を利用してLCMの不安定性を校正し、レコメンデーション性能を向上させることができる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:54:33 GMT)
Abductive Logical Reasoning on Knowledge Graphs [43.3] 知識グラフ(KG)に対する帰納的論理的推論は、KG文学において過小評価されている。
本稿では,知識グラフ(RLF-KG)による強化学習を導入し,KGに基づいて生成された仮説から引き出された観測結果と結論との差を最小化する。
実験により,変圧器を用いた生成モデルが論理的説明を堅牢かつ効率的に生成できることが実証された。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:06:20 GMT)
Improving the Accuracy and Interpretability of Neural Networks for Wind
Power Forecasting [42.6] 本稿ではまず,簡単な3重最適化手法(TriOpts)を提案する。
次に、DNNの予測動作を解釈するために、置換特徴重要度(PFI)と局所解釈モデル非依存的説明(LIME)技術を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:29:09 GMT)
SeACo-Paraformer: A Non-Autoregressive ASR System with Flexible and
Effective Hotword Customization Ability [41.1] フレキシブルで効果的なホットワードカスタマイズ機能を備えた新しいNARベースのASRシステムSeACo-Paraformer(SeACo-Paraformer)を提案する。
AEDベースのモデルの精度、NARモデルの効率、そして優れたパフォーマンスの明示的なカスタマイズ能力の利点を持っている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:44:15 GMT)
Uncertainty as a Predictor: Leveraging Self-Supervised Learning for
Zero-Shot MOS Prediction [40.5] 本稿では,低リソース環境における高効率な音質予測のギャップについて論じる。
我々は、wav2vecのような事前訓練された自己教師型学習モデルから得られた不確実性はVoiceMOSスコアと相関することを示した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:35:28 GMT)
Scalable Face Image Coding via StyleGAN Prior: Towards Compression for
Human-Machine Collaborative Vision [39.5] 先進的な生成先行から導かれる階層的表現が、人間と機械の協調的なビジョンのための効率的なスケーラブルなコーディングパラダイムの構築をいかに促進するかを考察する。
キーとなる洞察は、StyleGANを前もって活用することで、階層的な意味論を符号化する3層表現を学習できるということです。
マルチタスクのスケーラブルな速度歪み目標に基づいて,提案手法を協調的に最適化し,最適解析性能,人間の知覚経験,圧縮比を実現する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:57:23 GMT)
On Diversified Preferences of Large Language Model Alignment [39.2] 一般的に使われているフィードバックデータセットにおける多彩な嗜好の存在を検証するための最初の定量的分析を行う。
多様な選好によって生じるアライメントの非効率性を軽減するために,新しいtextbfMulti-textbfObjective textbfReward 学習法を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 16:26:58 GMT)
Exploiting Diffusion Priors for All-in-One Image Restoration [38.6] オールインワン画像復元は、画像復元の様々な課題を1つのモデルで解決することを目的としている。
本稿では,事前訓練した拡散モデルにより得られた画像の先行画像を利用することが可能な方法を提案する。
ゼロAIRと呼ばれるオールインワン画像復元のためのゼロショットフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:50:44 GMT)
Segment Anything Model for Medical Images? [38.4] Segment Anything Model (SAM) は一般画像分割のための最初の基礎モデルである。
我々は18のモダリティ、84のオブジェクト、125のオブジェクトとモダリティのペアターゲット、1050Kの2Dイメージ、6033Kマスクを備えた大規模な医療セグメンテーションデータセットを構築した。
SAMはいくつかの特定のオブジェクトで顕著なパフォーマンスを示したが、不安定、不完全、あるいは他の状況で完全に失敗した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:52:23 GMT)
EmotionIC: Emotional Inertia and Contagion-Driven Dependency Modeling
for Emotion Recognition in Conversation [37.4] 情緒的慣性・伝染(Emotional Inertia and Contagion, EmotionIC)による依存モデリングの新しいアプローチを提案する。
EmotionICは3つの主要コンポーネントから構成されており、Identity Masked Multi-Head Attention (IMMHA), Dialogue-based Gated Recurrent Unit (DiaGRU), Skip-chain Random Field (SkipCRF)である。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:52:06 GMT)
Open-Vocabulary Video Relation Extraction [37.4] OVRE(Open-vocabulary Video Relation extract)は,行動中心関係三重項のレンズを通して行動理解を行う新しいタスクである。
OVREは、アクションに参加するペアワイズ関係に焦点を当て、これらの関係三つ子と自然言語を記述する。
マルチラベルアクション分類データセットをベースとした,アクション中心リレーショナルトリプレットを備えた180KビデオからなるMoments-OVREデータセットをキュレートする。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:29:34 GMT)
Audiobox: Unified Audio Generation with Natural Language Prompts [37.4] 本稿では,様々な音響モダリティを生成可能なフローマッチングに基づく統一モデルであるAudioboxを提案する。
我々は、制御性を高め、音声および音声生成パラダイムを統一するために、記述ベースおよび例ベースプロンプトを設計する。
Audioboxは、音声と音声の生成に関する新しいベンチマークを設定し、新しい音声と音響のスタイルで音声を生成する新しいメソッドをアンロックする。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 22:24:49 GMT)
TAPE: Leveraging Agent Topology for Cooperative Multi-Agent Policy
Gradient [36.8] 本稿では,他のエージェントを政策として考慮すべきかどうかを判断するエージェントトポロジフレームワークを提案する。
エージェントは、グローバルユーティリティではなく、連立ユーティリティを学習目的として使用することができる。
我々は,TAPEの政策改善定理を証明し,エージェント間の協調性の向上に関する理論的説明を行う。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:24:33 GMT)
EHRSQL: A Practical Text-to-SQL Benchmark for Electronic Health Records [36.2] 発声は、医師、看護師、保険審査・健康記録チームを含む222人の病院職員から集められた。
我々はこれらの質問を、MIMIC-IIIとeICUの2つのオープンソースのEHRデータベースに手動でリンクし、データセットに様々な時間表現と解決不可能な質問を格納した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:12:53 GMT)
PULASki: Learning inter-rater variability using statistical distances to
improve probabilistic segmentation [36.1] 本稿では,専門家アノテーションの変動を正確に捉えるバイオメディカルイメージセグメンテーションのためのPULASkiを提案する。
提案手法では,条件付き変分オートエンコーダ構造における統計的距離に基づいて,損失関数を改良した。
また,本手法は多ラベルセグメンテーションタスクにも適用可能であり,血行動態モデリングなどの下流タスクにも有用である。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:31:22 GMT)
DSNet: Disentangled Siamese Network with Neutral Calibration for Speech
Emotion Recognition [35.2] 我々は、より堅牢で説明可能な音声感情認識モデルの需要を満たすために、中立キャリブレーションを備えたディケンタングル・シームズ・ネットワークであるDSNetを提案する。
2つの人気のあるベンチマークデータセットの実験結果は、話者非依存SERの様々な最先端手法よりもDSNetの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 02:58:37 GMT)
Conditional Variational Autoencoder for Sign Language Translation with
Cross-Modal Alignment [34.0] 手話翻訳(SLT)は、連続手話動画をテキストに変換することを目的としている。
SLT(CV-SLT)のための条件変分オートエンコーダに基づく新しいフレームワークを提案する。
CV-SLTは、エンコーダとデコーダの出力を正規化するために、2つのKullback-Leiblerの分岐を持つ2つの経路からなる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:20:40 GMT)
Word length-aware text spotting: Enhancing detection and recognition in
dense text image [33.4] シーンテキスト画像の検出と認識のための新しい単語長認識スポッターであるWordLenSpotterを提案する。
我々は、特に高密度テキスト画像の尾データにおいて、長短の単語のスポッティング機能を改善する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:46:20 GMT)
Towards Real-World Blind Face Restoration with Generative Diffusion
Prior [32.1] ブラインド顔の復元はコンピュータビジョンにおいて重要な課題であり、広範囲の応用により注目されている。
低画質の顔画像から特徴を効果的に抽出するBFRffusionを提案する。
また、人種、性別、年齢といったバランスのとれた属性を備えたPFHQというプライバシ保護顔データセットも構築しています。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:16:24 GMT)
HGE: Embedding Temporal Knowledge Graphs in a Product Space of
Heterogeneous Geometric Subspaces [31.8] 時間的知識グラフは時間的事実を表す。 $(s,p,o,tau)$ 主題 $s$ とオブジェクト $o$ at time $tau$。
本稿では,時間的事実を,異なる幾何学的性質を持つ不均一な幾何部分空間の積空間にマッピングする埋め込み手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:20:07 GMT)
TimesURL: Self-supervised Contrastive Learning for Universal Time Series
Representation Learning [31.5] 時系列表現に対処するために,TimesURL という新しい自己教師型フレームワークを提案する。
具体的には、時間的特性を一定に保つために、まず周波数時間に基づく拡張を導入する。
また、コントラスト学習を改善するために、特別なタイプのハードネガティブとしてダブルユニバーサムを構築します。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:23:26 GMT)
Language Generation from Brain Recordings [31.1] 本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。
提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。
本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 19:25:51 GMT)
NPHardEval: Dynamic Benchmark on Reasoning Ability of Large Language
Models via Complexity Classes [30.8] NPHardEvalは、900の質問の幅広い範囲にわたって、LLM(Large Language Models)の推論能力を評価するように設計されている。
NP-ハード複雑性クラス以下の幅広い複雑性クラスを表現するために慎重に選択される。
データポイントを毎月更新する動的更新メカニズムで設計されている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:56:50 GMT)
Deep Structure and Attention Aware Subspace Clustering [30.0] 本稿では,新しいサブスペースクラスタリング(DSASC)を提案する。
視覚変換器を用いて特徴を抽出し,抽出した特徴を2つの部分,構造特徴,内容特徴に分割する。
我々の手法は最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 01:19:47 GMT)
A Comprehensive Evaluation of Parameter-Efficient Fine-Tuning on
Software Engineering Tasks [29.9] 事前訓練されたモデル(PTM)は、様々なソフトウェア工学(SE)下流タスクで大きな成功を収めています。
広く使われているソリューションはパラメータ効率の微調整(PEFT)であり、追加パラメータを導入しながらPTMを凍結する。
本研究の目的は,5つのPEFT手法が8つのPTMおよび4つのSE下流タスクに対して有効であることを示すことである。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:25:39 GMT)
Towards Generalizable Multi-Camera 3D Object Detection via Perspective
Debiasing [28.9] マルチカメラ3Dオブジェクト検出(MC3D-Det)は,鳥眼ビュー(BEV)の出現によって注目されている。
本研究では,3次元検出と2次元カメラ平面との整合性を両立させ,一貫した高精度な検出を実現する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 16:30:00 GMT)
APTv2: Benchmarking Animal Pose Estimation and Tracking with a
Large-scale Dataset and Beyond [27.5] APTv2は動物のポーズ推定と追跡のための大規模ベンチマークのパイオニアである。
ビデオクリップは2,749本で、30種の動物から抽出・収集されている。
我々は,84,611種の動物インスタンスに対して高品質なキーポイントと追跡アノテーションを提供する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:49:49 GMT)
Multiple Representation Transfer from Large Language Models to
End-to-End ASR Systems [27.4] 大規模言語モデル(LLM)の知識の伝達は,言語知識をエンドツーエンドの自動音声認識(ASR)システムに組み込む上で有望な手法である。
LLMの複数の表現を転送することは、単一の表現のみを転送するより効果的な方法であることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:28:07 GMT)
Get a Grip: Reconstructing Hand-Object Stable Grasps in Egocentric
Videos [27.2] 我々は、自我中心の動画において、既知の対象カテゴリーに対する手動物体再構成に対処する。
本研究は,物体を安定に保持するフレームを共同で再構築する,手動安定グラフ再構成(HO-SGR)の課題を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:12:36 GMT)
GPTScan: Detecting Logic Vulnerabilities in Smart Contracts by Combining
GPT with Program Analysis [27.2] 本稿では,GPTと静的解析を組み合わせたGPTScanを提案する。
各ロジックの脆弱性タイプをシナリオとプロパティに分割することで、GPTScanは候補の脆弱性とGPTをマッチさせる。
人間の監査官が見逃した9つの新たな脆弱性を含む70%以上のリコールで、地上の真実的ロジックの脆弱性を効果的に検出する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:51:17 GMT)
PolyDiffuse: Polygonal Shape Reconstruction via Guided Set Diffusion
Models [26.8] PolyDiffuseは、視覚センサデータを拡散モデル(DM)で多角形に変換する新しい構造化再構成アルゴリズムである。
DMは、生成AIが爆発する中、新興機械であり、センサデータに条件付けされた生成プロセスとして再構築を定式化している。
我々は,多角形の集合としてのフロアプランと,一組のポリラインとしての自律走行車用HDマップという,2種類の多角形形状を再構築するためのアプローチを評価した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:55:07 GMT)
BiSwift: Bandwidth Orchestrator for Multi-Stream Video Analytics on Edge [26.8] BiSwiftは、マルチレベルパイプラインと統合された新しい適応型ハイブリッドによって、同時リアルタイムビデオ分析をスケールする、双方向フレームワークである。
BiSwiftは10%$sim$21%の精度を改善し、最先端のビデオ分析パイプラインと比較して1.2$sim$9$times$スループットを提供する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:25:43 GMT)
MVDiffusion: Enabling Holistic Multi-view Image Generation with
Correspondence-Aware Diffusion [26.6] 本稿では,一貫したマルチビュー画像を生成するためのシンプルで効果的なMVDiffusionを提案する。
MVDiffusionは同時にすべての画像をグローバルに生成し、一般的なエラーの蓄積に効果的に対処する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:32:26 GMT)
Self-supervised Learning of Implicit Shape Representation with Dense
Correspondence for Deformable Objects [26.1] 変形可能な物体に対する暗黙的形状表現を学習するための,新しい自己教師型アプローチを提案する。
本手法は, 骨格と皮膚の重量の先行を必要とせず, 符号付き距離場で表現される形状の収集のみを必要とする。
我々のモデルは大きな変形を伴う形状を表現することができ、テクスチャ転送や形状編集といった2つの典型的な応用をサポートすることができる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:48:33 GMT)
Solving Label Variation in Scientific Information Extraction via
Multi-Task Learning [25.7] ScientificIEの2つの一般的なデータセットは、SemEval-2018 Task-7とSciERCである。
重複するサンプルを持ち、アノテーションのスキームが異なるため、矛盾が生じる。
ラベルのバリエーションに対処するためのマルチタスク学習に基づく新しいアプローチを最初に導入した。
そこで,不整合ラベルを確率分布に変換するソフトラベリング手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 15:24:41 GMT)
Nighttime Person Re-Identification via Collaborative Enhancement Network
with Multi-domain Learning [25.6] 本稿では,並列フレームワークにおけるマルチレベル機能インタラクションを行うCENetという新しい協調型拡張ネットワークを提案する。
特にCENetは並列トランスフォーマーネットワークであり、設計された並列構造は、ライティング画像の品質がReID性能に与える影響を避けることができる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:19:36 GMT)
Spatial-Temporal Interplay in Human Mobility: A Hierarchical
Reinforcement Learning Approach with Hypergraph Representation [25.3] STI-HRLフレームワークは、人間の移動意思決定における空間的要因と時間的要因の相互作用を捉えている。
階層的決定設定を補完するため,過去のデータを整理するハイパーグラフを構築した。
実世界の2つのデータセットに対する実験は、ユーザの次の訪問を予測するための最先端手法よりもSTI-HRLの方が優れていることを検証した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:00:05 GMT)
Scalable Geometric Fracture Assembly via Co-creation Space among
Assemblers [24.9] 我々は,意味情報に頼らずに,幾何学的フラクチャーアセンブリのためのスケーラブルなフレームワークを開発した。
本稿では, フラクチャー・アセンブリ・プロセスにおける衝突問題に対処するために, 新たな損失関数,すなわち幾何に基づく衝突損失を導入する。
私たちのフレームワークは、既存の最先端フレームワークと比較して、PartNetとBreaking Badデータセットの両方でパフォーマンスが向上しています。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:39:12 GMT)
Differentially Private Over-the-Air Federated Learning Over MIMO Fading
Channels [24.5] フェデレートラーニング(FL)は、エッジデバイスが機械学習モデルを協調的にトレーニングすることを可能にする。
オーバー・ザ・エアのモデルアグリゲーションは通信効率を向上させるが、無線ネットワーク上のエッジサーバにモデルをアップロードすると、プライバシのリスクが生じる可能性がある。
FLモデルとマルチアンテナサーバとの通信がプライバシー漏洩を増幅することを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 17:27:55 GMT)
Multi-modal Large Language Model Enhanced Pseudo 3D Perception Framework
for Visual Commonsense Reasoning [24.3] 代表作は、まず画像中のオブジェクトを認識し、それからテキスト中のキーワードと関連付ける。
MLLM拡張擬似3次元認識フレームワークは、視覚的コモンセンス推論のために設計されている。
VCRデータセットの実験は、最先端のアプローチよりも提案されたフレームワークの方が優れていることを示している。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:59:02 GMT)
IQAGPT: Image Quality Assessment with Vision-language and ChatGPT Models [24.0] 本稿では,画像品質評価システムIQAGPTを紹介する。
トレーニングと評価のためのCT-IQAデータセットを構築した。
LLMの能力をよりよく活用するために、アノテートされた品質スコアをプロンプトテンプレートを用いて意味的にリッチなテキスト記述に変換する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:13:18 GMT)
Are All Unseen Data Out-of-Distribution? [23.5] 未知データの分布はアウト・オブ・ディストリビューション(OOD)として扱われている。
多くの証拠は、トレーニングデータのサイズの増加が、テストデータの一般化エラーを単調に減少させることを示唆している。
特に、トレーニングデータが複数のソースドメインを持ち、テストデータが分散ドリフトを含む場合、トレーニングデータのサイズが大きくなるにつれて、すべての一般化エラーが単調に減少するわけではない。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:00:38 GMT)
Viral Marketing in Social Networks with Competing Products [23.5] ネットワーク内のレッドシードノードを選択するための時間近似アルゴリズムを提案する。
実世界および合成ネットワークにおける実験により,提案アルゴリズムが他のアルゴリズムより優れていることを示す。
特に、ノード数/エッジ数、最大外度、直径など、異なるグラフパラメータの観点から収束時間に関するいくつかの厳密な境界を証明します。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 21:59:15 GMT)
Modality-missing RGBT Tracking via Invertible Prompt Learning and A
High-quality Data Simulation Method [22.7] 現在のRGBT追跡研究は主に、現実世界のシーンにおけるモダリティを欠く課題を見越して、モダリティ完備なシナリオに焦点を当てている。
本稿では、コンテンツ保存プロンプトをよく訓練された追跡モデルに統合する、新しい非可逆的プロンプト学習手法を提案する。
提案手法は,最先端手法と比較して,大幅な性能向上を実現している。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:39:00 GMT)
iKUN: Speak to Trackers without Retraining [21.6] 市販トラッカーとの通信を実現するため,iKUNと呼ばれる挿入可能な知識統一ネットワークを提案する。
局所化精度を向上させるために,プロセスノイズを動的に調整するKalman filter (NKF) のニューラルバージョンを提案する。
また、パブリックなDanceTrackデータセットをモーションとドレッシング記述で拡張することで、より困難なデータセットであるRefer-Danceにもコントリビュートしています。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:48:55 GMT)
Toward Accurate and Temporally Consistent Video Restoration from Raw
Data [20.4] 連続的かつ高精度な空間伝搬による新しいVJDDフレームワークを提案する。
提案した損失は,不正確な流量推定による誤差蓄積問題を回避することができる。
復元精度,知覚品質,時間的整合性の観点から,VJDDの先行性能を示す実験を行った。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:38:03 GMT)
XuanCe: A Comprehensive and Unified Deep Reinforcement Learning Library [18.6] XuanCeは総合的に統合された深層強化学習(DRL)ライブラリである。
XuanCeは40以上の古典DRLとマルチエージェントDRLアルゴリズムを含む幅広い機能を提供している。
XuanCeはオープンソースで、https://agi-brain.com/agi-brain/xuance.gitでアクセスできる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:45:39 GMT)
A Faithful Deep Sensitivity Estimation for Accelerated Magnetic
Resonance Imaging [18.5] 本稿では,JDSIと呼ばれる統合深度感性推定と画像再構成ネットワークを提案する。
画像アーティファクトの除去の間に、高周波数情報を持つより忠実な感度マップが徐々に提供され、画像再構成が改善される。
生体内データセットとラジオロジカル・リーダーによる研究の結果、キャリブレーションベースとキャリブレーションレスの再構築の両方において、提案したJDSIは最先端の性能を視覚的に定量的に達成することを示した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:03:51 GMT)
A Survey on Open-Set Image Recognition [18.5] オープンセット画像認識(OSR)は、既知のクラスサンプルの分類と、テストセット内の未知クラスサンプルの識別の両方を目的としている。
我々は,既存のDNNベースのOSR手法を包括的にレビューする新しい分類法を提案する。
我々は、粗粒度データセットと細粒度データセットの両方において、典型的なOSR法と最先端OSR法のパフォーマンスを比較した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 00:30:23 GMT)
TACIT: A Target-Agnostic Feature Disentanglement Framework for
Cross-Domain Text Classification [17.2] クロスドメインテキスト分類は、ラベルの豊富なソースドメインからラベルの少ないターゲットドメインにモデルを転送することを目的としている。
本稿では,ロバストな特徴とアンロバストな特徴を適応的に分離する対象領域特徴のアンタングル化フレームワークであるTACITを提案する。
我々のフレームワークは、ソースドメインデータのみを活用しながら、最先端のベースラインに匹敵する結果を得る。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 02:52:36 GMT)
O3D: Offline Data-driven Discovery and Distillation for Sequential
Decision-Making with Large Language Models [16.9] 大規模言語モデル(LLM)の最近の進歩は、逐次的意思決定問題を解決する上で有望な性能を示した。
LLMエージェントのコンテキスト内学習性能を向上させるために,オフラインデータを大規模に活用するオフライン学習フレームワークを提案する。
次に、細調整なしでLCMによるポリシーを改善するために、オフラインデータ駆動型ディスカバリー・蒸留(O3D)フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:29:04 GMT)
WebVLN: Vision-and-Language Navigation on Websites [15.9] Vision-and-Language Navigation (VLN)タスクは、AIエージェントが自然言語命令を正確に理解し、追跡できるようにすることを目的としている。
本稿ではWebVLN(Vision-and-Language Navigation on Websites)という新しいタスクを提案する。
質問ベースのインストラクションを使ってエージェントを訓練し、ユーザがWebサイトを自然に閲覧する方法をエミュレートする。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 22:13:26 GMT)
Osprey: Pixel Understanding with Visual Instruction Tuning [15.7] Ospreyは、細かいマスク領域を言語命令に組み込むことでMLLMを拡張するマスクテキスト命令チューニング手法である。
この目的を達成するために、まず724Kサンプルを用いてマスクベースの領域テキストデータセットをキュレートし、次いでLLMにピクセルレベルの表現を注入して視覚言語モデルを設計する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:50:19 GMT)
MetaScript: Few-Shot Handwritten Chinese Content Generation via
Generative Adversarial Networks [15.0] 漢字のデジタル表現における個人的手書きスタイルの存在感の低下に対処する新しいコンテンツ生成システムであるMetaScriptを提案する。
本手法は,個人固有の手書きスタイルを保ち,デジタルタイピングの効率を維持できる漢字を生成するために,数ショット学習の力を利用する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 17:31:19 GMT)
TEILP: Time Prediction over Knowledge Graphs via Logical Reasoning [14.5] 本稿では,時間的要素を知識グラフ予測に統合する論理的推論フレームワークTEILPを提案する。
まず、TKGを時間的事象知識グラフ(TEKG)に変換する。
最後に、条件付き確率密度関数を導入し、クエリ間隔を含む論理規則に関連付けて、時間予測に着く。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 21:54:56 GMT)
Video-Specific Query-Key Attention Modeling for Weakly-Supervised
Temporal Action Localization [14.4] 弱いトリミングされた時間的アクションローカライゼーションは、ビデオレベルのアクションラベルのみを用いて、教師なしビデオ内のアクションインスタンスを特定し、ローカライズすることを目的としている。
本稿では,VQK-Netという名前のネットワークを提案する。ビデオ固有のクエリキーアテンションモデリングにより,各ビデオのアクションカテゴリ毎にユニークなクエリを学習する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:10:21 GMT)
Federated learning-outcome prediction with multi-layer privacy
protection [14.3] FecMapは、ローカルクライアントのプライベートデータを保存し、グローバルな一般化モデルを通じて他の人と通信する分散グレード予測モデルである。
FecMapは、グローバル機能に対するローカル機能を明示的に学習するローカルサブスペース学習(LSL)と、プライベート機能を階層的に保護するマルチレイヤプライバシ保護(MPP)について検討している。
この研究は、学習分析タスクにおけるフェデレーション学習の利用を新たに試み、プライバシー保護によるパーソナライズされた教育の促進への道を開く可能性がある。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:29:05 GMT)
EHRXQA: A Multi-Modal Question Answering Dataset for Electronic Health
Records with Chest X-ray Images [13.8] 構造化されたEHRと胸部X線画像を組み合わせた新しいマルチモーダル質問応答データセットであるEHRXQAを紹介する。
EHRにおけるマルチモーダルな質問の独特な課題に対処するため,外部VQA APIを備えたニューラルベース戦略を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 16:26:23 GMT)
Sparse-view CT Reconstruction with 3D Gaussian Volumetric Representation [13.7] Sparse-view CTは従来のCTスキャンの放射線線量を減らすための有望な戦略である。
近年、3Dガウスアンは複雑な自然シーンのモデル化に応用されている。
スパース・ビューCT再建の可能性について検討した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:47:33 GMT)
Inference of Dependency Knowledge Graph for Electronic Health Records [13.4] 動的対数線形トピックモデルに基づくスパース知識グラフの導出フレームワークを提案する。
このモデルでは、経験的ポイントワイド相互情報行列上で特異値分解を行うことにより、KG埋め込みを推定する。
次に、KG低ランク推定器のエントリーワイド正規度を確立し、制御されたI型誤差によるスパースグラフエッジの回復を可能にする。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:45:36 GMT)
On Robust Wasserstein Barycenter: The Model and Algorithm [13.0] 固定支援RWB (fixed-RWB) と自由支援RWB (free-RWB) の2種類のロバストなバリセンター問題 (RWB) の計算効率向上に焦点をあてる。
まず、モデル還元による効率の改善を行い、固定RWBと自由RWBの両方で機能する拡張ワッサーシュタインバリセンタ問題としてRWBを削減する。
次に,モデル削減手法とコアセット手法を組み合わせることで,重みと位置を交互に更新することで,自由RWBのアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 16:20:32 GMT)
Active headrest combined with a depth camera-based ear-positioning
system [12.9] アクティブヘッドレストは、アクティブノイズコントロール(ANC)システムに基づいて、耳周りの低周波ノイズを低減することができる。
この問題を解決するために、深度カメラに基づく人間の耳位システムを導入している。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:28:19 GMT)
General Phrase Debiaser: Debiasing Masked Language Models at a
Multi-Token Level [12.0] 我々はtextbf General Phrase Debiaser と呼ばれる自動マルチトークンデバイアスパイプラインを提案する。
具体的には,ウィキペディアページからステレオタイプ句を生成するテキストフレーズフィルタのステージから構成する。
後者はモデルのバイアスをトリガーするプロンプトを検索し、デバイアスに使用する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 02:57:36 GMT)
Swap-based Deep Reinforcement Learning for Facility Location Problems in
Networks [11.6] グラフ上の施設位置問題は、実世界ではユビキタスであり、非常に重要である。
p-median問題とグラフ上の施設配置問題に対処するスワップベースフレームワークを提案する。
また,複雑なグラフ構造に対する意識を示す新しい強化学習モデルも導入する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:00:25 GMT)
Minimax Analysis for Inverse Risk in Nonparametric Planer Invertible
Regression [11.2] 平面上の逆関数を推定するミニマックスリスクについて検討するが、推定器も可逆である。
導出されたミニマックスレートは、非可逆双リプシッツ関数のそれに対応しており、これは、この可逆性が推定問題の複雑性をその速度で減少させないことを示している。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:30:07 GMT)
MFAS: Emotion Recognition through Multiple Perspectives Fusion
Architecture Search Emulating Human Cognition [11.0] 音声感情認識は、人間に似たターゲット音声における感情状態を特定し、分析することを目的としている。
連続的な視点から音声コンテンツを理解することによって、より包括的な感情情報を捉えることができることを示す。
我々はMFAS(Multiple perspectives Fusion Architecture Search)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 01:57:40 GMT)
Contrastive Learning-Based Framework for Sim-to-Real Mapping of Lidar
Point Clouds in Autonomous Driving Systems [11.0] 本稿では,自動走行システムにおいて広く使われている知覚センサであるライダー点雲のシミュレートと実写マッピングに焦点を当てた。
画像と画像の翻訳技術の最近の進歩に触発された、コントラシティブ・ラーニングに基づく新しいSim-to-Realマッピングフレームワーク、すなわちCRS2Rを紹介する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 21:55:00 GMT)
Self-Supervised Learning for Few-Shot Bird Sound Classification [10.4] 音声における自己教師あり学習(SSL)は、様々な領域において大きな可能性を秘めている。
本研究では,アノテーションを必要とせずに,音声録音から有意義な鳥の音の表現を抽出できることを実証する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 22:33:45 GMT)
Lifting by Image -- Leveraging Image Cues for Accurate 3D Human Pose
Estimation [10.4] 2次元ポーズからのリフト」法が3Dヒューマンポーズ推定の主流となっている(3DHPE)
画像中のリッチな意味とテクスチャ情報は、より正確な「リフト」手順に寄与する。
本稿では, 一般化問題の原因と画像特徴の有効性について, 新たな知見を与える。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:50:58 GMT)
Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation using
Large Language Models [10.3] Co-NavGPTは、多ボット協調視覚目標ナビゲーションのためのグローバルプランナーとしてLarge Language Modelsを統合する革新的なフレームワークである。
探索された環境データをプロンプトにエンコードし、LLMのシーン理解を強化する。
その後、探索フロンティアを各ロボットに割り当て、効率的な目標探索を行う。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:57:13 GMT)
Unsupervised Domain Adaptation for Semantic Segmentation with Pseudo
Label Self-Refinement [9.7] 擬似ラベルのオンライン精錬のための補助的擬似ラベル精錬ネットワーク(PRN)を提案する。
3つの異なるドメインシフトを持つベンチマークデータセットに対する我々のアプローチを評価する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:23:11 GMT)
RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for
Program Repair [9.4] 本稿では,APRのコード表現と,LoRAと呼ばれるパラメータ効率の高いLLM微調整技術を組み合わせたプログラム修復手法を提案する。
この結果、LLaMAは言語モデルでバグを修正するのに非常に効果的なプログラム修復アダプタを作成した。
全体として、Re repairLLaMAは125のDefects4J v2と82のHumanEval-Javaバグを正しく修正し、すべてのベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:39:46 GMT)
A Closed-Loop Multi-perspective Visual Servoing Approach with
Reinforcement Learning [9.2] 我々は,新しい学習型多視点視覚サーボフレームワークについて紹介した。
本研究では,異なる視点から初期画像から最適制御ポリシーを学習できることを実証した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 20:46:36 GMT)
Tailoring coherent microwave emission from a solid-state hybrid system
for room-temperature microwave quantum electronics [8.9] マイクロ波量子増幅とX帯での発振を室温で行うことが可能な固体ハイブリッドシステムについて報告する。
ハイブリッドシステムに外部駆動と能動消散制御を組み込むことで,9.4GHzのメーザーエミッション特性の効率的なチューニングを実現する。
我々の研究は、量子情報処理と通信のために新しい固体メーザーを最適化する機会を強調している。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:51:47 GMT)
Multi-level Relation Learning for Cross-domain Few-shot Hyperspectral
Image Classification [8.8] クロスドメインの少数ショットハイパースペクトル画像分類は、ソースドメインから多数のラベル付きサンプルから事前知識を学ぶことに焦点を当てている。
本稿では,異なるレベルのサンプル関係を学習し,それらをモデル学習プロセスに取り入れることを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:43:43 GMT)
Universal Control in Bosonic Systems with Weak Kerr Nonlinearities [8.8] 弱い単光子自己Kerr非線形性を持つ共振器は、理論的には、フォック状態がそれらの非線形性よりもはるかに大きい損失が存在する場合に備えるために用いられる。
これらの系は有限次元部分空間において任意の所望のゲート演算を達成するために制御できる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 18:17:47 GMT)
BDIS-SLAM: A lightweight CPU-based dense stereo SLAM for surgery [8.4] 本研究の目的は,シングルコアCPU上で動作し,リアルタイムな性能を実現する軽量な高密度ステレオSLAMシステムである。
新しい高密度ステレオマッピングモジュールはORB-SLAM2システムに統合され、BDIS-SLAMと名付けられた。
BDIS-SLAMは、典型的な内視鏡/大腸内視鏡のシナリオにおいて、現代のシングルコアCPU上で30Hz以上の速度で動作する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:07:37 GMT)
Neural Born Series Operator for Biomedical Ultrasound Computed
Tomography [8.3] 本稿では,波動シミュレーションの高速化を目的とした新技術であるNeural Born Series Operator (NBSO)を紹介する。
NBSOは前方シミュレーションと画像再構成の両方において正確かつ効率的であることが証明されている。
この進歩は、ニューラルオペレーターがほぼリアルタイムでUSCT再建を促進する可能性を示し、USCTの臨床応用がますます有効で有望になる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 01:06:31 GMT)
GanFinger: GAN-Based Fingerprint Generation for Deep Neural Network
Ownership Verification [8.0] 本稿では,ネットワークの動作に基づいてネットワーク指紋を構築するために,GanFingerというネットワークフィンガープリント手法を提案する。
GanFingerは、効率性、ステルス性、差別性において最先端の技術を著しく上回っている。
指紋生成では6.57倍の速度でARUC値が0.175に向上し、相対的に約26%向上した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:35:57 GMT)
Revisiting Knowledge Distillation under Distribution Shift [7.8] 本研究では, 流通シフトに対する知識蒸留のメカニズムについて検討する。
本稿では,2つの一般分布シフトに対して知識蒸留をベンチマークするための統一的かつ体系的な枠組みを提案する。
分布シフト下での教育成績の低さを興味深い観察で明らかにした。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:43:31 GMT)
A Multi-Modal Contrastive Diffusion Model for Therapeutic Peptide
Generation [7.8] 本稿では,新しいペプチド配列と構造を共生成するために,拡散フレームワークにおける配列と構造の両方のモダリティを融合したマルチモーダルコントラスト拡散モデルを提案する。
MMCDは、抗菌性/抗がん性スコア、多様性、ペプチドドッキングなど、さまざまな指標で治療ペプチドを産生する、最先端のディープジェネレーション法よりも優れている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:20:26 GMT)
A Split-and-Privatize Framework for Large Language Model Fine-Tuning [7.4] パラメータ効率の良い微調整では、下流のデータセットでトレーニングされるのは、少数のモジュールのみである。
本研究では,既存の分割学習アーキテクチャを適応させることで,プライバシ問題を緩和するSAP(Split-and-Privatize)フレームワークを提案する。
その結果,1%モデルの性能劣化を犠牲にして,経験的プライバシを62%向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:53:33 GMT)
Context-aware Communication for Multi-agent Reinforcement Learning [7.2] マルチエージェント強化学習(MARL)のための文脈認識型コミュニケーション手法を開発する。
通信プロトコルCACOMは2つの段階から構成される。
第1段階では、エージェントは放送方式で粗い表現を交換し、第2段階のコンテキストを提供する。
その後、エージェントは第2段階の注意機構を利用し、受信機用にパーソナライズされたメッセージを選択的に生成する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:33:08 GMT)
Diversity-Based Recruitment in Crowdsensing By Combinatorial Multi-Armed
Bandits [6.8] 本稿では,モバイル端末とそのユーザを中心的要求者の協調の下で集団センシングタスクに活用するモバイル・クラウドセンシングについて検討する。
ここでの最大の課題は、最初は未知であり、徐々に学ばなければならない個々の労働者の知覚能力の変化である。
本稿では,各ラウンドにおけるタスクの重み付けを各ラウンドの割り当て頻度に基づいて動的に調整することにより,各ラウンドにおけるタスクの多様性を高める新しいモデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:54:58 GMT)
Navigating Decision Landscapes: The Impact of Principals on
Decision-Making Dynamics [6.8] 本研究は、意思決定プロセスに加え、プリンシパルや外部ガイドを導入しました。
これらの原則の信頼性は決定に大きな影響を与えた。
本研究は,意思決定の文脈に信頼を置く際に注意が必要であることを強調した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 00:24:29 GMT)
Be More Active! Understanding the Differences between Mean and Sampled
Representations of Variational Autoencoders [6.7] 不整合表現を学習する変分オートエンコーダの能力は、実践的な応用にアピールしている。
下流のタスクに一般的に使用される平均表現は、最近、サンプリングされたタスクよりも相関が強いことが示されている。
その結果, 受動的変数は, 平均表現において他の変数と高い相関値を示し, サンプルでは相関関係が全くないことがわかった。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 15:08:02 GMT)
Demystifying Code Snippets in Code Reviews: A Study of the OpenStack and
Qt Communities and A Practitioner Survey [6.5] コードレビューのコードスニペットに関する情報と知識をマイニングするために、混合メソッドの研究を行います。
調査の結果は、レビュー担当者が開発者がコードレビューに必要な特定の情報を満たすために、適切なシナリオでコードスニペットを提供することができることを強調している。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 02:59:58 GMT)
PBScaler: A Bottleneck-aware Autoscaling Framework for
Microservice-based Applications [6.5] マイクロサービスベースのアプリケーションのためのボトルネック対応自動スケーリングフレームワークPBScalerを提案する。
PBScalerは資源を効率的に保存しながら既存の手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:58:34 GMT)
SAiD: Speech-driven Blendshape Facial Animation with Diffusion [6.4] 大規模なビジュアルオーディオデータセットが不足しているため、音声駆動の3D顔アニメーションは困難である。
拡散モデル (SAiD) を用いた音声駆動型3次元顔アニメーションを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:40:32 GMT)
Adaptive FSS: A Novel Few-Shot Segmentation Framework via Prototype
Enhancement [6.2] Few-Shot (FSS) は、いくつかの注釈付き画像を用いて、新しいクラスセグメンテーションタスクを達成することを目的としている。
本稿では,既存のFSSモデルを新しいクラスに効率的に適応できるアダプタ機構,すなわちAdaptive FSSに基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:03:38 GMT)
Interference of cavity light by a single atom acting as a double slit [6.0] 二重井戸内の1つの原子トンネルが光リング空洞に結合すると、干渉現象が生じる。
分散状態において外部レーザーによって駆動されるので、原子によって放出される磁場は干渉パターンを示す。
我々の研究は、量子情報応用のための原子の制御可能な外部状態で光子を操作する方法を開く。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:06:11 GMT)
EnrichEvent: Enriching Social Data with Contextual Information for
Emerging Event Extraction [5.8] 本稿では,ストリーミングソーシャルデータの言語的および文脈的表現を活用する新しいフレームワークであるEnrichEventを提案する。
提案するフレームワークは,イベントの時間的変化を示すために,各イベントのクラスタチェーンを生成する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 14:27:55 GMT)
PersianLLaMA: Towards Building First Persian Large Language Model [5.8] 本稿ではペルシャ語テキストとデータセットの収集に基づいて訓練されたペルシャ語モデルであるペルシャ語モデル(ペルシャ語モデル)を紹介する。
その結果、ペルシャのLLaMAは、ペルシャ語のテキストの理解と生成において、競争相手を著しく上回っていることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:48:55 GMT)
ESGReveal: An LLM-based approach for extracting structured data from ESG
reports [5.5] ESGRevealは企業報告から環境・社会・ガバナンス(ESG)データを効率的に抽出・分析するための革新的な手法である。
このアプローチは、検索拡張生成(RAG)技術で強化されたLarge Language Models (LLM)を利用する。
この効果は、2022年に香港証券取引所に上場した様々な分野の166社のESGレポートを用いて評価された。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:44:32 GMT)
Benchmarking Machine Learning Models for Quantum Error Correction [5.2] 我々は、機械学習に基づく量子誤り訂正を理解するための新しい視点を提供する。
ニューラルネットワークアーキテクチャにまたがる7つの最先端ディープラーニングアルゴリズムを評価した。
遠方のアシラキュービットからの情報を活用するための受容野を拡大することにより、QECの精度は著しく向上する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:51:19 GMT)
GenPose: Generative Category-level Object Pose Estimation via Diffusion
Models [5.2] カテゴリーレベルのオブジェクトポーズ推定を条件付き生成モデルとして再検討することで,新しい解を提案する。
提案手法は,厳密な5d2cmおよび5d5cmの計測値に対して50%と60%を越え,REAL275データセットの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:03:49 GMT)
Classification by sparse additive models [4.4] 我々は(非パラメトリック)スパース加法モデル(SpAM)を分類する。
SpAM分類器の設計は、スパース群Lasso/Slope型ペナルティによるロジスティック損失を最小化することに基づいている。
あるスパース群で制限された固有値条件の下では、解析的、ソボレフ、ベソフ類の全範囲にわたって、ほぼ最小(対数因子まで)であることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:27:56 GMT)
A graph-based multimodal framework to predict gentrification [4.4] 本稿では,トラクタと必須施設の都市ネットワークに基づくジェントリフィケーションを予測するための,グラフに基づくマルチモーダル深層学習フレームワークを提案する。
シカゴ、ニューヨーク、ロサンゼルスのデータを使って提案されたフレームワークをトレーニングし、テストする。
このモデルは平均0.9倍の精度で国勢調査水準のジェントリフィケーションを予測できる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:20:50 GMT)
Choosing the Right Path for AI Integration in Engineering Companies: A
Strategic Guide [4.3] 論文では、ビジネス理解からデプロイメント、さらなる進化に至るまで、AIソリューション構築のライフサイクル全体について取り上げている。
このフレームワークは、エンジニアリング企業がビジネス価値を生み出すための最適なAIアプローチを選択するのに役立つかもしれない。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:58:37 GMT)
Pilot-Based Key Distribution and Encryption for Secure Coherent Passive Optical Networks [4.0] 安全なコヒーレントPONのための4レベルパルス振幅変調(GCS-PAM4)の鍵分布を設計する。
デジタルサブキャリア多重化を用いた200-GbpsセキュアコヒーレントPONの実験結果から,GCS-PAM4パイロットベースの鍵分布は,追加のオーバーヘッドを占有することなく上流送信時にエラーを発生させる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:18:05 GMT)
AHAM: Adapt, Help, Ask, Model -- Harvesting LLMs for literature mining [3.8] 本稿では、BERTopicトピックモデリングフレームワークのドメイン固有のテキストbfadaptationをガイドするAHAMの方法論とメトリクスについて述べる。
LLaMa2生成言語モデルを利用することで、ワンショット学習によるトピック定義を生成する。
トピック間の類似度評価には、言語生成および翻訳プロセスからのメトリクスを利用する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 18:23:03 GMT)
Astrocyte Regulated Neuromorphic CPG Control of Legged Robotic
Locomotion [3.8] 本稿では,四足歩行ロボットのための移動歩行学習用アストロサイト制御スパイキングニューラルネットワーク (SNN) を提案する。
SNNベースのCPGは、多目的物理シミュレーションプラットフォーム上でシミュレーションされ、平地でロボットを走らせながらトロッティング歩行が出現する。
最先端の強化学習に基づくロボット制御アルゴリズムと比較して、23.3Times$計算パワーセーブが観測される。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 20:33:16 GMT)
A Comprehensive Study of Object Tracking in Low-Light Environments [3.5] 本稿では,ノイズ,色不均衡,低コントラストが自動物体追跡装置に与える影響について検討する。
本稿では,低照度化と低照度化を両立させて追尾性能を向上させる手法を提案する。
実験結果から,低照度合成データセットを用いてトレーニングしたトラッカーは,バニラMixFormerとSiam R-CNNより優れていた。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 17:20:57 GMT)
Attention Deficit is Ordered! Fooling Deformable Vision Transformers
with Collaborative Adversarial Patches [3.5] 変形可能な視覚変換器は、注意モデリングの複雑さを著しく低減する。
最近の研究は、従来の視覚変換器に対する敵攻撃を実証している。
我々は,対象のパッチに注意を向けるようにソースパッチが操作する新たなコラボレーティブアタックを開発する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:35:41 GMT)
Control and readout of a transmon using a compact superconducting
resonator [3.3] トランスモン量子ビットに基づく超伝導人工原子の制御と読み出しを実証する。
共振器のフットプリントは約200m×200mで、標準的なトランスモンサイズに似ている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 15:33:23 GMT)
Comparative Analysis of Radiomic Features and Gene Expression Profiles
in Histopathology Data Using Graph Neural Networks [3.2] 本研究は,メラノーマ分類におけるMELCデータと放射能抽出機能を統合するために,グラフニューラルネットワークを用いた。
遺伝子発現プロファイルと放射線特徴の有効性を評価し,放射線特徴が分類性能を著しく向上させることを明らかにした。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 22:49:03 GMT)
Entangling two Dicke states in a periodic modulated quantum system [3.1] 周期量子系における2つのディック状態の絡み合う理論的アプローチを提案する。
エネルギーレベルが各キュービットアンサンブルの励起数に非線形に依存する実効ハミルトニアンを導出する。
本研究では,周波数変調によるマグノンNOON状態の生成手法を提案し,デコヒーレンスの影響について検討する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 00:23:26 GMT)
The Broken Windows Theory Applies to Technical Debt [2.9] 技術的負債 (Technical debt, TD) とは、システムの進化と維持を阻害する準最適解の集合を指す用語である。
壊れたウィンドウ理論(BWT)がソフトウェア開発プロジェクトにも適用されると主張する者もいる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:47:39 GMT)
A Target Detection Algorithm in Traffic Scenes Based on Deep
Reinforcement Learning [2.9] 本研究では,実世界のシナリオにおける交通物体を正確に検出するために,深層強化学習を用いた新しいアクティブ検出モデルを提案する。
このモデルでは、LSTM-CNNに基づく深いQ-ネットワークを使用して、ターゲットゾーンをトラフィックオブジェクトの特定のカテゴリに識別し、アライメントする。
実験では、このモデルの精度を実証し、信号機の位置と速度制限標識の精度と性能を示した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:23:30 GMT)
Mixed-Integer Optimal Control via Reinforcement Learning: A Case Study
on Hybrid Vehicle Energy Management [2.8] 本稿では,2つの遅延深度決定論的アクターQ(TD3AQ)を最適制御問題に適用する,新しい連続離散強化学習法を提案する。
TD3AQはアクター批判とQ-ラーニングの両方の利点を組み合わせ、連続したアクション空間と離散的なアクション空間を同時に扱うことができる。
提案手法はプラグインハイブリッド電気自動車(PHEV)のエネルギー管理問題に対して評価される。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:12:38 GMT)
FAGC:Feature Augmentation on Geodesic Curve in the Pre-Shape Space [2.6] 本研究では, 形状空間理論に基づく特徴拡張法, すなわち, FAGC と呼ばれるジオデシック曲線上の特徴増強法を提案する。
提案手法は,小サンプルデータセットに対して単純で効果的で無感な手法である。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:27:09 GMT)
Masked Face Dataset Generation and Masked Face Recognition [2.4] パンデミック後の時代には、フェイスマスクを着用することは、通常の顔認識に大きな課題をもたらしてきた。
モデルを現実世界の状況に適応させるために、より困難なマスク付き顔データセットを作成しました。
50のアイデンティティMFR上での最良のテスト精度は95%に達した。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 17:09:02 GMT)
Measurement-based quantum computation in finite one-dimensional systems:
string order implies computational power [2.2] 本稿では,近距離対称資源状態における測定ベースの量子計算(MBQC)のパワーを評価するための新しい枠組みを提案する。
MBQC計算パワーと文字列順序の接続性を強化する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:30:21 GMT)
Large Scale Training of Graph Neural Networks for Optimal Markov-Chain
Partitioning Using the Kemeny Constant [2.0] 我々は,マルコフ連鎖のグラフ分割問題に対処するGNNアーキテクチャをいくつか提案する。
このアプローチは、提案されたパーティショニングがケメニー定数をどの程度変更するかを最小化することを目的としている。
線形層を持つグラフSAGEベースのGNNが、この文脈でより大きく、より表現力に富んだアテンションベースモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:38:19 GMT)
MuLA-GAN: Multi-Level Attention GAN for Enhanced Underwater Visibility [1.9] 本稿では,総合的な水中画像強調のためのGAN(Geneversarative Adrial Networks)とマルチレベルアテンション機構の相乗効果を利用した新しいアプローチであるMuLA-GANを紹介する。
本モデルは,水中画像の複雑な細部を捉え保存することに優れており,様々な用途に欠かせない。
この研究は、水中画像の強調における重要な研究ギャップに対処するだけでなく、GANの強化におけるマルチレベル注意の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:33:47 GMT)
Training Convolutional Neural Networks with the Forward-Forward
algorithm [1.7] Forward Forward (FF)アルゴリズムは、現在まで完全に接続されたネットワークでしか使われていない。
FFパラダイムをCNNに拡張する方法を示す。
MNIST手書き桁データセットの分類精度は99.0%である。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 05:47:20 GMT)
RDF-star2Vec: RDF-star Graph Embeddings for Data Mining [1.6] 本研究では、RDF-star2Vecという、RDF-starグラフのための新しい知識グラフ埋め込みモデルを紹介する。
複雑なRDF星グラフに着目したデータマイニングタスクのためのデータセットとベンチマークフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:32:14 GMT)
Complexity and Operator Growth for Quantum Systems in Dynamic
Equilibrium [1.2] クリロフ複雑性(Krylov complexity)は、量子系の作用素成長の尺度である。
我々は、Krylov複雑性が$mathsfPT$-symmetricと$mathsfPT$-symmetric-broken相を区別できることを示した。
以上の結果から,Krylov複雑性は$mathsfPT$-symmetric系の特性と遷移を探索するツールとして有用であることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 18:58:13 GMT)
Effects of cavity-mediated processes on the polarization entanglement of
photon pairs emitted from quantum dots [1.2] 2光子励起および共振器支援2光子放出下での偏光結合光子対の生成について検討した。
強いカップリング状態において、キャビティは水平および垂直に偏光されたエクシトン状態の不平等なアク・スタークシフトを導入し、エクシトン状態が効果的に分裂する。
第二に、弱いカップリング状態であっても、励起子状態間の交差結合を誘導し、望ましくない2光子状態を生成する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:34:10 GMT)
SantaQlaus: A resource-efficient method to leverage quantum shot-noise
for optimization of variational quantum algorithms [1.1] 変分量子アルゴリズム(VQA)に適した資源効率最適化アルゴリズムであるSantaQlausを紹介する。
サンタクロースは, 地域最適度の低さに収束するリスクを軽減するために, 既存のアルゴリズムよりも優れていることを示す。
これは、量子変分モデルの効率的で堅牢なトレーニングの道を開く。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 18:58:20 GMT)
Escaping Local Minima with Quantum Coherent Cooling [0.9] 本稿では,大域最小値を求めるためのハイブリッド量子古典アルゴリズムを提案する。
提案手法は, 量子コヒーレント冷却を利用してエネルギー障壁を通した配向トンネルを容易にする。
提案手法は量子キャビティを用いた回路量子電磁力学(cQED)システムで実装できる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 00:09:55 GMT)
Classical capacity of quantum non-Gaussian attenuator and amplifier
channels [0.8] 本稿では,ビームスプリッタや2モードスクラッシャを介して入力モードを任意の状態に設定した環境モードに結合する量子ボソニックチャネルについて考察する。
非ガウス減衰器 (非ガウス減衰器) または増幅器 (増幅器) と呼ばれるこのチャネルの古典的容量について検討する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:05:51 GMT)
D3L: Decomposition of 3D Rotation and Lift from 2D Joint to 3D for Human
Mesh Recovery [0.7] 我々は2次元関節から3次元メッシュ(D3L)への3次元回転とリフトの分解という新しいアプローチを提案する。
我々は3次元関節回転を骨方向と骨ねじれ方向に切り離して、人間のメッシュ回復タスクを、ポーズ、ツイスト、形状の推定に分解する。
提案手法は,人間のポーズ推定手法を活用でき,形状推定過適合によるポーズ誤差を回避することができる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:53:25 GMT)
The hidden Lorentz Covariance of Quantum Mechanics [0.6] ヒルベルト空間の各質量セクターはローレンツ代数の表現を持ち、各質量セクター上の(反)デシッター代数はポアンカレア代数に縮約することを示した。
また、3次元ファジィ空間はこれらの代数のユニタリ表現も持つことを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 15:18:57 GMT)
Challenges of Blockchain adoption in financial services in China's Greater Bay Area [0.6] 金融サービスにおけるテクノロジーの利用の増加は、多くの利害関係者に利益をもたらす可能性がある。
中国の大都市圏(広東-香港-マカオ)では、金融サービスにおける技術利用の増加は、多くの利害関係者に利益をもたらす可能性がある。
本稿では,金融業界における保険,銀行,支払い,資産取引,融資,送金,モノのインターネット(IoT)の現在の動向について考察する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 00:58:11 GMT)
Probing entanglement across the energy spectrum of a hard-core
Bose-Hubbard lattice [0.2] 絡み合いとその伝播は、量子系の様々な物理的性質を理解する中心である。
ここでは、2次元のハードコアBose-Hubbard格子をエミュレートするために、制御可能な4倍の超伝導量子ビット配列を用いる。
我々は、全ての格子サイトを同時に駆動して重畳状態を生成し、その多体エネルギースペクトルの相関長と絡み合いエントロピーを抽出する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 19:22:25 GMT)
$\mu$-Net: ConvNext-Based U-Nets for Cosmic Muon Tomography [0.1] $mu$-Netはミューオン散乱トモグラフィーのための新しいディープラーニングアルゴリズムである。
1024ミューオンの投与で17.14PSNRの最先端のパフォーマンスを達成する。
ミューオン検出をボクセルにマッピングする最初の大規模データセットを生成し、公開しています。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:54:44 GMT)
VAE for Modified 1-Hot Generative Materials Modeling, A Step Towards
Inverse Material Design [0.0] 材料設計において, 所定の特性を持つ材料を設計しようとする場合, 提案する新素材の合成可能性を確保することが重要な課題である。
私たちは、暗黙のデータセット関係、すなわち、ある物質をデータセット内の他の物質に分解することができることをエンコードします。
本稿では,この特性を潜在空間に保持し,新しいサンプルを生成可能なVAEモデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 04:04:47 GMT)
Using Cascade in Quantum Key Distribution [0.0] 本稿では,2方向誤り訂正プロトコルカスケードを用いた量子鍵分配(QKD)プロトコルの解析における重大な欠陥を指摘する。
この欠陥に対処し、有効なキーレートを生成する、単純でエレガントな代替手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:37:10 GMT)
The i.i.d. State Convertibility in the Resource Theory of Asymmetry for
Finite Groups and Lie groups [0.0] そこで本研究では,<i>d</i>状態変換の絶対誤差の最適値は,フィッシャー情報行列の比で有界であることを示す。
これらの結果は、RTAの適用範囲を大きく広げることが期待されている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 15:42:24 GMT)
Report of the DOE/NSF Workshop on Correctness in Scientific Computing,
June 2023, Orlando, FL [0.0] 本報告は2023年6月17日に開催されたDOE/NSF Workshop on Correctness in Scientific Computing (CSC'23)のダイジェストである。
CSC は DOE と NSF によって考案され,大規模科学的シミュレーションを行うために計算手法を使用している人々の間で,正当性に関する懸念が高まっている。
このような多様なバックグラウンドを持つ参加者を巻き込むため、CSCは2023年のFCRC(Federated Computing Research Conference)で開催された。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:59:18 GMT)
Reducing LLM Hallucinations using Epistemic Neural Networks [0.0] 我々は,Llama-2 7B モデル上に ENN をトレーニングし,コントラストデコード機能拡張技術と組み合わせた。
我々は、次のトークン予測タスクのためにENNをトレーニングし、TruthfulQAデータセットの幻覚を減らすためにこの方法の有効性を探求する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 01:17:01 GMT)
Quantum walks advantage on the dihedral group for uniform sampling
problem [0.0] 歩行を混合することは、マルコフ連鎖が群に対する定常分布を近似する過程である。
量子ウォークは古典的な場合よりも時間混合の潜在的な利点を示しているが、有限群の場合では一般的な証明が欠如している。
この研究は、非アーベル群、グラフ同型テスト等をサンプリングするアルゴリズムに潜在的な応用がある。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:21:55 GMT)
Quantum thermometry with optomechanical system [0.0] 光学場と機械共振器からなる光学系を用いた量子温度測定法を提案する。
プローブの量子フィッシャー情報を数値計算する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:47:53 GMT)
Preconditioning for a Variational Quantum Linear Solver [0.0] 必要なアンザッツ深さの顕著な減少を数値的に示すことにより,プリコンディショニングが量子アルゴリズムにも有用であることを明らかにする。
この回路深さの低減は、ノイズ中間スケール量子(NISQ)アルゴリズムの効率と精度を向上させる鍵となる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:50:22 GMT)
Polygamy relations for tripartite and multipartite quantum systems [0.0] 3部量子系および多部量子系におけるポリガミー特性について検討する。
トリパルタイト系において、ポリガミーのための解集合を構築し、その集合の下位境界を求める。これは、ポリガミウスとなるような補助の量子的絡み合いに対して十分かつ必要な条件である。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 10:26:58 GMT)
On the rank of two-dimensional simplicial distributions [0.0] 単純分布は、量子文脈性を研究するためのフレームワークを提供する。
本稿では,2 次元計測空間に対して定義されたツイスト単純分布の階数式を提案する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 19:11:41 GMT)
On the connection between weak measurement in quantum physics and
analytic phase-retrieval in classical wave optics [0.0] 2つの光学的弱測定は、量子物理学における弱い測定と密接な関係を持つことを示す。
偏光の前と後の選択は、分析位相検索で利用されるものと同様のフィルタリング効果を提供する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 03:25:36 GMT)
Numerical Methods for Quantum Spin Dynamics [0.0] 本報告は,量子スピン系のシミュレーションにおける数値計算法の効率性に関するものである。
既存の手法の精度は、チャープパルスの存在下で評価される。
この作業の結果はPythonパッケージのMagPyで実装され、現在のアプローチよりもエラー対コストの比率が向上している。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 00:35:24 GMT)
Non-locally Reconstructed both Sides of Wormhole and its
Non-Traversability [0.0] エンタングルドブラックホール間のトラベル可能なワームホールの理論的含意について検討した。
2つの最大絡み合ったブラックホールの絡み合った状態を利用することで、ワームホールを構築することができる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 06:51:26 GMT)
Non-Hermitian $p$-wave superfluid and effects of the inelastic
three-body loss in a one-dimensional spin-polarized Fermi gas [0.0] 一次元スピン偏極フェルミガス中の非エルミート$p$波フェルミ超流動性について検討する。
想像上の原子-二量体結合を考えると、超流動状態の原子損失効果に対する安定性について論じる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 13:21:52 GMT)
Measurement incompatibility at remote entangled parties is insufficient
for Bell nonlocality in two-input and two-output setting [0.0] ベル非局所性は、双方が任意の非互換な射影測度を使用する場合、常に確立することができる。
純2ビットの絡み合いを一定量共有する場合に,Cluser-Horne-Shimony-Holt Bell式を最適化する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 12:04:01 GMT)
Interaction-induced multiparticle bound states in the continuum [0.0] 連続体(BIC)における境界状態は、放射線連続体に属する局所的なモードである。
相互作用変調Bose-Hubbardモデルにおける新しい種類の多粒子状態を予測する。
準BICのThoulessポンプは、空間と時間におけるオンサイト相互作用を変調することで実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 09:16:26 GMT)
Hashmarks: Privacy-Preserving Benchmarks for High-Stakes AI Evaluation [0.0] 本稿では,適切な回答を開示することなく,オープンな言語モデルを評価するためのプロトコルであるハッシュマーキングを提案する。
最も単純な形式では、ハッシュマークは参照ソリューションが公開前に暗号的にハッシュ化されているベンチマークである。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:45:14 GMT)
Going Viral: An Analysis of Advertising of Technology Products on TikTok [0.0] 本研究は、感情分析、コンテンツ特性、インフルエンサーの役割など、バイラル性に関する様々な側面を分析する。
データスクレイピングと自然言語処理ツールを使って2000のTikTokポストと274,651のメタデータを分析し、TikTok上のバイラルテクノロジー製品広告のニュアンスに関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:40:12 GMT)
Generalized Majorana edge modes in a number-conserving periodically
driven $p$-wave superconductor [0.0] 解析的に可解で実験的に関係のある数保存型周期駆動型$p$-wave超伝導体について検討した。
そのような系は一般化されたマヨラナ 0 と $pi$ モードをサポートし、非エルミート的であるにもかかわらず、なおも qubit を符号化できる。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 07:49:47 GMT)
Generalization of Legendre functions applied to Rosen-Morse scattering
states [0.0] 関連するルジャンドル関数の一般化が提案され、ローゼン・モースポテンシャルの散乱を記述するために用いられる。
反射係数と透過係数の基本的な式が与えられ、一般化されたルジャンドル関数の積分恒等式が証明される。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 08:44:35 GMT)
Design and Implementation of a Tool for Extracting Uzbek Syllables [0.0] シラビフィケーション(Syllabification)は、言語研究、言語技術、教育、および様々な分野に応用された多用途の言語ツールである。
本稿では,ルールベースの手法や機械学習アルゴリズムを含む,ウズベク語のシラビフィケーションに対する包括的アプローチを提案する。
実験の結果,両アプローチは高い精度を示し,99%以上であった。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 17:46:58 GMT)
Conformable Schr\"odinger Equation in D-dimensional space [0.0] N 空間座標の分数次元系に対する時間依存整合性Schr"odinger方程式を拡張する。
特定の例として、自由粒子共形Schr"odinger波動力学がある。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 11:46:16 GMT)
Chatbot is Not All You Need: Information-rich Prompting for More
Realistic Responses [0.0] 近年のLarge Language Models (LLM) は、架空の人物や実際の人間を会話で模倣する際、顕著な能力を示している。
LLMからより現実的で一貫した応答を生成する新しい手法を提案する。
新しいベンチマークデータセットとコード、プロンプト、サンプル結果はGithubで公開しています。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 02:18:58 GMT)
A Sequential Detection and Tracking of Very Low SNR Objects [0.0] 超低信号雑音(SNR)オブジェクトの検出・追跡には,逐次検出・追跡(SDT)手法が提案されている。
1データフレームのしきい値に基づく従来の検出と追跡(CDT)アプローチは,比較のためのベンチマークとして検討されている。
論文参考訳(メタデータ) (Mon, 25 Dec 2023 22:31:31 GMT)