UReader: Universal OCR-free Visually-situated Language Understanding
with Multimodal Large Language Model [108.9] MLLM(Multimodal Large Language Model)に基づく汎用OCRのない視覚的言語理解の最初の探索であるUReaderを提案する。
MLLMの浅いテキスト認識能力を利用することで、パラメータを1.2%だけ微調整した。
言語理解タスク10のうち8つは、最先端のocrフリーな性能を実現している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:33:09 GMT)
PARL: A Unified Framework for Policy Alignment in Reinforcement Learning [106.6] 我々は、強化学習におけるポリシーアライメントの最近強調された重要な問題に対処するために、新しい統合された二段階最適化ベースのフレームワーク、textsfPARLを提案する。
その結果,提案したtextsfPARL が RL におけるアライメントの懸念に対処できる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:28:57 GMT)
Quantum Sensing with superconducting qubits for Fundamental Physics [103.7] 量子センシング(Quantum Sensing)は、ダークマター(ダークマター)の探索として、基礎物理学におけるその応用の1つを見つける、急速に拡大する研究分野である。
超伝導量子ビットの製造における最近の進歩は、量子センシングの進行に寄与している。
本研究では,Qub-ITによる最初の超伝導トランスモン量子ビット素子のキャラクタリゼーションについて述べる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:11:42 GMT)
Are Personalized Stochastic Parrots More Dangerous? Evaluating Persona
Biases in Dialogue Systems [103.4] ペルソナバイアス(Persona biases)とは、人格の違いに対する有害な対話モデル行動の感度である。
我々は、攻撃性、有害継続性、関係性、ステレオタイプ合意、および有害合意の5つの側面でペルソナバイアスを測定する。
我々の研究では、Blender、ChatGPT、Alpaca、Vicunaの4つのモデルにおいて、重要なペルソナバイアスを明らかにした。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:03:18 GMT)
Scaling Laws of RoPE-based Extrapolation [103.3] 基本値と外挿性能の関係を記述するために,RoPEに基づく外挿法におけるtextbftextitScaling法則を提案する。
LLaMA2 7Bと13Bで最大100万の文脈長を16Kのトレーニング長で達成した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:50:36 GMT)
Building an Open-Vocabulary Video CLIP Model with Better Architectures,
Optimization and Data [102.0] 本稿では,CLIPを強力なゼロショットビデオ分類器に適応させるフレームワークであるOpen-VCLIP++を提案する。
我々は,Open-VCLIP++のトレーニングが,履歴データゼロで連続的な学習に欠かせないことを実証した。
提案手法は,広く使用されている3つの行動認識データセットを用いて評価する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:46:43 GMT)
Detecting Road Obstacles by Erasing Them [101.5] 画像パッチを選択して周囲の道路テクスチャに塗布し,そのパッチから障害を取り除く傾向にある。
次に、元のパッチと塗布されたパッチとの相違を認識するためにトレーニングされたネットワークを使用し、消去された障害を通知します。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:30:49 GMT)
Agents: An Open-source Framework for Autonomous Language Agents [97.0] 我々は、言語エージェントを人工知能への有望な方向と見なしている。
Agentsはオープンソースライブラリで、これらの進歩を広く非専門的な聴衆に開放することを目的としています。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:43:38 GMT)
Low-Resolution Self-Attention for Semantic Segmentation [96.8] 我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:10:09 GMT)
ZooPFL: Exploring Black-box Foundation Models for Personalized Federated
Learning [95.6] 本稿では,限られた資源とパーソナライゼーションの両課題を解決しようと試みる。
個人化フェデレート学習におけるゼロ階最適化を用いたZOOPFLという手法を提案する。
計算コストの削減とパーソナライゼーションの向上を目的として,低次元およびクライアント固有の埋め込みを持つオートエンコーダを組み込む入力手術を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:26:13 GMT)
RA-DIT: Retrieval-Augmented Dual Instruction Tuning [93.4] Retrieval-augmented Language Model (RALMs) は、外部データストアからロングテールおよび最新の知識にアクセスすることで、パフォーマンスを向上させる。
既存のアプローチでは、LM事前トレーニングに高価な検索固有の修正が必要になるか、あるいは、最適以下のパフォーマンスをもたらすデータストアのポストホック統合を使用する必要がある。
本稿では,第3の選択肢を提供する軽量な微調整手法であるRetrieval-Augmented Dual Instruction Tuning (RA-DIT)を紹介する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:05:20 GMT)
FedFed: Feature Distillation against Data Heterogeneity in Federated
Learning [88.4] フェデレートラーニング(FL)は通常、データ不均一性、すなわちクライアント間の分散シフトに直面している。
我々はtextbfFederated textbfFeature textbfdistillation (FedFedFed) という新しいアプローチを提案する。
FedFedは、データをパフォーマンスに敏感な機能(すなわち、モデルパフォーマンスに多大な貢献)とパフォーマンスを損なう機能(つまり、モデルパフォーマンスに限られた貢献)に分割する。
総合的な実験は、モデル性能の促進におけるFedFedの有効性を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:00:59 GMT)
How Graph Neural Networks Learn: Lessons from Training Dynamics in
Function Space [86.3] 関数空間におけるグラフニューラルネットワーク(GNN)の学習力学について検討する。
学習したGNN関数がなぜ一般化したのか,また異種グラフ上での病的振る舞いについて解説する。
実際に、学習ダイナミクスのスポース化と実装は、最小主義的な半教師付き学習アルゴリズムに繋がる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:19:56 GMT)
SAMRS: Scaling-up Remote Sensing Segmentation Dataset with Segment
Anything Model [85.9] 我々はSAMRSと呼ばれる大規模RSセグメンテーションデータセットを生成するための効率的なパイプラインを開発する。
SAMRSは完全に105,090の画像と1,668,241のインスタンスを持ち、既存の高解像度RSセグメンテーションデータセットを数桁上回っている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:15:18 GMT)
Zero-Shot Detection of Machine-Generated Codes [83.0] 本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。
既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。
本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:08:21 GMT)
Outlier Weighed Layerwise Sparsity (OWL): A Missing Secret Sauce for
Pruning LLMs to High Sparsity [81.6] 本研究では,不均一層幅比の調整を施した新しいLCMプルーニング手法を提案する。
提案手法は,最先端の Wanda と SparseGPT を 61.22 と 6.80 のパープレキシティで70% に上回り,優れた性能向上を示した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:22:58 GMT)
Learning Separable Hidden Unit Contributions for Speaker-Adaptive
Lip-Reading [80.4] 話者自身の特徴は、ほとんど顔画像や浅いネットワークを持つ単一の画像によって常にうまく表現できる。
話し手によって表現される音声コンテンツに付随するきめ細かい動的特徴には、常に深いシーケンシャルネットワークが必要である。
私たちのアプローチは、既存の方法よりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:48:25 GMT)
Enhancing Argument Structure Extraction with Efficient Leverage of
Contextual Information [79.1] 本稿では,コンテキスト情報を完全に活用する効率的なコンテキスト認識モデル(ECASE)を提案する。
文脈情報や議論情報を集約するために,シーケンスアテンションモジュールと距離重み付き類似度損失を導入する。
各種ドメインの5つのデータセットに対する実験により,我々のモデルが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:47:10 GMT)
CREATOR: Tool Creation for Disentangling Abstract and Concrete Reasoning
of Large Language Models [78.7] 大規模言語モデル(LLM)はツールの利用において大きな進歩を遂げているが、その能力はAPIの可用性によって制限されている。
我々は、LCMがドキュメンテーションとコード実現を使って独自のツールを作成できる新しいフレームワークCREATORを提案する。
我々は,MATH と TabMWP のベンチマークで CREATOR を評価する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:12:12 GMT)
Bidirectional Knowledge Reconfiguration for Lightweight Point Cloud
Analysis [74.0] ポイントクラウド分析は計算システムのオーバーヘッドに直面し、モバイルやエッジデバイスでの利用を制限する。
本稿では,軽量点雲モデルのための特徴蒸留について検討する。
本研究では,教師から生徒への情報的文脈的知識を抽出するための双方向知識再構成を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:32:50 GMT)
Multi-modal Queried Object Detection in the Wild [72.2] MQ-Detは、現実世界のオブジェクト検出のための効率的なアーキテクチャと事前学習戦略設計である。
既存の言語クエリのみの検出器に視覚クエリを組み込む。
MQ-Detのシンプルで効果的なアーキテクチャとトレーニング戦略設計は、ほとんどの言語でクエリされたオブジェクト検出器と互換性がある。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:08:31 GMT)
Statistical Learning under Heterogenous Distribution Shift [71.8] ground-truth predictor is additive $mathbbE[mathbfz mid mathbfx,mathbfy] = f_star(mathbfx) +g_star(mathbfy)$.
クラス $F$ が$G$ よりも "simpler" であるとき、予測子は $textbfheterogenous shifts$ よりレジリエントであることを示します。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:20:12 GMT)
Video-CSR: Complex Video Digest Creation for Visual-Language Models [71.7] 実世界のビデオクリップのキャプションや要約を生成する視覚言語モデルの性能を評価するための新しいタスクと人間の注釈付きデータセットを提案する。
データセットには、20秒から60秒間の4.8KのYouTubeビデオクリップが含まれており、幅広いトピックや興味をカバーしている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:02:43 GMT)
Visual Storytelling with Question-Answer Plans [70.9] 本稿では、事前訓練された言語モデルと計画に視覚表現を統合する新しいフレームワークを提案する。
我々のモデルは、画像列を視覚的な接頭辞、つまり言語モデルで解釈できる連続的な埋め込みの列に変換する。
また、一連の質問と回答のペアを青写真プランとして利用して、健全な視覚概念を選択し、物語にどのように組み立てるべきかを決定する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:45:34 GMT)
Enhancing Representations through Heterogeneous Self-Supervised Learning [70.4] 本稿では,HSSL(Heterogeneous Self-Supervised Learning)を提案する。
HSSLは、構造的変化を伴わない表現学習方式で、ベースモデルに新しい特徴を付与する。
HSSLは、様々な自己教師型メソッドと互換性があり、様々な下流タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:44:05 GMT)
DeltaScore: Story Evaluation with Perturbations [69.3] DELTASCOREは,ニュアンスストーリーの側面の評価に摂動技術を用いた新しい手法である。
私たちの中心的な命題は、物語が特定の側面(例えば、流感)で興奮する程度は、特定の摂動に対するその感受性の大きさと相関している、と仮定している。
事前学習言語モデルを用いて,前摂動状態と後摂動状態の確率差を計算することにより,アスペクトの品質を測定する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:24:26 GMT)
MinPrompt: Graph-based Minimal Prompt Data Augmentation for Few-shot
Question Answering [68.5] オープンドメイン質問応答のための最小限のデータ拡張フレームワークMinPromptを提案する。
我々は、生テキストをグラフ構造に変換し、異なる事実文間の接続を構築する。
次に、グラフアルゴリズムを適用して、原文のほとんどの情報をカバーするのに必要な最小限の文の集合を識別する。
同定された文サブセットに基づいてQAペアを生成し、選択した文に基づいてモデルをトレーニングし、最終モデルを得る。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:44:36 GMT)
GestSync: Determining who is speaking without a talking head [67.8] 本稿では,ジェスチャ・シンク (Gesture-Sync) を導入する。
Lip-Syncと比較して、Gesture-Syncは、声と体の動きの間にはるかに緩い関係があるため、はるかに難しい。
このモデルは自己教師付き学習だけで訓練でき、LSS3データセット上での性能を評価することができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:48:30 GMT)
Recurrent Neural Language Models as Probabilistic Finite-state Automata [66.2] 単純なRNNは確率的有限状態オートマトンの部分クラスと同値であることを示す。
我々は、任意の決定論的有限状態LMをアルファベット$Sigma$上の$N$状態で表現するために、RNNは$Omegaleft(N |Sigma|right)$ニューロンを必要とすることを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:36:05 GMT)
Linear-Covariance Loss for End-to-End Learning of 6D Pose Estimation [64.1] 現代の画像に基づく6Dオブジェクトのポーズ推定手法は、2D-3D対応の予測を学習し、そこから解法を用いてポーズを求めることができる。
ここでは、ネットワークが精度を低下させるであろう勾配につながる問題の平均的な性質と矛盾するものであると論じる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:44:50 GMT)
Walking Down the Memory Maze: Beyond Context Limit through Interactive
Reading [63.9] 我々は,長いコンテキストを要約ノードのツリーに処理する手法であるMemWalkerを紹介した。クエリを受信すると,モデルがこのツリーをナビゲートして関連する情報を検索し,十分な情報を収集すると応答する。
その結果,MemWalkerは,テキストを対話的に読み取る際の推論ステップを強調し,クエリに関連するテキストセグメントをピンポイントすることで,説明性の向上を図っている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:18:14 GMT)
In-Context Convergence of Transformers [63.0] 勾配降下法により訓練したソフトマックスアテンションを有する一層変圧器の学習力学について検討した。
不均衡な特徴を持つデータに対しては、学習力学が段階的に収束する過程をとることを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:55:33 GMT)
Robust Lipschitz Bandits to Adversarial Corruptions [61.9] リプシッツ・バンディット(英: Lipschitz bandit)は、計量空間上で定義された連続アーム集合を扱うバンディットの変種である。
本稿では,敵対的腐敗の存在下でのリプシッツ・バンディットの新たな問題を紹介する。
我々の研究は、両タイプの敵の下でサブ線形後悔を達成できるロバストなリプシッツ・バンディットアルゴリズムの最初のラインを提示する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 19:45:06 GMT)
Error Analysis Prompting Enables Human-Like Translation Evaluation in
Large Language Models: A Case Study on ChatGPT [61.3] 機械翻訳の質を評価するためにChatGPTを使用すると、システムレベルでは最先端のパフォーマンスが得られるが、セグメントレベルでは性能が良くない。
本稿では,階層構造と誤り解析を組み合わせたEAPromptという新しいプロンプト手法を提案する。
以上の結果から,ChatGPTなどのLLMにエラー解析を施すことで,システムレベルとセグメントレベルの両方でヒューマンライクなMT評価が生成できることが示唆された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:50:10 GMT)
Learning Many-to-Many Mapping for Unpaired Real-World Image
Super-resolution and Downscaling [60.8] 実世界のLR画像とHR画像の双方向多対多マッピングを教師なしで同時に学習するSDFlowと呼ばれる画像ダウンスケーリングとSRモデルを提案する。
実世界の画像SRデータセットによる実験結果から,SDFlowは定量的かつ定性的に,多様な現実的なLRとSRの画像を生成可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:48:34 GMT)
Towards Better Chain-of-Thought Prompting Strategies: A Survey [60.8] CoT(Chain-of-Thought)は,大規模言語モデル(LLM)の促進戦略として使用すると,その印象的な強度を示す。
近年,CoTの促進効果が注目されている。
この調査は、関連する研究全般の参考になるかもしれない。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:16:55 GMT)
Do Large Language Models Know about Facts? [60.5] 大規模言語モデル(LLM)は、最近、さまざまな自然言語処理タスクにおいて、大幅なパフォーマンス改善を推進している。
我々は,ベンチマークPinocchioを設計し,LLM内の事実知識の範囲と範囲を評価することを目的とする。
Pinocchioには、異なるソース、タイムライン、ドメイン、リージョン、言語にまたがる20万のさまざまな事実質問が含まれている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:26:55 GMT)
Self-Knowledge Guided Retrieval Augmentation for Large Language Models [59.8] 大規模言語モデル(LLM)はタスク固有の微調整なしで優れた性能を示す。
検索に基づく手法は、非パラメトリックな世界知識を提供し、質問応答のようなタスクのパフォーマンスを向上させることができる。
SKR(Self-Knowledge guided Retrieval augmentation)は、LLMがこれまで遭遇した質問を参照できるようにする、シンプルで効果的な方法である。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:22:33 GMT)
GMMFormer: Gaussian-Mixture-Model based Transformer for Efficient
Partially Relevant Video Retrieval [59.5] テキストクエリーが与えられた場合、部分的に関連のあるビデオ検索は、データベース内の関連するモーメントを含むビデオを探し出そうとする。
PRVRにとって、クリップモデリングはテキストとビデオの間の部分的関係をキャプチャするために不可欠である。
本稿では,PRVR手法の効率問題を解決するため,GMMFormerを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:04:50 GMT)
MSight: An Edge-Cloud Infrastructure-based Perception System for
Connected Automated Vehicles [58.5] 本稿では,自動走行車に特化して設計された最先端道路側認識システムであるMSightについて述べる。
MSightは、リアルタイムの車両検出、ローカライゼーション、トラッキング、短期的な軌道予測を提供する。
評価は、待ち時間を最小限にしてレーンレベルの精度を維持するシステムの能力を強調している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:32:30 GMT)
Lightweight In-Context Tuning for Multimodal Unified Models [57.1] MultiModal In-conteXt Tuning (M$2$IXT)は、マルチモーダル統一モデルのICL機能を強化する軽量モジュールである。
最大50Kのマルチモーダルデータをチューニングすると、M$2$IXTは数ショットのICL性能を大幅に向上させることができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:47:24 GMT)
WikiIns: A High-Quality Dataset for Controlled Text Editing by Natural
Language Instruction [56.2] WikiInsは高品質な制御されたテキスト編集データセットで、情報性が向上している。
高品質なアノテートデータセットを用いて,大規模な銀のトレーニングセットを生成するための自動アプローチを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:46:39 GMT)
Loose lips sink ships: Mitigating Length Bias in Reinforcement Learning
from Human Feedback [55.8] 人間のフィードバックからの強化学習は、大きな言語モデルと人間と社会的価値を整合させる重要な橋として機能する。
報酬モデルが意図した目的を回避できるショートカットを見つけることがよくあります。
本稿では、報酬モデリングとシーケンス長の影響を分離するために、Product-of-Experts技術を適用した革新的なソリューションを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:14:39 GMT)
NeuralFastLAS: Fast Logic-Based Learning from Raw Data [54.9] シンボリック・ルール学習者は解釈可能な解を生成するが、入力を記号的に符号化する必要がある。
ニューロシンボリックアプローチは、ニューラルネットワークを使用して生データを潜在シンボリック概念にマッピングすることで、この問題を克服する。
我々は,ニューラルネットワークを記号学習者と共同でトレーニングする,スケーラブルで高速なエンドツーエンドアプローチであるNeuralFastLASを紹介する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:33:42 GMT)
AutoTrial: Prompting Language Models for Clinical Trial Design [53.6] 本稿では,言語モデルを用いた臨床検査基準の設計を支援するAutoTrialという手法を提案する。
70K以上の臨床試験で、AutoTrialが高品質な基準テキストを生成することが確認された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:44:35 GMT)
Model Extraction Attack against Self-supervised Speech Models [52.8] 自己教師付き学習(SSL)音声モデルは、与えられたクリップの有意義な表現を生成する。
モデル抽出攻撃 (MEA) は、しばしば、クエリアクセスのみで被害者モデルの機能を盗む敵を指す。
本稿では,少数のクエリを用いたSSL音声モデルに対するMEA問題について検討する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:41:22 GMT)
Generative Spoken Language Model based on continuous word-sized audio
tokens [52.1] 本稿では,単語サイズ連続評価音声埋め込みに基づく生成音声言語モデルを提案する。
結果として得られるモデルは、単語サイズの連続埋め込みに基づく最初の生成言語モデルである。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:46:14 GMT)
Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.1] 本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 23:39:38 GMT)
Confidence-driven Sampling for Backdoor Attacks [49.7] バックドア攻撃は、悪質なトリガをDNNモデルに過剰に挿入することを目的としており、テストシナリオ中に不正な制御を許可している。
既存の方法では防衛戦略に対する堅牢性が欠如しており、主に無作為な試薬を無作為に選別しながら、引き金の盗難を強化することに重点を置いている。
信頼性スコアの低いサンプルを選別し、これらの攻撃を識別・対処する上で、守備側の課題を著しく増大させる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:57:36 GMT)
Analyzing Norm Violations in Live-Stream Chat [49.1] 本研究は,ライブストリーミングプラットフォーム上での会話における規範違反を検出することを目的とした,最初のNLP研究である。
ライブストリームチャットにおける標準違反カテゴリを定義し、Twitchから4,583のコメントを注釈付けします。
以上の結果から,適切なコンテキスト情報がモデレーション性能を35%向上させる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:57:31 GMT)
Toolink: Linking Toolkit Creation and Using through Chain-of-Solving on
Open-Source Model [48.6] Toolinkは総合的なフレームワークで、まずツールキットを作成し、次にチェーン・オブ・ソルディング・アプローチを通じてツールの計画と呼び出しを統合することでタスク解決を行います。
LLaMA-CoSは高度なツールプランニングとツールコール機能を備えた強力なオープンソースモデルである。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:07:42 GMT)
Geometry Aware Field-to-field Transformations for 3D Semantic
Segmentation [48.3] ニューラル・レージアンス・フィールド(NeRF)を利用した3次元セマンティック・セマンティック・セマンティック・セマンティック・セマンティクスの手法を提案する。
表面点雲に沿って特徴を抽出することにより,サンプル効率が高く3次元推論に導出しやすいシーンのコンパクトな表現を実現する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:48:19 GMT)
AANet: Aggregation and Alignment Network with Semi-hard Positive Sample
Mining for Hierarchical Place Recognition [48.0] 視覚的位置認識(VPR)はロボット工学におけるホットスポットの一つで、視覚情報を用いてロボットの位置を特定する。
本稿では,アグリゲーションモジュールを介して候補を検索するためのグローバルな特徴を抽出できる統一ネットワークを提案する。
また、より堅牢なVPRネットワークをトレーニングするために、適切なハード正のイメージを選択するためのセミハード正のサンプルマイニング(ShPSM)戦略を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:46:11 GMT)
Data-centric Graph Learning: A Survey [47.3] 本稿では,グラフ学習パイプラインの段階に基づく新しい分類法を提案する。
グラフデータに埋め込まれた潜在的な問題を解析し、それをデータ中心の方法で解決する方法について議論する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:17:22 GMT)
Online Learning in Contextual Second-Price Pay-Per-Click Auctions [47.1] オンライン学習は、クリック単価のオークションで学習し、そこでは、各ラウンドのT$で、学習者がいくつかのコンテキストと広告を受信する。
学習者のゴールは、彼女の後悔を最小限に抑えることであり、それは彼女の総収入と託宣戦略のギャップとして定義される。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:04:22 GMT)
Structure-Preserving Instance Segmentation via Skeleton-Aware Distance
Transform [47.0] 本研究では,接続性を維持するためのオブジェクトスケルトンと,幾何学的配置をモデル化する際のDTの利点を組み合わせたスケルトン対応距離変換(SDT)を提案する。
病理組織像セグメンテーションの実験により,SDTが最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:51:33 GMT)
Benchmarking Large Language Models with Augmented Instructions for
Fine-grained Information Extraction [46.1] 本稿では,Large Language Models (LLMs) に適した微細なIEベンチマークデータセットを提案する。
本研究では,エンコーダ・デコーダモデル,特にT5およびFLAN-T5の広範な評価により,未知の情報型への一般化が期待できる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:41:18 GMT)
Zero-Resource Hallucination Prevention for Large Language Models [45.4] ハロシン化(Hallucination)とは、大規模言語モデル(LLM)が事実的に不正確な情報を生成する事例を指す。
本稿では,SELF-FAMILIARITYと呼ばれる,入力命令に含まれる概念に対するモデルの親しみ度を評価する新しい自己評価手法を提案する。
4つの異なる大言語モデルでSELF-FAMILIARITYを検証し、既存の手法と比較して一貫して優れた性能を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:08:41 GMT)
TILFA: A Unified Framework for Text, Image, and Layout Fusion in
Argument Mining [44.1] 本稿では,テキストと画像の両方を含むデータセットを紹介する。
私たちのフレームワークであるTILFAは、この混合データを扱うように設計されています。
テキストの理解だけでなく、光学文字の検出や画像のレイアウトの詳細の認識も優れている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:54:37 GMT)
FABRIC: Automated Scoring and Feedback Generation for Essays [42.0] FABRICは,1)全体スコア,2)特定のルーリックスコア,3)エッセイの改善方法に関する詳細なフィードバックを自動生成することで,英語の授業における学生やインストラクターを支援するパイプラインである。
我々は,新しいDREsSと拡張戦略CASEの有効性を定量的に評価し,既存のデータセットでトレーニングしたモデルよりも大幅に改善されたことを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:00:04 GMT)
Valley: Video Assistant with Large Language model Enhanced abilitY [41.8] 大規模言語モデル強化型ビデオアシスタントであるValleyを紹介した。
映像理解と指示追従能力でバレーを強化するため,映像指導データセットを構築した。
タスク指向会話データの構築を容易にするためにChatGPTを用いる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:49:53 GMT)
On the Zero-Shot Generalization of Machine-Generated Text Detectors [41.3] 大規模な言語モデルは、人間が書く言語と区別できないテキストを生成するのに十分な流動性を持っている。
この研究は重要な研究課題によって動機付けられている: 機械が生成したテキストの検出器は、新しい発電機の出力でどのように動作し、検出器が訓練されていないか?
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:49:51 GMT)
NLPBench: Evaluating Large Language Models on Solving NLP Problems [41.0] 大規模言語モデル(LLM)は、自然言語処理(NLP)の能力を高めることを約束している。
イェール大学の最終試験から得られた様々なNLPトピックにまたがる378の大学レベルのNLP質問を含む,ユニークなベンチマークデータセットであるNLPBenchを提案する。
GPT-3.5/4, PaLM-2, LLAMA-2などのLCMに着目した評価では, チェーン・オブ・シークレット(CoT)やツリー・オブ・シークレット(ToT)といった先進的なプロンプト戦略が取り入れられている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:34:29 GMT)
Towards Scalable Wireless Federated Learning: Challenges and Solutions [40.7] 効果的な分散機械学習フレームワークとして、フェデレートラーニング(FL)が登場します。
本稿では,ネットワーク設計と資源オーケストレーションの両面から,スケーラブルな無線FLを実現する上での課題と解決策について論じる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:55:03 GMT)
A Comparative Study of Voice Conversion Models with Large-Scale Speech
and Singing Data: The T13 Systems for the Singing Voice Conversion Challenge
2023 [40.5] 本稿では,歌唱音声変換チャレンジ(SVCC)2023について述べる。
ドメイン内およびドメイン内の両方の英語歌唱音声変換タスクに対して、自己教師付き学習に基づく表現を用いた認識合成アプローチを採用する。
SVCC 2023 による大規模リスニング試験の結果,我々のT13 システムは,難易度の高いクロスドメイン SVC に対して,競合自然性および話者類似性を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:30:44 GMT)
Language Models Can Improve Event Prediction by Few-Shot Abductive
Reasoning [39.9] イベント予測に大規模な言語モデルを統合するフレームワークであるLAMPを設計する。
我々のフレームワークは、最先端のイベントシーケンスモデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:27:20 GMT)
Explicit Planning Helps Language Models in Logical Reasoning [39.3] 言語モデルを用いて多段階論理推論を行う新しいシステムLEAPを提案する。
明示的な計画によって、システムは各ステップでより深い推論決定を行うことができる。
我々のシステムは、複数の標準データセット上で競合する他の手法よりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:25:10 GMT)
Learning A Coarse-to-Fine Diffusion Transformer for Image Restoration [39.1] 画像復元のための粗大な拡散変換器(C2F-DFT)を提案する。
C2F-DFTは拡散自己注意(DFSA)と拡散フィードフォワードネットワーク(DFN)を含んでいる
粗い訓練段階において,我々のC2F-DFTはノイズを推定し,サンプリングアルゴリズムにより最終クリーン画像を生成する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:16:54 GMT)
Distantly-Supervised Joint Entity and Relation Extraction with
Noise-Robust Learning [38.4] 結合エンティティと関係抽出は、一つのモデルを用いてエンティティペアとその関係を識別するプロセスである。
本稿では,テキストコーパス内のエンティティの言及と,それに対応するエンティティや関係型を知識ベースで整列させることによって生成する,遠隔ラベル付きデータに基づいてこれらのモデルをトレーニングする問題に焦点をあてる。
1)事前学習したGPT-2を同時エンティティと関係検出のためのシーケンスタギングスキームに組み込み,2)有意関係パターンと実体の両方との不整合性を罰する新たな損失関数を含むノイズロバスト学習フレームワークを導入する,という新しいノイズロバストアプローチを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:42:15 GMT)
Global Convergence of Policy Gradient Methods in Reinforcement Learning,
Games and Control [38.1] 政策勾配法は、強化学習、ゲーム、制御におけるシーケンシャルな意思決定にますます人気がある。
ポリシー勾配法の大域的最適性を保証することは、値関数の非凹凸のため、非常に非自明である。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:54:25 GMT)
Explainable Claim Verification via Knowledge-Grounded Reasoning with
Large Language Models [36.9] 本稿では,FOLK(First-Order-Logic-Guided Knowledge-Grounded Reasoning)を提案する。
複雑なクレームを検証し、注釈付きエビデンスを必要とせずに説明を生成することができる。
実験の結果,FOLKは3つのデータセットに対して高いベースラインを達成できた。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:04:05 GMT)
Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text
via Conditional Probability Curvature [36.3] 本研究では,大言語モデルと人間の単語選択における不一致を解消するために,条件付き確率曲率の概念を導入する。
我々は、より効率的なサンプリングステップで検出GPTの摂動ステップを置き換える最適化されたゼロショット検出器であるFast-DetectGPTを提案する。
評価の結果,Fast-DetectGPTはWhite-box設定とBlack-box設定の両方でTectGPTより優れるだけでなく,検出プロセスを340倍高速化することがわかった。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:41:28 GMT)
Lookaround Optimizer: $k$ steps around, 1 step average [36.2] 重み平均(WA)は、深層ネットワークの簡易化と一般化の促進に効果があるため、活発な研究課題である。
しかし、既存の重量平均アプローチは、ポストホックな方法で1つの訓練軌道に沿って実行されることが多い。
そこで我々は,SGDに基づく単純かつ効果的な一般化であるLookaroundを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:41:12 GMT)
Adversarial Attacks on Combinatorial Multi-Armed Bandits [36.2] 我々は、コンビニアル・マルチアーム・バンドイット(CMAB)に対する報酬中毒攻撃について研究する。
まず,CMABの攻撃性について十分かつ必要な条件を提示する。
次に、攻撃可能なCMABインスタンスに対する攻撃アルゴリズムを考案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 23:22:36 GMT)
Enhancing Kernel Flexibility via Learning Asymmetric Locally-Adaptive
Kernels [35.8] 本稿では,ラジアル基底関数(RBF)カーネルを強化するための訓練可能なパラメータとして,局所適応バンド幅(LAB)の概念を紹介する。
LAB RBFカーネルのパラメータはデータ依存であり、データセットによってその数は増加する可能性がある。
本稿では,非対称なカーネルリッジ回帰フレームワークを初めて確立し,反復的なカーネル学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:08:15 GMT)
More Context, Less Distraction: Zero-shot Visual Classification by
Inferring and Conditioning on Contextual Attributes [35.5] トレーニング不要で2段階のゼロショット分類手法であるPerceptionCLIPを提案する。
画像が与えられたら、まずコンテキスト属性(例えば背景)を推論し、その上でオブジェクト分類条件を実行する。
実験の結果,PerceptionCLIPはより優れた一般化,グループロバスト性,解釈可能性を実現することがわかった。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:56:53 GMT)
Retrieving Multimodal Information for Augmented Generation: A Survey [35.3] マルチモーダルな知識を検索することで生成モデルを補助・拡張する手法について検討する。
このような手法は、事実性、推論、解釈可能性、堅牢性といった重要な問題に対する有望な解決策を提供する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:26:35 GMT)
Multi-Resolution Active Learning of Fourier Neural Operators [35.3] 本稿では,FNO(MRA-FNO)の多解能動学習を提案する。
具体的には,確率的多分解能FNOを提案し,モンテカルロのアンサンブルを用いて効果的な後部推論アルゴリズムを提案する。
いくつかのベンチマーク演算子学習タスクにおいて,本手法の利点を示した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:20:21 GMT)
GSLB: The Graph Structure Learning Benchmark [34.9] グラフ構造学習(GSL)は、グラフニューラルネットワーク(GNN)のパラメータと計算グラフ構造の両方を同時に最適化する能力のため、近年注目されている。
パフォーマンス評価の標準的な実験的な設定や公正な比較は存在せず、この分野の進歩を理解するのに大きな障害を生み出します。
グラフ構造学習ベンチマーク (GSLB) を開発した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:13:03 GMT)
D$^3$Fields: Dynamic 3D Descriptor Fields for Zero-Shot Generalizable
Robotic Manipulation [34.3] D$3$Fields - 動的3D記述子フィールドを導入します。
これらのフィールドは、基礎となる3D環境のダイナミクスを捉え、セマンティックな特徴とインスタンスマスクの両方をエンコードする。
D$3$Fieldsは、ゼロショットロボット操作タスクの汎用性と有効性の両方を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:17:51 GMT)
Back to the Future: Towards Explainable Temporal Reasoning with Large
Language Models [33.8] そこで本稿では,コンテキストに基づいたイベント発生の予測を行うために,時間的推論を記述可能な最初のタスクを紹介する。
本研究では,時間的予測と説明の最先端性能を実現する方法を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:45:18 GMT)
Generating images of rare concepts using pre-trained diffusion models [32.5] テキスト・ツー・イメージ拡散モデルは高品質な画像を合成できるが、様々な制限がある。
これらの制限は、トレーニングデータの長い尾の性質に起因していることが示されています。
ノイズ空間内で適切な生成種を慎重に選択することで、稀な概念を正しく生成できることが示される。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:51:57 GMT)
SemST: Semantically Consistent Multi-Scale Image Translation via
Structure-Texture Alignment [32.4] 教師なし画像画像変換(I2I)は、ソースドメインからの入力をターゲットドメインの出力に転送するクロスドメイン画像マッピングを学習する。
ソース領域とターゲット領域の異なる意味統計は、意味歪みとして知られる内容の相違をもたらす。
翻訳における意味的一貫性を維持する新しいI2I法が提案され,SemSTと命名された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:44:58 GMT)
GEAR: A GPU-Centric Experience Replay System for Large Reinforcement
Learning Models [32.2] GEARは、大きなシーケンスモデル(トランスなど)でスケーラブルな強化学習(RL)を実現するように設計されている。
ホストメモリへのゼロコピーアクセスを使用してトラジェクトリを収集できるGPUカーネルと、InfiniBand上のリモート指向メモリアクセスを備える。
Gearは、最先端の大規模RLモデルをトレーニングする際に、Reverbよりも最大6倍パフォーマンスレベルを達成することができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:39:43 GMT)
Harnessing the Power of Large Language Models for Empathetic Response
Generation: Empirical Investigations and Improvements [32.2] 本研究では,大規模言語モデル(LLM)の共感応答生成における性能について実験的に検討する。
大規模な実験により, LLMは提案手法の利点を大いに生かし, 自動評価と人的評価の両方で最先端の性能を達成できることが示されている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:21:24 GMT)
OV-PARTS: Towards Open-Vocabulary Part Segmentation [31.1] 多様な物体の部分の分割と認識は、様々なコンピュータビジョンやロボットタスクにまたがるアプリケーションにおいて重要な能力である。
本稿では,これらの課題を調査・解決するためのOpen-Vocabulary Part (OV-PARTS)ベンチマークを提案する。
OV-PARTSには、Pascal-Part-116とADE20K--234という2つの公開データセットの洗練されたバージョンが含まれている。さらに、Generalized Zero-Shot Partアナログ、Cross-Dataset Part、Few-Shot Partという3つの特定のタスクもカバーしている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:28:42 GMT)
An Investigation of LLMs' Inefficacy in Understanding Converse Relations [30.9] 本稿では,知識グラフ補完データセットから抽出した17の関係と1240のトリプルを含む,逆関係に着目した新しいベンチマークであるConvReを紹介する。
我々のConvREは2つのタスク、Re2TextとText2Reを備えており、LLMが関連テキストと関連するテキストのマッチングを判定する能力を評価するために、多選択質問応答として定式化されている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:45:05 GMT)
HypoCompass: Large-Language-Model-based Tutor for Hypothesis
Construction in Debugging for Novices [30.9] hypoは、学習原則によって導かれる豊富なトレーニング材料を生成するためにLLMに依存している。
10人の初心者がパフォーマンスを17%改善し、完了時間の13%を短縮した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:39:47 GMT)
Retrieval-Generation Synergy Augmented Large Language Models [30.5] 本稿では,反復的な検索・生成協調フレームワークを提案する。
シングルホップQAとマルチホップQAタスクを含む4つの質問応答データセットの実験を行った。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:50:57 GMT)
ed-cec: improving rare word recognition using asr postprocessing based
on error detection and context-aware error correction [30.5] 本稿では,誤り検出と文脈認識誤り訂正により,稀な単語の認識を改善することに焦点を当てた新しいASRポストプロセッシング手法を提案する。
5つのデータセットにまたがる実験結果から,提案手法は従来の手法に比べて単語誤り率(WER)が有意に低いことを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:40:30 GMT)
Tailoring Self-Attention for Graph via Rooted Subtrees [29.8] 本稿では,上記の問題に対処するために,サブツリー注意(Subtree Attention, STA)と呼ばれる新しいマルチホップグラフアテンション機構を提案する。
マルチホップ近傍における注意重みの直接計算を行うことにより、STAは既存のグラフ注意機構の固有の問題を緩和する。
得られたGNNアーキテクチャSTAGNNは、単純なSTAベースのグラフニューラルネットワークを提供する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:47:18 GMT)
RelBERT: Embedding Relations with Language Models [29.5] 比較的小さな言語モデルから関係埋め込みを抽出する。
RelBERTは驚くほど微細な方法でリレーショナル類似性をキャプチャする。
トレーニング中にモデルが見た以上の関係をモデル化することが可能です。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:22:26 GMT)
SSL-Cleanse: Trojan Detection and Mitigation in Self-Supervised Learning [29.1] 自己教師付き学習(SSL)は、データ表現を符号化する一般的な手法である。
SSLエンコーダに埋め込まれたTrojan攻撃は隠蔽的に動作し、複数のユーザやデバイスに分散する。
SSLエンコーダのバックドア脅威を特定し軽減するためのソリューションとしてSSL-Cleanseを導入します。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:17:14 GMT)
Guideline Learning for In-context Information Extraction [29.1] 大規模言語モデル(LLM)は、単にタスク命令といくつかの入力出力例を条件付けるだけで、新しいタスクを実行することができる。
インコンテキスト情報抽出は、最近研究コミュニティで注目を集めている。
In-context IEのためのガイドライン学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:25:16 GMT)
Exploring the Usage of Chinese Pinyin in Pretraining [28.9] ピニインは、ASR導入エラーに対するエラー訂正や耐故障性など、多くのシナリオにおいて不可欠である。
そこで本研究では,PmBERTと呼ばれる事前学習モデルにPinyinを使用する方法について検討し,新しい事前学習手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:26:44 GMT)
Unsupervisedly Prompting AlphaFold2 for Few-Shot Learning of Accurate
Folding Landscape and Protein Structure Prediction [28.6] そこで我々は,メタ生成モデルであるEvoGenを提案し,貧弱なMSAターゲットに対するAlphaFold2のアンダーパフォーマンスを改善する。
EvoGenは、キャリブレーションまたは実質的に生成されたホモログシーケンスでモデルにプロンプトすることで、AlphaFold2を低データで正確に折り畳むのに役立つ。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:29:51 GMT)
MULTISCRIPT: Multimodal Script Learning for Supporting Open Domain
Everyday Tasks [28.3] 新しいベンチマークチャレンジであるMultiScriptを提示します。
どちらのタスクも、入力はターゲットタスク名と、ターゲットタスクを完了するために何をしたかを示すビデオから成っている。
期待される出力は、(1)デモビデオに基づくテキスト中の構造化されたステップ記述のシーケンス、(2)次のステップのための単一のテキスト記述である。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:51:17 GMT)
VisionFM: a Multi-Modal Multi-Task Vision Foundation Model for
Generalist Ophthalmic Artificial Intelligence [27.9] VisionFMは560,457人の眼科画像340万枚を事前訓練した基礎モデルである。
事前トレーニングの後、VisionFMは複数の眼科人工知能(AI)応用を育成する基盤を提供する。
VisionFMの一般知能は、12の一般的な眼科疾患を共同診断する際に、基礎的および中間的なレベルの眼科医より優れていた。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:40:14 GMT)
Fine-tuning Language Models with Generative Adversarial Feedback [27.9] RLHF(Reinforcement Learning with Human Feedback)は、大規模言語モデル(LLM)の性能を大幅に向上させることが実証されている。
我々は、RLHFとSFTに対するRLGAF(Reinforcement Learning with Generative Adversarial Feedback)という別のアプローチを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:40:42 GMT)
SCANet: Scene Complexity Aware Network for Weakly-Supervised Video
Moment Retrieval [27.7] ビデオモーメント検索は、与えられた言語クエリに対応するビデオ内のモーメントをローカライズすることを目的としている。
本稿では,Scene Aware Network(SCANet)と呼ばれる検索システムについて紹介する。
SCANetは、各ビデオ内の複数のシーンのシーン複雑性を計測し、各ビデオ内のシーンの様々な複雑さに対応する適応的な提案を生成する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:19:58 GMT)
Quantifying Zero-shot Coordination Capability with Behavior Preferring
Partners [27.6] ゼロショットコーディネーション(ZSC)は、学習したコーディネーションスキルを未確認のパートナーに一般化することに焦点を当てた新しい課題である。
既存の方法は、事前に訓練されたまたは進化した集団からパートナーとエゴエージェントを訓練する。
本研究の目的は,ZSC能力の信頼性,包括的,効率的な評価手法を作ることである。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:49:36 GMT)
TopicAdapt- An Inter-Corpora Topics Adaptation Approach [27.5] 本稿では、関連するソースコーパスから関連するトピックを適応し、ソースコーパスに存在しないターゲットコーパスに新しいトピックを発見できるトピックモデルTopicAdaptを提案する。
多様なドメインからの複数のデータセットに対する実験は、最先端のトピックモデルに対して提案されたモデルの優位性を示している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:56:44 GMT)
Circumventing Concept Erasure Methods For Text-to-Image Generative
Models [26.8] テキストから画像への生成モデルは、非常に幅広い概念のフォトリアリスティック画像を生成することができる。
これらのモデルには、性的に明示的なコンテンツを特徴とする画像を生成する可能性など、多くの欠点がある。
テキスト・ツー・イメージ・モデルからセンシティブな概念を「取り除く」ための様々な手法が提案されている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:51:46 GMT)
IFT: Image Fusion Transformer for Ghost-free High Dynamic Range Imaging [26.1] マルチフレームハイダイナミックレンジ(HDR)画像は、コンテンツ補完的ではあるが空間的に不一致な低ダイナミックレンジ(LDR)画像から、ゴーストフリー画像の写実的詳細を再構成することを目的としている。
既存のHDRアルゴリズムは、ダイナミックなシーンで大きな動きを持つLDRフレーム間の長距離依存関係をキャプチャできないため、ゴーストアーティファクトを生成する傾向にある。
我々は,高速グローバルパッチ探索(FGPS)モジュールと,ゴーストフリーHDRイメージングのためのセルフクロスフュージョンモジュール(SCF)を併用した新しい画像融合トランスフォーマ(IFT)を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:56:18 GMT)
TEMPO: Prompt-based Generative Pre-trained Transformer for Time Series
Forecasting [26.1] 本稿では,時系列表現を効果的に学習できる新しいフレームワークTEMPOを提案する。
TEMPOは、様々な領域のデータから現実世界の時間現象を動的にモデル化する機能を拡張する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:02:25 GMT)
Direct Preference-based Policy Optimization without Reward Modeling [25.2] 嗜好に基づく強化学習(PbRL)は、RLエージェントが嗜好から学習できるアプローチである。
報酬モデリングを必要とせずに好みから直接学習するPbRLアルゴリズムを提案する。
我々は,本アルゴリズムを実際の人選好ラベル付きオフラインRLタスクに適用し,既存のPbRL手法と同等あるいは同等であることを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:32:40 GMT)
Learning Generalizable Agents via Saliency-Guided Features Decorrelation [25.2] 特徴と判断の相関をなくすために,サリエンシガイド機能デコレーションを提案する。
RFFは高次元画像における複雑な非線形相関を推定するために利用され、サリエンシマップは変化した特徴を識別するために設計されている。
サリエンシマップの指導のもと、SGFDはサンプル再重み付けを用いて、変化した特徴に関する推定相関を最小化する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:24:43 GMT)
Are Emily and Greg Still More Employable than Lakisha and Jamal?
Investigating Algorithmic Hiring Bias in the Era of ChatGPT [24.5] GPT-3.5、Bard、Claudeといった大規模言語モデル(LLM)は、様々なタスクに適用可能である。
本研究では,(1)履歴書と職種とのマッチング,(2)履歴書と雇用関連情報との要約の2つの課題についてLCMを評価した。
総じて、LSMは人種や性別で頑丈であり、妊娠状態や政治的親戚関係におけるパフォーマンスが異なる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:08:48 GMT)
Unified speech and gesture synthesis using flow matching [24.2] 本稿では,テキストから音声とスケルトンに基づく3次元ジェスチャーを共同で合成するための,新しい統一アーキテクチャを提案する。
提案したアーキテクチャは,従来の技術よりもシンプルで,メモリフットプリントが小さく,音声とジェスチャーの同時分布を捉えることができる。
新たなトレーニング体制であるシンセサイザーは、以前よりもはるかに少ないステップ(ネットワーク評価)で、より良い品質を実現する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:37:28 GMT)
Probing Language Models from A Human Behavioral Perspective [24.1] 大規模言語モデル(LLM)は、現代のNLPにおいて支配的な基礎モデルとして登場した。
フィードフォワードネットワークやマルチヘッド・セルフアテンションなどの予測プロセスと内部メカニズムの理解は、いまだに未解明のままである。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:16:21 GMT)
Temporal Knowledge Graph Forecasting Using In-Context Learning [24.0] 本稿では,関連する歴史的事実をプロンプトに変換し,トークン確率を用いてランキング予測を生成する枠組みを提案する。
驚いたことに、LLMは最先端のTKGモデルと同等に動作している。
また,エンティティ/リレーション名の代わりに数値指標を用いると,性能に悪影響を及ぼさないことも判明した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:59:15 GMT)
Skeleton-of-Thought: Large Language Models Can Do Parallel Decoding [23.7] 本研究の目的は,大規模言語モデル(LLM)のエンドツーエンド生成レイテンシの削減である。
人間の思考と記述のプロセスに動機づけられた私たちは、Skeleton-of-Thought (SoT)を提案する。
SoT はまず LLM をガイドして回答のスケルトンを生成し、次に並列API呼び出しやバッチデコードを実行して、各スケルトンポイントの内容を並列に完了させる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:59:29 GMT)
PK-ICR: Persona-Knowledge Interactive Context Retrieval for Grounded
Dialogue [23.2] ペルソナとナレッジ デュアルコンテキスト識別(ペルソナとナレッジ コンテクストの同定)は、与えられた対話において、ペルソナとナレッジを共同で識別するタスクである。
我々は,対話のすべての文脈を同時に活用する新しい接地検索手法を開発した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:45:12 GMT)
Physics-aware Machine Learning Revolutionizes Scientific Paradigm for
Machine Learning and Process-based Hydrology [22.1] 我々は、認識される障壁を克服し、両方の分野に革命をもたらすための変革的アプローチとして、物理認識機械学習(ML)を紹介した。
まず, 降雨流出水理プロセスと流体力学プロセスを含む, PaML における水文学の体系的な検討を行った。
最後に、新しいPaMLベースの水文学プラットフォームであるHydroPMLが、水学応用の基礎としてリリースされた。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:48:29 GMT)
Harnessing the Power of ChatGPT in Fake News: An In-Depth Exploration in
Generation, Detection and Explanation [21.9] ChatGPTはその例外的な自然言語処理能力のために大きな注目を集めている。
フェイクニュースサンプルの生成に4つのプロンプト手法を用いて,自己評価と人的評価の両面から,これらのサンプルの品質を実証する。
偽ニュースを識別するChatGPTの能力について検討し,その性能向上のための理由認識プロンプト手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:01:07 GMT)
Towards Explainable Machine Learning: The Effectiveness of Reservoir
Computing in Wireless Receive Processing [21.8] 本稿では,Reservoir Computing (RC) と呼ばれる一般的な学習手法を適用し,チャネル等化の具体的課題について検討する。
RCは従来の手法や学習に基づく手法に比べて優れた性能を示した。
また,これをシミュレーションにより最適化することにより,受信処理/シンボル検出性能の向上を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:44:35 GMT)
Revisiting Block-based Quantisation: What is Important for Sub-8-bit LLM
Inference? [21.2] 大規模言語モデル(LLM)の統計的および学習特性について検討する。
ブロック量子化(ブロック量子化)を LLM に適用する。
ほぼロスレスで量子化された6ビットのLSMは、float32ベースラインよりも19倍高い算術密度と5倍のメモリ密度を実現しています。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:05:14 GMT)
Txt2Img-MHN: Remote Sensing Image Generation from Text Using Modern
Hopfield Networks [20.9] 本稿では,リアルタイムなリモートセンシング画像を生成するために,新しいテキスト・ツー・イメージのホップフィールドネットワーク(Txt2Img-MHN)を提案する。
生成した画像のリアリズムとセマンティック一貫性をよりよく評価するため,実リモートセンシングデータを用いてゼロショット分類を行う。
提案したTxt2Img-MHNはよりリアルなリモートセンシング画像を生成することができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:51:43 GMT)
Large Language Model (LLM) as a System of Multiple Expert Agents: An
Approach to solve the Abstraction and Reasoning Corpus (ARC) Challenge [20.8] 我々はLarge Language Models (LLMs) を用いたARCチャレンジの解決を試みる。
入力画像を複数の適切なテキストベース抽象空間に変換する。
次に、LLMの連想力を利用して、入出力関係を導出する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:37:28 GMT)
Information-Theoretic Bounds on The Removal of Attribute-Specific Bias
From Neural Networks [20.7] 既存の属性バイアス除去法は,データセット固有のバイアスが比較的弱い場合にのみ有効であることを示す。
既存の属性バイアス除去法は,データセット固有のバイアスが比較的弱い場合にのみ有効であることがわかった。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:39:11 GMT)
Demystifying RCE Vulnerabilities in LLM-Integrated Apps [20.0] 大規模言語モデル(LLM)は、様々な下流タスクにおいて顕著なポテンシャルを示している。
一部のフレームワークはリモートコード実行(RCE)脆弱性に悩まされており、アタッカーはプロンプトインジェクションを通じてアプリのサーバ上で任意のコードをリモートで実行できる。
1) LLMSmithと呼ばれる静的解析ベースのツールで,潜在的RCE脆弱性を検出するためにフレームワークのソースコードをスキャンし,2) LLM統合Webアプリの脆弱性を検証するために,プロンプトベースの自動テストアプローチを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:28:14 GMT)
Synslator: An Interactive Machine Translation Tool with Online Learning [19.7] インタラクティブ機械翻訳(IMT)は、コンピュータ支援翻訳パラダイムの進歩として登場した。
本稿では、IMTをサポートするだけでなく、リアルタイム翻訳記憶を用いたオンライン学習にも長けているユーザフレンドリーなコンピュータ支援翻訳(CAT)ツールであるSynslatorを紹介する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:05:55 GMT)
SARNet: Semantic Augmented Registration of Large-Scale Urban Point
Clouds [19.4] 本研究では,都市クラウドのためのセマンティック登録ネットワークであるSARNetを提案する。
提案手法は,登録精度の向上を支援するため,セマンティックな特徴をフル活用する。
提案するSARNetを,大都市景観の現実データを用いて広範に評価する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:31:28 GMT)
Prompt-augmented Temporal Point Process for Streaming Event Sequence [18.9] 本稿では,ニューラル・テンポラル・ポイント・プロセス(TPP)モデルを継続的に監視するための新しいフレームワークを提案する。
PromptTPPは、3つの実際のユーザ行動データセットにわたって、最先端のパフォーマンスを一貫して達成する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:41:16 GMT)
SIAD: Self-supervised Image Anomaly Detection System [18.4] 本稿では,SsaAと呼ばれる自動アノテーションシステムについて概説する。
ユーザフレンドリーなWebベースのインターフェースにより、SsaAは教師なしアルゴリズムと教師なしアルゴリズムの両方を統合するのに非常に便利である。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:55:35 GMT)
CARLG: Leveraging Contextual Clues and Role Correlations for Improving
Document-level Event Argument Extraction [17.5] 我々はCARLGモデルを提案し、CCA(Contextual Clues Aggregation)とRLIG(Role-based Latent Information Guidance)の2つのモジュールからなる。
CCAモジュールは、事前訓練されたエンコーダからのコンテキストアテンション重みを利用して、コンテキストヒントを適応的にキャプチャし、統合する。
RLIGモジュールはロール間エンコーディングを通じて意味的相関をキャプチャし、潜在ロール表現を伴う貴重な情報ガイダンスを提供する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:09:16 GMT)
MenatQA: A New Dataset for Testing the Temporal Comprehension and
Reasoning Abilities of Large Language Models [17.3] 大規模言語モデル(LLM)は、多くの自然言語処理(NLP)タスクにおいてほぼ飽和した性能を示している。
本稿では,LLMの時間的理解と推論能力を評価するために,合計2,853個のサンプルを用いた多感性因子時間QA(MenatQA)を構築した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:19:52 GMT)
Learning from Mistakes via Interactive Study Assistant for Large
Language Models [17.3] 大規模言語モデル(LLM)は、フィードバックに基づいて生成を洗練できる有望な能力を示している。
誤りを学習し,訂正するためのLarge LAnguage Model (SALAM)を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 23:00:33 GMT)
Blockchain-Envisioned Disaster Relief Networks: Architecture, Opportunities, and Open Issues [17.2] 無人航空機(UAV)支援災害救助ネットワーク(UDRN)は、既存の地上救助ネットワークを支援するためにUAVを活用している。
本稿では、有望なブロックチェーン技術を活用し、協調的で信頼性のない、トレーサブルな災害救助サービスに対処する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:32:25 GMT)
MindfulDiary: Harnessing Large Language Model to Support Psychiatric
Patients' Journaling [16.9] 私たちはMindfulDiaryという,Large Language Model(LLM)を組み込んだモバイルジャーナリングアプリを紹介した。
その結果、MindfulDiaryは毎日の記録を継続的に充実させ、精神科医が自分の思考や日常の文脈を理解することで、患者に共感しやすくすることを支援した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:00:04 GMT)
Understanding the Robustness of Multi-modal Contrastive Learning to
Distribution Shift [16.0] CLIPのようなマルチモーダルな対照的な学習アプローチは、分散シフトに対して堅牢な学習表現において、顕著な成功を収めている。
実証的な成功にもかかわらず、そのような一般化可能な表現を学習するメカニズムは理解されていない。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:25:52 GMT)
PIT: Optimization of Dynamic Sparse Deep Learning Models via Permutation
Invariant Transformation [15.9] 動的スパーシ性計算のための置換不変変換(PIT)を提案する。
PITは、結果を変えることなく、マイクロタイルをGPU効率の高い高密度タイルに変換する。
最先端のコンパイラで5.9倍(平均2.43倍)の動的空間計算を高速化することができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:33:15 GMT)
Hi Guys or Hi Folks? Benchmarking Gender-Neutral Machine Translation
with the GeNTE Corpus [15.4] 機械翻訳(MT)は、しばしば男性やステレオタイプ表現にデフォルトを与える。
本研究は、英語からイタリア語へのジェンダーニュートラル翻訳に重点を置くことで、包括的言語への需要が高まっていることに対処する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:44:00 GMT)
FairTune: Optimizing Parameter Efficient Fine Tuning for Fairness in
Medical Image Analysis [15.2] 医用診断などの倫理的に敏感な応用分野において,頑健なグループフェアネス特性を持つトレーニングモデルが重要である。
高容量のディープラーニングモデルは、すべてのトレーニングデータをほぼ完璧に適合させることができる。
公平性に関してPEFTパラメータの選択を最適化するフレームワークであるFairTuneを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:41:15 GMT)
PEACE: Cross-Platform Hate Speech Detection- A Causality-guided
Framework [14.4] ヘイトスピーチ検出(Hate speech detection)とは、宗教、性別、性的指向、その他の特徴に基づいて個人または集団を軽蔑することを目的としたヘイトフルコンテンツを検出するタスクである。
本稿では,2つの本質的な因果的手がかりをヘイトフルコンテンツで識別し,活用する因果性誘導型フレームワークPEACEを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:44:47 GMT)
Instances and Labels: Hierarchy-aware Joint Supervised Contrastive
Learning for Hierarchical Multi-Label Text Classification [14.4] 教師付きコントラスト学習とHMTCのギャップを埋めるtextbfHierarchy-aware textbfJoint Supervised textbfContrastive textbfL法を提案する。
具体的には、ケースワイドおよびラベルワイドのコントラスト学習技術を用いて、コントラスト学習の目的を達成するためにバッチを慎重に構築する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:36:45 GMT)
The Art of Embedding Fusion: Optimizing Hate Speech Detection [14.4] ヘイトスピーチ検出は、言語的および文脈的ニュアンスをキャプチャする必要がある、困難な自然言語処理タスクである。
事前訓練された言語モデル(PLM)は、このタスクを改善するために、テキストのリッチな意味表現を提供する。
いくつかのPLMの様々な組み合わせ技術に光を当て、その有効性を分析した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:11:44 GMT)
Simplifying GNN Performance with Low Rank Kernel Models [14.3] 半教師付きノード分類(SSNC)への最近のスペクトルGNNアプローチを再考する。
また,近年のGNN手法の性能改善は,評価基準の変化によるものである可能性が示唆された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:56:30 GMT)
How Reliable Are AI-Generated-Text Detectors? An Assessment Framework
Using Evasive Soft Prompts [14.2] 本研究では,PLMに高い性能の検出器を回避できるテキストを生成する新しい手法を提案する。
提案手法は、新しいタイプのソフトプロンプトである普遍的回避プロンプトを示唆しており、このプロンプトは、検知器を誤解させる「人間のような」テキストを生成するのにPLMを導く。
我々は,最先端検出器の回避における回避ソフトプロンプトの有効性を評価するために,広範囲な実験を行った。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:53:46 GMT)
FP3O: Enabling Proximal Policy Optimization in Multi-Agent Cooperation
with Parameter-Sharing Versatility [13.9] 既存のマルチエージェントPPOアルゴリズムは、異なるタイプのパラメータ共有と互換性がない。
我々は,FP3O(Full-Pipeline PPO)と呼ばれる実用的アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:26:35 GMT)
Towards Smaller, Faster, and Greener Language Models of Code [13.8] Avatarは、コードの大規模な言語モデルからデプロイ可能なモデルを構築する、新しいアプローチである。
アバターの鍵となる考え方は、多目的構成チューニング問題として言語モデルの最適化を定式化することである。
私たちはAvatarを使って、小型の3MBの最適化モデルを作成しました。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:52:19 GMT)
GEMINI: Controlling the Sentence-level Writing Style for Abstractive
Text Summarization [13.8] 本稿では,文の書き直しと抽象化を模倣するために,リライターとジェネレータを統合した適応モデル GEMINI を提案する。
実験により、我々の適応的なアプローチは、3つのベンチマークデータセット上で純粋に抽象的で書き直しのベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:53:11 GMT)
XLS-R fine-tuning on noisy word boundaries for unsupervised speech
segmentation into words [13.8] XLS-Rモデルを微調整し、上位層音声分割システムによって生成された単語境界を予測する。
我々のシステムは、ゼロショット方式で微調整中に目に見えない言語から音声を分割することができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:05:00 GMT)
Text2NKG: Fine-Grained N-ary Relation Extraction for N-ary relational
Knowledge Graph Construction [13.8] Text2NKGは,n-aryリレーショナル知識グラフ構築のための,新しいn-aryリレーショナル抽出フレームワークである。
我々は,異なるアリティにおける粒度n-ary関係抽出を実現するために,ヘテロオーダーマージを用いたスパンタプル分類手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:47:13 GMT)
Deep Reinforcement Learning Based Cross-Layer Design in Terahertz Mesh
Backhaul Networks [13.0] Terahertz(THz)メッシュネットワークは、次世代無線バックホールシステムにとって魅力的なものだ。
効率的な層間ルーティングと長期リソース割り当ては、THzメッシュネットワークでは未解決の問題である。
本稿では,THzメッシュネットワークにおける深部強化学習(DRL)に基づく層間設計を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:36:00 GMT)
Do Automatic Test Generation Tools Generate Flaky Tests? [12.8] テスト生成ツールが生成するフレキなテストの頻度と性質はほとんど不明である。
EvoSuite(Java)とPynguin(Python)を使ってテストを生成し、各テストは200回実行します。
この結果から, フレキネスは開発者の手書きテストと同様, 生成テストでも一般的であることが判明した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:44:27 GMT)
Unleashing the Multilingual Encoder Potential: Boosting Zero-Shot
Performance via Probability Calibration [12.4] 事前多言語エンコーダモデルは、ゼロショット多言語タスクや言語探索を直接実行することができる。
モデルによって予測されるラベル語の確率を変化させる様々なキャリブレーション手法と組み合わせる。
単言語エンコーダおよび多言語エンコーダに対する校正手法の有効性を評価する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:31:05 GMT)
Enhancing Document-level Event Argument Extraction with Contextual Clues
and Role Relevance [12.2] ドキュメントレベルのイベント引数抽出は、ロングインプットとクロスセンス推論という新たな課題を引き起こす。
本研究では,Span-Triggerに基づくコンテキストプーリングと潜在ロールガイダンスモデルを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:29:10 GMT)
DeepQTest: Testing Autonomous Driving Systems with Reinforcement
Learning and Real-world Weather Data [12.1] 強化学習(RL)を用いた自律走行システム(ADS)の新しいテスト手法を提案する。
DeepQTestはRLを使用して環境構成を学習する。
生成されたシナリオの現実性を保証するため、DeepQTestは現実的な制約セットを定義し、実際の気象条件を導入する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:59:43 GMT)
ASM: Adaptive Skinning Model for High-Quality 3D Face Modeling [11.9] マルチビュー・アンキャリブレーション画像による再構成では,キャパシティがより高められた新しいモデルが要求される。
適応スキニングモデル (Adaptive Skinning Model, ASM) を提案する。
本研究は,パラメトリック顔モデル研究の新たな方向性を開拓し,多視点再構成の今後の研究を促進するものである。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:16:28 GMT)
Probability-Dependent Gradient Decay in Large Margin Softmax [11.8] 訓練中に確率依存的な勾配減衰率を制御するために、ソフトマックスで勾配減衰ハイパーパラメータが導入された。
一般化性能は信頼確率が上昇するにつれて勾配減衰率に大きく依存することがわかった。
本研究では,ソフトマックス損失を動的に調整するウォームアップ手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:37:20 GMT)
XVO: Generalized Visual Odometry via Cross-Modal Self-Training [11.7] XVOは、一般化された単眼視眼視(英語版)モデル(英語版)(VO)を訓練するための半教師付き学習法である。
単一のデータセット内の既知のキャリブレーションをよく研究する標準的な単分子VOアプローチとは対照的に、XVOは現実のスケールで相対的なポーズを回復するのを効率的に学習する。
そこで我々は,YouTubeで公開されている大量の非拘束・異質なダッシュカメラビデオから,自己学習による動作推定モデルを最適化した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:32:45 GMT)
Latent Diffusion Model for Medical Image Standardization and Enhancement [11.3] DiffusionCTは、異なる非標準分布を標準化形式に変換するスコアベースのDDPMモデルである。
このアーキテクチャは、ボトルネック位置に統合されたDDPMモデルにより強化されたU-Netベースのエンコーダデコーダを含む。
DiffusionCTによる画像の標準化の顕著な改善が示唆された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:11:14 GMT)
On the Amplification of Cache Occupancy Attacks in Randomized Cache Architectures [11.0] MIRAGEは,エビクションベースの攻撃に対して耐性があるといわれ,キャッシュ占有率の増大を図っている。
我々は,MIRAGEのグローバルな消去特性を利用して,バイトレベルの粒度を持つ被覆チャネルを実証する。
攻撃ベクトルを拡張して、ワークロードのサイドチャネル、テンプレートベースのフィンガープリントをクロスコア設定に含めます。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:06:06 GMT)
Multi-Ship Tracking by Robust Similarity metric [10.9] マルチシップ追跡(MST)は、海上での状況認識と自律船の航法システム開発に応用されることが証明されている。
歩行者や車両のデータセットに対するマルチオブジェクト追跡(MOT)アルゴリズムによって達成された驚くべき追跡結果にもかかわらず、これらのモデルとテクニックは、船舶のデータセットに適用した場合、パフォーマンスが劣っている。
本稿では,予測ボックスと検出ボックスの両方を囲む最小の凸形状を組み込むことで,IoUの弱点に対処する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:05:10 GMT)
STAEformer: Spatio-Temporal Adaptive Embedding Makes Vanilla Transformer
SOTA for Traffic Forecasting [10.9] 適応埋め込み(Adaptive Embedding)と呼ばれる,優れた利得を得られるコンポーネントを提案する。
実験により,本質的な時間的関係と情報トラフィック時系列を捉えることにより,適応的な埋め込みが交通予測において重要な役割を担っていることが示された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:58:10 GMT)
On the Inconsistencies of Conditionals Learned by Masked Language Models [10.7] マスケッド言語モデルは、双方向コンテキストで条件付けられたトークンの分布を提供することができる。
一般的な仮定とは対照的に、そのような条件はしばしばかなりの矛盾を示す。
本研究では,モデルが直接生成する多くの不整合条件を共同で考える自己アンサンブルアルゴリズムであるEnsemble of Conditionalsを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:57:03 GMT)
Prompt-based test-time real image dehazing: a novel pipeline [10.4] 本稿では,プロンプトをベースとしたテストタイム・デハージング(PTTD)について述べる。
PTTDは、合成データに基づいてトレーニングされたデハージングモデルを用いて、領域ギャップを狭め、実際の画像デハージングの性能を高めることができることを実験的に見出した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:17:04 GMT)
Adaptive Reorganization of Neural Pathways for Continual Learning with
Spiking Neural Networks [10.4] 神経経路を適応的に再編成する脳にインスパイアされた連続学習アルゴリズムを提案する。
提案モデルでは,様々な連続学習タスクにおいて,性能,エネルギー消費,メモリ容量が一貫した優位性を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:36:41 GMT)
ITRE: Low-light Image Enhancement Based on Illumination Transmission
Ratio Estimation [10.3] ノイズ、アーティファクト、過剰露光は、低照度画像強調の分野において重要な課題である。
モデルの起源からノイズやアーティファクトを抑圧するRetinexベースの新しい手法ITREを提案する。
広汎な実験により, 騒音抑制, アーティファクト防止, 露光量の同時制御におけるアプローチの有効性が示された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:22:20 GMT)
The Troubling Emergence of Hallucination in Large Language Models -- An
Extensive Definition, Quantification, and Prescriptive Remediations [10.2] 我々は、その程度、向き、カテゴリーに基づいて、プロファイリング幻覚について論じる。
幻覚は, (i) acronym ambiguity, (ii)numeric nuisance, (iii) generated golem, (iv) virtual voice, (v) Geographic erratum, (vi) time wrapの6種類に分類される。
より広範なNLPコミュニティのためのツールとしてHalucination Vulnerability Index (HVI)を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:31:29 GMT)
Comparative Analysis of Transfer Learning in Deep Learning
Text-to-Speech Models on a Few-Shot, Low-Resource, Customized Dataset [10.1] この論文は、トレーニング時間が少なく、データサンプルが少なく、高品質な音声出力が得られるTSモデルを見つける必要があることの根底にある。
この研究は、徹底的な技術分析を通じて、TTSの最先端のモデル伝達学習能力を評価する。
その後、制約付きデータセットにおけるモデルのパフォーマンスを比較するために、ハンズオンの実験分析を行う。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:08:25 GMT)
"A Nova Eletricidade: Aplica\c{c}\~oes, Riscos e Tend\^encias da IA
Moderna -- "The New Electricity": Applications, Risks, and Trends in Current
AI [10.1] この章では、進化を続けるAIの展望の概要を紹介する。
我々は、経済の分野を再定義するAI応用を探求し、社会と人間性に影響を与える。
我々は、AIの急速な技術進歩と今後のトレンドに伴うリスクを分析します。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:01:18 GMT)
Progressive Neural Compression for Adaptive Image Offloading under
Timing Constraints [9.9] タイミング制約下での機械学習アプリケーションの推論性能を最大化する適応的アプローチを開発することが重要である。
本稿では,画像分類を対象とし,この問題の効率的な解法としてプログレッシブ・ニューラル・圧縮(PNC)を提案する。
我々は、最先端のニューラル圧縮アプローチとテストベッド上の従来の圧縮手法に対するPNCの利点を実証する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:58:31 GMT)
ImageNet-Hard: The Hardest Images Remaining from a Study of the Power of
Zoom and Spatial Biases in Image Classification [9.8] 入力画像の適切なフレーミングは、イメージネット画像の98.91%の正確な分類につながることを示す。
本稿では,モデルにズームイン操作を明示的に実行させることにより,分類精度を向上させるテスト時間拡張(TTA)手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 23:03:33 GMT)
Successive Data Injection in Conditional Quantum GAN Applied to Time
Series Anomaly Detection [9.5] 逐次データインジェクション(SuDaI)と呼ばれる新しい高次元符号化手法を提案する。
SuDaIエンコーディングにより、既存のQGANよりもはるかに高次元のネットワークデータによる異常検出にQGANを適用することができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:58:44 GMT)
Counter Turing Test CT^2: AI-Generated Text Detection is Not as Easy as
You May Think -- Introducing AI Detectability Index [9.3] AI生成テキスト検出(AGTD)はすでに研究で注目を集めているトピックとして現れている。
本稿では,既存のAGTD手法の脆弱性を総合的に評価することを目的とした手法のベンチマークであるCounter Turing Test (CT2)を紹介する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:20:36 GMT)
Improved Active Learning via Dependent Leverage Score Sampling [9.2] 非依存的なサンプリング戦略とレバレッジスコアサンプリングを組み合わせることで、非依存的(逆方向雑音)設定における能動的学習法の改善方法を示す。
独立サンプリングと比較して,本手法は,所定の目標精度に到達するために必要なサンプル数を最大50%削減する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:51:30 GMT)
CodeTransOcean: A Comprehensive Multilingual Benchmark for Code
Translation [9.0] 最近のコード翻訳技術は、ある言語から別の言語にソースコードを翻訳するために、ニューラルネットワーク翻訳モデルを利用している。
CodeTransOceanは、コード翻訳のための最大の言語をサポートする、大規模な包括的なデータセットである。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:16:18 GMT)
High-Sensitive Microwave Electrometry with Enhanced Instantaneous
Bandwidth [8.7] ライドバーグマイクロ波(MW)センサは、広い動作周波数範囲と優れた電位感度のため、従来のアンテナベースの技術よりも優れている。
我々は、Rydbergマイクロ波受信機を、高い感度で62,mathrmnV Mathrmcm-1 MathrmHz-1/2$と、最大10.2,mathrmMHz$の広帯域で示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:45:22 GMT)
The Emergence of Reproducibility and Consistency in Diffusion Models [8.6] 拡散モデルは、逆拡散過程を通じてランダムノイズ入力を変換することで、新しいデータ(例えば画像)を生成する。
本研究は, 初期雑音入力と決定論的解法を用いたサンプリングから始めると, 拡散モデルはほぼ同一の出力成分を生成する傾向にあることを示した。
この現象のより深い理解は、より解釈可能で制御可能なデータ生成プロセスをもたらす可能性がある。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 19:02:46 GMT)
CO-ASnet :A Smart Contract Architecture Design based on Blockchain
Technology with Active Sensor Networks [8.6] 本稿では,イベントスタディを用いて,世論指導者が初期貨幣取引を利用して影響力を行使する現象を考察する。
その結果、世論のリーダーは、彼らのソーシャルネットワークにおける金銭とデータトラフィックによるトークン資産の価格に影響を与えることができることがわかった。
この現象と影響の結果に基づいて、安全で適用可能な分散型規制スキームを設計するために、ChainLink Oracle with Active Sensor Networks(CO-ASnet)を使用します。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:31:49 GMT)
Resource Efficient Boolean Function Solver on Quantum Computer [8.6] グロバーのアルゴリズムは、量子コンピュータ上の非線形方程式系を解く最もよく知られた量子探索アルゴリズムの1つである。
本稿では,Groverのフレームワーク下での反復効率向上のための3つの新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:07:35 GMT)
TARGET: Automated Scenario Generation from Traffic Rules for Testing
Autonomous Vehicles [8.5] TARGETは、トラフィックルールに基づくテストシナリオの自動生成用に設計されたエンドツーエンドフレームワークである。
我々は、交通ルールから知識を自動的に抽出し、交通ルール記述をDSL表現に変換するために、大きな言語モデルを活用する。
TARGETは実行可能なテストシナリオスクリプトを合成して、シミュレータでテストシナリオをレンダリングする。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:08:46 GMT)
Multitask learning for recognizing stress and depression in social media [8.5] 本稿では,抑うつとストレスを主課題として用いた2つのマルチタスク学習フレームワークを提案する。
具体的には、うつ病のデータセットと5つのドメインの10のサブレディットからのストレスの多いポストを含むストレスの多いデータセットを使用します。
最初のアプローチでは、各投稿は共有BERTレイヤを通過し、両方のタスクによって更新される。
次に、2つの別々のBERTエンコーダレイヤが利用され、各タスクによって個別に更新される。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:05:26 GMT)
RobustFair: Adversarial Evaluation through Fairness Confusion Directed
Gradient Search [8.3] ディープニューラルネットワーク(DNN)は、様々な敵の摂動に対する脆弱性のため、しばしば課題に直面している。
本稿では, 偽りや偏りのある摂動を受ける場合のDNNの正確な公平性を評価するための新しいアプローチであるRobustFairを紹介する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:39:56 GMT)
LLM4VV: Developing LLM-Driven Testsuite for Compiler Validation [8.0] 大規模言語モデル(LLM)は、自然言語を含む幅広いアプリケーションのための強力なツールである。
我々は、OpenAI GPT-4のようなクローズドソースオプションや、Meta AI Codellamaのようなオープンソースの代替品など、最先端のLLMのキャパビリティについて検討する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:43:39 GMT)
Safe Deep Policy Adaptation [7.9] 強化学習(RL)に基づく政策適応は、汎用性と汎用性を提供するが、安全性と堅牢性に挑戦する。
政策適応と安全強化学習の課題を同時に解決する新しいRLおよび制御フレームワークであるSafeDPAを提案する。
我々は、SafeDPAの理論的安全性を保証し、学習エラーや余分な摂動に対するSafeDPAの堅牢性を示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:32:59 GMT)
The Reinforce Policy Gradient Algorithm Revisited [7.9] 文献からReinforce Policy gradientアルゴリズムを再検討する。
本稿では,基本アルゴリズムの大幅な拡張を提案する。
この新しいアルゴリズムの収束の証明を提供する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:05:13 GMT)
Extraction of Medication and Temporal Relation from Clinical Text using
Neural Language Models [7.7] textbfMedTemプロジェクトは、BiLSTM-CRFやCNN-BiLSTMなどの先進的な学習構造を使用している。
CNN-BiLSTMは、i2b2-2009 臨床 NER タスクにおいて、精度、リコール、F1 スコアに対して 75.67, 77.83, 78.17 の BiLSTM-CRF モデルにわずかに勝っている。
BERT-CNNモデルは、マクロAvgを使用してP/R/F1の64.48、67.17、65.03の評価スコアも生成した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:17:54 GMT)
How WEIRD is Usable Privacy and Security Research? (Extended Version) [7.7] 本研究は, WEIRD 諸国のUPS 紙のサンプルがどの程度の規模であったかを明らかにするため, 文献レビューを行った。
研究手法と採用手法における地理的および言語的障壁は、研究者がローカルでユーザー研究を行う原因となる可能性がある。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:22:22 GMT)
A Trustworthy and Consistent Blockchain Oracle Scheme for Industrial Internet of Things [7.4] 本稿では,高品質なオフチェーンデータが得られるセキュアで信頼性の高いオラクル方式を提案する。
具体的には、まず、検証ランダム関数(VRF)と評価機構に基づくオラクルノード選択アルゴリズムを設計する。
次に、スライディングウィンドウに基づくデータフィルタリングアルゴリズムを提案し、収集したデータの一貫性をさらに向上する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:44:29 GMT)
Fully Spiking Neural Network for Legged Robots [7.2] スパイキングニューラルネットワーク(SNN)は、脚のあるロボットを処理するために使用される。
SNNは、推論速度とエネルギー消費の観点から、従来のニューラルネットワークよりも自然な優位性を持っている。
我々の知る限りでは、脚のあるロボットにSNNを実装するのはこれが初めてだ。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:48:30 GMT)
Model-adapted Fourier sampling for generative compressed sensing [7.1] 測定行列が一意行列からランダムにサブサンプリングされたとき, 生成的圧縮センシングについて検討した。
我々は,textitO(kd| boldsymbolalpha|_22)$の測定精度を改良したモデル適応サンプリング戦略を構築した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:13:16 GMT)
Intelligent DRL-Based Adaptive Region of Interest for Delay-sensitive
Telemedicine Applications [7.0] ビデオストリーミングの遅れは、遠隔医療アプリケーションにとって依然としてハードルだ。
本稿では、推定スループットに応じてROIサイズと非ROI品質をインテリジェントに適応するDeep Reinforcement Learningモデルを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:01:28 GMT)
Data Augmentation through Pseudolabels in Automatic Region Based
Coronary Artery Segmentation for Disease Diagnosis [6.9] 冠状動脈疾患(CAD)は予防できるが、死と障害の主な原因の1つである。
本稿では,データ拡張手法として擬似ラベルを用いることにより,ベースラインYoloモデルの性能向上を図る。
この方法は、検証データセットで9%、テストデータセットで3%、ベースラインのF1スコアを上昇させる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:54:12 GMT)
Single Stage Warped Cloth Learning and Semantic-Contextual Attention
Feature Fusion for Virtual TryOn [6.5] 画像ベースの仮想試着は、ホップの衣服を着ている人の画像に合わせることを目的としている。
対象の衣服を人物画像の対応する身体部分と整列させるガーメント・ワープは、この目標を達成するための重要なステップである。
明示的な多段階学習なしに暗黙的に同じことを学習する新しいシングルステージフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:05:01 GMT)
Cross-head mutual Mean-Teaching for semi-supervised medical image
segmentation [6.4] これらの問題に対処するために,新しいtextbfCross-head textbfmutual textbfmean-textbfteaching Network (CMMT-Net) を提案する。
提案手法は3つの公開データセット上で既存のSSMIS法より一貫して優れている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:13:04 GMT)
Enhancing SAEAs with Unevaluated Solutions: A Case Study of Relation
Model for Expensive Optimization [6.4] 本稿では,SAEAの効率を高めるために,未評価解を用いた枠組みを提案する。
代理モデルを用いて、評価無しに新しい解を直接生成するための高品質な解を同定する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:04:34 GMT)
Evaluating Self-Supervised Speech Representations for Indigenous
American Languages [6.2] 南アメリカの先住民であるケチュア語に対するASRコーパスを提示する。
我々は、Kechua上の大規模なSSLモデルと、低リソースのASR上のGuaraniやBrbriといった6つのネイティブ言語の有効性をベンチマークした。
その結果、最先端のSSLモデルによる驚くほど高い性能を示し、大規模モデルの現実世界データへの一般化可能性を示している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 23:28:50 GMT)
ULF: Unsupervised Labeling Function Correction using Cross-Validation
for Weak Supervision [5.6] 弱監督(WS)は手動データラベリングの代案として費用対効果がある。
教師なしラベル付け関数修正のための新しいアルゴリズムULFを導入する。
ULFは、この割り当てを信頼性の高いクロスバリデーションサンプルに再推定することで、クラスへのLFの割り当てを洗練します。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:18:09 GMT)
Distributional Reinforcement Learning with Online Risk-awareness
Adaption [5.4] オンラインリスク適応型分散RL(DRL-ORA)を新たに導入する。
DRL-ORAは、オンラインの総変動最小化問題を解くことにより、てんかんのリスクレベルを動的に選択する。
DRL-ORAは、固定リスクレベルまたは手動で決められたリスクレベルに依存する既存の手法よりも優れている、複数のタスクのクラスを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:32:23 GMT)
A Privacy-Preserving Trajectory Synthesis Method Based on Vector Translation Invariance Supporting Traffic Constraints [5.2] 本稿では,トラジェクトリ間の関係に基づく集約クエリを提案し,既存の手法と比較してデータの有用性を大幅に向上させることができる。
提案手法が提案するトラジェクトリは有効性が高く,理論解析により安全かつ信頼性が高いことが示された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:35:36 GMT)
Constrained Bundle Adjustment for Structure From Motion Using
Uncalibrated Multi-Camera Systems [5.1] 本稿では,これらのカメラが互いに静的であることを考慮し,ベースライン制約を実装したバンドル調整ソリューションを提案する。
システムキャリブレーションのない車両に搭載された2台のGoProカメラのビデオフレームを用いて実験を行った。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:00:45 GMT)
Generalizing Topological Graph Neural Networks with Paths [5.0] グラフニューラルネットワーク(GNN)は様々な分野で大きな進歩を遂げてきたが、1-Weisfeiler-Lehmanテストとして知られる理論的な制約によって妨げられている。
すべてのグラフに固有のパスに重点を置いています。
我々はより一般的な位相的視点を構築し、他の位相的領域に関する確立された理論を橋渡しすることができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:35:06 GMT)
From Data to Dialogue: Leveraging the Structure of Knowledge Graphs for
Conversational Exploratory Search [4.9] 本稿では,自然言語質問によるニュース記事探索のための知識駆動対話システムを提案する。
54名の被験者を対象に,グラフに基づく探索探索の有効性を実証的に評価した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:52:09 GMT)
sign.mt: Real-Time Multilingual Sign Language Translation Application [4.6] Sign.mtは、音声言語と署名された言語間のリアルタイム多言語双方向翻訳の先駆的なオープンソースアプリケーションである。
聴覚と聴覚のコミュニケーションの相違に対処することを目的としており、音声と署名と署名の両方の方向のシームレスな翻訳を容易にする。
アプリは個人的および学術的な用途で使用、変更可能で、翻訳APIもサポートしている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:14:03 GMT)
Boosting Facial Action Unit Detection Through Jointly Learning Facial
Landmark Detection and Domain Separation and Reconstruction [4.4] AUドメインの分離と再構築と顔のランドマーク検出を共同で学習するマルチタスク学習を導入した新しいAU検出フレームワークを提案する。
また,単純なプロジェクタによるコントラッシブ・ラーニングとコントラッシブ・ロスの改善に基づく新たな特徴アライメント手法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:49:26 GMT)
Cross-domain Robust Deepfake Bias Expansion Network for Face Forgery
Detection [4.3] 本稿では,顔偽造検出を強化するために,クロスドメインロバストバイアス拡張ネットワーク(BENet)を導入する。
BENetは、入力顔の再構成にオートエンコーダを使用し、実際の顔の不変性を維持しつつ、再構成された偽顔と元の顔との差を選択的に強化する。
さらに、BENetは、サンプルが既知の分布に属するかどうかを決定する閾値を持つクロスドメイン検出器を組み込んでいる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:30:22 GMT)
Federated Learning: A Cutting-Edge Survey of the Latest Advancements and
Applications [4.2] Federated Learning (FL) はセキュアな分散機械学習手法である。
FLはクラウドインフラストラクチャを統合して、ブロックチェーン技術を使用してMLモデルをエッジサーバに転送する。
現在のFL実装では、データ所有者はモデルをローカルにトレーニングし、その結果を重み、勾配、パラメータの形式でクラウドにアップロードする。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 19:54:26 GMT)
Towards Optimizing with Large Language Models [4.2] 各種タスクやデータサイズにまたがるLLMの最適化能力の評価を行う。
様々な視点からタスクパフォーマンスの総合評価を行うために,3つの異なる指標を紹介した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:35:00 GMT)
Compositional Semantics for Open Vocabulary Spatio-semantic
Representations [4.0] 汎用移動ロボットは、人間の指示なしにタスクを完了する必要がある。
本稿では,クエリー・セマンティック記憶のための学習に基づく知識表現として,潜時意味埋め込み z* を提案する。
我々は、COCO-Stuffデータセットで訓練された単純な高密度VLMが、42.23 mIoUで181の重なり合うセマンティクスについてz*を学習できることを実証した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:07:14 GMT)
HOD: A Benchmark Dataset for Harmful Object Detection [3.8] 有害物体検出のための新しいベンチマークデータセットを提案する。
提案したデータセットには、有害である可能性のある6つのカテゴリにわたる1万以上の画像が含まれている。
我々は,提案したデータセットの有効性を評価するために,広範囲な実験を行った。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:00:38 GMT)
Error metric for non-trace-preserving quantum operations [3.6] 非トレース保存量子演算における誤差の測定問題について検討する。
本稿では,正規化出力状態間のトレース距離の上限を効率的に設定する誤差計量を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 19:02:00 GMT)
A Knowledge Graph-Based Search Engine for Robustly Finding Doctors and
Locations in the Healthcare Domain [3.3] 知識グラフ(KG)は、半構造化データから洞察を収集する利点を組み合わせる強力な方法として登場した。
医療領域の医師や場所を確実に見つけるためのKGベースの検索エンジンアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:28:17 GMT)
Compressed online Sinkhorn [3.3] 我々は最近導入された[Mensch and Peyr'e, 2020]オンラインシンクホーンアルゴリズムを再考する。
我々は、オンラインシンクホーンアルゴリズムの収束解析を改善し、パラメータ選択によって得られる新しいレートは、以前のレートよりも高速である。
次に, オンラインシンクホーン法と, オンラインシンクホーン法を組み合わせた圧縮オンラインシンクホーン法を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:33:32 GMT)
Unmasking Biases and Navigating Pitfalls in the Ophthalmic Artificial
Intelligence Lifecycle: A Review [3.2] この記事では、AIライフサイクルを7つのステップに分割する。
データ収集; モデルタスクの定義; データ前処理とラベル付け; モデル開発; モデル評価と検証; デプロイメント。
最後に、デプロイ後の評価、監視、システムリカレーションを行い、各ステップにおける害のリスクと、それらを緩和するための戦略を掘り下げます。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:49:42 GMT)
RSMS: Towards Reliable and Secure Metaverse Service Provision [3.0] 本稿では、パフォーマンスを犠牲にすることなく、Metaverseサービスの信頼性とセキュリティを確保するために、Reliable and Secure Metaverse Service (RSMS)を提案する。
RSMSは2つのプロトコルで構成されている。 1つはブロックチェーンベースの、異種Metaverseサービスリソースノード(RN)に関する軽量相互認証プロトコルである。
もう1つは、RNによって構成される安定的でセキュアなMetaverseサービスグループの形成と維持に使用されるグループ認証プロトコルで、信頼性を確保し、Metaverseサービスのセキュリティを強化する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:28:45 GMT)
FLatS: Principled Out-of-Distribution Detection with Feature-Based
Likelihood Ratio Score [3.0] FLatSはOOD検出の原理的解法である。
我々は,FLatSが他のOOD検出手法を拡張可能な汎用フレームワークとして機能できることを実証した。
実験の結果、FLatSは人気のあるベンチマークで新しいSOTAを確立している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 09:16:46 GMT)
Prompt position really matters in few-shot and zero-shot NLU tasks [3.0] 我々は、自然言語理解タスクにおいて、迅速な位置選択の日時まで、最も包括的な分析を行う。
先行研究で用いられるプロンプト位置は、ゼロショット設定と少数ショット設定の両方において、しばしば準最適である。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:45:10 GMT)
A Comparative Analysis of Deep Reinforcement Learning-enabled Freeway
Decision-making for Automated Vehicles [2.4] 人工知能の課題に対処するための強力な方法論として、深層強化学習(DRL)が登場している。
本稿では高速道路における自律走行車による意思決定問題に対するDRLアプローチについて比較する。
これらのDRL対応意思決定戦略の制御性能を評価するために,一連のシミュレーション実験を行った。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:32:57 GMT)
Learning force laws in many-body systems [2.4] 粉塵プラズマ実験において,機械学習モデルにより強制法則を推論できることが示されている。
このモデルの精度は、現在の理論の解決を超えた、ほこりの多いプラズマにおける新しい物理学を示している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 20:12:34 GMT)
Maximizing Utilitarian and Egalitarian Welfare of Fractional Hedonic
Games on Tree-like Graphs [2.3] 本稿では,木状グラフ上の分数的ヘドニックゲームにおける福祉最大化分割を計算するための(擬)ポリノミカル時間アルゴリズムを提案する。
P$neq$NPという仮定の下では、擬ポリノミアル時間可解性が最良であることを示す硬度結果が提供される。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:18:08 GMT)
Revisiting Remote State Preparation with Verifiability: A New Set of
Notions with Well-behaved Properties [2.3] 検証可能性を備えたリモート状態準備(RSPV)では、クライアントはサーバ側で量子状態(状態ファミリーからサンプリングされた)を準備したい。
近年,シングルサーバの計算安全設定 [MV21] に一般化されているセルフテストという概念は,サーバの動作を認証することを目的としている。
本稿では,自己検査の代替として,検証可能性を備えた遠隔操作アプリケーション(ROAV)を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 17:38:43 GMT)
A Quantum Approach for Reducing Communications in Classical
Cryptographic Primitives [2.3] 我々は、おそらく驚くべきことに、より弱い仮定の下で量子技術でこの問題を解決することが可能であることを示した。
量子通信と計算を行うことで、ハッシュ関数の折り畳みのみを仮定してこの問題のプロトコルを提供する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:07:46 GMT)
A Survey on Image-text Multimodal Models [2.3] 視覚情報とテキスト情報の収束は重要なフロンティアとして浮上し、画像テキストのマルチモーダルモデルの出現につながった。
本稿では,画像テキストマルチモーダルモデルの進化と現状を概観し,その応用価値,課題,潜在的研究軌跡について考察する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:32:51 GMT)
LocoNeRF: A NeRF-based Approach for Local Structure from Motion for
Precise Localization [2.2] 本研究では,Structure from Motion (SfM) 技術を用いて,視覚的位置決めの精度を向上させる新しい手法を提案する。
我々は,高レイテンシに悩まされるグローバルSfMの限界と,高精度な再構成のために大規模な画像データベースを必要とするローカルSfMの課題を強調した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:54:25 GMT)
Quantum Next Generation Reservoir Computing: An Efficient Quantum
Algorithm for Forecasting Quantum Dynamics [1.9] NG-RCは、積分可能系とカオス系の両方において、完全多体量子力学を正確に予測できることを示す。
本稿では,ブロック符号化手法を用いて,量子計算の高速化による多体量子力学予測のためのエンドツーエンド量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:13:23 GMT)
Hierarchical Generative Adversarial Imitation Learning with Mid-level
Input Generation for Autonomous Driving on Urban Environments [1.9] エンドツーエンドのアプローチでは、ポリシーは車両のカメラからの高次元画像をステアリングやスロットルのような低レベルのアクションにマッピングする必要がある。
本研究では,車両の自律走行をエンドツーエンドアプローチで解くため,hGAILアーキテクチャを提案する。
提案したhGAILは,2つの主モジュールからなる階層型逆数イミテーション学習アーキテクチャで構成されている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:09:29 GMT)
Advancements in Point Cloud Data Augmentation for Deep Learning: A
Survey [1.8] ポイントクラウドは、自律運転、マッピング、ナビゲーション、シーン再構築、医療画像など、幅広い分野で応用されている。
ディープラーニング (DL) は, 検出, セグメンテーション, 分類などのタスクにおいて, 主流かつ効果的な手法の1つとなっている。
DLモデルのトレーニング中の過度な適合を低減し、モデル性能を改善するためには、拡張が不可欠であることが多い。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:21:51 GMT)
Kernel Methods are Competitive for Operator Learning [1.4] 本稿では,Banach空間間の演算子を学習するためのカーネルベースのフレームワークと,プリオリエラー解析を提案する。
バニラカーネルを使用したとしても、当社のアプローチはコスト-正確性トレードオフの点で競争力があることが示されています。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:41:08 GMT)
Susceptibility of Continual Learning Against Adversarial Attacks [1.4] 本研究では,現在および以前取得したタスクを含む継続的な学習課題の敵攻撃に対する感受性について検討する。
このような学習タスクの攻撃に対する感受性や脆弱性は、データの完全性とプライバシに関する深刻な懸念を引き起こす。
本稿では,正規化に基づく3つの手法,リプレイに基づく3つのアプローチ,リプレイと模範的アプローチを組み合わせた1つのハイブリッド手法の堅牢性について検討する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:41:18 GMT)
Measuring reasoning capabilities of ChatGPT [1.4] 推論タスクに適用した場合、ChatGPTが生成する論理的欠陥を定量化する。
この図書館には算術パズル、論理方程式、スドゥークのようなパズル、ゼブラのようなパズル、真理を解き明かすパズル、グリッドパズル、奇数、自己参照パズルなど、様々な種類のパズルが含まれている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 20:18:50 GMT)
Optimizing state-discrimination receivers for continuous-variable
quantum key distribution over a wiretap channel [1.3] 我々は、コヒーレント状態の第四次位相シフトキー(QPSK)を用いた連続可変量子鍵分布プロトコルに対処する。
我々は、唯一のチャネル損失を収集するために、盗聴可能な盗聴が制限される純粋損失量子通信路を考える。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:26:52 GMT)
Predictive Coding Based Multiscale Network with Encoder-Decoder LSTM for
Video Prediction [1.3] 将来のビデオフレーム予測のためのマルチスケール予測符号化モデルを提案する。
我々のモデルは、より高レベルなニューロンが粗い予測(より低解像度)を生成するマルチスケールアプローチ(粗から微細)を採用している。
本稿では,長期予測における予測誤差の蓄積を軽減するためのトレーニング戦略のいくつかの改善を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 15:19:18 GMT)
Clustering Three-Way Data with Outliers [1.2] 行列変量正規データを異常値でクラスタリングする手法について論じる。
このアプローチは、サブセットのログライクな分布を使い、OCLUSTアルゴリズムを拡張し、反復的なアプローチを使ってアウトレイラを検出しトリムする。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:27:29 GMT)
Randomly Initialized One-Layer Neural Networks Make Data Linearly
Separable [1.2] 十分な幅が与えられると、ランダムに1層ニューラルネットワークは2つの集合を2つの線形分離可能な集合に変換することができる。
本論文は, 十分な幅が与えられると, ランダムに一層ニューラルネットワークが2つの集合を2つの線形分離可能な集合に変換できることを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 20:23:56 GMT)
Waveformer for modelling dynamical systems [1.1] 動的システムの学習ソリューションを学習するための新しい演算子学習手法である「ウェーブフォーマ」を提案する。
提案した波形変換器はウェーブレット変換を利用して解場と変圧器の空間的マルチスケールな挙動を捉える。
本稿では,提案するWaveformerが解演算子を高精度に学習し,既存の最先端演算子学習アルゴリズムを最大1桁の精度で上回っていることを示す。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:34:59 GMT)
On the Role of Neural Collapse in Meta Learning Models for Few-shot
Learning [1.0] この研究は、数ショット学習のためのメタラーニングフレームワークにおける神経崩壊の性質を初めて探求し、理解したものである。
我々は,オムニグロットデータセットを数ショット設定で研究し,神経崩壊現象を研究する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 04:48:55 GMT)
Big Data Privacy in Emerging Market Fintech and Financial Services: A Research Agenda [0.9] 白書では、新興市場および金融サービスにおけるデータプライバシの問題と解決策の理解を深めるための研究課題について述べる。
我々は、包括的な分析、データプライバシのローカル定義の理解、リスクの主な原因の文書化、潜在的な技術的解決策の5つの研究分野について強調する。
この研究課題が、新興市場におけるプライバシーの多面的な性質に注目されることを願っている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:11:19 GMT)
Lifelong Learning for Fog Load Balancing: A Transfer Learning Approach [0.7] 待ち時間の最小化により,IoTアプリケーションの実行遅延を最適化するプライバシ対応強化学習(RL)エージェントの性能向上を図る。
本稿では,行動遅延を最小限に抑えるために軽量推論モデルを用いて,環境変化が著しい場合にのみ再訓練を行う,これらのエージェントのための生涯学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:49:33 GMT)
Human-in-the-loop: The future of Machine Learning in Automated Electron
Microscopy [0.7] MLに基づくアクティブな実験を設計する際の考慮事項について論じる。
今後数年間の計画としては、人力による自動実験が考えられる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:26:32 GMT)
Hybrid Quantum-Classical Machine Learning for Sentiment Analysis [0.6] 本稿では,ハイブリッド量子古典機械学習アルゴリズムを用いた感情分析手法を提案する。
提案手法は英語とベンガル語に基づく2つの異なるデータセットを用いて評価される。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:45:22 GMT)
PASSION: Permissioned Access Control for Segmented Devices and Identity for IoT Networks [0.6] 本稿では,ブロックチェーンベースのデータアクセス制御を用いたIoTシステムにおけるプライバシ保護手法を提案する。
イベント情報の機密性、完全性、信頼性を維持している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:28:32 GMT)
Dynamic Multi-Domain Knowledge Networks for Chest X-ray Report
Generation [0.6] 放射線診断レポート生成のための動的マルチドメイン知識(DMDK)ネットワークを提案する。
DMDKネットワークは、Chest Feature Extractor(CFE), Dynamic Knowledge Extractor(DKE), Specific Knowledge Extractor(SKE), Multi-knowledge Integrator(MKI)モジュールの4つのモジュールで構成されている。
IU X-RayとMIMIC-CXRの2つの広く使われているデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:20:02 GMT)
U-shaped Transformer: Retain High Frequency Context in Time Series
Analysis [0.6] 本稿では,変圧器の低域特性を考察し,その利点を取り入れようと試みる。
パッチマージと分割操作を導入し、異なるスケールの機能を抽出し、より大きなデータセットを使用してトランスフォーマーバックボーンを完全に活用する。
実験により、比較的低コストで複数のデータセットをまたいだ高度なレベルでモデルが動作できることが実証された。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 07:41:58 GMT)
Design Verification of the Quantum Control Stack [0.5] 本論文は量子コンピューティングの紹介と,古典的デバイス検証技術の適用方法の紹介として機能する。
量子制御スタックを構築する上での2つの大きな課題は、エッジでの正確な決定論的最適化操作と、中間層でのスケールアウト処理である。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:51:48 GMT)
Robust-GBDT: A Novel Gradient Boosting Model for Noise-Robust
Classification [0.5] 我々は、ロバストGBDTと呼ばれる新しいノイズロストブースティングモデルを導入し、堅牢な損失を伴う高度なGBDTフレームワークをシームレスに統合する。
また,クラス不均衡に対処するために,ロバスト・フォカル・ロスという新しいロバスト・ロス関数を導入する。
その結果、Robust-GBDTはより正確な予測を生成し、その能力を大幅に向上させた。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:28:40 GMT)
Investigating the Ability of PINNs To Solve Burgers' PDE Near
Finite-Time BlowUp [0.4] 物理情報ニューラルネットワーク(PINN)は、複雑なPDEを数値的に解くという新たな成果を達成している。
最近の実験では、PINNはそのような有限時間爆破を検出できるかもしれないことが示唆されている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:56:46 GMT)
Enhancing Pre-Trained Language Models with Sentence Position Embeddings
for Rhetorical Roles Recognition in Legal Opinions [0.2] 法的意見の規模は増え続けており、法的意見の修辞的役割を正確に予測できるモデルを開発することはますます困難になっている。
本稿では,文の位置情報に関する知識によって強化された事前学習言語モデル(PLM)を用いて,修辞的役割を自動的に予測する新しいモデルアーキテクチャを提案する。
LegalEval@SemEval2023コンペティションの注釈付きコーパスに基づいて、我々のアプローチではパラメータが少なく、計算コストが低下することを示した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 20:33:55 GMT)
cito: An R package for training neural networks using torch [0.0] cito"は、ディープラーニングのためのユーザフレンドリーなRパッケージで、Rパッケージで慣れ親しんだ公式でディープニューラルネットワークを指定できる。
「シトー」には、モデルプロットと分析のための多くのユーザフレンドリーな機能が含まれている。
総合Rアーカイブネットワーク(CRAN)から「シトー」の安定版をインストールすることができる。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:52:36 GMT)
Trapped ion-mediated interactions between two distant trapped atoms [0.0] 2つの大きく分離された原子が、Rydbergの励起によって捕獲されたイオンと相互作用すると、イオンを介する相互作用は数桁の直接原子と原子の相互作用を超えることが示される。
原子の運動はイオンの運動よりもはるかに遅いため、イオンを介する断熱ポテンシャルを計算するためにボルン・オッペンハイマー近似を利用する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 10:06:20 GMT)
Transforming Pixels into a Masterpiece: AI-Powered Art Restoration using
a Novel Distributed Denoising CNN (DDCNN) [0.0] 本稿では,ディープラーニング,特に畳み込みニューラルネットワーク(CNN)とコンピュータビジョン技術を用いた革新的なアプローチを提案する。
このデータセットは、複雑な詳細を保持しながら歪みを取り除くためにDistributed Denoising CNN(DDCNN)をトレーニングする。
本手法は様々な歪みの種類やレベルに適応し, 様々な劣化したアートワークに適している。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 19:59:42 GMT)
The Work Avatar Face-Off: Knowledge Worker Preferences for Realism in
Meetings [0.0] 複数の国の知識労働者2509名を対象に,マネージャ,既知の同僚,未知の同僚が使用するためのアバタースタイルを5つ評価した。
あらゆるシナリオにおいて、参加者はより高いリアリズムを好んだが、完全に現実的なアバターは時々不気味であると認識された。
アバターは、未知の同僚やマネージャーと対話する際に、既知の同僚と比べて、より現実的な評価が下がった。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 18:08:36 GMT)
The Generalized Fokker-Planck Equation in terms of Dunkl-type
Derivatives [0.0] 1+1)次元のフォッカー・プランク方程式の2つの異なる一般化を導入する。
これらの結果の応用として、一般化されたフォッカー・プランク方程式を正確に解く。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:23:42 GMT)
The Dunkl-Fokker-Planck Equation in $1+1$ Dimensions and the Shifted
Harmonic Oscillator [0.0] 空間微分をダンクル微分に置き換え、(1+1)次元のフォッカー・プランク方程式を一般化する。
ドリフト関数が奇数であれば、最近開発されたウィグナー・ダンクル超対称性の値にその結果を還元する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:19:47 GMT)
Supervised Learning Models for Early Detection of Albuminuria Risk in
Type-2 Diabetes Mellitus Patients [0.0] 本研究の目的は,T2DM患者にアルブミン尿を発症するリスクを予測するための教師付き学習モデルを開発することである。
特徴として10の属性、目標として1の属性(アルブミン尿症)から構成される。
これはそれぞれ0.74と0.75の精度とf1スコアの値を達成し、T2DMの尿失調を予測するためのスクリーニングに適していた。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:47:24 GMT)
ROSTAM: A Passwordless Web Single Sign-on Solution Mitigating Server Breaches and Integrating Credential Manager and Federated Identity Systems [0.0] クレデンシャル・マネジメントとフェデレーション・アイデンティティ・システムを統合することで,ユーザにとって不利で信頼性の高いオンラインエクスペリエンスを提供する,パスワードのない未来を構想する。
この点に関して、ROSTAMは、パスワードのないSSOの後、ユーザが1クリックでアクセスできるすべてのアプリケーションを示すダッシュボードを提供します。
クレデンシャルマネージャのウェブパスワードのセキュリティはマスターパスワードではなくマスターキーで保証されるので、暗号化パスワードはサーバから盗まれたとしても安全である。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:41:04 GMT)
Quantum state preparation for bell-shaped probability distributions
using deconvolution methods [0.0] 本稿では、量子回路の前処理ステップとしてデコンボリューションを行うことにより、確率分布のロードに対するハイブリッドなアプローチを提案する。
我々は,このアルゴリズムを,27量子ビット量子プロセッサである IBMQ Kolkata と IBM Quantum シミュレータで検証する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 06:55:47 GMT)
Out of Distribution Performance of State of Art Vision Model [0.0] ViTの自己保持機構は、CNNよりも堅牢である。
58の最先端コンピュータビジョンモデルの性能を統一的なトレーニング設定で検証する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:01:52 GMT)
Orlicz regrets to consistently bound statistics of random variables with
an application to environmental indicators [0.0] 我々は、下と上の両方から確率変数の統計を一貫して束縛する新しいオルリッツの遺言を提案する。
そこで我々は,オルリッツの遺言と発散リスク尺度の対応に十分な条件を求め,さらに勾配降下型数値アルゴリズムを用いて計算する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 13:54:55 GMT)
Optimizing Large Language Models to Expedite the Development of Smart
Contracts [0.0] スマートコントラクトコードを生成するために最適化された,大規模な言語モデルであるMazzumaGPTを紹介する。
最適化と微調整のパラメータを概説し、機能的正確性に対するモデルの性能評価を行い、我々の研究の限界と幅広い影響に対処する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 14:29:33 GMT)
OptBA: Optimizing Hyperparameters with the Bees Algorithm for Improved
Medical Text Classification [0.0] 本稿では, ビーズアルゴリズムを利用して, 深層学習モデルのハイパーパラメータを微調整する, OptBA と呼ばれる新しいメカニズムを提案する。
実験の結果,約1.4%の精度向上が認められた。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:30:33 GMT)
Operationalising Representation in Natural Language Processing [0.0] 哲学的にインフォームドされた表現の概念を運用するプロジェクトは、科学の哲学者とNLPの実践者の両方にとって興味深いものであるべきである。
これは哲学者に表現の性質に関する主張のための新しいテスト場を与え、NLP研究者が探索実験に関する大規模な文献を整理するのに役立つ。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:49:38 GMT)
On the Query Complexity of Training Data Reconstruction in Private
Learning [0.0] 我々は,ホワイトボックスの敵が学習者に対して行わなければならないクエリ数を分析し,学習データを再構築する。
例えば$(epsilon, delta)$ DPの学習者は任意のコンパクトな距離空間から引き出された訓練データを持つ。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 23:34:35 GMT)
On migration to Perpetual Enterprise System [0.0] 移行は、グリーンフィールドから始まっていないことを意味する。
この文書は、組織コンピュータシステムを永久に進化し、組織全体に対処し、統合される新しいシステムへ移行する方法に関する実践的なアプローチを記述しています。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 19:22:20 GMT)
Making Differential Privacy Work for Census Data Users [0.0] アメリカ国勢調査局は、研究者や政策立案者によって多用されているアメリカ人に関する詳細な人口統計データを収集し、公表している。
このプライバシ保護システムの重要な出力はノイズ計測ファイル(NMF)であり、これは集計された統計にランダムノイズを加えることで生成される。
我々は、NMFを使用可能なフォーマットに変換するために使用するプロセスを説明し、NMFの今後のバージョンをどうリリースするかを局に推奨する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:36:58 GMT)
Low-temperature quantum thermometry boosted by coherence generation [0.0] 温度計プローブに量子コヒーレンスを発生させることにより温度範囲と感度を向上させる低温測定法を提案する。
我々は,2レベル量子システム(qubit)をプローブとして使用し,アンシラ量子ビットの集合をインターフェースとして導入することにより,試料への直接プローブアクセスを防止する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 12:22:51 GMT)
Image Compression and Decompression Framework Based on Latent Diffusion
Model for Breast Mammography [0.0] 本研究では,潜在拡散モデル(LDM)を用いた医用画像の圧縮・圧縮のための新しい枠組みを提案する。
LDMは, 拡散確率モデル (DDPM) の進歩を表現し, 優れた画質が得られる可能性が示唆された。
医用画像データを用いた画像アップスケーリングにおけるLCMとTorchvisionの応用の可能性について検討した。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 22:08:59 GMT)
High-fidelity transmon coupler activated CCZ gate on fluxonium qubits [0.0] 本研究では,カプラ上のマイクロ波パルスによって活性化されるトランスモン量子ビットを介して容量的に接続されたフラキソニウム上で,高忠実なCCZゲートを動作させる新しい方法を提案する。
ノイズレスモデルでは,95n長ゲートの99.99%以上の忠実度を実測回路パラメータで数値シミュレーションし,従来のデコヒーレンス率で約0.25%の誤差を推定する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 08:42:36 GMT)
Generalizable Error Modeling for Search Relevance Data Annotation Tasks [0.0] 人間のデータアノテーションは、機械学習(ML)と人工知能(AI)システムの品質を形成する上で重要である。
この文脈における重要な課題の1つは、MLモデルの性能が低下する可能性があるため、アノテーションエラーによって引き起こされることである。
本稿では,3つの産業規模のMLアプリケーションを対象とした検索関連アノテーションタスクにおいて,潜在的なエラーを検出するよう訓練された予測誤差モデルを提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 21:21:19 GMT)
Evaluating Bias and Noise Induced by the U.S. Census Bureau's Privacy
Protection Methods [0.0] アメリカ合衆国国勢調査局は、国勢調査統計の正確さと個々の情報の保護との間に難しいトレードオフに直面している。
我々は,2つの主要な開示回避システムによって誘導されるバイアスとノイズの独立評価を行う。
TopDownのポストプロセッシングはNMFノイズを劇的に低減し、スワップの精度に類似したデータを生成する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 02:41:53 GMT)
Domain Knowledge Graph Construction Via A Simple Checker [0.0] 本研究は,ハードウェア設計ドメインテキストからの知識グラフ構築の問題に取り組む。
GPT3.5のパワーを活用するためのオラクル・チェッカー方式を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:09:31 GMT)
Detecting Abnormal Health Conditions in Smart Home Using a Drone [0.0] ドローンを用いた視覚に基づく転倒監視システムを開発した。
本研究では, 落下物体を精度0.9948で識別できることを示す。
その結果, 落下物体を精度0.9948で識別できることがわかった。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 05:03:35 GMT)
Cost/benefit analysis model for implementing virtual reality in
construction companies [0.0] イマーシブ・テクノロジー (ImT) は建設業界にいくつかの応用がある。
費用対効果分析の欠如は、建設意思決定者がこれらの技術を実装することを妨げている。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 00:48:16 GMT)
Breaking Down Word Semantics from Pre-trained Language Models through
Layer-wise Dimension Selection [0.0] 本稿では,レイヤ間の中間出力にバイナリマスクを適用することにより,BERTから意味感覚を分離することを目的とする。
2つの異なる文の目的語が同じ意味を持つかどうかを判定するために、二分分類により、アンタングル埋め込みを評価する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 11:07:19 GMT)
BDD-Based Framework with RL Integration: An approach for videogames
automated testing [0.0] ビデオゲームのテストは、従来のソフトウェア開発のプラクティスとは異なる。
振る舞い駆動開発(BDD)と強化学習(RL)の統合を提案する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 20:05:29 GMT)
Accelerating Machine Learning Primitives on Commodity Hardware [0.0] 本稿では,Deep Neural Networks (DNN) における一般行列乗算 (GEMM) に基づく畳み込みよりも効率的な代替手段として,スライディングウィンドウ畳み込み手法について広範な研究を行う。
この結果から,Sliding Window 計算カーネルは CPU 上でも専用ハードウェアアクセラレータ上でも GEMM ベースの畳み込みよりも優れていることが示唆された。
これにより、特別なハードウェアを必要とせずに、低消費電力および低メモリデバイスにAIが広く採用される可能性がある。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 16:26:18 GMT)
A new economic and financial theory of money [0.0] 電子通貨の評価はマクロ経済理論と金融政策の基本的な方程式に基づいて行われる。
電子通貨を、サブエコノミーの有形資産に関連付けられた取引株式として捉えていく。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 03:16:06 GMT)
A Comprehensive Review of YOLO: From YOLOv1 and Beyond [0.0] YOLOは、ロボット工学、無人運転車、およびビデオ監視アプリケーションのための中心的なリアルタイムオブジェクト検出システムとなっている。
本稿では,YOLOの進化を包括的に分析し,元のYOLOからYOLOv8,YOLO-NAS,YOLOをトランスフォーマーとしたYOLOまでの各イテレーションにおけるイノベーションとコントリビューションについて検討する。
論文参考訳(メタデータ) (Sun, 8 Oct 2023 01:01:35 GMT)